前言:
今天小伙伴们对“算法pdf百度云盘”大约比较关注,各位老铁们都想要了解一些“算法pdf百度云盘”的相关文章。那么小编同时在网上网罗了一些对于“算法pdf百度云盘””的相关文章,希望你们能喜欢,我们一起来学习一下吧!今天我们来了解一个Excel中非常强大的功能:汇总PDF文件,相较于其他的汇总软件,利用Excel进行汇总最大的好处就是可以自动匹配表头,后期如果有新的文件进来只需点击下刷新就能一键汇总
一、所需函数
今天我们需要用到2个M函数,这个是PowerQuery独有的,Excel也是需要版本支持的,最低2016,如果版本不止的话,使用PowerBI也是一样的操作
Pdf.Tables:获取PDF文件中的表格
Table.PromoteHeaders:将第一行用于标题
M函数的用法与Excel函数很相似,但是它们的区别还是还是很大的,Excel函数仅仅只能计算单元格,M函数可以计算一个表格,一列数据的,简单来说就是它可以对表格的结构进行计算
二、导入到PowerQuery
首先我们需要将想要汇总的Excel都放在一个文件夹中,随后打开Excel,点击【数据】功能组,在右侧找到【获取数据】→【从文件夹】,然后找到存放PDF的文件夹,直接点击下打开,稍等一下就会看出一个【导航器】的界面,点击右下角的【转换数据】进入PowerQuery的编辑界面
三、数据整理
在这里我们仅仅需要【Content】与【Name】这两列数据,可以将所有的数据都删掉。
Content这一列我们可以理解为它就是一个PDF文件
Name这一列就是每个PFD文件的名称
随后点击【添加列】找到【自定义列】在跳出的窗口中输入函数:=Pdf.Tables([Content]),它的作用就是获取PDF中的表格中数据,点击确定后,就会多出一列【自定义】列,需要点击右上角的左右箭头来展开数据,仅仅勾选【Kind】与【Data】这两个字段即可,不要使用【原始列名作为前缀】
四、筛选数据
【Data】这个字段存放的就是PDF文件中的表格,【Kind】这个字段是数据类型。
首先在【Kind】中仅仅选中【Table】这个类型,就是表示仅仅选中PDF文件中的表格,【page】表示页,就是PDF每一页的数据,这个我们是不需要的
随后点击【Data】中蓝色的table就会看到表格,但是现在数据的表头是在表格中的,我们需要将表头放在上一行用做标题,才能使用自动匹配字段
筛选完毕后,就可以将【Kind】与【Content】这两个字段删掉了
五、提升标题
需要点击下【添加列】找到自定义列,将公式设置为:Table.PromoteHeaders([Data]),然后点击确定,就会在后面多出一个【自定义】列,这样的话就会将表头用作标题,我们还是直接点击【右上角】来展开数据即可,这样就可以将所有的PDF文件都汇总一起。
最后将【Data】这一列删除掉,然后点击【主页】点击【关闭并上载】就会将数据加载到Excel文件中了,至此就汇总完毕了
后期如果有新的PDF文件进来,只需要放在这个文件夹中,然后打开汇总表,点击【刷新】就能实现自动汇总了,非常的方便。
想要从零学习Excel,这里↓↓↓
标签: #算法pdf百度云盘