前言:
如今看官们对“python将excel表按表头合并”大体比较讲究,各位老铁们都需要了解一些“python将excel表按表头合并”的相关内容。那么小编也在网上搜集了一些有关“python将excel表按表头合并””的相关资讯,希望兄弟们能喜欢,你们一起来学习一下吧!上次介绍了用Power Query合并excel表格(合并excel表格(使用Power Query)),今天,介绍用python合并excel表格。
准备测试数据
准备3个excel工作簿:明细1.xlsx(包含表一、表二2个工作表)、明细2.xlsx(包含表一、表二2个工作表)、明细3.xlsx(包含表一、表二、表三3个工作表)。在桌面上新建一个文件夹,命名为“明细”,将以上3个工作簿放入其中。在桌面上再建一个文件夹,命名为“合并后的数据”,合并后的文件将导入该文件夹。
明细1.xlsx 表一
明细1.xlsx 表二
明细2.xlsx 表一
明细2.xlsx 表二
明细3.xlsx 表一
明细3.xlsx 表二
明细3.xlsx 表三
开始合并
我用的是Jupyter Notebook,输入如下代码:
执行,打开“合并后的数据”,可以看到在该文件夹中,生成了一个工作簿“合并明细.xlsx”
打开该工作簿,可以看到所有数据已合并到一张表中。
解释说明
接下来逐行解释代码
导入os模块和pandas模块,并为pandas模块取一个别名pd
将“明细”文件夹的路径以字符串的形式赋值给变量dir。“\”是转义字符,在字符串前面加上“r”,则字符串中的“\”不发生转义。
os模块下的listdir()方法,以列表的形式返回指定路径下的文件和目录的名称。返回的结果是这样的:
新建一个空列表df
本部分是for循环部分,用到pd.read_excel()函数、os.path.join()函数、字典的values()方法,append()方法。
pd.read_excel() 读取excel工作簿。header=0表示表中第一行为列名,sheet_name=None表示读取工作簿中所有的工作表。
os.path.join() 拼接路径。
os.path.join(dir,file),即把dir和file连接起来,比如文件夹中的第一个工作簿是“明细1.xlsx”,则os.path.join(dir,'明细1.xlsx')的结果是 “C:\Users\Administrator\Desktop\明细\明细1.xlsx”,如图:
values()方法 用于提取字典的值。如果一个工作簿中有多个工作表,读取后会以字典的形式返回,键为工作表的名称,值为工作表的数据。比如读取明细3.xlsx,结果如下,‘表一’,‘表二’,‘表三’为键,冒号后面为数据。
append()方法 向列表的末尾添加元素
该段代码首先遍历“明细”文件夹中的所有文件,读取每一个工作簿,读取excel工作簿后,再遍历工作簿中的工作表,然后将工作表添加到df中。循环结束后,生成的是一个列表,列表共分7部分,分别是每个工作簿中每个工作表的数据块。如图所示,中括号表示列表,列表中的元素为数据块,数据块用逗号隔开。
将生成的列表中的数据块连接起来,这里用到了concat()函数,结果如下,最左侧为行索引。
将文件导出到指定文件夹,并命名为“合并明细.xlsx”,index=False表示不显示索引。
用python合并excel表格的方法就介绍到这里。本次内容涉及到os模块和pandas模块,for循环 以及os.listdir()、pd.read_excel()、os.path.join()、values()、append()、pd.concat()、to_excel()等函数。每一部分都包括很多内容,本次只介绍了合并excel需要用到的内容,大家有兴趣可以查看相关的说明文档。