前言:
如今小伙伴们对“python重复项合并”大概比较关注,看官们都想要分析一些“python重复项合并”的相关知识。那么小编在网络上收集了一些有关“python重复项合并””的相关资讯,希望各位老铁们能喜欢,你们快快来了解一下吧!实现功能:
将两个excel文件依据某一个相同字段进行拼接合并(并集)
输入:两个excel文件(至少含有一个相同的字段)
输出:按照相同字段列进行拼接后的excel文件
实现代码:
1
import pandas as pd
2
import warnings
3
warnings.filterwarnings("ignore")
4
5
def merge(file1,file2):
6
data1=pd.read_excel(file1)
7
data1=pd.DataFrame(data1)
8
print(data1[['病例系统ID号','性别','民族']])
9
10
data2=pd.read_excel(file2)
11
data2=pd.DataFrame(data2)
12
print(data2[['病例系统ID号','NAME','市']])
13
14
result=pd.merge(data1[['病例系统ID号','性别','民族']],data2[['病例系统ID号','NAME','市']],on='病例系统ID号',how='outer')
15
16
print(result)
17
result.to_excel("F:\数据杂坛\\result\合并.xls")
18
19
if __name__=="__main__":
20
merge("F:\数据杂坛\data\江苏省SLE数据库(整理).xlsx","F:\数据杂坛\data\患者按地区性别住址_2231.xls")
实现效果:
第一个excel(dataframe)含有病例系统ID号、性别、民族三个字段,共2453条记录;
第二个excel(dataframe)含有病例系统ID号、NAME、市三个字段,共2231条记录;
依据病例系统ID号这个字段进行拼接,拼接后含有病例系统ID号、性别、民族、NAME、市五个字段,共2453条记录(并集拼接)。
喜欢记得点赞,在看,加关注(数据杂坛),将持续更新!
标签: #python重复项合并