龙空技术网

python依据相同字段实现两个excel文件(dataframe)合并

数据杂坛 539

前言:

如今小伙伴们对“python重复项合并”大概比较关注,看官们都想要分析一些“python重复项合并”的相关知识。那么小编在网络上收集了一些有关“python重复项合并””的相关资讯,希望各位老铁们能喜欢,你们快快来了解一下吧!

实现功能:

将两个excel文件依据某一个相同字段进行拼接合并(并集)

输入:两个excel文件(至少含有一个相同的字段)

输出:按照相同字段列进行拼接后的excel文件

实现代码:

1

import pandas as pd

2

import warnings

3

warnings.filterwarnings("ignore")

4

5

def merge(file1,file2):

6

data1=pd.read_excel(file1)

7

data1=pd.DataFrame(data1)

8

print(data1[['病例系统ID号','性别','民族']])

9

10

data2=pd.read_excel(file2)

11

data2=pd.DataFrame(data2)

12

print(data2[['病例系统ID号','NAME','市']])

13

14

result=pd.merge(data1[['病例系统ID号','性别','民族']],data2[['病例系统ID号','NAME','市']],on='病例系统ID号',how='outer')

15

16

print(result)

17

result.to_excel("F:\数据杂坛\\result\合并.xls")

18

19

if __name__=="__main__":

20

merge("F:\数据杂坛\data\江苏省SLE数据库(整理).xlsx","F:\数据杂坛\data\患者按地区性别住址_2231.xls")

实现效果:

第一个excel(dataframe)含有病例系统ID号、性别、民族三个字段,共2453条记录;

第二个excel(dataframe)含有病例系统ID号、NAME、市三个字段,共2231条记录;

依据病例系统ID号这个字段进行拼接,拼接后含有病例系统ID号、性别、民族、NAME、市五个字段,共2453条记录(并集拼接)。

喜欢记得点赞,在看,加关注(数据杂坛),将持续更新!

标签: #python重复项合并