龙空技术网

Pandas去重操作

文和乱武 232

前言:

眼前小伙伴们对“dataframe去重复行”大体比较关切,你们都需要知道一些“dataframe去重复行”的相关内容。那么小编在网摘上网罗了一些对于“dataframe去重复行””的相关知识,希望朋友们能喜欢,各位老铁们一起来了解一下吧!

在 Pandas 中,可以使用 df.drop_duplicates() 方法对 DataFrame 中的重复行进行去重操作。这个方法会返回一个新的 DataFrame,其中已经去除了重复的行。

如果只需要计算去重后的行数,可以在去重后使用 df.shape[0] 来获取行数,例如:

import pandas as pd# 创建包含重复行的 DataFramedf = pd.DataFrame({    'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Charlie'],    'age': [25, 30, 35, 25, 35],    'gender': ['F', 'M', 'M', 'F', 'M']})# 对 DataFrame 进行去重操作,并计算去重后的行数unique_rows_count = df.drop_duplicates().shape[0]# 输出去重后的行数print('去重后的行数:', unique_rows_count)

运行上述代码,输出结果为:

去重后的行数: 3

在这个例子中,我们首先创建了一个包含重复行的 DataFrame,然后使用 drop_duplicates() 方法对其进行去重操作,并使用 shape[0] 获取去重后的行数。

标签: #dataframe去重复行 #dataframe 列 去重