龙空技术网

巧用excel函数排除重复数据

python学徒 83

前言:

眼前姐妹们对“python重复函数”大体比较关切,大家都需要了解一些“python重复函数”的相关内容。那么小编在网络上收集了一些有关“python重复函数””的相关内容,希望大家能喜欢,兄弟们一起来了解一下吧!

用某软件获取到一些某文库数据,但该数据中有很多是重复的,现在需要得到无重复,并且按下载量降序排列的数据,那我们应如何做呢?

1、鼠标选中某中一个单元格,然后选择“数据/删除重复项”,在出现的对话框中啥也不选,直接点击确定。

2、系统会将重复数据删除掉,并提示删除了多少条。这里的删除重复是指每一列的值都是一样的就算是重复的。

3、但光是这样还并没有去除完整,我们再次点击“删除重复项”,在对话框中点“取消全选”,然后再在列框中选择“简介”,那么只要简介是一样的就算是重复项。

4、经过上述步骤,可能还没有删除完重复数据,因为有些简介内容长短不一样,即使是重复的,但由于长度不同,系统也会判定为不重复,那这时我们就要将每个简介都只截取固定长度来进行对比。5、我们在新的列,使用如下公式:

=LEFT(F2,10)

或者:

=MID(F2,1,10)

注:这样我们就只取10个字符,MID函数的第2个参数是指起始位置,是从1开始的,不是从0开始,如果输入为0会出现错误。

6、对K列所有单元格应该上述公式,得到长度统一的简介,对现有数据再次像第3步中那样应用“删除重复项”,只是这次要选中“截取后的简介”。

7、这样就又去除掉了一些重复的项。

8、去重以后,我们再对下载量应用降序排列,那么最后就得到了我们想要的结果了。

标签: #python重复函数