当前位置:主页 > python教程 > Python对多属性的重复数据去重实例

Python对多属性的重复数据去重多种方法

发布:2020-01-16 10:24:57 101


给网友们整理Python对多属性的重复数据去重相关的编程文章,网友郁文光根据主题投稿了本篇教程内容,涉及到python、多属性、数据去重、Python对多属性的重复数据去重实例相关内容,已被580网友关注,内容中涉及的知识点可以在下方直接下载获取。

Python对多属性的重复数据去重实例

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>> 

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。


参考资料

相关文章

  • Python Beautiful Soup模块使用教程详解

    发布:2023-03-26

    Beautiful Soup 简称 BS4(其中 4 表示版本号)是一个 Python 中常用的页面解析库,它可以从 HTML 或 XML 文档中快速地提取指定的数据,这篇文章主要介绍了Python Beautiful Soup模块的使用


  • 基于DataFrame某一列的值来选择具体的某一行方法

    发布:2020-01-19

    今天小编就为大家分享一篇根据DataFrame某一列的值来选择具体的某一行方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧


  • python编程写代码时几个坏习惯总结

    发布:2019-06-06

    这篇文章主要介绍了程序员写Python时的5个坏习惯,你有几条?有的习惯会让 Bug 变得隐蔽难以追踪,当然,也有的并没有错误,只是个人觉得不够优雅。本文有示例代码,感兴趣的朋友跟随小编


  • Python playwright学习之自动录制生成脚本

    发布:2023-03-22

    playwright 可以支持自动录制生成脚本,也就是说只需要在页面上点点点,就可以自动生成对应的脚本了。本文就来和大家详细聊聊实现方法吧


  • 解决Python 遍历字典时删除元素报异常的问题

    发布:2022-06-29

    给网友朋友们带来一篇关于Python的教程,下面小编就为大家带来一篇解决Python 遍历字典时删除元素报异常的问题。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧


  • python或者的表示方式和用法

    发布:2019-06-28

    python中或者用“or”表示,逻辑表达式为x or y。​Python语言支持逻辑运算符,假设变量a为10, b为20,那么(a or b) 则返回10。


  • Python中ConfigParser模块示例详解

    发布:2023-03-06

    有些时候在项目中,使用配置文件来配置一些灵活的参数是比较常见的事,因为这会使得代码的维护变得更方便,而ini配置文件是比较常用的一种,今天介绍用ConfigParser模块来解析ini配置文件,感兴趣的朋友一起看看吧


  • Python操作配置文件方法分享

    发布:2020-02-19

    这篇文章主要给大家介绍了关于Python配置文件处理的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧


网友讨论