数据的基本操作——去重
duplicated()DataFrame的duplicated方法返回一个布尔型Series表示各行是否是重复行。具体用法如下In[1]: df DataFrame({k1:[one]*3 [two]*4, k2:[1,1,2,3,3,4,4]})In[2]: dfOut[2]:k1 k20 one 11 one 12 one 23 two 34 two 35 two 46 two 4In[3]: df.duplicated()Out[3]:0 False1 True2 False3 False4 True5 False6 Truedtype: booldrop_duplicates()drop_duplicates()用于去除重复的行数具体用法如下In[4]: df.drop_duplicates()Out[4]:k1 k20 one 12 one 23 two 35 two 4代码要求去除df1中重复的行并把结果保存到df2中。示例代码from pandas import Series,DataFrameimport pandas as pddef delete_duplicated():df1 DataFrame({k1: [one] * 3 [two] * 4, k2: [1, 1, 2, 3, 3, 4, 4]})df2df1.drop_duplicates()return df2
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2504204.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!