本文共 2323 字,大约阅读时间需要 7 分钟。
1.3填充缺失值
当数据量不够或者其他部分信息很重要的时候,就不能删除数据了,这时需要对缺失值进行填充,通过fillna方法可以将缺失值替换为常数值。 例:import pandas as pdimport numpy as npfrom pandas import Series,DataFramefrom IPython.display import displaydata=DataFrame(np.arange(12).reshape(3,4))display(data)#对数据进行处理,即创建一些为缺失值的数据data.loc[1,:]=np.nandata[2]=np.nandisplay(data)
import pandas as pdimport numpy as npfrom pandas import Series,DataFramefrom IPython.display import displaydata=DataFrame(np.arange(12).reshape(3,4))display(data)#对数据进行处理,即创建一些为缺失值的数据data.loc[1,:]=np.nandata[2]=np.nandisplay(data)data.fillna(0)#全部填充为0
import pandas as pdimport numpy as npfrom pandas import Series,DataFramefrom IPython.display import displaydata=DataFrame(np.arange(12).reshape(3,4))display(data)#对数据进行处理,即创建一些为缺失值的数据data.loc[1,:]=np.nandata[2]=np.nandisplay(data)data.fillna({ 1:6,3:0})
import pandas as pdimport numpy as npfrom pandas import Series,DataFramefrom IPython.display import displaydata=DataFrame(np.arange(12).reshape(3,4))display(data)#对数据进行处理,即创建一些为缺失值的数据data.loc[1,:]=np.nandata[2]=np.nandisplay(data)data.fillna(method='ffill')
data=DataFrame({ '姓名':['小敏','晓明','小强','小红','晓明'], '年龄':['女','男','男','女','男'], '地址':['北京','南京','上海','广州','南京']})
import pandas as pdimport numpy as npfrom pandas import Series,DataFramefrom IPython.display import displaydata=DataFrame({ '姓名':['小敏','晓明','小强','小红','晓明'], '年龄':['女','男','男','女','男'], '地址':['北京','南京','上海','广州','南京']})display(data)data.duplicated()
import pandas as pdimport numpy as npfrom pandas import Series,DataFramefrom IPython.display import displaydata=DataFrame({ '姓名':['小敏','晓明','小强','小红','晓明'], '年龄':['女','男','男','女','男'], '地址':['北京','南京','上海','广州','南京']})display(data)data.drop_duplicates()
import pandas as pdimport numpy as npfrom pandas import Series,DataFramefrom IPython.display import displaydata=DataFrame({ '姓名':['小敏','晓明','小强','小红','晓明'], '年龄':['女','男','男','女','男'], '地址':['北京','南京','上海','广州','南京']})display(data)data.drop_duplicates('年龄')
转载地址:http://hrynz.baihongyu.com/