當前位置:成語大全網 - 新華字典 - python dataframe 如何去除缺失值

python dataframe 如何去除缺失值

1、導入需要的庫。import pandas as pd,import numpy as np,from sklearn.preprocessing import Imputer。

2、生成缺失數據。data=pd.DataFrame({'name':['Kite','Lily','Hanmei','Danny','Bob'],'English':[92,78,np.nan,23,82],'Math':[69,87,91,np.nan,90],'Chinese':[np.nan,78,96,np.nan,75]}),print(data)。

3、查看缺失值。data.isnull()#查看所有缺失值,data.isnull().any()#獲取含有缺失值的列,data.isnull().all()#獲取全部為NA的列。

4、刪除缺失值。這種處理方式丟失的信息比較多。data2=data.dropna()。print(data2)可以看到,刪除後,僅剩兩行數據。

5、利用sklearn替換缺失值。當缺失值為數值型數據時,可用利用均值來替換。

6、利用pandas替換缺失值。data.fillna(0) #缺失值用0替換。

擴展資料

Python在執行時,首先會將py文件中的源代碼編譯成Python的byte code(字節碼),然後再由Python Virtual Machine(Python虛擬機)來執行這些編譯好的byte code。這種機制的基本思想跟Java,NET是壹致的。

然而,Python Virtual Machine與Java或.NET的Virtual Machine不同的是,Python的Virtual Machine是壹種更高級的Virtual Machine。

這裏的高級並不是通常意義上的高級,不是說Python的Virtual Machine比Java或.NET的功能更強大;

說和Java 或NET相比,Python的Virtual Machine距離真實機器的距離更遠。或者可以這麽說,Python的Virtual Machine是壹種抽象層次更高的Virtual Machine。

基於C的Python編譯出的字節碼文件,通常是pyc格式。除此之外,Python還可以以交互模式運行,比如主流操作系統Unix/Linux、Mac、Windows都可以直接在命令模式下直接運行Python交互環境。直接下達操作指令即可實現交互操作。

Python的設計目標之壹是讓代碼具備高度的可閱讀性。它設計時盡量使用其它語言經常使用的標點符號和英文單字,讓代碼看起來整潔美觀。

它不像其他的靜態語言如C、Pascal那樣需要重復書寫聲明語句,也不像它們的語法那樣經常有特殊情況和意外。

Python開發者有意讓違反了縮進規則的程序不能通過編譯,以此來強制程序員養成良好的編程習慣。

並且Python語言利用縮進表示語句塊的開始和退出(Off-side規則),而非使用花括號或者某種關鍵字。增加縮進表示語句塊的開始,而減少縮進則表示語句塊的退出。縮進成為了語法的壹部分。