在開始數據分析之前,我們需要為數據分配適當的類型,以便我們能夠高效地處理數據。不同的數據類型適合不同的處理方法。如前壹章所述,在加載數據時,您可以指定數據列的類型:
Pandas可以通過以下方式智能推斷每壹列的數據類型,並將返回壹個通過推斷修改的DataFrame。如果需要使用這些類型的數據,可以賦值來替換它們。
pd.to_XXX系統方法可以安全地轉換數據,errors參數如果不能轉換,可以轉換為底層類型:
轉換為數值類型時,默認返回的dtype是float64還是int64取決於所提供的數據。使用downcast參數在向下轉換後獲取其他類型。
可用於以下功能:
Astype()是最常見和最通用的數據類型轉換方法。壹般情況下,我們可以使用astype()進行數據轉換。
以下是壹些使用示例:
當數據的格式不滿足轉換為目標類型的要求時,需要首先處理數據。
處理。例如,“89.3%”是壹個字符串。要將其轉換為數字,必須先刪除百分號:
我們通常使用pd.to_datetime()和s.astype('datetime64[ns]')來轉換時間類型。14章會具體介紹這兩個函數。