當前位置:成語大全網 - 漢語詞典 - 使用Python進行數據分析的註意事項:3.1數據結構

使用Python進行數據分析的註意事項:3.1數據結構

元組是固定長度且不可變的Python對象序列。創建元組最簡單的方法是用逗號分隔序列值:

tuple函數將任何序列或叠代器轉換為元組:

括號[]可以得到元組的元素,Python中的序列索引從0開始:

壹旦創建了元組,每個位置中的對象就不能被修改。如果元組的對象是可變的,例如列表,您可以在內部修改它:

您可以使用+符號連接元組,以生成更長的元組:

壹個元組乘以壹個整數會生成壹個有多個副本的元組,就像壹個列表壹樣:

將壹個元組表達式賦給壹個變量,Python會將等號右邊的值解包:

解包的壹個常見場景是遍歷壹系列元組或列表:

*rest用於在調用函數時獲取任意長度的位置參數列表:

Count用於衡量壹個值在元組中出現的次數:

列表的長度是可變的,內容可以修改。您可以使用[]或列表類型函數來定義列表:

append方法將元素添加到列表的末尾:

insert方法可以將元素插入到指定的列表位置:

(插入位置範圍從0到列表長度)

Pop是insert的反向操作,它刪除特定位置的元素並返回:

remove方法找到第壹個匹配值並刪除它:

In關鍵字可以檢查壹個值是否在列表中;

不在意味著不在:

+號可以連接兩個列表:

extend方法可以向列表中添加多個元素:

使用extend向現有列表添加元素是壹種更好的方法,比+更快。

排序方法可以對列表進行排序:

Key可以通過壹個函數生成壹個排序值,比如按字符串長度排序:

找到元素應該插入的位置,並返回位置信息。

insort將元素插入到排序列表中的相應位置,以保持序列的排序。

等分模塊的功能並不檢查列表是否已經排序,所以對無序列表使用等分不會給出錯誤,但可能導致不正確的結果。

切片符號可以為大多數序列類型選擇子集,基本形式是[start:stop]

起始位置的起始索引包含,而結束位置的停止索引不包含。

切片還可以將序列分配給變量:

可以省略Start和stop,默認傳入起始位置或結束位置。負索引可以從序列的末尾開始索引:

步長值可以用在第二個冒號之後,這意味著每隔幾個數字取壹個值:

翻轉列表或元組時,將值傳遞給步長值的壹個巧妙方法是-1:

Dict可能是Python中最重要的數據結構,它更常見的名字是哈希表或關聯數組。

字典是鍵-值對的集合,其中鍵和值都是Python對象。

{}是創建字典的壹種方式,其中鍵-值對用逗號分隔:

您可以在字典中訪問、插入或設置元素:

在檢查字典是否包含鍵時:

Del或pop方法刪除值,pop方法將同時返回被刪除的值,並刪除鍵:

更新方法合並了兩個字典:

update方法改變字典元素的位置。對於字典中已經存在的鍵,如果傳遞給update方法的數據也包含相同的鍵,其值將被覆蓋。

字典的值可以是任何Python對象,但是鍵必須是不可變的對象,比如標量類型(整數、浮點數、字符串)或者元組(並且元組中的對象也必須是不可變的對象)。

hash函數可用於檢查壹個對象是否可以被散列(即,它是否可以被用作字典的鍵):

集合是具有唯壹元素的無序容器。

set函數創建壹個帶有文字集和大括號的集合:

union方法或|二元運算符獲取兩個集合的並集,即兩個集合中不同元素的並集:

交集法或& amp;運算符獲得交集,即包含在兩個集合中的元素:

常用收集方法列表:

與字典類似,集合的元素必須是不可變的。如果要包含列表元素,必須先將它們轉換成元組: