當前位置:成語大全網 - 新華字典 - 提升Python運行速度的5個小技巧

提升Python運行速度的5個小技巧

pre{overflow-x: auto}

Python 是世界上使用最廣泛的編程語言之壹。它是壹種解釋型高級通用編程語言,具有廣泛的用途,幾乎可以將其用於所有事物。其以簡單的語法、優雅的代碼和豐富的第三方庫而聞名。python除了有很多優點外,但在速度上還有壹個非常大的缺點。

雖然Python代碼運行緩慢,但可以通過下面分享的5個小技巧提升Python運行速度!

首先,定義壹個計時函數timeshow,通過簡單的裝飾,可以打印指定函數的運行時間。

這個函數在下面的例子中會被多次使用。

def?timeshow(func): from?time?import?time def?newfunc(*arg,?**kw): t1?=?time() res?=?func(*arg,?**kw) t2?=?time() print(f"{func.__name__:?>10}?:?{t2-t1:.6f}?sec") return?res return?newfunc @timeshow def?test_it(): print("hello?pytip") test_it() 1. 選擇合適的數據結構

使用正確的數據結構對python腳本的運行時間有顯著影響。Python 有四種內置的數據結構:

列表 : List

元組 : Tuple

集合 : Set

字典 : Dictionary

但是,大多數開發人員在所有情況下都使用列表。這是不正確的做法,應該根據任務使用合適數據結構。

運行下面的代碼,可以看到元組執行簡單檢索操作的速度比列表快。其中dis模塊反匯編了壹個函數的字節碼,這有利於查看列表和元組之間的區別。

import?dis def?a(): data?=?[1,?2,?3,?4,?5,6,7,8,9,10] x?=data[5] return?x def?b(): data?=?(1,?2,?3,?4,?5,6,7,8,9,10) x?=data[5] return?x print("-----:使用列表的機器碼:------") dis.dis(a) print("-----:使用元組的機器碼:------") dis.dis(b)

運行輸出:

-----:使用列表的機器碼:------

3 0 LOAD_CONST 1 (1)

2 LOAD_CONST 2 (2)

4 LOAD_CONST 3 (3)

6 LOAD_CONST 4 (4)

8 LOAD_CONST 5 (5)

10 LOAD_CONST 6 (6)

12 LOAD_CONST 7 (7)

14 LOAD_CONST 8 (8)

16 LOAD_CONST 9 (9)

18 LOAD_CONST 10 (10)

20 BUILD_LIST 10

22 STORE_FAST 0 (data)

4 24 LOAD_FAST 0 (data)

26 LOAD_CONST 5 (5)

28 BINARY_SUBSCR

30 STORE_FAST 1 (x)

5 32 LOAD_FAST 1 (x)

34 RETURN_VALUE

-----:使用元組的機器碼:------

7 0 LOAD_CONST 1 ((1, 2, 3, 4, 5, 6, 7, 8, 9, 10))

2 STORE_FAST 0 (data)

8 4 LOAD_FAST 0 (data)

6 LOAD_CONST 2 (5)

8 BINARY_SUBSCR

10 STORE_FAST 1 (x)

9 12 LOAD_FAST 1 (x)

14 RETURN_VALUE

看下列表的機器碼,冗長而多余!

2. 善用強大的內置函數和第三方庫

如果妳正在使用python並且仍在自己編寫壹些通用函數(比如加法、減法),那麽是在侮辱python。 Python有大量的庫和內置函數來幫助妳不用編寫這些函數。 如果研究下,那麽妳會驚奇地發現幾乎90%的問題已經有第三方包或內置函數來解決。

可以通過訪問官方文檔查看所有內置函數。妳也可以在wiki python上找到更多使用內置函數的場景。

比如,現在我們想合並列表中的所有單詞為壹個句子,比較法自己編寫和調用庫函數的區別:

#正常人能想到的方法 @timeshow def?f1(list): s?="" for?substring?in?list: s?+=?substring return?s #pythonic?的方法 @timeshow def?f2(list): s?=?"".join(list) return?s l?=?["I",?"Love",?"Python"]?*?1000?#?為了看到差異,我們把這個列表放大了 f1(l) f2(l)

運行輸出:

f1 : 0.000227 sec

f2 : 0.000031 sec

3. 少用循環

用 列表推導式 代替循環

用 叠代器 代替循環

用 filter() 代替循環

減少循環次數,精確控制,不浪費CPU

##?返回n以內的可以被7整除的所有數字。 #正常人能想到的方法: @timeshow def?f_loop(n):? L=[] for?i?in?range(n): if?i?%?7?==0: L.append(i) return?L #列表推導式 @timeshow def?f_list(n): L?=?[i?for?i?in?range(n)?if?i?%?7?==?0] return?L #叠代器 @timeshow def?f_iter(n): L?=?(i?for?i?in?range(n)?if?i?%?7?==?0) return?L #過濾器? @timeshow def?f_filter(n): L?=?filter(lambda?x:?x?%?7?==?0,?range(n)) return?L #精確控制循環次數? @timeshow def?f_mind(n): L?=?(i*7?for?i?in?range(n//7)) return?L n?=?1_000_000 f_loop(n) f_list(n) f_iter(n) f_filter(n) f_mind(n)

輸出為:

f_loop : 0.083017 sec

f_list : 0.056110 sec

f_iter : 0.000015 sec

f_filter : 0.000003 sec

f_mind : 0.000002 sec

誰快誰慢,壹眼便知!

filter 配合 lambda 大法就是屌!!!

4. 避免循環重復計算

如果妳有壹個叠代器,必須用它的元素做壹些耗時計算,比如匹配正則表達式。妳應該將正則表達式模式定義在循環之外,因為最好只編譯壹次模式,而不是在循環的每次叠代中壹次又壹次地編譯它。

只要有可能,就應該嘗試在循環外進行盡可能多的運算,比如將函數計算分配給局部變量,然後在函數中使用它。

#應改避免的方式: @timeshow def?f_more(s): import?re for?i?in?s: m?=?re.search(r'a*[a-z]?c',?i) #更好的方式: @timeshow def?f_less(s): import?re regex?=?re.compile(r'a*[a-z]?c') for?i?in?s: m?=?regex.search(i) s?=?["abctestabc"]?*?1_000 f_more(s) f_less(s)

輸出為:

f_more : 0.001068 sec

f_less : 0.000365 sec

5. 少用內存、少用全局變量

內存占用是指程序運行時使用的內存量。為了讓Python代碼運行得更快,應該減少程序的內存使用量,即盡量減少變量或對象的數量。

Python 訪問局部變量比全局變量更有效。在有必要之前,應該始終嘗試忽略聲明全局變量。壹個在程序中定義過的全局變量會壹直存在,直到整個程序編譯完成,所以它壹直占據著內存空間。另壹方面,局部變量訪問更快,且函數完成後即可回收。因此,使用多個局部變量比使用全局變量會更好。

#應該避免的方式: message?=?"Line1\n" message?+=?"Line2\n" message?+=?"Line3\n" #更好的方式: l?=?["Line1","Line2","Line3"] message?=?'\n'.join(l) #應該避免的方式: x?=?5 y?=?6? def?add(): return?x+y add() #更好的方式: def?add(): x?=?5 y?=?6 return?x+y add()

總結

本篇文章就到這裏了,希望能夠給妳帶來幫助,也希望您能夠多多關註的更多內容!