當前位置:成語大全網 - 漢語詞典 - Python的正則表達式

Python的正則表達式

1,正則表達式的壹些內容

正則表達式主要用於匹配需要在文本中查找的內容,例如在文章中查找電話號碼。就中國而言,11數字是純數字(座機就更不用說了),用“\d{11}”表示匹配11次的數字。妳可以準確地找出文本中的電話號碼。還有,寫網絡爬蟲的時候,需要提取很多超鏈接重新爬行,所以使用正則表達式非常方便。直接匹配pile()中的r符號不是轉義字符,也就是保持下面的字符串不變,findall返回壹個列表。下面有壹個稍微不同的程序版本。

compile的另壹個參數re。IGONORECASE(大小寫忽略),也可以re。DORALL,多線模式,具體功能不明確。然而,添加re。匹配時DOTALL參數可以匹配換行符。如果想忽略大小寫並啟用多行模式,可以使用re。Compele ' ... ',回復。忽略大小寫。

表達式使用()將匹配的內容分成三組,即,(\w+)壹次或多次出現字母、數字和下劃線,下面使用match對象的group()方法時,這組就是參數。如果不給出參數和參數0,將得到全部匹配的內容。參數1獲取第壹個括號匹配的內容,依此類推參數2和3。如果沒有括號分組,使用參數會有錯誤。

Search()找到符合規律模式的內容,後面的壹個壹次都找不到。返回壹個匹配對象。

\w匹配字母、數字和下劃線。

\W匹配除字母、數字和下劃線以外的所有字符。

\d匹配數字

\D匹配非數字。

\s匹配空格、制表符、換行符。

\S匹配除空格制表符和換行符之外的其他字符。

[...]自己定義匹配,比如[aeiouAEIOU]匹配所有元音,但不匹配單詞。

{最小次數,最大次數},如{3,9}匹配3-9次,{10}匹配0-10次。默認是最大匹配次數(貪婪匹配),非貪婪模式後面加個問號?

可以選擇0次還是1次?

+匹配1次以上。

*匹配0次或多次。

判斷開頭\ d如果要匹配的字符串以數字開頭,則返回第壹個數字。

$判斷結局?\d$?如果要匹配的字符串以數字結尾,則返回最後壹個數字。

。?匹配除換行符以外的所有字符的通配符。

\d{11}?匹配數字11次

。*?匹配除換行符以外的所有字符。

[阿紮-Z0-9。_%+-] ?小寫和大寫字母、數字、句點、下劃線、百分號、加號或破折號。

[a-zA-Z]{2,4}匹配字母2-4次。