有壹種簡單的方法可以動態解析頁面信息。Urllib不能解析動態信息,但瀏覽器可以。在瀏覽器上顯示處理過的信息實際上是處理過的HTML文本。
文件。這為我們捕捉動態頁面信息提供了壹個很好的思路。Python中有壹個著名的圖形庫——pyqt。雖然PyQt是壹個圖形庫,但它在其中。
QtWebkit。這很實用。谷歌的Chrome和蘋果的Safari都是基於WebKit內核開發的,所以我們可以從PyQt獲取QtWebKit。
讀取頁面中的信息並將其加載到HTML文檔中,然後解析HTML文檔並從HTML文檔中提取我們想要使用的信息。
所需材料:
作者本人使用MAC OS X .在Windows和Linux平臺上應該采用相同的方法。
1、Qt4庫
是庫,不是創作者。這個庫在Mac的默認安裝路徑下,應該是/home/username/developer/。不要更改Qt4的默認安裝路徑。否則安裝可能會失敗。
官網:/snake Wu 1994/style basis _ four/en _ album _ 607236 . shtml“)
Parser = MyParser()
Parser.feed(瀏覽器. html)
打印“完成”
瀏覽器。關閉()
通過這個程序,妳可以下載妳在網頁上看到的所有圖片。幾行簡單的程序完成了這項艱巨的任務。實現了圖片的批量處理。這真的是Python語言的優勢。把艱巨的任務交給第三方。