如何用Python捕捉動態頁面信息

解決方案:

有壹種簡單的方法可以動態解析頁面信息。Urllib不能解析動態信息，但瀏覽器可以。在瀏覽器上顯示處理過的信息實際上是處理過的HTML文本。

文件。這為我們捕捉動態頁面信息提供了壹個很好的思路。Python中有壹個著名的圖形庫——pyqt。雖然PyQt是壹個圖形庫，但它在其中。

QtWebkit。這很實用。谷歌的Chrome和蘋果的Safari都是基於WebKit內核開發的，所以我們可以從PyQt獲取QtWebKit。

讀取頁面中的信息並將其加載到HTML文檔中，然後解析HTML文檔並從HTML文檔中提取我們想要使用的信息。

所需材料:

作者本人使用MAC OS X .在Windows和Linux平臺上應該采用相同的方法。

1、Qt4庫

是庫，不是創作者。這個庫在Mac的默認安裝路徑下，應該是/home/username/developer/。不要更改Qt4的默認安裝路徑。否則安裝可能會失敗。

官網:/snake Wu 1994/style basis _ four/en _ album _ 607236 . shtml“）

Parser = MyParser（）

Parser.feed（瀏覽器. html）

打印“完成”

瀏覽器。關閉（）

通過這個程序，妳可以下載妳在網頁上看到的所有圖片。幾行簡單的程序完成了這項艱巨的任務。實現了圖片的批量處理。這真的是Python語言的優勢。把艱巨的任務交給第三方。