1.先分析網站內容,紅色部分是網站文章內容div。
2.隨便打開壹個div,可以看到藍色部分除了壹個文章標題之外,沒有什麽有用的信息,但是註意紅色部分我勾勒的地方,就可以知道是文章地址的超鏈接,爬蟲只需要抓取這個地址就可以了。
3.下壹個問題是翻頁。如妳所見,這與大多數網站不同。底部沒有頁面標簽,但是可以看到更多。
4.但是,在查看源文件時,會有壹個超鏈接。測試後,它指向下壹頁,因此通過更改它的最終值,您可以在相應的頁碼上定位它。
代碼如下: