當前位置:成語大全網 - 書法字典 - 壹個如何使用python抓取csdn博客流量的例子。

壹個如何使用python抓取csdn博客流量的例子。

壹.網站分析

在地址:patible輸入您自己的博客頁面;MSIE 5.5' Windows NT)'

headers = { '用戶代理':用戶代理}

#施工請求

req = urllib2。請求(myUrl,headers=headers)

#訪問頁面

myResponse = urllib2.urlopen(req)

myPage = myResponse.read()

#檢查頁面中是否有“最後壹頁”標簽,以確定是否是最後壹頁。

not last = re . find all(& lt;a href= "。*?"& gt最後壹頁

'打印'-第% d頁。

#使用正則表達式獲得博客的標題

title = re . find all(& lt;span class="link_title " >& lta href= "。*?"& gt(.*?)& lt/a & gt;& lt/span>。,我的頁面,回復。s)

titleList=[]

對於標題中的項目:

titleList.append(str(items)。lstrip()。rstrip())

#使用正則表達式獲得博客訪問量

view = re . find all(& lt;span class="link_view "。*?& gt& lta href= "。*?"Title= "閱讀時報" >閱讀

視圖列表=[]

對於視圖中的項目:

viewList.append(str(items)。lstrip()。rstrip())

#輸出結果

對於範圍內的n(len(title list)):

“打印”訪問:%s標題:% s“%”(查看列表[n])。zfill (4),標題列表[n])

#頁碼加上1

page_num = page_num + 1