在地址:patible輸入您自己的博客頁面;MSIE 5.5' Windows NT)'
headers = { '用戶代理':用戶代理}
#施工請求
req = urllib2。請求(myUrl,headers=headers)
#訪問頁面
myResponse = urllib2.urlopen(req)
myPage = myResponse.read()
#檢查頁面中是否有“最後壹頁”標簽,以確定是否是最後壹頁。
not last = re . find all(& lt;a href= "。*?"& gt最後壹頁
'打印'-第% d頁。
#使用正則表達式獲得博客的標題
title = re . find all(& lt;span class="link_title " >& lta href= "。*?"& gt(.*?)& lt/a & gt;& lt/span>。,我的頁面,回復。s)
titleList=[]
對於標題中的項目:
titleList.append(str(items)。lstrip()。rstrip())
#使用正則表達式獲得博客訪問量
view = re . find all(& lt;span class="link_view "。*?& gt& lta href= "。*?"Title= "閱讀時報" >閱讀
視圖列表=[]
對於視圖中的項目:
viewList.append(str(items)。lstrip()。rstrip())
#輸出結果
對於範圍內的n(len(title list)):
“打印”訪問:%s標題:% s“%”(查看列表[n])。zfill (4),標題列表[n])
#頁碼加上1
page_num = page_num + 1