1、基於網頁特征的爬蟲的對象主要是網站或者網頁,通過給定內容特征或者鏈接結構特征等來進行抓取具有特定結構的網頁。
2、基於內容模式的爬蟲則要求滿足壹定數據模式的網頁。
3、基於領域概念的抓取方式,通過建立目標領域的本體或詞典,從語義層面來分析特定主題中的不同特征分布情況。