1:爬蟲最大的困難是反爬。豐富的生態(Scrapy爬蟲框架,selenium等無頭瀏覽器)讓反爬變得容易很多,文檔豐富,各種庫和驅動大大降低了爬蟲編寫的難度。據我所知,php似乎沒有太大優勢。
2.Python很簡單,俗稱膠水語言。不管是java,php甚至node,都可以寫爬蟲,但是工業級爬蟲面對的場景比較復雜。如果需要面對面向業務的庫或組件,應該怎麽做?Python基本上不會有太多這樣的問題。
最後,想學python爬蟲的可以關註壹下。總結爬蟲教程很久了。