Ich bin kurz vor meinem zweiten Studienjahr. Ich habe selbst Python gelernt und habe Grundkenntnisse in der Grammatik. Ich m?chte Crawlen lernen, aber ich habe das Gefühl, dass es viel Wissen erfordert. Gibt es jemanden, der es erlebt hat und zusammenfassen kann, was er wei?, oder wie man Python-Crawling lernt?
溫故而知新,可以為師矣。 博客:www.ouyangke.com
爬蟲(chóng)學(xué)習(xí)要從需求學(xué)習(xí),你看網(wǎng)上那么多初級(jí)爬蟲(chóng)都是爬些什么段子,美女圖什么的,三天就能搞定這些簡(jiǎn)單的爬蟲(chóng)。
但是深入的話就是很難的,涉及到的方面也很多。
入門不是什么難事,可以看下這個(gè)--
如何學(xué)習(xí)Python爬蟲(chóng)[入門篇] https://zhuanlan.zhihu.com/p/...
原理上就是http請(qǐng)求,再多一點(diǎn)就是session和cookie,再多就是驗(yàn)證碼識(shí)別。
工具上就是請(qǐng)求工具可以用urllib2,更好是request庫(kù),請(qǐng)求過(guò)來(lái)需要解析,那就是beautifulsoup。
Python 基礎(chǔ)教程 | 菜鳥(niǎo)教程 http://www.runoob.com/python/...
Beautiful Soup 4.2.0 文檔 — Beautiful Soup 4.2.0 documentation https://www.crummy.com/softwa...
爬蟲(chóng)性能:NodeJs VS Python - QueenKing - SegmentFault /a/11...
用KNN來(lái)進(jìn)行驗(yàn)證碼識(shí)別 - QueenKing - SegmentFault /a/11...