0
| 本文作者: AI研習社 | 2020-07-31 14:51 |

為什么寫這本書 · · · · · ·
網絡爬蟲其實很早就出現了,最開始網絡爬蟲主要應用在各種搜索引擎中。在搜索引擎中,主要使用通用網絡爬蟲對網頁進行爬取及存儲。 隨著大數據時代的到來,我們經常需要在海量數據的互聯網環境中搜集一些特定的數據并對其進行分析,我們可以使用網絡爬蟲對這些特定的數據進行爬取,并對一些無關的數據進行過濾,將目標數據篩選出來。對特定的數據進行爬取的爬蟲,我們將其稱為聚焦網絡爬蟲。
在大數據時代,聚焦網絡爬蟲的應用需求越來越大。 目前在國內Python網絡爬蟲的書籍基本上都是從國外引進翻譯的,國內的本版書籍屈指可數,故而我跟華章的副總編楊福川策劃了這本書。本書的撰寫過程中各方面的參考資料非常少,因此完成本書所花費的精力相對來說是非常大的。
本書從系統化的視角,為那些想學習Python網絡爬蟲或者正在研究Python網絡爬蟲的朋友們提供了一個全面的參考,讓讀者可以系統地學習Python網絡爬蟲的方方面面,在理解并掌握了本書的實例之后,能夠獨立編寫出自己的Python網絡爬蟲項目,并且能夠勝任Python網絡爬蟲工程師相關崗位的工作。
同時,本書的另一個目的是,希望可以給大數據或者數據挖掘方向的從業者一定的參考,以幫助這些讀者從海量的互聯網信息中爬取需要的數據。所謂巧婦難為無米之炊,有了這些數據之后,從事大數據或者數據挖掘方向工作的讀者就可以進行后續的分析處理了。
本書是一本系統介紹Python網絡爬蟲的書籍,全書注重實戰,涵蓋網絡爬蟲原理、如何手寫Python網絡爬蟲、如何使用Scrapy框架編寫網絡爬蟲項目等關于Python網絡爬蟲的方方面面。
本書的主要特色如下: 系統講解Python網絡爬蟲的編寫方法,體系清晰。 結合實戰,讓讀者能夠從零開始掌握網絡爬蟲的基本原理,學會編寫Python網絡爬蟲以及Scrapy爬蟲項目,從而編寫出通用爬蟲及聚焦爬蟲,并掌握常見網站的爬蟲反屏蔽手段。 有配套免費視頻,對于書中的難點,讀者可以直接觀看作者錄制的對應視頻,加深理解。 擁有多個爬蟲項目編寫案例,比如博客類爬蟲項目案例、圖片類爬蟲項目案例、模擬登錄爬蟲項目等。除此之外,還有很多不同種類的爬蟲案例,可以讓大家在理解這些案例之后學會各種類型爬蟲的編寫方法。
總之,在理解本書內容并掌握書中實例之后,讀者將能勝任Python網絡爬蟲工程師方向的工作并學會各種類型網絡爬蟲項目的編寫。此外,本書對于大數據或數據挖掘方向的從業者也非常有幫助,比如可以利用Python網絡爬蟲輕松獲取所需的數據信息等。
本書面向的讀者
Python網絡爬蟲初學者
網絡爬蟲工程師
大數據及數據挖掘工程師
高校計算機專業的學生
其他對Python或網絡爬蟲感興趣的人員
作者簡介 · · · · · ·
重慶韜翔網絡科技有限公司董事長兼CEO,51CTO、CSDN講師,《知道日報》特約作者,國家工信部高級網絡營銷師,蜻蜓FM獨家簽約主播。 多年IT技術實戰開發經驗,曾做過程序員,也做過技術總監,現在運營一家專注于中大型軟件開發與IT技術服務的公司。 曾出品發行過多門IT類課程,包括但不限于《Python系列實戰教程》、《Python GUI系列實戰教程》、《Python數據分析與挖掘實戰教程》、《Nginx運維實戰教程》。
補充說明 · · · · · ·
本站所有資源版權均屬于原作者所有,這里所提供資源均只能用于參考學習用,請勿直接商用。如需刪除,請聯系 kefu@yanxishe.com
AI 研習社已經和阿里大文娛、曠視、搜狗搜索、小米等知名公司達成聯系,幫助大家更好地求職找工作,一鍵投遞簡歷至 HR 后臺,準備了一些內推渠道群。
歡迎大家添加研習社小學妹微信(aiyanxishe),小學妹拉你加入(備注求職)。

雷鋒網雷鋒網雷鋒網
相關文章:
資料 | 圖靈程序設計叢書:深度學習入門:基于Python的理論與實現
資料 | 數字圖像處理與機器視覺Visual C++與Matlab實現 作者張錚
資料 | Python強化學習實戰:應用OpenAI Gym和TensorFlow精通強化學習和深度強化學習
資料 | O'Reilly精品圖書系列:算法精解 C 語言描述 (簡體中文)
資料 | 1800頁33章數學方法精要筆記 —深入數學建模, 機器學習和深度學習的數學基礎
資料 | 算法(第4版)【圖靈程序設計叢書】算法領域的經典參考書
資料 | 《人工智能編程范式:通用Lisp中的案例研究》1048頁PDF免費下載
資料 | Yann LeCun「人工智能發展的挑戰在于無監督學習」原版演講PPT
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。