本书适合网络爬虫方向的初学者,系统全面地讲解了如何使用Python快速编写网络爬虫程序。本书在讲解时,结合理论加实践,循序渐进地引领读者疏通原理、动手实践、运用框架。通过本书可以让读者快速进入爬虫领域,具备运用爬虫的能力,满足获取定制数据的需求。
全书共分为13个章节,内容主要包括初识网络爬虫、爬虫的实现原理和技术、网页请求的原理、抓取和解析网页数据的相关技术、并发下载,抓取动态网页、图像识别与文字处理、存储爬虫数据,以及爬虫框架Scrapy的使用,最后介绍了通过Scrapy-Redis如何实现分布式爬虫。
本书既可作为高等院校专科计算机相关专业的程序设计课程教材,也可作为Python网络爬虫的培训教材,是一本适合广大编程开发者的爬虫入门级教材。
特色一:零基础、入门级讲解
为了帮助读者快速入门,本书以初学者的角度出发,铺垫讲解了很多关于网络爬虫的基础知识,让读者站在原理的角度上理解爬虫的机制。
特色二:循序渐进,通俗易懂
在课程知识和内容讲解上,本书所涉及到的知识点都是对应实际应用需求,课程的编排顺序符合大众的认知规律,在知识讲解时采用易于理解的图示和举例的方式,将抽象的概念具体化,并利用示例进一步验证和测试,以总结出实用的经验。
特色三:案例丰富、实战性强
全书共13章,除了第1章介绍爬虫基础知识外,其余每章配有一个真实的爬虫案例,具有极高的参考价值。读者只要亲自实践本书中的案例,轻松掌握爬虫,那都不是事儿~
特色四:知识点全面,技巧性强
在学习爬虫的过程中,本书都会在解决爬虫问题的基础上,提供多种技术参考和解决方案,并且对这些方案进行对比,以供读者在实际运用中更好地选择,增强读者在工作中的编程能力。
特色五:教材、资源、服务三合一,高效学习
为了便于老师备课,本教材配备了精美的PPT、教学视频和源代码等资源。本书还有配套题库可以根据需求自由组卷,方便老师考察学生的学习情况。