作者:
出版社: 人民邮电出版社
CIP号:2017305803
书号:978-7-115-47420-9
出版地:北京
出版时间:2018.1
定价:¥59
本书是掌握Scrapy开源爬虫框架的学习指南,先讲解了Scrapy框架的基础,然后讲解了使用Python和第三方API从任何源抽取数据、处理数据以及根据需求来呈现数据的方法。接下来有讲解了将爬取的数据存入数据库中的流程、搜索引擎的相关知识,以及使用Spark Streaming进行实时分析的方法。