数据采集技术

数据采集技术

作者:

出版社: 高等教育出版社

CIP号:2018107353

书号:978-7-04-049781-6

出版地:北京

出版时间:2018.5

定价:¥23.9


简介

本书主要分成四个章节部分,第一部分以学生信息管理的项目为依托,讲解Python的Web访问技术,它是爬虫的程序基础。第二部分以爬取城市天气预报的项目为依托,讲解网页数据的爬取方法,其中重点讲解了BeautifulSoap的数据分析与提取方法。第三部分以爬取网络图像的项目为依托,讲解爬起多个网页数据的方法,重点讲解了网页的深度优先与广度优先顺序爬取路径的构造方法与多线程分布式网页爬取技术。第四部分以爬起网站的图书信息项目为依托,讲解目前功能强大的分布式爬取框架scrapy的程序设计技术。

推荐

车牌查询
桂ICP备20004708号-3