作者:
出版社: 北京大学出版社
CIP号:2019238679
书号:978-7-301-30909-4
出版地:北京
出版时间:2019.12
定价:¥48.0
本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,介绍了pyspider框架、Scrapy框架和分布式爬虫。本书适合软件开发人员、数据科学家,以及对自然语言处理和机器学习感兴趣的人阅读。