作者:柯博文编著
出版社: 清华大学出版社
CIP号:2020068548
书号:978-7-302-55395-3
出版地:北京
出版时间:2020.8
定价:¥79.0
本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,最后介绍了pyspider框架、Scrapy框架和分布式爬虫。适合从事计算机、电子信息、自动化、人工智能专业学习的大学生作为教材,并适合从事机器学习的工程师参考阅读。