作者:
出版社: 机械工业出版社
CIP号:2018263173
书号:978-7-111-61404-3
出版地:北京
出版时间:2019.1
定价:¥59.0
本书提供了一个完整、现代的网络爬取指南,使用Python作为编程语言,专为数据科学的读者编写,探讨了网络爬取及其背后的大量Web技术。书中首先简要概述抓取和现实生活中的用例,解释了HTTP、HTML和CSS的核心概念作为基础,之后总结了一些最佳实践和一系列的例子,这些数据科学用例汇集了你学到的所有知识。读者将学会如何利用已建立的最佳实践和常用的Python包,处理包括JavaScript、Cookie等常见的网络爬取。