Python和Dask数据科学

Python和Dask数据科学

作者:

出版社: 清华大学出版社

CIP号:2020070587

书号:978-7-302-55378-6

出版地:北京

出版时间:2020.6

定价:¥79.8


简介

书讲述如何构建能处理大量数据的分布式数据项目。首先介绍Dask框架,描述Dask如何扩展Numpy和Pandas等常用Python库。然后介绍Dask数据帧,讨论有助于精简分析的代码模式,深入研究Seaborn的可视化,讲述Dask-ML构建机器学习模型。最后讨论如何扩展Dask应用程序,并讲述如何使用AWS和Docker构建Dask集群。本书分析NYC 2013-2017 Parking Ticket数据库中的大量数据,讨论如何分析数据集,以发现NYC趋势和模式。你将学会在自己的数据中发现类似趋势!

推荐

车牌查询
桂ICP备20004708号-3