作者:
出版社: 东南大学出版社
CIP号:2015165450
书号:978-7-5641-5921-4
出版地:南京
出版时间:2015.8
定价:¥54.0
所有领域中产生的数据都越来越大。你如何有效地利用这些数据?本书介绍了Apache Spark,一种能迅速执行数据分析过程的开源集群计算系统。利用Spark,你能够通过Python、Java和Scala中的简单API迅速地处理大数据集。本书由Spark的开发者撰写完成,得到数据科学家和工程师的支持,本书中的内容能够随时运行。你将学习如何只通过几行代码执行并行任务,并覆盖了从简单批量作业到流处理和机器学习等应用。