作者:
出版社: 清华大学出版社
CIP号:2019241996
书号:978-7-302-54090-8
出版地:北京
出版时间:2020.
定价:¥59.8
本书指导你使用PySpark构建机器学习模型、自然语言处理应用程序和推荐系统,以满足各种业务需求。本书讨论PySpark的基本原理和演变历程,介绍传统机器学习算法,展示如何构建有监督的机器学习模型(如线性回归、逻辑回归、决策树和随机森林)和无监督的机器学习模型(如k—means和分层聚类),分析如何用PySpark创建有用功能来训练机器学习模型。通过阅读本书,你将了解如何使用PySpark的机器学习库来构建和培训各种机器学习模型,还将熟悉相关的PySpark组件(如数据获取、数据处理和数据分析)。本书面向数据科学和机器学习专业人士。