本书主要在基于网站浏览记录的用户画像过程中,学习Hadoop生态体系中的各种组件及框架如何使用,在由项目做引导,拆分整体项目作为章节支撑,如大数据分布式管理系统HDFS,数据处理与筛选MapRedue,数据统计分析工具Hive,HBase数据快速处理,Sqoop数据迁移等,最后整合所有知识点完成大数据用户画像及可视化展示。本书语言精炼,内容易懂,适用于各大高职院校学生和培训机构做授课教材使用,解决了学生基础知识薄弱、理解能力差学习困难等问题。本教材以企业实际项目案例贯穿,在学籍基础知识同时体验企业实际项目应用,更加强化大数据生态系统学习。