大数据综合实战案例教程

作者
工业和信息化部教育与考试中心 组谭志彬 邓立 吴子颖
丛书名
职业教育大数据技术与应用专业产教融合系列教材
出版社
机械工业出版社*
ISBN
9787111661030
简要
简介
内容简介书籍计算机书籍 本书以某市出租车行业为背景介绍大数据技术在项目中的应用。全书共10章,第1章交通大数据概述,第2章某市出租车实战案例部署,第3章某市出租车项目设计,第4章Python语言基础,第5章数据提取,第6章数据清洗,第7章数据存储,第8章数据分析处理,第9章ECharts的应用,第10章某市出租车综合编程实践。 本书适合作为各类职业院校大数据及相关专业的教材,也可作为大数据开发工程师及其他科技工作者的参考用书。 本书配有电子课件、源代码,选用本书作为授课教材的教师可登录机械工业出版社教育服务网(www.cmpedu.com)注册后免费下载。
目录
前 言
第1章 交通大数据概述........................................1
1.1 大数据概述........................................3
1.2 大数据处理过程........................................5
1.3 交通大数据的来源........................................7
1.4 交通大数据的应用........................................9
1.5 交通大数据发展面临的挑战........................................10
1.6 思考练习........................................11
第2章 某市出租车项目实战案例部署.....................13
2.1 项目背景........................................15
2.2 主要流程........................................15
2.3 项目难点分析........................................16
2.4 数据加载........................................16
2.5 本地开发环境搭建........................................20
2.6 发布Tomcat可视化页面........................................31
2.7 数据可视化效果展示........................................34
2.8 思考练习........................................44
第3章 某市出租车项目设计................................45
3.1 数据源........................................47
3.2 项目整体架构设计........................................48
3.3 选择所需软件........................................49
3.4 Hadoop集群规划........................................49
3.5 大数据ETL过程........................................50
3.6 思考练习........................................53
第4章 Python语言基础...................................55
4.1 Python语言概述........................................57
4.2 PyCharm概述........................................58
4.3 Python基础........................................64
4.4 思考练习........................................72
第5章 数据提取........................................73
5.1 数据爬虫........................................75
5.2 文件数据提取........................................86
5.3 思考练习........................................93
第6章 数据清洗........................................95
6.1 数据清洗过滤........................................97
6.2 各类格式文件的数据输出........................................105
6.3 思考练习........................................110
第7章 数据存储........................................111
7.1 HDFS加载存储........................................113
7.2 Sqoop加载存储........................................116
7.3 思考练习........................................120
第8章 数据分析处理.......................................121
8.1 MapReduce概述........................................123
8.2 MapReduce体系结构........................................125
8.3 MapReduce工作流程............................

推荐

车牌查询
桂ICP备20004708号-3