| 作者 |
| 工业和信息化部教育与考试中心 组谭志彬 邓立 吴子颖 |
| 丛书名 |
| 职业教育大数据技术与应用专业产教融合系列教材 |
| 出版社 |
| 机械工业出版社* |
| ISBN |
| 9787111661030 |
| 简要 |
| 简介 |
| 内容简介书籍计算机书籍 本书以某市出租车行业为背景介绍大数据技术在项目中的应用。全书共10章,第1章交通大数据概述,第2章某市出租车实战案例部署,第3章某市出租车项目设计,第4章Python语言基础,第5章数据提取,第6章数据清洗,第7章数据存储,第8章数据分析处理,第9章ECharts的应用,第10章某市出租车综合编程实践。 本书适合作为各类职业院校大数据及相关专业的教材,也可作为大数据开发工程师及其他科技工作者的参考用书。 本书配有电子课件、源代码,选用本书作为授课教材的教师可登录机械工业出版社教育服务网(www.cmpedu.com)注册后免费下载。 |
| 目录 |
| 前 言 第1章 交通大数据概述........................................1 1.1 大数据概述........................................3 1.2 大数据处理过程........................................5 1.3 交通大数据的来源........................................7 1.4 交通大数据的应用........................................9 1.5 交通大数据发展面临的挑战........................................10 1.6 思考练习........................................11 第2章 某市出租车项目实战案例部署.....................13 2.1 项目背景........................................15 2.2 主要流程........................................15 2.3 项目难点分析........................................16 2.4 数据加载........................................16 2.5 本地开发环境搭建........................................20 2.6 发布Tomcat可视化页面........................................31 2.7 数据可视化效果展示........................................34 2.8 思考练习........................................44 第3章 某市出租车项目设计................................45 3.1 数据源........................................47 3.2 项目整体架构设计........................................48 3.3 选择所需软件........................................49 3.4 Hadoop集群规划........................................49 3.5 大数据ETL过程........................................50 3.6 思考练习........................................53 第4章 Python语言基础...................................55 4.1 Python语言概述........................................57 4.2 PyCharm概述........................................58 4.3 Python基础........................................64 4.4 思考练习........................................72 第5章 数据提取........................................73 5.1 数据爬虫........................................75 5.2 文件数据提取........................................86 5.3 思考练习........................................93 第6章 数据清洗........................................95 6.1 数据清洗过滤........................................97 6.2 各类格式文件的数据输出........................................105 6.3 思考练习........................................110 第7章 数据存储........................................111 7.1 HDFS加载存储........................................113 7.2 Sqoop加载存储........................................116 7.3 思考练习........................................120 第8章 数据分析处理.......................................121 8.1 MapReduce概述........................................123 8.2 MapReduce体系结构........................................125 8.3 MapReduce工作流程............................ |