作者 |
毋建军 姜波 |
丛书名 |
面向新工科高等院校大数据专业系列教材 |
出版社 |
机械工业出版社* |
ISBN |
9787111687108 |
简要 |
简介 |
内容简介 《Python数据分析、挖掘与可视化》从大数据分析实际业务流程出发,利用案例贯穿介绍了大数据分析应具备的基础开发技术,包括Python基础、Python高级开发技术、数据采集与存储、数据预处理、数据分析、数据可视化、数据挖掘等;详细介绍了基于Python的数据分析全流程技术和相关机器学习算法;并通过社交用户画像挖掘案例,介绍了从应用场景需求分析→社交数据分析→用户画像构建的开发方法和过程,以及基于Flask框架、用户属性、神经网络挖掘的社交用户数据分析和画像构建过程。 《Python数据分析、挖掘与可视化》既可作为高等院校人工智能、计算机、大数据等专业的相关课程的教材,也可作为大数据分析人员的技术参考书。 |
目录 |
前言 第1章 Python基础1 11 Python概述1 12 Python大数据应用3 121 Python与大数据技术3 122 常用行业数据集6 123 嵌入式开发应用6 124 数据挖掘及应用7 125 机器学习及应用8 126 数据分析未来发展9 13 搭建Python开发环境10 131 Python开发环境系统要求10 132 Windows系统平台下搭建开发环境10 133 Linux系统平台下搭建开发环境12 134 Mac系统平台下搭建开发环境13 14 Python集成开发平台14 15 Python常用库概述18 151 Python库简介18 152 Python库安装及集成19 153 Python数据分析工具21 16 创建Python程序21 161 在Anaconda下创建Python程序22 162 命令行创建Python程序25 163 Python运行在移动终端25 164 创建Python嵌入式程序27 习题28 第2章 Python高级开发29 21 字符串29 211 字符串及格式化29 212 字符串常用方法32 213 字符串匹配与正则表达式匹配33 214 字符串应用35 22 文本处理35 221 读写JSON数据35 222 读写CSV数据37 223 解析XML数据38 224 字典转XML数据42 225 文本处理应用43 23 文件和流45 231 打开文件及模式45 232 文件处理方法46 233 文件应用47 24 网络及Web应用48 241 创建TCP、UDP服务器48 242 RPC远程访问51 243 Python动态网站应用52 25 Python图形绘制55 251 Python GUI简介55 252 wxPython安装及配置55 253 wxPython应用55 254 PySimpleGUI及Jython应用58 26 Python测试及框架60 习题63 第3章 Python数据采集与存储64 31 数据采集简介64 311 数据源概述64 312 常用的爬虫框架66 313 社交网站信息采集75 32 Python数据存储78 321 文本格式存储78 322 文本存储应用80 323 二进制格式存储80 324 二进制存储应用81 33 数据库存储81 331 Python 常用数据库简介82 332 MongoDB及应用82 333 Redis及应用93 334 SQLite及应用102 335 PyTables 及应用108 336 社交数据存储112 34 案例:租房数据采集与存储113 习题115 第4章 Python数据预处理116 41 数据预处理及工具简介116 411 预处理基础116 412 预处理方法117 413 预处理技术118 414 垃圾短信分类预处理120 42 NumPy122 421 NumPy安装及配置123 422 NumPy的数据存取123 423 NumPy的矩阵构建126 424 NumPy 的矩阵运算128 425 NumPy的数学统计131 426 NumPy的排序运算134 427 NumPy处理缺失项136 43 pandas137 431 pandas安装及配置138 432 pandas数据结构141 433 pandas 数据加载和存储142 434 pandas数值计算与排序144 435 pandas数据索引构建147 436 pandas复杂数据结构148 437 书目信息索引149 44 SciPy150 441 SciPy安装及配置151 442 SciPy的文件输入与输出152 443 SciPy的特殊函数应用152 444 SciPy的线性代数运算153 445 SciPy的快速傅里叶变换154 446 SciPy的优化和拟合155 45 案例:社交网站数据预处理157 习题162 第5章 Python数据分析163 51 数据分析简介163 511 数据分析发展163 512 数据分析主流技术164 513 数据分析应用领域166 52 Python 数据分析库167 521 scikit-learn167 522 statsmodels170 523 Gensim172 524 Keras174 525 社交网站数据分析177 53 分类178 531 分类简介179 532 常用分类算法179 533 分类评价标准181 534 新闻分类182 54 回归184 541 回归简介184 542 常用回归算法185 543 回归评价标准187 544 房屋价格回归分析188 55 聚类189 551 聚类简介189 552 典型聚类算法189 553 聚类评价标准191 554 用户社区聚类分析192 56 机器学习基础194 561 机器学习简介194 562 常见机器学习算法195 563 主流应用框架196 564 Theano 应用198 57 案例:购物网站用户态度及情感分析199 习题201 第6章 Python 数据可视化202 61 数据可视化简介202 611 数据可视化定义202 612 数据可视化发展203 613 数据可视化分类204 614 数据可视化应用205 62 数据可视化基础206 621 数据可视化基本流程206 622 主流数据可视化分析技术207 623 人口迁移数据可视化209 63 数据可视化开发工具210 631 matplotlib210 632 NetworkX213 633 seaborn214 634 ggplot216 635 Bokeh217 636 Pygal219 637 Plotly221 638 pyecharts224 64 数据可视化分析框架227 65 案例:话题漂移可视化228 习题232 第7章 Python数据挖掘与应用233 71 数据挖掘简介233 711 Python数据挖掘基础234 712 文本分词236 713 Gensim文本主题挖掘237 714 新词发现242 72 Python视频数据处理244 721 常见视频数据处理算法244 |