作者 |
王恺,路明晓,于刚,张月久 |
丛书名 |
数据科学与工程技术丛书 |
出版社 |
机械工业出版社 |
ISBN |
9787111681601 |
简要 |
简介 |
内容简介书籍计算机书籍 本书基于作者多年来的课程教学经验和利用Python进行数据分析的工程经验编写而成,面向数据分析的初学者,使其具备利用Python开展数据分析工作、解决各专业问题的思维和能力。高校计算机、大数据、人工智能及其他相关专业均可使用本书作为数据分析课程教材。 |
目录 |
第1章 基础知识 1.1 数据分析简介 1.2 Python编程基础 1.2.1 Anaconda环境的安装配置 1.2.2 Jupyter Notebook的使用 1.2.3 内置数据类型 1.2.4 程序控制结构 1.2.5 模块化 1.2.6 面向对象 1.2.7 文件操作 1.2.8 异常处理 1.3 包/模块使用示例 1.3.1 CSV文件操作 1.3.2 排序时间测试 1.4 本章小结 第2章 科学计算基础工具包NumPy 2.1 ndarray类 2.1.1 为什么使用ndarray 2.1.2 ndarray类对象常用属性 2.1.3 创建ndarray类对象 2.2 本章示例数据 2.3 索引和切片基础 2.4 数据拷贝 2.5 数据处理 2.5.1 基础运算 2.5.2 广播机制 2.5.3 通用函数 2.5.4 常用函数和方法 2.6 高级索引 2.7 本章小结 第3章 数据分析工具库Pandas 3.1 Series类 3.1.1 Series对象常用属性 3.1.2 创建Series对象 3.2 DataFrame类 3.2.1 DataFrame对象常用属性 3.2.2 创建DataFrame对象 3.3 Index类 3.3.1 Index对象常用属性 3.3.2 创建Index对象 3.4 元素访问方式 3.4.1 属性运算符访问 3.4.2 索引运算符访问 3.4.3 loc访问方法 3.4.4 iloc访问方法 3.4.5 at和iat索引方法 3.4.6 head和tail方法 3.5 数据清洗 3.5.1 处理缺失数据 3.5.2 删除重复数据 3.6 数据合并 3.6.1 merge方法 3.6.2 join方法 3.6.3 concat方法 3.7 数据重塑 3.7.1 pivot方法 3.7.2 melt方法 3.8 Pandas数据处理实例 3.8.1 药品销售数据处理实例 3.8.2 流感与人口数据处理实例 3.9 本章小结 第4章 数据统计分析 4.1 基本统计分析 4.2 分组分析 4.2.1 定性分组 4.2.2 定量分组 4.3 分布分析 4.4 交叉分析 4.5 结构分析 4.6 相关分析 4.7 应用实例 4.8 本章小结 第5章 时间序列分析 5.1 Datetime 模块 5.2 时间序列基础 5.3 日期时间处理 5.4 频率转换与重采样 5.4.1 频率转换 5.4.2 重采样 5.5 本章小结 第6章 数据可视化 6.1 Matplotlib 6.1.1 线形图 6.1.2 条形图 6.1.3 饼图 6.1.4 散点图 6.1.5 直方图 6.2 Seaborn 6.2.1 关系图 6.2.2 分布图 6.2.3 分类图 6.2.4 回归图 6.2.5 热力图 6.3 Pyecharts 6.3.1 Pyecharts图表类 6.3.2 Pyecharts图表配置 6.4 应用实例 6.5 本章小结 第7章 常见数据格式和网络爬虫 7.1 网络数据获取 7.1.1 Request模块简介 7.1.2 Requests模块主要方法及功能一览 7.1.3 例程代码清单 7.2 数据文件操作 7.2.1 BeautifulSoup4模块简介 7.2.2 BeautifulSoup4模块常用方法及功能一览 7.2.3 例程代码清单 7.3 应用实例 7.4 本章小结 第8章 MySQL数据库操作 8.1 MySQL简介 8.2 MySQL安装 8.3 连接、读取和存储 8.3.1 创建数据库和数据表 8.3.2 Python连接数据库 8.3.3 Python读取数据库 8.3.4 Python存储数据库 8.4 数据操作 8.4.1 查询操作 8.4.2 插入操作 8.4.3 更新操作 8.4.4 删除操作 8.5 应用实例 8.6 本章小结 |