Python广告数据挖掘与分析实战

作者
杨游云 周健
丛书名
数据分析与决策技术丛书
出版社
机械工业出版社
ISBN
9787111677628
简要
简介
内容简介书籍计算机书籍 这是一部营销和广告数据挖掘与分析的实战指南,横跨技术和业务两个维度,理论与实践相结合。技术维度,结合营销与广告行业的实际需求,系统讲解了广告数据挖掘的模型、算法以及数据分析方法,从而实现面向用户的精准营销;业务维度,结合广告业务的具体场景,为广告中的具体问题提供解决方案。更重要的是,本书还讲解了热门的机器学习算法在广告数据挖掘与分析中的应用。 全书共 10 章,从逻辑上可分为技术理论知识和具体业务应用两个部分。前6章以及第10章主要讲解了广告数据分析与挖掘的技术、方法和应用,第7~9 章则主要讲解了广告业务中的具体问题及相应的解决方法。 第1~2 章主要介绍了Python的安装和环境配置,以及广告数据和广告数据分析的基础知识; 第3~6章深入讲解了Python常用的工具包、模型常用的评价指标,以及如何利用Python建立广告分类模型和集成模型。 第7~8章讲解了广告数据分析的典型案例和常用分析方法,以及如何做一份满意的数据分析报告。 第9章讲解了如何运用数据分析与挖掘方法解决广告业务中的实际问题。 第 10 章主要讲解了常用的数据预处理及特征选择方法。
目录
前言
第1章 Python安装方法1
1.1 Python介绍1
1.1.1 Python的由来1
1.1.2 Python的特点2
1.2 Anaconda安装2
1.3 PyCharm安装及环境配置9
1.3.1 PyCharm安装9
1.3.2 PyCharm环境配置12
1.4 为什么建议使用Python17
1.5 本章小结18
第2章 认识广告数据分析19
2.1 广告数据概述19
2.1.1 广告数据的特点19
2.1.2 广告数据分析的意义20
2.2 广告数据分布20
2.2.1 伯努利分布20
2.2.2 均匀分布20
2.2.3 二项分布21
2.2.4 正态分布22
2.2.5 泊松分布22
2.2.6 指数分布23
2.3 异常值诊断24
2.3.1 三倍标准差法24
2.3.2 箱形图分析法25
2.4 数据相关性26
2.4.1 Pearson相关系数26
2.4.2 Spearman秩相关系数26
2.5 显著性检验27
2.6 本章小结27
第3章 Python广告数据分析常用工具包29
3.1 数据基础运算工具:NumPy29
3.1.1 常见数据结构30
3.1.2 索引与切片34
3.1.3 数组运算35
3.1.4 矩阵运算39
3.1.5 广播42
3.1.6 其他常用操作43
3.2 数据预处理工具:Pandas46
3.2.1 数据结构概述47
3.2.2 数据加载49
3.2.3 数据拼接53
3.2.4 数据聚合57
3.2.5 数据透视表和交叉表59
3.2.6 广告缺失值处理60
3.3 数据可视化分析工具:Matplotlib63
3.3.1 散点图64
3.3.2 条形图65
3.3.3 折线图66
3.3.4 饼图68
3.3.5 直方图68
3.3.6 箱形图71
3.3.7 组合图72
3.4 本章小结74
第4章 模型常用评价指标75
4.1 回归模型常用评价指标75
4.1.1 R275
4.1.2 调整后的R276
4.2 分类模型常用评价指标77
4.2.1 混淆矩阵77
4.2.2 ROC曲线79
4.2.3 AUC80
4.2.4 KS指标82
4.2.5 提升度85
4.3 本章小结87
第5章 利用Python建立广告分类模型88
5.1 逻辑回归88
5.1.1 逻辑回归原理88
5.1.2 损失函数89
5.1.3 利用Python建立逻辑回归92
5.2 决策树92
5.2.1 决策树概述92
5.2.2 决策树算法93
5.2.3 决策树剪枝处理96
5.2.4 决策树的实现97
5.3 KNN98
5.3.1 距离度量98
5.3.2 KNN算法原理99
5.3.3 KNN算法中K值的选取100
5.3.4 KNN中的一些注意事项100
5.3.5 KNN分类算法实现101
5.4 SVM101
5.4.1 最大间隔超平面101
5.4.2 支持向量103
5.4.3 目标函数104
5.4.4 软间隔最大化106
5.4.5 核函数107
5.4.6 SVM算法的应用109
5.5 神经网络110
5.5.1 结构特点110
5.5.2 训练过程111
5.5.3 激活函数114
5.5.4 损失函数117
5.5.5 神经网络的实现118
5.6 本章小结118
第6章 利用Python建立广告集成模型119
6.1 随机森林119
6.1.1 随机森林的Bagging思想119
6.1.2 随机森林的生成及优点120
6.1.3 袋外误差121
6.1.4 Scikit-learn随机森林类库介绍122
6.1.5 随机森林模型的实现123
6.2 GBDT124
6.2.1 GBDT算法思想124
6.2.2 GBDT算法原理125
6.2.3 Scikit-learn GBDT类库介绍126
6.2.4 使用Scikit-learn类库实现GBDT算法127
6.3 XGBoost128
6.3.1 XGBoost算法思想128
6.3.2 XGBoost算法原理129
6.3.3 XGBoost算法的优点130
6.3.4 XGBoost类库参数131
6.3.5 使用Scikit-learn类库实现XGBoost算法132
6.4 Stacking133
6.4.1 Stacking算法思想134
6.4.2 Stacking算法原理135
6.4.3 Stacking算法实现136
6.5 LR+GBDT137
6.5.1 LR+GBDT原理138
6.5.2 LR+GBDT在广告CTR中的应用139
6.5.3 LR+GBDT算法实现140
6.6 FM142
6.6.1 FM的原理142
6.6.2 FM的改进145
6.6.3 FM的Python实现145
6.7 本章小结147
第7章 移动广告常用数据分析方法149
7.1 App下载数据分析149
7.2 游戏行业用户分析151
7.2.1 游戏行业数据分析的作用152
7.2.2 游戏行业的关键数据指标152
7.2.3 游戏用户数据分析方法154
7.3 电商类App用户转化分析156
7.4 工具类App用户分析162
7.5 本地O2O婚纱摄影行业分析163
7.5.1 精准人群定向164
7.5.2 广告创意素材164
7.6 品牌广告与效果广告166
7.7 本章小结168
第8章 广告数据分析报告169
8.1 分析观点明确,逻辑清晰169
8.2 汇报结果,用数据说话170
8.3 分析过程有理有据171
8.4 图表说明171
8.5 数据验证173
8.6 分析建议173
8.7 本章小结174
第9章 广告用户数据挖掘与分析175
9.1 广告用户曝光与响应率分析175
9.2 广告用户曝光与点击率分析178
9.3 广告订单消耗与延时性分析181
9.3.1 Budget Smooth算法184
9.3.2 Budget Smooth的系统设计184
9.4 Lookalike聚类分析186
9.4.1 Lookalike概述186
9.4.2 K-means聚类187
9.4.3 K-means算法的过程188
9.4.4 K-means算法的实现188
9.5 Lookalike技术在广告中的应用190
9.5.1 Lookalike的基本流程190
9.5.2 微信社交中的Lookalike应用191
9.6 本章小结192
第10章 广告数据预处理与特征选择193
10.1 广告数据预处理193
10.1.1 特征缩放193
10.1.2 特征编码195
10.2 常用特征选择方法197
10.2.1 Filter198
10.2.2 Wrapper203
10.2.3 Embedded207
10.3 PCA209
10.3.1 PCA的主要思想209
10.3.2 最大方差理论210
10.4 本章小结214


推荐

车牌查询
桂ICP备20004708号-3