首页>参考读物>计算机科学与技术>软件与程序设计

Python广告数据挖掘与分析实战
作者 : 杨游云 周健 著
出版日期 : 2021-03-22
ISBN : 978-7-111-67762-8
定价 : 89.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 222
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

本书共十二章,第1-4章重在介绍移动广告营销数据分析理论与案例分析,包括广告数据分析的基本概念、内容和意义,广告数据分析相关理论知识及常用分析方法,移动广告营销常见的数据分析案例剖析以及如何做一份让领导满意的数据分析报告;本书第5-6章主要介绍Python软件安装及常用包的主要用法。本书第7-10章主要介绍利用Python实现移动广告营销中常见的机器学习算法,重点掌握常用的模型评价方法,模型原理、实现方法和技巧,其中包括混淆矩阵、AUC、ROC等常用模型评价方法以及线性回归、逻辑回归、决策树、KNN、SVM、神经网络、随机森林、GBDT、XGBoost、Stacking等常用监督学习算法。第11章主要介绍k-means聚类、Lookalike相似用户挖掘等常用无监督学习算法及实现方法。第12章主要介绍移动广告营销常用的特征选择及特征工程方法。读者如果只想了解数据分析相关概念和方法,可以选择性阅读本书前四章内容,后八章偏向数据挖掘算法和编程实践等内容,有兴趣可以深入阅读全书。

图书特色

Advertising Data Mining and Analysis with Python;
技术维度,系统讲解广告数据挖掘的模型、算法和方法,实现精准营销;业务维度,为广告业务中的具体问题提供解决方案,包含大量案例和代码
数据分析与决策技术丛书
Python广告数据挖掘与分析实战

杨游云 周健 著

图书前言

为何写作本书
近几年来大数据、云计算、人工智能等概念越来越深入人心,相关技术也越来越成熟。技术的进步必然会带来社会的发展,进而推动整个人类社会不断进步。机器学习、深度学习、强化学习等均属于人工智能的细分领域,数据分析又是机器学习的基础,近几年在现实中的应用场景非常多,作用越发明显,因而越来越受到重视。随着5G时代的到来,数据分析、AI方面的人才将更加紧缺,可以说未来很长一段时间数据分析人才都会是招聘市场上的高端人才,备受企业青睐。本书旨在帮助读者快速了解移动广告相关业务知识及具体应用,掌握数据分析相关理论和实践技能。
本书主要特点
本书将深入剖析广告营销行业的常见数据分析案例,并结合当前热门的机器学习和AI算法在广告营销场景的具体应用进行介绍,帮助读者更好地理解广告行业相关业务与技术应用,快速掌握广告营销数据分析所需要的基本知识和技能。书中采用Python作为项目实战编程语言,可帮助读者学习用Python进行数据分析和解决现实问题。
本书读者对象
本书是一本广告营销行业数据分析入门指导书,适合的读者对象主要分为下面几类:
广告营销专业的在校学生;
对广告营销数据分析感兴趣的其他行业从业者;
想转行做广告数据分析的职场白领、开发人员、其他技术人员等。
如何阅读本书
本书共10章,从逻辑上可分为技术理论知识和具体业务应用两部分。其中,第1~2章主要介绍Python的安装和环境配置,带领读者认识广告数据,理解广告数据分析的意义。第3~6章主要介绍Python常用工具包以及模型常用评价指标,并利用Python建立广告分类模型。第7~8章主要介绍广告数据分析典型案例及常用分析方法,教读者如何做一份满意的数据分析报告。第9章主要介绍如何运用数据分析挖掘方法解决广告业务中的实际问题。第10章主要介绍常用的数据预处理及特征选择方法。
总之,前6章以及第10章主要介绍广告数据分析挖掘技术理论和应用,第7~9章则主要介绍广告业务中的具体问题及相应的解决方法,读者可以有选择性地阅读相应内容,有兴趣的话也可以通读全书。
勘误
尽管作者已经尽了自己最大的努力,但书中仍有不尽如人意的地方。若读者发现本书有错误之处,或者针对本书内容有更好的写作建议及意见,可以在微信公众号“数据挖掘与AI算法”上进行反馈。
致谢
动手写作本书时,我已有孕在身,所以一直顾虑颇多,很担心无法按时交稿。如今书稿付梓在即,心中感慨万千。首先要感谢本书的另一位作者周健的努力和配合,其次要感谢我的家人对我的理解和支持,没有他们,本书是无法顺利完成的。还要特别感谢机械工业出版社华章分社的两位编辑杨福川和李艺,他们的大力支持和辛勤付出才让本书得以顺利出版。

杨游云

上架指导

计算机\数据挖掘

封底文字

经常有朋友找我咨询广告数据挖掘AI算法模型相关的内容,但行业内一直缺少一本体系化讲解这些内容的图书,本书恰好填补了这方面的空白。书中基于Python技术,对广告数据挖掘与分析中常用的AI算法的各种模型、数据预处理、特征提取等关键环节的实现细节进行了详细的拆解,特别适合广告领域的数据分析师和数据挖掘工程师阅读。
——吴俊 流量资本合伙人/《程序化广告实战》《一本书读透Martech智慧营销》作者

广告是数据挖掘与分析的重要应用场景,也是数据价值落地的主要领域,因此在各个企业内部都备受关注。本书介绍了大量广告行业相关的数据分析方法、算法、模型,并融合了一定的行业经验和特殊用法,适合广告营销领域相关的读者阅读。
——宋天龙 触脉咨询副总裁/《Python数据分析与数据化运营》作者

随着5G、智能设备的普及以及各种App的不断涌现,广告主能够越来越简单地通过各种私域、公域渠道触达用户,甚至能够选择触达用户的时机,以及为不同用户呈现不同的广告创意,也就是说,“在合适的时间、合适的渠道为合适的用户呈现合适的内容”的营销愿景离现实越来越近。当然,这一切都需要数据分析的支撑。营销和广告行业一直是数据比较密集、数据价值比较大的行业之一,如何在这些数据中发掘出有价值的信息,不断提升广告投放的ROI是从业者面临的一大难题。游云基于自己丰富的广告行业经验以及数据分析经验,在书中详细介绍了广告行业数据分析的方法和原理,相信能够帮助大家更好地应对这一难题。
——李新国 前国双科技广告监测产品负责人/阿里巴巴技术专家

图书目录

前言
第1章 Python安装方法1
1.1 Python介绍1
1.1.1 Python的由来1
1.1.2 Python的特点2
1.2 Anaconda安装2
1.3 PyCharm安装及环境配置9
1.3.1 PyCharm安装9
1.3.2 PyCharm环境配置12
1.4 为什么建议使用Python17
1.5 本章小结18
第2章 认识广告数据分析19
2.1 广告数据概述19
2.1.1 广告数据的特点19
2.1.2 广告数据分析的意义20
2.2 广告数据分布20
2.2.1 伯努利分布20
2.2.2 均匀分布20
2.2.3 二项分布21
2.2.4 正态分布22
2.2.5 泊松分布22
2.2.6 指数分布23
2.3 异常值诊断24
2.3.1 三倍标准差法24
2.3.2 箱形图分析法25
2.4 数据相关性26
2.4.1 Pearson相关系数26
2.4.2 Spearman秩相关系数26
2.5 显著性检验27
2.6 本章小结27
第3章 Python广告数据分析常用工具包29
3.1 数据基础运算工具:NumPy29
3.1.1 常见数据结构30
3.1.2 索引与切片34
3.1.3 数组运算35
3.1.4 矩阵运算39
3.1.5 广播42
3.1.6 其他常用操作43
3.2 数据预处理工具:Pandas46
3.2.1 数据结构概述47
3.2.2 数据加载49
3.2.3 数据拼接53
3.2.4 数据聚合57
3.2.5 数据透视表和交叉表59
3.2.6 广告缺失值处理60
3.3 数据可视化分析工具:Matplotlib63
3.3.1 散点图64
3.3.2 条形图65
3.3.3 折线图66
3.3.4 饼图68
3.3.5 直方图68
3.3.6 箱形图71
3.3.7 组合图72
3.4 本章小结74
第4章 模型常用评价指标75
4.1 回归模型常用评价指标75
4.1.1 R275
4.1.2 调整后的R276
4.2 分类模型常用评价指标77
4.2.1 混淆矩阵77
4.2.2 ROC曲线79
4.2.3 AUC80
4.2.4 KS指标82
4.2.5 提升度85
4.3 本章小结87
第5章 利用Python建立广告分类模型88
5.1 逻辑回归88
5.1.1 逻辑回归原理88
5.1.2 损失函数89
5.1.3 利用Python建立逻辑回归92
5.2 决策树92
5.2.1 决策树概述92
5.2.2 决策树算法93
5.2.3 决策树剪枝处理96
5.2.4 决策树的实现97
5.3 KNN98
5.3.1 距离度量98
5.3.2 KNN算法原理99
5.3.3 KNN算法中K值的选取100
5.3.4 KNN中的一些注意事项100
5.3.5 KNN分类算法实现101
5.4 SVM101
5.4.1 最大间隔超平面101
5.4.2 支持向量103
5.4.3 目标函数104
5.4.4 软间隔最大化106
5.4.5 核函数107
5.4.6 SVM算法的应用109
5.5 神经网络110
5.5.1 结构特点110
5.5.2 训练过程111
5.5.3 激活函数114
5.5.4 损失函数117
5.5.5 神经网络的实现118
5.6 本章小结118
第6章 利用Python建立广告集成模型119
6.1 随机森林119
6.1.1 随机森林的Bagging思想119
6.1.2 随机森林的生成及优点120
6.1.3 袋外误差121
6.1.4 Scikit-learn随机森林类库介绍122
6.1.5 随机森林模型的实现123
6.2 GBDT124
6.2.1 GBDT算法思想124
6.2.2 GBDT算法原理125
6.2.3 Scikit-learn GBDT类库介绍126
6.2.4 使用Scikit-learn类库实现GBDT算法127
6.3 XGBoost128
6.3.1 XGBoost算法思想128
6.3.2 XGBoost算法原理129
6.3.3 XGBoost算法的优点130
6.3.4 XGBoost类库参数131
6.3.5 使用Scikit-learn类库实现XGBoost算法132
6.4 Stacking133
6.4.1 Stacking算法思想134
6.4.2 Stacking算法原理135
6.4.3 Stacking算法实现136
6.5 LR+GBDT137
6.5.1 LR+GBDT原理138
6.5.2 LR+GBDT在广告CTR中的应用139
6.5.3 LR+GBDT算法实现140
6.6 FM142
6.6.1 FM的原理142
6.6.2 FM的改进145
6.6.3 FM的Python实现145
6.7 本章小结147
第7章 移动广告常用数据分析方法149
7.1 App下载数据分析149
7.2 游戏行业用户分析151
7.2.1 游戏行业数据分析的作用152
7.2.2 游戏行业的关键数据指标152
7.2.3 游戏用户数据分析方法154
7.3 电商类App用户转化分析156
7.4 工具类App用户分析162
7.5 本地O2O婚纱摄影行业分析163
7.5.1 精准人群定向164
7.5.2 广告创意素材164
7.6 品牌广告与效果广告166
7.7 本章小结168
第8章 广告数据分析报告169
8.1 分析观点明确,逻辑清晰169
8.2 汇报结果,用数据说话170
8.3 分析过程有理有据171
8.4 图表说明171
8.5 数据验证173
8.6 分析建议173
8.7 本章小结174
第9章 广告用户数据挖掘与分析175
9.1 广告用户曝光与响应率分析175
9.2 广告用户曝光与点击率分析178
9.3 广告订单消耗与延时性分析181
9.3.1 Budget Smooth算法184
9.3.2 Budget Smooth的系统设计184
9.4 Lookalike聚类分析186
9.4.1 Lookalike概述186
9.4.2 K-means聚类187
9.4.3 K-means算法的过程188
9.4.4 K-means算法的实现188
9.5 Lookalike技术在广告中的应用190
9.5.1 Lookalike的基本流程190
9.5.2 微信社交中的Lookalike应用191
9.6 本章小结192
第10章 广告数据预处理与特征选择193
10.1 广告数据预处理193
10.1.1 特征缩放193
10.1.2 特征编码195
10.2 常用特征选择方法197
10.2.1 Filter198
10.2.2 Wrapper203
10.2.3 Embedded207
10.3 PCA209
10.3.1 PCA的主要思想209
10.3.2 最大方差理论210
10.4 本章小结214

教学资源推荐
作者: 钱晓捷 编著
作者: (美)Y. Daniel Liang 著 阿姆斯特朗亚特兰大州立大学
作者: 过敏意 主编吴晨涛 李超 阮娜 陈雨亭 编著
作者: 刘振安
参考读物推荐
作者: [德] 彼得?普林茨(Peter Prinz),托尼?克劳福德(Tony Crawford)著
作者: 黎跃春 韩小东 付金亮 编著
作者: (美)Adrian Turtschi 等