首页>参考读物>计算机科学与技术>软件与程序设计

R语言游戏数据分析与挖掘
作者 : 谢佳标 著
出版日期 : 2017-06-30
ISBN : 978-7-111-57308-1
定价 : 79.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 411
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

内容简介:
这是一部从大数据技术和游戏业务双重维度讲解如何利用结果数据指导商业决策的实战性著作,乐逗游戏高级数据分析师撰写,是他近10年数据挖掘与分析经验的总结。
传统的数据分析类图书重技术而轻业务,本书二者并重:技术方面,以游戏数据的挖掘与分析为核心,辐射游戏数据处理的各个环节,系统讲解游戏数据挖掘与分析的技术、方法论和工具;业务方面,所有案例的讲解过程中都对相关业务进行了重点解读,旨在加深数据分析师对游戏业务的理解和思考,从而更好地利用R语言技术解决游戏数据处理中的各种复杂问题。
第一部分:基础篇(第1~4章)
主要讲解了游戏数据分析的流程,以及进行游戏数据分析所需要掌握的R语言技术和相关工具(软件包)的使用方法,这是利用R语言进行数据分析必备的基础。
第二部分:实战篇(第5~11章)
详细讲解了游戏数据的预处理、常用分析方法、玩家路径分析和用户数据分析等核心内容,包含游戏数据分析全流程的技巧和方法论,以及对游戏业务的深入思考。
第三部分:提高篇(第12~13章)
详细介绍了R语言的图形界面工具Rattle和Web开发框架shiny包的使用,能帮助数据分析师们解决更复杂的问题。

图书特色

内容简介
这是一部从大数据技术和游戏业务双重维度讲解如何利用结果数据指导商业决策的实战性著作,由乐逗游戏高级数据分析师撰写,是他近10年数据分析与挖掘经验的总结。
传统的数据分析类图书重技术而轻业务,本书二者并重:技术方面,以游戏数据的分析与挖掘为核心,辐射游戏数据处理的各个环节,系统讲解游戏数据分析与挖掘的技术、方法论和工具;业务方面,所有案例的讲解过程中都对相关业务进行了重点解读,旨在加深数据分析师对游戏业务的理解和思考,从而更好地利用R语言技术解决游戏数据处理中的各种复杂问题。
基础篇(第1~4章)
主要讲解了游戏数据分析的流程,以及游戏数据分析所需要掌握的R语言技术和相关工具(软件包)的使用方法,这是利用R语言进行数据分析必备的基础。
实战篇(第5~11章)
详细讲解了游戏数据的预处理、常用分析方法、玩家路径分析和用户数据分析等核心内容,包含游戏数据分析全流程的技巧和方法论,以及对游戏业务的深入思考。
提高篇(第12~13章)
详细介绍了R语言的图形界面工具Rattle和Web开发框架shiny包的使用,能帮助数据分析师们解决更复杂的问题。

“用户导向,数据驱动”一直是乐逗游戏运营的原则,随着公司业务的增长,我们积累了海量的用户游戏数据,如何有效地分析和应用数据是关键!利用数据科学方法从数据中发掘用户的潜在价值、评估产品质量是每家企业的核心竞争力。佳标将自己多年游戏数据分析的经验写进本书,理论与实践相结合,旨在帮助读者更好地了解数据科学实践的方法和技巧。
——陈湘宇 乐逗游戏CEO
大数据是一把双刃剑,在带来巨大价值的同时,也带来很多挑战。DT时代所积累的海量数据本身并无意义,真正的意义体现在对含有信息的数据所进行的专业化处理。本书以R语言为分析工具,通过大量真实游戏案例,演绎数据价值的发现、评估和挖掘过程,展示了一个职业数据分析师扎实的统计、计算机、游戏业务方面的知识,值得各层次的数据领域从业者参考与借鉴。
——汤银才 华东师范大学经济与管理学部统计学院教授
这是一本能够学到知识的书。作为数据分析和挖掘的老兵,谢佳标先生深度解析了游戏行业的分析流程,带给读者的,不仅仅是流畅的分析过程,还有丰富的实战经验。
——王学钦 中山大学教授/华南统计科学研究中心执行主任
R语言逐渐成为数据分析、挖掘与机器学习领域的重要工具。佳标凭借近10年在游戏公司从事大数据挖掘和可视化工作的实战经验,结合大量的游戏数据分析案例,深入浅出地讲解了游戏数据分析与挖掘过程的多项重要知识:数据探索、数据预处理、模型构建、玩家路径分析和用户分析等。本书将 R 语言与游戏数据分析有机融合,同时将R语言应用辐射至整个数据分析领域,不仅对从事游戏数据处理的读者有极高的参考价值,而且对希望借助R语言进行数据处理、分析、模型构建及可视化的读者也很有价值。
——张良均 资深数据挖掘专家/广州泰迪智能科技总经理 
怎样才能做好游戏数据分析师,是本书将会告诉你的!谢佳标以自己的亲身实践,讲述了游戏数据分析与挖掘的方法与技巧。全文以R语言贯穿,从项目调研到落地实施,处处以数据分析为导向,展示了R语言强大的数据处理能力。做好游戏数据分析,让数据为玩家服务。
——张丹 资深R语言专家/《R的极客理想》系列图书作者

作者简介
谢佳标
资深数据分析与挖掘专家,有近10年的数据分析与挖掘相关工作的经验,从事过电商、电购、电力和游戏等行业,熟悉不同行业的数据特点,有丰富的R语言数据挖掘的实战经验。微软中国最有价值专家(MVP)。
目前供职于国内知名游戏公司——乐逗游戏,任高级数据分析师。作为创梦天地数据挖掘组负责人,带领团队搭建用户画像标签库和智能推荐系统,对游戏数据进行深度挖掘, 主要利用R语言进行大数据的挖掘和可视化工作。
多次受邀在中国R语言大会上发表演讲,曾受邀在中山大学、贵州大学、华南师范大学、厦门大学等多所高校做R语言主题分享。同时还研发了《R语言基础培训》《数据分析之R语言实战》《机器学习与R语言实践》《Rattle:可视化数据挖掘工具》《R语言行业案例实战》等有影响力的精品课程,合著有《R语言与数据挖掘》和《数据实践之美》等书籍。

图书前言

为什么要写这本书
随着大数据的概念越来越流行,越来越多的企业开始重视数据,期待从数据中寻找有价值的结论,以指导公司管理层决策,最终创造更大的价值。但是在游戏行业,数据分析的发展相对缓慢,很多游戏公司是在发现人口红利消失后才逐渐重视数据,希望利用数据驱动产品。而在各种数据分析技术中,R语言作为一个可进行交互式数据分析和探索的强大平台,拥有举足轻重的作用。R语言的免费开源使得很多公司用它来处理数据、展示数据、分析数据、完成模型。
使用R语言可以进行游戏数据分析系统的搭建,可以对累积的海量游戏数据进行挖掘,找出其中的特征和规律。对于有志成为互联网数据挖掘/分析师的读者来说,R语言将成为他们未来必备的技能之一。
笔者在历届中国R语言会议演讲时,都会遇到一些同学问类似这样的问题:“是否学好数据挖掘工具就能胜任数据分析工作?”虽然这些学生都具备很好的理论和工具使用能力,但是缺乏对实际生产数据的处理能力,即学生们很少接触到企业的真实数据,不知道如何将脏数据处理为可以建模的数据集。这也是笔者写这本书的初衷。在本书中,笔者希望结合自己多年的数据挖掘实战经验,将R语言与游戏数据分析有机结合,真正做到“授之以渔”。
本书特色
本书从实际应用出发,结合实例及应用场景,通过对大量案例进行详细阐述和深入分析,进而指导读者在实际工作中通过R语言对游戏数据进行分析和挖掘。
本书的核心是游戏数据分析实战,所以在案例讲解过程中均会对分析结果进行业务解读,进而帮助数据分析师提高“利用结果数据指导实际商务决策”的能力。
基于对业务的思考,本书从解决问题入手,以游戏为最佳切入点,辐射整个数据分析领域,并完成数据分析和挖掘建模工作,对其他行业的数据分析师如何做数据分析/挖掘也具有很大的启发性。同时,本书内容涵盖了R语言基础、数据挖掘理论与实战、交互式绘图和Web网页开发等,故也可以作为数据挖掘的入门书籍。
本书适用对象
游戏产品运营人员
游戏数据分析人员
各行各业的数据分析师
数据分析爱好者
具有数据分析背景的数据科学家
进行数据挖掘应用研究的科研人员
相关专业的在校生
如何阅读本书
全书一共13章,分为三篇:基础篇、实战篇和提高篇。基础篇介绍了游戏数据分析的基本理论知识、R语言的安装与使用、R语言中的数据结构、常用操作和绘图功能。实战篇主要介绍了游戏数据的预处理、常用分析方法、玩家路径分析和用户分析。提高篇介绍了R语言图形界面工具Rattle和Web开发框架shiny包。
第一篇是基础篇(第1~4章):第1章主要介绍了游戏数据分析的必要性和流程;第2章讲解了R语言和RStudio的安装及使用方法,并对数据对象和数据导入进行了介绍;第3章介绍了R语言绘图基础,包括常用图形参数设置、低级绘图函数和高级绘图函数;第4章介绍了lattice和ggplot2绘图包,并详细介绍了一些基于R语言可用于生成交互式图形的软件包,包括rCharts、recharts、rbokeh、plotly等。
第二篇是实战篇(第5~11章):第5章介绍了游戏数据预处理常用的手段,包括数据抽样、数据清洗、数据转换和数据哑变量处理;第6章介绍了游戏数据分析的常用方法,包括指标数据可视化、游戏数据趋势分析、游戏数据相关性分析和游戏数据中的降维技术;第7章介绍了事件点击行为常用的漏斗分析和路径分析;第8章介绍了留存指标的计算、留存率计算与预测、常用分类算法原理和模型评估;第9章介绍了常用用户指标计算、LTV计算与预测、用户物品购买关联分析、基于用户物品购买智能推荐和社会网络分析;第10章介绍了渠道数据分析的必要性和对渠道用户进行质量评级;第11章介绍了常用收入指标计算、利用用户活跃度衡量游戏经济状况、RFM模型研究。
第三篇是提高篇(第12~13章):第12章介绍了R语言的图形界面工具Rattle,该工具能够在图形化的界面上完成数据导入、数据探索、数据可视化、数据建模和模型评估整个数据挖掘流程;第13章介绍了Web开发框架shiny包,使得R的使用者不必太了解CSS、JS,只需要了解一些HTML的知识就可以快速完成Web开发。
勘误和支持
由于笔者的水平有限,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。你可以把意见或建议直接发至我的邮箱(jiabiao1602@163.com)。如果你有什么问题,也可以发邮件来提问,我将尽力为读者提供满意的解答,期待你们的反馈。书中全部数据及源代码都可以从GitHub网站(登录网站https://github.com/jiabiao 1602/Game_DataMining_With_R或扫描下方二维码)进行下载。
致谢
首先,感谢乐逗游戏CEO陈湘宇的支持,让笔者能把这几年在游戏行业中的一些数据挖掘实战写进本书,使读者能完整地看到如何对原始的数据源进行清洗转换以达到建模需求。书中介绍了对游戏行业付费用户行为研究的几种模型算法,相信对其他行业进行付费用户挖掘分析也可以起到很好地借鉴作用。
其次,感谢机械工业出版社华章分社副总编杨福川的信任,同时,也要感谢编辑李艺审阅本书的全部章节,有了他们的支持、鼓励和帮助,本书才能得以顺利出版。
最后,感谢家人,感谢你们一直以来的理解、陪伴和支持。
谨以此书献给我最亲爱的家人以及众多R语言的爱好者和数据分析师们!

上架指导

计算机科学/大数据分析与处理

封底文字

“用户导向,数据驱动”一直是我们乐逗游戏运营的原则,随着公司业务的增长,我们积累了海量的用户游戏数据,如何有效地分析和应用数据是关键!利用数据科学方法从数据中发掘用户的潜在价值,评估产品质量是每家企业的核心竞争力。佳标将多年游戏数据分析经验写进本书,理论与实践相结合,读者可以从书中了解到数据科学实践的方法和技巧。

——陈湘宇 乐逗游戏CEO
大数据是一把双刃剑,带来巨大价值的同时,也带来很多挑战。DT时代所积累的海量数据本身并无意义,真正的意义体现在对于含有信息的数据进行专业化的处理。本书以R语言为分析工具,通过大量真实游戏案例,演绎数据价值的发现、评估和挖掘过程,展示了一个职业数据分析师扎实的统计、计算机、游戏业务方面的知识,值得各层次的数据领域从业者参考与借鉴。
——汤银才 华东师范大学经济与管理学部统计学院教授
这是一本能够学到知识的书。作为数据分析和挖掘的老兵,谢佳标先生深度解析游戏行业的分析流程,带给读者的,不仅仅是流畅的分析套路,还有丰富的实战经验。
——王学钦 中山大学教授/华南统计科学研究中心执行主任
R语言逐渐成为数据分析、挖掘与机器学习领域的重要工具。佳标凭借10余年游戏公司从事大数据挖掘和可视化的实战经验,结合大量的游戏数据分析案例和实践经验,深入浅出地讲解了游戏数据分析与挖掘过程的多项重要知识:数据探索、数据预处理、模型构建、玩家路径分析和用户分析等。本书将 R 语言与游戏数据分析有机融合,同时将R语言应用辐射至整个数据分析领域,不仅对从事游戏数据处理的读者有极高的参考价值,对希望借助R语言进行数据处理、分析、模型构建及可视化的读者也很有价值。
——张良均 资深数据挖掘专家/广州泰迪智能科技总经理
怎样才能做好游戏数据分析师,是本书将会告诉你的!谢佳标以自己的亲身实践,讲述了游戏数据分析与挖掘的方法与技巧。全文以R语言贯穿,从项目调研到落地实施,处处以数据分析为导向,展示了R语言强大的数据处理能力。做好游戏数据分析,让数据为玩家服务。
——张丹 资深R语言专家/《R的极客理想》 系列图书作者

作者简介

谢佳标 著:
谢佳标,资深高级数据分析师,现就任于深圳市创梦天地科技有限公司。精通R语言,有8年以上的数据分析经验,在运用R语言进行数据分析处理及建模等方面有丰富的实战经验,主要从事游戏大数据处理、建模与数据可视化方向的研究。

图书目录

前言
第一篇 基础篇
第1章 什么是游戏数据分析2
1.1 为什么要对游戏进行分析2
1.2 游戏数据分析的流程3
1.3 数据分析师的能力要求4
1.3.1 数据处理能力5
1.3.2 数据挖掘能力6
1.3.3 数据应用能力8
1.4 小结8
第2章 必备R语言基础9
2.1 开发环境准备和快速入门9
2.1.1 R语言简介9
2.1.2 R的安装10
2.1.3 其他辅助工具10
2.1.4 R快速入门12
2.2 数据对象19
2.2.1 向量20
2.2.2 矩阵与数组24
2.2.3 列表和数据框27
2.3 数据导入30
2.3.1 利用RStudio导入30
2.3.2 文本文件的导入32
2.3.3 Excel文件的导入33
2.3.4 数据库文件的导入34
2.3.5 网络数据的爬取38
2.4 小结42
第3章 R语言绘图重要技术43
3.1 常用图形参数43
3.1.1 颜色元素43
3.1.2 文字元素46
3.1.3 点元素46
3.1.4 线元素48
3.2 低级绘图函数48
3.2.1 标题48
3.2.2 坐标轴50
3.2.3 图例52
3.2.4 网格线52
3.2.5 点54
3.2.6 文字54
3.2.7 线55
3.3 高级绘图函数57
3.3.1 散点图58
3.3.2 气泡图59
3.3.3 线图60
3.3.4 柱状图62
3.3.5 饼图62
3.3.6 直方图和密度图63
3.3.7 Q-Q图65
3.3.8 箱线图66
3.3.9 茎叶图66
3.3.10 点图67
3.3.11 马赛克图67
3.4 小结69
第4章 高级绘图工具70
4.1 lattice包绘图工具70
4.1.1 绘图特色70
4.1.2 基本图形77
4.2 ggplot2包绘图工具93
4.2.1 从qplot开始93
4.2.2 ggplot作图96
4.2.3 ggthemes主题包101
4.3 交互式绘图工具103
4.3.1 rCharts包104
4.3.2 recharts包108
4.3.3 rbokeh包118
4.3.4 plotly包119
4.3.5 googleVis包122
4.3.6 其他基于htmlwidgets包开发的交互包124
4.4 小结132
第二篇 实战篇
第5章 游戏数据预处理134
5.1 数据抽样134
5.1.1 数据抽样的必要性134
5.1.2 类失衡处理方法:SMOTE135
5.1.3 数据随机抽样:sample函数138
5.1.4 数据等比抽样:createData-Partition函数139
5.1.5 用于交叉验证的样本抽样142
5.2 数据清洗143
5.2.1 缺失值判断及处理144
5.2.2 异常值判断处理152
5.3 数据转换158
5.3.1 产生衍生变量158
5.3.2 数据分箱159
5.3.3 数据标准化转换160
5.4 数据哑变量处理162
5.5 小结165
第6章 游戏数据分析的常用方法166
6.1 游戏数据可视化166
6.1.1 单指标数据可视化166
6.1.2 双指标数据可视化167
6.1.3 三指标数据可视化167
6.2 游戏数据趋势分析169
6.2.1 同比、环比169
6.2.2 趋势线拟合170
6.2.3 时间序列数据预测171
6.3 游戏数据相关分析179
6.3.1 相关分析基本原理179
6.3.2 相关关系可视化181
6.3.3 活跃时间段相关分析184
6.4  游戏数据中的降维技术186
6.4.1 主成分及因子分析基本原理186
6.4.2 对应分析基本原理188
6.4.3 玩家偏好分析188
6.5 小结191
第7章 漏斗模型与路径分析192
7.1 漏斗模型与路径分析的主要区别和联系192
7.2 漏斗模型193
7.2.1 漏斗模型的主要应用场景193
7.2.2 分析案例:新手教程漏斗模型194
7.3 路径分析197
7.3.1 路径分析的主要应用场景197
7.3.2 路径分析的主要算法198
7.3.3 分析案例:游戏点击事件路径分析202
7.4 小结208
第8章 留存分析209
8.1 指标概述209
8.1.1 用户留存209
8.1.2 流失分析211
8.2 留存率的分析及预测212
8.2.1 留存率曲线213
8.2.2 留存率预测曲线213
8.2.3 优化预测曲线216
8.3 用户流失预测218
8.3.1 分类及模型评估220
8.3.2 活跃用户流失预测233
8.4 小结238
第9章 用户分析239
9.1 用户分类239
9.1.1 新老用户240
9.1.2 活跃用户241
9.1.3 用户习惯243
9.2 LTV244
9.2.1 LTV的定义244
9.2.2 LTV的预测244
9.3 用户物品购买关联分析247
9.3.1 常用关联规则算法248
9.3.2 R中的实现250
9.3.3 案例:对用户购买物品进行关联分析251
9.4 基于用户物品购买智能推荐259
9.4.1 智能推荐模型构建及评估259
9.4.2 案例:对用户物品购买进行智能推荐262
9.5 社会网络分析264
9.5.1 网络图的基本概念264
9.5.2 网络图的R语言实现266
9.5.3 R与Gephi的结合270
9.5.4 案例:分析用户物品购买分类275
9.6 小结279
第10章 渠道分析280
10.1 渠道分析的意义280
10.2 建立渠道数据监控体系282
10.2.1 构建数据分析指标283
10.2.2 建立渠道数据监控体系287
10.3 渠道用户质量评级293
10.3.1 渠道用户质量评级的背景和目的293
10.3.2 渠道用户质量打分模型293
10.3.3 分析案例:渠道用户质量打分294
10.4 小结298
第11章 收入分析299
11.1 宏观收入分析299
11.2 游戏经济与用户关系分析302
11.2.1 背景及数据302
11.2.2 数据探索分析303
11.2.3 模型构建308
11.3 RFM模型研究310
11.3.1 RFM模型研究背景及原理310
11.3.2 案例:付费用户RFM模型研究312
11.3.3 RFM模型的不足及改进314
11.4 小结316
第三篇 提高篇
第12章 Rattle:可视化数据挖掘工具318
12.1 Rattle简介及安装318
12.1.1 Rattle简介318
12.1.2 Rattle安装319
12.2 功能预览319
12.3 数据导入320
12.3.1 导入CSV数据321
12.3.2 导入ARFF数据325
12.3.3 导入ODBC数据326
12.3.4 R Dataset—导入其他数据源328
12.3.5 导入RData File数据集330
12.3.6 导入Library数据332
12.4 数据探索333
12.4.1 数据总体概况333
12.4.2 数据分布探索335
12.4.3 相关性338
12.4.4 主成分341
12.4.5 交互图343
12.5 数据建模348
12.5.1 聚类分析348
12.5.2 关联规则352
12.5.3 决策树354
12.5.4 随机森林356
12.6 模型评估360
12.6.1 混淆矩阵360
12.6.2 风险图360
12.6.3 ROC曲线及相关曲线361
12.6.4 模型得分数据集361
12.7 小结364
第13章 快速搭建游戏数据分析平台365
13.1 shiny快速入门365
13.2 shinydashboard包375
13.3 案例一:搭建数据可视化原型379
13.4 案例二:用户细分及付费预测平台388
13.5 案例三:渠道用户打分平台395
13.6 小结402

教学资源推荐
作者: 邱李华 曹青 郭志强 编著
作者: Brian W.Kernighan,Rob Pike
参考读物推荐
作者: [美]伊恩 F.达尔文(Ian F. Darwin)著
作者: 张军
作者: Alan Monnox
作者: 翟周伟 著