首页>参考读物>计算机科学与技术>专用软件

R语言数据可视化实战
作者 : 米霖 编著
出版日期 : 2020-10-23
ISBN : 978-7-111-66791-9
定价 : 169.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 572
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

本书全面介绍了如何利用R语言绘制各种统计图形,书中的所有统计图形都给出了实例源代码,读者可以通过代码进行复现。本书共13章,涵盖的主要内容有R语言数据可视化简介;数据处理与探索;数据可视化;单变量图形绘制;两个同类型变量的图形绘制;离散变量和连续变量之间的图形绘制;高维图形绘制;其他图形绘制;图形元素、标题和图例;颜色等参数的调整;合并多幅图形;R语言绘图包;Shiny工具包。
本书适合R语言数据可视化入门与进阶读者阅读,也适合数据分析和数据挖掘的从业者及其他数据科学从业者阅读。另外,本书还适合统计学、计算机、机器学习和数学等相关专业的本科生及研究生作为参考读物。

图书特色

广告语:

资深数据科学家多维度详解R语言数据可视化技术的精髓,通过500多个可视化示例,全面展现30多类统计图形的绘制,学习门槛低,零基础即可入门,示例均给出代码

图书前言

  数据可视化是一种非常重要的技能,能够帮助人们快速理解信息,分析数据中存在的趋势,识别关系中的模式。当人们有了新的见解后,往往需要将这些见解传达给其他人,在传达的过程中,使用图表、图形或其他对视觉有影响的表现形式非常重要,因为这些表现形式吸引人并可以迅速传达信息。
  R是由统计学家设计的专门用于统计计算的语言,它也是一种非常好的数据可视化工具。随着技术的进步,数据公司或研究机构对数据的收集变得越来越复杂,许多人已经采用R语言作为分析数据的首选语言。R语言适用于机器学习、数据分析、数据可视化及科学计算等领域。它有多个主题的软件包,如计量经济学、金融学和时间序列等,也拥有一流的可视化、报告和交互性工具。这些工具对于企业和科学研究都非常重要,被科学家、工程师和商业人士广泛使用。
  笔者多年来一直以R语言为工具从事数据可视化、数据分析、统计建模和机器学习等数据科学工作,在工作中积累了大量的经验,对R语言的原理和应用有比较全面和深入的认识,尤其在数据可视化方面更是有独到的见解。R语言提供了强大的数据可视化功能,可以生成高质量的图形,如条形图、直方图、散点图、动态图和数学符号,甚至可以用很少的代码来实现自己设计的全新图形。R语言有很多数据可视化包,如ggplot2、ggivs和plotly等,使用这些包可以非常轻松地绘制出令人印象深刻的数据可视化图表。其中,plotly包提供了一套绘制交互式图形的工具,所绘制的图形非常有表现力。另外,R语言的文档资源很丰富,而且质量很高,这对学习R语言有很大的帮助。
  为了帮助广大相关从业人员和数据技术爱好者快速掌握R语言数据可视化技术,笔者编写了本书。本书主要介绍如何使用R语言绘制常见的统计图形,如直方图、散点图和箱线图等,另外也介绍了如何绘制一些不常见但很实用的统计图形,如桑基图、和弦图和时间序列图等。
  本书不但介绍了普通的统计图形的绘制,而且介绍了交互式图形及动画图形的绘制,另外还介绍了如何使用Shiny工具包进行数据探索与可视化。相信通过阅读本书,读者可以在较短时间内比较系统地掌握R语言数据可视化技术。
本书特色
  1.内容全面,理论结合实践
  本书全面介绍如何利用R语言绘制各种统计图形,涵盖普通的统计图形绘制、高级统计图形绘制、交互式图形绘制、动画图形绘制,以及统计图形的细节调整。另外,本书还介绍了如何利用Shiny进行数据探索与可视化,是一部理论与实践紧密结合的数据可视化学习宝典。
  2.零基础入门,学习门槛低
  阅读本书不需要读者具备太多的预备知识,只要有基本的数学与统计学知识即可,学习门槛很低,零基础即可入门。
  3.实例丰富,实用性强
  本书在讲解的过程中给出了大量的R语言绘图实例,这些实例涵盖单变量图形绘制、两个同类型变量的图形绘制、分类变量和连续变量的图形绘制、高维图形绘制等。这些例子都非常实用,可以比较容易地迁移到实际工作中。
  4.绘图代码详细,效果精美
  本书中的绘图实例都给出了详细的实现代码,读者可以按照代码和操作步骤亲自动手实现每一个实例的效果,而且这些绘图实例的效果非常精美,让人赏心悦目。
本书内容
  本书共分为13章,各章内容简单介绍如下:
  第1章主要介绍R语言的基本概念、Rstudio跨平台集成开发环境及常见的统计图形等。
  第2章主要介绍一些数据处理与数据探索的方法,如数据转换和数据重塑等,因为在数据可视化之前需要先对数据进行处理。
  第3章主要介绍在不进行更多细节调整的情况下如何快速地进行数据可视化。
  第4章主要介绍面积图、密度图、直方图和频率图这几种单变量图形的绘制。这类图形往往只涉及数据集的一个变量。
  第5章主要介绍两个同类型变量的图形绘制,包括散点图、抖动点图、连续二维分布图和线图。
  第6章主要介绍分类变量和连续变量的图形绘制,包括箱线图、小提琴图、棒棒糖图、条形图、圆形条形图、饼图和甜甜圈图。
  第7章主要介绍高维图形的绘制,包括气泡图、三维散点图、流型图、相关矩阵图、树状图、圆形包装图和树形图。
  第8章主要介绍其他类型的统计图形绘制,包括和弦图、桑基图、网络图、旭日图、雷达图、词云、平行图、时间序列图、交互式图形及动画图。这些图形并不是很常见,但是非常有用,使用这些高级图形能够让数据可视化的效果更加引人注目。
  第9~11章主要介绍图形的细节调整,如添加图形元素、图形的颜色调整、线条类型调整、坐标轴范围调整、删除面板边框和网格线、合并多幅图形等。一幅优秀的统计图形往往需要许多细节上的调整,通过调整细节,可以让图形更具表现力。
  第12、13章主要介绍一些扩展内容,包括ggfortify绘图包和Shiny工具包,它们可以实现数据可视化的一些高级功能,如交互式图形绘制和动画图形绘制等。
读者对象
* 数据可视化从业人员;
* 统计学、数学、经济学、计算机和财经等专业的本科生和研究生;
* 互联网从业人员,如产品经理;
* R语言数据可视化初学者与进阶者;
* 对数据可视化感兴趣的人员;
* 相关培训机构的学员。
配套资源
  本书的所有实例源代码文件及彩色效果图等相关资源需要读者自行下载。方法是:在机工新阅读网站(www.cmpreading.com)上搜索到本书,然后单击“资料下载”按钮,即可在本书页面上找到“配书资源”下载链接。
售后支持
  本书涉及的内容比较庞杂,R数据可视化技术也是日新月异,加之作者水平和成书时间所限,书中难免有一些疏漏和不当之处,敬请读者指正。阅读过程中若有疑问,请发E-mail至hzbook2017@163.com,以获得帮助。

上架指导

计算机/数据可视化

封底文字

编辑推荐:
资深数据科学家多维度详解R语言数据可视化技术的精髓
通过500多个可视化示例,全面展现30多类统计图形的绘制
快速上手:学习门槛低,零基础即可入门,并在短时间内快速掌握
内容全面:囊括所有常见统计图形的绘制,并介绍交互式和动画图形的绘制
示例丰富:穿插数百个示例,全面展现基于R语言的数据可视化效果
代码实战:所有的示例均给出了实现代码,便于读者动手实践和复现
大咖赞誉
一图胜千言。数据可视化可以更清晰、更直观地展现数据中蕴含的信息,是数据科学的一个重要组成部分。R语言是数据分析和可视化的常用工具,目前介绍R语言数据分析的书很多,而详细且系统地介绍R语言数据可视化的书籍却比较少。本书理论结合实践,对图形参数的含义及设置都做了详细讲解,让读者知其然也知其所以然。相信精读本书,能很好地帮助读者通过图形展示数据分析的结果。
——华中农业大学数学与统计学系副主任 李欣然

各行各业正朝着信息化、数字化和智能化的方向前进。数据作为一种资产越来越受到企业的重视,对其质量的探讨也成为近几年数据管理领域关注的热点。在我看来,数据质量高低的关键在于它能否在最大范围内被各方理解和信任,因此如何准确地表达数据成了一个重要问题。R语言数据可视化为数据的直观展现提供了可能。米霖的这本书顺应市场需求,系统地介绍了R数据可视的相关知识,值得每一位数据可视化技术爱好者细读。
——原金蝶集团技术架构委员会主任/易伙科技CEO/博士 胡博

R语言是颇受欢迎的统计分析编程语言。R语言数据可视化对于人们理解数据有很大的帮助。无论是数据可视化的初学者还是从业人员,只要认真研读本书并演练每一个实例,相信都能从本书中获得启发,从而全面、深入地理解R语言数据可视化技术的精髓。
——华中农业大学理学院数学与信息科学系主任/教授 石峰

作者简介

米霖 编著:快速上手:学习门槛低,零基础即可入门,并在短时间内快速掌握
内容全面:囊括所有常见图形的绘制,并介绍交互式和动画图形的绘制
示例丰富:穿插数百个示例,全面展现基于R语言的数据可视化效果
代码实战:所有的示例均给出实现代码,便于读者动手实践和复现

图书目录

前言
第1章 R语言数据可视化简介 1
1.1 R语言介绍 1
1.1.1 向量 3
1.1.2 列表 3
1.1.3 矩阵 4
1.1.4 数组 5
1.1.5 因子 5
1.1.6 数据框 6
1.1.7 for循环 7
1.1.8 条件判断 8
1.1.9 函数 9
1.2 Rstudio介绍 12
1.3 R包介绍 13
1.4 R语言数据读取 14
1.4.1 读取Excel数据 15
1.4.2 读取SPSS、SAS和STATA数据 17
1.5 ggplot2介绍 18
1.5.1 使用qplot函数快速绘图 19
1.5.2 使用ggplot函数绘图 20
1.6 统计图形 22
1.6.1 散点图 22
1.6.2 箱线图 24
1.6.3 小提琴图 25
1.6.4 条形图 27
1.6.5 和弦图 28
1.6.6 桑基图 30
1.6.7 棒棒糖图 31
1.6.8 克利夫兰点图 32
1.6.9 艺术图 34
1.7 tidyverse介绍 38
1.8 总结 41
第2章 数据处理与探索 42
2.1 数据转换 42
2.1.1 筛选数据集的行 42
2.1.2 筛选数据集的列 46
2.1.3 数据排序及新变量生成 48
2.1.4 数据分组汇总 49
2.1.5 数据合并 50
2.2 数据重塑 54
2.2.1 数据聚合 55
2.2.2 数据分散 56
2.2.3 数据切割 57
2.2.4 数据合并 58
2.3 总结 59
第3章 数据可视化 60
3.1 ggplot2核心概念 60
3.1.1 散点图 62
3.1.2 折线图 64
3.1.3 条形图 66
3.1.4 直方图 68
3.1.5 密度图 72
3.1.6 箱线图 75
3.2 总结 79
第4章 单变量图形绘制 80
4.1 面积图 80
4.1.1 面积图的绘制方式 82
4.1.2 绘制堆叠的面积图 85
4.1.3 绘制比例堆叠面积图 88
4.2 密度图 90
4.2.1 基础密度图 95
4.2.2 绘制少量分组的密度图 96
4.2.3 绘制大量分组的密度图 101
4.2.4 密度图的其他调整 103
4.3 直方图 105
4.3.1 基础直方图 107
4.3.2 分组直方图的绘制 109
4.3.3 合并直方图与密度图 111
4.4 频率图 113
4.5 总结 114
第5章 两个同类型变量的图形绘制 115
5.1 散点图 115
5.1.1 绘制基础散点图 118
5.1.2 绘制分组散点图 121
5.1.3 添加拟合曲线 127
5.1.4 在散点图中添加地毯图 130
5.1.5 在散点图中添加文本 136
5.2 抖动点图 140
5.3 连续二维分布图 142
5.3.1 绘制二维直方图 143
5.3.2 绘制六角直方图 144
5.3.3 绘制二维密度直方图 145
5.3.4 调整图形配色 147
5.4 线图 148
5.4.1 绘制基础线图 155
5.4.2 绘制连线图 160
第6章 分类变量和连续变量的图形绘制 163
6.1 箱线图 163
6.1.1 绘制基础箱线图 174
6.1.2 调整参数 175
6.1.3 调整箱线图组别的顺序 176
6.1.4 调整颜色 183
6.1.5 构建分组箱线图 191
6.1.6 调整箱线图的宽度 193
6.1.7 构建连续变量的箱线图 194
6.1.8 添加平均值 195
6.1.9 添加抖动点 196
6.2 小提琴图 197
6.2.1 绘制基础的小提琴图 200
6.2.2 绘制水平的小提琴图 201
6.2.3 在小提琴图中添加箱线图 203
6.3 棒棒糖图 204
6.3.1 绘制分组的棒棒糖图 209
6.3.2 绘制基础棒棒糖图 217
6.3.3 棒棒糖图参数的调节 219
6.3.4 添加标注 224
6.4 条形图 226
6.4.1 绘制基础条形图 229
6.4.2 改变条形图宽度 235
6.4.3 添加误差棒 235
6.5 圆形条形图 241
6.5.1 绘制基础圆形条形图 250
6.5.2 添加标签 252
6.5.3 圆形条形图的更多调整 253
6.6 饼图 259
6.6.1 绘制基础饼图 263
6.6.2 调整细节 264
6.6.3 添加标签 265
6.7 甜甜圈图 266
第7章 高维图形绘制 270
7.1 气泡图 270
7.1.1 绘制基础气泡图 274
7.1.2 控制气泡的大小 275
7.1.3 设置颜色 276
7.1.4 调整更多的细节 277
7.1.5 绘制动态图 279
7.2 三维散点图 280
7.3 流型图 282
7.3.1 绘制基础流型图 285
7.3.2 调整流型图的偏移 286
7.3.3 调整流型图的形状与颜色 287
7.4 相关矩阵图 288
7.5 树状图 291
7.5.1 绘制基础树状图 295
7.5.2 绘制圆形树状图 297
7.5.3 绘制聚类结果的树状图 298
7.5.4 更多调整 302
7.6 圆形包装图 308
7.6.1 具有一个层次的圆形包装图 310
7.6.2 调整颜色 311
7.6.3 调整圆形之间的距离 315
7.6.4 绘制多层次的圆形包装图 315
7.6.5 调整细节 317
7.6.6 隐藏第一级 321
7.7 树形图 325
7.7.1 绘制基础树形图 326
7.7.2 绘制带有多个级别的树形图 327
7.7.3 自定义树形图 328
第8章 其他图形绘制 332
8.1 和弦图 332
8.1.1 绘制圆形图 334
8.1.2 绘制基础和弦图 337
8.1.3 调整细节 340
8.2 桑基图 343
8.3 网络图 347
8.3.1 绘制基础网络图 356
8.3.2 调整网络图的参数 358
8.3.3 网络图布局 361
8.3.4 将变量映射到节点和链接特征 362
8.3.5 使用网络图可视化聚类结果 364
8.4 旭日图 366
8.5 雷达图 368
8.5.1 绘制雷达图 374
8.5.2 绘制多组雷达图 375
8.6 词云 376
8.6.1 绘制词云 378
8.6.2 调整颜色和背景颜色 379
8.6.3 调整形状 381
8.6.4 调整单词方向 382
8.7 平行图 383
8.7.1 绘制基础平行图 389
8.7.2 自定义颜色、主题和外观 390
8.8 时间序列图 391
8.8.1 时间序列包dygraphs 396
8.8.2 时间序列热图 397
8.9 交互式图形 399
8.9.1 散点图 400
8.9.2 气泡图 401
8.9.3 面积图 402
8.9.4 条形图 404
8.9.5 饼图 405
8.9.6 桑基图 406
8.9.7 误差棒图 408
8.9.8 箱线图 409
8.9.9 直方图 411
8.9.10 二维直方图 413
8.9.11 二维轮廓直方图 414
8.9.12 小提琴图 415
8.9.13 雷达图 416
8.9.14 热图 418
8.9.15 三维散点图 418
8.9.16 动画图 420
8.9.17 调整图形图例 421
8.9.18 修改交互文本 422
8.10 动画图 423
8.10.1 绘制基础动画图 424
8.10.2 使用分面 425
8.10.3 动态变化图形 426
第9章 图形元素、标题和图例绘制 429
9.1 添加图形元素 429
9.2 主标题、轴标签和图例标题 432
9.2.1 改变标签的外观 434
9.2.2 修改图例 436
9.2.3 修改图例的位置和外貌 436
9.2.4 使用guides函数修改图例 440
第10章 颜色等参数的调整 445
10.1 图形颜色调整 445
10.1.1 使用单个颜色调整图形 446
10.1.2 通过分组调整颜色 448
10.1.3 渐变或连续颜色 455
10.2 点的形状、颜色和大小的调整 457
10.3 线条类型调整 460
10.4 坐标轴范围调整 462
10.5 坐标轴转换 465
10.6 时间数据坐标轴 468
10.7 自定义标签 471
10.8 图形主题和背景颜色 477
10.9 自定义图形的背景 480
10.10 删除面板边框和网格线 481
10.11 ggthemes包 482
10.12 文本注释 483
10.13 ggrepel包 485
10.14 添加直线 488
10.15 图形翻转和反向 490
10.16 分面 491
第11章 合并多幅图形 499
11.1 合并多幅图形到一张图中 499
11.2 gridExtra包 502
11.3 添加边际分布图 505
11.4 在ggplot中插入一个外部图形元素 506
第12章 R语言绘图包 509
12.1 ggstatsplot包 509
12.2 ggfortify包 520
12.2.1 生存分析 520
12.2.2 时间序列图 521
12.2.3 密度图 523
12.2.4 时间序列预测图 524
12.2.5 聚类图 527
12.2.6 热力图 530
12.2.7 主成分分析可视化 532
12.3 quantmod包 535
第13章 Shiny工具包 544
13.1 Shiny工具包简介 544
13.2 Shiny App的基础部分 548
13.3 Shiny示例 550
13.4 Shiny总结 553
13.5 制作一个Shiny程序 554
13.6 Shiny部署 556

教学资源推荐
作者: 晓雨工作室
作者: 何宁 吴黎兵 滕冲
作者: 黄燕 吴平 等
作者: Helmut Kopka, Patrick W.Daly
参考读物推荐