首页>参考读物>公共基础课>心理健康教育

图形数据可视化:技术、工具与案例
作者 : [美] 科里·拉纳姆(Corey L. Lanum) 著
译者 : 王贵财 李建国 刘冰 译
出版日期 : 2017-12-18
ISBN : 978-7-111-58578-7
定价 : 59.00元
扩展资源
扩展信息
语种 : 简体中文
页数 : 197
开本 : 16
原书名 : Visualizing Graph Data
原出版社: Manning Publications
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

本书主要探讨理解图形数据、建立图形数据结构以及创建有意义的可视化的方法。s书中通过精彩的实例分析和令人信服的案例研究,详细介绍了图形数据可视化的技术与工具。你将学会如何用简单而有效的技术来建模数据、处理大数据以及描述时间和空间数据,并且将有能力探索自己的数据。

图书特色

通过清晰简明的图形理论和真实丰富的商业用例解决可视化问题并探索复杂数据集

假如你正在收集有关客户和产品的数据,你能将丰富的数据转化为重要的洞察力吗? 大数据集中复杂的关系难以识别,将这些联系可视化为图形就有可能看到模式,从而挖掘数据中有意义的价值。

本书通过精彩的实例教你如何理解图形数据,建立图形数据结构,以及创建有意义的可视化。你将学会如何用简单而有效的技术来建模数据、处理大数据以及描述时间和空间数据,从而具备扎实的理论基础和实践技巧来探索自己的数据。

本书内容包括:
创建有效的可视化技术
使用Gephi和KeyLines可视化开发包的示例
实际案例研究

作者简介
科里 L. 拉纳姆(Corey L. Lanum)
Cambridge Intelligence(KeyLines图形可视化软件的开发商)的商业主管。他在数据分析和可视化领域拥有近20年的经验。你能通过corey.lanum@gmail.com与他联系。

内容简介
图形是组织数据的一种有用方式,能帮助我们更好地理解数据中包含的关系。可视化有助于以视觉方式组织该数据。结合这两种方法可让那些不是数据科学家的人更加了解他们的数据。尤其在当今大数据时代,图形可视化更能提高数据价值。本书通过案例分析研究和编码实现来讨论图形可视化的基本原理及其原则。
本书共有10章和1个附录。第1章介绍图形可视化的背景知识并指出它们何时能以恰当方式说明数据。第2章探讨各种案例研究,其中图形可视化在反恐、防范信用卡诈骗、信息安全、在线审查诈骗以及其他政府和私营部门等领域都得到有效应用。第3章介绍图形可视化最常用的软件KeyLines和Gephi。第4章和第5章定义图形可视化的关键术语,并深入介绍图形绘制教程。第6章和第7章通过更好的技术来构建美观、整洁、互动的图形(动画、3D和优化触摸屏),并且布局良好。第8章解决可视化大型数据集的常见问题并解释数据筛选过程。第9章研究可视化连续变化数据的最佳方法以及绘制变化数据的不同图形选项。第10章讨论地图数据的绘制,讲解将位置建模为图形并在地图上叠加图形的方法。附录简要介绍D3.js,它是有图形功能的主流可视化库之一。

图书前言

本书的主题是图形可视化,它听起来像一个非常难的专业主题,但实际上有广泛的适用性。图形是组织数据的一种有用方式,能帮助我们更好地理解数据中包含的关系。可视化有助于以视觉方式组织该数据。结合这两种方法可让那些不是数据科学家的人更加了解和理解他们的数据。尤其在当今大数据时代,图形可视化更能提高数据价值。本书通过案例分析研究和编码实现来讨论图形可视化的基本原理及其原则。
如果你正阅读本书印刷版,其中插图为灰度图。黑白插图也能说明问题,但要对其全面了解,请阅读本书电子版,或从该书网站下载全部彩色插图:www.manning.com/books/visualizing-graph-data。
本书读者
有兴趣阅读此书的读者可能为数据科学家、工程师或某些专业人士,这些读者拥有数据并想知道嵌入在数据中的关系。他们会受益于本书。这不是一本学术著作,图形学理论博士可能会觉得这些内容有点太基础。本书部分章节提供JavaScript代码,但并非只针对JavaScript开发人员,因为Gephi的实现没有代码。但是如果开发基于Web的可视化,则需要读者具备JavaScript知识。
本书组织结构
本书分两部分,共有10章和1个附录。第一部分从高层视角介绍图形,结合案例研究说明图形的重要性并讨论数据导入图形模型的方法。第二部分详细介绍如何构建图形可视化,涵盖相关重要知识点。
第一部分讨论理论层面的图形和图形可视化——为什么要可视化图形?其价值是什么?另外,简要介绍在第二部分中用于构建示例的工具。
第1章介绍图形可视化的背景知识并指出它们何时能以恰当方式说明数据。
第2章探讨各种案例研究,其中图形可视化在反恐、防范信用卡诈骗、信息安全、在线审查诈骗以及其他政府和私营部门等领域都得到有效应用。
第3章介绍图形可视化最常用的软件KeyLines和Gephi。
第二部分详细介绍图形可视化的细节,以及使用KeyLines和Gephi实现样本数据集具体概念的方法。
第4章和第5章定义图形可视化的关键术语,并深入介绍图形绘制教程。
第6章和第7章通过更好的技术来构建美观、整洁、互动的图形(动画、3D和优化触摸屏),并且布局良好。
第8章解决可视化大型数据集的常见问题并解释数据筛选过程。
第9章研究可视化连续变化数据的最佳方法以及绘制变化数据的不同图形选项。
第10章讨论地图数据的绘制,讲解将位置建模为图形并在地图上叠加图形的方法。
附录简要介绍D3.js,它是有图形功能的主流可视化库之一。
需要注意,在第二部分中,依次在前几章概念讨论的基础上构建图形可视化示例,所以建议读者先按顺序概览,之后再详细阅读感兴趣的内容。
关于代码
本书包含KeyLines和D3中构建图形可视化的JavaScript代码。在Manning的Git服务器上公开了全部代码,Cambridge Intelligence网站页面上也有托管。示例代码使用KeyLines 3.0版(适用于后续版本)和D3的第4版。
大多数源代码已经调整了格式,添加换行符和相关缩进以适应页面排版。也有极少数源代码清单中包括行连续标记()。此外,正文中解释代码时通常会从源代码清单中删除其注释。源代码清单中附带的代码注释用于突出重要概念。

上架指导

计算机/数据可视化

封底文字

假如你正在收集有关客户和产品的数据,你能将丰富的数据转化为重要的洞察力吗? 大数据集中复杂的关系难以识别,将这些联系可视化为图形就有可能看到模式,从而挖掘数据中有意义的价值。

本书通过精彩的实例教你如何理解图形数据,建立图形数据结构,以及创建有意义的可视化。你将学会如何用简单而有效的技术来建模数据、处理大数据以及描述时间和空间数据,从而具备扎实的理论基础和实践技巧来探索自己的数据。

本书内容包括:
● 创建有效的可视化技术
● 使用Gephi和KeyLines可视化开发包的示例
● 实际案例研究


图书序言

大学刚毕业时,我的第一份工作是在一家情报机构担任承包商,用Visual Basic构建桌面应用程序,将数据库连接到前台。在这个行业我工作了近20年,尽管技术不断变化,但理解嵌入在大量数据间的关系这一问题却变得更加迫切。现在市场中真正需要的便是快速、有效、优雅地理解数据。
越来越多的组织每天收集更多的数据用于更多目标,而不再是分析团队在整个职业生涯中对其进行解析。过去只有大型政府机构处理这一数量级的数据,而现在连小规模的公司都在收集海量信息。大数据不再仅仅是政府职权。
行业面临的最大问题是收集的数据太多,而且大部分数据都无关紧要。因此你如何能看到森林里的树呢?
图形可视化是能够在大数据中识别模式的许多顶级工具之一,非常适合帮助大众了解数据中发生了什么、如何处理以及如何做出明智决定。如果你不根据数据做出决定,那么为什么要收集数据呢?
随着过去十年人们对图形数据库的兴趣激增,可视化数据已成为利用这些数据库的潜力并显著增加其价值的有力途径。通过当前的图形可视化技术,零售网站轻松地清除虚假评价,保险机构更快地发现可疑索赔,航空公司有效地简化航线,荷兰政府甚至使用可视化管理运河系统。图形数据可视化的应用很多,随着大数据不断扩大,这个行业也将获得巨大的发展。
我经常受邀参加世界各地的会议,讨论可视化图形的技术。 Manning出版社建议我把讲稿编著成书,向更多的人分享这些经验。随着编写工作的开展,本书逐步完善,最终成为图形可视化的入门书,并介绍了一些用来处理图形数据的工具。这个领域很有趣,而且可视化往往既美观又有用,我很高兴与读者分享。
本书中选择使用KeyLines和Gephi有两个重要原因。Gephi是一个免费的开源工具,易使用且能快速查看自己的数据。尽管用户界面差强人意,但它是数据科学家的标准工具,并且随着每次发布而变得更加强大。至于KeyLines,我承认或许不够客观:我受雇于Cambridge Intelligence,该公司开发了KeyLines。但是KeyLines是构建图形可视化最强大的JavaScript库,而且因为只做这一件事,所以更易于解释基本的可视化概念。另外有一个附录讨论D3.js,它虽然有点复杂,但却是一个功能强大的工具。

译者序

图形数据可视化是将数据进行图形化展示的过程,以最大限度地提高可读性并获得更多的洞察信息。但是,这并不意味着一定要实现绚丽多彩的视觉效果与应有尽有的功能模块。为了有效地传达思想概念,美学形式与功能需求应当齐头并进,通过直观地传达数据的关键特征,从而实现对相当稀疏而又复杂的数据集的深入洞察。然而,设计人员往往并不能很好地把握设计与功能之间的平衡,从而创造出华而不实的数据可视化形式,无法达到其主要目的,也就是传达与沟通信息。为此,本书不仅介绍了图形可视化的基本概念,还包含丰富的案例研究。书中所选皆为最实用的技术和工具,而不深入讨论图形绘制的理论细节,旨在理论教你如何理解图形数据、建立图形数据结构以及创建有意义的可视化。
Gephi是一个支持动态和分层图的交互图形可视化工具。KeyLines是构建图形可视化最强大的JavaScript库,能创建自定义可视化。D3.js 是最流行的可视化库之一,允许将任意数据绑定到DOM,然后将数据驱动应用到Document中。这本引人入胜的书通过前面提到的三种工具实现的精彩示例,向读者展示解决可视化问题并探索复杂数据集的方法。你将发现这些简单而有效的技术可以用来建模数据、处理大数据以及描述时间和空间数据。最后,你将掌握创建有效的可视化的实用技能。
不管是初学者、普通用户还是专家级用户,通过本书都能理解并掌握图形数据可视化技术。为让读者快速掌握核心技术,本书由浅入深讲解大量实例,图文并茂呈现每一步的操作结果,帮助读者更好地掌握图形数据可视化工具。
本书作者科里·拉纳姆(Corey L. Lanum)为世界各地的公司和政府机构构建可视化和分析应用程序,并在可视化图形方面积累了数十年的经验,翻译过程中我们为作者对可视化图形数据的深入掌握和独到见解而惊讶、赞叹。同时这对我们而言也是一个学习与提高的过程。为做到专业词汇权威准确,内容忠实原书,我们查阅了大量资料。但受限于时间和精力,难免存在错误,恳请读者及时指出,以便再版时予以更正。
翻译分工如下:河南工业大学信息学院王贵财负责1~8章以及附录,李建国负责第9章,中国兵器科学研究院刘冰负责第10章。
本书的翻译得到了以下资助:河南省高校科技创新团队支持计划——面向领域大数据的分布式计算技术(17IRTSTHN011),河南省高等学校重点科研项目资助计划(18A430011),河南工业大学校科研基金——青年支持计划(2016QNJH29)。
特别感谢机械工业出版社的编辑为本书出版所付出的辛勤劳动。感谢家人对我们的支持与鼓励。

图书目录

译者序
序言
致谢
前言
关于原书封面插图
第一部分 图形可视化基础
第1章 可视化图形介绍 2
1.1 初识图形可视化 3
1.1.1 何谓图形 3
1.1.2 引论 5
1.1.3 图形数据模型概述 5
1.1.4 何时会用到图形 7
1.2 了解图形可视化 9
1.2.1 何时可视化图形 10
1.2.2 图形可视化常用图例 10
1.3 小结 13
第2章 案例研究 14
2.1 情报与恐怖主义 15
2.2 信用卡诈骗 19
2.2.1 网购诈骗 20
2.2.2 在线审查诈骗 22
2.2.3 可视化审查诈骗 22
2.3 信息安全 26
2.3.1 识别异常网络流量 27
2.3.2 解构僵尸网络攻击 28
2.3.3 分析恶意软件传播 30
2.4 销售和营销图形 32
2.5 小结 35
第3章 Gephi与KeyLines介绍 36
3.1 Gephi 37
3.1.1 获取数据 37
3.1.2 导入数据到Gephi 39
3.1.3 用布局可视化组织数据 40
3.1.4 了解标签内容 41
3.1.5 筛选 41
3.1.6 大小 43
3.1.7 颜色 45
3.1.8 最终产品 45
3.2 KeyLines 47
3.2.1 编码HTML页面 47
3.2.2 编写KeyLines JavaScript 48
3.2.3 KeyLines与数据绑定 49
3.3 小结 51
第二部分 可视化自己的数据
第4章 数据建模 54
4.1 什么是数据模型 54
4.1.1 关系数据 55
4.1.2 键值存储 57
4.2 图形数据模型 57
4.2.1 确定结点 57
4.2.2 确定链接 58
4.3 图形数据库 59
4.3.1 Neo4j 60
4.3.2 Titan 63
4.4 小结 64
第5章 构建图形可视化 65
5.1 了解用户需求 66
5.2 使用直观的视觉属性 68
5.2.1 大小 68
5.2.2 颜色 69
5.2.3 结点图标 71
5.2.4 标识符 72
5.2.5 标签 73
5.3 构建有视觉属性的图形 74
5.4 小结 81
第6章 构建交互式可视化 82
6.1 图形浏览 84
6.2 整理图形 86
6.2.1 Gephi实现 88
6.2.2 KeyLines实现 89
6.3 数据量 90
6.4 动画和移动设备 95
6.4.1 动画图形 95
6.4.2 设计移动触摸环境 96
6.5 小结 97
第7章 组 织 图 形 98
7.1 力导向布局 100
7.1.1 Gephi的力导向布局 103
7.1.2 KeyLines实现 105
7.2 其他布局 106
7.2.1 环形布局 107
7.2.2 层次布局 109
7.2.3 径向布局 111
7.2.4 3D布局 113
7.3 小结 114
第8章 大数据:数据太多时使用图形 115
8.1 控制结点和边的可见性 116
8.1.1 在Gephi中筛选数据 119
8.1.2 在KeyLines中筛选数据 122
8.2 分组和组合 125
8.2.1 何谓分组 125
8.2.2 Gephi分组 130
8.2.3 KeyLines分组 131
8.3 小结 133
第9章 动态图形:如何随时间显示数据 134
9.1 图形如何随时间变化 135
9.2 可视化如何随时间变化 137
9.2.1 并排图标——用大量小图显示时间 137
9.2.2 基于时间筛选 137
9.2.3 动态属性图 142
9.3 实现动态图形 143
9.3.1 Gephi动态图形 143
9.3.2 KeyLines动态图形 145
9.4 小结 149
第10章 地图上的图形:图形可视化的位置 150
10.1 处理地理数据 150
10.1.1 位置数据图形 151
10.1.2 图形中如何对位置建模 151
10.1.3 限制位置表示为结点属性 152
10.2 地图上叠加图形 152
10.2.1 筛选数据子集 154
10.2.2 组合或分组 156
10.3 地图上构建图形 158
10.3.1 在KeyLines对象模型中保存数据 158
10.3.2 构建Hubway数据示例 159
10.4 小结 162
附录A D3.js教程 163

教学资源推荐
作者: (美)罗伯特 J.格雷戈里(Robert J.Gregory)伊利诺伊州威顿学院 著
作者: (美)保罗 E. 斯佩克特(Paul E. Spector)
作者: (美)斯坦伯格(Steinberg, L.)
作者: (美)罗伯特S.费尔德曼(Robert S. Feldman)
参考读物推荐
作者: [美]亚当·奥尔特(Adam Alter)著
作者: [新西兰]詹姆斯?弗林(James R.Flynn) 著
作者: [马来西亚]维申·拉克雅礼(Vishen Lakhiani) 著
作者: [美] 茱莉亚·斯拉格(Julia Silge)戴维·罗宾逊 (David Robinson)著