首页>参考读物>公共基础课>心理生活

数据即未来:大数据王者之道
作者 : [美] 布瑞恩·戈德西(Brian Godsey) 著
译者 : 陈斌 译
出版日期 : 2018-03-16
ISBN : 978-7-111-58926-6
定价 : 79.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 438
开本 : 32
原书名 : Think Like a Data Scientist: Tackle the Data Science Process Step-by-Step
原出版社: Manning Publications
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

图书特色

余晓芒 涂子沛 唐彬 张瑞海 向江旭 逄伟 郭大刚
联袂力荐

图书前言

2012年,《哈佛商业评论》中的一篇文章将数据科学家誉为“21世纪最性感的职业”。公平地说,在本世纪剩下的87年里,这个说法可能会有所改变。虽然现在数据科学家的确得到了很多关注,介绍数据科学的书籍也正在激增。但是,仅仅把从别处能够找到的文字重复一下或者将其重新包装成另一本书毫无意义。在研究了数据科学的新文献后,我发现大多数作者愿意解释如何使用各种最新的工具和技术,却不愿意详细地讨论数据科学中解决问题的过程。有抱负的数据科学家在熟读了几本书并掌握了最新算法和数据存储知识后,仍然会问同一个问题:应该从哪里开始?
所以,虽然这也是一本介绍数据科学的书,但本书试图引导读者通过存在很多歧路、陷阱并且目的地未知的数据科学之路,对可能发生的意外提出警告,让读者做好准备,并给出如何应对意外的建议。虽然本书将会讨论哪些工具可能最有用及其原因,但主要目标始终是为学习数据科学的过程引路导航,以便在现实生活中智慧、高效、成功地找到以数据为中心的问题的实际解决方案。

上架指导

计算机/数据分析

封底文字

宇宙万物不断演变,数据记载了万物变化的过程。数据工程为我们搜集、存储和管理数据奠定了基础,数据科学为我们探索数据世界的未知提供了思考和研究的框架。深刻领悟《数据即未来》书里所论述的数据科学探索过程、方法和理论,将有助于你深入掌握数据世界发展变化的规律。
 —— 张瑞海
北京百悟科技有限公司董事长

人工智能的核心是数据,如何准备、构建和交付高质量的数据产品至关重要,愿这本书成为大数据、人工智能学习者和从业者的良师益友!
—— 向江旭
苏宁云商IT总部执行副总裁
苏宁技术研究院院长

我们正处在一个新的时代,这个时代里数据是最新的燃料,数据和人工智能正在影响人类生活的方方面面。不只是数据科学家才要懂数据,每一个人,每一种职业,都需要一定的数据思维能力,把数据变成助推自己工作和生活的燃料。本书可以帮助读者掌握数据相关的基础知识,培养初步的数据思维,是一本非常好的入门书!
—— 逄伟
携程旅行网CDO,首席数据官

随着国家大数据战略的推进,以数据联通整合、分析应用、机器学习为中心的项目越来越多,本书称之为“数据科学项目”。作为一个管理者,对于如何成功地准备、组织、规划、构建、实施、交付这些项目,本书提供了很多见解。
 —— 涂子沛
《大数据》和《数据之巅》作者
阿里数据副总裁

本书细致入微地讨论了数据科学解决问题的过程,始终聚焦在数据科学项目中所特有的概念和挑战,不是停留在解释如何使用各种最新的工具和技术的炫技层次,而是组织与利用现有资源和信息实现项目目标的过程,为数据科学的过程引领导航。
—— 郭大刚
北京市互联网金融行业协会秘书长

译者简介

陈斌 译:暂无简介

译者序

汹涌的数字瀑布闪烁着神秘的光彩,密密麻麻地排满了整个屏幕,作为影史经典之作《黑客帝国》的片头,这一幕早已深入人心。而正如这一片头所显示的,今天的世界已然变成了一个数据的世界。阿里研究院甚至提出了从IT(信息科技)转向DT(数据科学)的战略方向。大数据(Big Data)也和人工智能(AI)、云计算(Cloud Computing)、区块链(DLT,分布式记账技术)合称为了ABCD四大新锐技术。
为什么会产生数据科学呢?首先,随着社会的发展,人类的社会实践、生产实践和科学实验产生了大量的数据。近年来,由于移动互联网的快速发展,数据产生的速度也随之激增。技术的进步,也使得数据的记录和整理变得越来越便利。在这一背景下,数据的海量增加使得人们对于数据采集、清洗、过滤、分析、建模和表达的需求也越来越殷切。人们的聚焦点也从如何生产、收集和管理数据,转向如何更好地建立模型和分析数据。由此,数据科学应运而生。
其实,如今在互联网行业里,也有很多从事与数据相关工作的人,包括最基础的数据库管理员(DBA)、维护大数据技术基础(Hadoop/Spark)的系统管理员、研发分布式数据处理程序的程序员、从事数据结构分析与管理的数据架构师、聚焦数据建模的工程师以及负责以可视化手段展示数据的工程师等等。虽然这些人的工作都与数据相关,其中有些人是数据的搬运工,有些人是数据的处理工,有些人是数据库的管理员,但是他们都不能称为数据领域的王者。这就像铁匠每天都在与铁打交道,但是我们从来不把铁匠称为金属学家;农民每天都在和土地打交道,但是我们从来不把农民称为土壤学家,我们每个人天天都在做各种计算,但是我们从来不把自己称为数学家。
那么,在数据的王国里,究竟谁是数据之王?我认为只有那些真正掌握数据科学项目的过程,知道如何探索数据、深入分析数据、用数据解决现实中问题的人才是数据世界里真正的王者,即数据科学家。
那么,如何从搬砖的数据民工变成一个指点江山的数据科学家呢?这需要行业的积淀,个人的努力,还有科学的指导。
本书作者布瑞恩·戈德西结合自己的亲身经历,讲述了数据科学中从项目准备、解决方案构建到项目交付的全部过程,系统地论述了数据科学的完整过程。特别是作者结合自己的成长过程以及工作经历,以案例的形式深入浅出地讲解了在开展数据科学项目的过程中可能遇到的各种问题,使本书成为有志于从事数据科学相关工作的初学者的极佳入门指南,并且对已经拥有数据科学项目经验的人来说,本书也非常实用和有借鉴价值。
数据科学作为一门独立的科学仅仅是近两三年的事情,因此,这个领域是神秘的,令人向往的,这里充满了荆棘,也蕴含着无数的机会,需要大批有志从事数据科学探索的人加入其中。如果你也想了解数据科学,走进数据科学,甚至成为该领域的王者,那么本书将是你最好的敲门砖。

陈斌
2017年11月

图书目录

本书赞誉
中文版序一
中文版序二
译者序
前言
致谢
关于本书
关于原书封面插图
第一部分 准备和收集数据与知识
第1章 数据科学的逻辑 …… 2
1.1 数据科学与本书 …… 4
1.2 意识的可贵 …… 7
1.3 研发人员与数据科学家 …… 9
1.4 需要成为软件研发者吗 …… 12
1.5 需要明白统计学吗 …… 13
1.6 优先级:知识、技术、观点 …… 14
1.7 最佳实践 …… 17
1.8 阅读本书:我怎么讨论概念 …… 23
小结 …… 24
第2章 通过好的提问设置目标 …… 26
2.1聆听客户 …… 27
2.2提出关于数据的好问题 …… 37
2.3用数据回答问题 …… 42
2.4设定目标 …… 48
2.5计划要有弹性 …… 50
练习 …… 51
小结 …… 51
第3章 周围的数据:虚拟的荒野 …… 52
3.1数据作为研究对象 …… 52
3.2数据可能存在的地方,以及如何与之交互 …… 62
3.3数据侦察 …… 80
3.4案例:microRNA与基因表达 …… 89
练习 …… 94
小结 …… 95
第4章 数据整理:从捕捉到驯化 …… 96
4.1案例研究:最佳田径表演 …… 97
4.2准备整理数据 …… 101
4.3技巧与工具 …… 109
4.4常见的陷阱 …… 112
练习 …… 119
小结 …… 119
第5章 数据评估:动手检查 …… 120
5.1案例:安然的电子邮件数据 …… 121
5.2描述性统计 …… 123
5.3检查数据的假设 …… 130
5.4寻找特定的实体 …… 134
5.5大概的统计分析 …… 140
练习 …… 147
小结 …… 147
第二部分 构建软件和统计产品
第6章 制订计划 …… 150
6.1学到了什么 …… 152
6.2重新考虑期望和目标 …… 158
6.3规划 …… 164
6.4沟通新目标 …… 175
练习 …… 176
小结 …… 177
第7章 统计建模:概念与基础 …… 178
7.1如何看待统计 …… 179
7.2统计学:与数据科学相关的领域 …… 180
7.3数学 …… 184
7.4统计模型与推理 …… 194
7.5其他的统计方法 …… 218
练习 …… 227
小结 …… 227
第8章 软件:统计学在行动 …… 229
8.1电子表格和用户图形界面应用 …… 230
8.2编程 …… 239
8.3选择统计软件工具 …… 264
8.4把统计转换成软件 …… 271
练习 …… 277
小结 …… 278
第9章 辅助软件:更大、更快、更高效 …… 279
9.1数据库 …… 280
9.2高性能计算 …… 287
9.3云服务 …… 290
9.4大数据技术 …… 293
9.5XX即服务 …… 297
练习 …… 298
小结 …… 298
第10章 执行计划:汇总 …… 299
10.1执行计划的诀窍 …… 300
10.2修改计划 …… 308
10.3结果:知道什么时候足够好 …… 310
10.4案例研究:基因活性测定协议 …… 315
练习 …… 328
小结 …… 329
第三部分 整理产品结束项目
第11章 交付产品 …… 332
11.1了解客户 …… 333
11.2交付形式 …… 335
11.3内容 …… 345
11.4案例:分析电子游戏 …… 351
练习 …… 353
小结 …… 353
第12章 交付后:问题与修改 …… 354
12.1产品及其使用问题 …… 354
12.2反馈 …… 364
12.3产品修改 …… 370
练习 …… 377
小结 …… 378
第13章 结束:项目善后 …… 379
13.1项目善后 …… 380
13.2从项目中学习 …… 392
13.3展望未来 …… 396
练习 …… 398
小结 …… 399
练习:案例与答案 …… 400

教学资源推荐
作者: [美]玛格丽特·马特林(Margaret W.Matlin)著
作者: (美)罗伯特 M. 卡普兰(Robert M. Kaplan)加利福尼亚大学洛杉矶分校 丹尼斯 P. 萨库兹(Dennis P. Saccuzzo)圣迭戈州立大学
作者: [美]罗伯特·S. 费尔德曼(Robert S. Feldman) 著
作者: (美)罗伯特 J. 斯滕伯格(Robert J. Sternberg)塔夫斯大学温迪 M. 威廉姆斯(Wendy M. Williams)康奈尔大学             著
参考读物推荐
作者: 阳志平 彭华军 等编著
作者: [美]阿米希·P.杰哈(Amishi P. Jha) 著
作者: [美] 欧文·D.亚隆(Irvin D. Yalom) 玛丽莲・亚隆(Marilyn Yalom) 著