首页>参考读物>计算机科学与技术>综合

数据分析即未来:企业全生命周期数据分析应用之道
作者 : [美]格雷戈里·S. 纳尔逊 (Gregory S. Nelson) 著
译者 : 陈道斌 万芊 等译
出版日期 : 2020-06-10
ISBN : 978-7-111-65699-9
定价 : 89.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 507
开本 : 32
原书名 : The Analytics Lifecycle Toolkit: A Practical Guide for an Effective Analytics Capability
原出版社: John Wiley & Sons(SIN)
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

本书旨在为数据分析生命周期提供一个全面和实用的指南,并着重于为组织打造行之有效的数据分析能力。全书分为三部分,第一部分分析基础篇,讨论了如何通过整合组织的人员、流程、技术和数据等资源来实现这样的分析能力;第二部分分析生命周期最佳实践篇,介绍了不同种类的分析产品和服务,以及如何支持分析产品或服务的设计、开发和交付;第三部分分析能力卓越常青之道,围绕如何让分析产品对组织的完善和持续改进产生最大作用展开讨论,内容包括如何衡量分析项目的效率和效果两个方面,以及如何应用行为经济学、社会心理学和变革管理等其他学科的经验和知识改进和完善分析过程。

图书特色

图书前言

现代企业往往被描述为“数据丰富,但信息贫乏”。由于在交互点(如客户、病人、供货商)产生的数据的规模很大且种类繁多,这一挑战呈现出加剧且进一步失衡的现象。不管你是进行数据准备,还是分析、呈现或者使用数据,建立一套坚实的数据管理和分析方法论的基础,对于有效地通过数据表达观点都至关重要。
在本书中,我把大数据、数据科学和数据分析相关知识有机地结合起来,形成一个全面的实用指南,为你提供经过实践验证的管理分析团队和分析过程的方法论框架,作为支持本书读者探索数据分析最佳实践艺术和科学的工具箱。
本书的重点是,讨论如何建立富有成效且高效的分析组织架构和分析流程,从而加强数据与分析在组织成功中的作用。
当我开始考虑写这个特定的主题时,主要是针对当时市面上有关数据分析的论述缺少“人与流程”方面的内容。也就是说,十多年来,人们一直在撰写关于数据分析的概念、数据分析在业务中的重要性以及Python、R或SAS等技术的具体实现方面的论述。然而,这些论述一般都不涉及分析模型开发或业务案例开发的策略,也不涉及分析对操作流程的影响。
自从Tom Davenport和Jeanne Harris发表其重要著作Competing on Analytics (Davenport和Harris,2007)的十多年来,各类组织一直在努力设法解决的问题,已经从“我们可以用数据分析解决哪些问题”转变为“如何发现、培养、留住数据分析专业人才”。这种从“什么”到“如何”的转变促成了我编写这本书的初衷。我自己也认为这本书正合时宜,因为各个行业都在通过对数据和分析的接纳与使用来改变自己。虽然不少企业已经克服了在日常业务处理以及战略决策中如何有效使用数据分析的障碍,但还有很多企业刚刚认识到数据分析的价值,他们看到了数据分析的光明前景,却没有明确的路线图来实现这一目标。对前者来说,挑战是有效性或者进一步提高效率。对于后者来说,真正的挑战往往是为数据分析创造一种企业文化或者思维模式,为发展企业的数据分析能力找到合理依据,并为成功开展数据分析而规划和调整组织架构。
本书的灵感来自Ralph Kimball的作品,我记得当我读第1版的Data Warehouse Toolkit(Kimball,1996)时,我在心里对自己说“这本书讲得有道理。”与一般商业和技术书籍中经常出现的大谈概念的处理方法非常不同,Kimball在这本书中为我们提供了真正进行数据仓库建设所需要的实用方法、工具和流程。不管是针对已经熟悉数据仓库的专业人士,还是刚开始接触这一解决方案的初学者,Kimball在书中都给他们提供了数据仓库相关领域的准确概述,以及数据仓库全生命周期和关键流程的完整框架。我希望你会发现,本书能够不负这一灵感,它为数据分析生命周期提供了一个全面和实用的指南,并着重于为你的组织打造行之有效的数据分析能力。
这本书不同于其他讲“如何做”的工具书,因为它不是指导你如何构造分析模型的“食谱”,而是重点讨论数据分析中用到的最佳实践和各种流程。本书的适用人群包括:
组织的领导者和分析决策者。指那些需要理解建立和保持企业分析能力与文化的重要意义的组织领导者和分析决策者,包括那些近年才有的首席分析官或首席数据官。
分析团队。指那些以设计、开发和提供分析服务或分析产品为主要任务的分析师团队。该团队包括分析产品经理、团队负责人、分析人员、项目经理、统计学家、科学家、工程师、数据科学家,以及构建分析模型的量化专家。
有抱负的数据倡导者。指那些通过数据或分析产品基于事实依据来解决业务问题的人。所谓数据倡导者,也就是那些希望通过数据来提高业务绩效、支持决策或改变某些业务流程的人。
这本书分为三个部分:
1. 分析基础。首先概述分析是什么,以及如何把分析应用于解决组织中的一些实际问题。重点转移到把分析作为一种组织的内在能力,并从不同的角度来阐述如何让分析为组织的整体目标服务,分析(和数据)策略如何指导我们的行动,如何实现这些能力。然后讨论如何通过整合组织的人员、流程、技术和数据等资源来实现这样的分析能力。
2. 分析生命周期最佳实践。介绍不同种类的分析产品和服务,以及如何支持分析产品或服务的设计、开发和交付。整个分析生命周期可分解为五个最佳实践领域,以及相对应的支持分析产品开发的特定流程。
3. 分析能力卓越常青之道。围绕如何让分析产品对组织的完善和持续改进产生最大作用展开讨论,内容包括如何衡量分析项目的效果和效率两个方面,以及如何应用行为经济学、社会心理学和变革管理等其他学科的经验与知识改进并完善分析过程。
在第1章中,你可能会觉得分析学的语言或术语令人困惑甚至望而生畏。在对分析学进行概念讨论或者描述时,通常会用到像科学、学科和最佳实践这样的术语。
然而,像方法(method)、方法论(methodology)或方式(approach)这样的术语则一般用来指分析流程。
编写本书时,我的做法是不做主观假设,尽可能把整个分析过程中的方法论都描述清楚。为此,我尽自己最大的努力,通过简明的例子和尽可能准确的描述,使数据分析变得容易理解。
读到这里,如果读者认同数据分析是个有趣的主题,值得深入学习和探讨的话,你会认同我的做法。但如果还需要列出进一步阅读本书的10个其他理由,这些理由大致如下:
1. 为那些想理解分析工作的完整生命周期并由此构建组织架构和有效分析流程的人士提供了一个实用指南。
2. 为组织提供建立分析师团队的方法论框架,包括团队职能定位和团队设计方法。
3. 围绕如何高效发挥分析团队的作用以及关于创建分析产品的设计思维两个方面,探索分析工作中所涉及的人才管理和流程设计两个主要问题。
4. 讨论分析工作岗位序列以及分析团队成员需要如何进行分工和承担哪些角色。
5. 来自现实世界的一些分析案例研究。
6. 把与分析文化相适应的概念(例如“数据中心主义”和计算能力)与数据和技术策略联系起来。
7. 为分析工作的领导者提供理解分析的方法和知识,为分析工作的实践者提供开展工作的工具箱。
8. 提供对一个工具和模板库的访问权限,包括支持领导力、流程改进和团队赋能的最佳实践方法。
9. 从分析生命周期的基本内容开始,讨论相关的知识领域和最佳实践案例,然后详细介绍分析团队的各项流程。
10. 本书作者是一位长期从事数据分析的专业人士,他参与并见证了横跨多个行业的数百个各具特色的数据分析场景和应用。
希望本书可以为刚开始从事分析工作的人士提供有用的指导,也可以为那些有丰富分析工作经验的人士提供参考意见。分析旅途愉快!
关于配套的网站
在本书的配套网站(http://www.analyticslifecycletoolkit.com/)上可以找到各种资源,包括本书中提到的工具和模板。除了那些可以用来加深理解本书所阐述概念的检查清单(checklist)、模板与各种材料外,该网站还包含各种与分析相关的资源、引用及其他信息的链接。此外,你可以在网站上注册并通过电子邮件随时获得内容的更新,你还将找到一个博客,我在这个博客里会讨论整个数据分析生命周期的实际含义与影响。

上架指导

计算机\数据科学

封底文字

“这本书充满了关于分析的智慧和经验,其优势在于它的生命周期管理方法。从提出问题到获得结果,你将了解分析如何真正对组织产生影响。”
 —— Thomas H. Davenport博士,
Competing on Analytics
和Only Humans Need Apply的作者
“这本书浓缩了很多关于分析战略领域的深入思考。分析并非易事——这个世界并不存在速成的人工智能(AI)、商业智能(BI)和机器学习(ML)捷径,可以帮你快速理解数据、业务或者流程。你必须建立一支多元化的人才队伍。你必须考虑那些可能需要调整伪发现率(False Discovery Rate, FDR)的试验性探索的危害。你应该考虑为了解某个流程的真实行为而设计一系列试验,观测数据集可能会暗示某种现象,但不能为你提供完整的全貌和理解。数据处理、特征工程、数据探查等都存在不同的角度,需要对应不同的技能。但是,随着在分析领域投资的深入,对流程的更深层次的洞察和巨大的改进机会也随之而来。这本书将分析置于一个战略业务系统的大背景下,涵盖了所有的维度。”
—— John Sall博士,
SAS联合创始人兼JMP首席架构师

“这本书为需要开发高性能和可扩展分析能力的组织提供了明确的指引。作者以不同寻常、非常清晰的方式对分析价值链非技术方面的关键点进行了整理和拓展,并将它们作为一个完整实践中的组成部分,与技术联系起来。认真研究这本如何应对分析的效率和有效性挑战的参考指南,可以为组织在精通分析的道路上节省数月,甚至数年痛苦的试错成本。”
 —— Scott Radcliffe,
Cox Communications数据分析执行董事
“目前许多市面上的书都回答了一个问题:‘什么是解决问题的正确工具?’而本书是我读过的为数不多的几本书之一,它回答了一个更为棘手的问题:‘我们如何使分析在整个组织中变得具有变革性?’本书融合了数据科学、设计思维和组织理论的元素,对于那些希望将分析构建到组织DNA中的高管和希望扩大组织覆盖范围的数据科学家,以及那些不仅教会学生如何做数据科学学问,更要教会他们如何利用数据科学来影响切实的变革的分析项目来说,都是一个有价值的资源。”
—— Jeremy Petranka博士,
杜克大学富卡商学院定量管理副院长
“这本书是‘思维人士的分析指南’。作者深入研究了一些主题,并为整个分析生命周期提供了大量参考。我认为本书是我读过的关于分析的佳作!”
—— JBob Gladden,
Highmark Health, 企业分析副总裁

译者序

如何建立企业级数据分析能力
随着大数据逐步深入发展至经济生活和社会活动的各个领域,全球正在稳步迈入数字化经济时代,我国也正式提出了“加快培育数据要素市场”的战略,越来越多的企业开始将数据作为一种战略资源,重新定义和努力挖掘数据价值。
著名信息学家达文波特(Davenport)曾经指出,各类企业正处在“可以用数据分析解决问题”向着“通过数据分析建立竞争优势”转变的重要阶段,并于2012年首次提出“数据科学家”这个时髦岗位。当前,世界范围内在如何组织和推动大数据分析,建立企业核心竞争能力方面已经有了许多进展,在其中发挥重要作用的数据科学家和数据分析师也成为全球范围内增长最快、需求量巨大的职业之一。
当前国内外普遍出现数据分析人才短缺的问题,是因为高水平数据分析师的培养难度很大。要成为一名高水平数据分析师,既要具有扎实的数学、统计学、数据分析基础能力,又要熟悉大数据应用的业务场景,还要具备很强的实践能力、创新意识和团队合作意识,懂得数据分析成果“入系统、进流程”的应用设计和业务协调。业界经验显示,培养一个中等水平的数据分析师平均需要五年的数据分析实践,而培养一个高级水平的数据分析师(数据科学家)平均需要九年以上的数据分析实践。对大多数企业而言,短期内引进大量高水平数据分析人才是不现实的,唯有依靠企业内部良好的体系化培养,才是正确道路。
在大数据时代,无论多么强调数据分析对企业的重要性都不为过。这是一本专门论述建立企业级数据分析方法论的书,国内关于这个专题的专著不多。我们组织翻译这本专著,是想给那些正在从事数据分析实践的数据分析师、正在研究企业数字化转型的学者、希望通过数据分析实现企业智能化运营和智慧化决策的企业管理者们介绍一套经过实践验证的、贯穿数据分析全生命周期的方法论和参考手册。希望通过本书的介绍,读者能够清楚地认识到解决好企业的数据分析与业务应用问题、通过数据驱动实现转型发展和建立以数字化为支撑的核心竞争能力,是一项需要企业高层管理者亲自参与推动、企业的各业务部门和数据分析师协同工作,数据分析成果应用流程需要精心设计、数据分析技能需要不断提升的长期努力过程。
结合译者多年从事数据分析与应用工作的实践经验,我们概括出做好企业级大数据分析必须重点修炼的四方面能力,请读者阅读本书时一并验证、探讨。
一、支持企业级数据分析的四大支柱
成功的大数据分析应用一定要注意做到数据基础、人才队伍、业务流程、技术支持四方面(象限)能力的平衡。缺少任何一个象限的能力,就不可能形成一流的企业级数据分析能力(见图1)。

图1 支持企业级数据分析能力的四大支柱
在数据基础建设方面,要从数据的量和质两个方面做好工作,记住两个铁律。第一,遵循“大数据秒杀一切算法”,尽一切可能收集、积累“准、快、全”的数据,除了企业内部数据外,还要尽可能收集有用的外部数据,做好内、外部数据的集成管理。第二,没有质量保证的数据毫无用处,也就是常说的“garbage in garbage out”。工商银行前任行长杨凯生先生曾深刻指出“数据不准确比没有数据的问题更加严重”。因此,必须将建立数据质量控制体系与数据标准管理体系列为开展企业级数据分析应用的先决条件。
分析师人才队伍建设方面,要做到外部引进与内部培养相结合,且以企业内部培养为主。同时具备“懂业务,懂数据,懂分析方法”三个条件的分析师人才十分稀缺,也是有远见的企业争相网罗的对象,企业要为分析师人才队伍开辟明确的职业发展道路,要在使用和激励两个方面做到分析师人才“引得进、养得成、用得好、留得住”。培养和留住分析师的最好办法,是为分析师提供施展才能的平台,组织分析师多参加数据分析最佳实践项目,让分析师经常有机会“贴近业务,靠近数据,彼此接近”,这是最佳的分析师使用和成长模式。
业务流程方面,一是分析项目要契合业务需求,坚持“问题导向、基层导向、客户导向、价值导向”,瞄准业务的痛点、难点问题;二是让分析成果“入系统、进流程”,要让高水平分析成果持续发挥业务应用价值。根据本书作者的举例,结合译者多年数据分析实践经验,成功的企业级数据分析项目往往都是在高管亲自领导或推动下,由分析师和业务人员组成项目团队,针对特定数据分析项目长期持续努力的结果。遗憾的是,大多数情况下,企业的数据分析项目往往因为组织实施不善或者缺乏高层认可、参与或推动而无法取得成功,而分析项目的失败往往会导致业务部门和分析师团队之间的相互埋怨和彼此不信任。
技术支持方面,要建立满足分析师工作需要的高性能数据分析环境,提供当前大数据分析所需的各类分析工具。但是,仅仅有这些“硬”技术能力还远远不够,还要采取多种方式建立分析师的“软”技术能力。例如,经常组织企业的分析师以建模大赛等“众筹”方式解决一些高价值、高难度的业务建模问题,为参赛分析师搭建数据分析项目实践比拼和展示能力的平台,提供观摩优胜者数据分析技能的机会,奖励解决了复杂业务建模问题的顶尖分析师。还可以通过组织高水平培训班、邀请业界顶尖专家为分析师举办讲座、购买优秀大数据分析网络课程等多种方式,提升企业的数据分析技能,往往这种“软”实力比“硬”技术更能够帮助企业级数据分析项目获得成功。
二、数据分析成果产生应用价值的关键方法
目前,业界谈论企业的数据分析方法和成果时,往往关心企业技术能力、具体建模方法的多,关心分析项目是否坚持“问题导向、基层导向、客户导向、价值导向”,是否能解决企业实际问题的少。本书的最大优点,是告诉我们应如何构建企业级数据分析应用能力,而不是仅仅停留在具体的数据分析技能上。因为,只有能够解决业务问题,创造业务价值的数据分析能力,才是企业普遍应该关注、培养和需要的数据分析能力。
在规划和建设企业级数据分析体系时,一定要将技术上能够提供的“数据分析潜能”与业务部门获得的“实际数据分析能力”区分开来。实际上,许多企业说的数据分析能力,往往指的是自己收集了多少数据,拥有多大的数据存储与计算能力,而这些能力仅仅为开展企业级数据分析提供了技术可能性,我们暂且称之为“数据分析潜能”,它实际上并不代表企业真正拥有的“数据分析应用能力”。国内外的企业数据分析实践表明,绝大部分企业的“数据分析应用能力”远远低于企业的“数据分析潜能”(见图2)。
造成企业数据分析能力浪费的原因很多,有业务部门没有参与数据分析项目选题、应用流程设计,对数据分析项目成果漠不关心甚至抵制,从而无法实现应用价值的原因,有数据分析项目成果理解难度大、应用门槛高、分析师数量配备不足而无法应用数据分析成果的原因,等等。在推动数据分析成果落地应用方面,有远见的企业一般会通过两种方法来克服数据分析成果落地应用困难,提升企业的“数据分析应用能力”,并使之不断逼近“数据分析潜能”。一是在企业内部增加数据分析师数量,支持业务部门理解、应用分析师团队主动开发的数据分析产品,降低业务部门应用数据分析项目的难度,实现数据分析项目成果落地应用(见图3)。二是引导业务部门主动提出数据分析项目,主动参与分析项目开发和应用流程设计,提高业务部门应用数据分析项目成果的积极性(见图4)。

图2 企业数据分析潜能不等于现实数据分析应用能力

图3 增加数据分析师数量,支持业务部门实现应用成果

图4 业务部门参与数据分析项目,提高成果应用积极性
三、数据分析要能支持企业从被动决策向主动决策转变
目前,大部分企业开展数据分析的目的是为企业管理和决策提供报表、研究报告。实际上,数据分析是建立企业核心能力、拓展业务范围、实现管理和业务创新、支持企业从被动决策到主动决策等一系列与核心竞争力建设息息相关的重要手段。全球著名的数据分析软件服务商SAS公司发布的“企业分析能力进阶图”,从数据分析方法复杂度和对企业核心竞争优势支持能力两个维度,将企业数据分析能力分为支持被动决策和支持主动决策两大类共八个等级。当前,大部分企业的数据分析能力停留在仅仅支持企业被动决策的低级阶段。这是因为,只有在数据、人才、流程、技术四个象限都做得很好的企业,才有能力采取体系化、平台化、制度化、自动化方法,真正让数据分析成果“入系统、进流程”,进入到依靠数据分析支持企业主动决策,建立企业核心竞争能力的高级阶段(见图5)。

图5 数据分析能力进阶:从支持被动决策到支持主动决策
四、明确数据分析师的能力要求
为了实现“通过数据分析建立竞争优势”的目标,企业往往要求数据分析师具备“熟悉业务、了解数据、精通工具”的精湛能力,希望数据分析模型具有“源于业务、服务业务、高于业务”的应用价值,怀着数据分析成果能够“入系统、进流程、打造核心能力”的殷切希望。现实情况下,找到具备精通数据、业务、流程、协调能力的“独角兽”—全能型数据分析师人才并不容易,企业的一般做法是选择能力互补的若干个分析师组成团队来达到理想的对分析师能力的要求。企业级数据分析项目由分析师团队承担,同时也要对分析师团队能力构成提出四方面的明确要求:定量化数据分析能力、完善的数据管理能力、良好的业务沟通与成果可视化能力和敏锐的业务理解能力。并且要求团队的每一个分析师都应完全具备其中一个或多个方面的能力(见图6)。如果想成为分析师中的翘楚—数据科学家,则一定要在四个方面都有精深的造诣才能达成,企业也应当采取多种正向激励措施,鼓励分析师努力向着这个方向前进。

图6 数据分析师应该具备的能力体系
本书不同于其他讲授数据分析“如何做”的工具书,因为它不是指导你如何构造分析模型的“食谱”,而是重点讨论企业级数据分析中用到的最佳实践和各种流程,对已经具备了初步的数据分析能力和实践经验,正在建立企业级数据分析体系,怀着“用数据分析建立竞争优势”远大抱负的专业研究人员、数据科学家、数据分析师和企业管理人员,都具有重要参考价值。企业级数据分析能力的修炼是一个持续的过程。本书为如何高效达成高水平企业级数据分析能力提供了经过实践验证的方法论借鉴,译者所属的分析师团队仔细研读本书后受益良多。结合译者多年来在数据分析领域的实践经验,简要总结了成功开展企业级数据分析活动的体会,希冀读者将其与本书的观点相互印证。

陈道斌
2020年4月10日

推荐序

推荐序一
数据是表现事物特征的精确语言,是认知世界的重要工具,是治理国家的有力手段,是科学研究的必备条件。尤其在大数据时代,企业和组织将自己活动中自然形成的数据资源与主动获得的外部数据资源相结合,通过集中、整合、挖掘、应用活动来探寻事物和现象的内在规律,形成了数据科学,而从事数据分析活动的核心人才—数据科学家是当前最稀缺的人才资源之一。在探寻规律的过程中,如何让数据说话,最大限度地发挥数据的作用,让数据成为有价值的信息情报,是数据分析的核心要务。
本书作者Gregory Nelson先生在数据科学、知识管理和商业分析方面有着丰富的经验和深入的研究,本书把大数据、数据科学和数据分析相关知识有机地结合起来,围绕如何建立高效的数据分析组织和分析流程,如何成为一名成功的数据科学家,与读者分享了经过实践验证的数据分析全生命周期的管理指南。
本书的主译者陈道斌博士是我的老朋友,在中国工商银行长期从事信息管理和数据分析工作,他所带领的团队在数据管理和应用理论与实践方面有精深的造诣,对于数据分析生命周期的管理具有深刻的理解。本书为国内企业和组织机构管理者,特别是数据分析和管理领域的从业人员提供了一个非常全面、实用的参考资料。相信本书的出版一定能够帮助国内致力于建立和保持企业分析能力的领导者和分析决策者打造行之有效的数据分析能力。

石勇
发展中国家科学院院士、国务院参事、
中国科学院大数据挖掘与知识管理重点实验室主任
2020年4月12日


推荐序二
大数据时代,数据已经深入到我们生活的方方面面,从手机通话到社交信息,从地理位置到身体健康,从购物记录到财务状况,数据已成为一种基础性战略资源,是企业和组织提高经营管理水平、提升市场竞争能力和风险防控能力的重要抓手。业界通常将企业的数据分析应用能力从低到高划分为三个阶段,分别是解释型分析阶段、预测型分析阶段和生产型分析阶段,三个阶段的数据分析能给企业带来的业务价值是不断提升的,但同时对企业数据分析应用人才队伍能力的要求也是不断升高的。
本书围绕数据分析生命周期,重点通过数据分析中用到的最佳实践和各种流程,为组织的领导者和决策分析者、分析团队和对数据分析感兴趣的从业人员等提供了一个全面和实用的指南。本书从数据分析的基础开始,深入浅出地介绍了分析学的专业术语,结合整个分析生命周期的五个最佳实践领域,从不同的角度阐述了如何通过整合组织的人员、流程、技术和数据等资源形成和提升企业与组织的数据分析能力,同时对如何长期保持、不断完善企业的数据分析能力进行了深入的探讨和分析。
本书的译者之一陈道斌博士在中国工商银行长期负责信息管理和数据分析工作。目前工行已经走过了以传统的统计报表分析为代表的解释型分析阶段,正在迈入以各类数据挖掘方法建立业务模型的预测型分析阶段,未来还将迎来以人工智能、机器学习方法建立业务模型的生产型分析阶段。道斌组织翻译本书,体现了他对工行数据分析工作的深刻理解,是他结合多年工作经验为广大从业人员做出的诚意推荐。相信本书一定能为国内的大数据管理和分析工作提供重要参考。

李伟平
北京大学教授
2020年4月12日

图书目录

推荐序一
推荐序二
译者序
前言
致谢
作者简介
译者简介
第一部分 分析基础
第1章 分析概览 …… 2
1.1 基本概念 …… 2
1.1.1 数据 …… 3
1.1.2 分析 …… 4
1.1.3 什么是分析 …… 5
1.1.4 分析与其他概念的区别 …… 7
1.2 分析概念 …… 9
1.2.1 商业智能和报表 …… 9
1.2.2 大数据 …… 12
1.2.3 数据科学 …… 13
1.2.4 边缘(和环境)分析 …… 14
1.2.5 信息学 …… 16
1.2.6 人工智能与认知计算 …… 16
1.3 分析方法论 …… 18
1.3.1 应用统计与数学 …… 19
1.3.2 预测和时间序列 …… 22
1.3.3 自然语言处理 …… 22
1.3.4 文本挖掘与文本分析 …… 26
1.3.5 机器学习 …… 27
1.3.6 数据挖掘 …… 30
1.4 分析的目的 …… 31
1.4.1 分析是关于改善结果的活动 …… 32
1.4.2 分析是关于创造价值的活动 …… 33
1.4.3 分析是关于发现的活动 …… 34
1.4.4 分析是关于促成变革的活动 …… 35
1.5 本章小结 …… 36
1.6 参考文献 …… 38
第2章 分析人才 …… 41
2.1 谁来做分析工作 …… 41
2.2 分析师的职责 …… 44
2.3 分析工作的岗位序列 …… 46
2.3.1 业务分析 …… 47
2.3.2 统计分析 …… 48
2.3.3 技术分析 …… 49
2.3.4 领导力分析 …… 50
2.3.5 产品分析管理 …… 51
2.4 分析的关键能力 …… 52
2.5 分析思维 …… 56
2.5.1 问题求解 …… 58
2.5.2 分解方法 …… 61
2.5.3 综合方法 …… 62
2.6 批判性思维方法 …… 63
2.7 分析中应用批判性思维的例子 …… 65
2.8 如何提高批判性思维能力 …… 66
2.9 系统性思维 …… 68
2.10 本章小结 …… 71
2.11 参考文献 …… 72
第3章 分析的组织背景 …… 74
3.1 组织的战略与分析活动的协同 …… 74
3.1.1 目标 …… 76
3.1.2 战略 …… 76
3.1.3 组织的能力 …… 78
3.1.4 资源 …… 80
3.1.5 评估和管理系统 …… 80
3.2 组织的文化 …… 83
3.3 分析团队的组织架构设计 …… 87
3.4 什么样的分析团队组织架构设计最好 …… 90
3.4.1 集中式架构 …… 91
3.4.2 分散式架构 …… 94
3.4.3 卓越中心式架构 …… 97
3.4.4 分析的组织方式 …… 100
3.5 本章小结 …… 102
3.6 参考文献 …… 103
第4章 数据战略、平台与架构 …… 105
4.1 数据战略 …… 106
4.1.1 数据战略声明 …… 107
4.1.2 战略与实施 …… 109
4.2 战略规划流程 …… 109
4.3 规划一个数据战略路线图 …… 113
4.3.1 范围和目的 …… 114
4.3.2 数据收集、标准化和清洗 …… 115
4.3.3 数据架构、虚拟化和整合 …… 116
4.3.4 数据洞察和分析 …… 117
4.3.5 数据治理和数据质量 …… 118
4.3.6 元数据管理 …… 120
4.3.7 数据访问、发布、隐私和安全 …… 121
4.3.8 数据保存 …… 122
4.3.9 性能与服务水平协议 …… 123
4.4 制定数据战略的敏捷方法 …… 124
4.5 数据战略小结 …… 125
4.6 平台和架构分析 …… 126
4.7 分析架构 …… 127
4.7.1 范围:业务规模和生命周期支持 …… 130
4.7.2 决策的复杂度 …… 130
4.7.3 理解复杂度 …… 132
4.7.4 紧迫性和影响 …… 132
4.8 特定目的数据或潜在价值数据 …… 134
4.9 本章小结 …… 136
4.10 参考文献 …… 137
第二部分 分析生命周期最佳实践
第5章 分析生命周期工具包 …… 140
5.1 分析生命周期最佳实践领域 …… 140
5.2 数据分析是数据科学的产物 …… 143
5.3 数据分析的目标 …… 143
5.4 分析产品的规模和范围 …… 144
5.5 分析生命周期工具包的组织方式 …… 146
5.5.1 关于分析流程 …… 147
5.5.2 分析生命周期最佳实践领域、流程和工具 …… 148
5.6 分析的设计思维 …… 154
5.6.1 什么是设计思维 …… 154
5.6.2 设计思维应考虑用户旅程 …… 155
5.6.3 设计思维的五个步骤 …… 156
5.7 本章小结 …… 159
5.8 参考文献 …… 159
第6章 问题理解 …… 160
6.1 流程概述 …… 160
6.2 为什么要理解问题 …… 161
6.3 流程领域 …… 161
6.3.1 问题定义 …… 163
6.3.2 根本原因调查 …… 167
6.3.3 提出假设 …… 175
6.3.4 问题设计 …… 182
6.3.5 业务方案优先级设置 …… 190
6.4 本章小结 …… 195
6.5 工具包总结 …… 197
6.6 参考文献 …… 198
第7章 数据探查 …… 200
7.1 流程概述 …… 200
7.1.1 数据探索 …… 200
7.1.2 为什么要做数据探查 …… 203
7.2 数据探查过程 …… 203
7.2.1 数据识别和优先级排序 …… 204
7.2.2 数据收集和准备 …… 209
7.2.3 数据剖析和特征描述 …… 213
7.2.4 可视化探索 …… 227
7.3 记录分析日志 …… 228
7.4 本章小结 …… 230
7.5 工具包总结 …… 231
7.6 参考文献 …… 232
第8章 分析模型开发 …… 234
8.1 流程概述 …… 234
8.1.1 分析模型定义 …… 239
8.1.2 模型开发 …… 240
8.1.3 利用多种方法进行检验 …… 245
8.1.4 为什么要这样做 …… 248
8.2 建模过程 …… 249
8.3 进行比较 …… 250
8.4 度量关联 …… 260
8.4.1 相关性统计检验 …… 264
8.4.2 其他相关性检验 …… 266
8.5 进行预测 …… 267
8.5.1 检测模式 …… 270
8.5.2 模式检测过程 …… 275
8.6 本章小结 …… 277
8.7 问题总结和练习 …… 278
8.8 工具包总结 …… 280
8.9 参考文献 …… 281
第9章 成果应用 …… 285
9.1 流程概述 …… 285
9.1.1 为什么要研究成果应用环节 …… 286
9.1.2 成果应用过程涉及的领域 …… 288
9.2 解决方案评估 …… 289
9.2.1 步骤1:模型回顾和验证 …… 290
9.2.2 步骤2:对结果的评价 …… 291
9.2.3 步骤3:影响评估 …… 292
9.3 分析成果应用的实施 …… 293
9.3.1 步骤1:制定部署计划 …… 294
9.3.2 步骤2:关键指标的定义 …… 296
9.3.3 步骤3:项目评估 …… 297
9.4 演示和讲故事 …… 298
9.4.1 通过数据讲故事的资源 …… 299
9.4.2 用数据讲故事的最佳实践 …… 303
9.5 本章小结 …… 316
9.6 练习 …… 318
9.7 工具箱总结 …… 320
9.8 参考文献 …… 321
第10章 分析产品管理 …… 326
10.1 流程概述 …… 326
10.2 分析产品管理过程涉及的领域 …… 329
10.2.1 分析产品经理 …… 330
10.2.2 价值管理 …… 334
10.2.3 分析生命周期的执行 …… 348
10.2.4 质量流程 …… 362
10.2.5 利益相关方的参与和反馈 …… 368
10.2.6 能力和人才发展 …… 371
10.3 本章小结 …… 373
10.4 工具包总结 …… 374
10.5 参考文献 …… 375
第三部分 分析能力卓越常青之道
第11章 把分析付诸行动 …… 380
11.1 分析的力量 …… 380
11.2 高效和有效的分析计划 …… 384
11.2.1 了解分析生命周期 …… 387
11.2.2 关于有效分析的一些观点 …… 390
11.2.3 对分析效果和效率的挑战 …… 391
11.3 为什么分析的上线运营会失败 …… 392
11.4 变革管理 …… 396
11.4.1 选择正确的变革方法 …… 398
11.4.2 为什么要开展变革管理 …… 400
11.4.3 对变革的情感反应 …… 401
11.4.4 分析变革管理的例子 …… 404
11.5 引领变革的最佳实践 …… 405
11.5.1 创建共同的变革目标 …… 406
11.5.2 建立可见的、参与型的领导联盟 …… 407
11.5.3 赋能参与和沟通 …… 409
11.5.4 支持强化个人绩效 …… 413
11.6 变革中的问题处理 …… 414
11.7 本章小结 …… 416
11.8 参考文献 …… 417
第12章 分析团队的核心胜任力 …… 418
12.1 核心胜任力概述 …… 418
12.1.1 分析胜任力定义 …… 418
12.1.2 培养分析胜任力 …… 420
12.1.3 过去和未来所需要的职场胜任力 …… 421
12.1.4 分析职业框架 …… 422
12.2 核心胜任力详述 …… 422
12.2.1 胜任力领域:业务知识 …… 424
12.2.2 胜任力领域:分析思维 …… 427
12.2.3 胜任力领域:数据管理 …… 430
12.2.4 胜任力领域:数据探索 …… 432
12.2.5 胜任力领域:数据可视化 …… 433
12.2.6 胜任力领域:技术素养 …… 435
12.2.7 胜任力领域:战略思维 …… 438
12.2.8 胜任力领域:领导力 …… 440
12.2.9 胜任力领域:分析产品管理 …… 443
12.3 基于知识领域的分析工作岗位序列的理想胜任力 …… 446
12.3.1 胜任力领域:业务知识 …… 446
12.3.2 胜任力领域:分析思维 …… 448
12.3.3 胜任力领域:数据管理 …… 448
12.3.4 胜任力领域:数据探索 …… 448
12.3.5 胜任力领域:数据可视化 …… 452
12.3.6 胜任力领域:技术素养 …… 452
12.3.7 胜任力领域:战略思维 …… 452
12.3.8 胜任力领域:领导力 …… 456
12.3.9 胜任力领域:分析产品管理 …… 456
12.4 本章小结 …… 459
12.5 参考文献 …… 459
第13章 数据分析未来趋势 …… 460
13.1 数据分析的生命周期框架 …… 460
13.2 分析在未来世界的作用 …… 462
13.3 未来主义者的视角 …… 463
13.3.1 普适计算和分析 …… 464
13.3.2 大数据将驱动创新 …… 465
13.3.3 分隔的行业与视角将消失 …… 466
13.3.4 目标造就差异化 …… 466
13.3.5 胜任力胜过特定技能 …… 467
13.4 最后的一点思考 …… 468
13.5 参考文献 …… 469
译后记 …… 470

教学资源推荐
作者: 黄传河 主编 杜瑞颍 吴黎兵 吕慧 张春林 张沪寅 张健 参编
作者: (英) W. Bolton 著
作者: (美)W. H. Inmon;Derek Strauss;Genia Neushloss著