参考读物 – 图书教辅

扩展信息

语种 : 简体中文

页数 : 224

开本 : 16

原书名 : Smarter Data Science: Succeeding with Enterprise-Grade Data and AI Projects

原出版社: John Wiley & Sons(USA)

属性分类: 店面

包含CD : 无CD

绝版 : 未绝版

图书简介

只有在可以一致地提供预测性的业务见解并在整个组织范围内扩展时，数据分析和AI才能产生价值。这也是众多企业所面临的巨大挑战。本书概述了有效且实用的组织、管理和评估数据的方法，因此有助于建立信息体系结构以更好地推动AI和数据科学的发展。本书主要包括以下内容：简化数据管理，使数据随时随地可用；缩短实现AI用例的价值实现时间；使整个企业都可以访问AI和数据洞察力；动态、实时地扩展复杂的AI场景；开发可带来可预测的、可重复的价值的信息体系结构。本书可以使包括架构师、开发人员、产品所有者和业务主管在内的各种角色受益。

图书特色

构建支持人工智能的企业级信息架构
让数据真正能够用起来

图书前言

“我想做的是交付结果。”
Lou Gerstner
Business Week
为何你需要此书
“19世纪末，谁也不会相信地球正受到智慧生命的密切注视……”
1898年，H. G. Wells出版的《世界大战》（The War of the Worlds，Harper & Brothers）以此开场。在20世纪末，这样的怀疑也同样盛行。但与19世纪以来的虚构的注视者不同，20世纪晚期的注视者是真实存在的，而这些注视者就是具有开拓性的数字化公司。在《世界大战》中，单细胞细菌被证明是兼具进攻性和防御性的决定性武器。如今，这一武器便是数据。当数据被错误使用时，企业将会面临突然崩溃的局面；当数据被正确使用时，企业则会茁壮成长。
自象形文字和字母出现以来，数据已然开始发挥其作用。商业智能（Business Intelligence，BI）一词的出现，可以追溯至Richard Millar Devens 1865年出版的Cyclopaedia of Commercial and Business Anecdotes一书。尽管如此，直至制表机器公司（Tabulating Machine Company，IBM前身）创始人Herman Hollerith发明了打孔卡片，数据的大规模采集才得以实现。Hollerith最初是为1890年美国政府人口普查而发明的打孔制表技术。1937年，美国政府与IBM签署协议，运用其打孔卡读卡机，为涉及2600万个社会保障号码的大规模簿记项目提供服务和支持。
1965年，美国政府建立了第一个数据中心，以存储其7.42亿张纳税申报单和1.75亿套录有指纹信息的计算机磁带。随着互联网以及后来的移动设备和物联网的出现，私有企业能够基于日益增加的与消费者共享的触点数，建立大量的消费者数据存储，从而使大规模数据使用真正得以实现。平均而言，每个人每秒创建的数据量超过1.7MB，这样的信息量大致相当于154万亿张打孔卡片。通过将数据量与数据有效处理能力相结合，数据并不仅仅是被简单记录和保存，而是得以大规模使用。
显然，我们正处于大数据时代。企业正在争先恐后地整合各种能完成高级分析的能力，如人工智能和机器学习，从而最大限度地利用其自身的数据。如何通过具有前瞻性的预判来改善市场的商业表现，已然成为强制性需求。诸如数据湖（Data Lake）之类的数据管理概念也被提出，以指导企业进行数据存储和数据管理。在许多方面，数据湖与更早的企业数据仓库（Enterprise Data Warehouse，EDW）形成了鲜明对比。通常而言，企业数据仓库仅接受已被视为有用的数据，且其内容的组织方式高度系统化。
在被误用的情况下，一个数据湖只不过是非结构化和未处理的海量数据的存储地，许多这样的数据永远都不会被使用。然而，通过高级分析和机器学习模型，数据湖可以有效地得到利用。
但是，数据仓库和数据湖能否真正实现企业改善商业表现的目的？更简洁地说，企业是否已经意识到存储数据之地在商业方面的价值？
全球信息技术研究和咨询公司—高德纳咨询公司（Gartner Group）对此进行了引人深思的分析。据估计，超过一半的企业数据仓库尝试都是失败的，而新的数据湖的情况甚至更糟。高德纳的分析师曾预测，数据湖的失败率可能高达60%。然而，现在高德纳认为这个数字过于保守，实际失败率可能接近85%。
为什么诸如企业数据仓库和数据湖这样的方案的失败率如此惊人？简单来说，开发适当的信息架构并非易事。
与企业数据仓库的失败原因相同，数据科学家采用的许多方法也未能意识到如下几点：
企业性质。
企业的业务运营。
变化的随机性和潜在的巨大性。
数据质量的重要性。
在模式设计和信息架构中应用不同技术的方式，这可能会影响组织应对变化的准备。
分析表明，数据湖和大数据计划失败率较高的原因并不在于技术本身，而是在于技术人员应用技术的方式。
在我们与企业客户的对话中，这些方面很快就变得不言而喻。在讨论数据仓库和数据湖时，我们经常面临诸多问题，例如：“对于每一种方式而言，我们都有很多选择，选择哪一个？”经常会出现组织中的一个部门需要数据库进行数据存储，但是其需求无法通过以前的数据存储方式得到满足。因此，该部门不再尝试重塑或更新已有的数据仓库或者数据湖，而是创建一个全新的数据存储区域。这样做的结果往往是一个多种数据存储解决方案的大杂烩，彼此之间不能有效结合，从而丧失数据分析的机会。
显然，新技术可以提供许多实实在在的好处，但是除非对这些技术进行严谨的部署和管理，否则，这些好处无法实现。与传统建筑架构的设计不同，信息架构的设计无法做到一劳永逸。
虽然组织可以控制如何获取数据，但是不能控制所需要的数据如何随时间变化。组织往往是脆弱的，因为当环境发生变化时，信息架构可能会崩溃。只有灵活的、自适应的信息架构才能适应新的环境。针对动态目标，设计和部署解决方案是困难的，但这个挑战并非不可克服。
很多信息技术专业人士都认为“垃圾输入等于垃圾输出”这个草率断言已经过时了。实际上，数十年来，垃圾数据一直给分析和决策过程带来困扰。管理不善的数据和缺乏一致性的表示对每一个人工智能项目来说依然是危险信号。
机器学习和深度学习对数据质量的要求尤其高。就像硬币的两面，低质量数据可能带来两种具有破坏性的影响。一方面，与历史数据相关的低质量数据会使预测模型的训练失真；另一方面，新数据会使模型失真，对决策制定产生负面影响。
作为一种可共享资源，当数据质量不佳时，数据通过服务层像病毒一样暴露在整个组织中，从而影响每一个接触此数据的人。因此，人工智能的信息架构必须能减少与数据质量相关的传统问题，促进数据流动，并在必要的时候实现数据隔离。
本书的目的是让你了解企业如何构建信息架构，从而为成功的、可持续的、可扩展的人工智能部署铺平道路。本书包括一个结构化框架和建议，既兼顾实用性又具有可操作性，可以帮助企业完成信息架构，进而从人工智能技术中获益。
本书主要内容
我们将从第1章开始，对人工智能阶梯进行讨论。人工智能阶梯是IBM开发的一个说明性工具，用来演示一个组织要持续从人工智能技术中获益所必须攀登的“步骤”或“梯级”。由此出发，第2章和第3章涵盖了数据科学家和信息技术领导者在攀登人工智能阶梯的过程中必须注意的一系列因素。
在第4章和第5章中，我们将探索关于数据仓库及其如何让位于数据湖的历史，并讨论如何根据地形学和拓扑学来设计数据湖。这些讨论将深入数据的接收、治理、存储、处理、访问、管理和监测等方面。
在第6章中，我们将讨论开发运营（DevOps）、数据运营（DataOps）、机器学习运营（MLOps）如何使组织得以更好地实时使用数据。在第7章中，我们将深入探讨数据治理和集成数据管理的基本要素。为了便于数据科学家确定数据的价值，我们将讨论数据价值链和数据可访问性、可发现性的需求。
由于组织内部的不同角色需要以不同的方式与数据进行交互，第8章将介绍不同的数据访问方式，还将进一步讨论数据价值评估，并解释如何使用统计学协助实现数据价值排序。
在第9章中，我们将讨论信息架构中可能出现的问题，以及整个组织的数据素养对于规避此类问题的重要性。
最后，在第10章中，我们将对开发人工智能信息架构的相关情况进行概述。第10章还提供了将上述理论背景应用于现实世界的信息架构开发的可行步骤。

专家评论

作者显然已经探索了通向高效信息架构的途径，从他们的经验中学习是有价值的。如果你对组织如何使用人工智能技术负责，你会发现本书是一本非常宝贵的读物。值得注意的是，本书的写作维度广，使得本书具有相当高的可信度。如今，关于人工智能技术的大量论述似乎都存在一个技术真空—我们并不是都在创业公司工作，我们有需要考虑的遗留技术。作者提供了优秀的资源，承认企业环境是一个微妙而重要的问题。这些想法以合乎逻辑且清晰的形式呈现，既适合技术人员阅读，也适合业务人员阅读。
Christopher Smith
沙利文和克伦威尔有限责任公司首席知识管理和创新官

向Neal学习一直是一件令人愉快的事。那些敦促每家企业保持“相关性”的故事和例子成为我的动力来源，本书中提出的概念有助于解决我一直在试图解决的问题。本书几乎涵盖了数据行业的所有方面，对经验、模式和反模式都进行了全面的解释。这本著作对架构师、开发者、产品所有者以及业务主管等各类人员都十分有用。对于探索人工智能的组织来说，本书是迈向成功的基石。
Harry Xuegang Huang博士
A. P.穆勒–马士基集团（丹麦）外聘顾问

到目前为止，本书是我读过的关于人工智能和数据科学的令人耳目一新的绝佳书籍之一。作者通过深入到大多数组织从数据中寻找价值时所面临的核心挑战来发现真相，即将注意力从“神奇的”技术和过于简化的方法上移开。本书以深思熟虑的方式展开，遵循作者的建议，你将获得真实的长期价值，并避免诸多陷阱。
Jan Gravesen
IBM杰出工程师，IBM董事及首席技术官

大多数关于数据分析和数据科学的书都侧重于该学科的工具和技术，并没有为读者提供一个完整的框架来规划和实施旨在解决业务问题和提升竞争优势的项目。仅仅因为机器学习和新的方法从数据中学习，而不需要预设分析模型，并不能消除对强大的信息管理计划和所需流程的需求。在本书中，作者提出了一个整体模型，强调了数据和数据管理在实现成功的价值驱动的数据分析和人工智能解决方案中的重要性。本书介绍了一种优雅而新颖的数据管理方法，并从数据创建/所有权和治理到质量和信任的多个层次与维度，进行了深入探讨。本书涵盖了数据管理和信息架构敏捷方法的组成部分，可以促进业务创新，并且能够适应不断变化的需求和优先级。书中提供了众多不同业务面临的数据挑战示例，并且这些示例都与实际应用相关，从而使得本书非常具有可读性。对于数据管理人员和数据科学家来说，这本极为优秀的书可以帮助他们深入了解数据管理、分析、机器学习和人工智能之间的基本关系。
Ali Farahani博士
洛杉矶郡前首席数据官，南加州大学兼职副教授

鉴于当今技术的新发展，有许多不同的方法可以从数据中获得洞见。这本书不仅包含了使人工智能和机器学习成为可能的技术，而且真实地描述了能使人工智能易使用和可操作的数据所需的过程和基础。我非常喜欢关于数据治理的介绍，以及关于可访问的、准确的、经过策管的和有组织的数据在任何类型的分析中的重要性的章节。区域和数据准备的重要性与差异性也有一些奇妙之处，在任何类型的分析项目中都应该高度重视。作者很好地描述了组织内部与业务需求和信息结果相关的真实数据的最佳实践。向任何在数据与人工智能的奇妙空间中学习、娱乐或工作的人强烈推荐本书。
Phil Black
TechD数据与人工智能客户服务副总裁

作者将数据治理、数据架构、数据拓扑和数据科学完美地组合在一起。他们的观察和方法为实现灵活和可持续的高级分析环境铺平了道路。我正在采用这些技术为我所在的公司构建分析平台。
Svetlana Grigoryeva
Shearman and Sterling数据服务和人工智能经理

本书读起来很有趣，并提供了许多发人深省的想法。本书是数据科学家以及所有参与大规模企业级人工智能计划的人的宝贵资源。
Simon Seow
Info Spec Sdn Bhd（马来西亚）董事总经理

作为一直从事信息技术方面工作的万事达信用卡公司副总裁以及通用汽车公司全球总监，我很早以前就意识到了寻找最优秀人才并向其学习的重要性。在这里，作者带来了一个独特而新颖的声音，引起了人们关于企业级数据科学如何取得成功的强烈共鸣。随着大数据、计算能力、便宜的传感器的爆炸性增长，以及人工智能技术令人敬畏的突破，本书让我们认识到：如果没有坚实的信息架构，我们在人工智能方面的工作可能会落后。
Glen Birrell
执行信息技术顾问
在21世纪，使用元数据增强跨行业生态系统以及利用人工智能算法的层次结构的能力，对于最大化利益相关者的利益至关重要。当今的数据科学进程和系统根本无法提供足够的速度、灵活性、质量或上下文来实现这一点。本书是一本非常有用的书，因为它为智能企业提供了将想法付诸实践的具体步骤。
Richard Hopkins
IBM（英国）技术学院院长
对于策管、管理数据，或根据数据做出决策的每个人来说，这都是一本必读的书。本书揭开了数据科学中很多神秘和神奇的思维，以解释为什么我们在兑现人工智能的承诺上做得不够好。对于使用人工智能或机器学习的现代分析环境，本书提供了许多改进其信息架构实践的实用想法。我强烈推荐你阅读本书。
Linda Nadeau
Metaphor咨询有限公司信息架构师
本书解释了数据作为现代企业的自然资源的意义。继上一本探讨数据在企业转型中的作用的书之后，作者又通过本书引导读者通过一种整体方法来利用数据科学实现业务价值。本书研究了跨多个行业的数据、分析和AI价值链，描述了在相关行业的具体用途和业务案例。这本书是首席数据官以及任何行业中的数据科学家的必读之作。
Boris Vishnevsky
Slalom复杂解决方案和网络安全负责人，托马斯·杰斐逊大学兼职教授
作为一名与客户一起处理高度复杂项目的架构师，我所有的新项目都涉及大量的数据、分布式数据源、基于云的技术和数据科学。对于在现实世界中的企业级实践而言，这本书是无价的。它将使用人工智能技术的预期风险、复杂性和回报以一种组织良好的方式展示出来，这种方式易于理解，可以使读者从基于事实的学术中走出来，进入数据科学的真实世界。我将这本书强烈推荐给任何想要从事数据科学工作的人。
John Aviles
IBM联邦CTO技术主管
我拥有超过150项专利，并以一名数据科学家的身份创建了一些复杂的人工智能商业项目，这本书对我来说是一本极具价值的实用指南。两位作者确定了为什么信息架构必须成为人工智能系统成熟方法的一部分。我将本书视为“下一代人工智能指南”。
Gandhi Sivakumar
IBM（澳大利亚），首席架构师兼首席发明家

本书阐述了企业利用人工智能技术的开创性方法。作者提供了一条可以跨越云计算、雾计算和霭计算来使用人工智能技术的清晰易懂的路径。这是所有数据科学家和数据管理者的必读书目。
Raul Shneir
以色列国家网络局主任

作为沃顿商学院讲授数据科学的教授，我经常向我的学生提到新兴的分析工具，比如人工智能，这些工具可以为商业决策者提供有价值的信息，我也鼓励他们掌握这些工具。本书必定在我的推荐阅读清单之列，它清晰地阐明了组织如何利用人工智能技术的优势，建立一个成功的信息架构。两位作者抓住了许多错综复杂的主题，这些主题与我的学生进入商业世界息息相关。本书中提出的许多想法对那些在数据科学领域工作或将受到数据科学影响的人非常有利。本书还包括许多批判性思维工具，以便让未来的数据科学工作者做好准备……坦率地讲，当下的数据科学工作者也需要这些工具。
Josh Eliashberg博士
沃顿商学院市场营销学Sebastian S. Kresge教授和运筹、信息与决策学教授

对于数据驱动型组织来说，这是一个极好的指南—这样的组织必须建立一个强大的信息架构，以便通过数据科学不断提供更大的价值，否则就会被时代抛弃。这本书将使组织完成其变革之旅，并可持续地利用基于云的人工智能工具和对抗性神经网络的人工智能技术。书中提出的指导原则将推进数据的民主化、劳动力数据素养的具备，以及人工智能透明化革命。
Taarini Gupta
Mind Genomics Advisors的行为科学家/数据科学家

上架指导

计算机/大数据

封底文字

“我不是数据科学家，我是一名系统工程师，但越发觉得自己与数据科学家的协同工作日益紧密。相信我，本书教给了我很多东西。我想你也会发现它十分有用。”
Grady Booch
ACM、IEEE会士和IBM院士
“本书是我目前为止读过的关于人工智能和数据科学令人耳目一新的绝佳书籍之一。通过遵循作者的建议，你将获得真实的长期价值，并避免诸多陷阱。”
Jan Gravesen
IBM杰出工程师，IBM董事及首席技术官
“这本著作对架构师、开发者、产品所有者以及业务主管等各类人员都十分有用。对于探索人工智能的组织来说，本书是迈向成功的基石。”
Harry Xuegang Huang博士
A.P.穆勒–马士基集团（丹麦）外聘顾问
“在本书中，作者提出了一个整体模型，强调数据和数据管理在实现成功的价值驱动的数据分析和人工智能解决方案中的重要性。书中提供了众多近来不同业务面临的数据挑战示例，使得本书非常具有可读性，并且这些示例都与实际应用相关。”
Ali Farahani博士
洛杉矶郡前首席数据官，南加州大学兼职副教授
“本书是一本非常有用的书，因为它为智能企业提供了将想法付诸实现的具体步骤。”
Richard Hopkins
IBM（英国）技术学院院长
“本书对我来说是一本极具价值的实用指南。两位作者已经确定了为什么信息架构必须成为人工智能系统成熟方法的一部分。我将本书视为‘下一代人工智能指南’。”
Gandhi Sivakumar
IBM（澳大利亚）首席架构师兼首席发明家

图书序言

在过去的十年里，人工智能领域取得了显著的进步，这要归功于三股重要力量的共同作用：大数据的崛起、计算能力的指数级增长，以及深度学习关键算法的发现。IBM的Deep Blue击败了世界上最好的国际象棋选手，Watson在Jeopardy中击败了所有人，DeepMind的AlphaGo和AlphaZero已经统治了围棋和电子游戏领域。一方面，这些进步在商业和科学领域被证明是有用的：人工智能在制造业、银行业和医药等领域发挥了重要作用。另一方面，这些进步也带来了一些难题，特别是在隐私和战争行为方面。
虽然人工智能科学领域的探索仍在继续，但其科学成果现在正以非常切实有效的方式在企业中发挥作用，这些方式不仅在经济上引起人们的关注，而且也有助于改善人类的生存状况。因此，想要利用人工智能技术的企业必须将重点转移到构筑包含认知成分的价值语用系统之上。
这就是本书的用武之地。
正如作者解释的那样，在构建这样的系统时，数据并不是事后才考虑的，而是一种先见之明。为了利用人工智能技术来预测、自动化和优化企业成果，数据科学必须成为开发过程中有意识的、可测量的、可重复的和敏捷的组成部分。在这里，你将了解收集、组织、分析和注入数据的最佳实践，这些最佳实践将使人工智能技术对于企业来说真正成为现实。关于本书，我最赞赏的是，作者不仅能够基于深刻的经验解释最佳实践，并且他们这样做的方式是可行的。他们对于结果驱动方法的强调不仅是敏捷的，还能够形成一个强大的框架，这令人耳目一新。
我不是数据科学家，而是一名系统工程师，但我越发觉得自己与数据科学家的协同工作日益紧密。这本书教给我很多东西，我想你也会发现它十分有用。

Grady Booch
ACM、IEEE会士和IBM院士

作者简介

[美]尼尔·菲什曼(Neal Fishman),[美]科尔·斯特莱克(Cole Stryker) 著：尼尔·菲什曼（Neal Fishman）是IBM的杰出工程师，并且是IBM全球业务服务组织内基于数据的病理学的首席技术官。尼尔也是Open Group认证的杰出IT架构师。
科尔·斯特莱克（Cole Stryker）是一名常驻洛杉矶的作家和记者。他是Epic Win for Anonymous和Hacking the Future的作者。

图书目录

题记
本书赞誉
序言
前言
致谢
关于作者
第1章　攀登人工智能阶梯1
1.1　人工智能的数据准备2
1.2　重点技术领域2
1.3　一步一个脚印地攀登阶梯3
1.4　不断适应以保持组织的相关性6
1.5　基于数据的推理在现代业务中至关重要8
1.6　朝着以人工智能为中心的组织迈进11
1.7　本章小结12
第2章　框架部分I：使用人工智能的注意事项14
2.1　数据驱动决策制定15
2.1.1　通过询问来获得洞见15
2.1.2　信任矩阵16
2.1.3　衡量标准和人类洞见的重要性18
2.2　使数据与数据科学民主化18
2.3　是的，先决条件：组织数据必须有先见之明20
2.4　促进变革之风：有组织的数据如何缩短反应时间23
2.5　质疑一切24
2.6　本章小结26
第3章　框架部分II：使用数据和人工智能的注意事项27
3.1　个性化每个用户的数据体验28
3.2　上下文的影响：选择正确的数据显示方式29
3.3　民族志研究：通过专业数据增进理解32
3.4　数据治理和数据质量33
3.4.1　分解数据的价值34
3.4.2　通过数据治理提供结构34
3.4.3　为训练进行数据策管35
3.4.4　创造价值的其他注意事项35
3.5　本体论：封装知识的手段36
3.6　人工智能成果的公平、信任和透明度38
3.7　可访问的、准确的、经过策管的和经过组织的数据41
3.8　本章小结42
第4章　分析回顾：不只是个锤子44
4.1　曾经的情况：回顾企业数据仓库44
4.2　传统数据仓库的缺点49
4.3　范式转变52
4.4　现代分析环境：数据湖53
4.4.1　两者对比55
4.4.2　本地数据56
4.4.3　差异属性56
4.5　数据湖的要素58
4.6　新常态：大数据即普通数据60
4.6.1　从单一数据模型的刚性中解放出来60
4.6.2　流数据61
4.6.3　适合任务的工具61
4.6.4　易访问性61
4.6.5　降低成本61
4.6.6　可扩展性62
4.6.7　人工智能的数据管理和数据治理62
4.7　Schema-On-Read与Schema-On-Write63
4.8　本章小结65
第5章　分析前瞻：不是所有事物都是钉子67
5.1　组织的需求67
5.1.1　暂存区域69
5.1.2　原始区域70
5.1.3　发现与探索区域71
5.1.4　对齐区域71
5.1.5　协调区域76
5.1.6　策管区域77
5.2　数据拓扑78
5.2.1　区域地图80
5.2.2　数据管道81
5.2.3　数据地形81
5.3　扩展、添加、移动和删除区域83
5.4　启用区域84
5.4.1　摄入84
5.4.2　数据治理86
5.4.3　数据存储和保留87
5.4.4　数据处理89
5.4.5　数据访问90
5.4.6　管理和监控91
5.4.7　元数据91
5.5　本章小结92
第6章　人工智能阶梯的运营准则93
6.1　时光流逝94
6.2　创建98
6.2.1　稳定性99
6.2.2　障碍99
6.2.3　复杂性99
6.3　执行100
6.3.1　摄入101
6.3.2　可见性102
6.3.3　合规性102
6.4　运行102
6.4.1　质量103
6.4.2　依赖104
6.4.3　可复用性104
6.5　xOps三重奏：DevOps/MLOps、DataOps和AIOps105
6.5.1　DevOps/MLOps105
6.5.2　DataOps107
6.5.3　AIOps109
6.6　本章小结111
第7章　最大化运用数据：以价值为导向112
7.1　迈向价值链113
7.1.1　通过关联链接116
7.1.2　启用操作117
7.1.3　扩大行动手段118
7.2　策管119
7.3　数据治理121
7.4　集成数据管理123
7.4.1　载入125
7.4.2　组织125
7.4.3　编目126
7.4.4　元数据127
7.4.5　准备128
7.4.6　预配129
7.4.7　多租户129
7.5　本章小结132
第8章　通过统计分析评估数据并启用有意义的访问133
8.1　派生价值：将数据当作资产进行管理133
8.2　数据可访问性：并非所有用户都是平等的139
8.3　向数据提供自助服务140
8.4　访问：添加控件的重要性141
8.5　为了数据治理，使用自底向上的方法对数据集进行排序142
8.6　各行业如何使用数据和人工智能143
8.7　受益于统计数字144
8.8　本章小结151
第9章　长期构建152
9.1　改变习惯的需要：避免硬编码152
9.1.1　过载153
9.1.2　锁定154
9.1.3　所有权和分解156
9.1.4　避免变化的设计156
9.2　通过人工智能扩展数据的价值157
9.3　混合持久化159
9.4　受益于数据素养163
9.4.1　理解主题165
9.4.2　技能集165
9.4.3　全部都是元数据167
9.4.4　正确的数据，在正确的上下文
　中，使用正确的接口168
9.5　本章小结170
第10章　终章：人工智能的信息架构171
10.1　人工智能开发工作172
10.2　基本要素：基于云的计算、数据和分析175
10.2.1　交集：计算容量和存储容量180
10.2.2　分析强度181
10.2.3　跨要素的互操作性183
10.2.4　数据管道飞行路径：飞行前、飞行中、飞行后186
10.2.5　数据水坑、数据池和数据湖的数据管理187
10.3　驱动行动：上下文、内容和决策者188
10.4　保持简单190
10.5　筒仓已死，筒仓长存192
10.6　分类：组织数据区域194
10.7　开放平台的功能197
10.8　本章小结200
附录　缩略语对照表203