首页>参考读物>计算机科学与技术>数据库

数据仓库应用指南:数据仓库与商务智能最佳实践
作者 : (美)Robert Laberge 著
译者 : 祝洪凯 李妹芳 译
出版日期 : 2012-03-01
ISBN : 978-7-111-37044-4
定价 : 69.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 334
开本 : 16
原书名 : The Data Warehouse Mentor: Practical Data Warehouse and Business Intelligence Insights
原出版社: McGraw-Hill
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:数据仓库和商务智能概述,建立商务智能和数据仓库的策略与计划,项目中的角色和职责,商务智能的数据集市及用途,企业数据模型和数据仓库体系结构等。本书作者经验丰富,提供了大量一线开发经验,为正确实施数据仓库和商务智能提供了行之有效的解决方案。适合构建数据仓库的开发人员、管理人员参考。

图书特色

开发可定制的、灵活的数据仓库和商务智能架构

  本书全面系统地讲解如何规划、设计、构建和管理数据仓库/商务智能解决方案。本书介绍在数据仓库开发项目中如何激励用户,在整个企业范围内更好地驱动决策制定,从专业的开发人员获取详细的指导和最佳实践经验。本书内容涉及如何选择恰当的组件、构建企业数据模型、配置数据集市和数据仓库、构建数据流并降低风险,还涉及项目开发中变更管理、数据监理和安全方面的问题。

本书主要内容:
 ● 理解数据仓库系统和商务智能组件。
 ● 建立项目目标并有效制定部署计划。
 ● 用数据挖掘发现组织内业务见解。
 ● 使用ETL技术对数据进行输入、清洗和规范化。
 ● 使用结构化输入文件来定义数据需求。
 ● 使用自上而下、自下而上、混合的设计方式。
 ● 使用数据监理工具来处理安全和性能优化问题。

图书前言

本书对数据仓库世界中很多主题进行了探讨。本书旨在从业务和技术角度说明数据仓库系统的构建,侧重于简单朴实地描述如何构建切实的解决方案。这些见解来源于我30多年在20多个国家中50多家企业的亲身经历,在这些经历中,我曾作为独立顾问、员工以及IBM产业模式和资产实验室的合伙人,见证了很多数据仓库的实施过程。
  本书介绍了构建数据仓库的组件和不同选择,以及选择某种方式的利弊。每家企业的数据仓库构建都是具有其特色的,但可以借鉴全球范围内很多企业的各种数据仓库和商务智能环境中获取的知识。本书首先从高层角度介绍了数据仓库主题,以确保对术语和上下文理解一致,然后详细说明了各个主题。这些主题都和数据仓库、商务智能和性能管理相关。
  对于数据仓库的构建不存在规则,但是有很多指南。本书的主要根本点是根据具体的和对业务需求的理解,构建适应特定企业需求的解决方案,同时为今后的工作创建一个开放、灵活的架构基础。很多企业在初始包含商务智能报表的集中式数据仓库的构建上花费了大量的预算,结果却发现其创建的解决方案过于具体,只适合一两个用途,而无法满足后期的需求。当然,我们无法对未来进行预测,但是可以在一定程度上预期今后的数据需求和使用方式,确保设计和构建环境灵活、开放,对于变化可扩展而不需要每次重新设计和构建。
  很多企业的领导人意识到企业数据是企业的基础资产,必须对它进行组织、结构化和维护,以保证其业务信息有较好的质量和管理,从而在整个企业范围内共享。如果没有信息系统,企业就无法运作,而如果没有商业目的,信息系统就不复存在。它们相互依存,应该充分意识到信息架构和使用方式,以使得企业变得更加智慧。
本书结构
  第一部分:准备
  第一部分介绍商务智能和数据仓库的基础概念,旨在介绍基础知识,为管理工作奠定基础。
  第1章:数据仓库和商务智能概述该章概要介绍了商务智能和数据仓库,最后提出了和数据仓库实现相关的高层次问题。
  第2章:企业中的数据该章探讨了数据如何作为企业资产,并提出关于如何组织数据的见解。
  第3章:为什么创建数据仓库该章探讨了支持和反对构建数据仓库的各种理由。“支持”的理由在于已经有一些构建数据仓库的经典场景,而“反对”的理由在于企业的文化和局限性能否推动项目向前发展。
  第4章:数据仓库和商务智能战略该章给出了构建数据仓库和商务智能行动的一些规划,探讨从何处以及如何启动项目,这取决于这项工作是面向商业报表解决方案,还是努力将数据进行组织和结构化。
  第5章:项目资源:角色和洞察力该章讨论了数据仓库项目的关键角色,以及最佳实践的团队结构。
  第6章:项目总结概论该章简要介绍了项目章程、项目范畴和工作说明书的内容。
  第二部分:组件
  第二部分介绍了数据仓库系统的基础组件,深入分析了数据仓库和商务智能系统的技术方面。这部分具体探讨了数据仓库系统中用以维护企业资产和提供商务智能支持工作的各个组件。
  第7章:商务智能:数据集市及其使用方式该章从数据模型到性能问题,详细探讨了数据集市及其使用方式。
  第8章:企业数据模型该章讨论了企业数据模型、如何构建企业数据模型的一些实例以及一般问题。
  第9章:数据仓库架构:组件该章从建模和数据流角度探讨了数据仓库架构的不同类型。
  第10章:ETL和数据质量该章探讨了数据仓库中的数据采集层和分发层的一些普遍特征,并提出关于数据质量问题的一些见解。
  第11章:项目规划和方法论该章讨论了数据仓库和商务智能项目规划的一些方法。
  第三部分:构建
  第三部分从实践角度说明了如何构建数据仓库系统。这部分旨在介绍经典的构建场景和工作,以及数据监理和对后期工作的审查。
  第12章:工作场景该章介绍了如何使用自上而下、自下而上和混合式方法来构建数据仓库和商务智能系统,并讨论了一些其他主题,包括简要介绍企业信息架构。
  第13章:数据监理该章探讨了企业数据监理,包括企业结构、数据质量、所有权和变更管理。
  第14章:项目后评审该章探讨了数据仓库和商务智能项目在开发完成后的一些方面。
  本书力争做到成为构建数据仓库系统的完整指南,目标是理解当今数据仓库系统中的很多问题,并从多个角度提出自己的观点。作者希望本书能够帮助你构建好自己的数据仓库。
  希望你喜欢本书!
致谢
  特别感谢本书的技术编辑David Marcotte 和 Ken Yu,感谢他们帮我审查书稿,并提出他们的观点和建议。他们的宝贵意见为本书最终的成功出版提供了方向指引。真心感激!
  David Marcotte是全球性零售业和分析业的大师,他拥有该行业的渊博知识。
  Ken Yu是数据设计和数据流方面的技术专家,他在很多部门工作过,积累了对数据建模和数据架构的很多实践经验和常识性方法。
  特别感谢我的妻子Rakhee Laberge(工商管理硕士),感谢她对本书的审查以及提出的很多意见和建议。
  Robert (Bob)Laberge
  联系方式:datawarehousementor@gmailcom

上架指导

计算机\数据挖掘

封底文字

开发可定制的、灵活的数据仓库和商务智能架构

本书全面系统地讲解如何规划、设计、构建和管理数据仓库/商务智能解决方案。介绍在数据仓库开发项目中如何激励用户,在整个企业范围内更好地驱动决策制定,从专业的开发和培训人员获取详细的指导和最佳实践经验。本书内容涉及如何选择恰当的组件、构建企业数据模型、配置数据集市和数据仓库、构建数据流并降低风险,还涉及项目开发中变更管理、数据监理和安全方面的问题。

主要内容:
理解BI和数据仓库系统组件
建立项目目标并有效制定部署计划
用数据挖掘发现组织内业务见解
使用ETL技术对数据进行输入、清洗和规范化
使用结构化输入文件来定义数据需求
使用自上而下、自下而上、混合的设计方式
使用数据监理工具来处理安全和性能优化问题

作者简介

(美)Robert Laberge 著:暂无简介

译者简介

祝洪凯 李妹芳 译:暂无简介

译者序

数据仓库和商务智能在各个领域的应用已经如火如荼。本书作者给我们分享了他30多年的工作经验。本书涉及面广泛,内容全面,从基础概念的介绍、各个组件的剖析,到实践中的问题,作者都给出了细致的描述,深入浅出、高屋建瓴地阐述了数据仓库和商务智能的方方面面。本书理论和实践相结合,是一本不错的数据仓库和商务智能方面的整体指南。
  本书分为三个部分来讲解数据仓库这个复杂系统,以及实现商务智能的有效方案。第一部分介绍了关于商务智能和数据仓库的基础概念,旨在介绍基础知识,为管理者思考为何、如何建立数据仓库提供了思考的方向。第二部分介绍数据仓库系统的基础组件,这部分涉及数据仓库和商务智能系统的技术方面,探讨了如何建立数据仓库系统,来维护企业资产并提供商务智能支持工作。第三部分从实践角度说明了如何构建数据仓库系统,包括经典的构建场景以及后期工作。
  说实话,业余翻译了几本书,总是很担心译得不好误导了读者。在翻译的过程中我们查阅了大量文献和网络资源,为了译好一些不常见的词汇也反复琢磨了作者原意。但是还是觉得时间紧迫,翻译仓促,惶恐不安。在这里要感谢机械工业出版社华章分社编辑吴怡老师的很多辛苦付出,也感谢所有其他为本书付出努力的编辑们。
  由于时间、精力、能力有限,本书的疏漏、错误之处在所难免,还望各位读者不吝指正。

图书目录

译者序
前言
作者简介
第一部分准备
第1章数据仓库和商务智能概述
11商务智能概述
111定义
112商务智能的价值
113剖析商务智能
114商务智能的成功要素
115商务智能的目标
116BI用户展现层
117BI工具和架构
118全球化带来的发展
12数据仓库概述
121定义
122数据仓库系统
123数据仓库架构
124数据流术语
125数据仓库目标
126数据结构化策略
127数据仓库业务
13常见问题
131当前系统是否足够好
132数据仓库的价值
133成本多高
134时间多长
135成功的因素
第2章企业中的数据
21企业资产
211具有上下文的数据
212数据质量
213数据字典
214数据组件
22组织数据
221对数据结构化
222数据模型
223数据架构
23竞争优势
231构建还是购买数据模型
232指导业务
第3章为什么创建数据仓库
31平台迁移
311业务连续性
312逆向工程
313数据质量
314并行环境
315附加值
32数据仓库集中化
321企业间并购
322企业内合并
323集中式设计和局部使用
33数据集市整合
34新方案
35新方案:动态报表
36“Just Build It”模式
37数据Floundation
38不构建数据仓库的原因
381数据质量差
382缺乏商业目标
383缺乏管理层支持
384目标不明确
385当前系统足够用
386缺乏人才资源
387环境不稳定
388成本太高
389管理不善
第4章数据仓库和商务智能战略
41商务智能战略
411商业目标
412商业用途
413架构概览
42数据仓库战略
421用途
422数据仓库架构
43重点和成功
431整个企业还是业务线
432目标明确
433成功:衡量的标准是什么
44从何处着手
441关于商务智能
442关于数据仓库
45如何开始
451关于商务智能
452关于数据仓库
46项目阶段化
47需要多长时间(重新回顾)
48兴趣点
481常见的失败原因
482基本原则
第5章项目资源:角色和洞察力
51关键点
511项目团队
512资深专业知识
513领导力
514项目发起人
515数据仓库管理层
52团队结构
521管理层发起人
522数据管家
523基本资源
53定期审查:进度审核
54能力中心
第6章项目总结概论
61项目章程
62项目范畴
63工作说明书
第二部分组件
第7章商务智能:数据集市及其使用方式
71为什么要对数据建模
711数据模型的类型
712数据设计
72事实表
721事实的类型
722事实表的类型
723衡量指标来源
724事实表关键字
725事实表粒度
726事实表密度
727无事实的事实表
73维度表
731维度还是指标
732历史表和日期表
733维度表关键字
734维度表的粒度
735维度属性的来源和价值
736维度类型
737级别和辅助表
738个人信息表
739维度数
74规模
第8章企业数据模型
81数据模型概览
82构建企业数据模型的目标
83企业数据模型的好处
84数据模型:从何处开始
85完全自上而下的数据模型
851主题领域模型
852概念模型
853实体关系模型
86总线结构
87购买的数据模型
88模型分析
881数据组件
882范化数据模型
883超类和子类模型
884在范化的数据模型中收集历史信息
885代理键
886逻辑和物理数据模型
887是否具备参照完整性
89其他数据模型
891输入数据模型
892临时存储数据模型
810最后的思考
第9章数据仓库架构:组件
91架构概述
92架构师角色
921解决方案架构师
922数据仓库架构师
923技术架构师
924数据架构师
925ETL架构师
926BI架构师
927综合
93体系结构分层
931单层体系结构
932经典的两层体系结构
933高级的三层体系结构
94数据仓库架构
941单独的数据集市架构
942总线结构
943中央存储库架构
944联合架构
95组件(分层)
951数据源
952数据生成
953数据组织
954数据分发
955信息输出
96实现方式
961数据设计和数据流
962逻辑和物理模型
963自上而下的方式
964自下而上的方式
965混合模式
97捷径
971数据采集层
972中央数据层
973数据分发层
974表现层
975用户展现层
976方法论
977现成的解决方案
第10章ETL和数据质量
101架构
1011数据获取
1012数据分发
1013ETL映射
1014初始加载和增量加载
1015ETL、ELT和ETTL
1016并行操作
1017ETL功能角色
1018数据流图
1019业务数据存储系统
102数据源系统
1021没有数据源
1022多个数据源
1023其他来源(结构化输入文件)
1024非结构化数据
103数据剖析
104数据获取
1041多个大文件
1042伪文件
1043故障预防策略
105转换和临时数据存储
1051准备工作
1052代理键
1053参照完整性
1054聚合、分析和汇总
1055编码表
106加载
1061是否加载历史数据
1062插入、更新、插入或更新、删除
1063数据获取信息
1064加载调度
107企业数据仓库的临时数据存储和总线架构的临时数据存储
108数据分发
109数据质量
1010ETL工具
第11章项目规划和方法论
111基础
1111风险:逐步发展
1112风险:数据质量
1113风险:资源
1114风险:成本
1115变更管理
1116最佳实践
112错误
113项目规划方法论
1131业务需求分析
1132战略和规划
1133解决方案纲要
1134设计
1135构建
1136部署
1137使用
第三部分构建
第12章工作场景
121让我们开始“烹饪”吧
122自上而下
1221字典
1222集中式数据模型
1223数据架构
1224数据源
1225数据模型
1226数据库
1227数据获取
1228解决方案概述
123自下而上
1231最终结果
1232字典
1233数据架构
1234一致性维度的管理
1235数据源
1236解决方案概述
124混合式
1241起步工作
1242数据模型
1243数据架构
1244解决方案概述
125归并
126没有输入:结构化的输入文件
127集成的第二阶段
128更大的框架:企业信息架构
第13章数据监理
131什么是数据监理
132数据监理的原因
133企业结构
134驱动和启动
135数据监理的主要方面
1351安全性和敏感性
1352数据质量
1353所有权
1354变更控制
136数据监理的准备工作
第14章项目后评审
141概述
142项目评审
143后续工作

教学资源推荐
作者: [葡]路易斯· 托尔戈(Luís Torgo)著
作者: [美]孟卫一(Weiyi Meng)纽约州立大学宾汉姆顿分校 於德(Clement T. Yu) 伊利诺伊大学芝加哥分校  著
作者: (加)Jiawei Han, Micheline Kamber
作者: 彭智勇 彭煜玮 编著