首页>参考读物>计算机科学与技术>数据库

数据仓库设计
作者 : (美)Claudia Imhoff, Nicholas Galemmo, Jonathan G.Geiger
译者 : 于戈 鲍玉斌 王大玲 等
丛书名 : 数据库技术丛书
出版日期 : 2004-11-24
ISBN : 7-111-13963-1
定价 : 35.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 312
开本 : 16开
原书名 : Mastering Data Warehouse Design: Relational and Dimensional Techniques
原出版社: John Wiley & Sons,Inc.
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

本书全面论述设计和建立高效、可持续发展且可扩展的数据仓库的方法,重点论述建立各种数据模型的方法。主要内容包括业务智能环境和数据模型的概念、数据模型分类、数据模型的开发步骤、各种数据的建模方法、数据仓库的优化与扩展、数据模型的维护、关系型解决方案的部署、多维体系结构与企业信息工厂的比较等。
  本书主要面向数据仓库的设计者和建设者,以及数据仓库技术研究人员,也适于对数据仓库技术和企业信息化建设感兴趣的其他读者阅读。

图书特色

作者简介

(美)Claudia Imhoff, Nicholas Galemmo, Jonathan G.Geiger:Claudia Imhoff: Intelligent Solutions公司(www.IntelSols.com)的总裁和创始人。该公司是CRM(客户关系管理)及商务智能技术和策略方面的权威咨询公司。Claudia Imhoff博士是一位受欢迎的演说家和国际上公认的专家,担当许多企业、大学和尖端技术公司在该领域的咨询顾问。她与他人合写了关于该领域的5本著作和50多篇文章。联系方式为CImhoff@IntelSols.com。
Nicholas Galemmo: 曾经担任Nestle USA的信息架构师。Nicholas具有27年作为专业人士和咨询顾问的经验,涉足制造、流通、教育、军事、保健和金融等行业的应用系统设计和开发的所有方面。他在过去11年里,一直活跃于大型数据仓库构建和系统集成项目。他使用多维体系结构和关系结构建立了许多数据仓库。他发表过许多文章,并出席过多届全国会议。联系方式为ngalemmo@yahoo.com。
Jonathan G.Geiger: Intelligent Solutions公司的执行副总裁。Jonathan参加了服务、电信、制造、教育、化工、金融和零售等行业中的许多企业信息工厂和客户关系管理项目。在他作为专业人士和咨询顾问的30年里,Jonathan负责或者承担了信息管理中所有方面的工作。他撰写了及与其他人合写了30篇文章和2部著作,经常出席各类技术会议,主讲了多个公开研究班课程。

译者简介

于戈 鲍玉斌 王大玲 等:于戈: 1962年生,博士,教授,博士生导师。1982年和1985年于东北大学获学士和硕士学位;1996年于日本九州大学获工学博士学位。现任东北大学信息学院副院长兼计算机系系主任,中国计算机学会数据库专业委员会副主任委员、中国计算机学会青年计算机论坛学术委员会委员、沈阳市电脑协会副理事长、辽宁省计算机学会副理事长、中国电子学会高级会员、ACM会员、SIGMOD会员、IEEE 会员、IEEE CS会员、日本IPSJ学会会员、WAIM国际学术会议指导委员会委员,ICDE’2002、CODAS’2001等多届国际学术会议程序委员会委员,《东北大学学报》(自然科学版)、《控制与决策》、《控制工程》等学术期刊的编委。承担或完成了“基于CORBA软件总线的CIMS信息集成平台的研究”等10多项国家863课题、国家自然科学基金课题和“新一代数据库基础技术的研究”等多项国际合作课题。获得国家科技进步奖二等奖2项,省部级科技进步二等奖1项、三等奖2项。获得教育部“跨世纪优秀人才基金”、“霍英东青年教师基金”、“中国高校青年教师奖”。出版《分布式数据库》等专著和论文集4部,在《J. of Computer Sci. and Tech.》、《计算机学报》、《软件学报》等权威学术期刊和ICDE'06、DASFAA'05等著名国际会议上发表学术论文50余篇。

图书目录

第1章  绪论
1.1  业务智能概述
1.2  什么是数据仓库
1.2.1  数据仓库的作用和目的
1.2.2  企业信息工厂
1.3  数据仓库的多用途性
1.3.1  支持的数据集市类型
1.3.2  支持的BI技术类型
1.4  可维护的数据仓库环境的特点
1.5  数据仓库数据模型
1.5.1  非冗余性
1.5.2  稳定性
1.5.3  一致性
1.5.4  最终数据使用方面的灵活性
1.5.5  Codd和Date前提
1.6  建立数据集市的效果
1.7  小结
第2章  关系的基本概念
2.1  为什么需要数据模型
2.2  关系数据模型的建模对象
2.2.1  主题
2.2.2  实体
2.2.3  元素或属性
2.2.4  联系
2.3  数据模型的类型
2.3.1  主题域模型
2.3.2  业务数据模型
2.3.3  系统模型
2.3.4  技术模型
2.4  建立关系数据模型的指导方针
2.4.1  指导方针与最合适的做法
2.4.2  规范化
2.5  关系数据模型的规范化
2.5.1  第一范式
2.5.2  第二范式
2.5.3  第三范式
2.5.4  其他的规范化级别
2.6  职业技巧
2.7  小结
第二部分  模型开发
第3章  理解业务模型
3.1  业务场景
3.2  主题域模型
3.2.1  关于特定行业的考虑
3.2.2  主题域模型开发过程
3.2.3  Zenith汽车公司的主题域模型
3.3  业务数据模型
3.4  小结
第4章  模型的开发
4.1  方法学
4.1.1  步骤1:选择感兴趣的数据
4.1.2  步骤2:在码中增加时间
4.1.3  步骤3:增加导出数据
4.1.4  步骤4:确定粒度级别
4.1.5  步骤5:汇总数据
4.1.6  步骤6:合并实体
4.1.7  步骤7:建立数组
4.1.8  步骤8:分离数据
4.2  小结
第5章  码的建立和维护
5.1  业务背景
5.1.1  不一致的客户业务定义
5.1.2  不一致的客户系统定义
5.1.3  系统之间不一致的客户标识符
5.1.4  包含外部数据
5.1.5  按照角色惟一确定的客户
5.1.6  未加说明的客户层次
5.2  数据仓库系统模型
5.2.1  不一致的客户业务定义
5.2.2  不一致的客户系统定义
5.2.3  系统之间不一致的客户标识符
5.2.4  吸收外部数据
5.2.5  按照角色惟一确定的客户
5.2.6  未加说明的客户层次
5.3  数据仓库技术模型
5.3.1  来自记录系统的码
5.3.2  来自公认标准的码
5.3.3  代理码
5.4  多维数据集市的含义
5.4.1  多维模型中的差异
5.4.2  多维一致性的维护
5.5  小结
第6章  日历建模
6.1  业务中的日历
6.1.1  日历类型
6.1.2  其他财务日历
6.1.3  日历的元素
6.1.4  日历时间跨度
6.2  时间和数据仓库
6.2.1  时间的性质
6.2.2  时间的标准化
6.3  数据仓库系统模型
6.4  案例分析:简单财务日历
6.4.1  分析
6.4.2  一个简单日历模型
6.5  案例分析:位置特定日历
6.5.1  分析
6.5.2  GOSH日历模型
6.5.3  日历交付
6.6  案例分析:多语种日历
6.6.1  分析
6.6.2  多国语言的存储
6.6.3  不同日期表现形式的处理
6.6.4  多语种交付
6.7  案例分析:多重财务日历
6.7.1  分析
6.7.2  扩展日历
6.8  案例分析:季节日历
6.8.1  分析
6.8.2  季节性日历的结构
6.8.3  季节数据交付
6.9  小结
第7章  层次树的建模
7.1  业务中的层次树
7.2  层次树的性质
7.2.1  层次树的深度
7.2.2  层次树的父子关系
7.2.3  层次树的结构
7.2.4  历史
7.2.5  层次树类型小结
7.3  案例分析:零售层次树
7.3.1  层次树的分析
7.3.2  层次树的实现
7.4  案例分析:销售和产量计划安排
7.4.1  分析
7.4.2  产品层次树
7.4.3  客户层次树
7.5  案例分析:零售采购
7.5.1  分析
7.5.2  业务模型的实现
7.6  案例分析:包装
7.6.1  分析
7.6.2  增加材料单
7.6.3  数据的发布
7.7  结构的变换
7.7.1  递归树的构建
7.7.2 递归树的平面化
7.8  小结
第8章  事务的建模
8.1  业务事务
8.1.1  数据仓库的业务应用
8.1.2  每个事务的平均行数
8.1.3  涉及变化的业务规则
8.2  应用接口
8.2.1  快照接口
8.2.2  增量接口
8.2.3  数据库事务日志
8.3  事务数据的交付
8.4  案例分析:销售订单的快照
8.4.1  订单的变换
8.4.2  技术1:完整的快照捕捉
8.4.3  技术2:变化数据的快照捕捉
8.4.4  技术3:具有增量捕捉的变化快照
8.4.5  装载处理
8.5  案例分析:事务接口
8.5.1  事务的建模
8.5.2  事务的处理
8.6  小结
第9章  数据仓库优化
9.1  开发过程的优化
9.1.1  设计和分析的优化
9.1.2  应用开发的优化
9.2  数据库的优化
9.2.1  数据聚簇
9.2.2  表划分
9.2.3  实现参照完整性
9.2.4  索引组织的表
9.2.5  索引技术
9.2.6  结论
9.3  优化系统模型
9.3.1  垂直划分
9.3.2  逆规范化
9.3.3  子类型聚簇
9.4  小结
第三部分  操作和管理
第10章  业务变化的适应
10.1  数据仓库的改变
10.1.1  变化的缘由
10.1.2  对变化的控制
10.1.3  变化的实现
10.2  业务变化的建模
10.2.1  设想最坏的情况
10.2.2  对联系的概化
10.2.3  使用代理码
10.3  业务变化的实现
10.3.1  主题域的集成
10.3.2  增加主题域
10.4  小结
第11章  模型的维护
11.1  模型及其演化的管理
11.1.1  主题域模型
11.1.2  业务数据模型
11.1.3  系统数据模型
11.1.4  技术数据模型
11.1.5  同步问题
11.2  模型的协调
11.2.1  主题域和业务数据模型
11.2.2  业务和系统数据模型
11.2.3  系统数据模型和技术数据模型
11.3  对多个建模者的管理
11.3.1  作用和职责
11.3.2  冲突管理
11.4  小结
第12章  关系型解决方案的部署
12.1  数据集市的混乱
12.1.1  为什么糟糕
12.1.2  “以体系结构方式”准则
12.2  从数据集市混乱中迁移出来
12.2.1  维的确认
12.2.2  建立数据仓库的数据模型
12.2.3  建立数据仓库
12.2.4  仅仅“以体系结构方式”建立新的数据集市——不要管旧的集市
12.2.5  从一个数据集市建立体系结构
12.3  选择正确的迁移路径
12.4  小结
第13章  数据仓库设计方法学比较
13.1  多维体系结构
13.2  企业信息工厂体系结构
13.3  CIF和MD体系结构的比较
13.3.1  范围
13.3.2  角度
13.3.3  数据流
13.3.4  易失性
13.3.5  灵活性
13.3.6  复杂性
13.3.7  功能
13.3.8  运行维护
13.4  小结
术语表

教学资源推荐
作者: [美] 查鲁·C. 阿加沃尔(Charu C. Aggarwal) 著
作者: 徐洁磐 操凤萍 编著
作者: (葡)Luis Torgo 著
作者: (美)Ryan K.Stephens Ronald R.Plew
参考读物推荐
作者: Rama Velpuri
作者: (美)Nirva Morisseau-Leroy Martin K.Solomon Julie Basu