首页>参考读物>计算机科学与技术>数据库

电子商务中的数据仓库技术
作者 : (美)W.H.Inmon, R.H.Terdeman,Joyce Norris-Montanari,Dan Meers
译者 : 张铭 金彦钟 等
丛书名 : 数据库技术丛书
出版日期 : 2004-03-15
ISBN : 7-111-13749-3
定价 : 35.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 236
开本 : 16开
原书名 : Data Warehousing for E-Business
原出版社: John Wiley&Sons,Inc.
属性分类: 店面
包含CD :
绝版 : 已绝版
图书简介

本书全面介绍了企业信息工厂(CIF)及其组成部分,并详细论述了结合企业现状,建设高效的电子商务基础设施的方法。主要内容包括企业信息工厂的概念、组成与建设方法,电子商务用户分析,电子商务数据模型构建、数据存储、性能管理及电子商务的应用等。
  本书主要面向电子商务经营管理者,以及参与电子商务建设的业务人员与工程技术人员,也适于对电子商务技术与数据仓库技术感兴趣的其他读者阅读。

图书特色

图书前言

每一代人都必须为自己找到一些关于技术和信息系统的“普遍真理”。我们这个电子商务的时代也不例外。
  在有关技术和信息系统的普遍真理中,有些道理有很强的生命力,无论在哪种技术环境中,以下道理都是成立的:
  ●性能不是用钱就可以买得来的东西,而是必须从系统的最底层就开始考虑。性能对系统的可用性有很大影响。如果系统性能低下,用户就会放弃这套系统。在更复杂的情况下,系统性能方面的真正特征要到系统进入了成熟期才会逐渐凸显。
  ●随着系统数目的不断增加以及系统的不断老化,数据的集成就成了一个重要的问题。缺乏数据集成所带来的困难和局限性起初并不明显,要等到出现了一大批应用程序并且这些程序都进入了成熟期之后才会变得显著起来。到那时,数据的分裂状态已经由来已久,已经来不及挽救了。
  ●随着为应用程序基础设施(application infrastructure)提供支持的系统不断增加和老化,缺乏数据集成所带来的问题就会变得更加严重。系统在少量数据和海量数据的情况下,行为是完全不同的。电子商务在对点击流(click stream)的处理过程中产生了大量的数据,这些海量数据对电子商务提出了最严峻的挑战。
  遗憾的是,在以上三种情况中,基础设施中固有的这些问题起初并不明显,直到电子商务应用和系统日渐成熟才显露出来。而到了那时,电子商务应用和系统早已分散到各处了。对早已建造好的一个系统或一个由应用程序和系统结合起来的系统集进行改造,不仅花费昂贵,而且非常令人头痛。
  电子商务开发者认为自己是一类新的开发人员,不同于过去的开发者。当然,电子商务开发者所使用的技术和技巧与过去相比,有着很大的不同。但是仅仅使用新的技术和技巧并不能使电子商务环境逃脱普遍的真理。如果电子商务的设计师能够从过去积累下来的经验和智慧中受益,那该多好啊。让电子商务的设计师再去重复前几代人痛苦的教训又有什么必要呢。
  可见,在电子商务基础设施开发者面前有着一个很好的机会。他们无需再去犯前几代开发者所犯下的错误就能发现关于信息系统的普遍真理。电子商务需要建立在过去的经验教训之上,而不是去重新发现这些经验教训。而电子商务的信息系统就是店铺。在电子商务中,用户可以很容易地看到和感觉到电子商务设计师的错误,因为这些错误往往非常明显。
  电子商务的设计师应该做什么呢?首先,入门者应该被告知存在着一个基础设施,该基础设施已经解决了绝大部分可能遇到的问题。所以,不必再去重新发现每一件事,也不必在黑夜中徘徊彷徨了。如果电子商务的开发者愿意开放其头脑,那么会有一种简单快捷的方法去学习一些普遍适用的经验,而不必再去经历由于忽视了这些经验而造成的痛苦了。
  本书介绍了可以通过多种形式为电子商务设计师可用的可靠体系结构。这种结构称作企业信息工厂(CIF),是一种已建立好的用于管理整个企业的信息框架。已证明CIF可以提供良好的性能、对数据的集成和处理以及对海量数据的管理。简而言之,CIF提供了一种非常成熟的技术。
  本书可以帮助电子商务设计师在更短的时间内建设一个对电子商务的短期需要和长期需要都很有用的基础平台。

本书的组织
  绝大部分书籍都是以顺序的方式来组织内容的。这种方式从时间的观点看来是很好的,但通常会缺乏内容之间的综合。本书从一种商务的角度来组织,采用自顶向下式的结构。考虑到不同电子商务团体的角度有所不同,我们从商务面临的挑战和机遇开始,向着技术的前景不断深入下去。电子商务团体的每一部分都可以看到他们各自独有的部件是如何被集成到整个系统中去的。
  下面是每一章的简介:
  ●第1章介绍电子商务所带来的新的机遇和挑战,以及它们是如何对企业产生影响的。
  ●第2章使用CIF模型把电子商务信息和企业的其他信息联系起来。我们将演示使用单一信息模型的好处,这样可以避免不必要的开销和风险。
  ●第3章强调应该使用渐进式的方式来开发为商务提供支持的基础设施,这样可以保证生产速度和生产量,而不至于对商务产生负面影响。
  ●第4章带领读者经历对电子用户团体进行身份识别的过程。
  ●第5章帮助读者了解将电子商务数据和所有其他企业数据集成到一起的必要性。
  ●第6章介绍性能对于满足在线用户期望的重要性。新集成进来的电子商务数据和遗留下来的传统数据造成了一场信息的大爆炸。
  ●第7章演示如何对海量新数据进行管理。
  ●第8章介绍如何在新的应用之间取得平衡,从而在新的环境中获得益处。
  ●第9章将回到商务的观点,并鼓励读者对数据进行探索,得到新的商业价值。
  ●第10章提醒读者,所有的商务和技术都存在于不断变化的世界中,需要审慎地为未来制定计划。

本书的读者
  这本书对于任何一个创建、支持、管理和使用电子商务环境的人来说都是很有用的。许多书都只集中讨论属于电子商务的一个很狭窄的领域,而本书则是从一个完整的角度来讲述的。本书不仅适合CEO们阅读,对网站程序员或设计者也同样适合。如果在阅读一本综合性图书的同时,又不时地顺着基础设施的某一层来看问题,很容易造成对所阅读内容的理解偏差。CIF模型会帮助企业认识到,没有哪一个部分比另一个部分更重要。对于一个有效的信息系统来说,所有的部分在使商务变得有效这个方面是同样不可缺少的。笔者强烈建议读者按顺序阅读本书,以便能从一个全面的角度得到所有的收获。

结语
  笔者相信本书能够帮助企业避免由于短视的商业观点而造成的问题。通过正确摆放电子商务各个组件的位置,企业可以减少额外的开销和风险。更重要的是,可以对不切实际的期望加以控制。一项新技术经常会造成一种期望,而最后这种期望往往会变成失望。我们把电子商务放置在传统商务的环境中,因而可以把更多切合实际的期望成功地转变成现实。希望所有读者都能够把本书作为一种高级指导,用于开发和管理电子商务的设计和实现。

作者简介

(美)W.H.Inmon, R.H.Terdeman,Joyce Norris-Montanari,Dan Meers:W.H.Inmon: W.H.Inmon是公认的”数据仓库之父”,也是关于企业信息源的专业网站www.billinmon.com的创始人。 在数据库、数据管理和数据仓库技术方面有超过40本著作。经常在主要行业会议上发表演说。他的Building the Data Warehouse是数据仓库领域被引用最多的标准参考书。
R.H.Terdeman: 在数据处理行业有超过30年的从业经验。在担任EMC公司的首席数据仓库架构师期间,每年都要访问上百家公司,为他们提供数据仓库基础设施设计方面的指导和咨询。
Joyce Norris-Montanari: Joyce Norris-Montanari Intelligent Solutions公司的高级副总裁,数据仓库与原数据方面的领袖级专家。经常在关于数据仓库的会议上发表演说。此外还是数学商业刊物的撰稿人。
Dan Meers: Dan Meers 商业咨询顾问,专长为用于电子商务支持的CIF战略。有着15年的计算和数据管理经验。与人合写过许多商业刊物文章、专业书籍和技术论文。

译者简介

张铭 金彦钟 等:暂无简介

译者序

随着Internet的迅速发展,电子商务对于企业的重要性早已成为人们的共识。怎样在充分利用企业已有信息资源的基础上,构建支持企业决策的数据仓库,从而为客户提供个性化、人性化的服务,这是本书所探讨的主题。
  本书以电子商务所面临的机遇与挑战开篇,首先介绍了企业信息工厂(CIF)及其组成部分,并对建立电子商务基础设施的相关内容进行了讨论。之后,在引入点击流数据这一电子商务的重要概念之后,对如何理解企业信息工厂与电子商务之间的数据接口进行了深入阐述。接下来,对如何构建可循环利用的电子商务体系结构、如何识别进入电子商务环境中的客户身份以及如何将电子商务与企业数据整合等方面进行了论述。最后,对电子商务环境中的性能、它所使用的存储技术、电子商务环境中都有哪些应用以及在电子商务环境中所进行的分析、探索工作等等进行了讨论,并对电子商务如何适应新的变化及其将来的发展方向等做了有益的探讨。
  本书的作者有着多年为企业构造IT系统的经验。作者W. H. Inmon被誉为“数据仓库之父”。书中列出了作者从业以来经历并解决的许多实际问题,这些问题可能是读者目前正待解决的,也可能是以后将要遇到的。在译者看来,这些实例正是本书的精华之处,对于电子商务企业的管理人员和参与建设电子商务数据仓库的技术人员有很强的指导意义。对数据仓库、电子商务感兴趣的各类读者,也能从本书受益。

张铭(北京大学)  金彦钟(天津科技大学)
2003年11月

图书目录

译者序
前言
第1章  电子商务的机遇与挑战 1
1.1  从现实世界到电子世界 1
1.2  三个挑战:数据量、速度和多样性 3
1.2.1  数据量 3
1.2.2  数据周转速度 3
1.2.3  数据格式的多样性 4
1.3  电子商务通道 6
1.3.1  企业对企业(B2B):集中交易与新兴市场 6
1.3.2  企业对消费者(B2C):消费环境 8
1.3.3  企业对员工(B2E) 9
1.4  电子零售带来的冲击 9
1.5  电子商务经济 11
1.5.1  新旧经济的比较 12
1.5.2  电子商务对经济周期的影响 13
1.6  区分事务周期和客户生存周期 15
1.7  支持合作伙伴关系管理 16
1.8  迎接当前电子商务基础设施的挑战 17
1.8.1  基础设施的机遇:从仓库到Web,从Web到仓库 19
1.8.2  基础设施的挑战:从Web到数据仓库 19
1.9  从金融角度来看信息 20
1.10  小结 21
第2章  CIF和电子商务 23
2.1  CIF的组成部分 23
2.1.1  定义Web环境 24
2.1.2  小结 30
2.2  定义电子商务体系结构需求 31
2.3  理解点击流数据 35
2.3.1  使用先前站点信息 39
2.3.2  与ODS结合起来 40
2.4  利用元数据转化语言来解释信息 42
2.4.1  企业应用集成 44
2.4.2  小结 46
2.5  理解CIF和电子商务接口 46
2.5.1  发送事务到操作型环境中 49
2.5.2  数据经过粒度管理器 49
2.5.3  数据经过ODS 51
2.6  小结 54
第3章  迭代地构建电子商务基础设施 55
3.1  采用迭代的方法来开发 55
3.1.1  元数据的重要性 56
3.1.2  创建一个循环迭代的周期 57
3.2  系统实施中的方法论 58
3.2.1  项目规划 60
3.2.2  过程设计 66
3.2.3  部署 68
3.2.4  管理和操作 69
3.3  小结 73
第4章  识别电子商务用户 75
4.1  识别内部用户群体 76
4.1.1  分析型用户 76
4.1.2  终端用户群 78
4.2  识别外部用户 80
4.2.1  业务合作伙伴 81
4.2.2  消费者 82
4.2.3  社区 85
4.3  获得过程 89
4.4  支持所有用户 90
4.5  小结 93
第5章  电子商务与企业数据的整合 95
5.1  粒度级别 95
5.2  数据模型的作用 96
5.2.1  主题域模型 97
5.2.2  企业逻辑数据模型(企业数据模型) 97
5.2.3  数据仓库和数据集市模型 99
5.2.4  Web站点ODS模型 100
5.2.5  企业ODS模型 102
5.3  模型之间的关系 105
5.4  小结 106
第6章  电子商务环境中的性能 107
6.1  从第一天就开始关注性能 107
6.2  交易处理和性能 109
6.2.1  简单交易 110
6.2.2  更复杂的交易 111
6.2.3  交易小结 112
6.3  管理Web网站的性能 112
6.3.1  ODS和性能 113
6.3.2  监视Web环境 114
6.4  高性能数据库设计技术 116
6.4.1  创建数据索引 117
6.4.2  使用数组 117
6.4.3  表合并 117
6.4.4  建立冗余数据 118
6.4.5  聚集数据 118
6.4.6  拆分事务使I/O操作最少 118
6.4.7  管理Web网站的工作日 119
6.4.8  容量计划及管理 120
6.4.9  管理大容量数据 120
6.5  数据集市与性能 121
6.6  网络性能 122
6.7  DBMS技术与性能 123
6.8  ETL效率与性能 124
6.9  其他增强性能的技术 126
6.9.1  移动少量数据 126
6.9.2  使用日志文件 127
6.9.3  生成在线报表 127
6.9.4  创建滚动式汇总数据结构 127
6.9.5  物理上并列存放的数据 128
6.9.6  闲时数据处理 128
6.9.7  重复查询 129
6.9.8  预先序列化事务 129
6.10  培训终端用户以提高性能 129
6.11  小结 129
第7章  电子商务的数据存储技术 131
7.1  数据存储的本质 131
7.1.1  离散与连续信息 132
7.1.2  持久性 132
7.1.3  延迟 133
7.1.4  访问 135
7.2  存储容量与性能 135
7.2.1  缓存 137
7.2.2  常规磁盘 139
7.2.3  高密度磁盘 139
7.2.4  光存储 140
7.2.5  近线存储 141
7.3  存储技术创新的快速步伐 141
7.4  存储的层次结构 142
7.5  建立存储基础设施 144
7.6  无线矩阵 146
7.7  小结 147
第8章  电子商务中的应用 149
8.1  定义分析型应用 149
8.1.1  经典财务和操作型报表 150
8.1.2  以客户为中心的报表 151
8.1.3  以产品为中心的报表 152
8.1.4  事务分析 154
8.1.5  纯信息型网站分析 156
8.1.6  网站内部导航分析 157
8.2  网站滞留时间:确立网站有效性基准 157
8.3  网站内基于内容的分析 158
8.4  小结 159
第9章  电子商务中的探索 161
9.1  时间 161
9.2  操作型探索 162
9.3  经典商业价值和探索 163
9.4  建立模型 165
9.4.1  定义探索的目标 165
9.4.2  定义接近的模式 166
9.4.3  初始的接触和联系 168
9.4.4  推断性关联 169
9.5  在探索中确定客户的价值 171
9.5.1  电子商务中的同属家庭处理 172
9.5.2  探索中不同的地址联系 172
9.6  小结 173
第10章  适应电子商务中的变化 175
10.1  品牌淡化和损失 176
10.2  对电子商务灵活性的需求 177
10.2.1  移动化 177
10.2.2  敏感度 177
10.3  电子商务灵活性面临的挑战 178
10.4  电子商务起步阶段的特点 180
10.5  企业性能:盈利能力的水平 184
10.5.1  关系型盈利能力 184
10.5.2  企业盈利能力 186
10.6  为企业性能而管理信息资产 187
10.7  小结 189
10.8  展望 189
术语表 191
推荐阅读材料 221

教学资源推荐
作者: 何玉洁 编著
作者: Abraham Silberschatz, Henry F.Korth, S.Sudarshan
作者: [美] 亚伯拉罕·西尔伯沙茨 (Abraham Silberschatz) [美] 亨利·F. 科思 (Henry F. Korth) [印] S. 苏达尔尚(S. Sudarshan) 著
作者: (葡)Luis Torgo 著
参考读物推荐
作者: 吴德胜 赵会东 等编著
作者: 王仲远 编著
作者: 申德荣 寇月 聂铁铮 于戈 等编著