数据仓库与数据挖掘
作者 : 李雄飞 杜钦生 吴昊 编著
出版日期 : 2013-11-11
ISBN : 978-7-111-43675-1
适用人群 : 研究生,本科生
定价 : 39.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 230
开本 : 16
原书名 :
原出版社:
属性分类: 教材
包含CD :
绝版 :
图书简介

介绍数据仓库和数据挖掘的基本知识和理论,按教育部软件工程硕士培养目标和相关文件,建设符合软件工程硕士教学需要的教材。
该教材建设也是“高水平研究生课程体系建设”项目的内容之一。

图书特色

封底
“大数据”作为时下最热门的IT行业的词汇,随着数据仓库、数据分析、数据挖掘等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的焦点。人们希望从已有的数据中分析未来的趋势,从技术和工具上提供有效的辅助决策手段。在此背景下,数据仓库和数据挖掘技术应运而生。
本书主要介绍了数据仓库和数据挖掘技术的基本概念和理论,特别是在现今大数据背景下更具实际意义。首先侧重介绍数据仓库,重点介绍了OLAP,数据仓库的数据模型,数据仓库的分析、设计与开发方法等内容;然后侧重介绍数据挖掘技术,重点介绍了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容;最后,给出了数据仓库和数据挖掘方面的几个典型应用案例。

图书前言

随着数据采集手段的逐渐丰富,存储装置容量的提升和成本的下降,人类已经进入海量数据存储的时代。如何有效地利用海量数据,分析其内在规律,挖掘潜藏在数据背后的知识,这些问题促使人们开始探索新的技术和方法。从应用的角度看,人们希望从已有的数据中分析未来的趋势,在技术和工具上提供有效的辅助决策手段。在此背景下,数据仓库和数据挖掘技术应运而生。目前,该领域成果已经应用到人类社会、经济、科技等各个方面,相关的理论、标准和工具日趋成熟。数据仓库和数据挖掘技术的发展又催生了大数据时代的降临。
  本书第1章是绪论,通过讨论数据采集、数据存储和数据管理技术的发展过程,引入数据仓库、数据挖掘的一般知识,并讨论了与本书主题相关的技术领域,对在应用领域中取得的成果进行了简单综述。第2~8章介绍数据仓库和数据挖掘的理论和技术,是本书的重点。其中,第2、3章侧重介绍数据仓库,从OLTP到OLAP,系统地形成了数据仓库的架构,这部分重点介绍了OLAP、数据仓库实现等内容,第4~8章介绍数据挖掘,有选择性地介绍关联规则、粗糙集、决策树、聚类分析等基本原理和典型算法,并以兴趣度量为主讨论对挖掘到的知识的评估问题。第9章给出数据仓库与数据挖掘方面的应用案例,考虑教学需要,仅选择部分与教材内容相关的案例,并进行适度裁剪和修改。
  本书注重内容的科学性、技术性和工程性。基本原理部分尽量做到严谨、完整。技术实现和技巧性上力求经典、特征突出。在工程方面节选部分成功案例,期望以点带面。 在教学过程中可以根据学时数、专业特点、课程性质等对教学内容适当取舍。
  本书由吉林大学李雄飞、长春大学杜钦生、吉林大学珠海学院吴昊共同编著。另外,长春理工大学董元方、李军也为本书出版做出了贡献。

作者

上架指导

计算机\数据库

封底文字

“大数据”作为时下最热门的IT行业的词汇,随之数据仓库、数据分析、数据挖掘等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的焦点。人们希望从已有的数据中分析未来的趋势,从技术和工具上提供有效的辅助决策手段。在此背景下,数据仓库和数据挖掘技术应运而生。
本书主要介绍了数据仓库和数据挖掘技术的基本概念和理论,特别是在现今大数据背景下更具实际意义。首先侧重介绍数据仓库,重点介绍了OLAP,数据仓库的数据模型,数据仓库的分析、设计与开发方法等内容;然后侧重介绍数据挖掘技术,重点介绍了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容;最后,给出了数据仓库和数据挖掘方面的几个典型应用案例。

图书目录

前  言
教学建议
第1章 绪论1
 1.1 引言1
 1.2 数据仓库2
  1.2.1 从数据库到数据仓库4
  1.2.2 数据仓库的基本概念6
  1.2.3 数据仓库的体系结构7
 1.3 数据挖掘8
  1.3.1 KDD与数据挖掘9
  1.3.2 数据库与数据挖掘发展历程11
  1.3.3 数据挖掘的特征与对象12
  1.3.4 数据挖掘相关领域17
 1.4 数据仓库与数据挖掘的关系18
 1.5 应用前景与发展趋势18
 本章小结19
 习题120
第2章 联机分析处理21
 2.1 引言21
 2.2 OLAP的定义21
 2.3 OLAP的相关概念22
 2.4 OLAP与OLTP的关系和比较23
 2.5 OLAP准则25
 2.6 多维数据分析方法25
 2.7 关系数据的组织27
 2.8 多维数据的存储方式30
 2.9 OLAP体系结构32
 2.10 OLAP的展现方式34
 2.11 OLAP工具的评价指标35
 2.12 OLAP的局限性36
 本章小结37
 习题237
第3章 数据仓库的设计与开发39
 3.1 引言39
 3.2 数据仓库的数据模型概述39
 3.3 数据仓库的分析与设计41
  3.3.1 需求分析41
  3.3.2 概念模型设计41
  3.3.3 逻辑模型设计42
  3.3.4 物理模型设计46
  3.3.5 数据仓库的索引技术47
 3.4 数据仓库的开发49
  3.4.1 风险因素49
  3.4.2 数据仓库系统的生命周期49
  3.4.3 建立数据仓库系统的思维模式52
  3.4.4 数据仓库数据库的设计步骤53
  3.4.5 数据质量与数据清洗53
  3.4.6 数据粒度与维度建模54
  3.4.7 选择数据仓库工具55
  3.4.8 提高数据仓库性能55
  3.4.9 数据仓库的安全性56
 3.5 主要的数据仓库产品57
 本章小结58
 习题358
第4章 关联规则60
 4.1 引言60
 4.2 关联规则模型61
 4.3 Apriori算法62
  4.3.1 发现频繁项集62
  4.3.2 生成关联规则67
 4.4 频繁模式增长算法76
  4.4.1 建树方法77
  4.4.2 用FP树挖掘频繁模式78
 4.5 关联规则模型扩展80
  4.5.1 多级关联规则81
  4.5.2 多维关联规则83
 本章小结86
 习题486
第5章 粗糙集88
 5.1 引言88
 5.2 近似空间89
  5.2.1 近似空间与不可分辨关系89
  5.2.2 知识与知识库90
 5.3 近似与粗糙集91
  5.3.1 基本概念91
  5.3.2 基本性质93
 5.4 描述粗糙集的特征的方法95
  5.4.1 近似精度95
  5.4.2 拓扑特征96
 5.5 信息系统97
  5.5.1 信息系统的定义97
  5.5.2 约简和核99
  5.5.3 分辨矩阵与分辨函数100
  5.5.4 信息系统约简101
 5.6 决策表103
  5.6.1 相对约简与知识依赖性103
  5.6.2 决策表及其约简105
  5.6.3 近似约简算法110
  5.6.4 决策规则111
 本章小结112
 习题5113
第6章 决策树115
 6.1 引言115
 6.2 构建决策树的理论问题116
  6.2.1 为当前结点选择属性117
  6.2.2 过拟合问题120
 6.3 ID3算法123
  6.3.1 生成决策树的算法123
  6.3.2 生成规则和决策127
 6.4 决策树的剪枝129
  6.4.1 预剪枝129
  6.4.2 后剪枝130
 6.5 C4.5算法133
 本章小结135
 习题6136
第7章 聚类分析137
 7.1 引言137
 7.2 聚类分析简介137
  7.2.1 聚类分析137
  7.2.2 聚类分析应用领域与算法特征137
 7.3 数据类型、距离和相似系数140
  7.3.1 数据类型140
  7.3.2 距离和相似系数141
 7.4 聚类方法与聚类分类145
  7.4.1 聚类方法145
  7.4.2 聚类方法的分类146
 7.5 划分方法147
  7.5.1 k-均值算法148
  7.5.2 k-中心点算法149
  7.5.3 关于参数K151
  7.5.4 EM聚类152
 7.6 层次方法156
  7.6.1 层次聚类中的距离度量156
  7.6.2 分裂方法157
  7.6.3 凝聚方法157
 7.7 基于密度的方法158
  7.7.1 DBSCAN算法158
  7.7.2 矢量感应聚类算法160
 7.8 聚类评估163
  7.8.1 假设检验164
  7.8.2 聚类评估中的假设检验166
  7.8.3 相对准则169
 本章小结169
 习题7169
第8章 兴趣度量171
 8.1 引言171
 8.2 用于关联规则和分类规则的度量173
  8.2.1 客观度量174
  8.2.2 主观度量181
  8.2.3 语义度量184
 8.3 用于总结的度量186
 8.4 分类器的兴趣度189
 本章小结192
 习题8192
第9章 应用案例194
 9.1 数据仓库应用案例194
  9.1.1 案例一:网络购物数据仓库194
  9.1.2 案例二:社会保障卡数据仓库197
  9.1.3 案例三:医院信息系统数据仓库202
 9.2 数据挖掘应用案例207
  9.2.1 案例一:零售商系统货篮数据挖掘207
  9.2.2 案例二:通信用户满意度指数评测212
  9.2.3 案例三:城市环境质量评价217
 本章小结220
参考文献221

教学资源推荐
作者: (美)Hector Garcia-Molina, Jeffrey D.Ullman, Jennifer Widom
作者: 何宁 黄文斌 熊建强
作者: [英]托马斯 M. 康诺利(Thomas M. Connolly) 卡洛琳 E. 贝格(Carolyn E. Begg)著
参考读物推荐