首页>参考读物>计算机科学与技术>数据库

商务智能与数据挖掘Microsoft SQL Server应用
作者 : 谢邦昌
丛书名 : 原创精品系列
出版日期 : 2008-03-10
ISBN : 7-111-23241-4
定价 : 49.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 342
开本 : 16开
原书名 :
原出版社:
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

相对于其他数据库系统或数据挖掘软件,微软最新推出的数据库系统Microsoft SQL Server借助自带的数据挖掘功能,较好地平衡了企业商务智能方案的性能和价格,因而在业界迅速普及。针对业界实务上的需求,本书主要介绍了如下内容:
  ●数据仓库、数据挖掘与商务智能之间的关系。
  ●Microsoft SQL Server的整体架构、分析服务和报告服务以及Microsoft SQL Server的整合服务和DMX语言。
  ●9种数据挖掘模型:决策树、贝叶斯分类、聚类分析、时序聚类、线性回归、Logistic回归、神经网络、时间序列。

本书给出了丰富的精彩实例,主要包括:
  ●利用聚类分析找出最具有投资价值的企业。
  ●利用决策树模型分析游戏《三国志4》武将数据,找出三国武将特性分布。
  ●利用线性回归分析了解成人血液中的胆固醇是否受体重、血压及年龄的影响,了解来店顾客人数是否受广告促销费用、店面面积以及店铺所在位置的影响。
  ●利用Logistic回归和神经网络分析影响病人肾细胞癌转移的临床病理因素。
  ●利用Logistic回归分析影响高中学生升学的因素。
  ●利用时间序列分析预测中国台湾地区未来的进出口货物价值,了解中国台湾地区未来的进出口货物的成长趋势,以及预测未来用电负荷,来整合整体电力使用规划。

  本书涉及的数据文件可到机工新阅读网站(www.cmpreading.com)和(www.acmr.com.cn/bi)下载。

图书特色

封底文字

相对于其他数据库系统或数据挖掘软件,微软最新推出的数据库系统Microsoft SQL Server借助自带的数据挖掘功能,较好地平衡了企业商务智能方案的性能和价格,因而在业界迅速普及。针对业界实务上的需求,本书主要介绍了如下内容:
  数据仓库、数据挖掘与商务智能之间的关系。
  Microsoft SQL Server的整体架构、分析服务和报告服务以及Microsoft SQL Server的整合服务和DMX语言。
  9种数据挖掘模型:决策树、贝叶斯分类、聚类分析、时序聚类、线性回归、Logistic回归、神经网络、时间序列。
  本书给出了丰富的精彩实例,主要包括:
  利用聚类分析找出最具有投资价值的企业。
  利用决策树模型分析游戏《三国志4》武将数据,找出三国武将特性分布。
  利用线性回归分析了解成人血液中的胆固醇是否受体重、血压及年龄的影响,了解来店顾客人数是否受广告促销费用、店面面积以及店铺所在位置的影响。
  利用Logistic回归和神经网络分析影响病人肾细胞癌转移的临床病理因素。
  利用Logistic回归分析影响高中学生升学的因素。
  利用时间序列分析预测中国台湾地区未来的进出口货物价值,了解中国台湾地区未来的进出口货物的成长趋势,以及预测未来用电负荷,来整合整体电力使用规划。
  本书涉及的数据文件可到华章网站(www.hzbook.com)和(www.acmr.com.cn/bi)下载。

图书序言

从事市场调研行业这么多年,一直都在面临一个挑战:市场调研公司能够为客户带来什么价值?或者说客户花的钱是否能够得到更高的回报?
  要解决好这个问题,我想取决于两点:第一,提供的数据是准确的;第二,能够从这些数据中得到有价值的信息,从而为客户提供高附加值的服务。
  我们一直在为这两个方面的完善而努力。华通人公司拥有丰富的宏观行业、企业以及多年来积累下来的调查数据,我们都坚信这些数据就是一个宝藏,并且这个宝藏中积累的财富会越来越多。但如何将这些宝藏挖掘出来,从中得到更高价值的信息,我们曾经很困惑,感觉无从下手,因为这些数据貌似彼此间孤立,并且摆在一起更显得纷繁复杂。
  直到我们接触到数据挖掘(Data Mining),这个困扰已久的问题才得以解决,这都受益于我们与谢邦昌教授进行的深度合作。谢教授作为辅仁大学统计信息学系教授以及中华资料采矿协会理事长,长期以来从事数据挖掘的理论教学和推广应用工作,并从最近几年开始,着力将数据挖掘的理论与方法向大陆学术届和商业应用领域推广。正是在和谢教授的合作中,我们发现数据挖掘正是我们需要的工具,我们可以将杂乱无章的数据建立起数据仓库(Data Warehouse),并在此基础上进行深度挖掘。我们的员工也如获至宝,开始潜心学习数据挖掘技术,组成了单独的数据挖掘团队,不但对我们自己的数据资源进行挖掘,也将这一技术融入到各个项目中去,越来越多的数据挖掘技术的应用,极大提高了项目的质量与水平,实现了为客户提供高附加值服务的期望。
  我们对数据挖掘如饥似渴,也认为数据挖掘技术对市场调研行业价值的升华起到了真正意义上的帮助,但在我们面前还有一个问题,那就是现在还没有一本优秀的、基于商业应用的数据挖掘教材。谢教授的这本著作正好解决了这个难题,这本书深入浅出地讲授了如何实现数据挖掘的商业应用,书中的例子更是让我们直观地了解了数据挖掘的应用价值。
  我们非常荣幸能够为本书的出版出一份力,我们公司的数据挖掘团队负责这本书的编著和修改,以适应读者的阅读习惯和需求。为此他们付出了很多努力,在这里对他们所做的工作表示感谢,华通人数据挖掘团队包括—组长:赵巍,组员:池碧云、付强、洪晶、武文捷、郑韶霞(顺序按拼音首字母排列)。
  这本书的出版,是数据挖掘技术普及与推广应用的一个美好开端。

  北京华通人商用信息有限公司名誉董事长
  高余先

作者简介

谢邦昌:暂无简介

推荐序

过去20年,企业已累积了大量的商业数据,并运用数据仓库来分析过去的信息,然而,对于过去的了解,并不表示就拥有丰富的商业知识,数据挖掘提供的预测功能,可协助企业洞悉商机,也是现今提升企业竞争力的重要技术。
  要发挥数据挖掘的最大功效,有3项要素不可或缺:了解算法并加以运用、具备Domain Know-How分析对的问题、熟悉工具的使用并与现行系统整合。这本书不但深入浅出地介绍了这些关键要素,还配有范例,帮助读者融会贯通。微软也期望借由Microsoft SQL Server易于建立的、高弹性的平台,让那些过去从未想过使用数据挖掘的企业,通过完善的架构、与IT信息系统深度的整合、搭配完整的分析工具以及Office易于使用的前端接口来建立全新的商业智能系统,从而提升企业利润并有效降低成本。企业可以针对各种常见的商业问题自定义数据挖掘的解决方案。
  谢邦昌教授是数据挖掘领域专家中的专家,听过他演讲的客户都称赞其演讲内容、实际案例分析和技术应用等非常契合企业的需求。而谢邦昌教授对新技术的引进及学习的积极态度, 更让后生晚辈的我们敬佩及推崇。本书由数据仓库、数据挖掘与商业智能概念开始谈起,进而深入地探讨了如何利用Microsoft SQL Server建立数据仓库、数据挖掘与商业智能之平台。期望借由谢邦昌教授对九大算法的精辟介绍及实际案例讲解,并搭配Microsoft SQL Server平民化的价格与易用整合的平台及Office前端,读者能有效达到数据挖掘的三大关键要素,快速进入数据挖掘的神秘殿堂。诚挚推荐这本不可错过的好书。

  微软大中国区 市场战略部
  策略规划经理
  黄淑翠

图书目录

推荐序


第1章  绪论 1
1.1  商业智能 1
1.2  数据挖掘 5
第2章  数据仓库 7
2.1  数据仓库定义 7
2.2  数据仓库特点 7
2.3  数据仓库架构 8
2.4  建立数据仓库的原因和目的 10
2.5  数据仓库的应用 10
2.6  数据仓库的管理 11
第3章  数据挖掘简介 13
3.1  数据挖掘的定义 13
3.2  数据挖掘的重要性 13
3.3  数据挖掘的功能 13
3.4  数据挖掘的步骤 14
3.5  数据挖掘建模的标准CRISP-DM 15
3.6  数据挖掘软件分类 17
3.7  各数据挖掘软件的分析方法简介 18
第4章  数据挖掘中的主要方法 23
4.1  回归分析 23
4.2  关联规则 25
4.3  聚类分析 25
4.4  判别分析 27
4.5  神经网络分析 28
4.6  决策树分析 29
4.7  其他分析方法 30
第5章  数据挖掘与相关领域的关系 32
5.1  数据挖掘与统计分析的不同 32
5.2  数据挖掘与数据仓库的关系 32
5.3  KDD与数据挖掘的关系 33
5.4  OLAP与数据挖掘的关系 34
5.5  数据挖掘与机器学习的关系 34
5.6  Web数据挖掘和数据挖掘有什么不同 35
第6章  SQL Server 2005中的商业智能 36
6.1  SQL Server 2005入门 36
6.2  关联型数据库 37
6.3  Analysis Services 39
第7章  SQL Server 2005中的数据挖掘
功能 43
7.1  创建商业智能应用程序 43
7.2  SQL Server 2005数据挖掘功能的
优势 45
7.3  SQL Server 2005数据挖掘算法 47
7.4  可扩展性 47
7.5  SQL Server 2005数据挖掘功能与商业
智能集成 47
7.6  使用数据挖掘可以解决的问题 48
第8章  SQL Server 2005的分析服务 52
8.1  建立数据源与数据源视图 52
8.2  创建维度和多维数据集 52
8.3  构建和部署 53
8.4  从模板创建可自定义的数据库 53
8.5  统一维度模型 54
8.6  基于属性的维度 54
8.7  维度类型 55
8.8  量度组和透视 56
8.9  计算和分析 56
8.10  MDX脚本 57
8.11  存储过程 58
8.12  关键绩效指标 58
8.13  实时商业智能 59
第9章  SQL Server 2005的报表服务 61
9.1  Reporting Services介绍 61
9.2  为什么使用Reporting Services 61
9.3  使用 Reporting Services 的方式 62
9.4  Reporting Services的功能 62
第10章  决策树模型 66
10.1  基本概念 66
10.2  决策树模型的建立 66
10.3  决策树与判别函数的比较 66
10.4  计算方法 67
10.5  SQL Server 2005操作步骤 69
10.6  范例分析 79
第11章  贝叶斯分类 84
11.1  基本概念 84
11.2  SQL Server 2005操作步骤 86
第12章  关联规则 97
12.1  基本概念 97
12.2  关联规则的种类 98
12.3  关联规则的算法:Apriori 98
12.4  SQL Server 2005操作步骤 99
第13章  聚类分析 111
13.1  基本概念 111
13.2  层次聚类分析 111
13.3  聚类分析原理 112
13.4  SQL Server 2005操作步骤 116
第14章  时序聚类分析 126
14.1  基本概念 126
14.2  相关研究 126
14.3  SQL Server 2005操作步骤 127
第15章  线性回归模型 138
15.1  基本概念 138
15.2  多元回归分析 142
15.3  SQL Server 2005操作步骤 145
15.4  范例分析一 154
15.5  范例分析二 158
第16章  Logistic回归模型 163
16.1  基本概念 163
16.2  logit变换 163
16.3  Logistic分布 164
16.4  列联表中的Logistic回归模型 165
16.5  SQL Server 2005操作步骤 166
16.6  范例分析一 175
16.7  范例分析二 180
第17章  神经网络模型 186
17.1  基本概念 186
17.2  神经网络的特性 187
17.3  神经网络的架构与训练算法 188
17.4  神经网络应用 188
17.5  神经网络优缺点 189
17.6  SQL Server 2005操作步骤 189
17.7  范例分析 199
第18章  时间序列模型 204
18.1  基本概念 204
18.2  时间序列的成分 205
18.3  时间序列数据的图形介绍 206
18.4  利用平滑法预测 210
18.5  用趋势投影预测时间序列 213
18.6  预测含有趋势成分与季节成分的
时间序列 214
18.7  利用回归模型预测时间序列 214
18.8  其他预测模型 215
18.9  单变量时间序列预测模型 215
18.10  时间趋势预测模型 218
18.11  SQL Server 2005操作步骤 219
18.12  范例分析 228
第19章  SQL Server 2005整合服务 232
19.1  SQL Server整合服务(SSIS)介绍 232
19.2  SSIS实例练习 239
第20章  文本挖掘模型 259
20.1  文本挖掘技术的发展 259
20.2  文本分析技术 259
20.3  文本挖掘技术 260
20.4  SQL Server 2005文本挖掘 261
20.5  范例分析 261
第21章  SQL Server 2005的DMX语言 302
21.1  DMX介绍 302
21.2  DMX函数介绍 304
21.3  DMX数据挖掘语法 311
21.4  DMX应用范例 320
第22章  实际案例:聚类分析模型应用 328
22.1  研究背景 328
22.2  分析过程 328
第23章  实际案例:时间序列模型应用 336
23.1  研究背景 336
23.2  分析过程 336

教学资源推荐
作者: 石彦芳 李丹 主编 赵占坤 赵滨 薛玉倩 副主编 周檬 苏默 高秀艳 石建国 参编
作者: 何玉洁 编著
作者: Abraham Silberschatz;Henry F. Korth;S. Sudarshan
作者: (美)Hector Garcia-Molina,Jeffrey D.Ullman,Jennifer Widom
参考读物推荐
作者: Rama Velpuri
作者: Sumit Sarin 钟鸣 孙登峰
作者: (印)普拉莫德 J. 塞得拉吉(Pramod J Sadalage), (美)马丁·福勒(Martin Fowler)著