首页>参考读物>计算机科学与技术>数据库

数据挖掘基础与应用(SQL Server 2008)
作者 : 谢邦昌 编著
出版日期 : 2011-11-07
ISBN : 978-7-111-36073-5
定价 : 45.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 291
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

本书首先系统介绍了数据挖掘技术,然后虚拟一个“邦邦超市”,通过使用SQL语言建立该超市的数据库并对数据的进行操作,再进一步利用SQL Server 2008的数据挖掘模型对超市积累的数据进行挖掘,以实际例子帮助读者迅速理解并掌握数据挖掘技术、学会使用SQL Server 2008 提供的Data Mining工具、提高零售企业的信息利用能力和经营水平。

图书特色

本书首先系统介绍了数据挖掘和数据仓库的概念和知识点,然后虚拟一个“邦邦超市”,通过使用SQL语言建立该超市的数据库并对数据的进行操作,再进一步利用SQL Server 2008的数据挖掘模型对超市积累的数据进行挖掘,以实际例子帮助读者迅速理解并掌握数据挖掘技术,学会使用SQL Server 2008 提供的数据挖掘工具,提高零售企业的信息利用能力和经营水平。

本书特点:

● 介绍数据挖掘和数据仓库的基本概念和知识点。
● 贴近中小企业和卖场的实际应用需求。
● 用商务智能和SQL Server帮助企业解决实际经营中面临的决策问题。
● “邦邦超市”的实际案例贴近生活,适合学习和研究商务智能应用的读者以此作为实用的参考。
● 作者在统计学和数据挖掘、商务智能等领域有多年的研究和应用实践指导,在两岸学术界和企业
  界具有相当的知名度。
● 机工新阅读网站(www.cmpreading.com)提供原始示例文件下载。

图书前言

随着时代的进步,大型超市已经成为生活中不可或缺的一部分,逛大型超市购物已经成为城市居民日常的生活习惯,食品、衣服和众多的百货在各大超市一应俱全。近年来,超市如雨后春笋般一间间地崛起,目前主要以沃尔玛、家乐福、华润和华联为主,彼此之间的竞争与合作、合纵连横不言而喻。
  每逢特定节假日超市都会有相应的促销活动。例如年终时节,各超市都会推出迎春节减价拼人气促销活动:各式各样折扣的节庆礼包,同时通过在超市现场歌舞表演和各种抽奖活动吸引人潮进行宣传。各超市都强调绝对是当地最低价,有的超市推出数十款春节特色礼包,礼包价格较之单独购买商品便宜许多,可以使过年送礼的消费者节省开支。此外,为争取业绩及方便白天上班的客户购物,超市还在节日期间推迟打烊时间。超市会在开学前主推3C、文具等开学用品,因为这时台式机、笔记本电脑的需求量几乎是平时的3倍。超市纷纷祭出低价、赠品大放送策略,同时也搭配买千送百、分期0利率、红利积点等促销手段。
  消费者购物的行为特点有超市化、周末化、全家化、休闲化、省钱化、冲动化、M型化与会员化的特点。对超市卖场来说,数据挖掘的新兴技术和商务智能的运用更是日趋重要。要从每天涌进数十万、甚至数百万的交易订单里,挖掘出有意义的商业信息,数据挖掘这一新兴科学在客户关系管理中扮演了关键的角色。不论是从关联规则看购物篮分析、从聚类分析看客户市场细分、从时间序列看未来销售量趋势,还是从决策树、罗吉斯回归、类神经网络等看潜在客户的预测,这些都是超市在市场营销中非常重要的科学技术。因此,本书将以Microsoft SQL Server 2008数据库系统,虚拟的邦邦超市为例,介绍SQL的基本语法,循序渐进地告诉读者如何从海量的数据中整理数据、创造有意义的新变量,将会员基本数据和订单数据合并成为待分析的数据样本以计算重复购买率、会员贡献度及会员流失率,以及利用SQL的数据挖掘技术解决实务的问题。盼读者慢慢品味,感受到作者的用心。

上架指导

计算机\数据库

作者简介

谢邦昌 编著:本书首先系统介绍了数据挖掘和数据仓库的概念和知识点,然后虚拟一个“邦邦超市”,通过使用SQL语言建立该超市的数据库并对数据的进行操作,再进一步利用SQL Server 2008的数据挖掘模型对超市积累的数据进行挖掘,以实际例子帮助读者迅速理解并掌握数据挖掘技术,学会使用SQL Server 2008 提供的Data Mining工具,提高零售企业的信息利用能力和经营水平。 本书具有以下特点: 介绍数据挖掘和数据仓库的基本概念和知识点贴近中小企业和卖场的实际应用需求,用BI和SQL Server帮助它们解决实际经营中面临的决策问题。 “邦邦超市”的实际案例贴近生活,适合学习和研究BI应用的读者以此作为实用的参考。作者在统计学和数据挖掘、BI等领域有多年的研究和应用实践指导,在两岸学术界和企业界具有相当的知名度。华章公司网站(www.hzbook.com)提供原始示例文件下载。 谢邦昌教授简介 谢邦昌教授,台湾大学生物统计学博士、 现任台湾辅仁大学统计资讯学系教授、台湾辅仁大学管理学院商学所所长、中华资料采矿协会理事长、台北市政府市政顾问。他还担任中华人民共和国国家统计局教材编审委员,厦门大学经济学院计划统计系讲座教授、博士生导师,同时是中国人民大学统计学院、中央财经大学统计学院等国内许多著名高校的客座教授。 谢邦昌教授是台湾数据挖掘界的领军人物及世界知名统计学家,长久以来致力推动两岸商务智能、数据挖掘和统计应用研究的发展。目前的研究方向主要集中在生物统 计、抽样调查设计、统计预测模型、数据挖掘,特别是数据挖掘与商务智能在企业中的应用研究。先后公开发表有关数据挖掘、预测模型、市场调查等方面的论文130余篇,出版统计学相关学术专著40余部。

图书目录

前言
第1章 数据挖掘与数据仓库 1
1.1 数据挖掘简介 1
1.1.1 数据挖掘的定义 1
1.1.2 数据挖掘的重要性 1
1.1.3 数据挖掘的功能 1
1.1.4 数据挖掘的步骤 2
1.1.5 数据挖掘建模的标准CRISP-DM 2
1.2 商务智能简介 4
1.2.1 商务智能 4
1.2.2 商务智能的定义 4
1.2.3 商务智能的架构 5
1.2.4 商务智能的实施流程 5
1.3 数据挖掘与其他相关领域的关系 6
1.3.1 数据挖掘与统计分析的不同 6
1.3.2 数据挖掘与数据仓库的关系 6
1.3.3 KDD与数据挖掘的关系 7
1.3.4 在线分析处理(OLAP)与数据挖掘的关系 7
1.3.5 数据挖掘与机器学习的关系 8
1.3.6 Web挖掘和数据挖掘有什么不同 8
1.4 数据挖掘在客户关系管理中的应用 9
1.4.1 客户关系管理(CRM) 9
1.4.2 客户关系管理指标 10
1.4.3 数据挖掘应用于各行业 13
1.4.4 客户市场细分 14
1.4.5 交叉销售 15
1.4.6 客户关系管理四大循环过程 15
1.4.7 数据库营销 16
1.5 数据仓库定义 17
1.5.1 数据仓库特性 17
1.5.2 数据仓库架构 18
1.5.3 构建数据仓库的原因 19
1.5.4 构建数据仓库的主要目的 19
1.5.5 数据仓库的应用 20
1.5.6 数据仓库的管理 20
1.6 数据挖掘工具分类 21
1.6.1 数据挖掘工具 21
1.6.2 各工具的简介 21
第2章 SQL语言介绍及其实例 22
2.1 SQL简介及数据变量来源说明 22
2.1.1 何谓SQL 22
2.1.2 各数据文档变量说明 23
2.2 SQL基本语法介绍 25
2.3 会员基本资料整理 40
2.3.1 查询县市别填答状态 40
2.3.2 婚姻状态 42
2.4 会员基本变项 43
2.4.1 性别 43
2.4.2 交易周期性变化 49
2.4.3 会员在交易时的年龄及婚姻状态 52
2.4.4 会员交易金额及红利积点次数分配百分比 55
2.4.5 平均交易间隔时间 59
2.5 产品组合 62
2.5.1 按照产品编号排行榜 63
2.5.2 单项产品的排行榜 68
2.5.3 重复购买率 71
2.6 会员流失率 79
2.7 会员贡献度 83
第3章 SQL Server 2008的数据挖掘模型在零售业中的应用 86
3.1 实际案例练习 86
3.1.1 数据挖掘Microsoft决策树 87
3.1.2 数据挖掘Microsoft罗吉斯回归 90
3.1.3 数据挖掘Microsoft类神经网络 93
3.1.4 数据挖掘Microsoft贝氏概率分类 97
3.2 潜在客户预测模型 99
3.2.1 潜在客户预测流程图 99
3.2.2 交易频率趋势图 100
3.2.3 交易频率语法 101
3.3 模型建构 102
3.3.1 SSIS操作流程 102
3.3.2 SSAS操作流程 113
3.3.3 数据挖掘Microsoft决策树模型建构 118
3.3.4 数据挖掘Microsoft罗吉斯回归模型建构 128
3.3.5 数据挖掘Microsoft类神经网络及贝氏概率模型建构 130
3.3.6 模型比较 132
3.4 数据挖掘Microsoft时间序列 140
3.4.1 基本概念 140
3.4.2 时间序列的成分 142
3.4.3 时间序列数据的图形介绍 143
3.4.4 利用修匀法预测 147
3.4.5 用趋势投射预测时间序列 150
3.4.6 预测含趋势与季节成分的时间序列 151
3.4.7 利用回归模型预测时间序列 152
3.4.8 其他预测模型 153
3.4.9 模型单变量时间序列预测模型 153
3.4.10 时间趋势预测模型 155
3.4.11 范例操作 156
3.5 数据挖掘Microsoft聚类分析 165
3.5.1 基本概念 165
3.5.2 范例操作 167
3.6 数据挖掘Microsoft线性回归 182
3.6.1 基本概念 182
3.6.2 简单线性回归分析 184
3.6.3 多元回归分析 184
3.6.4 岭回归分析 184
3.6.5 范例操作 185
3.6.6 补充(测试集数据汇出) 205
3.7 数据挖掘Microsoft关联规则 208
3.7.1 基本概念 208
3.7.2 关联规则的种类 209
3.7.3 关联规则的算法:Apriori算法 209
3.7.4 关联规则DMX数据挖掘语法 210
3.8 数据挖掘Microsoft时序群集 211
3.8.1 基本概念 211
3.8.2 相关研究 211
3.8.3 时序群集DMX数据挖掘语法 212
第4章 OLAP在零售业中的应用 214
4.1 数据仓库 214
4.2 实例操作 217
4.2.1 数据来源检查 217
4.2.2 创建命名查询(VIP会员数据) 222
4.2.3 编辑命名查询(VIP产品组成货号) 224
4.2.4 编辑命名查询(VIP订单明细表) 225
4.2.5 编辑命名查询(VIP订单数) 225
4.2.6 编辑命名查询(VIP购买产品) 225
4.2.7 编辑命名查询(VIP会员数) 226
4.3 维度设计 227
4.4 建立多维数据集 238
4.4.1 对企业的价值 238
4.4.2 数据储存的选择性 239
4.4.3 实例操作 240
4.5 数据模拟及相关数据明细 249
第5章 Excel中的数据挖掘模块 253
5.1 安装与设定数据挖掘加载宏 253
5.1.1 系统需求 253
5.1.2 开始安装 253
5.1.3 完成安装检查 256
5.1.4 状态设定 256
5.1.5 设定完成检查 259
5.2 Excel 2007数据挖掘工具列介绍 260
5.2.1 数据挖掘使用帮助 260
5.2.2 数据挖掘连接设定 261
5.2.3 设定目前的连接 261
5.2.4 跟踪 263
5.2.5 数据准备 263
5.2.6 浏览数据 263
5.2.7 清除数据 266
5.2.8 为数据分区 267
5.2.9 数据建模 270
5.2.10 准确性和验证 270
5.2.11 精确度图表 270
5.2.12 分类矩阵 271
5.2.13 利润图 272
5.2.14 模型使用方法 272
5.2.15 浏览 272
5.2.16 查询 275
5.2.17 模型管理 275
5.2.18 重命名此挖掘结构 276
5.2.19 删除此挖掘结构 276
5.2.20 清除此挖掘结构 276
5.2.21 使用原始数据处理此挖掘结构 277
5.2.22 用新数据处理此挖掘结构 277
5.2.23 导出此挖掘结构 278
5.2.24 导入 278
附录 279

教学资源推荐
作者: 丁兆云 周鋆 杜振国 著
作者: 杨佩理 陶瑜
作者: 试题研究编写组