首页>参考读物>计算机科学与技术>数据库

数据挖掘Clementine应用实务
作者 : 谢邦昌
出版日期 : 2008-04-24
ISBN : 7-111-23577-4
定价 : 69.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 516
开本 : 16开
原书名 :
原出版社:
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

图书特色

图书序言

从事市场调研行业这么多年, 一直都在面临一个挑战: 市场调研公司能够为客户带来什么价值?或者说客户花的钱是否能够得到更高的回报?
  要解决好这个问题, 我想取决于两点: 第一, 提供的数据是准确的; 第二, 能够从这些数据中得到有价值的信息, 从而为客户提供高附加值的服务。
  我们一直在为这两个方面的完善而努力。华通人公司拥有丰富的宏观行业、 企业以及多年来积累下来的调查数据, 我们都坚信这些数据就是一个宝藏, 并且这个宝藏中积累的财富会越来越多。但如何将这些宝藏挖掘出来, 从中得到更高价值的信息, 我们曾经很困惑, 感觉无从下手, 因为这些数据貌似彼此间孤立, 并且摆在一起更显得纷繁复杂。
  直到我们接触到数据挖掘(Data Mining), 这个困扰已久的问题才得以解决, 这都受益于我们与谢邦昌教授进行的深度合作。谢教授作为辅仁大学统计信息学系教授以及中华资料采矿协会理事长, 长期以来从事数据挖掘的理论教学和推广应用工作, 并从最近几年开始, 着力将数据挖掘的理论与方法向大陆学术届和商业应用领域推广。正是在和谢教授的合作中, 我们发现数据挖掘正是我们需要的工具, 我们可以将杂乱无章的数据建立起数据仓库(Data Warehouse), 并在此基础上进行深度挖掘。我们的员工也如获至宝, 开始潜心学习数据挖掘技术, 组成了单独的数据挖掘团队, 不但对我们自己的数据资源进行挖掘, 也将这一技术融入到各个项目中去, 越来越多的数据挖掘技术的应用, 极大提高了项目的质量与水平, 实现了为客户提供高附加值服务的期望。
  我们对数据挖掘如饥似渴, 也认为数据挖掘技术对市场调研行业价值的升华起到了真正意义上的帮助, 但在我们面前还有一个问题, 那就是现在还没有一本优秀的、 基于商业应用的数据挖掘教材。谢教授的这本著作正好解决了这个难题, 这本书深入浅出地讲授了如何实现数据挖掘的商业应用, 书中的例子更是让我们直观地了解了数据挖掘的应用价值。
  我们非常荣幸能够为本书的出版出一份力, 我们公司的数据挖掘团队负责这本书的编著和修改, 以适应读者的阅读习惯和需求。为此他们付出了很多努力, 在这里对他们所做的工作表示感谢, 华通人数据挖掘团队包括——组长: 赵巍, 组员: 池碧云、 付强、 洪晶、 武文捷、 郑韶霞(顺序按拼音首字母排列)。此外,还要感谢参与本书编写工作的郑宇庭、匡宏波两位老师。
  这本书的出版, 是数据挖掘技术普及与推广应用的一个美好开端。

  高余先
  北京华通人商用信息有限公司名誉董事长

作者简介

谢邦昌:暂无简介

推荐序

数据挖掘Clementine: 进入商务智能的钥匙
  “客户”是任何企业或组织的核心所在, 一旦无法对客户提供更高价值或更好的服务, 企业或组织的存在价值必受质疑, 甚至被淘汰, 所以“了解客户”是企业或组织的必要生存之道。在此所指的“客户”并非狭义的局限于民间企业的顾客, 举凡政府单位或研究机构所服务的对象, 均属于此定义之内, 例如, 纳税单位与纳税人, 执法单位与犯罪嫌疑者等。
  谢邦昌教授在数据挖掘领域的理论与实务上做出了卓越的贡献与付出, 他在中国人民大学统计学院及厦门大学计划统计系都成立了Data Mining Center, 同时在两岸成立ChungHwa Data Mining Center, 为华人在Data Mining 的先行者, 他协助高校及企业解决许多数据挖掘的问题及商务智能的开发;     Solvento 集团很早就和谢邦昌教授有着密切的合作。
  Clementine“数据挖掘”软件能利用统计分析与人工智能等技术, 从大量数据中, 把隐藏其内的型式、 关系等有用的信息不断地挖掘出来, 即把数据背后的意涵表现出来, 使“数据会说话”, 而这种意涵在商业上指的是其客户的流失率、 经营的风险, 企业的利润, 在政府部门指的是其服务的质量与绩效的表现, 在人类的日常生活上指的是其智慧的形成与累积。所以, 其应用范围包括客户关系管理(CRM)、 诈欺或犯罪的防患与侦查、 社会族群的行为调查等, 由此可知, 透过不断计算机化的“数据挖掘”流程就能越来越“了解客户”。
  然而, 如何做好“数据挖掘”工作呢?“工欲善其事, 必先利其器”, 我们很感谢谢邦昌教授在很短的时间把最新的Clementine 110版编著出来。相信这本书对在学的学子、 从事研究的老师或研究人员, 以及企业里的专业数据挖掘分析专家, 都会有很大的帮助。我个人乐于推荐。

  周强
  Solvento Technology Group
  中国地区CEO
  推荐序二
  数据挖掘的应用与最佳实践
  今天的企业和组织为了增长业务, 以最低的成本和最少的风险对其客户提供高质量和客制化的服务以及产品, 就有必要做好数字管理, 而要把数字管理做好的最佳实践就是做好数据挖掘工作。在数据挖掘领域, Clementine已经成为许多企业人士和研究人员的首选工具。事实上, 它已不仅是一个工具, 还包含了整个数据挖掘工作的方法论与最佳实践。
  在许多行业领域里, 用数据挖掘技术来实现企业目标已经是很司空见惯的事情,这里列举数据挖掘在以下行业中的应用:
  在制造业, 我们需要从以前粗放式的生产经营模式过度到精细化的生产管理。因此, 在制程上需要在最短时间内提升良品率、 降低成本, 在市场上需要了解客户偏好, 设计最受市场接受的产品; 制定合适的价格, 确保企业利润率; 了解市场需求, 调整生产计划, 优化库存结构; 控制并优化生产制造过程, 提高产品合格率; 评估供应商质量, 提高产品合格率; 评估供应合同和订单违约率, 提高风险控制能力; 了解产品生命周期, 及时调整产销计划。
  在金融行业, 只有在对客户和产品有了全面了解的基础上, 才能提高客户赢取率和挽留率, 以及将客户生命周期的各阶段价值最大化。管理主要的有型与无形资产, 以确保组织拥有健康的财务状况。依据精确计算和集合公司内部的风险测量, 有效改善资本配置、 管理风险。塑造有效的商业策略, 传达使客户立即行动的远景。借助渠道信息、 人力资源、 财务策略和IT基础建设的管理, 导入更有效的商业流程, 以提升股东价值和实现商业目标, 加速获得最大投资回收。
  在电信行业, 快速演变的技术、 微薄的利润及激烈的全球竞争, 意味着电信公司想要生存并成长, 必须要比以往更聪明、 更灵活。彼此连线的运作与复杂技术基础架构等种种措施, 皆对快速、 有效的策略制定造成了庞大障碍。在可预见的未来, 利润将只会来自于那些能够成功带来获利的基础领域:
 增进顾客吸引与挽留的效果。
 将每位顾客关系的价值最大化。
 开发更有效率, 同时更动态的业务流程。
 以正确的效能评量来评估成功。
 以统一的策略方向为中心, 进行组织重整。
  一个好的数据挖掘工具应该具备功能完整、 跨平台、 跨数据库、 数据笔数无上限、 处理速度快、 易整合、 操作使用容易、 价位合理等特点, Clementine正是符合上述特点的数据挖掘工具,并且是居于领导地位的工具。
  SPSS China是拥有丰富统计分析和数据挖掘实施经验的提供商, 致力于把业界数据挖掘的首选工具Clementine的中文版推荐给中国客户。目前正与国内的合作伙伴一道, 致力于金融、 保险、 电信、 政府、 零售、 网站等领域的数据挖掘的推广和应用。中国电信、 中国移动、 中国建设银行、 光大银行、 国家统计局、 信息产业部、 劳动和社会保障局、 太平保险、 南京地税、 摩托罗拉、 上海通用汽车、 可口可乐、 宝洁、 沃尔玛、 好又多、 统一、 TCL等, 这些在中国本土的成功企业和组织背后都有SPSS提供的信息决策解决方案。
  我们和谢邦昌教授在海峡两岸都有合作。这次承蒙谢教授的支持, 在非常短的时间内, 依据Clementine最新版本资料, 编辑成这本书, 相信本书对于数据挖掘应用与实施的推广可以起到推波助澜的效果。

  SPSS China President,Tomas
  2007年2月

图书目录

推荐序一
推荐序二


第1章数据挖掘简介
11何谓数据挖掘
12数据仓库、 KDD、 数据挖掘的关系
13数据挖掘的应用
14数据挖掘的进行步骤
15个案研究
16数据挖掘的分析方法
161分类
162决策树
163回归
164时间序列
165聚类
166关联规则
167顺序规则
168其他分析方法
17数据挖掘的运用理论与实际运用功能
18数据挖掘软件
19数据挖掘在CRM中扮演的角色
191客服中心是顾客关系管理的火
车头
192从客服中心角度看顾客关系
管理
第2章Clementine 110简介
21Clementine的安装与启动
211安装Clementine 110
212启动Clementine 110
22Clementine 110一览
221Clementine 110界面
222在Clementine 110中使用鼠标
223利用快捷键
224Clementine 110中获得帮助
23Clementine选项设置
231系统选项
232默认目录的设置
233用户选项的设置
24Clementine自动化
25Clementine 110版本的新功能
251商业品质的图形展示
252改进的SPSS输出节点
253增强的数据审核节点
254增强的数据变换节点
255优化分块节点
256SPSS转换节点
257改进的数据挖掘模型和算法
258运行效率、 安全性和远程部署
第3章数据挖掘入门
31数据挖掘回顾
32机器学习技术
321神经网络
322规则归纳
323Kohonen网络
324关联规则
325统计模型
326聚类模型
33潜在数据挖掘应用评估
34数据挖掘的策略
35数据挖掘中的小技巧
第4章构建数据流
41概述
42建立数据流
421节点的操作
422数据流的操作
423执行数据流
424保存数据流
425装载文件
426映射数据流
第5章处理缺失值
51概述
52指定缺失值
53处理缺失值
531处理带缺失值的记录
532处理带缺失值的字段
54针对缺失值的CLEM函数
第6章来源节点
61概述
62变量文件节点
63固定文件节点
64为文本区设置数据存储
65数据库节点
651设置数据库节点选项
652添加数据库连接
653选择表
654数据库查询
66SPSS导入节点
67多维数据集导入节点
68SAS导入节点
69Excel输入节点
610用户输入节点
611一般来源节点项目
6111在来源节点中设置数据类型
6112在来源节点处过滤字段
第7章记录操作节点
71概述
72选择节点
73抽样节点
74均衡节点
75聚合节点
76排序节点
77合并节点
771指定合并方法和关键字段
772从合并节点过滤字段
773设置输入顺序并加上卷标
78区分节点
79附加节点
第8章字段操作节点
81概述
82类型节点
821数据类型
822什么是实例化
823读取数据值
824缺失值处理
825检查类型值
826设置字段方向
827复制类属性
83过滤节点
84导出节点
841设置导出节点的基本选项
842导出多重字段
843设置导出规则选项
844设置导出标记选项
845设置导出设置节点选项
846设置导出状态选项
847设置导出计数选项
848设置导出条件选项
85导出节点
86再分类节点
87分块节点
88分割节点
89设置标记节点
810调整节点
811换位节点
812时间间隔节点
813历史节点
814字段记录节点
815SPSS转移节点
第9章建立CLEM 表达式
91什么是CLEM
911值及数据类型
912表达式及条件
92使用表达式编辑器
921获取表达式编辑器
922构造表达式
923选择函数
924选择字段、 参数以及全局变量
925选择变量值
926检查CLEM表达式
93CLEM函数类型
94CLEM的常见用法
941对字符串的操作
942处理空缺和缺失值
943处理数字
944处理时间和日期
第10章图节点
101概述
1011层迭图
1012三维图像
1013动画效果
102建立图
1021为图设置输出选项
1022设置图外观选项
103使用图
104点图节点
1041为点图节点设置选项
1042使用点图
105分布节点
1051设置分布节点选项
1052使用一个分布图
106直方图节点
1061设置直方图节点更多选项
1062使用一个直方图
107堆积图节点
1071设置堆积图节点的更多选项
1072堆积图的使用
108多点图节点
1081为多点图节点设置选项
1082使用一个多点图
109网络图节点
1091设置网络图节点选项
1092设置网络图节点的更多选项
1093网络图节点的外观选项
1010评估图表节点
10101设置评估图表节点选项
10102设置评估图表的更多选项
10103读取模型评估的结果
10104一个评估图表的使用
1011时间序列点图
10111时间序列点图设置选项
10112时间序列点图的显示选项
10113时间序列点图的输出选项
10114使用一个时间序列点图
第11章建模节点
111概述
112建模节点字段选项
113二进位分类节点
1131二进位分类节点模型选项
1132二进位节点的高级选项
1133二进位节点的Discard选项
114神经网络节点
1141神经网络节点模型选项
1142神经网络节点的附加选项
1143神经网络节点高级选项——
快速方法
1144神经网络节点高级选项——
多重方法
1145神经网络节点高级选项——
修剪方法
1146神经网络节点高级选项——
RBFN方法
1147神经网络节点学习比率
115C50节点
1151C50节点模型选项
1152错误归类损失选项
116分类回归树节点
1161分类回归树节点模型选项
1162分类回归树节点高级选项
1163分类回归树节点终止选项
1164分类回归树节点先验概率
选项
117QUEST节点
1171QUEST分类模型选项
1172QUEST高级选项
1173QUEST的成本选项
118CHAID
1181CHAID模型选项
1182CHAID高级选项
1183CHAID的成本选项
119决策表
1191决策表模型选项
1192决策表高级选项
1110Kohonen 节点
11101Kohonen 节点模型选项
11102Kohonen 节点高级选项
1111KMeans节点
11111KMeans 节点型选项
11112KMeans 节点高级选项
1112两步聚类节点
1113时间序列节点
1114异常探测节点
11141异常探测节点模型选项
11142异常节点高级选项
1115Apriori 节点
11151Apriori 节点模型选项
11152Apriori 节点高级选项
1116广义规则归纳节点
1117Carma规则分析
11171Carma规则的模型选项
11172Carma高级选项
1118序列节点
11181序列节点字段选项
11182序列节点模型选项
11183序列节点高级选项
1119因子分析/主成分分析
11191因子分析/主成分分析
模型选项
11192因子分析/主成分分析
高级选项
11193因子分析/主成分分析
旋转选项
1120特征选择节点
11201特征选择节点的模型选项
11202特征选择节点的附加选项
1121线性回归节点
11211线性回归节点模型选项
11212线性回归节点高级选项
11213线性回归节点单步选项
11214线性回归节点输出选项
1122Logistic回归节点
11221Logistic回归节点模型选项
11222Logistic回归节点高级选项
11223Logistic回归节点收敛选项
11224Logistic回归输出选项
1123判别分析节点
11231判别分析节点模型选项
11232判别分析的高级选项
1124广义线性模型
11241广义线性模型选项
11242广义线性模型的高级选项
第12章输出节点
121概述
122使用输出
123输出浏览菜单
124输出节点输出页签
125表格节点
1251表格节点设置页签
1252表格节点格式页签
1253表格浏览器
126矩阵节点
1261矩阵节点设置页签
1262矩阵节点外观页签
1263矩阵输出浏览器
127分析节点
1271分析节点Analysis页签
1272分析输出浏览器
128数据审查节点
1281数据审查节点页签
1282数据审查输出浏览器
129转换节点
1291转换节点设置标签
1292转换输出浏览器
1210统计量节点
12101统计量节点设置页签
12102统计量输出浏览器
1211均值节点
12111均值节点设置标签
12112均值节点选项标签
12113均值节点输出标签
12114均值节点输出浏览器
1212报告节点
12121报告节点模板页签
12122报告节点输出浏览器
1213设置全局节点
1214SPSS 输出节点
12141SPSS 程序节点语法页签
12142SPSS 程序输出浏览器
1215数据库输出节点
1216平面文件节点
1217SPSS 导出节点
1218SAS导出节点
1219Excel导出节点
1220方案发布节点
1221应用软件帮助
第13章生成模型
131概述
132在生成模型选项板中利用生成
模型进行操作
133在数据流中使用生成模型
134使用生成模型浏览器
135生成二进制分类器
136生成网络节点
1361生成的神经网络概要页签
1362从神经网络中生成一个
过滤节点
137生成C50节点
138生成C&R决策树
1381决策树模型页签
1382决策树浏览页签
1383决策树概要页签
1384从决策树生成规则集
139生成QUEST节点
1310生成CHAID节点
1311生成决策表
1312生成Kohonen节点
1313生成KMeans节点
13131生成的KMeans模型页签
13132生成的KMeans概要页签
1314生成两步聚类节点
13141生成的两步聚类模型页签
13142生成的两步概要页签
1315生成时间序列节点
1316生成异常探测节点
1317生成Apriori节点
1318生成GRI节点
1319生成Carma节点
1320生成序列规则序列节点
13201生成的序列规则节点
13202序列规则模型页签
13203序列规则的概要页签
13204从序列规则节点生成规则
超级节点
1321因子分析/主成分分析节点
13211因子分析/主成分分析
模型页签
13212因子分析/主成分分析
概要页签
13213因子分析/主成分分析
高级输出
1322生成特征选择节点
1323Logistic回归方程节点
13231Logistic回归方程概要页签
13232高级Logistic回归输出
1324生成线性回归模型
13241线性回归概要页签
13242线性回归模型的高级输出
1325判别分析
1326广义线性回归模型
1327未精练的规则模型
13271未精练规则的模型页签
13272未精练规则的概要页签
13273生成规则集
1328生成的规则集节点
13281生成的规则集模型页签
13282生成的规则集概要页签
第14章PMML输出模型
141概述
142用PMML输出
第15章超级节点
151概述
152超级节点类型
153创建一个超级节点
1531嵌套超级节点
1532有效超级节点举例
1533无效超级节点举例
154编辑超级节点
1541修改超级节点的类型
1542注释和重命名超级节点
1543超级节点参数
1544超级节点和暂存
1545超级节点和脚本
155保存并装载超级节点
第16章建立项目和报告
161项目介绍
1611CRISPDM浏览窗口
1612Classes浏览窗口
162建立项目
1621增加新项目
1622加入到项目中
1623设置项目属性
1624评注项目
1625对象属性
1626关闭项目
163建构报告
1631生成报告
1632保存和输出报告
第17章批处理模式
171批处理模式一览
172在批处理模式下工作
1721软件调用
1722使用命令行参数
1723批处理模式日志文件
1724批处理模式中的脚本编程
1725在批处理模式中使用参数
1726在批处理模式下输出
第18章Clementine 110中的脚本
编程
181脚本编程介绍
1811脚本类型
1812Clementine脚本范例
182在用户接口上进行脚本编程
1821在流中使用脚本
1822在超级节点中使用脚本
1823使用独立脚本
183以批处理模式编写脚本
第19章Clementine外部模块接口
191概述
192执行CEMI
193系统体系结构
194规范说明文件
1941参数
1942外部程序
1943命令行选项
1944编辑对话框
1945输入和输出字段
1946输入和输出文件
1947元文件
1948结果
1949返回代码
195限制
196规范说明文件范例
1961节点说明
1962核心说明
1963参数
1964执行
1965选项
1966控件
1967输出字段
1968输出数据
1969返回代码
19610完整的规范文件
197CEMI节点管理
1971增加CEMI节点
1972清除CEMI节点
198编写外部程序的技巧
第20章应用范例
201概述
202状态监测范例
2021审视数据
2022数据准备
2023学习
203测试
2031欺诈探测范例
2032数据采集
2033数据探索
2034训练神经网络
2035总结
204零售业范例
2041数据审核
2042学习和测试
205市场购物篮分析范例
2051获取数据
2052购物关联分析
2053客户细分
2054小结
第21章ACMR企业数据库挖掘研究
211研究背景
212操作过程
附录A命令行参数
附录BCLEM 语言参考
附录C脚本语言参考
附录D节点及流属性
附录ECEMI规范文件参考
参考文献
英文参考文献
后记

教学资源推荐
作者: Jeffrey D.Ullman, Jennifer Widom
作者: 朱翠娥 曹彩凤 刘兴林 主编 董超俊 何国辉 主审 李敬民 全萍 司徒伟俊 张胜利 编著
作者: [美] 翟成祥(Chengxiang Zhai) 肖恩·马森(Sean Massung) 著
参考读物推荐
作者: Marlene Theriault, Rachel Carmichael, James Viscusi
作者: 连德富 张富峥 王英子 袁晶 谢幸 编著
作者: 钟鸣 刘晓霞 编著
作者: (美)Kevin Loney Marlene Theriault 等