首页>参考读物>计算机科学与技术>软件与程序设计

SAS金融数据挖掘与建模:系统方法与案例解析
作者 : 陈春宝 徐筱刚 田建中 著
丛书名 : SAS大学技术丛书
出版日期 : 2017-09-28
ISBN : 978-7-111-58047-8
定价 : 59.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 218
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

内容简介
这是一部从实战角度讲解如何利用SAS对金融数据进行挖掘与建模的专著,由SAS大学授权撰写,是SAS大学的指定参考书,也是“SAS大学技术丛书”的第一本书。
全书两条主线:
主线1:金融客户(信贷)的生命周期管理,通过5个具有代表性的案例,讲解了金融客户再获取、提升、成熟、衰退、挽留这5个阶段的关键数据的挖掘与建模方法;
主线2:数据挖掘项目的生命周期管理,把项目生命周期的各个阶段的关键技术和处理方法融入到案例中,串接起一个一个独立、完整的实战场景。
全书一共6章:
第1章介绍了数据挖掘和建模在信贷(信用卡)客户生命周期管理中的15个主要应用场景;
第2章通过信用卡客户反欺诈案例,讲解了如何应用随机森林算法构建欺诈评分模型;
第3章通过信用卡客户精准营销案例,讲解了营销响应模型的构建、评估与应用;
第4章通过信用卡客户细分讲解了完整的聚类过程,对聚类做了最完整的阐释;
第5章通过贷款违约预测案例,为零建模基础的读者提供了一个简化版的行为评分模型;
第6章结合信用卡客户流失预警与挽留案例,讲解了客户价值(数值)预测与流失倾向(事件)预测两类问题的组合建模与应用。
不拘泥于方法本身,彰显了以企业实际运用为导向的写作思路,让案例更具实用参考价值。五个案例之后,你会发现这些方法和模型在大部分业务场景中似曾相识,金融企业数据挖掘与建模将变得迎刃而解。

图书特色

SAS大学授权编写,SAS大学指定参考书!
以金融客户生命周期管理为主线,纯实战导向,通过5个经典案例详细讲解金融数据挖掘与建模的方法与技巧
如何挖掘数据资产,并应用于业务实践,产生价值,需要一套系统的方法和工具,本书正好结合具体的案例,深入浅出地回答了这个问题,对从事大数据分析与挖掘的数据人有很好的参考价值。
—— 郑承满 厦门银行CIO

数字化是银行经营客户的趋势,数据分析和应用的变现能力是核心。本书归纳了客户数字化经营的主要场景,并选取代表性案例进行了剖析和介绍,对从业人员授之以渔,值得推荐。
—— 杨志敏 浦发银行零售业务管理部副总经理

把数据挖掘比作一场猎取宝藏的屠龙之旅,却有太多故事将屠龙之术浓墨重彩于宝藏之瑰丽或神兵之锋利。而本书更像是作者把他们亲历的一次次真实冒险娓娓道来,把读者带入一个个真实的场景,与作者一起面临险境,审时度势,化险为夷。历经百转千回才得峰回路转,柳暗花明。一气读完,顿觉身上的行囊充实了许多,远处宝藏的光辉也真实了几分,便急不可耐地踏上了新的冒险旅程。
—— 王晓 太平洋人寿保险客户资源整合部高级经理

写法化繁为简,案例源自实践,很多分析方法和代码可以直接复用,对挖掘建模人员具有很强的导向性和启发性,无论使用SAS或开源工具,都能从分析思路中受益。
—— 钟飞 蚂蚁金服风控策略专家

这是一套涵盖SAS编程语言、SAS应用实操、SAS统计理论分析的工具书,内容专业精深,语言浅显易懂,案例贴近热点业务需求,真可谓一套心血之作、诚意之品、价值之典!
—— 万平 平安银行总行大数据决策管理部


作者简介
陈春宝 上海交通大学工业工程博士,现任职于某商业银行,担任大数据专家。在银行、信用卡、医药与电信等行业拥有十年数据挖掘与建模经验,工作跨大数据、营销、风控、运营等多个领域,擅长诊断各类业务问题,应用商业和大数据手段获得创新性的解决方案并有效实施。曾担任美国管理科学协会咨询顾问、交通银行信用卡中心数据分析经理、上海交大工程硕士企业导师。
著有《大数据与机器学习:实践方法与行业案例》一书,在SCI&EI索引期刊发表论文10余篇。
徐筱刚 上海某金融机构高级数据分析师,具有深厚的数理统计与应用数据分析专业背景,8年数据分析与挖掘从业经验,曾就职于零售企业、咨询公司等,独立或带团队完成零售、电信、金融等多个大型数据挖掘项目。
田建中 北京师范大学管理学硕士,先后在电信业、银行业从事数据仓库建设、数据建模咨询等工作,对数据挖掘在营销中的应用有深入研究,拥有10多年的SAS开发经验。曾就职于河北移动、美商天睿有限公司,现就职于某大型商业银行大数据管理部,从事数据挖掘、业务用例研究及营销体系建设等工作。

内容简介
这是一部从实战角度讲解如何利用SAS对金融数据进行挖掘与建模的专著,由SAS大学授权撰写,是SAS大学的指定参考书,也是“SAS大学技术丛书”的第一本书。
全书两条主线:
主线1:金融客户(信贷)的生命周期管理,通过5个具有代表性的案例,讲解了金融客户在获取、提升、成熟、衰退、挽留这5个阶段的关键数据的挖掘与建模方法;
主线2:数据挖掘项目的生命周期管理,把项目生命周期的各个阶段的关键技术和处理方法融入到案例中,串接起一个一个独立、完整的实战场景。
全书共6章:
第1章介绍了数据挖掘和建模在信贷(信用卡)客户生命周期管理中的15个主要应用场景;
第2章通过信用卡客户反欺诈案例,讲解了如何应用随机森林算法构建欺诈评分模型;
第3章通过信用卡客户精准营销案例,讲解了营销响应模型的构建、评估与应用;
第4章通过信用卡客户细分讲解了完整的聚类过程,对聚类做了最完整的阐释;
第5章通过贷款违约预测案例,为零建模基础的读者提供了一个简化版的行为评分模型;
第6章结合信用卡客户流失预警与挽留案例,讲解了客户价值(数值)预测与流失倾向(事件)预测两类问题的组合建模与应用。
不拘泥于方法本身,彰显了以企业实际运用为导向的写作思路,让案例更具实用参考价值。5个案例之后,你会发现这些方法和模型在大部分业务场景中似曾相识,金融企业数据挖掘与建模将变得迎刃而解。

图书前言

古之欲明德于天下者,先治其国;欲治其国者,先齐其家;欲齐其家者,先修其身;欲修其身者,先正其心;欲正其心者,先诚其意;欲诚其意者,先致其知;致知在格物。
——《礼记》  

知之真切笃实处即是行,行之明觉精察处即是知。
——王阳明  

大数据势不可挡。然而,对于多数公司来说,数据分析和建模能力尚未完全发展起来,虽主观意识上认同了大数据的潜在价值,也开始采集、储备数据,却不知如何才能让数据充分融入业务、帮助业务部门达成业务指标。
大数据是一种全新的业务和产品创新思维,是海量数据存储和计算的基础架构,但小数据的分析运用才是多数公司和业务领域必须关注和掌握的核心能力。本书将聚焦于实践应用,介绍数据分析、建模的方法和在业务领域的实际应用,原理和基础理论知识不是重点,因此数学公式极少,除非它比文字更能表达内容。总体上,本书不会详细罗列最热门的机器学习算法、数据挖掘方法以及人工智能,而是基于金融企业当前的实际需要,精选最具代表性的业务领域以及被广泛验证实用高效的分析建模技术,这些技术是数据分析人员必须掌握的技能。本书同时也是为掌握统计学知识和基本数据分析方法的业务专家所写,帮助他们实践、应用数据建模手段,提升对业务的引导和驾驭能力。
本书的目标读者是高级数据分析师、咨询顾问、企业内部的业务专家、高校学者和研究生,以及立志于夯实数据建模基本功,并希望不断提升的数据挖掘与数据建模人员。
内容提要
知者过之,愚者不及也;贤者过之,不肖者不及也。
——《中庸》  

在学校和生活中,工作的最重要的动力是工作中的乐趣,是工作获得结果时的乐趣以及对这个结果的社会价值的认识。
——阿尔伯特·爱因斯坦  

本书是一本介绍金融企业数据建模的专著。在内容上,书中以信贷(信用卡)客户的生命周期管理为主线,选取了5个在客户获取、提升、成熟和衰退环节的最经典的金融企业案例,来详细介绍最具价值与实用性的数据建模过程,每个案例既自成体系又前后呼应。
第1章介绍了数据挖掘和建模在信贷(信用卡)客户生命周期管理中的应用场景。
第2章结合信用卡客户反欺诈案例,介绍了常用的三类反欺诈手段以及欺诈评分模型的构建过程,模型采用机器学习集成算法的典范——随机森林,并给出SAS代码(各类书中绝无仅有),对回归类、决策树类、神经网络类三大类机器学习算法做了比对。
第3章结合信用卡客户精准营销案例,介绍了营销响应模型的构建、评估与应用,完整阐述从数据准备、清洗、变量粗筛选、变量压缩与转换、建模、模型评估、部署、监测与更新等模型构建过程中所涉及的操作方法。
第4章通过信用卡客户细分案例,介绍了完整的聚类过程,除快速、系统、两步聚类算法外,还详细介绍了实际分析过程中必不可少的数据预处理过程,并对聚类模型做了最完整的阐释。
第5章通过贷款违约预测案例,为零建模基础的读者提供了一个最简化的行为评分模型的构建过程,帮助零基础读者快速上手,同时简单介绍了金融企业的三大风险模型(评分卡)。
第6章结合信用卡客户流失预警与挽留案例,介绍客户价值(数值)预测与流失倾向(事件)预测两类问题的建模过程及组合应用,不拘泥于方法本身,彰显了以企业实际运用为导向的写作思路,让案例更具实用参考价值。
了解完五个案例之后,你会发现这些方法和模型在大部分业务场景中似曾相识,金融企业的数据挖掘与建模将变得易如反掌。
全书由陈春宝统稿,其中,第1、2、5、6章由陈春宝撰写,第3章由徐筱刚撰写,第4章由田建中撰写。
源代码下载
若你对书中源代码感兴趣,可与作者联系,邮箱:64346837@qq.com。

上架指导

计算机\数据挖掘

封底文字

如何挖掘数据资产,并应用于业务实践,产生价值,需要一套系统的方法和工具,本书正好结合具体的案例,深入浅出地回答了这个问题,对从事大数据分析与挖掘的数据人有很好的参考价值。
——郑承满 厦门银行CIO
数字化是银行经营客户的趋势,数据分析和应用的变现能力是核心。本书归纳了客户数字化经营的主要场景,并选取代表性案例进了行剖析和介绍,对从业人员授之以渔,值得推荐。
——杨志敏 浦发银行零售业务管理部副总经理
把数据挖掘比作一场猎取宝藏的屠龙之旅,却有太多屠龙之术浓墨重彩于宝藏之瑰丽或神兵之锋利。而本书更像是作者把他们亲历的一次次真实冒险娓娓道来,把读者带入一个个真实的场景,与作者一起面临险境,审时度势,化险为夷。历经百转千回才得峰回路转,柳暗花明。一气读完,顿觉身上的行囊充实了许多,远处宝藏的光辉也真实了几分,便急不可耐的踏上了新的冒险旅程。
——王晓 太平洋人寿保险客户资源整合部高级经理
写法化繁为简,案例源自实践,很多分析方法和代码可以直接复用,对挖掘建模人员具有很强的导向性和启发性,无论使用SAS或开源工具,都能从分析思路中受益。
——钟飞 蚂蚁金服风控策略专家
这是一套涵盖SAS编程语言、SAS应用实操、SAS统计理论分析的工具书,内容专业精深,语言浅显易懂,案例贴近热点业务需求,真可谓一套心血之作、诚意之品、价值之典!
——万平 平安银行总行大数据决策管理部

作者简介

陈春宝 徐筱刚 田建中 著:
陈春宝 先后获得了经济学硕士和工业工程博士学位,拥有10年数据分析及应用经验,目前任职于股份制商业银行总行。在数据挖掘、机器学习和业务咨询方面有着独到的见解,他的工作跨大数据、营销、风险、运营等多个领域,擅长诊断各类业务问题,应用商业和数据分析手段获得创新性的解决方案,并帮助业务部门有效实施。

图书目录

赞誉

前言
第1章 金融数据挖掘与建模应用场景 1
1.1 客户数据挖掘的价值 1
1.2 金融客户生命周期及数据应用场景 3
1.3 最具代表性的数据应用场景 7
第2章 客户获取:信用卡客户欺诈评分案例 8
2.1 案例背景 9
2.2 数据准备与预处理 10
2.2.1 数据源 10
2.2.2 变量设计 11
2.3 构建评分模型 13
2.3.1 算法选择 13
2.3.2 模型训练 14
2.3.3 模型评估 16
2.4 评分模型的应用 19
2.5 小结 20
第3章 客户提升:信用卡客户精准营销案例 21
3.1 案例背景 21
3.2 建模准备 21
3.2.1 准备数据 22
3.2.2 数据预处理 26
3.2.3 过度抽样 27
3.2.4 构造训练集及测试集 30
3.3 数据清洗及变量粗筛 32
3.3.1 连续变量与连续变量之间 33
3.3.2 分类变量和分类变量之间 39
3.3.3 分类变量和连续变量之间 43
3.3.4 数据的错误及缺失值 47
3.3.5 数据离群值 53
3.3.6 重编码 59
3.4 变量压缩与转换变量 61
3.4.1 分类变量的水平数压缩 61
3.4.2 连续变量聚类 65
3.4.3 连续变量的分箱 77
3.4.4 变量的转换 79
3.5 模型训练 80
3.5.1 关于Logistic回归 80
3.5.2 变量筛选方法 81
3.6 模型评估 88
3.6.1 模型估计 88
3.6.2 模型评估 89
3.6.3 调整过度抽样 98
3.6.4 收益矩阵 98
3.6.5 模型转换为打分卡 100
3.7 模型的部署及更新 100
3.7.1 模型的部署 100
3.7.2 模型的监测及更新 101
3.8 本章小结 103
第4章 客户成熟:银行零售客户渠道偏好细分案例 104
4.1 案例背景 104
4.2 聚类分析流程 105
4.3 数据标准化 107
4.3.1 标准化介绍 107
4.3.2 标准化实现 110
4.4 变量聚类 111
4.4.1 变量聚类介绍 111
4.4.2 变量聚类基本步骤 112
4.4.3 SAS实现变量聚类 113
4.5 变量降维与可视化 118
4.5.1 图形化探索 118
4.5.2 主成分分析法降维 120
4.6 ACECLUS预处理过程 123
4.6.1 ACECLUS介绍 123
4.6.2 ACECLUS过程 123
4.6.3 ACECLUS示例 123
4.7 系统聚类分析 128
4.7.1 系统聚类法 128
4.7.2 样本与样本之间的度量 129
4.7.3 距离定义与测量 129
4.7.4 相关系数 131
4.7.5 类与类之间的度量 131
4.7.6 系统聚类法 139
4.7.7 不同系统聚类法之间的比较 140
4.7.8 类个数的确定 158
4.8 快速聚类 159
4.8.1 快速聚类法 159
4.8.2 快速聚类法实现 160
4.8.3 快速聚类法优缺点 161
4.9 两步聚类法 161
4.9.1 两步聚类法 161
4.9.2 两步聚类法实现 161
4.10 本章小结 167
第5章 客户衰退:银行贷款违约预测案例 168
5.1 案例背景 169
5.2 维度分析 170
5.3 建模分析 177
5.4 业务应用 179
5.5 小结 179
第6章 客户挽留:信用卡客户流失管理案例 180
6.1 案例背景 181
6.2 数据准备 182
6.2.1 设定目标变量 182
6.2.2 设定时间窗 183
6.2.3 设计预测变量 184
6.2.4 准备数据宽表 185
6.3 流失倾向预警:用Logistic回归构建响应率模型 186
6.3.1 粗分类 187
6.3.2 计算分组变量的WOE值和IV值 191
6.3.3 共线性检验 194
6.3.4 模型训练:显著性检验 195
6.3.5 模型评估 196
6.4 潜在客户价值预测:两阶段建模法 201
6.4.1 阶段1概率预测 201
6.4.2 阶段2 数值预测 201
6.4.3 模型评估 203
6.5 细分:差异化营销服务的基础 204
6.6 小结 208

教学资源推荐
作者: [丹]弗莱明·尼尔森(Flemming Nielson),[丹]汉内·里斯·尼尔森(Hanne Riis Nielson),[英]克里斯·汉金(Chris Hankin) 著
作者: [美]布鲁斯·埃克尔(Bruce Eckel) 戴安娜·马什(Dianne Marsh) 著
作者: 杨颂华 熊海灵 主编 杨明 黄春伦 等编著
参考读物推荐
作者: [美] 比尔·瓦格纳(Bill Wagner) 著
作者: 孟德国 王耀龙 周金利 黎欢 著
作者: 王宇韬 房宇亮 肖金鑫 编著