首页>参考读物>计算机科学与技术>人工智能

可解释机器学习:模型、方法与实践
作者 : 索信达控股 邵平 杨健颖 苏思达 等 著
出版日期 : 2021-11-23
ISBN : 978-7-111-69571-4
定价 : 79.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 223
开本 : 32
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

本书先从背景出发,阐述黑盒模型存在的问题以及不解决黑盒问题模型可能带来的后果,引出可解释机器学习的重要性;随后,我们从可解释机器学习的研究方向,分为内在可解释模型算法和模型事后解析方法两部分进行介绍,阐述不同模型的原理、应用及其可解释性。z后通过三个不同的应用场景,介绍在银行实战中的数据挖掘方法,由问题、处理方法出发,结合可解释机器学习模型结果,证明模型的有效性和实用性,期望读者通过对本书的阅读,可以更快更好的解决实际业务问题,而非纸上谈兵。业务场景均为业内的典型案例,希望能够对读者有所启发。同时,本书中还会有大量的公式与代码,保证内容的丰富与严谨,经得起推敲,使得读者知其然且知其所以然。

图书特色

国内金融人工智能一线团队倾力打造,追踪最前沿的研究进展,
全面、系统地介绍了可解释机器学习模型及方法。
以金融行业数字化转型面临的实际问题为背景,
创造性地应用可解释机器学习技术,成功突破人工智能算法进一步发展壮大的应用壁垒。

图书前言

为什么要写这本书
2018年,索信达正式成立金融AI实验室,开始研究和探索人工智能技术在金融行业中的应用。在与学术界领先学者合作和交流的过程中,我们开始接触可解释机器学习。通过数年的研究和实践,我们发现可解释机器学习恰好能够弥补当下人工智能技术在金融业应用中的不足。现今,深度学习、集成学习等复杂机器学习算法大行其道,银行里的营销模型、风控模型几乎全都顺应了这个大的技术潮流,虽然模型的精准性已有了较大的提升,但是业务应用风险却如影相随,模型的黑盒属性导致模型结果在业务应用上不具备清晰的逻辑和可解释性。模型是否存在偏见,何时适用,该如何使用?很多问题都是模糊不清的。
对于金融等风险控制严格的领域,如果要应用黑盒模型,我们必须慎之又慎。索信达作为一家深耕金融领域数据解决方案的提供商,一直都在致力于追求对行业问题保持前瞻性的洞察力,这也是金融人工智能实验室成立的初衷和意义所在。可解释机器学习在学术界尚属新兴事物,在国内金融领域的应用更是寥寥无几,知者甚少,但是可解释机器学习对于金融业规范、合理、安全地使用人工智能技术的价值和意义却是非凡的。2021年初,中国人民银行正式出台《人工智能算法金融应用评价规范》,这说明国家监管部门和行业专家已经意识到人工智能算法在金融领域中的应用存在乱象和潜在风险,并对此提出了严格的评价规范。在这个评价标准下,对于未来人工智能技术在金融领域的应用,可解释机器学习无疑会是大势所趋。索信达正好站在了引领潮流的当口,有过可解释机器学习在银行业的成功实践。例如,在客户流失预警问题的场景中,我们创造性地运用可解释机器学习,真正做到了对单个客户流失原因的归因,大大提升了潜在流失客户的挽留率。在促活营销场景中,利用可解释机器学习输出的客户名单的营销转化率提升了3倍。取得这些令人兴奋的成果之后,我们想要让整个金融业意识到可解释机器学习的价值的使命感油然而生,于是便有了写作这本书的动机,希望将这几年在可解释机器学习方面的研究,以及将其应用在银行业的实践经验分享给大家,更希望人工智能技术能够持续助力金融业健康繁荣发展。作为一家金融科技公司,索信达也希望能够为行业的发展贡献自己的一份力量!
读者对象
金融机构、银行、金融科技公司等数据技术相关岗位从业者。
人工智能、机器学习、数据挖掘相关技术岗位从业者。
人工智能、机器学习、大数据相关专业的院校研究生、本科生。
如何阅读本书
本书共分为三大部分,具体内容结构如下。
第一部分为背景(第1~2章)。由于可解释机器学习在业内属于新兴知识,因此本部分用两章的篇幅,以各种生动的例子,阐述可解释机器学习的背景和重要性,帮助读者建立对可解释机器学习的初步印象。
第二部分为理论(第3~4章)。本部分主要按照可解释机器学习已有的分类,从内在可解释和事后可解释两个方面来介绍本领域的常见模型,其中既包括传统的统计学模型,又包括学术界新提出来的一些模型。本部分内容可以让读者对目前已存在的各种可解释机器学习算法有一个详细的了解,并且能够让读者参照示例代码自己动手实践。
第三部分为实例(第5~7章)。本部分主要以案例的形式,重点介绍可解释机器学习在银行的营销、风控和推荐系统等业务领域的应用,以帮助读者进一步理解可解释机器学习如何解决银行业实际遇到的问题。
勘误和支持
由于作者的水平有限,写作的时间比较紧张,书中难免会出现一些错误或者不准确的地方,如有发现,恳请大家批评指正。如果大家有建议或意见,欢迎发送邮件至邮箱shaop@datamargin.com,很期待听到大家的真挚反馈。
致谢
首先要特别感谢香港大学张爱军博士团队,他让我们看到了可解释机器学习的价值,他们为我们指明了研究的方向和路线,对标国际领先的研究团队,让我们对可解释机器学习领域的研究能够快速步入正轨。在理论研究阶段,张爱军博士给予了我们极其耐心、细致的指导,让我们的技术水平有了日新月异的突破和提升。
感谢索信达金融AI实验室参与写作的小伙伴们:苏思达、杨健颖、何悦、苏钰、孙兆悦、董弋嵩。感谢他们坚持不懈、永不放弃的精神,以及克服巨大挑战的勇气。我们要做的研究和写作对于每个人来说都是全新的,虽然最初没有经验,也没有太多写作材料,困难重重,但是大家还是克服一切困难坚持了下来。这种坚持不懈和全心投入是我们最珍贵的收获。
感谢索信达华南服务二部李冉冉、何超、李震、邹美灵团队的大力帮助,感谢他们为我们提供了非常难得的银行实际业务的真实场景,并且协助我们顺利完成技术实施。没有他们的帮助,就没有这些宝贵的案例材料。
最后要感谢索信达市场部的蒋顺利老师和机械工业出版社华章分社的编辑杨绣国老师在本书出版过程中提供的大力支持。
谨以此书,献给金融机构、金融科技公司的人工智能技术从业者,以及数据挖掘、数据分析等相关技术爱好者。

邵平
索信达控股AI实验室总监

上架指导

计算机\人工智能

封底文字

国家关于加快发展人工智能战略规划的提出,进一步促进人工智能技术在各行各业迅速传播和推广,特别是以深度学习为主流的机器学习技术,在计算机视觉、语音识别、自然语言处理等领域取得了重大的成果,这让我们看到了人工智能带来的巨大社会效益和经济价值。然而,随着人工智能技术应用的深入和普及,新的问题和风险也逐渐显现出来。人工智能技术的可靠性、安全性、可解释性日益引起大家的关注和重视,在此背景下,可解释机器学习成了当下人工智能领域的又一个重要研究方向。本书及时追踪学术界最新研究成果,为读者全面梳理了可解释机器学习技术的发展更新历程,详细介绍了其中出现的一些重要算法的原理,并用简单的数据演示算法的实现过程,让读者在掌握理论的同时,能够快速付诸实践。本书最后结合银行实际业务问题系统地展示了可解释机器学习技术的功能和作用。

本书的主要内容和特色:
涵盖了可解释机器学习最前沿的研究成果及行业成功应用经验。
从算法层面系统地梳理了可解释机器学习技术的研究体系,脉络清晰,层层递进。
书中除详尽阐述了各种经典算法的原理外,还辅以数据、代码实例演示算法实现的步骤,是一本理论与实践相结合的实用指南。
提供了可解释机器学习应用于银行业务场景的实际案例,让读者身临其境,充分理解可解释机器学习是如何解决现实问题的。
涵盖了金融科技领域最新的技术应用成果,对金融机构数字化建设有重要的参考价值。

图书目录

前言
第一部分 背景
第1章 引言2
 1.1 可解释机器学习研究背景2
1.1.1 机器学习面临的挑战2
1.1.2 黑盒模型存在的问题4
 1.2 模型可解释性的重要性8
 1.3 国内外的模型监管政策10
 1.4 本章小结11
第2章 可解释机器学习12
 2.1 模型的可解释性12
2.1.1 可解释性的定义13
2.1.2 可解释性的分类14
2.1.3 可解释机器学习的研究方向16
 2.2 可解释性的作用18
2.2.1 产生信任19
2.2.2 提供因果关系依据19
2.2.3 帮助模型诊断20
2.2.4 安全使用模型22
2.2.5 避免发生偏见与歧视22
 2.3 可解释性的实现23
2.3.1 建模前的可解释性实现23
2.3.2 建模中的可解释性实现26
2.3.3 建模后的可解释性实现28
 2.4 本章小结29
第二部分 理论
第3章 内在可解释机器学习模型32
 3.1 传统统计模型33
3.1.1 线性回归33
3.1.2 广义线性模型37
3.1.3 广义加性模型41
3.1.4 决策树48
 3.2 EBM模型52
3.2.1 模型定义52
3.2.2 识别二阶交互项53
3.2.3 实现算法56
3.2.4 模型解释性59
3.2.5 模型的优势与不足62
 3.3 GAMINet模型63
3.3.1 模型定义64
3.3.2 GAMINet的3个重要准则66
3.3.3 实现算法70
3.3.4 模型解释性72
3.3.5 模型的优势与不足77
 3.4 RuleFit模型77
3.4.1 模型定义78
3.4.2 规则提取79
3.4.3 实现算法81
3.4.4 模型解释性81
3.4.5 模型的优势与不足84
 3.5 Falling Rule Lists模型85
3.5.1 模型定义85
3.5.2 模型参数估计87
3.5.3 实现算法88
3.5.4 模型解释性89
3.5.5 模型的优势与不足90
 3.6 GAMMLI模型91
3.6.1 传统推荐算法的不足92
3.6.2 交互项效应拟合方法94
3.6.3 自适应软填充95
3.6.4 模型解释性97
3.6.5 模型的优势与不足99
 3.7 本章小结99
第4章 复杂模型事后解析方法101
 4.1 部分依赖图102
4.1.1 部分依赖函数102
4.1.2 估计方法103
4.1.3 部分依赖图的局限105
4.1.4 个体条件期望图106
4.1.5 实例演示107
 4.2 累积局部效应图111
4.2.1 从部分依赖图到累积局部效应图112
4.2.2 累积局部效应方程114
4.2.3 实例演示116
4.2.4 ALE方法的优劣118
 4.3 LIME事后解析方法118
4.3.1 局部代理模型119
4.3.2 LIME方法的基本流程120
4.3.3 LIME方法的解释121
4.3.4 LIME方法的优劣123
 4.4 SHAP事后解析方法124
4.4.1 SHAP的基本思想125
4.4.2 Shapley Value126
4.4.3 SHAP的实现算法128
4.4.4 SHAP方法的解释137
4.4.5 SHAP方法的优劣140
4.4.6 扩展阅读141
 4.5 本章小结143
第三部分 实例
第5章 银行VIP客户流失预警及归因分析146
 5.1 案例背景146
 5.2 数据介绍147
 5.3 建模分析148
5.3.1 目标定义148
5.3.2 数据处理149
5.3.3 模型构建150
5.3.4 流失归因151
 5.4 营销建议157
 5.5 代码展示159
 5.6 本章小结162
第6章 银行个人客户信用评分模型研究163
 6.1 案例背景163
 6.2 数据介绍164
 6.3 建模分析165
6.3.1 目标定义165
6.3.2 数据处理166
6.3.3 模型构建167
 6.4 三种方法对比180
 6.5 代码展示182
 6.6 扩展思考:基于规则的特征衍生186
 6.7 本章小结188
第7章 银行理财产品推荐建模分析189
 7.1 场景介绍189
7.1.1 推荐系统190
7.1.2 银行中的推荐系统193
 7.2 数据介绍196
7.2.1 推荐场景数据特点196
7.2.2 Santander数据集197
 7.3 建模分析199
7.3.1 数据处理199
7.3.2 模型构建200
7.3.3 模型结果评估204
 7.4 案例分析208
 7.5 本章小结211

教学资源推荐
作者: (美)Joseph Giarratano,Gary Riley
作者: [英]伯纳黛特·夏普(Bernadette Sharp) [法]弗洛伦斯·赛德斯(Florence Sèdes)[波兰]维斯拉夫·卢巴泽斯基(Wiesław Lubaszewski) 编著
作者: 李新德 朱博 谈英姿 编著
作者: [中] 史斌(Bin Shi) [美] S.S.艾扬格(S.S.Iyengar)著
参考读物推荐
作者: [印度]朗坦·约瑟夫(Lentin Joseph) 著
作者: [葡]路易斯·佩德罗·科埃略(Luis Pedro Coelho) [德]威力·里克特(Willi Richert)[法]马蒂厄·布鲁切尔(Matthieu Brucher) 著
作者: 周兴社  杨刚  王岚 等编著
作者: [美]卡罗尔·费尔柴尔德(Carol Fairchild),托马斯 L.哈曼( Thomas L. Harman) 著