首页>参考读物>计算机科学与技术>人工智能

MLOps实战:机器学习模型的开发、部署与应用
作者 : [英]马克·特雷维尔(Mark Treveil),[美]the Dataiku Team 著
译者 : 熊峰 温泉 李磊 译
出版日期 : 2022-07-20
ISBN : 978-7-111-71009-7
定价 : 79.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 169
开本 : 16
原书名 : Introducing MLOps
原出版社: O'Reilly Media, Inc.
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

本书分为三部分。第1部分介绍MLOps主题,深入探讨了它是如何(以及为什么)发展成一门学科的、需要谁参与才能成功执行MLOps以及需要哪些组成部分。
第二部分介绍了机器学习模型的生命周期,其中包括有关模型开发、生产准备、生产部署、监测和治理的章节。这些章节不仅包括一般的注意事项,还包括MLOps生命周期每个阶段的注意事项,并提供第3章中所涉及主题相关的更多详细信息。
第三部分提供了MLOps的具体示例,以便读者了解MLOps在实践中的设置和含义。

图书特色

图书前言

在机器学习(ML)的发展历史中,我们已经到达了一个转折点,该技术已经从理论和学术领域进入了“现实世界”—为全世界的人提供各种服务和产品的业务。虽然这种转变令人兴奋,但同时也充满挑战,因为这将机器学习模型的复杂性与现代企业的复杂性结合在一起。
随着各种企业从尝试机器学习到在生产环境中扩展机器学习,其中的困难之一便是维护。企业如何从仅管理单个模型转变为管理几十乃至成百上千个模型呢?这不仅仅是MLOps发挥作用的地方,也是体现上述技术和商业方面复杂性的地方。本书将向读者介绍当前使用MLOps面临的挑战,同时还为开发MLOps功能提供实用的见解和解决方案。
本书适用人群
我们专门为分析人员和IT运营团队经理(即直接面对在生产中扩展机器学习任务的人员)编写了这本书。鉴于MLOps是一个新领域,我们编写了本书,作为创建一个成功的MLOps环境的指南,涵盖了从组织到技术方面的挑战。
本书结构
本书分为三个部分。第一部分(第1~3章)是对MLOps主题的介绍,深入探讨它如何(以及为何)发展成一门学科、需要谁参与才能成功执行MLOps以及需要哪些组成部分。
第二部分(第4~8章)大致介绍了机器学习模型的生命周期,其中包括有关模型开发、生产准备、生产部署、监控和治理的章节。这些章节不仅包括一般的注意事项,还包括MLOps生命周期每个阶段的注意事项,并提供与第3章中所涉及主题相关的更多详细信息。
最后一部分(第9~11章)提供了MLOps在当今公司中的具体示例,以便读者了解MLOps在实践中的设置和含义。尽管公司名称是虚构的,但这些故事是以现实中的公司在MLOps和大规模模型管理方面的经验为基础的。
排版约定
本书中使用以下排版约定:
斜体(Italic)
表示新的术语、URL、电子邮件地址、文件名和文件扩展名。
等宽字体(Constant width)
用于程序清单,以及段落中的程序元素,例如变量名、函数名、数据库、 数据类型、环境变量、语句以及关键字。
等宽粗体(Constant width bold)
表示应由用户直接输入的命令或其他文本。
等宽斜体(Constant width italic)
表示应由用户提供的值或由上下文确定的值替换的文本。
O’Reilly在线学习平台(O’Reilly Online Learning)
40多年来,O’Reilly Media致力于提供技术和商业培训、知识和卓越见解,来帮助众多公司取得成功。
我们拥有独一无二的专家和革新者组成的庞大网络,他们通过图书、文章、会议和我们的在线学习平台分享他们的知识和经验。O’Reilly的在线学习平台允许你按需访问现场培训课程、深入的学习路径、交互式编程环境,以及O’Reilly和200多家其他出版商提供的大量文本和视频资源。有关的更多信息,请访问http://oreilly.com。
如何联系我们
对于本书,如果有任何意见或疑问,请按照以下地址联系本书出版商。
美国:
O’Reilly Media,Inc.
1005 Gravenstein Highway North
Sebastopol,CA 95472
中国:
北京市西城区西直门南大街2号成铭大厦C座807室(100035)
奥莱利技术咨询(北京)有限公司
要询问技术问题或对本书提出建议,请发送电子邮件至errata@oreilly.com.cn。
本书配套网站https://oreil.ly/intro-mlops上列出了勘误表、示例以及其他信息。
关于书籍、课程、会议和新闻的更多信息,请访问我们的网站http://www.oreilly.com。
我们在Facebook上的地址:http://facebook.com/oreilly
我们在Twitter上的地址:http://twitter.com/oreillymedia
我们在YouTube上的地址:http://youtube.com/oreillymedia
致谢
我们要感谢整个Dataiku团队,感谢他们从构思到完成对本书出版的支持。这是真正的团队努力,就像我们在Dataiku做的大多数事情一样,植根于无数人和团队之间的基本合作。
感谢那些从一开始就与O’Reilly一起支持我们的愿景的人、那些帮助我们写作和编辑的人、那些提供诚实反馈的人(即使这意味着更多的写作、重写、再重写)、那些在内部当啦啦队队员的人,当然,还有那些帮助我们将本书推向世界的人。

上架指导

计算机/机器学习

封底文字

当今,组织创建的分析和机器学习(ML)模型中超过一半从未投入生产。机器学习运营化的一些挑战和障碍是技术性的,但其他则是组织性的。无论采取哪种方式解决问题,底线是未投入生产的模型不会影响业务。
本书介绍了MLOps的关键概念,以帮助数据科学家和应用工程师操作ML模型来驱动真正的业务变革,并随着时间的推移维护和改进这些模型。以全球众多MLOps应用课程为基础,9位机器学习专家深入探讨了模型生命周期的五个阶段——开发、预生产、部署、监控和治理,揭示了如何将强大的MLOps流程贯穿始终。
本书将帮助你:
? 通过减少整个ML管道和工作流程中的摩擦,实现数据科学的价值。
? 通过重新训练、定期调整和全面重构来优化ML模型,以确保长期准确性。
? 设计MLOps生命周期,以使用公正、公平、可解释的模型将组织风险降至最低。
? 为管道的部署和更复杂、标准化程度更低的外部业务系统实施ML模型。
“如果你正在寻找更好的战略和跨团队的实用ML过程,那么这本书很适合你。”
——Adi Polak
 微软高级软件工程师
“本书是在企业中构建、扩展、简化和管理模型部署的优秀指南。”
——Parul Pandey
 数据科学布道者,H2O.ai
Mark Treveil设计的产品涉及电信、银行和在线交易等多个领域。他自己的初创公司引领了英国地方政府的治理革命,目前它仍占据主导地位。他现在是Dataiku产品团队的一员。

图书目录

前言 1
第一部分 MLOps是什么,为什么要使用MLOps 5
第1章 为什么现在要使用MLOps,使用MLOps面临的挑战 7
1.1 定义MLOps及面临的挑战 8
1.2 使用MLOps以降低风险 11
1.3 大规模的MLOps 14
结语 15
第2章 MLOps的使用人员 16
2.1 行业专家 17
2.2 数据科学家 20
2.3 数据工程师 22
2.4 软件工程师 23
2.5 DevOps团队 23
2.6 模型风险管理者/审计师 24
2.7 机器学习架构师 25
结语 26
第3章 MLOps的主要组成部分 27
3.1 机器学习入门 27
3.2 模型开发 28
3.3 产品化与部署 31
3.4 监控 33
3.5 迭代与生命周期 36
3.6 治理 38
结语 42
第二部分 如何实现 43
第4章 开发模型 45
4.1 什么是机器学习模型 46
4.2 数据探索 50
4.3 特征工程与特征选择 50
4.4 实验 53
4.5 评估和比较模型 55
4.6 版本管理和再现性 60
结语 62
第5章 准备投入生产 63
5.1 运行时环境 63
5.2 模型风险评估 67
5.3 机器学习的质量保证 69
5.4 测试的关键注意事项 69
5.5 再现性和可审计性 70
5.6 机器学习安全 72
5.7 降低模型风险 74
结语 76
第6章 部署到生产 78
6.1 CI/CD管道 78
6.2 创建ML工件 80
6.3 部署策略 82
6.4 容器化 85
6.5 扩展部署 86
6.6 需求和挑战 88
结语 89
第7章 监控和反馈回路 90
7.1 模型应该多久接受一次再训练 91
7.2 理解模型退化 94
7.3 实践中的漂移检测 97
7.4 反馈回路 100
结语 108
第8章 模型治理 109
8.1 由谁决定组织的治理需求 109
8.2 将治理与风险级别相匹配 111
8.3 推动MLOps治理的现行法规 112
8.4 新一轮人工智能特定法规 115
8.5 负责任的人工智能的出现 117
8.6 负责任的人工智能的关键要素 118
8.7 MLOps治理模板 122
结语 130
第三部分 MLOps具体示例 131
第9章 实践中的MLOps:消费信贷风险管理 133
9.1 背景:商业使用案例 133
9.2 模型开发 134
9.3 模型偏见考虑 135
9.4 为生产做准备 135
9.5 部署到生产环境 136
结语 137
第10章 实践中的MLOps:营销推荐引擎 138
10.1 推荐引擎的兴起 138
10.2 数据准备 140
10.3 设计和管理实验 141
10.4 模型训练和部署 141
10.5 管道结构和部署策略 144
10.6 监控和反馈 145
结语 148
第11章 实践中的MLOps:消耗预测 149
11.1 能源系统 149
11.2 数据收集 151
11.3 问题定义:机器学习,还是不机器学习 153
11.4 空间和时间分辨率 153
11.5 实施 154
11.6 建模 155
11.7 部署 157
11.8 监控 157
结语 158

教学资源推荐
作者: [新西兰] 史蒂芬·马斯兰(Stephen Marsland) 著惠灵顿维多利亚大学
作者: [意]安吉洛?坎杰洛西(Angelo Cangelosi), [美]马修?施莱辛格(Matthew Schlesinger)著
作者: [美]马克·W. 斯庞(Mark W. Spong),[美]赛斯·哈钦森(Seth Hutchinson),[美]M. 维德雅萨加(M. Vidyasagar) 著
作者: Fredric M. Ham;Ivica Kostanic
参考读物推荐
作者: [美] 李崇(Chong Li) 邱美康(Meikang Qiu) 著
作者: 肖智清 著
作者: [美]塞巴斯蒂安·拉施卡(Sebastian Raschka) [美]刘玉溪(海登)(Yuxi (Hayden) Liu) [美]瓦希德·米尔贾利利(Vahid Mirjalili)著