首页>参考读物>计算机科学与技术>人工智能

业务驱动的推荐系统:方法与实践
作者 : 付聪 著
出版日期 : 2023-02-01
ISBN : 978-7-111-72093-5
定价 : 89.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 256
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

这是一本从业务视角解读推荐系统架构设计、评估方法、数据工程和算法原理的著作。
市面上推荐系统方面的著作,内容多以推荐技术、算法和模型为主,让读者误以为掌握了推荐算法就能用好推荐系统并提升业务指标,其实推荐算法只是工具,要真正发挥推荐系统的价值,需要将推荐系统植根于业务之上。本书从业务视角出发,描绘了当下主流推荐系统的设计思想和架构全貌,重点突出系统每个模块所需要解决的问题,进而介绍一到两种实践检验普遍有效、在学术界具备里程碑性质的算法。帮助读者练成识别算法的火眼金睛,从每年大量产出的新算法研究中去粗取精,真正解决实际问题。
阅读本书,你将有如下收获:
?从商业、运营、算法、工程视角理解推荐系统,对推荐系统的认知更加立体化;
?从业务视角理解推荐系统的顶层设计,掌握业务驱动的推荐系统设计思想;
?掌握业务驱动型推荐系统的评估方法,涵盖B端、C端和平台等多个维度;
?了解推荐系统的数据工程,掌握获取各类数据、构建特征体系的方法;
?从业务视角理解召回、排序和决策智能方面的经典算法和学术界有里程碑意义的算法;
?从技术和业务的双重视角去规划推荐算法工程师的成长路径,以达到事半功倍的效果。

图书特色

前阿里巴巴搜索与推荐算法专家撰写
百度首席科学家王井东、青年973首席科学家蔡登推荐
从业务视角解读推荐系统的架构设计、评估方法、数据工程、算法原理,揭秘千万级DAU工业推荐系统的构建、优化奥秘

上架指导

计算机\人工智能

封底文字

本书深入浅出地介绍了推荐系统的典型结构,把业务驱动的思想融入到技术剖析中。对推荐算法工程师工作的方法论和驱动力也做了一定的剖析,相信会对推荐算法工程师以及相关领域的从业人员有所帮助。
—— 王井东
百度计算机视觉首席科学家

付聪在学术领域产出过优秀的成果,在内容搜索、推荐领域也有扎实的工作经验。他将实验室产出的成果,成功地移植到了推荐系统的工业实践中,无论你是推荐系统方向的科研人员,还是推荐行业的从业者,本书都可以帮你深入理解推荐系统实践中的真实问题、解决方案和未来努力的方向。
—— 蔡 登
浙江大学教授、人工智能数据挖掘领域领军学者

付聪是我的学生,我们曾一起致力于探索可应用性高的机器学习算法创新。本书很好地构建了从学术界到工业界的桥梁,明确了工业界真实的问题,也探讨了实用算法的演进历史和未来的创新方向,是学术界和工业界的从业者都值得参考的一本书。
—— 任 翔
美国南加州大学终身教授

作者简介

付聪 著:作者简介
傅聪
博士,毕业于浙江大学计算机学院,美国南加州大学访问学者,前阿里巴巴算法专家。工业级高性能高维数据检索算法NSG、SSG的发明人,致力于推荐系统、搜索引擎前沿技术的研究和应用。曾作为团队负责人,在千万级DAU的电商及视频业务场景下,成功实现了推荐系统、搜索引擎、搜推融合等技术方向的项目落地,积累了丰富的实战经验。
学生时代师从国家优秀青年学者蔡登教授与国家杰出青年学者、前滴滴研究院院长何晓飞教授。在人工智能、推荐系统、数据库、数据挖掘、自然语言处理、神经网络、知识图谱等多个领域有丰富的研究成果。在顶级会议或期刊TPAMI、KDD、VLDB、IJCAI、EMNLP、CIKM等发表过多篇论文,并担任TKDE、IJCAI、EMNLP、AAAI、Neuron Computing等国际会议审稿人。

图书目录

第一部分 推荐系统概述
第一章 绪论
1.1 推荐系统的What & Why
1.1.1 广义推荐系统基本概念
1.1.2 浅谈个性化推荐带来的商业价值
1.2 运营、算法&工程视角看推荐系统
1.2.1 推荐业务运营思维:“货找人”
1.2.2 推荐算法建模思维:“人找货”
1.2.3 推荐引擎工程野望:“服务产品化”
1.3 一个推荐算法工程师的自我修养
1.3.1 大部分推荐算法工程师只有20%的时间在做算法
1.3.2 优秀推荐算法工程师的特质
1.3.3 正确认知推荐系统在产品、平台、业务中的定位
1.3.4 我的业务方到底在想什么
1.3.5 在自证价值和技术沉淀中寻求平衡
第二章 业务视角看推荐系统顶层设计
2.1 业务驱动下的推荐系统设计思想
2.1.1 通用业务场景抽象
2.1.2 用户体验与业务生态的平衡:谈谈推荐系统核心要素
2.2 从系统框架透视业务生态微循环
2.2.1系统大图剖析
2.2.2 监察者:埋点&日志服务
2.2.3 业务大脑:数据计算、分析&仓储服务
2.2.4 主循环系统:召回-排序模块
2.2.5 副循环系统: 运营&干预模块
2.2.5 新陈代谢:运维&实验平台
2.3 进阶话题
2.3.1 迭代效率最大化:全图化服务基础
第三章 在体验基础上做效率:推荐系统评估
3.1 业务导向型推荐系统评估的Do‘s & Dont‘s
3.1.1 体验优先准则和量化方式
3.1.2评估推荐系统的合理思维模式
3.1.3 从三种业务价值出发设计评价体系
3.2 B端业务:B端用户体验评估维度
3.2.1 玩法可解释性
3.2.2 C端用户触达率
3.2.3 投放效果可预测性
3.2.4 投入产出比
3.2.5 品类基尼系数
3.3 C端业务:C端用户体验评估维度
3.3.1 兴趣相关性
3.3.2 内容质量
3.3.3 结果多样性
3.3.4 结果惊喜性
3.3.5 疲劳度
3.4 平台成长:平台价值评估维度
3.4.1 产品调性&品牌印象
3.4.2 消费&转化率
3.4.3 高、中、低活用户留存
3.4.4 用户停留时长
3.5 评估方法概览
3.5.1 用户调研
3.5.2 离线评估
3.5.3 在线评估
3.6 A/B实验
3.6.1 A/B实验含义
3.6.2 A/B实验中的流量切分设计
3.6.3 A/B实验通用规程
3.6.4 实验结果的显著性校验
3.6.5 业务报表与监控报警
第二部分 数据与特征工程
第四章 业务标签体系
4.1 业务标签体系概述
4.1.1 业务标签体系的含义和价值
4.1.2 标签体系为什么要业务定制化
4.2 业务标签体系设计思路
4.2.1 标签体系层次化与精细化运营
4.3 业务标签挖掘方法
4.3.1 提取式标签挖掘
4.3.2生成式标签挖掘
4.3.3 人工打标&主动学习
4.3.4 标签改写、纠错&聚合
4.3.5 标签权重计算
4.4 业务标签体系评估方法
4.4.1 离线评估
4.4.2 在线评估
第五章 用户画像:业务层面的人格抽象
5.1 用户画像概述
5.1.1 用户画像的含义
5.1.2 用户画像的业务价值和算法价值
5.2 用户画像设计与迭代
5.2.1 画像基础:基于设备ID的业务人格抽象
5.2.2 向自然人格逼近:多端打通构建自然人画像
5.3 用户画像构建方法
5.3.1 用户元属性挖掘
5.3.2 用户行为属性挖掘
5.3.3 用户消费属性挖掘
5.4 用户画像权重计算
5.5 用户画像评估方法
5.5.1 离线评估
5.5.2 在线评估
第六章 生态循环的血液:数据获取与处理
6.1 日志埋点服务概述
6.1.1 日志埋点服务简介
6.1.2 为什么埋点要以业务诉求为中心设计
6.2 可扩展式业务埋点机制设计
6.2.1 spm埋点参数简介
6.2.2 scm埋点参数简介
6.2.3 扩展埋点参数简介
6.2.4 便于业务拓展的埋点设计
6.3 数据清洗
6.3.1 筛选真实曝光
6.3.2 理解数据中的bias
第七章 业务定制化特征工程设计
7.1 推荐特征体系概览
7.1.1 推荐特征体系简介
7.1.2 在特征体系中引入业务领域知识
7.1.3 从业务视角梳理特征类别
7.2 特征体系设计思想
7.2.1 业务目标相关性
7.2.2 引入泛化性特征
7.2.3 引入记忆性特征
7.3 描述性特征设计
7.3.1 User描述性特征
7.3.2 User特征人群泛化
7.3.3 Item描述性特征
7.3.4 Item特征属性泛化
7.4 User-Item交叉特征设计
7.4.1 数值类U-I交叉
7.4.2 属性类U-I交叉
7.5 User历史行为序列特征设计
7.6 特征&样本去bias
7.6.1 从数据维度去bias
7.6.2 从模型维度去bias
7.7 特征平滑
7.7.1 威尔逊置信区间方法
7.7.2 对数平滑方法
7.7.3 异质内容对齐
7.8 时间穿越及处理
7.8.1 时间穿越定义及影响
7.8.2 样本现场还原
7.9 实时特征
7.9.1 实时特征的业务和算法价值
7.9.2 实时特征设计和数据流程
7.10 特征评估方法
7.10.1 model-free评估
7.10.2 in-model评估
第三部分 召回排序系统
第八章 大动脉:召回模块的业务定位和算法选型
8.1 推荐召回概览
8.1.1 为什么召回是业务生态的大动脉
8.1.2 从业务目标中抽象出召回算法优化目标
8.1.3 召回模块设计:表达力和速度的平衡
8.1.4 从业务视角看各种2I算法及其特点
8.2 业务方的最爱:策略2I召回
8.2.1 策略2I召回业务背景及特点
8.2.2 策略2I召回实现方式
8.3 I2I召回
8.3.1 I2I召回的业务背景及特点
8.3.2 swing I2I召回算法
8.3.3 ItemCF算法
8.3.4 Item2Vec算法
8.3.5 Node2Vec算法
8.4 U2I召回
8.4.1 U2I召回业务背景及特点
8.4.2 基于画像的U2I
8.4.3 基于历史行为的U2I
8.4.4 UserCF算法
8.4.5 DeepMatch算法
8.4.6 UI异构图上的GraphSAGE算法
8.4.7 人群泛化:U2U2I
8.5 向量召回的另一面:检索算法
8.5.1 KNN向量检索与ANN向量检索
8.5.2 ANN向量检索算法分类及特点
8.5.3 OPQ检索算法与Faiss
8.5.4 HNSW检索算法
8.5.5 SSG检索算法
8.6 进阶话题
8.6.1 召回实时化
8.6.2 负采样是一门艺术
8.6.3 多路召回融合:业务经验和算法的平衡
8.6.4 如何做好一路新召回
第九章 毛细血管:通过个性化排序实现精准投放
9.1 排序模块概览
9.1.1 个性化主战场:推荐排序模块简介
9.1.2 理解业务:我们总说的排序效率,到底是什么
9.1.3 业务诉求满足第一性:体验指标量化
9.1.4 戴着镣铐起舞:带约束的效率最大化
9.1.5 排序模块框架
9.2 粗排模块
9.2.1 粗排模块特点与业务定位
9.2.2 粗排算法选型原则
9.2.3 GBDT算法
9.2.4 双塔深度网络
9.2.5 从精排蒸馏出粗排模型
9.3 精排模块
9.3.1 精排模块特点与业务定位
9.3.2 精排算法选型原则
9.3.3 以xDeepFM为backbone
9.3.4 MLP子模块及职责
9.3.5 XFM子模块及职责
9.3.6 Attention子模块及职责
9.3.7 Squeeze为网络挤出水分
9.4 多准则排序
9.4.1 多准则推荐简介及业务意义
9.4.2 MMoE建模多准则任务
9.4.3 多任务学习中的Pareto寻优
9.5 多准则推荐系统下的重排序
9.5.1 面向体验优化的重排序策略
9.5.2 PointWise to ListWise:强化学习重排序
9.5.3 解决数据匮乏问题:生成式强化学习重排
9.6 模型优化策略
9.6.1 选择正确的优化器
9.6.2更新频率与模型稳定性
9.6.3 从End2End到独立表征服务
第四部分 人工智能推荐离不开“人工”
第十章 算法辅助“人工“:决策智能
10.1 决策智能概述
10.1.1 决策智能含义
10.1.2 决策智能在推荐业务中的意义
10.1.3推荐业务中的决策智能
10.2 冷启动系统
10.2.1 冷启动系统简介
10.2.2 冷启动系统业务价值
10.2.3 冷启动系统要素及框架
10.2.4 基于业务经验的朴素冷启动方法
10.3 新内容冷启动
10.3.1 Bandit算法
10.3.2 LinUCB算法
10.4 新用户承接
10.4.1 新用户承接策略
10.4.2 稀疏数据下的用户表征泛化
10.5 爆款机制
10.5.1 爆款孵化的价值
10.5.2 算法协助爆品圈选机制设计
10.6 流量调控
10.6.1 流量调控业务价值与应用场景
10.6.2异构内容混排及强化学习应用
10.6.3 以保量为主目标的流量调控及算法
10.6.4 进阶话题:长期价值建模与决策
第十一章 “人工”指导算法:推荐系统迭代升级背后的上帝之手
11.1 业务迭代
11.1.1 配合业务发展安排优化节奏
11.1.2 避免“跷跷板”式优化
11.1.3 业务目标分类与优先级
11.1.4 反向输出:助力精细化运营
11.2 技术管理
11.2.1 从业务生态看推荐系统的生命周期
11.2.2 从“漏斗效应”看推荐系统问题排查与系统迭代路径
11.2.3 过程也很重要:从“漏斗效应”看目标管理

教学资源推荐
作者: (美)Tom M.Mitchell
作者: [德]菲利普·科恩(Philipp Koehn) 著
作者: 李玉鑑 张婷 等著
作者: [希腊] 斯皮罗斯·G. 扎菲斯塔斯(Spyros G. Tzafestas) 著
参考读物推荐
作者: [美]道格·罗斯(Doug Rose) 著
作者: [印] 萨扬·穆霍帕迪亚(Sayan Mukhopadhyay) 著
作者: 刘树春 贺盼 马建奇 王佳军 等著
作者: 涂铭 刘祥 刘树春 编著