推荐系统:原理与实践
作者 : [美] 查鲁·C. 阿加沃尔(Charu C. Aggarwal)著
译者 : 黎玲利 尹丹 李默涵 王宏志 等译
丛书名 : 计算机科学丛书
出版日期 : 2018-07-06
ISBN : 978-7-111-60032-9
定价 : 129.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 387
开本 : 16
原书名 : Recommender Systems:The Textbook
原出版社: Springer-Verlag
属性分类: 教材
包含CD : 无CD
绝版 :
图书简介

推荐系统对进行个性化商品和服务推荐,更好地服务用户具有重要的意义。本书作者具有丰富的研究经验,基于自己的研究经历,系统、全面地将推荐系统的相关知识做了阐述,使读者可以全面了解推荐系统的算法与评估方式、特定领域与语境下的推荐系统,同时书中还给出了关于推荐系统领域的一些前沿问题及研究进展的介绍。本书内容主要包括三个部分:算法与评估、特定领域与语境的推荐、高级主题与应用。此外,本书中还涉及当前一些热点主题与应用。

图书特色

图书前言

大自然呈现在我们面前的只是一头狮子的尾巴。但不要怀疑狮子的存在,尽管它因为身型巨大不能马上现出全身。
——Albert Einstein

随着Web成为商务和电子交易的重要媒介,推荐系统在20世纪90年代变得越来越重要。人们很早就认识到Web为个性化服务提供了空前的机会,这是其他渠道是不可能做到的。特别是Web为数据收集提供了便利,并且提供了一种非侵入式地推荐物品的用户界面。
自此以后,在公众眼中,推荐系统已经得到了显著的发展。这一事实的证据是,有许多会议和研讨会专门探讨该领域。会议ACM Conference on Recommender Systems特别值得一提,因为它为该领域定期贡献了许多前沿工作。推荐系统领域非常多样化,因为它能够使用各种类型的用户偏好数据和用户需求数据来做推荐。推荐系统中最著名的方法包括协同过滤方法、基于内容的方法和基于知识的方法。这三种方法构成了推荐系统研究领域的基本支柱。近年来,已经设计了一些专门的方法来针对不同的数据领域和上下文,例如时间、位置和社会信息。针对专门的场景提出了大量高级的方法,这些方法可以调整用于不同的应用领域,例如查询日志挖掘、新闻推荐和计算广告。本书的结构安排体现了这些重要的话题。本书的章节可以分为三类:
1)算法和评估:这些章节讨论了推荐系统中的基本算法,包括协同过滤方法(第2和4章)、基于内容的方法(第4章)和基于知识的方法(第5章)。这些方法的混合在第6章中讨论。第7章讨论了推荐系统评估。
2)特定领域和上下文的推荐:推荐系统的上下文在提供有效推荐方面扮演了至关重要的角色。例如,一个用户想要用其位置作为附加的上下文(context)来查找饭店。推荐的上下文可以被看作是影响推荐目标的重要辅助信息。不同类型的域,例如时间数据、空间数据和社会数据,提供了不同类型的上下文。相关的方法在第8~11章中讨论。第11章也讨论了利用社会信息来增加推荐过程可信度的话题。最近的话题(如分解机和可信推荐系统)在这些章节中也有涉及。
3)高级话题和应用:在第12章中,我们将从各个角度讨论推荐系统的健壮性,例如欺诈(shilling)系统、攻击模式及其防御。此外,近期的一些话题,例如排名学习、多臂赌博机、组推荐系统、多标准推荐系统和主动学习系统,将在第13章中讨论。该章的一个重要目标是向读者介绍当前研究的基本思想和原则。虽然不可能在一本书里对当前所有的研究技术细节进行讨论,但我们希望最后一章能够在高级话题方面为读者“破冰”。在这一章中,我们也研究了推荐技术的一些应用环境,例如新闻推荐、查询推荐和计算广告。本章还讨论了如何将前面章节中介绍的方法应用于各个不同的领域。
尽管本书是作为教科书来编写的,但仍有很多来自于工业界和学术界的读者。因此,我们也从应用角度和文献角度来撰写此书。书中提供了大量的示例和习题,使得它可以被用作教科书。由于大部分推荐系统课程只涵盖基础话题,因此有关基础话题的章节和算法着重于课堂教学。另一方面,工业界人员也许发现讨论上下文敏感的推荐系统的章节很有用,因为在许多真实的应用中会有大量可用的上下文辅助信息。第13章的应用部分是特别为工业界人员编写的,不过教师也许会发现它在推荐课程中也是有用的。
最后,我们对所使用的符号进行简要的介绍。本书中一直使用一个m×n的评分矩阵,记为R,其中m是用户的数量,n是物品的数量。矩阵R是不完整的,因为只有一部分项是已观测的。R的第(i,j)项表示用户i对物品j的评分,当它是已观测项时,被记为rij。当项(i,j)是由推荐算法预测得到(而不是用户指定)时,被记为带“帽子”符号(即抑扬符号)的r∧ij,表示它是一个预测的值。向量用“上划线”来表示,例如X或y。

上架指导

计算机\推荐系统

封底文字

推荐系统是一种预测用户对商品和信息的喜好的模型,可以帮助用户发现自己感兴趣的信息和商品。构建推荐系统时,既要考虑效率,也要考虑有效性;既要考虑用户心理,也要考虑用户的行为;既要考虑商品和信息的外在属性,又要考虑商品和信息的相互关联。由于其综合性和复杂性,推荐系统可以看成是数据库、自然语言处理、机器学习、信息检索、算法甚至心理学等领域的综合与交叉。本书从上述庞杂知识领域中梳理出一个完整的知识体系,有助于初学者系统地学习推荐系统知识。

本书特点
本书从原理、技术、应用角度对推荐系统进行全面介绍。首先介绍重要的推荐系统算法,包括它们的优缺点以及适用场景;然后,在特定领域场景和不同类型的输入信息以及知识基础的背景下研究推荐问题;最后,讨论推荐系统的高级的话题(包括攻击模型、组推荐系统、多标准系统和主动学习系统);此外,还涉及推荐系统的实际应用,比如新闻的推荐和计算广告等。
本书对推荐系统的介绍兼顾原理性和应用性。作者没有回避推荐技术原理中大量深入的数学方法,同时涵盖推荐系统涉及的众多技术和实际应用,使读者知其然更知其所以然,做到理论和实际的有效融合。
无论是学生、研究人员还是开发人员,都能从本书中获益。对于在校学生,本书利用大量的图示、实例来描述各种概念和技术,并且在每章末提供习题,以便于学生深入理解和掌握相关技术;对于研究人员,本书的每一章均从文献角度阐述技术,并对所涉及的研究工作进行了分析和比较,有助于研究人员了解当前技术的不足和有待解决的问题;对于开发人员,本书提供了大量的推荐模型和算法,并对其应用场景进行有针对性的介绍,从而帮助开发人员根据实际系统的要求选择相应的推荐模型和算法。

译者序

我们的时代已经由物品的缺乏时代进化到了丰富时代,随着物品的数量和种类越来越多,人的注意力成为稀缺资源,于是,推荐系统的重要性凸显了出来。推荐系统是一种预测用户对商品和信息的喜好或评分的模型,如何发现用户感兴趣的信息和商品是推荐系统要解决的问题,是用户从互联网上浩如烟海的信息中发现适合于自己信息和商品的重要渠道。
正因为推荐系统的重要性,它已经成为计算机科学中的一个热门领域,研究人员提出了大量模型和算法。推荐系统中需要考虑的因素很多,既要考虑效率,也要考虑有效性;既要考虑用户心理,也要考虑用户的行为;既要考虑商品和信息的外在属性,又要考虑商品和信息的相互关联。由于其综合性和复杂性,这个领域可以看成是数据库、自然语言处理、机器学习、信息检索、算法甚至心理学等领域的综合与交叉。
由于上述特点以及学科的快速发展,推荐系统的知识显得相当繁杂,从中梳理出一个明晰的知识体系对于学习者来说显得特别重要。本书就是能给推荐系统的学习者展示其完整体系的一本教材。
本书的作者Charu Aggarwal是数据库和数据挖掘领域知名专家,现就职于IBM T.J.Watson Research Center,是ACM Fellow、IEEE Fellow,其H.index达到80。他在数据挖掘领域的多年的研究经历和深厚造诣保证了本书的广度、深度和厚度。
 广度本书涵盖推荐系统的原理,并介绍推荐系统中的各类技术,大致可以分为协同过滤方法、基于内容的方法和基于知识的方法三类。除了推荐系统的相关主题以外,本书还探讨了和特定领域相关的技术,以及如何抵御攻击等高级话题。书中大量的示例和习题有助于读者对推荐系统技术的理解和掌握。
 深度本书对推荐系统的内容介绍不仅仅流于技术层面,更深入阐述推荐技术背后的原理,特别是没有回避其中大量深入的数学方法,这保证了本书理论和技术的融合,使得读者知其然更知其所以然,做到理论和实际的衔接。
 厚度推荐系统相关技术已经发展多年,并且现在仍然是研究热点。本书兼顾了推荐系统历史和发展,既介绍了一系列传统的推荐技术,也介绍了推荐系统最新的技术,体现了推荐系统发展的厚度。
由于这些特点,本书具有广泛的适用性,既适合作为初学者入门的教材,也适合作为进阶者深入学习的指导教材;既适合作为开发人员的参考资料,也适合作为研究人员的研究参考。
本书的翻译组织安排如下:黎玲利负责1、2、6、11、12、13章,前言,致谢及作者简介的翻译;尹丹负责5、7、8、9、10章的翻译;李默涵负责3、4章的翻译;王宏志组织了全书的翻译并进行统稿。参与翻译工作的人员还有哈尔滨工业大学的李东升、马靖昆、周昊天、王必聪同学,北京理工大学的郝俊卿、哈尔滨工程大学的张建川同学。另外,还要感谢黑龙江大学的邵鸿宇、冯博奇、徐绅宝等同学对译稿的审校。
限于译者水平,译文中存在许多不足,敬请读者批评指正。如有任何建议,请发送邮件至lilingli@hlju.edu.cn。本书以及大数据相关资料将在“大数据与数据科学家”微信公众号和华章网站分享,欢迎读者关注。

译者
2018年6月

图书目录

出版者的话
译者序
前言
致谢
作者简介
第1章推荐系统概述
11引言
12推荐系统的目标
121推荐系统应用范围
13推荐系统的基本模型
131协同过滤模型
132基于内容的推荐系统
133基于知识的推荐系统
134人口统计推荐系统
135混合集成的推荐系统
136对推荐系统的评价
14推荐系统领域特有的挑战
141基于上下文的推荐系统
142时间敏感的推荐系统
143基于位置的推荐系统
144社交信息系统
15高级论题和应用
151推荐系统中的冷启动问题
152抗攻击推荐系统
153组推荐系统
154多标准推荐系统
155推荐系统中的主动学习
156推荐系统中的隐私问题
157应用领域
16小结
17相关工作
18习题
第2章基于近邻的协同过滤
21引言
22评分矩阵的关键性质
23通过基于近邻的方法预测评分
231基于用户的近邻模型
232基于物品的近邻模型
233高效的实现和计算复杂度
234基于用户的方法和基于物品的方法的比较
235基于近邻方法的优劣势
236基于用户的方法和基于物品的方法的联合
24聚类和基于近邻的方法
25降维与近邻方法
251处理偏差
26近邻方法的回归模型视角
261基于用户的最近邻回归
262基于物品的最近邻回归
263基于用户的方法和基于物品的方法的结合
264具有相似度权重的联合插值
265稀疏线性模型
27基于近邻方法的图模型
271用户物品图
272用户用户图
273物品物品图
28小结
29相关工作
210习题
第3章基于模型的协同过滤
31引言
32决策和回归树
321将决策树扩展到协同过滤
33基于规则的协同过滤
331将关联规则用于协同过滤
332面向物品的模型与面向用户的模型
34朴素贝叶斯协同过滤
341处理过拟合
342示例:使用贝叶斯方法处理二元评分
35将任意分类模型当作黑盒来处理
351示例:使用神经网络作为黑盒分类器
36潜在因子模型
361潜在因子模型的几何解释
362潜在因子模型的低秩解释
363基本矩阵分解原理
364无约束矩阵分解
365奇异值分解
366非负矩阵分解
367理解矩阵因子分解方法族
37集成因子分解和近邻模型
371基准估计:非个性化偏倚中心模型
372模型的近邻部分
373模型的潜在因子部分
374集成近邻和潜在因子部分
375求解优化模型
376关于精度的一些观察
377将潜在因子模型集成到任意模型
38小结
39相关工作
310习题
第4章基于内容的推荐系统
41引言
42基于内容的系统的基本组件
43预处理和特征提取
431特征提取
432特征表示和清洗
433收集用户的偏好
434监督特征选择和加权
44学习用户画像和过滤
441最近邻分类
442与基于案例的推荐系统的关联性
443贝叶斯分类器
444基于规则的分类器
445基于回归的模型
446其他学习模型和比较概述
447基于内容的系统的解释
45基于内容的推荐与协同推荐
46将基于内容的模型用于协同过滤
461利用用户画像
47小结
48相关工作
49习题
第5章基于知识的推荐系统
51引言
52基于约束的推荐系统
521返回相关结果
522交互方法
523排序匹配的物品
524处理不可接受的结果或空集
525添加约束
53基于案例的推荐系统
531相似性度量
532批评方法
533批评的解释
54基于知识的系统的持久个性化
55小结
56相关工作
57习题
第6章基于集成的混合推荐系统
61引言
62从分类角度看集成方法
63加权型混合系统
631几种模型组合的方法
632对分类中的bagging算法的调整
633随机性注入算法
64切换型混合系统
641为解决冷启动问题的切换机制
642桶模型
65级联型混合系统
651推荐结果的逐步优化
652boosting算法
66特征放大型混合系统
67元级型混合系统
68特征组合型混合系统
681回归分析和矩阵分解
682元级特征
69交叉型混合系统
610小结
611相关工作
612习题
第7章推荐系统评估
71引言
72评估范例
721用户调查
722在线评估
723使用历史数据集进行离线评估
73评估设计的总体目标
731精确性
732覆盖率
733置信度和信任度
734新颖度
735惊喜度
736多样性
737健壮性和稳定性
738可扩展性
74离线推荐评估的设计要点
741Netflix Prize数据集的案例研究
742为训练和测试分解评分
743与分类设计的比较
75离线评估的精确性指标
751度量预测评分的精确性
752通过相关性评估排名
753通过效用评估排名
754通过ROC曲线评估排名
755哪种排名方式最好
76评估指标的局限性
761避免评估游戏
77小结
78相关工作
79习题
第8章上下文敏感的推荐系统
81引言
82多维方法
821层级的重要性
83上下文预过滤:一种基于降维的方法
831基于集成的改进
832多级别的估计
84后过滤方法
85上下文建模
851基于近邻的方法
852潜在因子模型
853基于内容的模型
86小结
87相关工作
88习题
第9章时间与位置敏感的推荐系统
91引言
92时间协同过滤
921基于新近的模型
922处理周期性上下文
923将评分建模为时间的函数
93离散时间模型
931马尔可夫模型
932序列模式挖掘
94位置感知推荐系统
941偏好位置
942旅行位置
943结合偏好位置与旅行位置
95小结
96相关工作
97习题
第10章网络中的结构化推荐
101引言
102排序算法
1021PageRank
1022个性化PageRank
1023基于近邻的方法应用
1024SimRank
1025搜索与推荐的关系
103使用集合分类的推荐
1031迭代分类算法
1032使用随机游走的标签传播
1033社交网络中协同过滤的适用性
104推荐好友:链接预测
1041基于近邻的方法
1042Katz度量
1043基于随机游走的度量
1044作为分类问题的链接预测
1045链接预测的矩阵分解
1046链接预测和协同过滤的关联
105社会影响力分析和病毒式营销
1051线性阈值模型
1052独立级联模型
1053影响力函数评估
1054社交流中的目标影响力分析模型
106小结
107相关工作
108习题
第11章社交和以信任为中心的推荐系统
111引言
112社交上下文的多维模型
113以网络为中心的方法和以信任为中心的方法
1131收集数据来建立信任网络
1132信任的传播和聚合
1133没有信任传播的简单推荐
1134TidalTrust算法
1135MoleTrust算法
1136信任游走算法
1137链接预测法
1138矩阵分解法
1139社交推荐系统的优点
114社交推荐系统中的用户交互
1141大众分类法的代表
1142社会性标签系统中的协同过滤
1143选择有价值的标签
1144无评分矩阵的社会性标签推荐
1145使用评分矩阵的社会性标签推荐
115小结
116相关工作
117习题
第12章抵抗攻击的推荐系统
121引言
122对攻击模型中的权衡的理解
1221量化攻击的影响
123攻击类型
1231随机攻击
1232均值攻击
1233bandwagon攻击
1234流行攻击
1235爱/憎攻击
1236反向bandwagon攻击
1237探测攻击
1238分段攻击
1239基本推荐算法的效果
124探测推荐系统中的攻击
1241单体攻击画像的探测
1242群体攻击画像的探测
125健壮推荐设计策略
1251用CAPTCHA防止自动攻击
1252使用社会信任
1253设计健壮的推荐算法
126小结
127相关工作
128习题
第13章推荐系统高级主题
131引言
132排名学习
1321成对排名学习
1322列表排名学习
1323与其他领域中排名学习方法的比较
133多臂赌博机算法
1331朴素算法
1332贪心算法
1333上限方法
134组推荐系统
1341协同和基于内容的系统
1342基于知识的系统
135多标准推荐系统
1351基于近邻的方法
1352基于集成的方法
1353无整体评分的多标准系统
136推荐系统中的主动学习
1361基于异质性的模型
1362基于性能的模型
137推荐系统中的隐私
1371基于冷凝的隐私
1372高维数据的挑战
138一些有趣的应用领域
1381门户内容个性化
1382计算广告与推荐系统
1383互惠推荐系统
139小结
1310相关工作
参考文献
索引

教学资源推荐
作者: [希]西格尔斯·西奥多里蒂斯(Sergios Theodoridis) 著
作者: 王章阳(Zhangyang Wang) [美]傅云(Yun Fu) [美]黄煦涛(Thomas S. Huang) 编著
作者: [澳] 萨尔曼·汗(Salman Khan) 侯赛因·拉哈马尼(Hossein Rahmani) 赛义德·阿法克·阿里·沙(Syed Afaq Ali Shah) 穆罕默德·本纳努恩(Mohammed Bennamoun) 著
作者: [法]奥利弗·布瓦西耶(Olivier Boissier) [巴西]拉斐尔·H. 博蒂尼(Rafael H. Bordini) [巴西]乔米·F. 胡布纳(Jomi F. Hübner) [意]亚历桑德罗·里奇(Alessandro Ricci) 著
参考读物推荐
作者: 刘祥龙 杨晴虹 胡晓光 于佃海等编著 深度学习技术及应用国家工程实验室 百度技术学院 组编
作者: 朱龙春 刘会福 柴亚团 万正勇 著
作者: [法]雅斯米娜·贝索伊·塞班(Yasmina Bestaoui Sebbane)著
作者: 刘祥龙 杨晴虹 谭中意 蒋晓琳 等编著深度学习技术及应用国家工程实验室、百度技术学院 组编