教学资源 – 图书教辅

扩展信息

语种 : 简体中文

页数 : 245

开本 : 16

原书名 : Twenty Lectures on Algorithmic Game Theory

原出版社: Cambridge University Press

属性分类: 教材

包含CD : 无CD

绝版 : 无

图书简介

【网店勿用！此为申报选题所填信息，网店请调用最终版】计算机科学和经济学在过去的十多年中进行了热烈的交互，产生了新的算法博弈论领域。许多现代计算机科学的核心问题，从大型网络的资源分配到在线广告，都涉及多个自利方个体之间的相互作用。经济学和博弈论为这些问题提供了大量有用的模型和定义。同时，对于传统经济学的许多问题，来自计算机科学的研究又起到了补充作用。本书源于作者在斯坦福大学的算法博弈论课程讲义，旨在让学生和其他新学者快速、方便地了解该领域的许多最重要的概念。本书通过在线广告、无线频谱交易和网络管理等案例来说明这些概念，非常适合课堂教授和自学。

图书特色

源于斯坦福大学“算法博弈论”课程讲义，计算机科学+经济学的跨学科研究

图书前言

在过去的15年里，计算机科学和经济学进行了一场热烈的交互，诞生了一个叫作“算法博弈论”或者“经济与计算科学”的新领域。计算机科学中的诸多核心问题本质上都涉及多个自私个体之间的交互，而经济学和博弈论为这样的问题提供了丰富的推理模型和定义系统。在传统经济学的很多问题上，来自计算机科学的研究又起到了补充作用。例如，计算机科学聚焦于计算复杂性，并且为之提供了整套描述语言；计算机科学对近似边界进行了研究和推广，为不能或不容易找到精确解的问题提供了推理方法；计算机科学还为贝叶斯或平均情况分析提供了替代方法，而这能帮助经济设计问题找到更牢靠的解。
本书源自我在斯坦福大学所讲授的“算法博弈论”课程的讲义。从2004年到2013年，我一共五次讲授这门课程。该课程的目标是利用具有代表性的模型和结论，让学生便捷、容易地进入这个领域。本书的目标、讲授结构和关键点都与我在斯坦福大学的课程一致。出于精简内容的需要，本书没有更详细地展开一些课题，包括贝叶斯机制设计、紧凑型博弈的表示、计算社会选择、竞赛设计、合作博弈、加密货币和网络系统中的动机、市场均衡、预测市场、隐私、信誉系统和社会计算。以上这些问题很多都可以参考其他书目，包括Brandt等（2016）、Hartline（2016）、Nisan等（2007）、Parkes和Seuken（2016）、Shoham和Leyton-Brown（2009），以及Vojnovic′（2016）。
在每章的开头，我会给出该章的简要介绍。在本书的最后，列出了全书的10个主要知识点。除此以外，每章中正文结束后，都会将重点知识总结出来。除了作为简介的第1章以外，全书可分为三部分。第2～10章涵盖关于规则制定的理论，即“机制设计”，除理论介绍外，还讲述了在线广告、无线频谱拍卖和肾脏交换等实际问题。第11～15章介绍的是“无秩序代价”理论，这是关于实际博弈中均衡的近似保证的，例如，由自私且相互竞争的个体组成的大型网络就是这样一个博弈。第16～20章介绍的是关于均衡计算的一些结论，既包括积极的结论，也包括消极的结论。这部分是基于分布式学习算法和以计算效率为核心的算法对均衡进行分析和计算的。第二、三部分可以独立于第一部分单独学习。学习本书第三部分需要具备第13章的基础；另外，学习16.2和16.3节需要12.4节的基础，学习16.4节需要第14章的基础。标星号的章节包含较困难的理论和技术内容，可以选择性阅读。
本书假设读者有一定的数学基础，另外，第4、19、20章需要读者对多项式时间算法和NP完全性有基本了解。本书并不要求读者具备博弈论或经济学的背景，同时，本书也不能代替博弈论或经济学的传统教材。在斯坦福大学，上这门课的学生包括高年级本科生、硕士生和一年级博士生，他们来自不同的专业，包括计算机科学、经济学、电子工程、运筹学和数学等。
在每一章的正文之后，我都简要总结了与其相关的参考文献。课后练习部分可以作为对这一章的回顾或加强。问题部分比较困难，但能带领读者一步步走向新的研究成果。在本书的最后，我还给出了部分习题的提示，有提示的习题都带有“（H）”标记。
我的课堂教学视频已经上传到YouTube，可以在我的个人主页（www.timroug-hgarden.org）上找到链接。除此以外，还有其他几门理论计算机科学课程的讲义和视频，也可以在主页上找到。如果有关于本书内容的问题，可以到论坛（twentylecturesonagt.freeforums.net/）与我及其他读者进行讨论。
我要感谢参加我的课程的斯坦福大学学生，他们提出的问题和建议对我很有益处。感谢我的助教Peerapong Dhangwatnotai、Kostas Kollias、Okke Schrijvers、Mukund Sundararajan和Sergei Vassilvitskii。其中，Kostas和Okke帮助我准备了本书中的部分图示。感谢Yannai Gonczarowski、Warut Suksompong和Inbal Talgam-Cohen，他们对本书的草稿给出了详细的反馈。感谢Lauren Cowles、Michal Feldman、Vasilis Gkatzelis、Weiwei Jiang、Yishay Mansour、Michael Ostrovsky、Shay Palachy和Rakesh Vohra给出的诸多建议。本书封面是由Max Greenleaf Miller设计的。本书的撰写得到了美国国家科学基金会CCF-1215965和CCF-1524062项目的资助。
如果你有任何建议或发现了书中的疏漏之处，请不吝提出，非常感谢。

Tim Roughgarden
2016年6月
于斯坦福大学

上架指导

计算机科学及应用

封底文字

计算机科学与经济学的交互产生了“算法博弈论”这一新的研究领域。对于计算机科学中的诸多核心问题，其本质上都涉及多个自私个体之间的交互，经济学和博弈论为这样的问题提供了丰富的推理模型和定义系统。而对于传统经济学中的问题，计算机科学也起到了补充作用，例如关于计算复杂性、近似边界以及贝叶斯或平均情况分析的研究。

本书源于斯坦福大学“算法博弈论”课程讲义，通过具有代表性的模型和结论，帮助读者快速了解这一领域的重要概念。书中首先讨论关于规则制定的理论，即“机制设计”，包括在线广告、无线频谱拍卖和肾脏交换等实例，目标是设计一个由多个策略型参与者组成的系统，并保证其具有良好的性能。接下来介绍“无秩序代价”理论，围绕实际博弈中均衡的近似保证展开讨论，目标是了解在什么情况下自私的行为是良性的。最后介绍关于均衡计算的一些结论，基于分布式学习算法和以计算效率为核心的算法对均衡进行分析和计算，目标是研究如何使策略型参与者达到博弈均衡，以及达到均衡后的情形。

蒂姆·拉夫加登（Tim Roughgarden）哥伦比亚大学计算机科学系教授，之前曾任教于斯坦福大学，主要研究领域包括算法、博弈论以及微观经济学。他曾获得美国青年科学家与工程师总统奖（PECASE），ACM颁发的Grace Murray Hopper奖，Game Theory Society颁发的Kalai奖，Mathematical Programming Society颁发的Tucker奖，以及EATCS-SIGACT颁发的G?del奖。

郝东　电子科技大学副教授，研究领域为算法博弈论、最优决策、多智能体系统。

作者简介

[美]蒂姆·拉夫加登（Tim Roughgarden）著：---作者简介---
蒂姆·拉夫加登（Tim Roughgarden）哥伦比亚大学计算机科学系教授，之前曾任教于斯坦福大学，主要研究领域包括算法、博弈论以及微观经济学。他曾获得美国青年科学家与工程师总统奖（PECASE），ACM颁发的Grace Murray Hopper奖，Game Theory Society颁发的Kalai奖，Mathematical Programming Society颁发的Tucker奖，以及EATCS-SIGACT颁发的Gödel奖。

---译者简介---
郝东电子科技大学副教授，研究领域为算法博弈论、最优决策、多智能体系统。

译者序

我们该如何理解人的决策和交互，并使计算机程序能够像人一样进行决策和交互？本书所探讨的就是在由人或智能体所组成的系统中，个体是如何决策的；以及这样的系统该如何理解，如何设计。
算法博弈论处于博弈论和计算机的交叉领域。在诸多世界顶尖级学术机构中，均有开设此门课程。它已经成功应用于很多场景，包括搜索关键字竞拍、在线广告、机构选址、网络构建、频谱定价、婚恋匹配、无人机群、竞技游戏等,其中有些已经收获了巨大的商业效益。我们希望此次翻译能够让更多的人了解并喜欢这一学科。
原书是基于作者Tim Roughgarden多年的授课经验而写成的。如果能跟随作者的思路深入研习下去，定会受益匪浅。原书内容概述可见前言，此处不再赘述。
本书的翻译是我在讲授研究生课程“算法博弈论”的过程中，与我的学生李斌和刘凡共同完成的。我主要负责第1~7、11~15及19~20章。李斌主要负责第8~10及16~18章。刘凡对第5~7章进行了协助。全文的检查和修改由我和李斌完成。我们要感谢李凯、董涵、张冬呈、侯光伟、石琪、张永亮、郭宇航进行了读校并给出了宝贵的修改建议。感谢曲熠编辑的邀请和机械工业出版社的支持。
此书涉及博弈论、理论计算机、人工智能领域的诸多知识。我们力求翻译可靠、易读，但由于时间较紧，知识和经验均有限，译文难免存在不足，在此敬请各位学者和读者朋友批评指正，您的任何意见请发送到邮箱haodongpost@gmail.com。

郝　东
2019年12月6日

图书目录

出版者的话
译者序
前言
第1章　简介和实例1
　1.1　关于规则制定的科学1
　1.2　自私的行为在什么时候是近似最优的3
　　1.2.1　布雷斯悖论3
　　1.2.2　线与弹簧4
　1.3　策略型参与者能通过学习算出一个均衡吗4
　总结6
　说明6
　练习6
　问题7
第2章　机制设计基础8
　2.1　单物品拍卖8
　2.2　密封价格拍卖9
　2.3　一价拍卖9
　2.4　二价拍卖和占优策略9
　2.5　理想化拍卖11
　2.6　经典案例：关键字搜索拍卖12
　　2.6.1　背景知识12
　　2.6.2　关键字搜索拍卖的基本模型12
　　2.6.3　我们想要什么13
　　2.6.4　我们的设计方法13
　总结14
　说明14
　练习14
　问题16
第3章　迈尔森引理17
　3.1　单参数环境17
　3.2　分配规则和支付规则18
　3.3　迈尔森引理的内容19
　3.4　迈尔森引理的证明20
　3.5　支付公式的运用23
　总结24
　说明25
　练习25
　问题25
第4章　算法机制设计28
　4.1　背包拍卖28
　　4.1.1　问题定义28
　　4.1.2　福利最大化的DSIC背包拍卖29
　　4.1.3　关键报价29
　　4.1.4　福利最大化的计算困难性29
　4.2　算法机制设计30
　　4.2.1　最好的情况：免费的DSIC30
　　4.2.2　再谈背包拍卖31
　4.3　显示原理33
　　4.3.1　再谈DSIC33
　　4.3.2　直接显示的证明33
　　4.3.3　在占优策略均衡之外34
　总结34
　说明35
　练习35
　问题36
第5章　收益最大化拍卖39
　5.1　收益最大化的挑战39
　　5.1.1　我们被社会福利最大化“宠坏”了39
　　5.1.2　单竞拍者和单物品40
　　5.1.3　贝叶斯分析40
　　5.1.4　再谈单竞拍者和单物品41
　　5.1.5　多竞拍者41
　5.2　最优DSIC机制的性质42
　　5.2.1　准备工作42
　　5.2.2　虚拟估值42
　　5.2.3　期望收益等于期望虚拟福利43
　　5.2.4　最大化期望虚拟福利44
　　5.2.5　正则分布44
　　5.2.6　最优单物品拍卖45
　5.3　案例分析：关键字搜索拍卖中的保留价格46
　5.4　引理5.1的证明47
　总结48
　说明49
　练习49
　问题50
第6章　简单的近似最优拍卖52
　6.1　最优拍卖可能很复杂52
　6.2　预知不等式53
　6.3　简单的单物品拍卖54
　6.4　先验独立机制56
　总结57
　说明58
　练习58
　问题59
第7章　多参数机制设计61
　7.1　一般化的机制设计环境61
　7.2　VCG机制62
　7.3　实际的考量64
　总结65
　说明65
　练习65
　问题66
第8章　频谱拍卖68
　8.1　非直接机制68
　8.2　分开拍卖多个物品69
　8.3　案例分析：同时升价拍卖70
　　8.3.1　两个新手常见错误70
　　8.3.2　同时升价拍卖的优点71
　　8.3.3　需求缩减和披露问题72
　　8.3.4　发送竞价信号73
　8.4　组合竞价74
　8.5　案例分析：2016年FCC激励拍卖74
　总结77
　说明77
　练习77
　问题78
第9章　含支付约束的机制设计80
　9.1　预算约束80
　9.2　同一价格多单位拍卖81
　　9.2.1　多单位拍卖81
　　9.2.2　同一价格拍卖81
　　9.2.3　同一价格拍卖不是DSIC的82
　9.3　锁定拍卖82
　9.4　不含钱机制设计85
　总结87
　说明88
　练习88
　问题89
第10章　肾脏交换和稳定匹配91
　10.1　案例分析：肾脏交换91
　　10.1.1　背景91
　　10.1.2　使用TTC算法92
　　10.1.3　应用匹配算法93
　　10.1.4　医院方的动机因素96
　10.2　稳定匹配97
　　10.2.1　模型97
　　10.2.2　延迟接受算法98
　10.3　更多的性质99
　总结101
　说明101
　练习102
　问题102
第11章　自私路由与无秩序代价103
　11.1　自私路由103
　　11.1.1　布雷斯悖论103
　　11.1.2　Pigou示例104
　　11.1.3　Pigou示例：非线性变种104
　11.2　主要结论：非正式的表述105
　11.3　主要结论：正式的表述106
　11.4　技术准备108
　11.5　定理11.2的证明109
　总结110
　说明110
　练习111
　问题111
第12章　超额配置和单元自私路由113
　12.1　案例分析：网络超额配置113
　　12.1.1　超额配置的动机113
　　12.1.2　超额配置网络的POA界113
　12.2　资源增广界115
　12.3　定理12.1的证明115
　12.4　单元自私路由116
　12.5　定理12.3的证明118
　总结119
　说明120
　练习120
　问题121
第13章　均衡：定义、示例和存在性123
　13.1　均衡概念的层级结构123
　　13.1.1　代价最小化博弈124
　　13.1.2　纯策略纳什均衡124
　　13.1.3　混合策略纳什均衡124
　　13.1.4　相关均衡125
　　13.1.5　粗糙相关均衡126
　　13.1.6　示例127
　13.2　纯策略纳什均衡的存在性127
　　13.2.1　均衡分流的存在性127
　　13.2.2　非单元均衡分流的唯一性128
　　13.2.3　拥塞博弈129
　13.3　势博弈129
　总结129
　说明130
　练习130
　问题131
第14章　平滑博弈的鲁棒无秩序代价界133
　14.1　POA界四阶段式处理方法133
　14.2　选址博弈134
　　14.2.1　模型134
　　14.2.2　选址博弈的性质136
　　14.2.3　定理14.1的证明137
　14.3　平滑博弈138
　14.4　平滑博弈的鲁棒POA界139
　　14.4.1　PNE的POA界139
　　14.4.2　CCE的POA界139
　　14.4.3　近似PNE的POA界140
　总结141
　说明141
　练习142
　问题142
第15章　最好情况和强纳什均衡144
　15.1　网络代价分摊博弈144
　　15.1.1　外部性144
　　15.1.2　模型144
　　15.1.3　示例：VHS还是Betamax145
　　15.1.4　示例：退出博弈146
　15.2　稳定的代价147
　15.3　强纳什均衡的POA148
　15.4　定理15.3的证明150
　总结151
　说明152
　练习152
　问题152
第16章　最优反应动力学154
　16.1　势博弈中的最优反应动力学154
　16.2　自私路由博弈中的近似PNE156
　16.3　定理16.3的证明157
　16.4　平滑势博弈中的低代价结果159
　总结161
　说明161
　练习162
　问题162
第17章　无憾动力学164
　17.1　在线决策164
　　17.1.1　模型164
　　17.1.2　定义和示例165
　17.2　乘性权重算法166
　17.3　定理17.6的证明168
　　17.3.1　适应型对手与非适应型对手168
　　17.3.2　分析168
　17.4　无憾与粗糙相关均衡170
　　17.4.1　无憾动力学170
　　17.4.2　收敛到粗糙相关均衡171
　　17.4.3　结束语171
　总结172
　说明172
　练习173
　问题173
第18章　交换遗憾和最小最大化定理176
　18.1　交换遗憾和相关均衡176
　18.2　定理18.5的证明177
　18.3　零和博弈的最小最大化定理180
　　18.3.1　两人零和博弈180
　　18.3.2　最小最大化定理181
　18.4　定理18.7的证明182
　总结183
　说明183
　练习184
　问题184
第19章　纯策略纳什均衡和PLS完全性186
　19.1　什么情况下均衡是计算可行的186
　　19.1.1　计算可行性回顾186
　　19.1.2　动力学和算法187
　　19.1.3　计算困难性的结论188
　19.2　局部搜索问题188
　　19.2.1　经典示例：最大割问题188
　　19.2.2　PLS：抽象局部搜索问题190
　　19.2.3　PLS完全性192
　19.3　计算拥塞博弈的纯策略纳什均衡193
　　19.3.1　计算纯策略纳什均衡是PLS问题193
　　19.3.2　纯策略纳什均衡的计算是PLS完全问题194
　　19.3.3　对称拥塞博弈195
　总结196
　说明197
　练习197
　问题198
第20章　混合策略纳什均衡和PPAD完全性199
　20.1　双矩阵博弈的混合策略纳什均衡的计算199
　20.2　全NP搜索问题200
　　20.2.1　NP搜索问题200
　　20.2.2　具有证据的NP搜索问题201
　　20.2.3　语法的复杂度集与语义的复杂度集202
　　20.2.4　我们该做什么203
　20.3　PPAD：TFNP的一个语法子集204
　20.4　经典的PPAD问题实例：Sperner引理205
　20.5　混合策略纳什均衡和PPAD206
　　20.5.1　Sperner引理和纳什定理207
　　20.5.2　Lemke-Howson算法208
　　20.5.3　结语208
　20.6　讨论209
　总结209
　说明209
　练习210
　问题211
10个最重要的知识点213
部分练习及问题提示215
参考文献220