本书是一本从机器学习视角讲解计算机视觉的非常好的教材。全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握。作者展示了如何使用训练数据来学习观察到的图像数据和我们希望预测的现实世界现象之间的联系,以及如何如何研究这些联系来从新的图像数据中作出新的推理。本书要求最少的前导知识,从介绍概率和模型的基础知识开始,接着给出让学生能够实现和修改来构建有用的视觉系统的实际示例。适合作为计算机视觉和机器学习的高年级本科生或研究生的教材,书中详细的方法演示和示例对于计算机视觉领域的专业人员也非常有用。
“这本书是计算机视觉和机器学习相结合的产物。针对现代计算机视觉研究,本书讲述与之相关的机器学习基础。这真是一本好书,书中的任何知识点都表述得通俗易懂。当我读这本书的时候,我常常赞叹不已。对于从事计算机视觉的研究者与学生,本书是一本非常重要的书,我非常期待能够在课堂上讲授这门课。”
—— William T. Freeman,麻省理工学院
“本书针对计算机视觉学科深入浅出地介绍概率模型相应的数学基础知识,所描述的相关知识都配备了详细而准确的例子与应用。大多数现代计算机视觉重点研究视觉处理工作,本书是对当前这一现状完美的补充,本书重点讲述基本的技术,强调与学习和推理有关的模型以及相应的方法。每一个严谨的学生和研究者都将发现本书的价值。在过去的两年多时间里,在我所任课的视觉与学习课程中,我都用到了本书中相关章节的知识。同时,在接下来的时间里,我在授课过程中将继续参考本书。”
—— David J. Fleet,多伦多大学
“本书是Prince的代表作,为理解现代计算机视觉提供了一个完整的概率框架。借助简洁明了的知识点描述,意义明确的插图,相应的示例应用程序,相关的知识点练习,有关的数学背景知识及相关的伪代码,本书详细描述了学习计算机视觉这门学科所需要具备的所有知识。”
—— Roberto Cipolla,剑桥大学
现代计算机视觉领域的一个主题就是通过概率模型进行学习与推理,即如何通过训练数据来学习可观测到的图像数据与现实世界中需要估计的信息之间的关系,例如三维结构和目标类别等,以及如何应用这些关系,由新给定的图像数据来推断现实世界的信息。
学习本书时,几乎不需要背景知识。本书从最基本的概率知识和模型拟合开始讲解,并同时将相关的知识应用于现实问题中,读者据此可以直接应用或者改进这些方法来构建有用的视觉系统。编写本书的主要目的是满足研究生和高年级本科生的学习需求,同时书中描述的方法对于计算机视觉从业人员也是很有帮助的。
本书特色
包括所有的数学背景知识。
详细介绍现代计算机视觉的重要主题,包括图割、机器学习和多视图几何。
包含350多张插图,描述70多个算法,同时给出每个算法的实现细节。
更多教学和参考资源请访问本书网站www.computervisionmodels.com。
作者简介
西蒙 J. D. 普林斯(Simon J. D. Prince) 博士是伦敦大学学院计算机科学系高级讲师,讲授过机器视觉、图像处理和高等数学方法等课程。他拥有生物科学与计算机科学等多种学科背景,并在计算机视觉、生物学、心理学、生理学、医学成像、计算机图形学和人机交互等跨学科领域发表过多篇论文。
目前,已有很多关于计算机视觉的书籍,那么还有必要再写另外一本吗?下面解释撰写本书的原因。
计算机视觉是一门工程学科,机器在现实世界中捕获的视觉信息可以激发我们的积极性。因此,我们通过使用计算机视觉解决现实问题来对我们的知识进行分类。例如,大多数视觉教科书都包含目标识别和立体视觉内容。我们的学术研讨会也是用同样的模式进行组织的。本书对这一传统方式提出了质疑:这真的是我们组织自己知识的正确方法吗?
对于目标识别问题,目前已提出多种算法解决这一问题(例如子空间模型、boosting模型、语义包模型、星座模型等)然而,这些方法没有什么共同点。任何试图全面描述知识的壮举都会转变为一个非结构化的技术列表。我们怎样让新同学把所有的技术和理论都弄懂呢 我主张使用一种不同的方式来组织知识,但首先让我告诉大家我是如何看待计算机视觉问题的。
对于一幅图像,我们不仅要观察图像中的内容,同时还需要提取其测量值。例如,我们可以直接使用RGB值,或者对图像进行滤波处理,或者执行一些更复杂的预处理。计算机视觉的目标或者需要解决的问题是使用这些测量值来推理全局状态。例如:在立体视觉中,我们尝试推断出场景的深度。在目标识别中,我们尝试推断某一特定类目标存在与否。
为了实现目标,我们建立一个模型。模型描述了测量值与全局状态之间的一系列统计关系。这一系列统计关系中的特殊成员是由一个参数集合确定的。在学习的过程中,选择这些参数,以便它们能够准确反映测量值与全局状态之间的关系。在推理的过程中,选用一组新的测量值,并利用学习后的模型来推理全局状态。学习和推理的方法包含在算法中。我认为计算机视觉应该从以下几方面来理解:目标、测量值、全局状态、模型、参数、学习和推理算法。
我们可以根据这些量选择性地组织知识,但在我看来,模型中最重要的内容是全局状态和测量值之间的统计关系。这主要有三个原因。首先,模型的类型往往超越了应用(同一个模型可用于不同的视觉任务);其次,模型能够自然地把它们自身组织成一些可分开理解的系列(例如,回归、马尔可夫随机场、相机模型);最后,在模型层次上讨论视觉问题使得我们能够得到那些貌似不相关的算法和应用之间的关联。因此,本书的章节安排非常巧妙,每个主要的章节都讨论一系列不同的模型。
最后一点,本书中的大部分思想在第一次接触到时是难以理解的。因此,我的目标是使后续研究计算机视觉的学生更容易理解这些内容,我希望这本书能够达到这一目的,并能够激励读者深入了解计算机视觉。
原出版社网站和作者网站(www.computervisionmodels.com)上包含丰富的教辅和参考资源,包括教学幻灯片、插图文件、书中包含算法和模型的详细介绍、源代码、进一步阅读资源、相关课程的教学大纲以及部分习题答案。书中全部习题答案,只有使用本书作为教材的教师才可以申请,需要的教师可向剑桥大学出版社北京代表处申请,电子邮件:solutions@cambridgeorg。——编辑注
致谢
非常感谢以下阅读本书并提出宝贵意见的读者:Yun Fu、David Fleet、Alan Jepson、Marc’Aurelio Ranzato、Gabriel Brostow、Oisin Mac Aodha、Xiwen Chen、PoHsiu Lin、Jose Tejero Alonso、Amir Sani、Oswald Aldrian、Sara Vicente、Jozef Dobos、Andrew Fitzgibbon、Michael Firman、Gemma Morgan、Daniyar Turmukhambetov、Daniel Alexander、Mihaela Lapusneanu、JohnWinn、Petri Hiltunen、Jania Aghajanian、Alireza Bossaghzadeh、Mikhail Sizintsev、Roger De SouzaEremita、Jacques Cali、Roderick de Nijs、James Tompkin、Jonathan O’Keefe、Benedict Kuester、Tom Hart、Marc Kerstein、Alex Borés、Marius Cobzarenco、Luke Dodd、Ankur Agarwal、Ahmad Humayun、Andrew Glennerster、Steven Leigh、Matteo Munaro、Peter van Beek、Hu Feng、Martin Parsley、Jordi Salvador Marcos、Josephine Sullivan、Steve Thompson、Laura Panagiotaki、Damien Teney、Malcolm Reynolds、Francisco Estrada、Peter Hall、James Elder、Paria Mehrani、Vida Movahedi、Eduardo Corral Soto、Ron Tal、Bob Hou、Simon Arridge、Norberto Goussies、Steve Walker、Tracy Petrie、Kostantinos Derpanis、Bernard Buxton、Matthew Pediaditis、Fernando FloresMangas、Jan Kautz、Alastair Moore、Yotam Doron、Tahir Majeed、David Barber、Pedro Quelhas、Wenchao Zhang、Alan Angold、Andrew Davison、Alex Yakubovich、Fatemeh Jamali、David Lowe、Ricardo David、Jamie Shotton、Andrew Zisserman、Sanchit Singh、Vincent Lepetit、David Liu、Marc Pollefeys、Christos Panagiotou、Ying Li、Shoaib Ehsan、Olga Veksler、Modesto Castrillón Santana、Axel Pinz、Matteo Zanotto、Gwynfor Jones、Brian Jensen、Mischa Schirris、Jacek Zienkiewicz、Etienne Beauchesne、Erik Sudderth、Giovanni Saponaro、Moos Hueting、Phi Hung Nguyen、Tran Duc Hieu、Simon Julier、Oscar Plag、Thomas Hoyoux、Abhinav Singh、Dan Farmer、Samit Shah、Martijn van der Veen、Gabriel Brostow、Marco Brambilla、Sebastian Stabinger、Tamaki Toru、Stefan Stavref、Xiaoyang Tan、Hao Guan、William Smith、Shanmuganathan Raman、Mikhail Atroshenko、Xiaoyang Tan、Jonathan Weill、Shotaro Moriya和Alessandro Gentilini。 他们无私的帮助使得本书在质量上得到了较大的提升。
此外,非常感谢Sven Dickinson在本书写作期间对我在多伦多大学长达九个月的关照,感谢Stephen Boyd让我使用他的完美LaTeX模板,感谢Mikhail Sizintsev帮助我总结密集立体视觉中杂乱的文献资料。特别感谢Gabriel Brostow 在阅读完本书的整稿之后,利用他宝贵的时间和我讨论书中的相关内容。最后,感谢Bernard Buxton对我在本研究领域的启蒙教导,以及在计算机视觉和我职业生涯的每个阶段的支持。
计算机\人工智能
“这本书是计算机视觉和机器学习相结合的产物。针对现代计算机视觉研究,本书讲述与之相关的机器学习基础。这真是一本好书,书中的任何知识点都表述得通俗易懂。当我读这本书的时候,我常常赞叹不已。对于从事计算机视觉的研究者与学生,本书是一本非常重要的书,我非常期待能够在课堂上讲授这门课”。
——William T. Freeman,麻省理工学院
“本书针对计算机视觉学科深入浅出地介绍概率模型相应的数学基础知识,所描述的相关知识都配备了详细而准确的例子与应用。大多数现代计算机视觉重点研究视觉处理工作,本书是对当前这一现状完美的补充,本书重点讲述基本的技术,强调与学习和推理有关的模型以及相应的方法。每一个严谨的学生和研究者都将发现这本书的价值。在过去的两年多时间里,在我所任课的视觉与学习课程中,我都用到了本书中相关章节的知识。同时,在接下来的时间里,我在授课过程中将继续参考本书。”
——David J.Fleet,多伦多大学
“本书是Price的代表作,为理解现代计算机视觉提供了一个完整的概率框架。借助简洁明了的知识点描述,意义明确的插图,相应的示例应用程序,相关的知识点练习,有关的数学背景知识及相关的伪代码,本书详细描述了学习计算机视觉这门学科所需要具备的所有知识。”
——Roberto Cipolla,剑桥大学
现代计算机视觉领域的一个主题就是通过概率模型进行学习与推理,即如何通过训练数据来学习可观测到的图像数据与现实世界中需要估计的信息之间的关系,例如三维结构和目标类别等,以及如何应用这些关系,由新给定的图像数据来推断现实世界的信息。
学习本书时,几乎不需要背景知识。本书从最基本的概率知识和模型拟合开始讲解,并同时将相关的知识应用于现实问题中,读者据此可以直接应用或者改进这些方法来构建有用的视觉系统。编写本书的主要目的是满足研究生和高年级本科生的学习需求,同时书中描述的方法对于计算机视觉从业人员也是很有帮助的。
本书特色:
包括所有的数学背景知识。
详细介绍现代计算机视觉的重要主题,包括图割、机器学习和多视图几何。
包含350多张插图,描述70多个算法,同时给出每个算法的实现细节。
更多教学和参考资源请访问本书网站www.computervisionmodels.com。
作者简介:
西蒙 J. D. 普林斯(Simon J. D. Prince)博士是伦敦大学学院计算机科学系高级讲师,讲授过机器视觉、图像处理和高等数学方法等课程。Prince教授拥有生物科学与计算机科学等多种学科背景,并在计算机视觉、生物学、心理学、生理学、医学成像、计算机图形学和人机交互等跨学科领域发表过多篇论文。
[英]西蒙 J.D. 普林斯(Simon J. D. Prince)著:暂无简介
苗启广 刘凯 孔韦韦 许鹏飞 译:暂无简介
2014年上半年,我在美国宾夕法尼亚州访问时,在图书馆发现了《Computer Vision:Models,Learning,and Inference》这本书,书名使我眼前豁然一亮。书中对模型、算法、学习、推理以及基础知识等方面的介绍深入浅出、通俗易懂,深深地吸引着研究计算机视觉技术的我。作者Simon J. D. Prince是伦敦大学学院计算机科学系的知名教授,在生物学、计算机科学等多学科交叉领域颇有建树。一年后,机械工业出版社的策划编辑姚蕾和朱劼联系我,期望我组织翻译本书,我毫不犹豫地欣然接受。
计算机视觉和机器学习相结合,是计算机视觉领域研究的热点,也是难点。本书正是计算机视觉和机器学习相结合的典范之作,清晰明了地阐述一般计算机视觉研究者易于混淆的“模型”与“算法”的区别。本书重点关注基本的技术,强调与学习和推理有关的模型以及相应的方法,其主要特点是知识体系系统、完整,不仅包括计算机视觉的相关理论,而且包括所有的数学背景知识。更重要的是,介绍与机器学习相关的基础知识,并将计算机视觉与机器学习有机地融合起来。考虑到读者最低限度的知识储备情况,本书从概率和模式匹配的基础知识开始,逐步讲解到实际实验,读者通过完成和修改这些实验,就可以建立起可用的视觉系统。
本书包含大量插图,描述了70多个算法,同时详细地阐述每个算法的实现细节,细致入微地阐述计算机视觉与机器学习的方方面面,为方便读者理解现代计算机视觉提供了一个完整的概率框架。本书主要适用于计算机视觉和机器学习研究方向的高年级本科生和研究生,书中对各种方法的详细描述也能够帮助计算机视觉的初学者进行学习。
本书由西安电子科技大学的苗启广教授组织翻译,参与的译者有西安电子科技大学的刘凯教授、西安邮电大学的孔韦韦副教授和西北大学的许鹏飞老师,其中苗启广翻译了第9、10、11和19章,刘凯翻译了第1~8章,孔韦韦翻译了第12~15章和附录部分,许鹏飞翻译了第16~18章和第20章以及前言等内容,统稿和审校由苗启广和刘凯共同完成。
本书的翻译工作涉及非常多计算机视觉基础知识的准确翻译,大量术语的统一,多位译者的交流沟通以及字斟句酌的研读等,既从头至尾充满着挑战,又洋溢着团结、合作的气氛,更不时分享逐步成文的喜悦。在此要感谢武警工程大学的雷阳博士,西安电子科技大学的博士研究生刘家辰、刘如意、李宇楠、程飞,硕士研究生孙尔强、范莹莹、黄玉辉、黄志新等,他们在书稿初译、译文修改、统一术语等方面做了大量的工作。感谢机械工业出版社的策划编辑姚蕾和其他编辑,他们为本书的出版付出了大量劳动,认真编辑书稿并提出了修改意见。
谨以本书献给致力于计算机视觉算法研究和开发设计的读者,翻译不足之处请批评指正!
苗启广
译者序
译者简介
序
前言
第1章绪论1
11本书结构2
12其他书籍4
第一部分概率
第2章概率概述6
21随机变量6
22联合概率7
23边缘化7
24条件概率8
25贝叶斯公式9
26独立性9
27期望10
讨论10
备注11
习题11
第3章常用概率分布12
31伯努利分布13
32贝塔分布13
33分类分布14
34狄利克雷分布14
35一元正态分布15
36正态逆伽马分布15
37多元正态分布16
38正态逆维希特分布16
39共轭性17
总结18
备注18
习题18
第4章拟合概率模型21
41最大似然法21
42最大后验法21
43贝叶斯方法22
44算例1:一元正态分布22
441最大似然估计22
442最大后验估计24
443贝叶斯方法26
45算例2:分类分布28
451最大似然法28
452最大后验法29
453贝叶斯方法30
总结31
备注31
习题32
第5章正态分布34
51协方差矩阵的形式34
52协方差分解35
53变量的线性变换36
54边缘分布36
55条件分布37
56正态分布的乘积38
57变量改变38
总结38
备注39
习题39
第二部分机器视觉的机器学习
第6章视觉学习和推理42
61计算机视觉问题42
62模型的种类42
621判别模型43
622生成模型43
63示例1:回归43
631判别模型44
632生成模型44
64示例2:二值分类46
641判别模型46
642生成模型46
65应该用哪种模型48
66应用49
661皮肤检测49
662背景差分50
总结51
备注51
习题52
第7章复杂数据密度建模54
71正态分类模型54
72隐变量56
73期望最大化57
74混合高斯模型58
741混合高斯边缘化59
742基于期望最大化的混合模型拟合59
75t分布63
751学生t分布边缘化64
752拟合t分布的期望最大化65
76因子分析67
761因子分析的边缘分布68
762因子分析学习的期望最大化68
77组合模型71
78期望最大化算法的细节71
781期望最大化算法的下界73
782E步74
783M步74
79应用75
791人脸检测75
792目标识别76
793分割77
794正脸识别78
795改变人脸姿态(回归)78
796作为隐变量的变换79
总结80
备注80
习题81
第8章回归模型82
81线性回归82
811学习83
812线性回归模型的问题83
82贝叶斯线性回归84
821实际考虑85
822拟合方差86
83非线性回归87
831最大似然法87
832贝叶斯非线性回归89
84核与核技巧89
85高斯过程回归90
86稀疏线性回归91
87二元线性回归93
88相关向量回归95
89多变量数据回归96
810应用96
8101人体姿势估计96
8102位移专家97
讨论98
备注98
习题98
第9章分类模型100
91逻辑回归100
911学习:最大似然估计102
912逻辑回归模型的问题103
92贝叶斯逻辑回归104
921学习104
922推理106
93非线性逻辑回归107
94对偶逻辑回归模型108
95核逻辑回归110
96相关向量分类111
97增量拟合和boosting113
98分类树116
99多分类逻辑回归117
910随机树、随机森林和随机蕨分类器118
911与非概率模型的联系119
912应用120
9121性别分类120
9122脸部和行人检测121
9123语义分割122
9124恢复表面布局123
9125人体部位识别124
讨论125
备注125
习题127
第三部分连接局部模型
第10章图模型130
101条件独立性130
102有向图模型131
1021示例1132
1022示例2132
1023示例3133
1024总结134
103无向图模型134
1031示例1135
1032示例2136
104有向图模型与无向图模型的对比136
105计算机视觉中的图模型137
106含有多个未知量的模型推理139
1061求最大后验概率的解139
1062求后验概率分布的边缘分布139
1063最大化边缘140
1064后验分布的采样140
107样本采样140
1071有向图模型的采样141
1072无向图模型的采样141
108学习142
1081有向图模型的学习142
1082无向图模型的学习143
讨论145
备注145
习题145
第11章链式模型和树模型147
111链式模型148
1111有向链式模型148
1112无向链式模型148
1113模型的等价性148
1114隐马尔可夫模型在手语中的应用149
112链式MAP推理149
113树的MAP推理152
114链式边缘后验推理155
1141求解边缘分布155
1142前向后向算法156
1143置信传播157
1144链式模型的和积算法158
115树的边缘后验推理160
116链式模型和树模型的学习161
117链式模型和树模型之外的东西161
118应用163
1181手势跟踪163
1182立体视觉164
1183形象化结构166
1184分割167
讨论167
备注168
习题169
第12章网格模型172
121马尔可夫随机场172
1211网格示例173
1212离散成对MRF图像去噪174
122二值成对马尔可夫随机场的MAP推理175
1221最大流/最小割176
1222MAP推理:二值变量177
123多标签成对MRF的MAP推理182
124非凸势的多标签MRF186
125条件随机场189
126高阶模型190
127网格有向模型190
128应用191
1281背景差分191
1282交互式分割192
1283立体视觉193
1284图像重排193
1285超分辨率195
1286纹理合成196
1287合成新面孔197
讨论198
备注198
习题200
第四部分预处理
第13章图像预处理与特征提取204
131逐像素变换204
1311白化204
1312直方图均衡化205
1313线性滤波206
1314局部二值模式210
1315纹理基元映射211
132边缘、角点和兴趣点212
1321Canny边缘检测器212
1322Harris角点检测器214
1323SIFT检测器215
133描述子216
1331直方图216
1332SIFT描述子216
1333方向梯度直方图217
1334词袋描述子218
1335形状内容描述子218
134降维219
1341单数值近似220
1342主成分分析221
1343二元主成分分析221
1344K均值算法222
结论223
备注223
习题224
第五部分几何模型
第14章针孔摄像机228
141针孔摄像机简介228
1411归一化摄像机229
1412焦距参数230
1413偏移量和偏移参数230
1414摄像机的位置与方向231
1415全针孔摄像机模型232
1416径向畸变232
142三个几何问题233
1421问题1:学习外在参数233
1422问题2:学习内在参数234
1423问题3:推理3D世界点235
1424解决问题235
143齐次坐标236
144学习外在参数237
145学习内在参数239
146推理3D世界点240
147应用241
1471结构光的深度241
1472剪影重构243
讨论245
备注245
习题246
第15章变换模型249
151二维变换模型249
1511欧氏变换模型249
1512相似变换模型251
1513仿射变换模型252
1514投影变换模型252
1515增加不确定性254
152变换模型中的学习255
1521学习欧氏参数255
1522学习相似参数256
1523学习仿射参数256
1524学习投影参数257
153变换模型中的推理258
154平面的三个几何问题258
1541问题1:学习外在参数258
1542问题2:学习内在参数260
1543问题3:与摄像机相关的3D位置推理261
155图像间的变换261
1551单应性的几何特征262
1552计算图像间的变换263
156变换的鲁棒学习264
1561RANSAC264
1562连续RANSAC265
1563PEaRL266
157应用268
1571增强现实追踪268
1572视觉全景269
讨论270
备注270
习题271
第16章多摄像机系统273
161双视图几何学理论273
1611极线约束274
1612极点274
162实矩阵275
1621实矩阵的属性276
1622实矩阵的分解277
163基础矩阵279
1631基础矩阵的估计279
16328点算法280
164双视图重构的流程281
165校正284
1651平面校正284
1652极面校正286
1653校正后处理287
166多视图重构287
167应用290
1671三维重构290
1672图片浏览291
1673立体图割292
讨论293
备注293
习题294
第六部分视觉模型
第17章形状模型298
171形状及其表示298
172snake模型299
1721推理301
1722snake模型中存在的问题301
173形状模板302
1731推理303
1732用迭代最近点算法进行推理304
174统计形状模型304
1741学习305
1742推理306
175子空间形状模型306
1751概率主成分分析307
1752学习308
1753推理309
176三维形状模型311
177形状和外观的统计模型311
1771学习313
1772推理314
178非高斯统计形状模型315
1781回归PPCA315
1782高斯过程隐变量模型316
179铰接式模型317
1710应用319
17101三维形变模型319
17102三维人体模型321
讨论322
备注322
习题324
第18章身份与方式模型326
181子空间身份模型328
1811学习329
1812推理331
1813在其他识别任务中的推理332
1814身份子空间模型的局限性333
182概率线性判别分析334
1821学习335
1822推理335
183非线性身份模型336
184非对称双线性模型337
1841学习339
1842推理339
185对称双线性和多线性模型341
1851学习342
1852推理343
1853多线性模型344
186应用344
1861人脸识别344
1862纹理建模345
1863动画合成346
讨论346
备注346
习题348
第19章时序模型349
191时序估计框架349
1911推理350
1912学习350
192卡尔曼滤波器351
1921推理351
1922改写测量合并阶段352
1923推理总结353
1924示例1353
1925示例2354
1926滤波355
1927时序和测量模型356
1928卡尔曼滤波器的问题358
193扩展卡尔曼滤波器358
194无损卡尔曼滤波器360
1941状态演化361
1942测量合并过程362
195粒子滤波363
1951时间演化364
1952测量合并364
1953扩展366
196应用366
1961行人跟踪366
1962单目的即时定位与地图构建366
1963在复杂背景中跟踪轮廓线367
讨论369
备注369
习题370
第20章视觉词模型372
201视觉词集合的图像372
202词袋373
2021学习374
2022推理374
2023词袋模型的相关问题375
203隐狄利克雷分布376
2031学习377
2032非监督物体检测379
204单一创作主题模型380
2041学习381
2042推理382
205星座模型382
2051学习383
2052推理385
206场景模型385
207应用386
2071视频搜索386
2072行为识别387
讨论388
备注389
习题389
第七部分附录
附录A符号说明392
附录B最优化394
附录C线性代数402
参考文献413