计算机视觉:模型、学习和推理
作者 : [英]西蒙 J.D. 普林斯(Simon J. D. Prince)著
译者 : 苗启广 刘凯 孔韦韦 许鹏飞 译
丛书名 : 计算机科学丛书
出版日期 : 2017-06-20
ISBN : 978-7-111-51682-8
定价 : 119.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 466
开本 : 16
原书名 : Computer Vision: Models, Learning, and Inference
原出版社: Cambridge University Press
属性分类: 教材
包含CD :
绝版 :
图书简介

本书是一本从机器学习视角讲解计算机视觉的非常好的教材。全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握。作者展示了如何使用训练数据来学习观察到的图像数据和我们希望预测的现实世界现象之间的联系,以及如何如何研究这些联系来从新的图像数据中作出新的推理。本书要求最少的前导知识,从介绍概率和模型的基础知识开始,接着给出让学生能够实现和修改来构建有用的视觉系统的实际示例。适合作为计算机视觉和机器学习的高年级本科生或研究生的教材,书中详细的方法演示和示例对于计算机视觉领域的专业人员也非常有用。

图书特色

“这本书是计算机视觉和机器学习相结合的产物。针对现代计算机视觉研究,本书讲述与之相关的机器学习基础。这真是一本好书,书中的任何知识点都表述得通俗易懂。当我读这本书的时候,我常常赞叹不已。对于从事计算机视觉的研究者与学生,本书是一本非常重要的书,我非常期待能够在课堂上讲授这门课。”
—— William T. Freeman,麻省理工学院

“本书针对计算机视觉学科深入浅出地介绍概率模型相应的数学基础知识,所描述的相关知识都配备了详细而准确的例子与应用。大多数现代计算机视觉重点研究视觉处理工作,本书是对当前这一现状完美的补充,本书重点讲述基本的技术,强调与学习和推理有关的模型以及相应的方法。每一个严谨的学生和研究者都将发现本书的价值。在过去的两年多时间里,在我所任课的视觉与学习课程中,我都用到了本书中相关章节的知识。同时,在接下来的时间里,我在授课过程中将继续参考本书。”
—— David J. Fleet,多伦多大学
“本书是Prince的代表作,为理解现代计算机视觉提供了一个完整的概率框架。借助简洁明了的知识点描述,意义明确的插图,相应的示例应用程序,相关的知识点练习,有关的数学背景知识及相关的伪代码,本书详细描述了学习计算机视觉这门学科所需要具备的所有知识。”
—— Roberto Cipolla,剑桥大学

现代计算机视觉领域的一个主题就是通过概率模型进行学习与推理,即如何通过训练数据来学习可观测到的图像数据与现实世界中需要估计的信息之间的关系,例如三维结构和目标类别等,以及如何应用这些关系,由新给定的图像数据来推断现实世界的信息。
学习本书时,几乎不需要背景知识。本书从最基本的概率知识和模型拟合开始讲解,并同时将相关的知识应用于现实问题中,读者据此可以直接应用或者改进这些方法来构建有用的视觉系统。编写本书的主要目的是满足研究生和高年级本科生的学习需求,同时书中描述的方法对于计算机视觉从业人员也是很有帮助的。
本书特色
包括所有的数学背景知识。
详细介绍现代计算机视觉的重要主题,包括图割、机器学习和多视图几何。
包含350多张插图,描述70多个算法,同时给出每个算法的实现细节。
更多教学和参考资源请访问本书网站www.computervisionmodels.com。

作者简介
西蒙 J. D. 普林斯(Simon J. D. Prince) 博士是伦敦大学学院计算机科学系高级讲师,讲授过机器视觉、图像处理和高等数学方法等课程。他拥有生物科学与计算机科学等多种学科背景,并在计算机视觉、生物学、心理学、生理学、医学成像、计算机图形学和人机交互等跨学科领域发表过多篇论文。

图书前言

目前,已有很多关于计算机视觉的书籍,那么还有必要再写另外一本吗?下面解释撰写本书的原因。
计算机视觉是一门工程学科,机器在现实世界中捕获的视觉信息可以激发我们的积极性。因此,我们通过使用计算机视觉解决现实问题来对我们的知识进行分类。例如,大多数视觉教科书都包含目标识别和立体视觉内容。我们的学术研讨会也是用同样的模式进行组织的。本书对这一传统方式提出了质疑:这真的是我们组织自己知识的正确方法吗?
对于目标识别问题,目前已提出多种算法解决这一问题(例如子空间模型、boosting模型、语义包模型、星座模型等)然而,这些方法没有什么共同点。任何试图全面描述知识的壮举都会转变为一个非结构化的技术列表。我们怎样让新同学把所有的技术和理论都弄懂呢 我主张使用一种不同的方式来组织知识,但首先让我告诉大家我是如何看待计算机视觉问题的。
对于一幅图像,我们不仅要观察图像中的内容,同时还需要提取其测量值。例如,我们可以直接使用RGB值,或者对图像进行滤波处理,或者执行一些更复杂的预处理。计算机视觉的目标或者需要解决的问题是使用这些测量值来推理全局状态。例如:在立体视觉中,我们尝试推断出场景的深度。在目标识别中,我们尝试推断某一特定类目标存在与否。
为了实现目标,我们建立一个模型。模型描述了测量值与全局状态之间的一系列统计关系。这一系列统计关系中的特殊成员是由一个参数集合确定的。在学习的过程中,选择这些参数,以便它们能够准确反映测量值与全局状态之间的关系。在推理的过程中,选用一组新的测量值,并利用学习后的模型来推理全局状态。学习和推理的方法包含在算法中。我认为计算机视觉应该从以下几方面来理解:目标、测量值、全局状态、模型、参数、学习和推理算法。
我们可以根据这些量选择性地组织知识,但在我看来,模型中最重要的内容是全局状态和测量值之间的统计关系。这主要有三个原因。首先,模型的类型往往超越了应用(同一个模型可用于不同的视觉任务);其次,模型能够自然地把它们自身组织成一些可分开理解的系列(例如,回归、马尔可夫随机场、相机模型);最后,在模型层次上讨论视觉问题使得我们能够得到那些貌似不相关的算法和应用之间的关联。因此,本书的章节安排非常巧妙,每个主要的章节都讨论一系列不同的模型。
最后一点,本书中的大部分思想在第一次接触到时是难以理解的。因此,我的目标是使后续研究计算机视觉的学生更容易理解这些内容,我希望这本书能够达到这一目的,并能够激励读者深入了解计算机视觉。
原出版社网站和作者网站(www.computervisionmodels.com)上包含丰富的教辅和参考资源,包括教学幻灯片、插图文件、书中包含算法和模型的详细介绍、源代码、进一步阅读资源、相关课程的教学大纲以及部分习题答案。书中全部习题答案,只有使用本书作为教材的教师才可以申请,需要的教师可向剑桥大学出版社北京代表处申请,电子邮件:solutions@cambridgeorg。——编辑注
致谢
非常感谢以下阅读本书并提出宝贵意见的读者:Yun Fu、David Fleet、Alan Jepson、Marc’Aurelio Ranzato、Gabriel Brostow、Oisin Mac Aodha、Xiwen Chen、PoHsiu Lin、Jose Tejero Alonso、Amir Sani、Oswald Aldrian、Sara Vicente、Jozef Dobos、Andrew Fitzgibbon、Michael Firman、Gemma Morgan、Daniyar Turmukhambetov、Daniel Alexander、Mihaela Lapusneanu、JohnWinn、Petri Hiltunen、Jania Aghajanian、Alireza Bossaghzadeh、Mikhail Sizintsev、Roger De SouzaEremita、Jacques Cali、Roderick de Nijs、James Tompkin、Jonathan O’Keefe、Benedict Kuester、Tom Hart、Marc Kerstein、Alex Borés、Marius Cobzarenco、Luke Dodd、Ankur Agarwal、Ahmad Humayun、Andrew Glennerster、Steven Leigh、Matteo Munaro、Peter van Beek、Hu Feng、Martin Parsley、Jordi Salvador Marcos、Josephine Sullivan、Steve Thompson、Laura Panagiotaki、Damien Teney、Malcolm Reynolds、Francisco Estrada、Peter Hall、James Elder、Paria Mehrani、Vida Movahedi、Eduardo Corral Soto、Ron Tal、Bob Hou、Simon Arridge、Norberto Goussies、Steve Walker、Tracy Petrie、Kostantinos Derpanis、Bernard Buxton、Matthew Pediaditis、Fernando FloresMangas、Jan Kautz、Alastair Moore、Yotam Doron、Tahir Majeed、David Barber、Pedro Quelhas、Wenchao Zhang、Alan Angold、Andrew Davison、Alex Yakubovich、Fatemeh Jamali、David Lowe、Ricardo David、Jamie Shotton、Andrew Zisserman、Sanchit Singh、Vincent Lepetit、David Liu、Marc Pollefeys、Christos Panagiotou、Ying Li、Shoaib Ehsan、Olga Veksler、Modesto Castrillón Santana、Axel Pinz、Matteo Zanotto、Gwynfor Jones、Brian Jensen、Mischa Schirris、Jacek Zienkiewicz、Etienne Beauchesne、Erik Sudderth、Giovanni Saponaro、Moos Hueting、Phi Hung Nguyen、Tran Duc Hieu、Simon Julier、Oscar Plag、Thomas Hoyoux、Abhinav Singh、Dan Farmer、Samit Shah、Martijn van der Veen、Gabriel Brostow、Marco Brambilla、Sebastian Stabinger、Tamaki Toru、Stefan Stavref、Xiaoyang Tan、Hao Guan、William Smith、Shanmuganathan Raman、Mikhail Atroshenko、Xiaoyang Tan、Jonathan Weill、Shotaro Moriya和Alessandro Gentilini。 他们无私的帮助使得本书在质量上得到了较大的提升。
此外,非常感谢Sven Dickinson在本书写作期间对我在多伦多大学长达九个月的关照,感谢Stephen Boyd让我使用他的完美LaTeX模板,感谢Mikhail Sizintsev帮助我总结密集立体视觉中杂乱的文献资料。特别感谢Gabriel Brostow 在阅读完本书的整稿之后,利用他宝贵的时间和我讨论书中的相关内容。最后,感谢Bernard Buxton对我在本研究领域的启蒙教导,以及在计算机视觉和我职业生涯的每个阶段的支持。

上架指导

计算机\人工智能

封底文字

“这本书是计算机视觉和机器学习相结合的产物。针对现代计算机视觉研究,本书讲述与之相关的机器学习基础。这真是一本好书,书中的任何知识点都表述得通俗易懂。当我读这本书的时候,我常常赞叹不已。对于从事计算机视觉的研究者与学生,本书是一本非常重要的书,我非常期待能够在课堂上讲授这门课”。
——William T. Freeman,麻省理工学院
“本书针对计算机视觉学科深入浅出地介绍概率模型相应的数学基础知识,所描述的相关知识都配备了详细而准确的例子与应用。大多数现代计算机视觉重点研究视觉处理工作,本书是对当前这一现状完美的补充,本书重点讲述基本的技术,强调与学习和推理有关的模型以及相应的方法。每一个严谨的学生和研究者都将发现这本书的价值。在过去的两年多时间里,在我所任课的视觉与学习课程中,我都用到了本书中相关章节的知识。同时,在接下来的时间里,我在授课过程中将继续参考本书。”
——David J.Fleet,多伦多大学
“本书是Price的代表作,为理解现代计算机视觉提供了一个完整的概率框架。借助简洁明了的知识点描述,意义明确的插图,相应的示例应用程序,相关的知识点练习,有关的数学背景知识及相关的伪代码,本书详细描述了学习计算机视觉这门学科所需要具备的所有知识。”
——Roberto Cipolla,剑桥大学

现代计算机视觉领域的一个主题就是通过概率模型进行学习与推理,即如何通过训练数据来学习可观测到的图像数据与现实世界中需要估计的信息之间的关系,例如三维结构和目标类别等,以及如何应用这些关系,由新给定的图像数据来推断现实世界的信息。

学习本书时,几乎不需要背景知识。本书从最基本的概率知识和模型拟合开始讲解,并同时将相关的知识应用于现实问题中,读者据此可以直接应用或者改进这些方法来构建有用的视觉系统。编写本书的主要目的是满足研究生和高年级本科生的学习需求,同时书中描述的方法对于计算机视觉从业人员也是很有帮助的。

本书特色:
 包括所有的数学背景知识。
 详细介绍现代计算机视觉的重要主题,包括图割、机器学习和多视图几何。
 包含350多张插图,描述70多个算法,同时给出每个算法的实现细节。
 更多教学和参考资源请访问本书网站www.computervisionmodels.com。

作者简介:
西蒙 J. D. 普林斯(Simon J. D. Prince)博士是伦敦大学学院计算机科学系高级讲师,讲授过机器视觉、图像处理和高等数学方法等课程。Prince教授拥有生物科学与计算机科学等多种学科背景,并在计算机视觉、生物学、心理学、生理学、医学成像、计算机图形学和人机交互等跨学科领域发表过多篇论文。

作者简介

[英]西蒙 J.D. 普林斯(Simon J. D. Prince)著:暂无简介

译者简介

苗启广 刘凯 孔韦韦 许鹏飞 译:暂无简介

译者序

2014年上半年,我在美国宾夕法尼亚州访问时,在图书馆发现了《Computer Vision:Models,Learning,and Inference》这本书,书名使我眼前豁然一亮。书中对模型、算法、学习、推理以及基础知识等方面的介绍深入浅出、通俗易懂,深深地吸引着研究计算机视觉技术的我。作者Simon J. D. Prince是伦敦大学学院计算机科学系的知名教授,在生物学、计算机科学等多学科交叉领域颇有建树。一年后,机械工业出版社的策划编辑姚蕾和朱劼联系我,期望我组织翻译本书,我毫不犹豫地欣然接受。
计算机视觉和机器学习相结合,是计算机视觉领域研究的热点,也是难点。本书正是计算机视觉和机器学习相结合的典范之作,清晰明了地阐述一般计算机视觉研究者易于混淆的“模型”与“算法”的区别。本书重点关注基本的技术,强调与学习和推理有关的模型以及相应的方法,其主要特点是知识体系系统、完整,不仅包括计算机视觉的相关理论,而且包括所有的数学背景知识。更重要的是,介绍与机器学习相关的基础知识,并将计算机视觉与机器学习有机地融合起来。考虑到读者最低限度的知识储备情况,本书从概率和模式匹配的基础知识开始,逐步讲解到实际实验,读者通过完成和修改这些实验,就可以建立起可用的视觉系统。
本书包含大量插图,描述了70多个算法,同时详细地阐述每个算法的实现细节,细致入微地阐述计算机视觉与机器学习的方方面面,为方便读者理解现代计算机视觉提供了一个完整的概率框架。本书主要适用于计算机视觉和机器学习研究方向的高年级本科生和研究生,书中对各种方法的详细描述也能够帮助计算机视觉的初学者进行学习。
本书由西安电子科技大学的苗启广教授组织翻译,参与的译者有西安电子科技大学的刘凯教授、西安邮电大学的孔韦韦副教授和西北大学的许鹏飞老师,其中苗启广翻译了第9、10、11和19章,刘凯翻译了第1~8章,孔韦韦翻译了第12~15章和附录部分,许鹏飞翻译了第16~18章和第20章以及前言等内容,统稿和审校由苗启广和刘凯共同完成。
本书的翻译工作涉及非常多计算机视觉基础知识的准确翻译,大量术语的统一,多位译者的交流沟通以及字斟句酌的研读等,既从头至尾充满着挑战,又洋溢着团结、合作的气氛,更不时分享逐步成文的喜悦。在此要感谢武警工程大学的雷阳博士,西安电子科技大学的博士研究生刘家辰、刘如意、李宇楠、程飞,硕士研究生孙尔强、范莹莹、黄玉辉、黄志新等,他们在书稿初译、译文修改、统一术语等方面做了大量的工作。感谢机械工业出版社的策划编辑姚蕾和其他编辑,他们为本书的出版付出了大量劳动,认真编辑书稿并提出了修改意见。
谨以本书献给致力于计算机视觉算法研究和开发设计的读者,翻译不足之处请批评指正!

苗启广

图书目录

译者序
译者简介

前言
第1章绪论1
11本书结构2
12其他书籍4
第一部分概率
第2章概率概述6
21随机变量6
22联合概率7
23边缘化7
24条件概率8
25贝叶斯公式9
26独立性9
27期望10
讨论10
备注11
习题11
第3章常用概率分布12
31伯努利分布13
32贝塔分布13
33分类分布14
34狄利克雷分布14
35一元正态分布15
36正态逆伽马分布15
37多元正态分布16
38正态逆维希特分布16
39共轭性17
总结18
备注18
习题18
第4章拟合概率模型21
41最大似然法21
42最大后验法21
43贝叶斯方法22
44算例1:一元正态分布22
441最大似然估计22
442最大后验估计24
443贝叶斯方法26
45算例2:分类分布28
451最大似然法28
452最大后验法29
453贝叶斯方法30
总结31
备注31
习题32
第5章正态分布34
51协方差矩阵的形式34
52协方差分解35
53变量的线性变换36
54边缘分布36
55条件分布37
56正态分布的乘积38
57变量改变38
总结38
备注39
习题39
第二部分机器视觉的机器学习
第6章视觉学习和推理42
61计算机视觉问题42
62模型的种类42
621判别模型43
622生成模型43
63示例1:回归43
631判别模型44
632生成模型44
64示例2:二值分类46
641判别模型46
642生成模型46
65应该用哪种模型48
66应用49
661皮肤检测49
662背景差分50
总结51
备注51
习题52
第7章复杂数据密度建模54
71正态分类模型54
72隐变量56
73期望最大化57
74混合高斯模型58
741混合高斯边缘化59
742基于期望最大化的混合模型拟合59
75t分布63
751学生t分布边缘化64
752拟合t分布的期望最大化65
76因子分析67
761因子分析的边缘分布68
762因子分析学习的期望最大化68
77组合模型71
78期望最大化算法的细节71
781期望最大化算法的下界73
782E步74
783M步74
79应用75
791人脸检测75
792目标识别76
793分割77
794正脸识别78
795改变人脸姿态(回归)78
796作为隐变量的变换79
总结80
备注80
习题81
第8章回归模型82
81线性回归82
811学习83
812线性回归模型的问题83
82贝叶斯线性回归84
821实际考虑85
822拟合方差86
83非线性回归87
831最大似然法87
832贝叶斯非线性回归89
84核与核技巧89
85高斯过程回归90
86稀疏线性回归91
87二元线性回归93
88相关向量回归95
89多变量数据回归96
810应用96
8101人体姿势估计96
8102位移专家97
讨论98
备注98
习题98
第9章分类模型100
91逻辑回归100
911学习:最大似然估计102
912逻辑回归模型的问题103
92贝叶斯逻辑回归104
921学习104
922推理106
93非线性逻辑回归107
94对偶逻辑回归模型108
95核逻辑回归110
96相关向量分类111
97增量拟合和boosting113
98分类树116
99多分类逻辑回归117
910随机树、随机森林和随机蕨分类器118
911与非概率模型的联系119
912应用120
9121性别分类120
9122脸部和行人检测121
9123语义分割122
9124恢复表面布局123
9125人体部位识别124
讨论125
备注125
习题127
第三部分连接局部模型
第10章图模型130
101条件独立性130
102有向图模型131
1021示例1132
1022示例2132
1023示例3133
1024总结134
103无向图模型134
1031示例1135
1032示例2136
104有向图模型与无向图模型的对比136
105计算机视觉中的图模型137
106含有多个未知量的模型推理139
1061求最大后验概率的解139
1062求后验概率分布的边缘分布139
1063最大化边缘140
1064后验分布的采样140
107样本采样140
1071有向图模型的采样141
1072无向图模型的采样141
108学习142
1081有向图模型的学习142
1082无向图模型的学习143
讨论145
备注145
习题145
第11章链式模型和树模型147
111链式模型148
1111有向链式模型148
1112无向链式模型148
1113模型的等价性148
1114隐马尔可夫模型在手语中的应用149
112链式MAP推理149
113树的MAP推理152
114链式边缘后验推理155
1141求解边缘分布155
1142前向后向算法156
1143置信传播157
1144链式模型的和积算法158
115树的边缘后验推理160
116链式模型和树模型的学习161
117链式模型和树模型之外的东西161
118应用163
1181手势跟踪163
1182立体视觉164
1183形象化结构166
1184分割167
讨论167
备注168
习题169
第12章网格模型172
121马尔可夫随机场172
1211网格示例173
1212离散成对MRF图像去噪174
122二值成对马尔可夫随机场的MAP推理175
1221最大流/最小割176
1222MAP推理:二值变量177
123多标签成对MRF的MAP推理182
124非凸势的多标签MRF186
125条件随机场189
126高阶模型190
127网格有向模型190
128应用191
1281背景差分191
1282交互式分割192
1283立体视觉193
1284图像重排193
1285超分辨率195
1286纹理合成196
1287合成新面孔197
讨论198
备注198
习题200
第四部分预处理
第13章图像预处理与特征提取204
131逐像素变换204
1311白化204
1312直方图均衡化205
1313线性滤波206
1314局部二值模式210
1315纹理基元映射211
132边缘、角点和兴趣点212
1321Canny边缘检测器212
1322Harris角点检测器214
1323SIFT检测器215
133描述子216
1331直方图216
1332SIFT描述子216
1333方向梯度直方图217
1334词袋描述子218
1335形状内容描述子218
134降维219
1341单数值近似220
1342主成分分析221
1343二元主成分分析221
1344K均值算法222
结论223
备注223
习题224
第五部分几何模型
第14章针孔摄像机228
141针孔摄像机简介228
1411归一化摄像机229
1412焦距参数230
1413偏移量和偏移参数230
1414摄像机的位置与方向231
1415全针孔摄像机模型232
1416径向畸变232
142三个几何问题233
1421问题1:学习外在参数233
1422问题2:学习内在参数234
1423问题3:推理3D世界点235
1424解决问题235
143齐次坐标236
144学习外在参数237
145学习内在参数239
146推理3D世界点240
147应用241
1471结构光的深度241
1472剪影重构243
讨论245
备注245
习题246
第15章变换模型249
151二维变换模型249
1511欧氏变换模型249
1512相似变换模型251
1513仿射变换模型252
1514投影变换模型252
1515增加不确定性254
152变换模型中的学习255
1521学习欧氏参数255
1522学习相似参数256
1523学习仿射参数256
1524学习投影参数257
153变换模型中的推理258
154平面的三个几何问题258
1541问题1:学习外在参数258
1542问题2:学习内在参数260
1543问题3:与摄像机相关的3D位置推理261
155图像间的变换261
1551单应性的几何特征262
1552计算图像间的变换263
156变换的鲁棒学习264
1561RANSAC264
1562连续RANSAC265
1563PEaRL266
157应用268
1571增强现实追踪268
1572视觉全景269
讨论270
备注270
习题271
第16章多摄像机系统273
161双视图几何学理论273
1611极线约束274
1612极点274
162实矩阵275
1621实矩阵的属性276
1622实矩阵的分解277
163基础矩阵279
1631基础矩阵的估计279
16328点算法280
164双视图重构的流程281
165校正284
1651平面校正284
1652极面校正286
1653校正后处理287
166多视图重构287
167应用290
1671三维重构290
1672图片浏览291
1673立体图割292
讨论293
备注293
习题294
第六部分视觉模型
第17章形状模型298
171形状及其表示298
172snake模型299
1721推理301
1722snake模型中存在的问题301
173形状模板302
1731推理303
1732用迭代最近点算法进行推理304
174统计形状模型304
1741学习305
1742推理306
175子空间形状模型306
1751概率主成分分析307
1752学习308
1753推理309
176三维形状模型311
177形状和外观的统计模型311
1771学习313
1772推理314
178非高斯统计形状模型315
1781回归PPCA315
1782高斯过程隐变量模型316
179铰接式模型317
1710应用319
17101三维形变模型319
17102三维人体模型321
讨论322
备注322
习题324
第18章身份与方式模型326
181子空间身份模型328
1811学习329
1812推理331
1813在其他识别任务中的推理332
1814身份子空间模型的局限性333
182概率线性判别分析334
1821学习335
1822推理335
183非线性身份模型336
184非对称双线性模型337
1841学习339
1842推理339
185对称双线性和多线性模型341
1851学习342
1852推理343
1853多线性模型344
186应用344
1861人脸识别344
1862纹理建模345
1863动画合成346
讨论346
备注346
习题348
第19章时序模型349
191时序估计框架349
1911推理350
1912学习350
192卡尔曼滤波器351
1921推理351
1922改写测量合并阶段352
1923推理总结353
1924示例1353
1925示例2354
1926滤波355
1927时序和测量模型356
1928卡尔曼滤波器的问题358
193扩展卡尔曼滤波器358
194无损卡尔曼滤波器360
1941状态演化361
1942测量合并过程362
195粒子滤波363
1951时间演化364
1952测量合并364
1953扩展366
196应用366
1961行人跟踪366
1962单目的即时定位与地图构建366
1963在复杂背景中跟踪轮廓线367
讨论369
备注369
习题370
第20章视觉词模型372
201视觉词集合的图像372
202词袋373
2021学习374
2022推理374
2023词袋模型的相关问题375
203隐狄利克雷分布376
2031学习377
2032非监督物体检测379
204单一创作主题模型380
2041学习381
2042推理382
205星座模型382
2051学习383
2052推理385
206场景模型385
207应用386
2071视频搜索386
2072行为识别387
讨论388
备注389
习题389
第七部分附录
附录A符号说明392
附录B最优化394
附录C线性代数402
参考文献413

教学资源推荐
作者: [美]查鲁·C. 阿加沃尔(Charu C. Aggarwal) 著
作者: (美)Joesph Giarratano
作者: 黄翰 郝志峰 著
作者: [美]马修 T.梅森(Matthew T. Mason)著
参考读物推荐
作者: 陈雨强 郑曌 谭中意 卢冕 等
作者: [美]马克·沃伦威尔德(Marc Vollenweider)著
作者: [印] 阿迪蒂亚·夏尔马(Aditya Sharma)[印] 维什韦什·拉维·什里马利(Vishwesh Ravi Shrimali) 著[美] 迈克尔·贝耶勒(Michael Beyeler)