教学资源 – 图书教辅

扩展信息

语种 : 简体中文

页数 : 519

开本 : 16

原书名 : Computer Vision: Principles, Algorithms, Applications, Learning，Fifth Edition

原出版社: Elsevier (Singapore) Pte Ltd

属性分类: 教材

包含CD : 无CD

绝版 : 无

图书简介

本书系统地展示了计算机视觉的基本方法学，讲解基础理论的同时，强调算法和实际中的设计约束。此次第5版全面修订，涵盖更多计算机视觉的概念和应用，既适合本科生和研究生，也适合该领域的研究人员和工程师。

图书特色

无

图书前言

本书的第1版于1990年出版，受到许多研究者和从业者的欢迎。然而，在随后的20年里，计算机视觉的发展速度飞快，许多在第1版中不值一提的话题，现在必须被纳入以后的版本中。例如，我们引入了大量关于特征检测、数学形态学、纹理分析、形状检测、人工神经网络、3D视觉、不变性、运动分析、目标跟踪和稳健统计的新材料，这些内容变得日益重要。在第4版中，我们认识到计算机视觉的应用范围越来越广，特别是必须增加关于监控和车载视觉系统的两章。从那以后，相关研究和讨论一直没有停止。事实上，在过去的四五年里，深度神经网络的研究开始呈现爆炸性增长，由此产生的实际成果令人震惊。显然，第5版必须反映这种彻底的转变—无论是基础理论还是实践应用。事实上，本书增加了一个新的部分—机器学习和深度学习网络（第三部分），可以看出，这个标题意味着新内容不仅反映了深度学习（相对于旧的“人工神经网络”的巨大改进），也反映了一种基于严格的概率方法的模式识别方法。
在书中阐释清楚这些主题并非易事，因为概率方法只有在相当严格的数学环境中才能讲透。数学背景太少，这个主题可能会被淡化到几乎没有内容；数学内容太多，对许多读者来说可能无法理解。显然，我们不能因为读者害怕那些数学公式就避而不谈。因此，第14章对读者而言是一次挑战，这一章充分展示了所涉及的方法类型，同时提供给读者越过一些数学复杂性的途径—至少在第一次遇到时是这样的。一旦越过了相对困难的第14章，第15章和第21章将主要向读者展示案例研究，前者聚焦于深度学习网络的关键发展时期（2012—2015），后者的时间段与之类似（2013—2016）。在此期间，深度学习的主要目标是人脸检测和识别，并且取得了显著的进步。不应忽视的是，这些增补对本书的内容产生了非常大的影响，以至于书名不得不做出修改。之后，本书的组织结构又得到了进一步修改，在新的第五部分“计算机视觉的应用”中，收入了三个关于应用的章节。
值得注意的是，此时计算机视觉已经达到成熟水平，这使它变得更加严格、可靠、通用，并且能够实时运行（考虑到现在可用于实现的改进的硬件设施，特别是功能极其强大的GPU）。这意味着在要求严格的应用中使用计算机视觉技术的人比以往任何时候都多，而且实际困难也更少了。本书旨在从根本上反映这一全新的令人兴奋的发展。
对于电子工程和计算机科学专业的大四学生，视觉课程可包括第1～13章和第16章的大部分内容，根据需要，还可包括其他章节的部分内容。对于理学硕士或博士研究生来说，可能涵盖第三部分或第四部分的深入内容，第五部分的部分章节也是合适的，其中许多实际练习都是在图像分析系统上进行的（一旦开始认真研究，就不应该低估附录中讨论的稳健统计的重要性，尽管这可能超出本科教学大纲的范围）。这在很大程度上取决于每个学生正在进行的研究项目。在现阶段，本书可能不得不更多地用作研究手册，事实上，这本书的主要目的之一就是作为这一重要领域的研究者和实践者的手册。
正如在之前版本的前言中提到的，本书很大程度上依赖于我与各位研究生合作时获得的经验，特别感谢马克·埃德蒙兹、西蒙·巴克、丹尼尔·塞拉诺、达雷尔·格林希尔、德里克·查尔斯、马克·苏格鲁和乔治·马斯塔克西斯，他们都以自己的方式帮助我形成了对计算机视觉技术的认识。此外，与同事巴里·库克、扎希德·侯赛因、伊恩·汉娜、德夫·帕特尔、大卫·梅森、马克·贝特曼、铁英·卢、阿德里安·约翰斯顿和皮尔斯·普吕默进行的许多有益的讨论是我最美好的回忆，尤其是阿德里安和皮尔斯，他们为实现我的研究小组的视觉算法在生成硬件系统方面贡献颇多。接下来，我要感谢英国机器视觉协会的同僚就这一主题进行了多次广泛的讨论，特别感谢马吉德·米尔迈赫迪、阿德里安·克拉克、尼尔·萨克尔和马克·尼克松，随着时间的推移，他们对本书的数次更新产生了巨大的影响，并在本书中留下了永久的印记。接下来，我要感谢匿名评论者发表的有见地的评论，以及提出的非常有价值的建议。最后，我要感谢爱思唯尔的蒂姆·皮茨的帮助和鼓励，没有他，第5版可能永远不会完成。
最后，本书网站https://www.elsevier.com/books-and-journals/book-companion/9780128092842
包含编程和其他资源，可帮助读者和学生使用本书。欢迎查看网站以了解更多信息。

E. R. 戴维斯
英国伦敦大学皇家霍洛威学院

上架指导

计算机\人工智能

封底文字

本书是计算机视觉领域的重要书籍，数年间屡次推陈出新。这一版的一个重大变化是包含关于深度学习的内容，这是一个勇敢但必要的举动。我期待着将第5版自豪地摆在书架上。
——Mark S. Nixon，南安普顿大学

本书特色：
新增三章讨论机器学习，以反映计算机视觉领域的发展。其中两章讨论基本分类概念和概率模型，另外一章介绍深度学习网络的原理，并通过人脸检测与识别这一应用讨论了其产生的影响。此外，还新增一章讨论了物体分割与形状模型。
深入讨论了几何变换、EM算法、Boosting方法、语义分割、人脸正面化、RNN等重要主题，包括眼睛、车辆和行人的定位等实例和应用，涵盖开发真实视觉系统的细节和实现过程。
理论方面，通过清晰的阐释和恰当的例子使数学知识和基础理论变得通俗易懂。此外，每一章都介绍了新研究进展，帮助学生和实践者紧跟技术发展潮流。
配备可免费下载的编程示例，包括代码、方法、图示、任务、提示和解决方案（主要采用MATLAB和C++）。

译者序

随着近几年人工智能和机器学习技术的迅猛发展，计算机视觉作为其最重要的应用领域，也越来越受到学术界和产业界的广泛关注，2019年在

美国洛杉矶召开的CVPR会议，注册的各界参会人数达9120人。面对各界对计算机视觉高层次人才的迫切需求，高校如何做好计算机视觉方向

的人才培养，成为我们这些计算机学科教师的重要课题。
我在清华大学深圳研究生院承担计算机视觉相关课程教学多年，深切感受到一本好教材对学生学好这门课的重要性，无论是课堂学习还是课后

自学。我也曾经用过多本优秀的翻译教材，如艾海舟老师等翻译的《计算机视觉：算法与应用》（2012年出版，Richard Szeliski著）、林学

訚老师等翻译的《计算机视觉：一种现代方法》（2004年出版，David A. Forsyth等著）、苗启广老师等翻译的《计算机视觉：模型、学习和

推理》（2017年出版，Simon J. D. Prince著）。前面两位都是当年在清华大学计算机系媒体所教过我这门课的老师。然而随着计算机视觉技

术的迅猛发展，深度学习方法已经在该领域广泛应用，如何将深度学习等最新的机器学习方法与传统的计算机视觉任务结合，成为当今计算机

视觉科研和教学的重要内容。
英国伦敦大学E. R. Davies教授的这本书总结了作者长期以来在计算机视觉领域的科研成果。尤其值得强调的是，他从1990年的第1版开始，

不断更新，不断修改，所以如今的这个版本可以说是当今计算机视觉领域在系统性、先进性、完整性方面最为突出的一本教材。有幸翻译这本

教材是我的幸运，同时也是一项艰巨的任务。在系统性上我们可以发现，本书结构与CVPR会议的报告内容分类非常一致，系统性地阐述了计算

机视觉的理论和方法，从初级视觉到中级视觉，再到机器学习和深度学习网络，以及3D视觉和运动。在先进性上，这是目前为止对深度学习计

算机视觉方法进行系统介绍的唯一一本教材。在完整性上，全书共24章，全面涵盖计算机视觉的主要理论和方法。所以，我们特别推荐该书作

为计算机视觉方向的大学本科或研究生教材。
感谢刘婧老师和我一起翻译此书，也感谢协助翻译工作的清华大学深圳研究生院的学生（选修2018年春季学期“计算机视觉”课程的学生），

还要感谢实验室的李磊、魏萌、袁晨曦、罗莉舒、张宇为、蔡佳音、袁帅等同学参与了本书的校对工作。
最后感谢机械工业出版社对我的信任和支持，让我来承担这本计算机视觉领域重量级图书的翻译工作。
最后，因为翻译时间仓促，难免有错误和遗漏的地方，请各位读者及时指出，不胜感谢！

袁春
2020年5月

推荐序

很荣幸为《计算机与机器视觉》的新版写序，现在的书名为《计算机视觉：原理、算法、应用及学习》。戴维斯的这本书是计算机视觉领域的重要书籍之一，数年间屡次推陈出新，现在已经更新到了第5版。但本书值得肯定的地方远不止于此—它不仅反映了作者无私奉献和锲而不舍的精神，也反映了这本书自身的成就。
计算机视觉在其短暂的历史中显示出惊人的发展速度。这部分由于技术的发展：如今计算机速度快得多，内存也比戴维斯开始做研究时便宜得多。科技领域已经取得了许多成就，不断推动着行业的发展。所有这些都会影响教材的内容。过去也曾有过一些优秀的教材，遗憾的是，它们未能在市场上长期留存。本书没有犯同样的错误，因为作者紧跟该领域的发展，不断对书籍内容进行升级和完善。
我们可以期待，在未来，自动化计算机视觉系统将使我们的生活变得更加轻松，同时也更加丰富。计算机视觉在食品工业和机器人汽车领域已经有了许多应用，我们很快就能在生活中看到这些产品。在医学领域，图像分析技术也在不断进步，计算机视觉技术可以通过自动化手段帮助诊断和治疗。指纹识别为手机用户带来了便利，而面部识别技术将进一步改善用户体验。这些都是由计算机、计算机视觉和人工智能应用的进步而推动的。
读者将会看到，计算机视觉确实是一个令人兴奋的领域。本书设法涵盖技术的许多方面，从人类视觉到需要电子硬件、计算机实现和大量计算机软件的机器学习。在新版中，戴维斯将继续非常详细地讲述这些内容。
我还记得1990年本书推出了第1版，将理论、实现和算法以独特且实用的方式结合在一起。现在，我很高兴看到第5版依然保持着这种独特的方法。学过之前版本的学生非常欣赏这种方法，他们希望计算机视觉入门阶段的学习能够无障碍地进行。随着时间的推移，新版本的篇幅肯定会增加—书籍通常如此。本书也是这样的，那些增加的内容正是许多研究人员不断改进、完善和发展新技术的成果。
这一版的一个重大变化是包含关于深度学习的内容。事实上，这是计算机视觉和模式识别领域的重大变化。计算能力的提高和内存成本的降低意味着技术可能会变得更加复杂，这种复杂性有助于 “大数据”分析的应用。我们不能忽视深度学习和卷积神经网络的影响力：只需仔细阅读顶级国际会议的计划，就能感受到它们对研究方向的革命性影响。尽管这些技术仍处于早期发展阶段，但是给出一些指导性资料对读者是有帮助的。在任何人工智能系统中，性能的本质总是容易受到质疑，回答这个问题的方法之一是更深入地考虑体系结构及其基础要素。这也是教科书的功能—对相关领域的研究和实践做推理式阐述，同时使知识体系得到升华。在这个版本中加入深度学习是一个勇敢的举动，但这是必要的。
戴维斯本人有什么变化呢？在牛津大学获得固体物理学博士学位后，他开发了一种新的核共振敏感方法，称为“Davies-ENDOR”（电子和核双共振），避免了其前身“Mims-ENDOR”的盲点。1970年，他被任命为皇家霍洛威学院的讲师。他发表了一系列关于模式识别及其应用的论文，并编著了几本书籍，这些成果使他获得了众多殊荣，包括首席资格、理学博士学位，以及当选英国机器视觉协会（BMVA）的杰出会士。他为BMVA贡献颇丰，最近编辑了BMVA通讯。显然，这些工作经历对于写作本书帮助很大。
我期待着将第5版自豪地摆在书架上，同时，第4版也不会“退休”，它会转移到我的学生的书架上。这本书从未躺在那里落灰，因为它是我经常求助的教科书之一，需要随时翻阅以获取信息。与网上的百科资料不同，教科书中的内容组织更加连贯，知识的扩展性也更好。这就是教科书的作用，第5版将继续发挥这一优势。

马克·S. 尼克松
2017年7月于南安普顿大学

图书目录

译者序
推荐序
第5版前言
第1版前言
缩写词汇表
第1章　计算机视觉面临的挑战 1
1.1　导言—人类及其感官 1
1.2　视觉的本质 2
1.2.1　识别过程 2
1.2.2　解决识别问题 3
1.2.3　物体定位 4
1.2.4　场景分析 5
1.2.5　视觉是逆向图形学 6
1.3　从自动视觉检测到监控 6
1.4　本书是关于什么的 7
1.5　机器学习的作用 8
1.6　后续章节内容概述 9
1.7　书目注释 9
第一部分　初级视觉
第2章　图像与图像处理 12
2.1　导言 12
2.2　图像处理操作 15
2.2.1　灰度图像的一些基本操作 15
2.2.2　二值图像的基本操作 19
2.3　卷积和点扩散函数 21
2.4　顺序操作与并行操作 22
2.5　结束语 23
2.6　书目和历史注释 24
2.7　问题 24
第3章　图像滤波和形态学 25
3.1　导言 25
3.2　通过高斯平滑抑制噪声 27
3.3　中值滤波器 28
3.4　模式滤波器 30
3.5　秩排序滤波器 35
3.6　锐化–反锐化掩模 35
3.7　中值滤波器引入的偏移 36
3.7.1　中值偏移的连续体模型 36
3.7.2　推广到灰度图 38
3.7.3　中值偏移的离散模型 40
3.8　秩排序滤波器引入的偏移 41
3.9　滤波器在计算机视觉工业应用中的作用 44
3.10　图像滤波中的色彩 44
3.11　二值图像的膨胀和腐蚀 45
3.11.1　膨胀和腐蚀 45
3.11.2　抵消效应 45
3.11.3　改进的膨胀与腐蚀算子 45
3.12　数学形态学 46
3.12.1　泛化的形态学膨胀 46
3.12.2　泛化的形态学腐蚀 47
3.12.3　膨胀与腐蚀之间的对偶性 47
3.12.4　膨胀与腐蚀算子的特性 48
3.12.5　闭合与开启 50
3.12.6　基本形态学运算概要 51
3.13　形态学分组 53
3.14　灰度图像中的形态学 54
3.15　结束语 55
3.16　书目和历史注释 56
3.17　问题 58
第4章　阈值的作用 61
4.1　导言 61
4.2　区域生长方法 62
4.3　阈值方法 62
4.3.1　寻找合适的阈值 62
4.3.2　解决阈值选取中的偏差问题 63
4.4　自适应阈值 64
4.5　更彻底的阈值选择方法 66
4.5.1　基于方差的阈值 67
4.5.2　基于熵的阈值 67
4.5.3　最大似然阈值 68
4.6　全局波谷阈值方法 69
4.7　应用全局波谷阈值方法的实际结果 71
4.8　直方图凹性分析 75
4.9　结束语 75
4.10　书目和历史注释 76
4.11　问题 77
第5章　边缘检测 78
5.1　导言 78
5.2　边缘检测基本理论 79
5.3　模板匹配方法 80
5.4　3×3模板算子理论 81
5.5　微分梯度算子的设计 82
5.6　圆形算子的概念 83
5.7　圆形算子的详细实现 83
5.8　微分边缘算子的系统设计 85
5.9　上述方法的问题—?一些替代方案 86
5.10　滞后阈值 88
5.11　Canny算子 89
5.12　Laplacian算子 92
5.13　结束语 93
5.14　书目和历史注释 93
5.15　问题 94
第6章　角点、兴趣点和不变特征的检测 95
6.1　导言 95
6.2　模板匹配 95
6.3　二阶导数方法 96
6.4　基于中值滤波的角点检测器 98
6.4.1　分析中值检测器的操作 98
6.4.2　实际结果 99
6.5　Harris兴趣点算子 100
6.5.1　各种几何构型的角点信号和位移 102
6.5.2　交叉点和T形交叉点的性能 103
6.5.3　Harris算子的不同形式 105
6.6　角点方向 106
6.7　局部不变特征检测器与描述符 106
6.7.1　几何变换和特征标准化 107
6.7.2　Harris尺度、仿射不变检测器和描述符 108
6.7.3　Hessian尺度、仿射不变检测器和描述符 109
6.7.4　尺度不变特征变换算子 110
6.7.5　加速鲁棒特征算子 110
6.7.6　最大稳定极值区域 111
6.7.7　各种不变特征检测器的比较 112
6.7.8　定向梯度直方图 114
6.8　结束语 115
6.9　书目和历史注释 116
6.10　问题 118
第7章　纹理分析 119
7.1　导言 119
7.2　纹理分析的一些基本方法 121
7.3　灰度共生矩阵 122
7.4　Laws纹理能量法 123
7.5　Ade特征滤波器法 125
7.6　对Laws法和Ade法的评估 126
7.7　结束语 127
7.8　书目和历史注释 127
第二部分　中级视觉
第8章　二值化形状分析 130
8.1　导言 130
8.2　二值图像的连通性 131
8.3　物体标记和计数 131
8.4　尺寸滤波 136
8.5　距离函数及其用途 138
8.6　骨架和细化 140
8.6.1　交叉数 141
8.6.2　细化的并行和顺序实现 143
8.6.3　引导细化 144
8.6.4　如何看待骨架的本质 145
8.6.5　骨架节点分析 146
8.6.6　骨架在形状识别中的应用 146
8.7　形状识别的其他度量 147
8.8　边界跟踪过程 148
8.9　结束语 149
8.10　书目和历史注释 150
8.11　问题 151
第9章　边界模式分析 154
9.1　导言 154
9.2　边界跟踪过程 156
9.3　质心轮廓 156
9.4　质心轮廓方法存在的问题 157
9.5　（s, ψ）图 159
9.6　解决遮挡问题 160
9.7　边界长度度量的准确性 162
9.8　结束语 163
9.9　书目和历史注释 164
9.10　问题 165
第10章　直线、圆和椭圆的检测 166
10.1　导言 166
10.2　霍夫变换在直线检测中的应用 167
10.3　垂足法 169
10.4　使用RANSAC进行直线检测 171
10.5　腹腔镜工具的位置 174
10.6　基于霍夫的圆形物体检测方案 175
10.7　圆半径未知的问题 178
10.8　克服速度问题 179
10.9　椭圆检测 181
10.9.1　直径平分法 182
10.9.2　弦切法 183
10.9.3　寻找剩余椭圆参数 184
10.10　人类虹膜定位 185
10.11　结束语 186
10.12　书目和历史注释 187
10.13　问题 189
第11章　广义霍夫变换 191
11.1　导言 191
11.2　广义霍夫变换 192
11.3　空间匹配滤波的相关性 193
11.4　梯度加权与均匀加权 194
11.4.1　灵敏度和计算负荷的计算 195
11.4.2　总结 196
11.5　使用GHT检测椭圆 196
11.6　各种椭圆检测方法的比较 199
11.7　物体定位的图论方法 200
11.8　节省计算的可能性 204
11.9　使用GHT进行特征排序 205
11.10　推广最大团及其他方法 207
11.11　搜索 208
11.12　结束语 208
11.13　书目和历史注释 209
11.14　问题 212
第12章　物体分割与形状模型 215
12.1　导言 215
12.2　主动轮廓 215
12.3　使用主动轮廓获得的实际结果 217
12.4　用于物体分割的水平集方法 218
12.5　形状模型 219
12.6　结束语 227
12.7　书目和历史注释 227
第三部分　机器学习和深度学习网络
第13章　基本分类概念 230
13.1　导言 230
13.2　最近邻算法 231
13.3　贝叶斯决策理论 232
13.4　最近邻与贝叶斯方法的关系 234
13.4.1　问题的数学陈述 234
13.4.2　最近邻算法的重要性 236
13.5　最佳特征数量 236
13.6　代价函数和错误–拒绝权衡 236
13.7　监督和无监督学习 238
13.8　聚类分析 238
13.9　支持向量机 240
13.10　人工神经网络 241
13.11　反向传播算法 244
13.12　多层感知器架构 246
13.13　训练数据过拟合 247
13.14　结束语 248
13.15　书目和历史注释 249
13.16　问题 250
第14章　机器学习：概率方法 251
14.1　导言 251
14.2　高斯混合和EM算法 253
14.3　更一般的EM算法视图 257
14.4　一些实际例子 259
14.5　主成分分析 264
14.6　多分类器 266
14.7　Boosting方法 268
14.8　AdaBoost建模 270
14.9　Boosting方法的损失函数 272
14.10　LogitBoost算法 275
14.11　Boosting方法的有效性 277
14.12　多类别的Boosting方法 277
14.13　接受者操作特性 281
14.14　结束语 284
14.15　书目和历史注释 284
14.16　问题 286
第15章　深度学习网络 287
15.1　导言 287
15.2　卷积神经网络 289
15.3　用于定义CNN架构的参数 290
15.4　LeCun 等人提出的LeNet 架构 293
15.5　Krizhevsky等人提出的AlexNet架构 296
15.6　Zeiler和Fergus对CNN架构的研究 300
15.7　Zeiler和Fergus的可视化实验 302
15.8　Simonyan和Zisserman的VGGNet架构 303
15.9　Noh等人的DeconvNet架构 305
15.10　Badrinarayanan等人的SegNet架构 307
15.11　循环神经网络 309
15.12　结束语 311
15.13　书目和历史注释 313
第四部分　三维视觉和运动
第16章　三维世界 316
16.1　导言 316
16.2　三维视觉方法 316
16.3　三维视觉投影方案 318
16.3.1　双目图像 319
16.3.2　对应问题 320
16.4　阴影形状 322
16.5　光度立体技术 325
16.6　表面光滑性的假设 326
16.7　纹理形状 327
16.8　结构光的使用 327
16.9　三维物体识别方案 329
16.10　Horaud的汇聚定向技术 329
16.11　一个重要的范例—工业零件的定位 332
16.12　结束语 333
16.13　书目和历史注释 334
16.14　问题 336
第17章　解决n点透视问题 338
17.1　导言 338
17.2　视角倒转现象 338
17.3　弱透视投影下的姿势歧义性 339
17.4　求姿势估计的唯一解 341
17.4.1　三点情况下的解 343
17.4.2　利用对称梯形来预测姿势 344
17.5　结束语 345
17.6　书目和历史注释 345
17.7　问题 346
第18章　不变量与透视 347
18.1　导言 347
18.2　交比：“比率的比率”的概念 348
18.3　非共线点的不变量 351
18.4　圆锥曲线上点的不变量 353
18.5　微分和半微分不变量 355
18.6　对称交比函数 356
18.7　消失点检测 357
18.8　更多关于消失点的内容 358
18.9　圆和椭圆的表观中心 359
18.10　美术和摄影中的透视效果 360
18.11　结束语 365
18.12　书目和历史注释 365
18.13　问题 367
第19章　图像变换和摄像机校准 368
19.1　导言 368
19.2　图像变换 369
19.3　摄像机校准 372
19.4　内部和外部参数 373
19.5　径向畸变纠正 375
19.6　多视图视觉 376
19.7　广义的对极几何 376
19.8　本征矩阵 377
19.9　基础矩阵 378
19.10　本征矩阵和基础矩阵的性质 379
19.11　评估基础矩阵 380
19.12　8点算法的更新 380
19.13　图像校正 380
19.14　三维重建 381
19.15　结束语 382
19.16　书目和历史注释 383
19.17　问题 384
第20章　运动 385
20.1　导言 385
20.2　光流 385
20.3　光流场的理解 387
20.4　利用扩展焦点避免碰撞 389
20.5　时间邻近度分析 390
20.6　基于光流模型的基本问题 391
20.7　运动中的立体视觉 391
20.8　卡尔曼滤波器 393
20.9　宽基线匹配 394
20.10　结束语 395
20.11　书目和历史注释 396
20.12　问题 396
第五部分　计算机视觉的应用
第21章　人脸检测与识别：深度学习带来的影响 398
21.1　导言 398
21.2　一种人脸检测的简单方法 399
21.3　人脸特征检测 401
21.4　用于快速人脸检测的Viola-Jones方法 402
21.5　人脸识别的特征脸方法 404
21.6　人脸识别的其他难点 406
21.7　人脸正面化 408
21.8　Sun等人提出的DeepID人脸表征系统 410
21.9　再议快速人脸检测 413
21.10　三维人脸检测 416
21.11　结束语 417
21.12　书目和历史注释 418
第22章　监控 420
22.1　导言 420
22.2　监控：基本几何 421
22.3　前景–背景分离 424
22.3.1　背景建模 424
22.3.2　背景建模的实例 426
22.3.3　前景的直接检测 430
22.4　粒子滤波 430
22.5　基于颜色直方图的跟踪 434
22.6　粒子滤波的应用 437
22.7　倒角匹配、跟踪和遮挡 439
22.8　多个摄像机的组合视角 440
22.9　交通流量监测的应用 443
22.9.1　Bascle等人的系统 443
22.9.2　Koller等人的系统 445
22.10　车牌定位 446
22.11　跟踪遮挡分类 447
22.12　通过步态区分行人 449
22.13　人体步态分析 451
22.14　基于模型的动物跟踪 452
22.15　结束语 454
22.16　书目和历史注释 455
22.17　问题 456
第23章　车载视觉系统 457
23.1　导言 457
23.2　定位道路 458
23.3　道路交通标线的定位 459
23.4　道路交通标志的定位 461
23.5　车辆的定位 462
23.6　通过查看车牌和其他结构特征获得的信息 464
23.7　定位行人 466
23.8　导航和自我运动 468
23.9　农业车辆导航 471
23.9.1　任务的三维层面 473
23.9.2　实时实现 473
23.10　结束语 474
23.11　高级驾驶辅助系统的更多细节及相关书目 474
23.11.1　车辆检测的发展 476
23.11.2　行人检测的发展 476
23.11.3　道路和车道检测的发展 478
23.11.4　交通标志检测的发展 479
23.11.5　路径规划、导航和自我运动的发展 480
23.12　问题 480
第24章　结语——计算机视觉展望 481
24.1　导言 481
24.2　机器视觉中的重要参数 481
24.3　权衡 483
24.3.1　一些重要的权衡 483
24.3.2　两阶段模板匹配权衡 484
24.4　摩尔定律的作用 484
24.5　硬件、算法和过程 485
24.6　选择表达形式的重要性 485
24.7　过去、现在和未来 486
24.8　深度学习探索 487
24.9　书目和历史注释 487
在线资源
附录A　稳健统计
附录B　采样定理
附录C　颜色的表示
附录D　从分布中采样
参考文献