机器视觉教程
作者 : Wesley E.Snyder, Hairong Qi
译者 : 林学訚 崔锦实 赵清杰 等
丛书名 : 计算机科学丛书
出版日期 : 2005-08-30
ISBN : 7-111-16790-2
定价 : 49.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 335
开本 : 16开
原书名 : Machine Vision
原出版社: Cambridge University Press
属性分类: 教材
包含CD :
绝版 :
图书简介

本书对机器视觉进行了全面且通俗易懂的讲解。提供了所有必需的理论工具,并且说明如何应用到实际的图像处理与机器视觉系统中。每章包含了许多编程作业,使读者能深入了解开发实用的图像处理算法的内幕。
  本书从回顾数学原理开始,然后讨论图像处理中的关键问题,还讨论了机器视觉的一些重要应用,其中包括目标的自动检测。本书强调了两个命题:一致性 (解决机器视觉问题的一个主要理论架构) 与优化 (用来实现这些方法的数学工具) 。
  本书所附光盘包括书中使用的软件、数据及图像。

图书特色

图书前言

致 教 师
  本书是讲解计算机识别景物中物体的教材,分基础内容与专题两个部分,可作为教材与教学参考书。几乎所有的章都有基础部分,可以作为教材,按教学法组织的,而专题部分包含大量有关新近发表的文章的参考文献,可以用作参考。本教材是面向电机与计算机工程系、计算机科学系或数学系的高年级本科生与研究生的。
  从第4章到17章的内容包括边缘检测、形状描述、传播、自适应轮廓、参数变换、匹配与一致性标号等有关专题,还包括句法与统计模式识别,以及聚类等内容。有两个主题是贯穿所有这些章节的:一致性(解决机器视觉问题的一个主要理论架构)与优化(用来实现这些方法的数学工具)。这两个主题是无所不在的,所以在每章的结尾都要讨论它们在本章中是如何体现的。第18章介绍目标自动检测这一应用问题,结合了前面章节讨论的所有主题,展示如何解决实际问题。
  本教材假设读者在线性代数与高等微积分方面具有良好的研究生程度的背景知识。成功完成本课程的学生可以承担在工业、医学、与军用机器视觉系统方面的设计任务。所附的光盘中有作者开发的软件工具以及图像数据,用来支持完成书中作业。这些软件可运行在Windows或Linux操作系统支持的PC机、在OS-X下的Macintosh计算机以及Solaris支持下的SUN计算机环境中。软件能够处理任何一种类型的图像,并能将JPEG等格式的图像转换成“标准”格式图像或进行反方向转换。
  尽管本书的使用方式可以多种多样,但作者的主要设计目的是使其作为机器视觉的研究生课程教材,以及作为机器视觉的参考书。如果作为教材,希望学生能阅读本书每一章的基本部分(本书内容一个学期都学不完)。下面的表格是为研究生程度的基础课程设计的学习计划。
  对学生的作业与编程必须包括一个正式的报告,由于作业中通常包含编程,完成作业的时间可以更长些,建议使用的时间列在表格第3列的括号中。本书也可用于本科高年级学生的课程,但听课的学生与讲课内容要仔细挑选。
  对希望进一步深造的学生,本书的“专题”部分可以作为阅读大量文献的导引。一定要对你的学生强调这样一点(就像我们在本书中所说的),即没有任何一本教科书能提供参考文献中才能提供的细节。而对一个实际的机器视觉项目来说,则要求开发工程师深入研读出版的杂志与会议论文。正如前面所述,贯穿本书的两个主题是一致性与优化。一致性概念是贯穿整个学科的,作为解决机器视觉问题的主要理论架构。针对一个机器视觉的实际应用,工程师需要进行搜索,以便找到确定信息源之间具有一致性的方法。优化是解决机器视觉问题的主要数学工具,包括确定一致性。在每一章的末尾介绍完技术问题后,我们都要提醒学生在该章何处体现了一致性原则,以及在何处应用了哪一种优化方法。

课程安排举例
序号内容 作业(花费周数)   阅读材料
1 引引言,术语,对图像的运算,模式分类和计算机  2.2~2.5 读第2章,并确认自己
视觉,图像生成,分辨率,动态范围,像素 2.9(1) 具备学习该课程的基础
2 引作为函数的图像,图像退化,点扩展函数,复原 3.1(1) 第1章与第3章
3 引图像的特性,等亮度线,脊,连通性 3.2, 4.1(2) 4.1节~4.5节
4 引核算子:应用核运算估计边缘位置 4.A1, 5.1节与5.2节      4.A2(1)
5 引用双二次函数拟合图像,用求向量导数的方法 5.1,5.2(1) 5.3节~5.4节
使函数最小化 (跳过六边形像素)
6 引图像的向量表示,图像基函数,边缘检测,高斯 5.4,5.5(2), 5.5节与5.6节          (跳过5.7节)  引模糊,二阶及高阶导数    5.7,5.8,  5.9(1)
7 引尺度空间简介,讨论作业 5.10,5.11(1) 5.8节(跳过5.9节)
8 引松弛与退火 6.1,6.3(1) 6.1节~6.3节
9 引扩散 6.2(2) 6A.2节
10 引MFA与扩散之间的等价性 6.7与6.8(1) 6A.4节
11 引图像数学形态学 7.5~7.7(1) 7.1节
12 引数学形态学(续),灰度数学形态学,距离变换 7.10(2) 7.2节,7.3节
13 引填补边缘间隙,连通性 7.4(1) 7A.4节
14 引用最佳阈值进行分割 8.1节,8.2节
15 引连通分量标号 8.2(1) 8.3节
16 引二维几何,变换 9.3(1) 9.1节,9.2节
17 引二维形状特征,不变矩、傅里叶描述子,中轴 9.2,9.4, 9.3节~9.7节           9.10(1)
18 引用蛇形主动轮廓与汽球主动轮廓进行分割 8.5节,8.5.1节
19 引偏微分方程表达与水平集 8.5.2节
20 引从x提取形状与结构光照明 9.10(1) 9A.2.2节,9A.2.3节
21 引图论图像表示方法:图,区域相邻图。子图同构 第12章
22 引一致性与松弛标号 10.1(1) 第10章
23 引Hough变换,参数变换 11.1(2) 11.1节,11.2节,11.3.3节
24 引广义Hough变换,高斯映像,电路板上检测孔的 11A.3节    应用
25 引图匹配,弹簧与模板,关联图 13.2与13.3(1) 13.1节~13.3节
26 引统计模式识别的作用

致谢
  感谢我在北卡罗来纳州立大学的研究生们,尤其是Rajeev Ramanath,没有他的帮助,就完成不了这本书。Bilg* Karacali在校对方面给了不少帮助,并且对支持向量机这一节贡献很大。
  当然要不是为了我的太太Rosalyn,所有这些都不重要了,正是她对我的鼓励才使这一切得以发生,她还不止一次地对整本书进行编辑,把原本工程化的语言转变成标准的英语。
W. E. Snyder

  我首先要感谢Wesley Snyder博士邀请我作为合作者,我非常喜欢这种合作,并且从中获取了极其宝贵的经验。
  在最后要交付这本书时,正值我的父母从中国来探亲。为了支持我完成最后的工作,他们一直陪伴我而放弃了在城市里观光与欢度节假日,我要深深地感谢他们。还要感谢Feiyi,给予我永远的技术支持与紧张工作后的宽慰。
Hairong Qi

作者简介

Wesley E.Snyder, Hairong Qi:Wesley E.Snyder: 在美国伊利诺伊大学获得博士学位,目前是北卡罗来納州立大学电气与计算机工程系教授。他发表了100多篇论文,并且著有Industrial Robots(工业机器人)一书。他是IEEE机器人与自动化学会和IEEE神经协会的创始人,还是美国国家科学基金、美国国家航空和航天管理局(NASA)、Sandia国家实验室以及美国陆军研究所的顾问。
Hairong Qi: 在美国北卡罗来纳州立大学获得博士学位,目前是美国田纳西大学诺克斯维尔分校电气与计算机工程系助理教授。

译者简介

林学訚 崔锦实 赵清杰 等:暂无简介

译者序

机器视觉又常称计算机视觉,这门学科的发生与发展已有几十年的历史,它是一门研究通过图像或视频数据观察周围世界的学科,主要以摄像机拍摄的图像或视频为原始数据,提取出在图像或视频中能观察到的事物。这个学科要解决的问题,与人类通过眼睛观察世界的视觉感知功能十分相似。称机器视觉是强调用机器构成的系统来处理视觉问题,而称计算机视觉则强调处理视觉的问题是一个计算问题,核心部件是计算功能强大的计算机。
  随着信息时代的到来,用计算机处理各种信息的需求越来越多。多媒体信息处理技术已成为日常生活各领域的迫切需要,而人们就更希望能用计算机技术来处理视觉问题,例如利用人脸、虹膜、指纹等识别技术来处理与个人有关的一切事务。利用自动识别技术帮助盲人,利用视觉自动监控系统监视环境中发生的非常事件,如陌生人的侵入、老年人的异常行动等。再如智能交通管理系统、视频检索、用于军事目的的自动目标检测等,都需要应用机器视觉技术来解决问题。正如视觉是人类在自然环境与社会环境中生存不可缺少的最重要感知器官,机器视觉技术也是信息技术中的一门不可少的技术,因此它成为计算机学科中不可或缺的一门学科。
  但是如何编写好一本机器视觉教科书却并不容易,这是由这门学科本身的特点所决定的。
  几十年来,计算机视觉的研究吸引了多个学科学者与研究人员的目光,计算机视觉的研究已深入到许多不同的应用领域,例如字符识别、人脸识别、指纹识别等在基本原理与实施细节上都形成了独特的算法体系,每个领域都有数量极大的参考文献。显然要对每一个都作详细介绍,并要让读者理解,在篇幅上是不可能的,对初学者来说也是不必要的。
  为了使这本书既能作为相关学科研究生与本科高年级学生学习机器视觉基础知识的教科书,并且又能作为有关专业人员自学机器视觉基本概念的参考书,作者将本书组织成基础与专题两个部分。基础部分是本书的重点,讲述每一章命题的基本概念以及基本处理方法,如图像处理、模式识别、线性代数、概率论等基础知识。学生们可以对机器视觉的基本概念及基本处理方法有一个全面的了解与掌握。本书作者还十分重视对学生通过实际动手培养基本能力,因而专门设计了一章讲解图像的一些基本操作,并要求读者能从底层的图像处理程序写起,以便真正掌握算法的实质。因此这本书是一本适合高年级本科生与研究生学习机器视觉的教科书,也是工程师与其他学科的研究人员学习机器视觉的入门参考书。
  但是一旦读者在掌握了机器视觉的基础知识后,往往需要深入到机器视觉的某个应用领域中去,因此本书作者在每一章都安排了专题。在专题中讨论一些较深入的概念以及有代表性的观点,并附有丰富的参考文献目录。这样一来,读者就可以方便地深入到感兴趣的领域中去了。
  此外,本书作者从始至终都强调两个命题,一个是一致性检测,另一个是求优化解。对前一个命题,作者把它看作解决机器视觉问题的基本哲理,这一点的确非常重要。当人们观察一幅数字图像时,孤立地观察每一个像素,或一个仅包含几个像素的小区域,是看不出图像中有什么东西的,而只有在审视了像素及其邻域中灰度(或颜色)值的分布特点才能发现有价值的东西。例如,图像中有一条直线,若孤立地观察线上的每一点,并不能得出有一条直线的结论,而如果把这些点联系起来观察,就会发现有一条直线存在。这些点为什么组成一条直线呢?这是因为这些点具有一个公共的特点,它们都符合某一直线方程的条件,这就是它们之间存在的一致性。这个例子表明,仅从局部信息来看是看不出图像中有什么内容,只有从全局性角度去观察才能发现图像中究竟包含了什么。然而,图像处理的一些基本算子(如边缘算子、平滑算子等)都只能在局部进行计算,无法在大面积范围内直接进行计算是机器视觉计算的要害,而一致性检测是机器视觉中从局部计算到全局性计算的主要哲理,这点对理解机器视觉的基本处理方法是极其关键的。至于求优化解是机器视觉计算求解的基本数学工具,还拿检测直线的例子来说吧!在图像中一条直线是由若干点组成的,由于这些点是通过边缘检测算子算出来的,这些点的位置往往不十分准确,因此严格地说这些点并不构成一条理想的直线,它可以用几条不同的直线来近似。那么究竟用哪一条直线来近似呢?这就是要找一个“最优”的直线的问题。要用一句话来概括机器视觉的话,就是从带噪声的数据中求解,这种解可以是识别一个字符,检测出一张人脸,跟踪了一个物体的运动等等。由于数据往往是不完整的,是混杂在一起的(一个场景往往是多种物体的组合),带有很强的噪声,因此往往没有解析解,没有唯一解,需要从多个可能的解中找到最优解,求最优解是机器视觉中最常用的数学工具。
  我们在翻译此书的过程中体会到这本书与其他一些机器视觉(或计算机视觉)的著作有明显不同,它的注意力并不放在介绍计算机视觉的最新成果上,而在于把学习机器视觉最需要、最基本的概念与处理方法有条有理地组织起来,有利于学生与初学者尽快地掌握最基本的内容。而专题部分又可以作为读者学习更深入知识的桥梁。
  由于翻译时间偏短,有些部分我们理解得不一定正确,用语也不够准确,译文中难免会出现这样那样的错误与不当之处,敬请读者们原谅,并欢迎指正。

图书目录

第1章  引言 1
1.1  本书宗旨 1
1.2  读者需具备的预备知识 1
1.3  一些术语 2
1.3.1  图像处理 2
1.3.2  机器视觉 3
1.4  机器视觉系统的组成 3
1.5  图像的性质 4
1.6  图像的操作分析 4
参考文献 5
第2章  数学原理回顾 7
2.1  概率论简单回顾 7
2.2  线性代数简单回顾 8
2.2.1  线性变换 10
2.2.2  求导运算 11
2.2.3  特征值与特征向量 12
2.3  函数最小化简介 12
2.3.1  牛顿-拉弗森方法 14
2.3.2  局部最小与全局最小 15
2.3.3  模拟退火 15
2.4  马尔科夫模型 16
2.4.1  隐马尔科夫模型 17
2.4.2  维特比算法 18
2.4.3  马尔科夫输出 19
2.4.4  估计模型参数 20
2.4.5  隐马尔科夫模型的应用 20
参考文献 21
第3章  编写图像处理程序 23
3.1  图像文件系统软件 23
3.1.1  IFS头部结构 23
3.1.2  某些有用的IFS函数 24
3.1.3  带共性的问题 24
3.2  图像处理程序的基本结构 24
3.3  好的编程风格 25
3.4  示例程序 25
3.5  生成文件 27
第4章  图像的生成与表示方式 29
4.1  图像的表示方法 29
4.1.1  图像表示 29
4.1.2  函数表示 30
4.1.3  线性表达式 30
4.1.4  概率表示 30
4.1.5  空域频率表示 30
4.1.6  关系表示方法(图表示法) 32
4.2  数字图像 32
4.2.1  数字图像的生成 32
4.2.2  距离图像的生成 35
4.3  图像生成机制 37
4.4  将图像看作表面 38
4.4.1  等亮度线 38
4.4.2  脊 38
4.4.3  二值图像与中轴 39
4.5  邻域关系 39
4.6  结论 41
4.7  术语 41
专题4A  图像表示方法 42
4A.1  采样的变种:六角形像素 42
4A.2  其他形式的图像表示 44
参考文献 46
第5章  线性算子与核算子 49
5.1  什么是线性算子 49
5.2  核算子在数字图像中的应用 49
5.2.1  自变量的方向:卷积和相关 50
5.2.2  用核算子估计导数 50
5.3  通过函数拟合估计导数 51
5.4  图像的矢量表示 55
5.5  图像的基向量 56
5.6  边缘检测 57
5.7  用核算子表示可微函数的采样 59
5.8  计算卷积 62
5.9  尺度空间 64
5.9.1  四叉树 64
5.9.2  高斯尺度结构 65
5.10  量化边缘检测算子的精确性 67
5.11  人们的做法 67
5.12  结论 69
5.13  术语 69
专题5A  边缘检测器 72
5A.1  Canny边缘检测器 72
5A.2  改进边缘检测 73
5A.3  从边缘点推理线段 73
5A.4  空域频率表示 74
5A.5  术语 75
参考文献 77
第6章  图像松弛:复原与特征抽取 81
6.1  松弛 81
6.2  复原 81
6.3  最大后验方法 84
6.3.1  贝叶斯准则 84
6.3.2  题外话:逆问题中的问题 86
6.3.3  用于边缘保留型平滑的目标函数 86
6.4  均值场退火 87
6.4.1  选择先验项 89
6.4.2  退火:避免局部最小值 91
6.4.3  如何对一个含有核算子的函数求导 92
6.4.4  实际考虑:边缘保留型的平滑 94
6.5  结论 95
6.6  术语 95
专题6A  替代算法与等价算法 97
6A.1  GNC: 一种可去除噪声的替代算法 97
6A.2  传导率可变的扩散 99
6A.3  面向边缘的各向异性扩散 100
6A.4  对图像松弛算子的一个通用描述 100
6A.5  与神经元网络之间的关系 103
6A.6  结论 104
参考文献 105
第7章  数学形态学 111
7.1  二值形态学 111
7.1.1  膨胀 111
7.1.2  腐蚀 113
7.1.3  膨胀与腐蚀的性质 113
7.1.4  开运算与闭运算 115
7.1.5  开运算与闭运算的性质 116
7.2  灰度形态学 117
7.3  距离变换 118
7.3.1  采用掩膜计算距离变换 118
7.3.2  Voronoi图 119
7.4  结论 119
7.5  术语 119
专题7A  形态学 121
7A.1  有效地计算腐蚀、膨胀 121
7A.2  形态学采样定理 124
7A.3  选择结构元素 126
7A.4  边缘及曲面上的缝隙弥合 126
7A.5  术语 136
参考文献 136
第8章  分割 139
8.1  划分图像 139
8.2  阈值化分割 140
8.3  连通分量分析 142
8.3.1  递归式区域增长算法 143
8.3.2  迭代式连通分量分析方法 145
8.3.3  标号图像的一种替代方法 149
8.4  曲线分割 149
8.5  主动轮廓线 150
8.5.1  能量最小化原则 150
8.5.2  偏微分方程方法 151
8.6  曲面分割 153
8.6.1  曲面描述 153
8.6.2  椭圆及椭球拟合 154
8.7  评估分割质量 155
8.8  结论 156
8.9  术语 156
专题8A  分割 157
8A.1  纹理分割 157
8A.2  使用边缘的图像分割 159
8A.3  运动分割 160
8A.4  颜色分割 160
8A.5  使用MAP方法的分割 160
8A.6  人如何完成分割 160
参考文献 160
第9章  形状 167
9.1  线性变换 167
9.2 基于协方差矩阵的变换方法 169
9.2.1  K-L展开的推导 169
9.2.2  K-L展开的性质 172
9.3  简单特征 173
9.4  矩 176
9.5  链码 177
9.6  傅里叶描述子 178
9.7  中轴 178
9.8  变形模板 179
9.9  二次曲面 180
9.10  表面的谐波函数表示 181
9.11  超二次曲面 181
9.12  广义柱体 183
9.13  结论 183
9.14  术语 183
专题9A  形状的描述 184
9A.1  求非凸区域的直径 184
9A.2  从图像推测三维形状 186
9A.3  运动分析与跟踪 192
9A.4  术语 194
参考文献 197
第10章  一致性标号 205
10.1  一致性 205
10.2  松弛法标号 208
10.2.1  利用一致性来修正标号 208
10.2.2  标号问题示例 209
10.3  结论 210
10.4  术语 211
专题10A  二维线条图的三维解释 211
参考文献 213
第11章  参数变换 215
11.1  Hough变换 215
11.1.1  垂直线带来的问题 216
11.1.2  如何找到交点—累加器数组 217
11.2  减少计算复杂度 218
11.3  检测圆 218
11.3.1  用非共线三个像素表示一个圆的定位 218
11.3.2  用参数变换检测圆 219
11.3.3  检测圆中利用梯度信息降低计算量 219
11.4  广义Hough变换 220
11.5  结论 220
11.6  术语 221
专题11A  参数变换 221
11A.1  检测抛物线 221
11A.2  检测峰值 223
11A.3  高斯图 223
11A.4  立体视觉中的参数一致性 223
11A.5  结论 224
11A.6  术语 224
参考文献 225
第12章  图和图论概念 227
12.1  图 227
12.2  图的性质 227
12.3  图结构的实现 228
12.4  区域邻接图 228
12.5  图匹配的应用:子图同构问题 230
12.6  外观图 230
12.7  结论 231
12.8  术语 231
参考文献 232
第13章  图像匹配 233
13.1  图像表达的匹配 233
13.1.1  模板匹配 233
13.1.2  点匹配 234
13.1.3  线段匹配 234
13.1.4  特征图像 235
13.2  匹配简单特征 237
13.3  图匹配 238
13.3.1  关联图 238
13.3.2  弹性模板 240
13.4  结论 241
13.5  术语 241
专题13A  匹配 243
13A.1  弹簧加模板回顾 243
13A.2  人工神经元网络用于物体识别 244
13A.3  图像索引 247
13A.4  匹配几何不变量 248
13A.5  结论 250
13A.6  术语 251
参考文献 251
第14章  统计模式识别 255
14.1  分类器设计 255
14.1.1  决策规则的选择 255
14.1.2  最大似然分类器 256
14.1.3  分类器学习算法 256
14.2  贝叶斯规则和最大似然分类器 257
14.2.1  贝叶斯规则 257
14.2.2  参数模式分类器 258
14.2.3  概率密度估计 259
14.2.4  均值估计 260
14.2.5  方差估计 260
14.2.6  似然比 261
14.3  决策区间和错误概率 262
14.4  条件风险 263
14.5  二次函数分类器 265
14.6  最小最大规则 267
14.7  最近邻方法 267
14.8  结论 268
14.9  术语 269
专题14A  统计模式识别 270
14A.1  用统计方法匹配特征向量 270
14A.2  支持向量机 272
14A.3  结论 275
14A.4  术语 276
参考文献 276
第15章  聚类 279
15.1  聚类之间的距离 279
15.2  聚类算法 281
15.2.1  合并聚类 281
15.2.2  k均值聚类 283
15.3  最优化聚类方法 284
15.3.1  分支定界法 285
15.3.2  向量量化 285
15.3.3  赢者全得算法 285
15.4  结论 286
15.5  术语 286
参考文献 288
第16章  句法模式识别 289
16.1  术语 289
16.2  文法类型 290
16.2.1  0型文法 290
16.2.2  1型文法 290
16.2.3  2型文法 291
16.2.4  3型文法 291
16.3  用文法结构进行形状识别 291
16.3.1  3型文法 291
16.3.2  2型方法 294
16.4  结论 296
16.5  术语 296
参考文献 297
第17章  应用 299
17.1  多谱图像分析 299
17.2  光学字符识别 299
17.3  自动诊断和辅助诊断 299
17.4  检测和质量控制 300
17.5  安全检测和入侵者识别 300
17.6  机器人视觉 300
17.6.1  机器人外科手术 301
17.6.2  机器人驾驶 301
参考文献 302
第18章  自动目标识别 307
18.1  层次体系 307
18.2  系统组成 308
18.3  算法的性能评价 309
18.3.1  性能表示 310
18.3.2  从训练数据生成ROC曲线 311
18.3.3  性能和系统评价 312
18.4  特有的机器视觉问题 312
18.4.1  目标信号可变性和误警率 312
18.4.2  跟踪 313
18.4.3  分割 314
18.4.4  特征选择 314
18.5  自动目标识别算法 314
18.5.1  基于模型的技术 316
18.5.2  基于统计的技术 317
18.5.3  模板匹配 317
18.6  Hough变换 318
18.7  形态学技术 318
18.8  链码 319
18.9  结论 319
参考文献 320
索引 327

教学资源推荐
作者: [斯洛文尼亚] 马塔伊·米赫尔(Matjaž Mihelj) 塔代·巴吉(Tadej Bajd), 阿尔斯·乌德(Aleš Ude) 贾德兰·勒纳里奇(Jadran Lenarčič) 阿尔斯·斯坦诺夫尼克(Aleš Stanovnik), 马尔科·穆尼(Marko Munih),尤里·雷吉(Jure Rejc)塞巴斯蒂安·斯拉杰帕(Sebastjan Šlajpah) 著
作者: [美] 杰瑞米·瓦特(Jeremy Watt) 雷萨·博哈尼(Reza Borhani) 阿格洛斯·K.卡萨格罗斯(Aggelos K. Katsaggelos) 著
作者: (美)Tom Mitchell
作者: [美]陈光祯(Kwang-Cheng Chen) 著
参考读物推荐