数字图像处理疑难解析
作者 : (英)Maria Petrou, (希)Panagiota Bosdogianni
译者 : 赖剑煌 冯国灿 等
丛书名 : 计算机科学丛书
出版日期 : 2005-04-15
ISBN : 7-111-15544-0
定价 : 33.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 263
开本 : 16开
原书名 : Image Processing: The Fundamentals
原出版社: John Wiley & Sons, Inc.
属性分类: 教材
包含CD :
绝版 :
图书简介

本书通过问答形式介绍数字图像处理的基础理论,涉及图像处理技术的各个层面。本书作者有丰富教学经验,全书用例详实,内容深入浅出,实用性强。
  本书可作为大学计算机及相关专业本科生、研究生的教学参考书,也可供广大从事数字图像处理与应用研究的专业人员参考。

图书特色

图书前言

本书是作者给Surrey大学信号处理和机器智能专业的硕士研究生开设本门课程11年来的教学成果的总结。
  图像处理作为机器智能的一门学科,最近几年得到了蓬勃发展,因此,引起了来自心理学、生理学、工程学和数学等不同领域研究人员的关注。机器智能的各种问题可以用不同的工具来解决。但是,当我们要用计算机来完成一项任务时,就必须要用机器所能理解的语言,而且这种语言是一种从数学领域发展出来算术语言,因此解决机器智能问题的方法主要是数学方法。图像处理是所有与机器智能相关的视觉和图像研究的基础。那种撇开图像处理去实现计算机视觉的想法就像希望从屋顶开始建造房子一样是不现实的,而不借助数学来做图像处理就像挥动胳膊去飞翔一样也是不可能的。
  由于打算在机器智能领域工作的人员层次不同,所以本书分为两个层次。第一个层次用有限的数学知识就很容易地理解,这个层次适合于那些进入这个领域的新手和研究生。第二个层次就比较复杂,需要用到各种复杂的数学方法和证明,适合于那些不屈不挠地刨根问底,想要知道“为什么”和“怎么样”的有好奇心的学生。对较低层次的读者,阅读本书时可以不需要参考为高层次读者所写的内容。所有涉及到高层次的内容都放在方框里,可以忽略。本书包含了大量例子。与方框中内容相联系的例子都用大写字母B标记出来了,如果愿意,它们可以和那些高级内容一样忽略。读者需要具备的基本的数学背景知识是如何进行矩阵的加减运算,矩阵的特征值分析的知识也是很重要的。但是,本书会有几个完全可行的例子,使得即使不熟悉这些知识的人,也能通过本书很容易地学会这种基本要点。本书介绍的随机方法也一样:读者可以从随机变量的基本概念开始学习,然后达到理解和运用遍历概念的水平。
  借此机会我要感谢无数的硕士生这么多年帮助我完善这本书,他们尖锐的提问,或者有时候看起来天真的问题,都对我有很大帮助。其实,人们在学习的时候是没有天真的问题的,天真的反而是那些不问问题的人!学生的问题有助于我清楚地规划好学习进度,并给了我把内容用提问和回答的形式表示出来的想法。
  写这本书对于Panagiota和我来说都是一个学习的过程。通过示例图像我们找到很大的乐趣,并且发现了这些方法的秘密。最困扰我们的一件事就是连续和离散方法之间的差别。一个解析推导得出的适用于连续域的公式通常和计算机编程来完成任务的公式没什么联系。这一点在第6章“图像复原”中会看到清晰的例证。这也是为什么在展示所有我们提出的方法时都使用了小的离散的图像的原因,这使得我们可以人工地操作这些图像,而又能知道当一幅真实大小的图像输入计算机时计算机会如何处理。谈到真实大小的图像,我们要感谢Constantinos Boukouvalas帮助编写了一些方法的程序。
  最后,我要感谢Surrey大学的视觉、语音和信号处理中心的同事们,尤其感谢Josef Kittler博士提供给我的所有机会和支持,还有我们的主管Graeme Wilford的热心帮助。
Maria Petrou

译者简介

赖剑煌 冯国灿 等:赖剑煌: 1986年毕业于中山大学,1989年获硕士学位,1999年获博士学位。曾到美国HARRIS数字系统公司、联合国大学软件技术研究所(澳门)等作访问学者。现任中山大学数学系教授、博士生导师、应用数学教研室主任、中国图像图形学会常务理事、广东省图像图形学会常务理事和秘书长。主要研究方向是图像处理和模式识别,尤其是人脸检测与人脸识别技术。迄今,已在国际学术期刊和会议上发表论文50余篇。曾获商业部科技进步二等奖及其他科技奖励多项。
冯国灿: 1988年获得中山大学硕士学位,1999年获香港浸会大学计算机科学博士学位。2000年10月~2002年11月获邀请到英国格莱莫根大学(University of Glamorgan)数字图像实验室和布拉德福大学(University of Bradford)数字媒体实验室做博士后研究员,主要从事压缩域图像特征提取和基于内容的图像检索技术的研究。现任中山大学教授、数学系副主任、博士生导师。近年来,主要从事模式识别和计算机视觉的研究,尤其是人脸识别技术和压缩域图像及视频特征提取。迄今,已在国际学术期刊和会议上发表论文50余篇。

译者序

数字图像处理是一门新兴学科,它起源于20世纪20年代,但是直到80至90年代,随着计算机应用的发展,数字图像处理才逐渐形成一套独立的学科体系。近20年来,由于遥感、医学、军事、工业和通信等领域应用的需要,数字图像处理的科学理论与技术手段得到迅猛发展,已成为了一个跨越计算机科学、数学、遥感、气象、冶金、地球物理学、生物医学等多学科的前沿科技领域。从CT的发明、数码相机的普及和数字电视业务的开展,到遥感图像处理、生物特征鉴别和智能交通的应用,数字图像处理的应用随处可见,它已极大地促进了人类的科学研究的发展、社会生产率的提高和生活方式的改善。因此,作为一个有广阔应用前景的新兴学科,无论是在理论研究方面,还是在应用生产方面,数字图像处理目前都存在许多问题有待我们去探索。
  数字图像处理的核心是数学理论,图像的采集、变换、表达、增强、滤波、复原和分割,无一不与数学密切相关。对于初学者来说,学习数字图像处理这门学科往往会有许多疑问,也会因为表面深奥的数学公式而裹足不前。本书刚好可以解决这些问题。
  这本书是作者在数字图像处理领域11年教学工作的成果,它有如下特色:
  * 写作形式独特。它以提问和回答的形式循序渐进、深入浅出地阐述了图像处理的基本原理。其中许多问题都来源于教学中学生的提问,很有代表性。这些问题往往是读者都会遇到的。
  * 对数学的处理恰到好处。它给出了两个层次的详细数学解释:一个层次是为了便于看懂而做的叙述,尽可能少地涉及数学;另一个是高层次的,严格的数学证明。
  * 对图像处理问题的来龙去脉解释清楚。使读者能够理解每种方法的“基本的细节”,包括有关问题来源及在实践中可能会遇到的问题。
  * 通过用尺度小的图像来解释概念,使读者不必借助计算机就可以做运算。
  * 分析了大量的实例,指导读者克服难点,获得答案。
  本书由中山大学数学与计算科学学院从事数字图像处理的有关师生共同翻译。赖剑煌教授和冯国灿教授负责翻译并审校了全书,其中赖剑煌教授负责本书的第1、5、6、7章,冯国灿教授负责本书的第2、3、4章。参加翻译的还有冯莉、李星、石林英、陈家大、陈羽、郑伟诗、谭丹娜、苏秋斌、何婧、江永宏等。
  由于时间仓促,译者水平有限,书中难免存在错误和疏漏,欢迎读者批评指正。

赖剑煌、冯国灿
2004年8月26日

图书目录

第1章  导论 1
1.1  为什么要做图像处理 1
1.2  什么是一幅图像 1
1.3  什么是一幅图像在一个像素点的亮度 1
1.4  为什么图像经常用512×512、256×256、128×128等形式表述2
1.5  存储一幅图像需要多少比特 2
1.6  什么是图像的分辨率 2
1.7  如何进行图像处理 3
1.8  什么是一个线性算子 4
1.9  算子是如何定义的 5
1.10  一个算子是如何对一幅图像进行变换的 5
1.11  什么是点扩散函数 5
1.12  如何表达一个线性算子作用于一幅图像的实际效果 7
1.13  矩阵H结构的可分离性假设的含义是什么 11
1.14  可分离变换如何用矩阵形式来表示 11
1.15  可分离性假设的含义是什么 12
1.16  本章要点 14
1.17  图像处理的目的是什么 14
1.18  本书要点 15
第2章  图像变换 17
2.1  本章概述 17
2.2  如何定义基图像 17
2.3  什么是两个向量的外积 17
2.4  如何用向量外积进行图像展开 17
2.5  什么是酉变换 19
2.6  什么是酉矩阵 19
2.7  什么是酉变换的逆 19
2.8  如何构造酉矩阵 19
2.9  如何选择矩阵U和V使得g能用比f少的比特来表示 19
2.10  如何对角化矩阵 20
2.11  如何计算图像对角化时所需要的矩阵U、V及 24
2.12  什么是图像的奇异值分解 27
2.13  如何用SVD逼近一幅图像 27
2.14  用SVD逼近图像的误差是多少 28
2.15  如何最小化重构误差 29
2.16  用SVD进行图像展开时的基图像是怎样的 30
2.17  任意被展开的图像是否存在基图像集 35
2.18  什么是函数的完全标准正交集 35
2.19  是否存在标准正交离散函数完全集 36
2.20  如何定义哈尔函数 36
2.21  如何定义沃尔什函数 37
2.22  如何从哈尔函数和沃尔什函数创建一个图像变换矩阵 37
2.23  哈尔变换的基图像是怎样的 40
2.24  如何仅用+1或-1定义一个正交矩阵 45
2.25  哈达玛/沃尔什变换的基图像是怎样的 45
2.26  沃尔什和哈尔变换的优缺点是什么 49
2.27  什么是哈尔小波 49
2.28  傅里叶变换的离散形式是怎样的 49
2.29  离散傅里叶变换如何用矩阵形式表示 51
2.30  矩阵U可否用于DFT的酉矩阵 52
2.31  用DFT进行图像展开时的基图像是怎样的 53
2.32  为什么离散傅里叶变换比其他变换使用更普遍 56
2.33  什么是卷积定理 57
2.34  如何显示图像的离散傅里叶变换 62
2.35  图像旋转时的离散傅里叶变换是怎样的 63
2.36  图像平移时的离散傅里叶变换是怎样的 64
2.37  函数平均值和它的DFT之间的关系是怎样的 65
2.38  图像伸缩时的离散傅里叶变换是怎样的 66
2.39  什么是离散余弦变换 68
2.40  本章要点 68
第3章  图像的统计描述 69
3.1  本章概述 69
3.2  为什么需要对图像进行统计描述 69
3.3  是否存在一个用不相关数据来表示的图像变换可以按最小均方误差来近似图像 69
3.4  什么是随机场 69
3.5  什么是随机变量 69
3.6  如何描述随机变量 69
3.7  什么是事件的概率 69
3.8  什么是随机变量的分布函数 70
3.9  什么是随机变量取特定值的概率 70
3.10  什么是随机变量的概率密度函数 71
3.11  如何描述多个随机变量 71
3.12  n个随机变量之间的可能关系是怎样的 71
3.13  如何定义随机场 72
3.14  如何联系同一随机场中两个随机变量 73
3.15  如何联系两个随机场中两个随机
3.16  既然我们总是只有图像的一个版本,如何计算以前定义中的期望值74
3.17  什么时候随机场是齐次的 74
3.18  如何计算随机场的空间统计量 75
3.19  什么时候随机场是遍历性的 75
3.20  什么时候随机场对于均值是遍历性的 75
3.21  什么时候随机场对于自相关函数是遍历性的 75
3.22  遍历性的含义是什么 79
3.23  如何利用遍历性来减少表示一幅图像所需要的比特数 79
3.24  具有不相关随机变量的随机场的]
3.25  如何变换图像使得它的自相关矩阵是对角的 80
3.26  遍历性的假设是现实的吗 80
3.27  如何用K-L变换来逼近一幅图像 85
3.28  当我们截断K-L扩展来逼近一幅
3.29  K-L变换的基图像是怎样的 85
3.30  本章要点 96
第4章  图像增强 97
4.1  什么是图像增强 97
4.2  如何增强图像 97
4.3  利用图像的灰度级统计进行图像增强有哪些方法 97
4.4  什么是图像的直方图 97
4.5  什么时候有必要修改图像的直方图 97
4.6  如何修改图像的直方图 97
4.7  什么是直方图均衡化 98
4.8  为什么直方图均衡化并不会产生具有平坦直方图的图像 98
4.9  增强图像使它具有绝对平坦的直方图是否可能 98
4.10  如果我们不想要一幅有绝对平坦直方图的图像应该怎么做 100
4.11  为什么除了进行直方图均衡化之外还希望实现其他的操作 101
4.12  如果图像的对比度不均一该如何处理 102
4.13  对直方图的操作是否还有其他的方法 103
4.14  如何提高多光谱图像的对比度 105
4.15  什么是主分量分析 106
4.16  本章讨论的K-L变换和第3章所讨论的有什么联系 106
4.17  如何实现主分量分析 106
4.18  使用主分量来表示图像的优点是什么 107
4.19  主分量分析的缺点是什么 107
4.20  有一些增强了对比度的图像看起来噪声很明显。如何处理这种情况112
4.21  图像噪声的类型有哪些 112
4.22  什么是排序滤波器 114
4.23  什么是中值滤波 114
4.24  如果图像的噪声不是脉冲的要怎么办 114
4.25  为什么低通滤波可以减少噪声 115
4.26  如果我们感兴趣的是图像的高频部分应该怎么做 116
4.27  什么是理想高通滤波器 116
4.28  如何改善有光照变化的图像 116
4.29  是否可以用第2章的线性方法实现图像增强的目的 118
4.30  本章要点 119
第5章  二维滤波器 121
5.1  本章概述 121
5.2  如何定义一个二维滤波器 121
5.3  系统函数和滤波器的单位采样响应是如何联系在一起的 121
5.4  为什么我们对实域的滤波器函数感兴趣 121
5.5  h(k, l) 需要满足什么条件才可以做为一个卷积滤波器 122
5.6  一维理想低通滤波器和二维理想低通滤波器之间的关系 125
5.7  如何实现无限域上的滤波器 126
5.8  如何定义数字化一维滤波器的z变换 126
5.9  为什么要用z变换 127
5.10  二维的z变换如何定义 127
5.11  一维递归滤波器和二维递归滤波器有什么基本的区别 133
5.12  如何知道滤波器没有扩大噪声 134
5.13  是否有另一种方法使用无限脉冲响应滤波器 134
5.14  为什么需要逼近理论 134
5.15  如何知道一个近似滤波器是否性能良好 134
5.16  对一个给定的理想系统函数的最佳逼近是什么 134
5.17  为什么根据Chebyshev范数而不是均方误差来评价一个近似值 134
5.18  如何获得一个系统函数的逼近 135
5.19  什么是窗口法 135
5.20  窗口法存在什么问题 135
5.21  如何提高窗口法处理的效果 135
5.22  如何用一维信号的窗口函数来定义图像的窗口函数 136
5.23  所要解决的逼近问题的形式定义是什么 136
5.24  什么是线性规划 136
5.25  如何把滤波器设计问题转化为线性规划问题 137
5.26  如何减少线性规划求解的计算强度 141
5.27  迭代方法的主要思想是什么 141
5.28  有什么算法可以减少吻合误差的上限吗 141
5.29  最大化算法是如何工作的 141
5.30  什么是等式的极限集合 142
5.31  什么是La Vallee Poussin定理 142
5.32  如何证明La Vallee Poussin定理 142
5.33  迭代算法的步骤是怎样的 142
5.34  可以逼近一个在频域上有效的滤波器吗 143
5.35  如何构造一个函数去实现用滤波器的其他频率值表达它的某些频率的值143
5.36  当仅在频域设计滤波器时要怎样做 149
5.37  如何求解未知值H(k, l) 150
5.38  根据Chebyshev准则频率采样方法是否能得到最优解 150
5.39  本章要点 151
第6章  图像复原 153
6.1  什么是图像复原 153
6.2  图像增强和图像复原之间的区别是什么 153
6.3  为什么图像需要复原 153
6.4  几何畸变是如何产生的 153
6.5  几何畸变的图像如何被复原 154
6.6  如何实现空间变换 154
6.7  为什么灰度插值是必要的 154
6.8  退化图像是如何依赖非退化图像和线性退化过程的点扩展函数的 157
6.9  退化图像是如何依赖于非退化图像和线性移不变退化过程的点扩展函数的 157
6.10  对于离散图像式(6-5)的形式是怎样的 158
6.11  图像复原的问题是什么 158
6.12  如何解决图像复原的问题 158
6.13  如何获得退化过程的传递函数的信息 158
6.14  如果知道退化过程的传递函数,图像复原问题的解决方法是否就更简单 165
6.15  在=0的点(u, v)会发生什么样的情况 165
6.16  是否和的零点总是一致的 165
6.17  当我们写线性退化方程的时候如何把噪声考虑进去 165
6.18  如何避免扩大噪声 166
6.19  如何形式化地表达图像复原问题 171
6.20  式(6-37)的解是什么 172
6.21  可以求出式(6-37)的线性解吗 172
6.22  图像复原问题的线性最小均方误差解是什么 172
6.23  如果原图像f(r)未知,如何利用依赖于退化图像的互谱密度函数的式(6-41)来推导需要的滤波器 173
6.24  如果我们对于未知图像f(r)的统计信息完全不知道,应该如何使用式(6-47) 174
6.25  Wiener滤波器式(6-47)和式(6-25)的逆滤波器之间的关系是怎样的 174
6.26  假定知道未知图像f(r)的统计信息,能否确定由Svv (r)所表达的噪声的
统计信息 174
6.27  假定退化过程是线性的,为什么我们要用卷积定理而不是通过解一组线性方程来恢复结果呢 182
6.28  式(6-76)看起来简单明了,为什么还要那么麻烦地去用其他方法呢 183
6.29  是否存在对矩阵H求逆的方法 184
6.30  什么矩阵是块循环的 184
6.31  什么矩阵是循环矩阵 184
6.32  为什么块循环矩阵可以很容易地求逆 184
6.33  什么是循环矩阵的特征值和特征向量 184
6.34  已知矩阵特征值和特征向量如何求矩阵的逆 185
6.35  如何知道表达线性退化过程的矩阵H是块循环的 189
6.36  如何对角化一个块循环矩阵 190
6.37  现在我们知道了如何解决对H求逆的问题,但是如何解决式(6-76)
对噪声的极端敏感问题 198
6.38  如何利用矩阵逆的约束 199
6.39  Wiener滤波器和加约束的矩阵逆滤波器之间的关系是怎样的 201
6.40  本章要点 208
第7章  图像分割和边缘检测 209
7.1  本章概述 209
7.2  图像分割和边缘检测的目的是什么 209
7.3  如何将一幅图像分成一些统一的区域 209
7.4  给图像加“标记”有什么意义 210
7.5  当直方图的谷不是很明显时如何处理 210
7.6  如何最小化错分像素的数目 211
7.7  如何选择最小误差阈值 211
7.8  当物体和背景像素是正态分布时的最小误差阈值是什么 215
7.9  式(7-6)的两个解的意义是什么 216
7.10  最小误差阈值方法的缺点是什么 219
7.11  是否有一种可以不依赖于物体和背景像素分布模型的方法 219
7.12  Otsu方法有缺点吗 222
7.13  如何对在变化光照下所获得的图像定阈值 222
7.14  如果可以根据ln f(x, y)的直方图来定图像的阈值,是否可以根据图像
表面的反射性质来定阈值 222
7.15  如果直接阈值化方法在变化光照的情况下失效,应该如何处理 224
7.16  阈值方法有哪些缺点 225
7.17  如何处理看起来一致而实际上包含了不一致区域的图像 226
7.18  有哪些方法考虑了像素的空间邻接关系 226
7.19  如何选择种子像素 226
7.20  拆分和合成方法是如何进行的 227
7.21  与考虑像素之间的相似性相反,是否可以考虑区域之间的不相似性来
进行图像分割 227
7.22  如何度量相邻像素之间的不相似性 227
7.23  可以选择的最小窗口是什么样的 228
7.24  当图像有噪声的时候会发生什么情况 229
7.25  对于边缘检测如何选择3×3模板的权重 232
7.26  参数K的最佳值是什么 233
7.27  一般情况下,如何决定一个像素是否是边缘像素 238
7.28  Sobel模板是否对所有图像都适用 241
7.29  如果因为图像中存在着明显的噪声而需要选择一个更大的模板,我们要如何选择权重 241
7.30  能否用边缘检测的最优滤波器以最优的方式检测图像中的线 243
7.31  阶跃边缘和线的基本差别是什么 244
7.32  本章要点 254
参考文献 255
主题词索引 259

教学资源推荐
作者: 彭波 孙一林 等
作者: 姚敏 等编著
作者: [美]詹妮·普瑞斯(Jenny Preece)[英]伊温妮·罗杰斯(Yvonne Rogers) 海伦·夏普(Helen Sharp) 著
作者: 陈永强 张聪
参考读物推荐