首页>参考读物>计算机科学与技术>综合

OpenCV实例精解
作者 : [美] 普拉蒂克·乔希(Prateek Joshi),大卫·米兰·埃斯克里瓦(David Mill·n Escriv·),维尼修斯·戈多伊(Vinicius Godoy)著
译者 : 呆萌院长 李风明 李翰阳 译
丛书名 : 华章程序员书库
出版日期 : 2016-08-30
ISBN : 978-7-111-54741-9
定价 : 59.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 222
开本 : 16
原书名 : OpenCV By Example
原出版社: Packt Publishing Ltd.
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

图书特色

OpenCV是最常见的计算机视觉库之一,它提供了许多经过优化的复杂算法,而且几乎可以兼容所有的平台。本书首先讲解OpenCV的安装和基本处理过程,然后带领你从零开始建立诸如视频流分析或文字识别等复杂场景的OpenCV项目。

通过对本书的学习,你将熟悉OpenCV的基本知识,如矩阵运算、过滤器和直方图,以及更高级的概念,如分割、机器学习、复杂的视频分析和文字识别。

通过阅读本书,你将学到:
OpenCV 3 的安装
创建所需的CMake脚本、编译C++应用程序和管理其依赖关系
理解计算机视觉的工作流程、基础图像矩阵格式和过滤器
理解图像分割和特征提取技术
从静态场景中移除背景来识别视频监控的移动对象
在直播视频中使用各种不同的技术,探测不同物体
使用Tesseract进行文本探测与识别


作者简介

Prateek Joshi 计算机视觉专家,曾任职于NVIDIA、微软、高通等公司,其研究方向为基于内容的分析和深度学习。他在计算机视觉领域已经斩获多个专利,也赢得过很多关于图像识别技术的编程比赛。他还是《OpenCV with Python By Example》一书的作者。
David Millán Escrivá 有超过13年的IT工作经验和9年以上的计算机视觉领域从业经验,在不同的项目和初创企业工作过,并一直在工作中运用计算机视觉、光学字符识别、图像识别方面的知识。他是DamilesBlog (http://blog.damiles.com)的作者,还是《Mastering OpenCV with Practical Computer Vision Projects Book》一书的合著者。
Vinícius Godoy PUCPR的计算机图形学教授、Blackmuppet公司的联合创始人。他感兴趣的领域包括图像处理、设计模式和多线程应用程序。

内容简介
OpenCV是一个开源的计算机视觉库,在计算机视觉的开发中扮演着重要的角色。它为计算机视觉应用开发提供了灵活、功能强大的开发接口,使其成为计算机视觉专业人员所依赖的重要开发工具。
本书首先介绍计算机视觉中的各个领域和在C++中相关的OpenCV功能。每个章节都包含真实世界的例子和示例代码,可以帮助你轻松地掌握主题,并了解它们在现实生活中的应用。全书自始至终都在力争使用简洁的语言、清晰的格式以及实践性很强的示例项目来教你如何在C++中使用OpenCV,并建立各种应用程序。
无论你是对计算机视觉一无所知,还是对此已有基本的了解,本书都将通过一些真实世界的例子和项目来引导你理解OpenCV的概念和算法。

图书前言

OpenCV是开发计算机视觉应用最流行的库之一。它使我们能够实时运行许多不同的计算机视觉算法。它已经存在了很多年,并成为这个领域的标准库。OpenCV的主要优点之一是它的高度优化和几乎可以在所有平台上兼容。
本书首先介绍了计算机视觉中的各个领域和在C++中相关的OpenCV功能。每章都包含真实世界的例子和示例代码帮助你轻松地掌握主题,并了解它们在现实生活中的应用。总之,本书是一部实用指南,会教你如何在C++中使用OpenCV,并建立各种应用程序。
本书的主要内容
第1章涵盖各种操作系统的安装步骤,介绍了人类视觉系统,以及计算机视觉中的各种主要内容。
第2章讨论如何在OpenCV中读/写图像和视频,并且介绍如何使用CMake建立一个项目。
第3章介绍如何通过创建一个图形用户界面和鼠标事件检测器来实现交互式应用程序。
第4章探讨直方图和滤波器,也演示了如何卡通化图像。
第5章描述了各种图像的预处理技术,如去除噪声、阈值化,以及轮廓分析。
第6章处理对象识别和机器学习,并学习如何使用支持向量机建立一个对象分类系统。
第7章讨论了人脸检测和Haar级联,并解释如何使用这些方法来检测人脸的各个部分。
第8章探索背景差分、视频监控和形态学图像操作,并描述了它们如何彼此关联。
第9章介绍如何使用不同的技术跟踪对象,如基于颜色和基于特征。
第10章介绍光学字符识别、文本分割和Tesseract OCR引擎。
第11章深入研究Tesseract OCR引擎,介绍如何将它应用于文本检测、提取和识别。
你需要准备什么
本书的例子会用到以下技术:
OpenCV 3.0或更新的版本
CMake 3.3.x或更新的版本
Tesseract
Leptonica(Tesseract依赖包)
QT(可选)
OpenGL(可选)
相关章节提供了详细的安装说明。
本书的读者对象
本书面向OpenCV初学者,以及希望在C++中使用OpenCV进行计算机视觉应用开发的开发人员。懂得C++的基础知识将有助于理解本书。本书对于想要开始学习计算机视觉,并了解基本概念的人来说同样适用。他们应该知道基本的数学概念,如向量、矩阵、矩阵乘法,等等,这样才能最大限度地利用本书。在阅读本书的过程中,你将从头学习如何使用OpenCV创建各种计算机视觉应用。
下载示例代码
可登录http://www.hzbook.com,下载本书示例代码。

上架指导

计算机\程序设计

封底文字

OpenCV是最常见的计算机视觉库之一,它提供了许多经过优化的复杂算法,而且几乎可以兼容所有的平台。本书首先讲解OpenCV的安装和对基本处理过程的理解,然后带领你从零开始建立诸如视频流分析或文字识别等复杂场景的OpenCV项目。

  通过对本书的学习,你将熟悉OpenCV的基本知识,如矩阵运算、过滤器和直方图,以及更高级的概念,如分割、机器学习、复杂的视频分析和文字识别。
通过阅读本书,你将学到:
 OpenCV3 的安装
 创建所需的CMake脚本、编译C++应用程序和管理其依赖关系
 理解计算机视觉的工作流程、基础图像矩阵格式和过滤器
 理解图像分割和特征提取技术
 从静态场景中移除背景来识别视频监控的移动对象
 在直播视频中使用各种不同的技术,探测不同物体
 使用Tesseract进行文本探测与识别

作者简介

[美] 普拉蒂克·乔希(Prateek Joshi),大卫·米兰·埃斯克里瓦(David Mill·n Escriv·),维尼修斯·戈多伊(Vinicius Godoy)著:暂无简介

译者简介

呆萌院长 李风明 李翰阳 译:暂无简介

译者序

通俗地讲,计算机视觉就是给计算机安装上眼睛(照相机)和大脑(算法),让其能够感知周围的环境。它是对生物视觉的一种模拟,通常的做法是通过对采集的图像或者视频进行处理来获得相应场景的三维信息。计算机视觉不仅应用在计算机科学和工程、信号处理、物理学、应用数学和统计学中,也广泛应用在神经生理学和认知科学等领域,发展前景可见一斑。
工欲善其事,必先利其器。作为如今开发计算机视觉应用最流行的库之一,OpenCV不但能够实时运行许多不同的计算机视觉算法,而且几乎可以兼容所有的平台。
本书本着学以致用的精神,每章都包含现实世界的例子和示例代码,以帮助读者更好地了解它们在现实生活中的应用。桃李不言,下自成蹊,对本书最真实的评价,来自于广大的读者朋友。
本书翻译的过程并不短暂,作为译者,我们尽可能地忠于原著。对于本书中大量的专业术语尽量遵循已有的标准,并参阅了大量文献,以便于读者理解。
全书由呆萌院长、李风明和李翰阳共同完成翻译。由于水平有限,书中出现的错误和不妥之处,恳请读者批评指正。

译者
2016年6月

图书目录

译者序
前言
第1章 OpenCV的探险之旅 1
1.1 理解人类视觉系统 1
1.2 人类是怎么理解图像内容的 3
1.3 OpenCV可以做什么 4
1.4 安装OpenCV 11
1.5 总结 14
第2章 OpenCV基础知识介绍 15
2.1 CMake基本配置文件 15
2.2 创建库 16
2.3 管理依赖关系 17
2.4 脚本复杂化 19
2.5 图像和矩阵 21
2.6 读写图像 23
2.7 读取视频和摄像头 27
2.8 其他基本对象类型 30
2.9 矩阵的基本运算 33
2.10 基本数据持久性和存储 36
2.11 总结 38
第3章 图形用户界面和基本滤波 39
3.1 介绍OpenCV的用户界面 39
3.2 使用OpenCV实现基本图形用户界面 40
3.3 QT的图形用户界面 45
3.4 在界面上添加滑动条和鼠标事件 47
3.5 在用户界面上添加按钮 51
3.6 支持OpenGL 55
3.7 总结 60
第4章 深入研究直方图和滤波器 61
4.1 生成CMake脚本文件 62
4.2 创建图形用户界面 63
4.3 绘制直方图 65
4.4 图像色彩均衡化 69
4.5 LOMO效果 71
4.6 卡通效果 76
4.7 总结 80
第5章 自动光学检测、目标分割和检测 81
5.1 隔离场景中的目标 82
5.2 创建AOI应用程序 84
5.3 输入图像的预处理 86
5.4 分割输入图像 92
5.5 总结 101
第6章 学习目标分类 102
6.1 介绍机器学习的概念 103
6.2 计算机视觉和机器学习的工作流程 106
6.3 自动检测目标分类的示例 108
6.4 特征提取 110
6.5 总结 120
第7章 识别人脸部分并覆盖面具 121
7.1 理解Haar级联 121
7.2 积分图 123
7.3 在实时视频中覆盖上面具 124
7.4 戴上太阳镜 127
7.5 跟踪鼻子、嘴和耳朵 130
7.6 总结 131
第8章 视频监控、背景建模和形态学操作 132
8.1 理解背景差分 132
8.2 简单背景差分法 133
8.3 帧差值法 137
8.4 混合高斯方法 141
8.5 形态学图像操作 144
8.6 图像细化 145
8.7 图像加粗 146
8.8 其他形态学运算 147
8.9 总结 152
第9章 学习对象跟踪 153
9.1 跟踪特定颜色的对象 153
9.2 建立交互式对象跟踪器 156
9.3 使用Harris角点检测器检测点 161
9.4 Shi-Tomasi角点检测器 163
9.5 基于特征的跟踪 166
9.6 总结 175
第10章 文本识别中的分割算法 176
10.1 OCR简介 176
10.2 预处理步骤 178
10.3 在你的操作系统上安装Tesseract OCR 186
10.4 使用Tesseract OCR库 190
10.5 总结 195
第11章 使用Tesseract识别文本 196
11.1 文本识别API工作原理 196
11.2 使用文本识别API 200
11.3 总结 212

教学资源推荐
作者: (美)Thomas Pittman(阿肯色大学)  James Peters(阿肯色大学) 著
作者: (加)Dennis Roddy 著
参考读物推荐
作者: [美]尼尔·福特(Neal Ford),[美]马克·理查兹(Mark Richards),[美]普拉莫德·萨达拉奇(Pramod Sadalage),[澳]扎马克·德加尼(Zhamak Dehghani) 著