首页>参考读物>计算机科学与技术>人工智能

人脸识别与美颜算法实战:基于Python、机器学习与深度学习
作者 : 方圆圆 著
出版日期 : 2020-04-07
ISBN : 978-7-111-65045-4
定价 : 99.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 232
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

本书将传统的图像处理技术、机器学习时代的图像技术,到目前炙手可热的深度学习时代的图像处理技术融汇贯通起来。生动的结合了目前热门的应用,以抖音、美颜相机、手机自带的滤镜和美颜功能为切入点,专注于人脸图像的各种处理,大量实际案例,带领读者与一线AI图像算法工程师在项目实践中的如何设计算法流程,如何优化算法逻辑,如何将算法应用到实际的场景中。另外本身的最后一章,深扒了目前抖音、美颜相机、天天P图、淘宝、京东等APP里面图像技术的应用场景以及实现原理,提纲挈领的概述了电商、娱乐、金融、安防这四大领域中应用的AI+图像技术实现思路。让读者可以对整个中国AI+图像的应用现状以及前景有直观的认知。

图书前言

据统计,在当今各行各业中,互联网与软件工程行业薪资名列前茅,大幅领先于传统行业。BOSS直聘发布《2020年人才资本趋势报告》,该报告公布了2020年人才领域的前瞻趋势,对其中的人工智能相关方向进行了梳理。其中,自然语言处理岗位的平均薪资为25?553元;机器学习岗位的平均薪资为27?652元;语音识别岗位的平均薪资为24?037元;深度学习岗位的平均薪资为27?516元;语音、视频、图形开发岗位的平均薪资为22?979元。随着人工智能领域的不断扩大和普及,各行各业逐步深入实践和应用人工智能领域的相关技术,具有实践经验的顶尖AI人才缺口增大,人工智能技术将成为第四次工业革命的发动机,成为不可或缺的力量源泉。
在人工智能领域,计算机视觉是人工智能最重要的部分之一,尤其是人脸图像处理领域涌现了商汤、旷视、云丛、抖音等多家独角兽企业。2014年,中国人脸识别行业的市场规模为49亿元;2018年,中国人脸识别行业的市场规模为131亿元,年均复合增长率为37%。这充分显示了人脸图像处理技术的巨大商用价值,大量的人脸相关应用不断涌现。
本书结合大量的实际案例,从Python图像处理开始讲起,再到机器学习、深度学习的理论和应用,通过由浅入深、图文并茂的讲解及项目实战,提高读者的理论水平和代码实践能力。
本书特色
1. 入门门槛低,学习曲线平滑
本书从搭建环境学起,首先介绍Windows、Linux和Mac OS这三种环境下编译环境的配置和安装;然后介绍与Python数据编程相关的基础知识、图像处理算法基础及常用函数;接着介绍机器学习和深度学习的基础理论;最后通过Python复现各种常用软件中的人脸图像算法应用。本书学习曲线平滑,适合深度学习和机器学习的零基础读者阅读。
2. 通过对比、理论结合实践的方式讲解,适合新手学习
对于一个新知识点的出现,本书通过对比的方式给出了概念或原理,让读者能举一反三,拓宽知识面;对深度学习的一些理论和概念,本书结合目前热门软件中的图像算法应用实例,让读者能边学习边实践,缩短了新手与老手之间的差距。
3. 内容丰富、实用,主次分明
本书所选案例涉猎广泛而丰富,算法案例紧跟当前潮流,如抖音、天天P图、美颜相机中的各种图像处理技巧,沿着“需求→算法设计→代码实现”的思路讲解,书中大量既丰富又生动有趣的例子简单易学,可直接上手。在代码示例中,不仅包含了模型构建和设计的核心思想,同时也兼顾了新手容易犯错的细节展示。此外,本书还介绍了一些在工程实践中常用的设计与实现技巧,以提高内容的实用性,增强案例与实际系统设计和实现过程的联系。
4. 图文搭配合理、生动有趣,全程伴随实战
本书从实战出发,介绍了大约60多个案例,脉络清晰,没有太多枯燥的理论讲解,而是以一位资深AI算法工程师手把手带读者入门做项目的方式,讲述了新手如何入门成为AI图像算法工程师,遇到项目如何入手去做,以及目前抖音中好玩的效果是如何一步步通过算法设计做出来的,沿着Python基础、图像处理技术、视频处理技术、机器学习、深度学习及各类图像美颜算法的思路去实现。目前,各种App中美颜算法大行其道,希望通过作者有趣的讲解,可以带领读者探索其中的各种算法设计小技巧。
本书内容
第1章?AI时代:图像技术背景知识
本章首先介绍了什么是人工智能以及人工智能的历史和发展,通过介绍AI的发展历史和一些标志性事件,概述了目前中国AI技术的发展现状;然后介绍了计算机视觉技术及其分类和应用,让读者在第1章就可以体会到AI在生活中无处不在,以及它无限的发展前景。
第2章?武器和铠甲:开发环境配置
本章主要介绍了本书涉及的开发语言和编译环境,详细介绍了OpenCV开源库及Python不同版本间的区别,带领读者手把手搭建PyCharm和Anaconda编译环境,完成基本的AI开发环境配置,并且在不同环境下装载各种需要的工具包。
第3章?开启星辰大海:图像处理技术基础知识
本章详细介绍了图像处理技术的基础知识,每个知识点对应多个Python实例,让读者能够轻松完成图像的旋转、平移、镜像和缩放等一系列操作。
第4章?First Blood:第一波项目实战
本章以大量的Python实例展示了基于图像处理算法可以实现的多种效果,介绍了抖音哈哈镜、照片怀旧、素描、油画、卡通化和马赛克处理等一系列项目的算法原理和代码实现,有趣地展示了图像处理技术中的各种玩法。
第5章?Double Kill:视频图像处理理论和项目实战
本章介绍了视频图像处理技术的原理和流程,并以大量的实例展示了如何根据抖音的一些视频特效来设计算法以实现其效果,完成了抖音视频中抖动、闪白、霓虹、时光倒流、视频反复、慢动作和Black magic等效果设计。
第6章?Triple Kill:基于机器学习的人脸识别
本章详细介绍了机器学习的基础知识,从一个机器学习的实例出发,讲述了机器学习的原理,以及什么时候使用机器学习。本章以经典的人脸识别算法为例,从数据准备到算法设计原理,再到最后的训练,完成一个完整的机器学习项目。
第7章?Quatary Kill:基于深度学习的人脸识别
本章详细介绍了深度学习的基本概念和使用场景;讲解了深度学习和机器学习的区别,并以LeNet-5网络为例讲解了深度学习的经典网络;还讲解了几种常见的网络层及其作用,如卷积层、激励层、池化层、Flatten层和全连接层;调用TensorFlow进行数据增广,详解模型训练和测试过程,并讲解了如何设计损失函数和优化器,以及如何评价一个模型的好坏。
第8章?Penta Kill:人脸图像美颜算法项目实战
本章以几种经典的图像美颜算法为例,讲解了目前主流的美图软件,如美颜相机、天天P图等图像美颜算法的设计。其中,涉及的图像处理基础算法有各种图像过滤器、图像颜色HSV空间、颜色分割和各种图像增强算法等。本章还通过大量的Python实例实现了人脸磨皮、美白和祛痘等效果。
第9章?Legendary:AI时代图像算法应用新生态
本章以目前主流的应用领域为例,分析了AI时代图像算法的应用现状,讲解了项目中基本的算法设计逻辑,以及抖音和天天P图等应用中图像算法的应用情况与算法设计复现,带领读者感受应用级项目算法的设计思路。
配套资源获取方式
本书涉及的源代码文件等资料需要读者自行下载。请登录机工新阅读网站(www.cmpreading.com),在该网站上搜索到本书,然后单击“资料下载”按钮,即可在本书页面上找到下载链接。
本书读者对象
深度学习爱好者;
计算机视觉技术爱好者;
算法工程设计实现工程师;
渴望入门深度学习相关领域的学生;
图像处理技术爱好者;
对美颜算法、App自动化妆算法感兴趣的人员;
深度学习应用研究人员;
人工智能从业人员。
本书作者
本书由方圆圆编写。作者在人工智能技术领域有多年的工作经历和丰富的开发经验。由于能力和时间所限,书中可能还存在疏漏和不足之处,敬请广大读者朋友指正。联系邮箱:hzbook2017@163.com。

上架指导

计算机/人工智能/深度学习与神经网络

封底文字

本书是新手入门人工智能图像处理技术的基础图书,其主旨是带领读者从零开始学习人脸识别与美颜算法的相关知识。书中介绍了Python图像处理的相关知识,并介绍了机器学习和深度学习理论及其在人脸识别与美颜领域中的应用。书中秉承知识点结合案例的方式讲解,结合了60多个行业案例和代码进行实战,以降低读者学习的难度。
本书共9章,前5章着重介绍了基本的Python编程和视频图像处理技术,包括基于Anaconda和pycharm的环境搭建、各种数据处理的相关包(Numpy、Matplotlib等),还复现了抖音中各种视特效的算法设计;后4章介绍了机器学习和深度学习在人脸图像处理领域中的算法与实战案例,包括使用基于分类器和卷积神经网络的经典应用、算法模型设计,以及目前主流的视频媒体中人脸美颜、虚拟试妆等算法设计和复现。
本书内容丰富,实例典型,实用性强,尤其适合熟悉Python但不熟悉框架而想要了解和学习机器学习和深度学习在人脸图像应用中的初学者阅读,同时也适合有一定基础的程序员作为工具书和参考书使用。

推荐序

“两弯似蹙非蹙笼烟眉,一双似喜非喜含情目”“眉将柳而争绿,面共桃而竞红”。古诗中有很多诸如此类形容美人的句子,寄托了人们对美好容颜的无尽向往。虽然现实中无法人人拥有一副古诗中描述的俊俏面容,也难以抵挡岁月所留下的痕迹,但是随着图像处理和人工智能技术的飞速发展,以美图秀秀为代表的图像美颜应用和以抖音为代表的视频美颜应用使人们的这一愿望得到满足。磨皮、削骨、瘦脸、修眉,过去需要技艺精湛的整形外科医生或者技术高超的化妆师才能实现的效果,如今通过一个App就可以实现。
智能图像处理是人工智能应用中非常重要的一环,造就了国内多家独角兽公司,而“图像处理+人工智能”型人才在市场上也是供不应求。掌握一门技术的最好方式是动手实践,即所谓源码之前了无秘密。本书以美拍、抖音等美颜App背后的实现原理为线索,运用图像处理和人工智能技术,博观约取讲原理,条分缕析讲实现,从代码层面手把手教读者实现其中的关键算法。对于从事图像处理和人工智能研究的工程技术人员和学者而言,这是一本不可多得的实战宝典。
从具体内容上看,本书首先介绍了利用Python进行图像处理的基本原理与方法,以及开源Python图像处理工具库的使用,然后介绍了机器学习和深度学习的基础知识及机器学习和深度学习中人脸识别的实现,最后介绍了主流视频软件中人脸美颜算法的设计、图像特效及视频特效的原理和实现,展望了AI时代图像处理算法在各大领域的应用新生态。本书内容紧凑,从基础技术到实践再到前沿技术,逻辑严谨,环环相扣。
我和本书的作者同一年入学中国科学院研究生院,她在人工智能计算机视觉领域有8年多的工作经验,拥有8篇核心技术专利,曾历任唯品会硅谷研发中心AI高级算法工程师、联想研究院VR图像算法工程师,拥有11项发明专利。工作之余,她还联合创办了AILOB上海AI人才社区,组织了多次精彩的线下技术交流活动,并兼任多家创业公司的技术顾问。她不仅有优秀的人工智能科班背景,同时在产业界有着扎实的实战经验。本书是她花费过去一年中几乎全部的业余时间所完成的诚意之作。值得一提的是,作者还亲自担任模特来测试各类美颜算法的效果,这也给读者的阅读增加了很多乐趣。
拿到样稿是一个阳光明媚的午后。在昆明湖之畔,我翻遍了泛黄的诗笺,只为找几句话来衬托这本书写“美丽”的书。本书的作者很美,书也很美,我很荣幸为之作序,把本书推荐给各位读者,同时预祝大家阅读愉快。

中科院计算所博士/中科视拓CEO?刘昕
2020年于北京

图书目录

推荐序
前言
第1章 AI时代:图像技术背景知识 1
1.1 人工智能的前世今生 2
1.2 AI与CV的相互融合之路 3
1.3 AI图像处理技术 5
1.4 本章小结 7
第2章 武器和铠甲:开发环境配置 8
2.1 来自传承的馈赠:OpenCV开源跨平台机器视觉库 8
2.1.1 OpenCV的整体概念 9
2.1.2 OpenCV的应用领域 9
2.1.3 OpenCV的编程语言 9
2.1.4 OpenCV支持的系统 10
2.1.5 OpenCV的线上资源 10
2.2 召唤萌宠:Python语言的“制霸”之路 10
2.2.1 Python语言的发展 11
2.2.2 Python 2.7.X版本和3.X版本的区别 11
2.2.3 本书采用的Python版本 13
2.3 铸剑:基于PyCharm的系统环境配置 14
2.3.1 PyCharm在Mac OS系统下的安装和配置 14
2.3.2 Mac OS系统下Anaconda的安装和配置 17
2.4 牛刀小试:一起动手来写个例子吧 19
2.5 本章小结 21
第3章 开启星辰大海:图像处理技术基础知识 22
3.1 图像的基本概念 23

3.1.1 像素的概念 23
3.1.2 图像的构成 24
3.1.3 图像的格式 24
3.1.4 理解图像的位深和通道的概念 25
3.2 图像的读取、显示和存储操作 26
3.2.1 OpenCV基本图像处理函数 26
3.2.2 Python读取一张图片并显示和存储 27
3.3 从像素出发构建二维灰度图像 28
3.3.1 NumPy科学计算库 28
3.3.2 创建二维灰度图像 30
3.3.3 灰度图像的遍历 31
3.4 灰度图像和彩色图像的变换 32
3.4.1 图像的颜色空间 32
3.4.2 彩色图像的通道分离和混合 33
3.4.3 彩色图像的通道分离和混合程序示例 34
3.4.4 彩色图像的二值化 35
3.4.5 彩色图像的遍历 37
3.4.6 彩色图像和灰度图像的转换 38
3.5 图像的几何变换 40
3.5.1 图像几何变换的基本概念 40
3.5.2 插值算法 41
3.5.3 图像的缩放 42
3.5.4 图像的平移 44
3.5.5 图像的旋转 45
3.5.6 图像的镜像变换 47
3.6 图像色彩空间基础知识 48
3.6.1 图像的色调、色相、饱和度、亮度和对比度 48
3.6.2 RGB色彩空间 49
3.6.3 HSV色彩空间 49
3.6.4 HSI色彩空间 50
3.7 图像的直方图 50
3.7.1 图像直方图的基本概念 50
3.7.2 绘制灰度图像的直方图 51
3.7.3 绘制彩色图像的直方图 53
3.7.4 图像直方图均衡化 54
3.7.5 图像直方图反向投影 56
3.8 本章小结 58
第4章 First Blood:第一波项目实战 59
4.1 抖音哈哈镜 60
4.1.1 抖音的哈哈镜效果 60
4.1.2 哈哈镜的原理 61
4.1.3 哈哈镜的程序实现 61
4.2 给你一张老照片 64
4.2.1 怀旧风格算法原理 64
4.2.2 怀旧风格程序实现 65
4.3 给自己画一张文艺范的素描 66
4.3.1 轮廓检测算法原理 66
4.3.2 素描风格算法原理 67
4.3.3 素描风格算法的程序实现 68
4.4 来一张油画吧 69
4.4.1 图像油画算法原理 69
4.4.2 图像油画算法的程序实现 69
4.5 如何打马赛克 72
4.5.1 马赛克算法原理 72
4.5.2 马赛克算法的程序实现 72
4.6 打造自己的专属肖像漫画 74
4.6.1 漫画风格算法原理 74
4.6.2 漫画风格算法的程序实现 74
4.7 本章小结 76
第5章 Double Kill:视频图像处理理论和项目实战 77
5.1 视频处理流程和原理 78
5.1.1 视频的捕获和存储 78
5.1.2 提取视频中的某些帧 79
5.1.3 将图片合成为视频 80
5.1.4 多个视频合并 81
5.2 抖音中的视频抖动效果设计 82
5.2.1 视频抖动的原理 82
5.2.2 视频抖动的程序实现 83
5.3 抖音中的视频闪白效果设计 85
5.3.1 视频闪白的原理 86
5.3.2 视频闪白的程序实现 87
5.4 抖音中的视频霓虹效果设计 90
5.4.1 视频霓虹的原理 90
5.4.2 视频霓虹效果的程序实现 91
5.5 抖音中的视频时光倒流效果设计 94
5.5.1 视频时光倒流的原理 94
5.5.2 视频时光倒流的程序实现 94
5.6 抖音中的视频反复效果设计 95
5.6.1 视频反复的原理 95
5.6.2 视频反复的程序实现 95
5.7 抖音中的视频慢动作效果设计 96
5.7.1 视频慢动作的原理 97
5.7.2 视频慢动作的程序实现 97
5.8 视频人物漫画风格滤镜设计 98
5.9 本章小结 99
第6章 Triple Kill:基于机器学习的人脸识别 100
6.1 机器学习的基本概念 101
6.1.1 机器学习的目的 101
6.1.2 机器学习的内容 102
6.1.3 机器学习的作用 103
6.1.4 如何使用机器学习获得的东西 105
6.1.5 使用机器学习方法的时机 106
6.1.6 总结机器学习的基本概念 108
6.2 机器学习中的图像预处理流程 112
6.2.1 一个经典的机器学习图像处理实例 112
6.2.2 人脸识别机器学习Model训练思路 113
6.2.3 正样本图像预处理 113
6.2.4 负样本图像预处理 121
6.3 人脸检测机器学习算法设计 123
6.3.1 图像特征 123
6.3.2 Harr-like特征求值加速算法 127
6.3.3 图像分类器 128
6.3.4 人脸检测的训练算法流程 130
6.3.5 人脸检测的检测算法流程 131
6.4 训练人脸检测分类器并测试 132
6.4.1 训练准备 132
6.4.2 开始训练 133
6.4.3 模型测试 134
6.5 本章小结 135
第7章 Quatary Kill:基于深度学习的人脸识别 137
7.1 深度学习的基本概念 138
7.1.1 深度学习简介 138
7.1.2 深度学习和机器学习的区别 139
7.1.3 深度学习入门概念 141
7.2 卷积神经网络 147
7.2.1 卷积的原理 147
7.2.2 池化层的原理 150
7.2.3 全连接层的原理 150
7.2.4 一个经典的CNN网络结构 152
7.3 手写数字分类项目 153
7.3.1 训练环境的搭建 153
7.3.2 训练数据的准备 154
7.3.3 训练网络的搭建 155
7.3.4 训练代码 158
7.3.5 深度学习基础知识扩展 159
7.4 基于深度学习的人脸识别解决方案 161
7.4.1 数据的准备 161
7.4.2 数据集的读取和处理 163
7.4.3 网络的搭建 165
7.4.4 Model的训练过程 167
7.4.5 Model的测试过程 168
7.5 本章小结 169
第8章 Penta Kill:人脸图像美颜算法项目实战 170
8.1 人脸磨皮算法 171
8.1.1 图像滤波算法和效果 171
8.1.2 人脸磨皮算法设计 176
8.2 图像的色彩空间 180
8.2.1 RGB和HSV色彩空间基础知识 180
8.2.2 RGB和HSV转换的数学描述和函数实现 180
8.2.3 图片中的颜色检测 181
8.3 人脸美白算法设计 183
8.3.1 通过图层混合实现图像美白算法 184
8.3.2 通过beta参数调整实现图像美白算法 185
8.3.3 通过颜色查找表实现图像美白算法 187
8.4 人脸的手动祛痘算法设计 189
8.4.1 图像修复算法介绍 190
8.4.2 图像修复的原理 190
8.4.3 通过图像修复算法实现手动祛痘 191
8.5 本章小结 193
第9章 Legendary:AI时代图像算法应用新生态 194
9.1 抖音中的图像技术 195
9.1.1 抖音中的图像应用概览 195
9.1.2 抖音中的人脸检测技术 195
9.1.3 抖音中的人脸检测技术应用 197
9.1.4 抖音中的人体检测技术 201
9.1.5 抖音中的人体检测技术应用 201
9.1.6 抖音中的视频技术 202
9.1.7 抖音中的图像技术总结 205
9.2 美颜和美妆类App中的图像技术 206
9.2.1 美颜和美妆类App图像应用概览 207
9.2.2 五官的调整 207
9.2.3 美妆算法 208
9.2.4 染发算法 209
9.2.5 五官分析 211
9.2.6 美颜相机和美妆相机中图像技术的一些总结 213
9.3 电商中的图像技术 213
9.3.1 电商中的图像技术应用概览 213
9.3.2 虚拟穿戴技术和商品3D展示 214
9.3.3 尺寸测量 214
9.3.4 相似商品推荐及以图搜图 215
9.4 本章小结 216

教学资源推荐
作者: 李进 谭毓安 著
作者: Nils J.Nilsson
作者: Wesley E.Snyder, Hairong Qi
参考读物推荐
作者: 张春强 张和平 唐振 著
作者: 于俊 李雅洁 彭加琪 程知远 著
作者: [澳] 图珊·加内格达拉(Thushan Ganegedara)著
作者: 陈雨强 郑曌 谭中意 卢冕 等