Python机器学习(原书第2版)
作者 : (美)塞巴斯蒂安·拉施卡(Sebastian Raschka),瓦希德·米尔贾利利(Vahid Mirjalili)著
译者 : 陈斌 译
出版日期 : 2018-11-05
ISBN : 978-7-111-61150-9
定价 : 89.00元
教辅资源
扩展信息
语种 : 简体中文
页数 : 381
开本 : 16
原书名 : Python Machine Learning,Second Edition
原出版社: Packt Publishing Ltd.
属性分类: 教材
包含CD : 无CD
绝版 :
图书简介

机器学习与预测分析正在改变企业和其他组织的运作方式,本书将带领读者进入预测分析的世界。全书共16章,除了简要介绍机器学习及Python在机器学习中的应用,还系统讲述了数据分类、数据预处理、模型优化、集成学习、回归、聚类、神经网络、深度学习等内容。本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。本书讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。本书可作为学习数据科学的初学者及想进一步拓展数据科学领域认识的读者的参考书。同样,本书也适合计算机等相关专业的本科生、研究生阅读。

图书特色

00

图书前言

通过新闻媒体的报道,你可能已经了解到机器学习已经成为当代最激动人心的技术。像谷歌、Facebook、苹果、Amazon和IBM这样的大公司基于各自的考虑,已经在机器学习的研究和应用方面投入了巨资。机器学习似乎已经成为流行词,但这绝不是昙花一现。这个激动人心的领域开启了许多新的可能性,已经在日常生活中不可或缺。智能手机的语音助手、为客户推荐合适的产品、防止信用卡欺诈、过滤垃圾邮件、检测和诊断疾病等都是明证。
如果有志于从事深度学习,想更好地解决问题或开展深度学习方面的研究,那么这本书就是为你而写。然而,深度学习背后的理论概念可能艰深难懂。但近几年已经出版了许多机器学习方面的著作,阅读它们有助于通过研发强大的机器学习算法走上机器学习之路。
熟悉机器学习的示例代码及应用是深入该领域的捷径。通过具体的示例学以致用有助于阐明宽泛的概念。请记住,能力越大责任越大!除了用Python和基于Python的机器学习软件库掌握实践经验外,本书还介绍了机器学习算法背后的数学概念,这对于成功地使用机器学习必不可少。这使得本书有别于其他的纯实战书籍。本书将对机器学习概念的必要细节进行讨论,同时对机器学习算法的工作原理、使用方法以及最为重要的如何避免掉入最常见的陷阱,提供直观且翔实的解释。
如果在谷歌专业网站以“机器学习”作为关键词进行搜索,结果会找到180万个出版物。当然我们无法对过去60年来所出现的各种不同算法和应用逐一进行考证。然而,本书将开始一个激动人心的旅程,涵盖所有重要的主题和概念,让你在该领域捷足先登。如果你发现所提供的知识还不能解渴,没关系,本书还引用了许多其他有用的资源,供你追踪该领域的精要突破。
如果已经详细研究了机器学习理论,那么本书可以教你如何把知识付诸实践。如果以前用过机器学习技术,想更深入地了解其工作原理,那么本书就是为你而备。如果机器学习对你是全新的领域,那么不必担心,你更有理由为此感到兴奋。我保证机器学习将会改变你解决问题的思路,并让你看到如何通过释放数据的力量来解决问题。
在深入机器学习领域之前,先回答一个最重要的问题:“为什么要用Python?”答案很简单:Python功能强大且易于取得。Python已成为数据科学最常用的编程语言,因为它可以让我们忘记编程的冗长乏味,同时提供了可以把想法落地、概念直接付诸行动的环境。
我们认为,对机器学习的研究使我们成为更好的科学家、思想家和问题解决者。本书将与你分享这些知识。知识是要靠学习获得的。学习的关键在于热情,而要真正掌握技能只能通过实践。前面的路或许崎岖不平,有些话题可能颇具挑战性,但我们希望你能抓住这个机会,更多地考虑本书所带来的回报。请记住,我们共同踏上这个旅程,本书将为你的军火库添加许多强大的武器,让你以数据驱动的方式来解决最棘手的问题。
本书内容
第1章介绍了机器学习在解决不同问题时的主要应用领域。另外,还讨论了构建典型的机器学习模型所需要的基本步骤,从而形成一条导引后续各章节的管道。
第2章追溯了机器学习的起源,介绍了二元感知器、分类器和自适应线性神经元。对模式分类的基本原理作了简单介绍,同时关注算法优化和机器学习的交互。
第3章描述了基本的机器学习分类算法,并用最流行和全面的开源机器学习软件库scikit-learn提供了实际案例。
第4章讨论了如何解决未处理数据集中最常见的问题,如数据缺失。也讨论了用来识别数据集中信息量最大特性的几种方法,并教你如何将不同类型的变量作为机器学习算法的适当输入。
第5章描述了减少数据集中的特征数,同时保留大部分有用和识别性信息的基本技术。讨论了基于主成分分析的标准降维方法,并将其与有监督学习和非线性变换技术进行了比较。
第6章讨论了在预测模型的性能评价中该做和不该做什么。此外,还讨论了模型性能评估的不同度量以及优化机器学习算法的技术。
第7章介绍了有效结合多种学习算法的不同概念,讲解了如何建立专家小组来克服个别学习者的弱点,从而产生更准确更可靠的预测。
第8章讨论了将文本数据转换为有意义的机器学习算法,以根据文本内容预测人们意见的基本步骤。
第9章继续使用前一章中的预测模型,并介绍了使用嵌入式机器学习模型开发网络应用的基本步骤。
第10章讨论根据目标和响应变量之间的线性关系建模,从而进行连续预测的基本技术。在介绍了不同的线性模型之后,还讨论了多项式回归和基于树的建模方法。
第11章将焦点转移到机器学习的其他子领域,即无监督学习。 用来自于三个基本聚类家族的算法来寻找一组拥有一定程度相似性的对象。
第12章扩展了基于梯度的优化概念,该概念在第2章中介绍过,用来在Python中构建基于常见的强大的多层神经网络的反向传播算法。
第13章基于前一章的知识,为更有效地训练神经网络提供实用指南。 该章的重点是TensorFlow,这是一个开源的Python 软件库,允许我们充分利用现代的多核GPU。
第14章更详细地介绍了TensorFlow的计算图和会话的核心概念。 另外,该章还介绍了如何保存会话以及可视化神经网络图等主题,这对本书其他章节的学习会非常有用。
第15章讨论了深度神经网络的结构体系,这些结构体系已成为计算机视觉和图像识别领域(卷积神经网络)的新标准。 本章讨论了作为特征提取器的卷积层之间的主要概念,并将卷积神经网络体系结构应用于图像识别,以获得近乎完美的识别准确度。
第16章介绍了深度学习的另外一种常用的神经网络结构体系,它特别适合于处理序列数据和时间序列数据。 在该章中,我们应用不同的递归神经网络体系结构来处理文本数据。作为热身练习,我们将从一个情感分析开始,并学习如何生成全新的文本。
阅读本书需要的材料
要执行本书的示例代码,需要在MacOS、Linux或者Microsoft Windows操作系统上安装Python 3.6.0或更新的版本。本书将持续使用包括SciPy、NumPy、scikit-learn、Matplotlib和pandas在内的Python的科学计算软件库。
第1章将为建立Python环境及其核心库提供指令和有用的提示。我们将逐渐添加更多的软件库。另外,会分别在不同的章节提供安装指令:用于自然语言处理的NLTK库(第8章),Flask 网络框架库(第9章),Seaborn统计数据可视化库(第10章) 和有关图像处理单元的有效神经元网络训练的TensorFlow(第13~16章)。
本书的目标读者
如果你想知道如何开始用Python回答数据方面的关键问题,那就开始学习本书吧!不论是从头学起,还是要扩展数据科学方面的知识,本书都是不可或缺的重要资源。
下载示例代码及彩色图像
本书的示例源码及所有截图和样图,可以从http://www.packtpub.com通过个人账号下载,也可以访问华章公司官网http://www.hzbook.com,通过注册并登录个人账号下载。
本书的代码包也托管在GitHub 上,地址如下:
https://github.com/PacktPublishing/Python-Machine-Learning-Second-Edition。书中用到的彩色图像截图或者图表的PDF文件也可以从http://www.packtpub.com/sites/default/files/downloads/PythonMachineLearningSecondEdition_ColorImages.pdf下载。

上架指导

计算机/机器学习

封底文字

本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让你聚焦于如何正确地提出问题、解决问题。书中讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。
在本书第1版的基础上,作者对第2版进行了大量更新和扩展,纳入最近的开源技术,包括scikit-learn、Keras和TensorFlow,提供了使用Python构建高效的机器学习与深度学习应用的必要知识与技术。

通过阅读本书,你将学到:
探索并理解数据科学、机器学习与深度学习的主要框架
通过机器学习模型与神经网络对数据提出新的疑问
在机器学习中使用新的Python开源库的强大功能
掌握如何使用TensorFlow库来实现深度神经网络
在可访问的Web应用中嵌入机器学习模型
使用回归分析预测连续目标的结果
使用聚类发现数据中的隐藏模式与结构
使用深度学习技术分析图片
使用情感分析深入研究文本与社交媒体数据

作者简介

(美)塞巴斯蒂安·拉施卡(Sebastian Raschka),瓦希德·米尔贾利利(Vahid Mirjalili)著:塞巴斯蒂安·拉施卡(Sebastian Raschka)

密歇根州立大学博士,他在计算生物学领域提出了几种新的计算方法,还被科技博客Analytics Vidhya评为GitHub上最具影响力的数据科学家。他在Python编程方面积累了丰富经验,曾为如何实际应用数据科学、机器学习和深度学习做过数次讲座,包括在SciPy(重要的Python科学计算会议)上做的机器学习教程。正是因为Sebastian在数据科学、机器学习以及Python等领域拥有丰富的演讲和写作经验,他才有动力完成本书的撰写,以帮助那些不具备机器学习背景的人设计出有数据驱动的解决方案。他因其工作和贡献获得了2016-2017学年系杰出研究生奖,以及《ACM 计算评论》 2016年度最佳奖。

瓦希德·米尔贾利利(Vahid Mirjalili)

密歇根州立大学计算机视觉与机器学习研究员,致力于把机器学习应用到各种计算机视觉研究项目。他在学术和研究生涯中积累了丰富的Python编程经验,其主要研究兴趣为深度学习和计算机视觉应用。

译者简介

陈斌 译:暂无简介

译者序

人工智能的研究从20世纪40年代已经开始,在近80年的发展中经历了数次大起大落。自从2016年AlphaGo战胜顶尖的人类围棋选手之后,人工智能再一次进入了人们的视野,成为当今的热门话题。各大互联网公司都投入了大量的资源研究和开发自动驾驶、人脸识别、语音识别和机器翻译等技术。人类已经开始担忧人工智能可能带来的各种影响。人工智能的最新发展可以说是“古树发新枝”,到底是什么原因使沉寂多年的人工智能技术焕发了青春的活力呢?
首先,移动互联网的飞速发展产生了海量的数据,使我们有机会更加深入地认识社会、探索世界、掌握规律。其次,大数据技术为我们提供了有力的技术手段,使我们可以面对瞬息万变的市场,有效地存储和处理海量数据。再次,计算技术特别是GPU的广泛应用使算力有了大幅度的提升,以前需要几天的运算如今只需要几分钟或几秒钟,这也为人工智能和机器学习的普及与应用提供了计算基础。在这几项技术发展的基础之上,深度学习技术终于破茧而出,成为引领人工智能发展的重要力量。
本书英文版在美国出版后备受欢迎,究其原因,除了机器学习是所有技术人员关注的焦点以外,还在于本书系统性地梳理和分析了机器学习的各种经典算法,最为重要的是作者通过Python语言以具体代码示例深入浅出地介绍了各种算法的应用方法。如果你想了解机器学习并掌握机器学习的具体技术,那就请翻开此书,通过一个又一个案例领略机器学习的风采。所以这本书既是一本初步了解机器学习的启蒙读物,也是一本让你从初学者变成AI专家的教练示范材料。
毋庸置疑,人工智能(AI)、区块链(BlockChain)、云计算(Cloud)、大数据(Big Data)、物联网(IoE)这五项技术(简写为ABCDE)已经成为计算机和互联网技术未来发展的五大核心动力。特别是人工智能技术,它将是继蒸汽机、电力、计算机、互联网之后的又一股重要的革命性力量。之前的几次革命解放的是我们的四肢,而人工智能解放的将是我们的头脑。

图书目录

译者序
关于作者
关于审校人员
前言
第1章 赋予计算机从数据中学习的能力 1
1.1 构建把数据转换为知识的智能机器 1
1.2 三种不同类型的机器学习 1
1.2.1 用有监督学习预测未来 2
1.2.2 用强化学习解决交互问题 3
1.2.3 用无监督学习发现隐藏结构 4
1.3 基本术语与符号 4
1.4 构建机器学习系统的路线图 6
1.4.1 预处理—整理数据 6
1.4.2 训练和选择预测模型 7
1.4.3 评估模型和预测新样本数据 7
1.5 用Python进行机器学习 7
1.5.1 从Python包索引安装Python和其他包 8
1.5.2 采用Anaconda Python和软件包管理器 8
1.5.3 科学计算、数据科学和机器学习软件包 8
1.6 小结 9
第2章 训练简单的机器学习分类算法 10
2.1 人工神经元—机器学习早期历史一瞥 10
2.1.1 人工神经元的正式定义 11
2.1.2 感知器学习规则 12
2.2 在Python中实现感知器学习算法 14
2.2.1 面向对象的感知器API 14
2.2.2 在鸢尾花数据集上训练感知器模型 16
2.3 自适应神经元和学习收敛 20
2.3.1 梯度下降为最小代价函数 21
2.3.2 用Python实现Adaline 22
2.3.3 通过调整特征大小改善梯度下降 25
2.3.4 大规模机器学习与随机梯度下降 27
2.4 小结 30
第3章 scikit-learn机器学习分类器一览 32
3.1 选择分类算法 32
3.2 了解scikit-learn软件库的第一步—训练感知器 32
3.3 基于逻辑回归的分类概率建模 37
3.3.1 逻辑回归的直觉与条件概率 37
3.3.2 学习逻辑代价函数的权重 39
3.3.3 把转换的Adaline用于逻辑回归算法 41
3.3.4 用scikit-learn训练逻辑回归模型 44
3.3.5 通过正则化解决过拟合问题 45
3.4 支持向量机的最大余量分类 47
3.4.1 最大边际的直觉 48
3.4.2 用松弛变量处理非线性可分 48
3.4.3 其他的scikit-learn 实现 50
3.5 用核支持向量机求解非线性问题 50
3.5.1 处理线性不可分数据的核方法 50
3.5.2 利用核技巧,发现高维空间的分离超平面 52
3.6 决策树学习 55
3.6.1 最大限度地获取信息—获得最大收益 55
3.6.2 构建决策树 58
3.6.3 通过随机森林组合多个决策树 61
3.7 K-近邻—一种懒惰的学习算法 63
3.8 小结 65
第4章 构建良好的训练集——预处理 66
4.1 处理缺失数据 66
4.1.1 识别数据中的缺失数值 66
4.1.2 删除缺失的数据 67
4.1.3 填补缺失的数据 68
4.1.4 了解scikit-learn评估器API 68
4.2 处理分类数据 69
4.2.1 名词特征和序数特征 69
4.2.2 映射序数特征 70
4.2.3 分类标签编码 70
4.2.4 为名词特征做热编码 71
4.3 分裂数据集为独立的训练集和测试集 73
4.4 把特征保持在同一尺度上 75
4.5 选择有意义的特征 76
4.5.1 L1和L2正则化对模型复杂度的惩罚 76
4.5.2 L2正则化的几何解释 77
4.5.3 L1正则化的稀疏解决方案 78
4.5.4 为序数特征选择算法 80
4.6 用随机森林评估特征的重要性 84
4.7 小结 87
第5章 通过降维压缩数据 88
5.1 用主成分分析实现无监督降维 88
5.1.1 主成分分析的主要步骤 88
5.1.2 逐步提取主成分 89
5.1.3 总方差和解释方差 91
5.1.4 特征变换 92
5.1.5 scikit-learn的主成分分析 93
5.2 基于线性判别分析的有监督数据压缩 96
5.2.1 主成分分析与线性判别分析 96
5.2.2 线性判别分析的内部逻辑 97
5.2.3 计算散布矩阵 97
5.2.4 在新的特征子空间选择线性判别式 99
5.2.5 将样本投影到新的特征空间 101
5.2.6 用scikit-learn实现的LDA 101
5.3 非线性映射的核主成分分析 102
5.3.1 核函数与核技巧 103
5.3.2 用Python实现核主成分分析 106
5.3.3 投影新的数据点 111
5.3.4 scikit-learn的核主成分分析 113
5.4 小结 114
第6章 模型评估和超参数调优的最佳实践 115
6.1 用管道方法简化工作流 115
6.1.1 加载威斯康星乳腺癌数据集 115
6.1.2 集成管道中的转换器和评估器 116
6.2 使用k折交叉验证评估模型的性能 118
6.2.1 抵抗方法 118
6.2.2 k折交叉验证 119
6.3 用学习和验证曲线调试算法 122
6.3.1 用学习曲线诊断偏差和方差问题 122
6.3.2 用验证曲线解决过拟合和欠拟合问题 124
6.4 通过网格搜索为机器学习模型调优 126
6.4.1 通过网格搜索为超参数调优 126
6.4.2 以嵌套式交叉验证来选择算法 127
6.5 比较不同的性能评估指标 128
6.5.1 含混矩阵分析 128
6.5.2 优化分类模型的准确度和召回率 129
6.5.3 绘制受试者操作特性图 130
6.5.4 多元分类评分指标 133
6.6 处理类的不平衡问题 133
6.7 小结 135
第7章 综合不同模型的组合学习 136
7.1 集成学习 136
7.2 采用多数票机制的集成分类器 139
7.2.1 实现基于多数票的简单分类器 139
7.2.2 用多数票原则进行预测 143
7.2.3 评估和优化集成分类器 145
7.3 套袋—基于导引样本构建分类器集成 149
7.3.1 套袋简介 150
7.3.2 应用套袋技术对葡萄酒数据集中的样本分类 151
7.4 通过自适应增强来利用弱学习者 153
7.4.1 增强是如何实现的 154
7.4.2 用scikit-learn实现AdaBoost 156
7.5 小结 158
第8章 应用机器学习于情感分析 159
8.1 为文本处理预备好IMDb电影评论数据 159
8.1.1 获取电影评论数据集 159
8.1.2 把电影评论数据预处理成更方便格式的数据 160
8.2 词袋模型介绍 161
8.2.1 把词转换成特征向量 161
8.2.2 通过词频逆反文档频率评估单词相关性 162
8.2.3 清洗文本数据 164
8.2.4 把文档处理为令牌 165
8.3 训练文档分类的逻辑回归模型 166
8.4 处理更大的数据集—在线算法和核心学习 168
8.5 具有潜在狄氏分配的主题建模 171
8.5.1 使用LDA分解文本文档 171
8.5.2 LDA与scikit-learn 172
8.6 小结 174
第9章 将机器学习模型嵌入网络应用 175
9.1 序列化拟合scikit-learn评估器 175
9.2 搭建SQLite数据库存储数据 177
9.3 用Flask开发网络应用 179
9.3.1 第一个Flask网络应用 179
9.3.2 表单验证与渲染 181
9.4 将电影评论分类器转换为网络应用 184
9.4.1 文件与文件夹—研究目录树 185
9.4.2 实现主应用app.py 186
9.4.3 建立评论表单 188
9.4.4 创建一个结果页面的模板 189
9.5 在面向公众的服务器上部署网络应用 190
9.5.1 创建PythonAnywhere账户 190
9.5.2 上传电影分类应用 191
9.5.3 更新电影分类器 191
9.6 小结 193
第10章 用回归分析预测连续目标变量 194
10.1 线性回归简介 194
10.1.1 简单线性回归 194
10.1.2 多元线性回归 195
10.2 探索住房数据集 196
10.2.1 加载住房数据 196
10.2.2 可视化数据集的重要特点 197
10.2.3 用关联矩阵查看关系 198
10.3 普通最小二乘线性回归模型的实现 200
10.3.1 用梯度下降方法求解回归参数 200
10.3.2 通过scikit-learn估计回归模型的系数 203
10.4 利用RANSAC拟合稳健的回归模型 205
10.5 评估线性回归模型的性能 206
10.6 用正则化方法进行回归 209
10.7 将线性回归模型转换为曲线—多项式回归 210
10.7.1 用scikit-learn增加多项式的项 210
10.7.2 为住房数据集中的非线性关系建模 211
10.8 用随机森林处理非线性关系 214
10.8.1 决策树回归 214
10.8.2 随机森林回归 215
10.9 小结 217
第11章 用聚类分析处理无标签数据 218
11.1 用k-均值进行相似性分组 218
11.1.1 scikit-learn的k-均值聚类 218
11.1.2 k-均值++—更聪明地设置初始聚类中心的方法 221
11.1.3 硬聚类与软聚类 222
11.1.4 用肘法求解最佳聚类数 223
11.1.5 通过轮廓图量化聚类质量 224
11.2 把集群组织成有层次的树 228
11.2.1 以自下而上的方式聚类 228
11.2.2 在距离矩阵上进行层次聚类 229
11.2.3 热度图附加树状图 232
11.2.4 scikit-learn凝聚聚类方法 233
11.3 通过DBSCAN定位高密度区域 233
11.4 小结 237
第12章 从零开始实现多层人工神经网络 238
12.1 用人工神经网络为复杂函数建模 238
12.1.1 单层神经网络扼要重述 239
12.1.2 介绍多层神经网络体系 240
12.1.3 利用正向传播激活神经网络 242
12.2 识别手写数字 243
12.2.1 获取MNIST数据集 243
12.2.2 实现一个多层感知器 247
12.3 训练人工神经网络 256
12.3.1 逻辑成本函数的计算 256
12.3.2 开发反向传播的直觉 257
12.3.3 通过反向传播训练神经网络 258
12.4 关于神经网络的收敛性 260
12.5 关于神经网络实现的最后几句话 261
12.6 小结 261
第13章 用TensorFlow并行训练神经网络 262
13.1 TensorFlow与模型训练的性能 262
13.1.1 什么是TensorFlow 263
13.1.2 如何学习TensorFlow 264
13.1.3 学习TensorFlow的第一步 264
13.1.4 使用阵列结构 266
13.1.5 用TensorFlow的底层API开发简单的模型 267
13.2 用TensorFlow的高级 API高效率地训练神经网络 270
13.2.1 用TensorFlow的Layers API构建多层神经网络 270
13.2.2 用Keras研发多层神经网络 274
13.3 多层网络激活函数的选择 277
13.3.1 逻辑函数回顾 278
13.3.2 在多元分类中调用softmax函数评估类别概率 279
13.3.3 利用双曲正切拓宽输出范围 280
13.3.4 修正线性单元激活函数 281
13.4 小结 282
第14章 深入探讨TensorFlow的工作原理 283
14.1 TensorFlow的主要功能 283
14.2 TensorFlow 的排序与张量 284
14.3 了解TensorFlow的计算图 285
14.4 TensorFlow中的占位符 287
14.4.1 定义占位符 287
14.4.2 为占位符提供数据 287
14.4.3 用batchsizes 为数据阵列定义占位符 288
14.5 TensorFlow中的变量 289
14.5.1 定义变量 289
14.5.2 初始化变量 290
14.5.3 变量范围 291
14.5.4 变量复用 292
14.6 建立回归模型 295
14.7 在TensorFlow计算图中用张量名执行对象 297
14.8 在TensorFlow中存储和恢复模型 298
14.9 把张量转换成多维数据阵列 300
14.10 利用控制流构图 303
14.11 用TensorBoard可视化图 305
14.12 小结 308
第15章 深度卷积神经网络图像识别 309
15.1 构建卷积神经网络的模块 309
15.1.1 理解CNN与学习特征的层次 309
15.1.2 执行离散卷积 310
15.1.3 子采样 316
15.2 拼装构建CNN 317
15.2.1 处理多个输入或者彩色频道 317
15.2.2 通过淘汰正则化神经网络 319
15.3 用TensorFlow实现深度卷积神经网络 321
15.3.1 多层CNN体系结构 321
15.3.2 加载和预处理数据 322
15.3.3 用TensorFlow的低级API实现CNN模型 323
15.3.4 用TensorFlow 的Layers API实现CNN 332
15.4 小结 336
第16章 用递归神经网络为序列数据建模 338
16.1 序列数据 338
16.1.1 序列数据建模—顺序很重要 338
16.1.2 表示序列 339
16.1.3 不同类别的序列建模 339
16.2 用于序列建模的RNN 340
16.2.1 理解RNN的结构和数据流 340
16.2.2 在RNN中计算激活值 341
16.2.3 长期交互学习的挑战 343
16.2.4 LSTM单元 343
16.3 用TensorFlow实现多层RNN序列建模 345
16.4 项目一:利用多层RNN对IMDb电影评论进行情感分析 345
16.4.1 准备数据 345
16.4.2 嵌入式 348
16.4.3 构建一个RNN模型 350
16.4.4 情感RNN类构造器 350
16.4.5 build方法 351
16.4.6 train方法 353
16.4.7 predict方法 354
16.4.8 创建SentimentRNN类的实例 355
16.4.9 训练与优化情感分析RNN模型 355
16.5 项目二:用TensorFlow实现字符级 RNN语言建模 356
16.5.1 准备数据 356
16.5.2 构建字符级RNN语言模型 359
16.5.3 构造器 359
16.5.4 build方法 360
16.5.5 train方法 362
16.5.6 sample方法 362
16.5.7 创建和训练CharRNN模型 364
16.5.8 处于取样状态的CharRNN模型 364
16.6 总结 365

教学资源推荐
作者: (美)保罗 E. 斯佩克特(Paul E. Spector)
作者: (美)利迪(Leedy,P.D.),(美)奥姆罗德(Ormrod,J.E.)
作者: [美]玛格丽特·马特林(Margaret W.Matlin)著
作者: (美)卡萝尔·韦德 (Carole Wade),卡罗尔·塔维斯( Carol Tavris)著
参考读物推荐
作者: [美]马蒂?奥尔森?兰尼(Marti Olsen Laney),[美] 迈克?兰尼(Michael L. Laney)
作者: 王科 李霖 著 韩维建 主编
作者: [美]艾拉·比奥格(Ira Byock)著
作者: (德)格拉德·许特(Gerald Hüther) 尤里·豪泽(Uli Hauser)著