首页>参考读物>计算机科学与技术>软件与程序设计

机器学习系统设计:Python语言实现
作者 : [美] 戴维?朱利安(David Julian)著
译者 : 李洋 译
出版日期 : 2017-06-02
ISBN : 978-7-111-56945-9
定价 : 59.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 198
开本 : 16
原书名 : Designing Machine Learning Systems with Python
原出版社: Packt Publishing Ltd.
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

图书前言

机器学习是计算世界所见的最大趋势之一。机器学习系统具有意义深远且令人兴奋的能力,能够在各种应用领域为人们提供重要的洞察力,从具有开创性的挽救生命的医学研究到宇宙基础物理方面的发现,从为我们提供更健康、更清洁的食物到互联网分析和建立经济模型,等等。事实上,就某种意义而言,这项技术在我们的生活中已经无所不在。要想进入机器学习的领域,并且对其具有充分的认知,就必须能够理解和设计服务于某一项目需要的机器学习系统。
本书的主要内容
第1章从机器学习的基础知识开始,帮助你用机器学习的范式进行思考。你将学到机器学习的设计原理和相关模型。
第2章讲解了Python中众多针对机器学习任务的程序包。本章会让你初步了解一些大型库,包括NumPy、SciPy、Matplotlib和Scilit-learn等。
第3章讲解了原始数据可能有多种不同格式,其数量和质量也可能各不相同。有时,我们会被数据淹没;而有时,我们希望从数据中榨取最后一滴信息。数据要成为信息,需要有意义的结构。本章我们介绍了一些宽泛的主题,如大数据、数据属性、数据源、数据处理和分析等。
第4章在逻辑模型中探索了逻辑语言,并创建了假设空间映射;在树状模型中,我们发现其具有广泛作用域并易于描述和理解;在规则模型中,我们讨论了基于有序规则列表和无序规则集的模型。
第5章介绍了线性模型,它是使用最广泛的模型之一。线性模型是众多高级非线性技术的基础,例如,支持向量机(SVM)和神经网络。本章还研究了机器学习最常用的技术,创建线性回归和logistic回归的假设语句。
第6章介绍了机器学习最强大的人工神经网络算法。我们将看到这些网络如何成为大脑神经元的简化模型。
第7章讨论了特征的不同类型,即定量特征、有序特征和分类特征。我们还将详细学习如何结构化和变换特征。
第8章解释了集成机器学习背后的动机和成因,其来源于清晰的直觉并具有丰富的理论历史基础。集成机器学习的类型在于模型本身,以及围绕着三个主要问题(如何划分数据、如何选择模型、如何组合其结果)的考量。
第9章着眼于一些设计策略,以确保你的机器学习系统最优。我们将学习模型选择和参数调优技术,并将所学知识应用于一些案例研究之中。
阅读前的准备工作
你需要有学习机器学习的意愿,并需要下载安装Python 3。Python 3的下载地址是:https://www.python.org/downloads/ 。
本书的读者对象
本书的读者包括数据学家、科学家,或任何好奇的人。你需要具备一些线性代数和Python编程的基础,对机器学习的概念有基本了解。

上架指导

计算机\人工智能

作者简介

[美] 戴维?朱利安(David Julian)著:暂无相关简介

译者简介

李洋 译:暂无简介

译者序

2016年,对于计算机相关从业者(和职业围棋手)而言,毋庸置疑,最具冲击力的大事件就是AlphaGo的成功了。对此,即便是如我本人这样最迟钝的计算机工程师,也终于不能无动于衷,感觉是时候跳出if-else的懒惰,捡起尘封多年乃至遗忘的线性规划和微积分等知识,投身于人工智能的汪洋了。历经60载的孕育,人工智能的时代终于到来了。
回想起本世纪初,我曾参与了电信公司的一个营销项目,这个项目的目标是建立一系列客户指标,以反映客户的价值和分类,使营销人员能够进行精准营销和客户关怀。对于这个项目,当时的术语是,数据仓库和集市,旋转、切片、透视等统计分析,分类和聚类等数据挖掘,等等。当工作作风一向是直接有效(简单粗暴)的市场营销专家,了解到数据仓库和统计工具软硬件的昂贵、数据挖掘工作的繁杂之后,他们提出直接拿一套指标变量和决策阈值,然后用if-else来决定对付客户的营销手段。好吧,指标变量还好,但是优化的决策边界怎么拿?最终,一份虚构臆想的报告出炉了,对此,我至今仍怀有深深的罪恶感。
如今,市场营销的专家作风依旧吧?但是,即便是初出茅庐(大有可为)的软件工程师,也完全能够用触手可得的开源工具和计算环境,建立起一个机器学习系统,获得一些令人信服的决策边界优化解,让那些令人哭笑不得的推销短信变得更少,让短信垃圾成为雪中送炭,想要获取信息的人们无须再从一些衣冠楚楚、侃侃而谈的顾问手里购买一纸空洞的报告了。这就是人工智能的时代,在自动驾驶成为投资大鳄眼中的香饽饽时,人工智能已经无所不在了。本书也是如此,对于计算机科学专业的小伙伴们来说,书中的内容都不陌生,但当这些都成为随手可得、随时要用的东西时,就证明了我们已经身处其时。
本书涵盖了建立机器学习系统的方方面面,相对比较基础,其中最有价值的是,书中介绍了机器学习系统设计的整个过程,以及相关的Python库,并在各个知识环节中都给出了Python示例。无论对于机器学习系统的新兵还是老手,本书都有一定的参考价值。对于机器学习系统的初学者而言,本书较为系统地介绍了相关知识,同时也在一开始就给出了语言和环境,能够让大家甩开膀子,撸起袖子,伸手开干;而对于机器学习系统的老手而言,其更多的参考价值在于如何使用Python来实现那些概念。
但需要注意的是,本书绝不是机器学习的学科教材,也不是Python库的用户手册,更不是实际项目的设计文档。因此,本书并没有对各种模型提供完整的解释和严格的推导,也没有对Python库的各种对象和函数提供完整详尽的说明,更不会对实际问题给出详细的解决方案和实现。但本书确实是一个简明的指引,并富有逻辑,让我们能够按图索骥,由此及彼,较为系统地了解Python机器学习系统设计的方方面面,并以此为线索,展开更多的阅读和深入的学习。同时,书中的诸多示例也能在一定程度上为我们解决类似问题提供思路。
在人工智能的时代,翻译一本机器学习的书籍,对译者而言也是幸甚至哉,借此与各路志士同仁共勉。

李洋
2017年2月

图书目录

译者序
前言
第1章 机器学习的思维1
1.1 人机界面1
1.2 设计原理4
1.2.1 问题的类型6
1.2.2 问题是否正确7
1.2.3 任务8
1.2.4 统一建模语言27
1.3 总结31
第2章 工具和技术32
2.1 Python与机器学习33
2.2 IPython控制台33
2.3 安装SciPy栈34
2.4 NumPy35
2.4.1 构造和变换数组38
2.4.2 数学运算39
2.5 Matplotlib41
2.6 Pandas45
2.7 SciPy47
2.8 Scikit-learn50
2.9 总结57
第3章 将数据变为信息58
3.1 什么是数据58
3.2 大数据59
3.2.1 大数据的挑战60
3.2.2 数据模型62
3.2.3 数据分布63
3.2.4 来自数据库的数据67
3.2.5 来自互联网的数据68
3.2.6 来自自然语言的数据70
3.2.7 来自图像的数据72
3.2.8 来自应用编程接口的数据72
3.3 信号74
3.4 数据清洗76
3.5 数据可视化78
3.6 总结80
第4章 模型—从信息中学习81
4.1 逻辑模型81
4.1.1 一般性排序83
4.1.2 解释空间84
4.1.3 覆盖空间86
4.1.4 PAC学习和计算复杂性87
4.2 树状模型88
4.3 规则模型92
4.3.1 有序列表方法94
4.3.2 基于集合的规则模型95
4.4 总结98
第5章 线性模型100
5.1 最小二乘法101
5.1.1 梯度下降102
5.1.2 正规方程法107
5.2 logistic回归109
5.3 多分类113
5.4 正则化115
5.5 总结117
第6章 神经网络119
6.1 神经网络入门119
6.2 logistic单元121
6.3 代价函数126
6.4 神经网络的实现128
6.5 梯度检验133
6.6 其他神经网络架构134
6.7 总结135
第7章 特征—算法眼中的世界136
7.1 特征的类型137
7.1.1 定量特征137
7.1.2 有序特征138
7.1.3 分类特征138
7.2 运算和统计139
7.3 结构化特征141
7.4 特征变换141
7.4.1 离散化143
7.4.2 归一化144
7.4.3 校准145
7.5 主成分分析149
7.6 总结151
第8章 集成学习152
8.1 集成学习的类型152
8.2 Bagging方法153
8.2.1 随机森林154
8.2.2 极端随机树155
8.3 Boosting方法159
8.3.1 AdaBoost161
8.3.2 梯度Boosting163
8.4 集成学习的策略165
8.5 总结168
第9章 设计策略和案例研究169
9.1 评价模型的表现169
9.2 模型的选择174
9.3 学习曲线176
9.4 现实世界中的案例研究178
9.4.1 建立一个推荐系统178
9.4.2 温室虫害探测185
9.5 机器学习一瞥188
9.6 总结190

教学资源推荐
作者: [美]埃里克 S. 罗伯茨(Eric S. Roberts) 著
作者: 王珊珊 臧洌 张志航 编著
参考读物推荐
作者: (美)Cameron Wakefield Henk-Evert Sonder 等
作者: (美)Michael Daley