首页>参考读物>计算机科学与技术>人工智能

机器学习实战:基于Sophon平台的机器学习理论与实践
作者 : 星环科技人工智能平台团队 编著
出版日期 : 2019-12-10
ISBN : 978-7-111-64265-7
定价 : 79.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 221
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

在机器学习大行其道的今天,机器学习平台也有着突飞猛进的发展。本书的立意,就是使用机器学习平台积累、沉淀下来的模块、组件去解决一个又一个业务难题和探索隐藏在其中的数据之美。Sophon机器学习平台的丰富算子能力和优秀的建模上线功能提供正是这样的能力。本书针对每种类型的机器学习问题,结合实际案例依照数据、分析、建模、总结的演进历程进行系统化阐述并进行实战讲解。

图书特色

图书前言

人工智能技术的快速发展,带来了技术平台和行业应用的繁荣,从Caffe、CNTK、CoreML到TensorFlow、TensorRT,从CPU、GPU到TPU、FPGA、ARM,从图形处理、视觉识别到自然语言处理,技术体系越来越复杂,开发门槛越来越高;大量的技术人员需要不断授受技术更新,更多的应用需要考虑额外的迁移成本,更多的市场需要投入大量的资源以充分体现人工智能赋予的价值。
目前产业界开始出现少量技术使用门槛低、应用开发方便的机器学习平台(Machine Learning Platform,MLP)或者数据科学平台(Data Science Platform, DSP),但这些平台大部分还局限在特定行业的有限算法应用,需要不断进行架构优化、模型扩展和算法增强,提供多种场景下的应用迁移工具,才能形成较为成熟的产品化平台。
星环科技作为国内大数据和人工智能平台的领航者,自2013年成立以来,专注于企业级容器云计算、大数据和机器学习核心平台的研发和服务,拥有一批来自国内外著名高科技企业和科研院校的优秀专业人才,是国内大数据领域最早掌握核心技术的企业,也是最早开展机器学习平台理论与实践的公司之一,产品在政府、金融、公安等行业得到大规模应用。
星环科技人工智能平台Sophon是从大数据到人工智能演进过程中诞生的一款创新性机器学习技术平台。用户可以基于该平台快速完成从特征工程、模型训练到模型上线的机器学习全生命周期开发工作。
Sophon平台具有以下技术特点:
q采用去中心化的全分布式架构、性能线性扩展,满足海量数据处理模式下的快速训练和精准推理要求。
q一站式的机器学习集成开发平台,支持自动化开发、图形化操作及可视化建模,可快速构建行业应用解决方案。
q支持多种复杂算法,支持自定义模型和算法导入,可适应多种特定应用场景的复杂建模和模型迁移要求。
q集成大量面向行业领域的分析工具,如实体画像、视频分析、自然语言处理等,便于第三方应用快速定制开发。
q支持深度学习的知识图谱,能够便捷实现含图结构的应用建模,支持实体间多关系图的分析展示和演进变化,发现更有价值的图谱关系。
随着使用机器学习平台的用户越来越多,应用场景日益广泛,非常需要一本关于机器学习理论总结和实践指导的专业图书,不仅可以讲解整体知识体系的理论基础,也可以作为使用星环人工智能平台(Sophon)工具的指导手册。
目前市面上销售的机器学习相关书籍,要么偏重原理介绍和公式推导,要么重点描述开源算法的实现调用,无法满足二者兼顾的要求。为此,我们结合理论分析和实践指导要求,编写了这本面向机器学习一线工程技术人员的专业书籍。它既能帮助读者深入理解相关算法原理,也有助于读者学会利用专业工具平台快速搭建模型,构建机器学习的行业应用。
本书内容覆盖了机器学习领域从理论到实践的多个课题,总共分为10章。
第1章为导论,介绍机器学习的背景、定义和任务类型,构建机器学习应用的步骤,以及开发机器学习工作流的方式。
第2章详细介绍数据预处理和特征工程,并辅以实例进行验证。
第3~6章介绍回归模型、分类模型、模型融合、聚类模型,这些内容是机器学习理论和实践中的传统重点。其中不仅介绍对各种常见数据类型的处理方法,还针对删失数据进行了专门的综述和实践。
第7章介绍机器学习领域较难的图计算,并从工业界视角解读如何将图计算落地。
第8章针对特征工程、建模过程中大量调参的场景介绍自动机器学习的理论和应用,并细致比较和测试了各种自动特征工程算法在不同数据上的表现。
第9章介绍自然语言处理(词向量、序列标注、关键词抽取、自动摘要和情感分析),使用新闻文本数据搭建文本分类的流程。
第10章介绍计算机视觉中图像分类和目标检测的应用以及落地案例(车辆检测)。
书中的第1~2章是基础内容,建议读者认真阅读,其他章节则可根据需要选择性地阅读。
全书由孙元浩和杨俊统一主持和整理,参与编写的作者还包括杨一帆、裴瑞光、林木丰、乐向楠、陆增翔、蒲瑜琪、李祥祥、曾宪宇、赵文谦、林晨、浦锦毅、安磊、许凯琪、孙乐飞和吴香莲。
本书从雏形到定稿,历时近一年,非常感谢参与本书编纂校对工作的算法工程师和架构师,没有他们无私的理论分享和实践指导,本书是难以高质量完成的。在此我们对所有编者表示衷心的感谢和敬意。

孙元浩
2019年7月

上架指导

计算机/人工智能/机器学习

封底文字

本书内容覆盖了机器学习领域从理论到实践的多个主题,总共分为10章。
第1章为导论,介绍机器学习的背景、定义和任务类型,构建机器学习应用的步骤,以及开发机器学习工作流的方式。
第2章详细介绍数据预处理和特征工程技术,并辅以实例进行验证。
第3~6章介绍回归模型、分类模型、模型融合和聚类模型,这些内容是机器学习理论和实践中的传统重点。其中不仅介绍各种常见数据类型的处理方法,还针对删失数据进行了专门的综述和实践。
第7章介绍机器学习领域较难的图计算话题,并从工业界视角解读如何将图计算落地。
第8章针对特征工程、建模过程中大量调参的场景介绍自动机器学习的理论和应用,并细致比较和测试了各种自动特征工程算法在不同数据上的表现。
第9章介绍自然语言处理(词向量、序列标注、关键词抽取、自动摘要和情感分析)技术,使用新闻文本数据搭建文本分类的流程。
第10章介绍计算机视觉中图像分类和目标检测的应用以及车辆检测的落地案例。
本书适合作为高等院校计算机、软件工程、人工智能等相关专业的教学用书,同时也可供从事机器学习相关领域的工程技术人员阅读和参考,帮助他们掌握机器学习相关的算法原理,并能通过专业工具平台快速搭建各类模型,构建机器学习的行业应用。

作者简介

星环科技人工智能平台团队 编著:星环科技人工智能平台团队
星环科技人工智能平台团队由五十多位优秀的研发工程师和算法工程师组成,逾八成具有国内外名校硕士及以上学历。其中研发子团队的工作重心为一站式人工智能建模平台Sophon;算法子团队则负责基础算法的研发及改进,并在数据挖掘、传统机器学习、计算机视觉、自然语言处理、知识图谱等领域进行前瞻性研究以及项目实施落地。星环科技人工智能平台团队一直致力于“把中国人自主研发的领先创新技术赋能全世界各行各业,促进社会可持续发展,通过科技让人类的生活更美好”。目前产品应用已覆盖金融、安防、电力、交通、教育等数十个行业和领域,申请专利近三十个。

图书目录

丛书前言
丛书编委会
前言
第1章 机器学习导论1
1.1 什么是机器学习1
1.1.1 机器学习的背景1
1.1.2 机器学习的定义2
1.1.3 机器学习的任务类型3
1.1.4 构建机器学习应用的步骤5
1.2 开发机器学习工作流的方式7
1.2.1 数据导入7
1.2.2 流程搭建9
第2章 数据预处理与特征工程13
2.1 特征提取13
2.1.1 探索性数据分析14
2.1.2 数值特征18
2.1.3 类别特征22
2.1.4 时间特征24
2.1.5 文本特征24
2.1.6 过滤方法26
2.1.7 封装方法29
2.1.8 嵌入方法30
2.1.9 自动特征工程31
2.2 交互式数据预处理31
2.3 本章小结32
第3章 回归模型35
3.1 回归任务概述35
3.2 回归算法原理36
3.2.1 线性回归36
3.2.2 决策树回归38
3.2.3 生存回归41
3.3 Sophon案例42
3.4 本章小结45
第4章 分类模型47
4.1 分类任务概述47
4.2 分类算法原理48
4.2.1 逻辑回归48
4.2.2 因子分解机51
4.2.3 XGBoost52
4.3 使用Sophon建立分类模型52
4.3.1 场景介绍52
4.3.2 建模过程54
4.3.3 结果分析56
4.4 本章小结61
第5章 模型融合63
5.1 集成学习理论63
5.1.1 集成学习基本概念63
5.1.2 个体学习器63
5.1.3 基学习器集成64
5.1.4 常用的集成学习方法65
5.2 常用融合方法70
5.2.1 平均法70
5.2.2 学习法70
5.3 使用Sophon进行模型融合71
5.3.1 场景与数据集介绍71
5.3.2 建模过程71
5.3.3 结果分析74
5.4 本章小结75
第6章 聚类模型77
6.1 聚类任务概述77
6.2 聚类算法原理78
6.2.1 K-Means78
6.2.2 模糊C均值79
6.2.3 Canopy81
6.2.4 高斯混合83
6.3 聚类模型实例85
6.3.1 场景介绍85
6.3.2 建模过程87
6.3.3 结果分析91
6.4 本章小结91
第7章 图计算93
7.1 背景和问题描述93
7.2 常用算法介绍95
7.2.1 PageRank95
7.2.2 标签传播97
7.2.3 中心性检测98
7.2.4 图嵌入99
7.3 落地案例102
7.3.1 场景介绍102
7.3.2 建模过程103
7.3.3 结果分析107
7.4 本章小结109
第8章 自动机器学习111
8.1 场景介绍111
8.2 自动特征工程113
8.2.1 自动多表特征扩展114
8.2.2 自动特征构建122
8.3 建模过程127
8.4 结果分析129
8.5 真实测试案例135
8.5.1 数据集135
8.5.2 前置设置136
8.5.3 测试结果分析137
8.5.4 Abalone和Airfoil Self-Noise数据集的增强测试138
8.5.5 结论139
8.6 本章小结140
第9章 自然语言处理141
9.1 自然语言处理算法原理141
9.1.1 词向量141
9.1.2 序列标注143
9.1.3 关键词抽取147
9.1.4 文本自动摘要148
9.1.5 文本情感分析152
9.2 使用Sophon建立自然语言处理模型154
9.2.1 场景介绍154
9.2.2 建模流程154
9.2.3 模型评估155
9.3 落地案例156
9.4 本章小结159
第10章 计算机视觉161
10.1 计算机视觉概述161
10.2 计算机视觉算法原理161
10.2.1 图像分类161
10.2.2 目标检测163
10.3 计算机视觉模型示例166
10.3.1 图像预处理166
10.3.2 图像分类算法建模166
10.3.3 目标检测算法建模169
10.4 落地案例171
10.5 本章小结173
附录A 企业级人工智能应用平台Sophon175
参考文献206

教学资源推荐
作者: [美]詹姆?普斯特若夫斯基(James Pustejovsky), [美]安伯•斯塔布斯(Amber Stubbs)著
作者: [奥]迪特尔·施马尔斯蒂格(Dieter Schmalstieg) [美]托比亚斯·霍勒尔(Tobias Höllerer) 著
作者: 蔡自兴 王勇 编著
作者: Joseph Giarratano Gary D.Riley
参考读物推荐
作者: [美]劳伦斯·莫罗尼(Laurence Moroney) 著
作者: [美]罗伯特·本菲尔德(Robert Benefield) 著
作者: [中]石川(Chuan Shi) 王啸(Xiao Wang)[美]俞士纶(Philip S. Yu) 著
作者: [美]赫伯特·L.罗埃布莱特(Herbert L. Roitblat)著