参考读物 – 图书教辅

首页>参考读物>计算机科学与技术>软件与程序设计

在线试读

Python强化学习：算法、核心技术与行业应用

作者 : [美]埃内斯·比尔金(Enes Bilgin) 著

译者 : 朱小虎汪莉娟张韩昊帝译

丛书名 : 智能系统与技术丛书

出版日期 : 2023-09-06

ISBN : 978-7-111-73489-5

定价 : 129.00元

扩展资源下载

扩展信息
图书简介
图书特色
上架指导
封底文字
图书目录
图书评论
相关推荐
回到顶部

读者反馈

扩展信息

语种 : 简体中文

页数 : 无

开本 : 16

原书名 : Mastering Reinforcement Learning with Python

原出版社: Packt Publishing Ltd.

属性分类: 店面

包含CD : 无CD

绝版 : 未绝版

图书简介

本书使用受现实世界商业和行业问题启发的实际示例来讲授强化学习技术的相关知识。本书分为四部分：第一部分涵盖强化学习的必要背景，包括定义、数学基础和强化学习解决方案的概述；第二部分深入介绍最先进的强化学习算法（规模化的深度Q-学习、基于策略的方法、基于模型的方法、多智能体强化学习等），包括每种算法的优缺点；第三部分介绍强化学习中的高级技术，包括机器教学、泛化和域随机化、元强化学习等主题，还涵盖强化学习中有助于改进模型的各种高级主题；第四部分讲解强化学习的各种应用，例如自主系统、供应链管理、营销和金融、智慧城市与网络安全等，并讨论强化学习领域的一些挑战及未来方向。学完本书，你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。

图书特色

AI和ML领域的知名专家和博主重磅作品，囊括行业前沿技术
深度学习与强化学习的完美结合，让你轻松掌握复杂算法
注重实际应用，涵盖大量代码示例，助你成为强化学习专家

上架指导

计算机\人工智能

封底文字

强化学习(RL)是用于创建自学习自主智能体的人工智能方法。本书基于强大的理论基础，采用实用的方法来研究强化学习，并使用受现实世界中商业和行业问题启发的实际示例来教授先进的强化学习知识。
本书首先介绍老虎机问题、马尔可夫决策过程和动态规划，带你深入了解经典强化学习技术，包括蒙特卡罗方法和时间差分学习方法。然后，你将了解深度Q-学习、策略梯度方法、Actor-Critic算法、基于模型的方法以及多智能体强化学习。接下来，本书将介绍一些最成功的强化学习实现背后的关键方法，例如，域随机化和好奇心驱动的强化学习。
随着学习的深入，你将使用现代Python库（例如，TensorFlow和Ray的RLlib包）探索许多具有高级实现的新颖算法。你还将了解如何在机器人、供应链管理、市场营销、金融、智慧城市与网络安全等领域应用强化学习技术，同时评估不同方法的利弊并避免常见的陷阱。
学完本书，你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。
通过阅读本书，你将：
使用强化学习建模并解决复杂的序贯决策问题。
深入了解最先进的强化学习方法的工作原理。
使用Python和TensorFlow从头开始编写强化学习算法。
使用Ray的RLlib包并行化强化学习实现，以及扩展强化学习实现。
深入了解各种强化学习主题。
了解不同强化学习方法之间的利弊。
发现并解决在现实世界中实现强化学习的挑战。

图书目录

图书评论