首页>参考读物>计算机科学与技术>软件与程序设计

Flink技术内幕:架构设计与实现原理
作者 : 罗江宇 赵士杰 李涵淼 闵文俊 著
丛书名 : 大数据技术丛书
出版日期 : 2021-12-03
ISBN : 978-7-111-69629-2
定价 : 99.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 336
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

内容简介
这是一部从源代码角度出发,通过分析Flink的各个功能模块的实现来剖析Flink的架构设计和实现原理的著作。它将能指导读者更好地对Flink进行性能调优、可用性保障、效能优化和二次开发。
四位作者都是非常资深的Flink专家,部分作者是Flink源代码的维护者和改造者,本书总结了他们在阿里巴巴、蚂蚁集团、滴滴等企业的大规模Flink实践经验。
全书共11章,主要内容如下。
第1章 阅读Flink源代码前的准备
主要介绍了Flink源代码的获取、编译、调试,以及它的目录结构、设计理念和基本架构。此外,还分析了Flink与Hadoop MapReduce、Spark在设计上的差异。
第2~8章 Flink功能模块源代码和架构解析
从源码角度分析了Flink的编程模型与API、运行时组件与通信、状态管理与容错、任务提交与执行、Flink网络栈、Flink Connector、部署模式等功能模块的原理。力求让读者深入理解Flink的原理,而不只是跟着本书读一遍Flink源代码。原理和思想是不局限于某一个框架和技术,了解了Flink的原理和思想,可以将其扩展到其他框架和技术上。
第9~10章 Flink Table、SQL与Flink CEP
编程方式逐渐从原先基于Map-Reduce的任务模式向SQL化演进,SQL意味着标准和效率。这两章重点讲解了StreamTableEnvironment的实现过程、SQL的解析过程、Table Connector以及Flink CEP的内部实现原理。
第11章 Flink监控
主要讲解了Flink的监控指标、常用系统指标和监控体系的建设,以及常用的定位手段。

图书特色

资深Flink专家/Flink源代码维护和改造者撰写,阿里巴巴、蚂蚁集团、滴滴等企业大规模生产经验总结
从源代码角度剖析Flink架构设计和内部机制,指导读者更好地进行性能调优、可用性保障、效能优化、二次开发

图书前言

为什么要写本书
近些年来,流计算技术发展迅速,被广泛应用于数据ETL、数据BI、实时数据仓库建设和AI等方面。Flink作为流计算领域的一颗璀璨的明星,自问世以来发展迅猛,其技术生态圈也日益壮大,现已成为Apache顶级开源项目中最活跃的项目之一。很多企业选择用Flink来构建其流计算体系或流批一体体系,使用on YARN或on Kubernetes部署模式来进行大规模生产。
转眼间,我从事Flink研发工作已经4年,其间我对Flink 的1.2、1.3、1.5、1 .8、1.9、1.11 和1.13版本源代码进行维护和改造,提供Flink 大规模集群生产支持,并在公司内提供业务解决方案。在为业务方提供支持的过程中,我逐渐萌生写一本剖析Flink内部机制的书的想法,原因有二。
其一,随着流计算的流行和应用于大规模生产,公司对Flink的性能、可用性和效能等方面的要求更加迫切,因而更加需要流计算方面的人才,尤其是拥有Flink性能调优、可用性和效能等方面经验的人才。而单纯查看官方文档,对Flink机制的认识只能流于黑盒形式。只有深入源代码才能深刻理解Flink 的内部机制,才能更好地进行性能调优,做好可用性保障和优化,以及做好效能方面的优化。
其二,市场上缺少深入剖析Flink源代码和设计的图书。我希望借助自己多年从事大规模生产以及进行多个Flink 版本维护与改造的经验,对Flink 的设计与实现进行深入剖析,帮助读者更好地了解Flink源代码与机制。
通过了解源代码,读者能有以下收获:
编写出更健壮的流计算代码;
更好地对流计算作业进行调优,使得作业性能更高;
更好地维护Flink引擎,并对Flink引擎进行二次开发。
读者对象
本书适合以下几类人员阅读:
流计算开发人员、大数据开发人员;
大数据架构人员;
对Flink计算引擎底层感兴趣的相关人员。
本书特色
基于使用方式及其背后的原理、原理背后的设计及源代码实现来剖析Flink内部机制,由浅入深。
尽量用图来展示原理和机制,以便于读者理解。
尽可能结合实际生产分析Flink 内部机制,对读者的实际生产具有指导意义。
讲解的设计和实现原理有助于读者提升架构设计与实现能力。
本书结构与内容
本书基于Flink 1.9版本的源代码来解析Flink。全书共11章,主要内容如下。
第1章 阅读Flink源代码前的准备
主要介绍Flink源代码阅读环境准备以及Flink的设计理念和基本架构,包括Flink源代码的导入流程和调试方式,Flink与Hadoop MapReduce、Spark的设计差异,以及Flink的分层架构和运行时架构。
第2章 编程模型与API
主要介绍Flink DataStream的算子的使用和实现原理。首先讲解DataStream底层的转换,接着介绍常用算子(如FlatMap、Join、Aggregation、Union),最后解析窗口的设计与实现。
第3章 运行时组件与通信
深入剖析运行时组件、组件间通信及运行时组件的高可用。首先介绍运行时组件REST、Dispatcher、ResourceManager、JobMaster和TaskExecutor,接着介绍运行时组件间通信的框架Akka,并以Slot申请为例讲解运行时组件之间的通信,最后介绍运行时组件高可用的功能、存在的问题及其解决方案。
第4章 状态管理与容错
从状态、检查点、状态后端三个概念入手,对Flink状态管理和容错的设计与实现进行深度剖析。
第5章 任务提交与执行
主要介绍Flink任务提交的整个流程,从客户端、JobManager和TaskManager端对应任务各个阶段的转换入手进行深入的梳理与分析。
第6章 Flink网络栈
首先介绍Flink的内存管理机制,然后讲解什么是Flink网络栈以及网络传输流程,其中涵盖Flink的两种背压实现方式,最后介绍流批一体的shuffle架构的设计和实现。
第7章 Flink Connector的设计与实现
首先以Kafka Connector为切入点介绍Connector模块设计时需要考虑的消费、分区管理、一致性语义保障等关键问题,然后以HBase为例介绍SQL/Table Connector的使用和实现原理。
第8章 部署模式
主要介绍Flink中常用的三种部署模式:Local模式、Standalone模式和第三方部署模式。首先介绍用于本地调试的Local模式、Standalone模式中Session模式的构建与实现,然后介绍Flink on YARN的Session模式和Per-Job模式的设计与实现,最后介绍Flink on Kubernetes基于YAML的实现。
第9章 Flink Table与SQL
主要介绍Flink Table与SQL中StreamTableEnvironment的实现过程、SQL的解析过程、Table Connector以及UDF和内置算子的实现。
第10章 Flink CEP原理解析
主要介绍Flink CEP的基本概念和语法,如何使用Flink CEP编写作业,以及 Flink CEP内部基于NFA的实现原理。
第11章 Flink监控
主要介绍Flink监控指标、常用系统指标和监控体系的建设,以及常用的定位手段。
勘误与支持
由于作者的水平有限,加之写作时间仓促,书中难免存在不妥之处。为此,我们在GitHub上创建了本书专属工程(https://github.com/streaming-olap/deep-in-flink-book)来支持在线反馈。大家如有任何意见或建议,欢迎在该工程下创建issue,我们会尽快处理。
致谢
感谢Flink社区提供了如此优秀的流处理框架。
感谢我们的家人和朋友,没有他们的支持和鼓励,我们不可能完成本书。
感谢机械工业出版社华章分社的编辑杨福川和罗词亮,他们的细致工作让本书得以顺利出版。
谨以此书献给大数据行业的关注者和建设者!

罗江宇  
2021年12月

上架指导

计算机/大数据

封底文字

本书首先全面梳理了Flink系统的架构、组件、编程模型和API、内部通信等机制,然后详细讲解了在Flink运行中各关键组件如何工作,如何协同,如何与大数据生态中的其他系统进行交互,并从使用者角度系统介绍了Flink的编程模型、SQL模型及CEP模型,对于需要用Flink来解决实际业务问题的人士有很高的参考和学习价值。不仅如此,本书还从系统运维、服务保障方面介绍了如何管理和监控集群,监控各类性能和稳定性指标,因而也适合运维和网站可靠性工程师参考。
——Luo Li Shopee数据架构组资深经理/Apache Alluxio PMC & Committer

Flink已经成为实时计算领域的事实标准。要想基于开源的Flink引擎打造自主可控的服务体系,对引擎原理的深度掌控至关重要。本书作者之一赵士杰主导了滴滴实时计算服务的构建,积累了丰富的Flink实战经验。本书深入浅出地介绍了Flink架构与原理,极大地降低了学习与理解Flink的门槛。
——张亮 滴滴出行企业级事业群滴滴云负责人

大数据里的4V特征众所周知,其中Velocity(高速性)是互联网数据的特点。互联网公司对数据的新鲜度和处理爆发型数据的能力都有非常强的业务诉求,而实时计算已经成为它们的基础能力之一。Apache Flink在最近5年内飞速发展,已成为实时计算领域的事实标准。很高兴有越来越多的技术图书来剖析实时计算引擎的内部原理。本书内容翔实,深入浅出,图文并茂,是很好的实时计算进阶材料。
——阮若夷 蚂蚁计算资深专家/计算基础负责人

市面上与Flink相关的书有很多,但与本书同类型的较少。本书从源代码机制上对Flink的设计与实现进行深入剖析,帮助读者更好地了解Flink源代码与机制,并分享了Flink性能调优(对流计算作业进行调优,使得作业性能更高)、可用性(编写出更健壮的流计算代码)和效能等方面的经验。同时本书采用示意图来展示原理和机制,尽可能结合实际生产来分析Flink内部机制,有助于读者理解,进而提升架构设计与实现能力。
——君山 《深入分析Java Web技术内幕》作者

作者简介

罗江宇 赵士杰 李涵淼 闵文俊 著:作者简介
罗江宇
Flink技术专家,先后就职于新浪微博、滴滴和某大型电商公司。先后主导或参与了多家公司的Flink实时计算服务的构建、对超大规模集群的维护以及Flink引擎的改造。拥有丰富的实时计算实战经验,目前专注于Kubernetes调度、Flink SQL及Flink流批一体化方向。
赵士杰
资深大数据技术专家,曾就职于滴滴、阿里巴巴等一线互联网公司。从0到1深度参与了滴滴的大数据建设,拥有非常丰富的大数据平台一线建设经验,对于大数据领域的计算和存储引擎也有深入研究。
李涵淼
大数据研发专家,曾任滴滴大数据开发工程师。从事大数据领域工作多年,参与过多家公司流计算平台的设计与研发,目前专注于批流一体、OLAP技术方向的研究与应用。
闵文俊
蚂蚁集团技术专家、开源大数据社区爱好者、Flink Contributor,在实时计算领域工作多年,深度参与了滴滴、蚂蚁集团的实时计算平台建设。

图书目录

前 言
第1章 阅读Flink源代码前的准备 1
1.1 环境准备 1
1.2 获取、编译和调试Flink的源代码 4
1.2.1 获取与导入Flink源代码 4
1.2.2 编译与调试Flink源代码 6
1.3 Flink源代码的目录结构 9
1.4 Flink设计理念与基本架构 11
1.4.1 Flink与主流计算引擎对比 11
1.4.2 Flink基本架构 14
1.5 本章小结 17
第2章 编程模型与API 18
2.1 DataStream 18
2.2 算子 21
2.3 窗口 28
2.3.1 窗口的基本概念 28
2.3.2 窗口的执行流程 30
2.3.3 窗口分配器 32
2.3.4 触发器 37
2.3.5 窗口函数 41
2.4 本章小结 43
第3章 运行时组件与通信 44
3.1 运行时组件 44
3.1.1 REST 45
3.1.2 Dispatcher 54
3.1.3 ResourceManager 61
3.1.4 JobMaster 75
3.1.5 TaskExecutor 85
3.2 组件间通信 95
3.2.1 Akka与Actor模型 95
3.2.2 组件间通信实现 99
3.3 运行时组件的高可用 117
3.3.1 Master节点上组件的高可用 117
3.3.2 现有运行时组件高可用存在的问题及其解决方案 126
3.4 本章小结 128
第4章 状态管理与容错 129
4.1 状态 129
4.1.1 状态的原理与实现 129
4.1.2 状态生存时间的原理与实现 134
4.2 检查点 137
4.2.1 检查点机制原理 137
4.2.2 检查点执行过程 137
4.2.3 任务容错 140
4.3 状态后端 143
4.4 本章小结 148
第5章 任务提交与执行 149
5.1 任务提交整体流程 149
5.2 DAG转换 152
5.2.1 DAG的4层转换 152
5.2.2 WordCount转换过程 152
5.3 Slot分配 160
5.3.1 相关概念和实现类 160
5.3.2 Slot申请流程 162
5.3.3 任务部署 168
5.4 任务执行机制 170
5.4.1 任务执行过程 170
5.4.2 MailBox线程模型 174
5.5 本章小结 177
第6章 Flink网络栈 178
6.1 内存管理 178
6.2 网络传输 182
6.2.1 什么是Flink网络栈 182
6.2.2 非流控模型的网络传输流程 184
6.2.3 流控模型的网络传输流程 197
6.3 流批一体的shuffle架构 199
6.3.1 生命周期管理 199
6.3.2 数据shuffle 207
6.4 本章小结 208
第7章 Flink Connector的设计与实现 209
7.1 Kafka Connector实现原理 209
7.1.1 Kafka Source Connector实现 209
7.1.2 Kafka Sink Connector 实现 216
7.2 HBase Table Connector 实现原理 220
7.2.1 HBase Source Connector和Sink Connector的工厂实现 221
7.2.2 HBase维表实现 222
7.3 本章小结 224
第8章 部署模式 225
8.1 Local部署 225
8.2 Standalone部署 228
8.3 Flink on YARN模式 240
8.3.1 YARN基本架构 240
8.3.2 Flink on YARN模式介绍 241
8.3.3 Flink on YARN启动过程 243
8.4 Flinkon Kubernetes模式 260
8.5 本章小结 265
第9章 Flink Table与SQL 266
9.1 StreamTableEnvironment类介绍 266
9.1.1 StreamExecution-Environment类 267
9.1.2 EnvironmentSettings类 267
9.1.3 TableConfig类 268
9.1.4 StreamTableEnvironment的创建过程 269
9.2 SQL解析过程 270
9.2.1 SQL解析 270
9.2.2 SQL优化 277
9.2.3 RelNode转换 279
9.3 Table Connector 281
9.3.1 TableSource 282
9.3.2 TableSink 286
9.3.3 SPI机制在Table Connector中的应用 288
9.4 UDF与内置算子 292
9.4.1 UDF 292
9.4.2 内置算子 294
9.5 本章小结 297
第10章 Flink CEP 原理解析 298
10.1 CEP的基本概念 298
10.1.1 什么是Flink CEP 298
10.1.2 Pattern 298
10.1.3 量词 300
10.1.4 条件 301
10.1.5 连接 302
10.1.6 Flink CEP作业编写举例 302
10.2 CEP内部实现原理 304
10.2.1 NFA简介 305
10.2.2 匹配过程 305
10.2.3 CEP状态存储 310
10.2.4 CEP和SQL结合 313
10.3 本章小结 315
第11章 Flink监控 316
11.1 监控指标 316
11.1.1 指标类型 316
11.1.2 系统指标及自定义指标 318
11.1.3 指标的使用 319
11.2 常用系统指标 322
11.3 监控体系建设 324
11.3.1 指标监控及展示 324
11.3.2 日志分析处理 326
11.3.3 定位手段 326
11.4 本章小结 327

教学资源推荐
作者: 朱鸣华等
作者: [美] 罗伯特·塞奇威克(Robert Sedgewick) 凯文·韦恩(Kevin Wayne) 罗伯特·唐德罗(Robert Dondero) 著
作者: Brian W.Kernighan,Dennis M.Ritchie
参考读物推荐
作者: (美)Venkat Subramaniam 著
作者: 吴惠茹 等编著
作者: (美)Mickey Williams