首页>参考读物>计算机科学与技术>软件与程序设计

编译系统透视:图解编译原理
作者 : 新设计团队 著
丛书名 : 华章原创精品
出版日期 : 2016-03-24
ISBN : 978-7-111-49858-2
定价 : 169.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 1049
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

内容简介
本书是编译原理领域的鸿篇巨著,中文版尚未出版,英文版权已经输出到美国,将在世界范围内产生重要影响。从以下多个角度讲,本书都具有重要的里程碑意义:
它第一次让编译原理不再像是一门高深晦涩的“数学课”,而是一个可以调试、可以接触、可以真切感受的理论体系。本书用1140余幅信息量巨大的运行时结构图和视频动画取代了同类书中复杂枯燥的数学公式,更加立体和直观,生动地将编译后的执行程序在内存中的运行时结构图展现了出来;
它第一次将GCC源代码、编译原理、运行时结构、编译系统原理(包含汇编与链接)的内在关系、逻辑与原理梳理清楚了,并将它们结合成一个整体。真正能够让读者透彻掌握编译器如何运行和如何设计,以及为什么要这么设计;
它是第一本系统解读著名商用编译器GCC核心源代码的著作,GCC源代码一共有600万行,为了便于讲解和阅读,本书进行了取舍和裁剪,讲解了与编译本质相关的最核心的60万行代码。
全书一共8章,具体内容和逻辑如下:
第1章以一个C程序(先简单,后复杂)的运行时结构为依托,对程序编译的整体过程做了宏观讲述,让读者对编译有整体认识,这样更容易理解后面的内容。
第2~6章通过实际的程序案例、结合GCC的源代码,根据程序编译的顺序和流程,依次讲解了词法分析、语法分析、中间结构和目标代码的生成,遵循了由易到难的原则,先是通过简单程序讲解清楚原理,然后再通过复杂程序强化理解。
第7章讲解了与编译器紧密关联的汇编器和链接器,能让读者对可执行程序的最终生成有一个完整的了解。
第8章讲解了预处理,就编译器的执行顺序而言,预处理器的执行比较靠前,之所以放在最后讲,是因为它比较独立,在读者已经了解整个编译过程中之后再讲解,读者会更容易理解。

图书特色

编译原理领域的鸿篇巨著和里程碑作品,它不仅能指导你设计出自己的编译器,更能帮助你写出更高质量的代码
60余万行源代码、1140余幅运行时结构图详尽阐述和展示应用程序的编译原理和GCC编译器的工作机制

编译系统是人与计算机之间的沟通桥梁,编译系统通过编译、汇编和链接等一系列工作将只有人能读懂的程序代码转换为机器能识别的机器码。编译系统的效率决定了应用程序的性能,程序代码的优劣对编译系统的效率有决定性的影响。编写高质量代码的方法和手段很多,但是最本质的莫过于搞清楚你的程序代码执行时在内存中的运行时结构,这是程序员的最高境界。
了解程序的运行时结构,研究编译系统的原理是最好的办法,没有捷径。本书为广大程序员完全掌握GCC编译器、编译系统原理以及如何通过掌握编译原理来改善代码质量提供了更直接、有效的指导。
当然,改善代码质量可能不是所有想掌握编译器及其原理的程序员们的唯一目的或最终目的,有的人可能是想设计自己的编译器,或者有其他目的。本书可以帮你做到的是,不仅能通过GCC编译器的源代码了解GCC的工作机制和实现原理,还能让你系统了解整个编译系统的工作原理,最终掌握编译器为何要如此设计以及如何设计自己的编译器。

图书前言

掌握程序在内存中的运行时结构对提高程序设计水平的重要性再怎么强调都不过分,将程序员编写的源代码转化为可执行程序是由编译器完成的,编译器对运行时结构的形成起着非常重要的作用。如果你想提高自己的编程水平,了解编译器怎么将你编写的源代码转换为可执行程序的,那么本书就是为你而写的!如果你对编译原理很感兴趣,也很愿意阅读编译器的源代码,却苦于代码量庞大,不知从何下手,那么你必将从本书中得到巨大的收获。
对程序员来说,提高编程水平最关键的因素之一就是了解程序的运行时结构,只有了解了自己编写的源代码运行的时候在内存中是什么样的(运行时结构),才能真正写出高质量的代码。编译器是将源代码转化为最终运行时结构的工具,如何实现运行时结构正是本书最重要的一条主线。编译器是一个非常经典的程序,其中包含的很多技术已广泛应用于其他软件(如文字处理软件、数据库、Web开发程序等)。读懂编译器的源代码,对计算机软件的很多方面来说都会有借鉴作用。
一般介绍编译原理的书籍通常都是空泛地讲一些抽象的概念,甚至夹杂不少晦涩的数学公式,脱离了具体的编译器,基本上没有编译器的源代码,初学者很难理解。
而本书则是以一个真实、具体、商用GCC编译器的源代码为蓝本,以几个案例程序的实际编译为线索,详细讲解编译案例程序的源代码的具体过程。
本书先对读者最难理解的复杂过程、关系和数据结构以动画视频的方式进行直观、形象的讲解。看过这些视频,读者就会对编译原理有一个概略、直观、整体的理解,从而很容易掌握更深的内容。纸质内容再将编译原理与GCC编译器的源代码有机联系起来,用了大量直观的图示、源代码、文字做详细讲解。
本书没有用一个数学公式,力争用最简单易懂的语言把深奥的理论讲明白。读者在看完本书后会真正了解一个编译器是如何运行的,以及为什么要这么设计,更重要的是知道编译完的程序执行时在内存中的运行时结构是什么样的。
我们还为读者提供了一个缩减版的GCC源代码。原版的GCC源代码大约有600万行,是一个适用于多种计算机语言的编译器,体量过于庞大,几乎无法在短时间内阅读、理解,甚至很难记忆。我们只保留了C语言的相关部分,并去掉了错误分析、处理和优化的相关部分,大约只有130万行,其中约50万行是为了与具体指令集相关,由机器生成的代码,仅涉及后端;在剩下的80万行代码中,与编译本质相关的核心代码大约有60万行。此外,我们还提供了与之相对应的汇编器和链接器的源代码,这些代码虽然不是编译器的一部分,但却是生成完整的可执行程序必不可少的。我们还提供了一整套的开发调试环境,既有适用于Linux的,也有适用于Windows的。读者可以在一个比较小的范围内随着本书的讲解跟踪调试,这样效率更高。读者在阅读的时候始终都能与真实的编译过程、真实的编译器源代码紧密相连。本书的编译原理不再像一门“数学课”,而是一个可以调试、可以接触、可以真切感受的理论体系。
读者只要了解C语言的语法规则,会使用C语言编写一些简单的程序,就能看懂本书。
本书内容安排
第1章的前半部分先讲解程序的运行时结构。如我们一再强调,运行时是程序执行的关键,编译器正是将源代码转化为可执行程序并形成运行时结构的工具。对于只是想提高开发能力的程序员,这部分几乎起到了90%的作用。
第1章的后半部分对整体的编译过程做了一个综述。当读者对整体有概念的时候,再去看每个章节的具体内容,会更容易理解。
第2章用一个简单案例讲解词法分析。词法分析是把源文件中的内容读出并识别出符号的过程。
第3章继续用词法分析时的简单案例讲解语法分析。语法分析是在词法分析的结果中识别出语句的过程。
第4章仍用前面的简单案例生成中间结构及目标代码。
第5章和第6章用几个更为复杂的案例来分析语法和生成中间结构及目标代码的过程。
至此,严格意义上的编译过程已经讲解完毕。为了让读者对最终生成的可执行程序有一个完整的了解,我们专门安排了汇编器、链接器的内容,这就是第7章。
第7章详细讲解如何将目标代码转变为可执行程序,包括文件格式、汇编器和链接器的内容。
第8章讲预处理。从编译器的执行顺序来看,预处理器的执行是比较靠前的,之所以把预处理放在最后讲,是因为预处理比较独立,在介绍完整个编译过程之后再讲解,读者更容易理解。
其中第1~3章都配了相应的视频,建议在看纸质内容之前先看视频。
致谢
首先,依然要感谢机械工业出版社华章分社的副总经理温莉芳女士以及其他领导,他们数年来一如既往的支持,是本书能够顺利出版的前提。
其次,特别感谢机械工业出版社华章分社的副总编辑杨福川,他对事业的追求、对工作认真负责的态度以及与作者团队的密切配合,使得本书能够以常规条件下难以置信的速度走上出版流程,与读者见面。
还要感谢机械工业出版社华章分社的版权输出团队和CRC Press的贺瑞君先生,他们的不懈努力、扎实工作和高效沟通,使得本书能够成功版权输出。
最后,感谢我们的家人和朋友,是他们的坚定支持才使得团队能够拒绝方方面面、形形色色的诱惑,放弃普遍追求的短期利益,踏踏实实地做一点实在、深入的工作。这是本书的基础。

上架指导

计算机\程序设计

封底文字

编译系统是人与计算机之间的沟通桥梁,编译系统通过编译、汇编和链接等一系列工作将只有人能读懂的程序码转换为机器能识别的机器码。编译系统的效率决定了应用程序的性能,程序代码的优劣对编译系统的效率有决定性的影响。编写高质量代码的方法和手段很多,但是最本质的莫过于搞清楚你的程序代码在执行时在内存中的运行时结构,这是程序员的最高境界。
了解程序的运行时结构,研究编译系统的原理是最好的办法,没有捷径。本书为广大程序员完全掌握GCC编译器、编译系统原理以及如何通过掌握编译原理来改善代码质量提供了更直接、有效的指导。
当然,改善代码质量可能不是所有想掌握编译器及其原理的程序员们的唯一目的或最终目的,有的人可能是想设计自己的编译器,或者有其他目的。本书可以帮你做到的是,不仅能通过GCC编译器的源代码了解GCC的工作机制和实现原理,还能让你系统性的了解整个编译系统的工作原理,最终掌握编译器为何要如此设计以及如何设计在自己的编译器。

作者简介

新设计团队 著:暂无简介

图书目录

作者简介
前  言
第1章 运行时结构及编译过程概述 1
1.1 一个简单C程序的运行时结构 1
1.2 更为复杂C程序的运行时结构 16
1.3 编译过程概述 25
1.3.1 词法分析 25
1.3.2 语法分析 26
1.3.3 从语法树到中间代码再到目标代码 26
第2章 词法分析 28
2.1 词法分析概要说明 28
2.2 词法分析过程 31
2.3 状态转换图 36
2.3.1 状态转换图总体介绍 36
2.3.2 依托状态转换图展现词法分析过程 42
2.4 GCC实现词法分析的源代码 55
2.4.1 词法分析源代码总览 55
2.4.2 结合GCC源代码讲解词法分析过程 55
2.4.3 标识符、数字、字符和字符串的详细分析过程 65
第3章 语法分析 74
3.1 语法分析综述 74
3.2 语法分析思路 74
3.3 产生式 78
3.3.1 什么是产生式 78
3.3.2 产生式的具体示例 80
3.4 匹配产生式,消除左递归 89
3.4.1 用标准产生式做匹配,出现左递归 89
3.4.2 消除左递归 93
3.4.3 产生式的工作效率 97
3.5 提取左公因子,消除回溯 100
3.5.1 对“直接声明符”的产生式提取左公因子 100
3.5.2 用提取过左公因子的产生式再去匹配 102
3.5.3 对其他产生式都提取左公因子 103
3.5.4 函数声明和定义两部分产生式的合并 105
3.6 语法分析结果:语法树 107
3.7 GCC关于语法分析的源代码解析 112
3.7.1 GCC语法分析函数调用图 112
3.7.2 全部语句的语法分析 115
第4章 语法树到目标代码 217
4.1 总述语法树到中间代码的转化过程 217
4.2 目标代码到运行时结构的映射 224
4.3 语法树转高端gimple 232
4.3.1 语法树到高端gimple的总体步骤及运行时 236
4.3.2 高端gimple的实际数据结构 241
4.3.3 语法树转高端gimple的GCC源代码解析 246
4.4 高端gimple到低端gimple 286
4.4.1 高端gimple转低端gimple概述 286
4.4.2 高端gimple转化低端gimple的GCC代码解析 293
4.5 低端gimple到cfg 297
4.5.1 低端gimple到cfg的转化概述 297
4.5.2 低端gimple转cfg的实际过程 300
4.6 cfg转ssa 301
4.7 生成RTL 305
4.7.1 为何要有RTL 305
4.7.2 转化RTL阶段的主要步骤 306
4.7.3 确定初始RTL中的运行时信息 320
4.8 RTL生成目标代码(汇编) 332
4.8.1 汇编文件介绍 332
4.8.2 创建汇编文件 334
4.8.3 输出汇编文件总入口 334
4.8.4 全局变量写入汇编文件 335
4.8.5 函数写入汇编文件 340
第5章 语句拓展案例的编译过程 353
5.1 总述各个语句拓展案例的编译过程 353
5.2 if语句的语法分析 376
5.2.1 多个变量的声明语句语法分析 376
5.2.2 if语句的语法分析过程 381
5.2.3 if...else if语句的语法分析过程 387
5.3 带标号语句的语法分析 395
5.4 switch...case、goto、break语句的语法分析过程 399
5.4.1 switch...case 语句 399
5.4.2 goto语句 407
5.4.3 分析break语句 409
5.5 do...while、while、for语句的语法分析过程 420
5.5.1 do...while语句的语法分析 424
5.5.2 while语句的语法分析过程 433
5.5.3 for语句的语法分析过程 444
5.6 各种语句嵌套组合的语法分析过程 472
5.6.1 两条变量声明语句分析的结果 477
5.6.2 分析while循环语句 477
5.6.3 进入if进行分析 480
5.6.4 进入else进行分析 485
5.7 所有案例语法树转中间结构的过程 516
5.7.1 案例1的语法树转高端gimple的总体介绍 516
5.7.2 案例1的语法树转高端gimple的代码分析 528
5.7.3 案例1的高端gimple转低端gimple 552
5.7.4 案例1的低端gimple到cfg 552
5.7.5 转化RTL阶段的主要步骤 562
5.7.6 案例2的语法树转高端gimple 587
5.7.7 案例3的语法树转高端gimple 596
第6章 数据拓展案例的编译过程 612
6.1 数据拓展案例的编译过程总述 612
6.1.1 基础类型数据总述 612
6.1.2 用户自定义类型数据总述 617
6.1.3 指针类型数据总述 626
6.1.4 作用域和生存期总述 640
6.1.5 表达式总述 645
6.2 基础类型数据的语法分析过程 652
6.2.1 非浮点型数据的语法分析 653
6.2.2 浮点型数据的语法分析 662
6.3 复合类型数据的语法分析过程 670
6.3.1 数组的语法分析 670
6.3.2 枚举类型数据的语法分析 675
6.3.3 struct类型数据的语法分析 678
6.3.4 union类型数据的语法分析 683
6.3.5 自定义数据声明和使用的语法分析 684
6.4 指针类型数据的语法分析过程 693
6.4.1 对swap_point函数中指针的语法分析 693
6.4.2 对指针使用的语法分析 696
6.5 关于作用域和生存期的语法分析过程 705
6.5.1 C语言作用域和生存期概述 705
6.5.2 全局变量data语法分析中作用域相关处理过程 706
6.5.3 fun函数定义的语法分析中作用域相关处理 709
6.5.4 main函数定义中局部变量声明data作用域处理过程 716
6.5.5 main函数内部语句块中变量nCount作用域处理过程 719
6.5.6 main函数中引用变量data时选择相应声明节点的过程分析 719
6.5.7 main函数中引用变量nCount时选择相应声明节点的过程分析 720
6.5.8 main函数中退出内部语句块时更新变量作用域过程分析 721
6.5.9 fun函数中静态变量temp生存期信息的语法分析 726
6.6 表达式的语法分析过程 728
6.6.1 if条件中的表达式语法分析 728
6.6.2 if条件下面“语句”部分的表达式语法分析 740
6.7 所有案例语法树转中间结构(RTL)的过程 754
6.7.1 基础类型数据语法树转高端gimple的过程 754
6.7.2 用户自定义数据语法树转高端gimple的过程 794
6.7.3 指针类型数据语法树转高端gimple的过程 838
6.7.4 作用域和生存期案例语法树转高端gimple的过程 878
6.7.5 复杂表达式案例的语法树转高端gimple的过程 887
第7章 汇编与链接 934
7.1 汇编器 934
7.1.1 详细介绍汇编指令到机器指令的转化 934
7.1.2 .o文件格式总体情况介绍 953
7.1.3 代码段、数据段以及其他各个表项间的关系 962
7.1.4 从汇编文件到目标文件的实现 967
7.1.5 汇编器处理的源代码分析 973
7.2 链接器 985
7.2.1 .o文件链接总体介绍 985
7.2.2 多个.o文件链接时通过符号表建立关系 989
7.2.3 链接时统一计算地址并回填 997
7.2.4 链接器源代码介绍 999
7.2.5 库函数的链接 1002
7.2.6 动态链接 1002
第8章 预处理 1012
8.1 文件包含 1012
8.2 宏定义 1017
8.3 条件编译 1019
8.4 带参数的宏定义 1022
附录 RTX定义 1031
作者的话 1039

教学资源推荐
作者: Alfred V. Aho;Monica S.Lam;Ravi Sethi;Jeffrey D. Ullman
作者: [美] 托尼·加迪斯(Tony Gaddis) 著
作者: [美]布鲁斯·埃克尔(Bruce Eckel) 戴安娜·马什(Dianne Marsh) 著
作者: 刁成嘉 刁 奕
参考读物推荐
作者: (美)H.M.Deitel,P.J.Deitel,T.R.Nieto
作者: [印]谢瑞什·查万(Shirish Chavan)
作者: (美)David Mark James Bucanek 著
作者: 王哲 张良均 李国辉 卢军 梁晓阳 著