深入理解计算机系统(原书第3版)
作者 : [美] 兰德尔 E.布莱恩特(Randal E. Bryant)大卫 R. 奥哈拉伦(David R. O'Hallaron) 著
译者 : 龚奕利 贺莲 译
丛书名 : 计算机科学丛书
出版日期 : 2016-11-14
ISBN : 978-7-111-54493-7
定价 : 139.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 771
开本 : 16
原书名 : Computer Systems: A Programmer's Perspective, Third Edition
原出版社: Pearson Education Asia
属性分类: 教材
包含CD :
绝版 :
图书简介

本书是将计算机软件和硬件理论结合讲述的经典教程,内容覆盖计算机导论、体系结构和处理器设计等多门课程。本书的最大优点是为程序员描述计算机系统的实现细节,通过描述程序是如何映射到系统上,以及程序是如何执行的,使读者更好地理解程序的行为为什么是这样的,以及造成效率低下的原因。

图书特色

基于该教材的北大“计算机系统导论”课程实施已有五年,得到了学生的广泛赞誉,学生们通过这门课程的学习建立了完整的计算机系统的知识体系和整体知识框架,养成了良好的编程习惯并获得了编写高性能、可移植和健壮的程序的能力,奠定了后续学习操作系统、编译、计算机体系结构等专业课程的基础。北大的教学实践表明,这是一本值得推荐采用的好教材。本书第3版采用最新x86-64架构来贯穿各部分知识。我相信,该书的出版将有助于国内计算机系统教学的进一步改进,为培养从事系统级创新的计算机人才奠定很好的基础。
—— 梅 宏 中国科学院院士/发展中国家科学院院士
以低年级开设“深入理解计算机系统”课程为基础,我先后在复旦大学和上海交通大学软件学院主导了激进的教学改革……现在我课题组的青年教师全部是首批经历此教学改革的学生。本科的扎实基础为他们从事系统软件的研究打下了良好的基础……师资力量的补充又为推进更加激进的教学改革创造了条件。
—— 臧斌宇 上海交通大学软件学院院长

本书是一本将计算机软件和硬件理论结合讲述的经典教程,内容覆盖计算机导论、体系结构和处理器设计等多门课程。本书的最大优点是从程序员的角度描述计算机系统的实现细节,通过描述程序是如何映射到系统上,以及程序是如何执行的,使读者更好地理解程序的行为,以及程序效率低下的原因。
和第2版相比,本版内容上最大的变化是,从以IA32和x86-64为基础转变为完全以x86-64为基础。主要更新如下:
基于x86-64,大量地重写代码,首次介绍对处理浮点数据的程序的机器级支持。
处理器体系结构修改为支持64位字和操作的设计。
引入更多的功能单元和更复杂的控制逻辑,使基于程序数据流表示的程序性能模型预测更加可靠。
扩充关于用GOT和PLT创建与位置无关代码的讨论,描述了更加强大的链接技术(比如库打桩)。
增加了对信号处理程序更细致的描述,包括异步信号安全的函数等。
采用最新函数,更新了与协议无关和线程安全的网络编程。


兰德尔 E. 布莱恩特
(Randal E. Bryant)
1981年于麻省理工学院获得计算机博士学位,1984年至今一直任教于卡内基-梅隆大学。现任卡内基-梅隆大学计算机科学学院院长、教授,同时还受邀任教于电子和计算机工程系。他从事本科生和研究生计算机系统方面课程的教学近40年。他和O’Hallaron教授一起在卡内基-梅隆大学开设了15-213课程“计算机系统导论”,该课程即为本书的基础。他还是ACM院士、IEEE院士、美国国家工程院院士和美国人文与科学研究院院士。其研究成果被Intel、IBM、Fujitsu和Microsoft等主要计算机制造商使用,他还因研究获得过Semiconductor Research Corporation、ACM、IEEE颁发的多项大奖。








大卫 R. 奥哈拉伦
(David R. O'Hallaron)
卡内基-梅隆大学电子和计算机工程系教授。在弗吉尼亚大学获得计算机科学的博士学位,2007年—2010年为Intel匹兹堡实验室主任。他教授本科生和研究生的计算机系统方面的课程已有20余年,并和Bryant教授一起开设了“计算机系统导论”课程。曾获得CMU计算机学院颁发的Herbert Simon杰出教学奖。他主要从事计算机系统领域的研究,与Quake项目成员一起获得过高性能计算领域中的最高国际奖项——Gordon Bell奖。他目前的工作重点是研究自动分级(autograding)概念,即评价其他程序质量的程序。




如何使用本书
从程序员的角度来学习计算机系统是如何工作的会非常有趣。最理想的学习方法是在真正的系统上解决具体的问题,或是编写和运行程序。这个主题观念贯穿本书始终。因此我们建议你用如下方式学习这本书:
学习一个新概念时,你应该立刻做一做紧随其后的一个或多个练习题来检验你的理解。这些练习题的解答在每章的末尾。要先尝试自己来解答每个问题,然后再查阅答案。
每一章后都有一组难度不同的作业题,这些题目需要的时间从十几分钟到十几个小时,但建议你尝试完成这些作业题,完成之后你会发现对系统的理解更加深入。
本书中有丰富的代码示例,鼓励你在系统上运行这些示例的源代码。
我们邀请国内名师录制了本书的导读,从中你可以了解各章的重点内容和知识关联,形成关于计算机系统的知识架构。
向老师或他人请教和交流是很好的学习方式。我们将不定期组织线上线下的学习活动,你可以登录本书网络社区及时了解活动的信息,并与学习本书的其他读者交流、讨论。
为帮助读者更好地学习本书,我们开设了本书的网络社区,请扫描如下二维码或登录http://www.hzmedia.com.cn/e/jsj加入社区,获得本书相关学习资源,了解活动信息。

图书前言

本书(简称CS:APP)的主要读者是计算机科学家、计算机工程师,以及那些想通过学习计算机系统的内在运作而能够写出更好程序的人。
我们的目的是解释所有计算机系统的本质概念,并向你展示这些概念是如何实实在在地影响应用程序的正确性、性能和实用性的。其他的系统类书籍都是从构建者的角度来写的,讲述如何实现硬件或系统软件,包括操作系统、编译器和网络接口。而本书是从程序员的角度来写的,讲述应用程序员如何能够利用系统知识来编写出更好的程序。当然,学习一个计算机系统应该做些什么,是学习如何构建一个计算机系统的很好的出发点,所以,对于希望继续学习系统软硬件实现的人来说,本书也是一本很有价值的介绍性读物。大多数系统书籍还倾向于重点关注系统的某一个方面,比如:硬件架构、操作系统、编译器或者网络。本书则以程序员的视角统一覆盖了上述所有方面的内容。
如果你研究和领会了这本书里的概念,你将开始成为极少数的“牛人”,这些“牛人”知道事情是如何运作的,也知道当事情出现故障时如何修复。你写的程序将能够更好地利用操作系统和系统软件提供的功能,对各种操作条件和运行时参数都能正确操作,运行起来更快,并能避免出现使程序容易受到网络攻击的缺陷。同时,你也要做好更深入探究的准备,研究像编译器、计算机体系结构、操作系统、嵌入式系统、网络互联和网络安全这样的高级题目。
读者应具备的背景知识
本书的重点是执行x86-64机器代码的系统。对英特尔及其竞争对手而言,x86-64是他们自1978年起,以8086微处理器为代表,不断进化的最新成果。按照英特尔微处理器产品线的命名规则,这类微处理器俗称为“x86”。随着半导体技术的演进,单芯片上集成了更多的晶体管,这些处理器的计算能力和内存容量有了很大的增长。在这个过程中,它们从处理16位字,发展到引入IA32处理器处理32位字,再到最近的x86-64处理64位字。
我们考虑的是这些机器如何在Linux操作系统上运行C语言程序。Linux是众多继承自最初由贝尔实验室开发的Unix的操作系统中的一种。这类操作系统的其他成员包括Solaris、FreeBSD和MacOS X。近年来,由于Posix和标准Unix规范的标准化努力,这些操作系统保持了高度兼容性。因此,本书内容几乎直接适用于这些“类Unix”操作系统。
文中包含大量已在Linux系统上编译和运行过的程序示例。我们假设你能访问一台这样的机器,并且能够登录,做一些诸如切换目录之类的简单操作。如果你的计算机运行的是Microsoft Windows系统,我们建议你选择安装一个虚拟机环境(例如VirtualBox或者VMWare),以便为一种操作系统(客户OS)编写的程序能在另一种系统(宿主OS)上运行。
我们还假设你对C和C++有一定的了解。如果你以前只有Java经验,那么你需要付出更多的努力来完成这种转换,不过我们也会帮助你。Java和C有相似的语法和控制语句。不过,有一些C语言的特性(特别是指针、显式的动态内存分配和格式化I/O)在Java中都是没有的。所幸的是,C是一个较小的语言,在Brian Kernighan和Dennis Ritchie经典的“K&R”文献中得到了清晰优美的描述\[61\]。无论你的编程背景如何,都应该考虑将K&R作为个人系统藏书的一部分。如果你只有使用解释性语言的经验,如Python、Ruby或Perl,那么在使用本书之前,需要花费一些时间来学习C。
本书的前几章揭示了C语言程序和它们相对应的机器语言程序之间的交互作用。机器语言示例都是用运行在x86-64处理器上的GNU GCC编译器生成的。我们不需要你以前有任何硬件、机器语言或是汇编语言编程的经验。
给C语言初学者  关于C编程语言的建议
为了帮助C语言编程背景薄弱(或全无背景)的读者,我们在书中加入了这样一些专门的注释来突出C中一些特别重要的特性。我们假设你熟悉C++或Java。

如何阅读此书
从程序员的角度学习计算机系统是如何工作的会非常有趣,主要是因为你可以主动地做这件事情。无论何时你学到一些新的东西,都可以马上试验并且直接看到运行结果。事实上,我们相信学习系统的唯一方法就是做(do)系统,即在真正的系统上解决具体的问题,或是编写和运行程序。
这个主题观念贯穿全书。当引入一个新概念时,将会有一个或多个练习题紧随其后,你应该马上做一做来检验你的理解。这些练习题的解答在每章的末尾。当你阅读时,尝试自己来解答每个问题,然后再查阅答案,看自己的答案是否正确。除第1章外,每章后面都有难度不同的家庭作业。对每个家庭作业题,我们标注了难度级别:
只需要几分钟。几乎或完全不需要编程。
可能需要将近20分钟。通常包括编写和测试一些代码。(许多都源自我们在考试中出的题目。)
需要很大的努力,也许是1~2个小时。一般包括编写和测试大量的代码。
一个实验作业,需要将近10个小时。
文中每段代码示例都是由经过GCC编译的C程序直接生成并在Linux系统上进行了测试,没有任何人为的改动。当然,你的系统上GCC的版本可能不同,或者根本就是另外一种编译器,那么可能生成不一样的机器代码,但是整体行为表现应该是一样的。所有的源程序代码都可以从csapp.cs.cmu.edu上的CS:APP主页上获取。在本书中,源程序的文件名列在两条水平线的右边,水平线之间是格式化的代码。比如,图1中的程序能在code/intro/目录下的hello.c文件中找到。当遇到这些示例程序时,我们鼓励你在自己的系统上试着运行它们。

图1 一个典型的代码示例
为了避免本书体积过大、内容过多,我们添加了许多网络旁注(Web aside),包括一些对本书主要内容的补充资料。本书中用CHAP:TOP这样的标记形式来引用这些旁注,这里CHAP是该章主题的缩写编码,而TOP是涉及的话题的缩写编码。例如,网络旁注DATA:BOOL包含对第2章中数据表示里面有关布尔代数内容的补充资料;而网络旁注ARCH:VLOG包含的是用Verilog硬件描述语言进行处理器设计的资料,是对第4章中处理器设计部分的补充。所有的网络旁注都可以从CS:APP的主页上获取。
旁注  什么是旁注
在整本书中,你将会遇到很多以这种形式出现的旁注。旁注是附加说明,能使你对当前讨论的主题多一些了解。旁注可以有很多用处。一些是小的历史故事。例如,C语言、Linux和Internet是从何而来的?有些旁注则是用来澄清学生们经常感到疑惑的问题。例如,高速缓存的行、组和块有什么区别?还有些旁注给出了一些现实世界的例子。例如,一个浮点错误怎么毁掉了法国的一枚火箭,或是给出市面上出售的一个磁盘驱动器的几何和运行参数。最后,还有一些旁注仅仅就是一些有趣的内容,例如,什么是“hoinky”?

本书概述
本书由12章组成,旨在阐述计算机系统的核心概念。内容概述如下:
●第1章:计算机系统漫游。这一章通过研究“hello,world”这个简单程序的生命周期,介绍计算机系统的主要概念和主题。
●第2章:信息的表示和处理。我们讲述了计算机的算术运算,重点描述了会对程序员有影响的无符号数和数的补码表示的特性。我们考虑数字是如何表示的,以及由此确定对于一个给定的字长,其可能编码值的范围。我们探讨有符号和无符号数字之间类型转换的效果,还阐述算术运算的数学特性。菜鸟级程序员经常很惊奇地了解到(用补码表示的)两个正数的和或者积可能为负。另一方面,补码的算术运算满足很多整数运算的代数特性,因此,编译器可以很安全地把一个常量乘法转化为一系列的移位和加法。我们用C语言的位级操作来说明布尔代数的原理和应用。我们从两个方面讲述了IEEE标准的浮点格式:一是如何用它来表示数值,一是浮点运算的数学属性。
对计算机的算术运算有深刻的理解是写出可靠程序的关键。比如,程序员和编译器不能用表达式(x-y<0)来替代(x●第3章:程序的机器级表示。我们教读者如何阅读由C编译器生成的x86-64机器代码。我们说明为不同控制结构(比如条件、循环和开关语句)生成的基本指令模式。我们还讲述过程的实现,包括栈分配、寄存器使用惯例和参数传递。我们讨论不同数据结构(如结构、联合和数组)的分配和访问方式。我们还说明实现整数和浮点数算术运算的指令。我们还以分析程序在机器级的样子作为途径,来理解常见的代码安全漏洞(例如缓冲区溢出),以及理解程序员、编译器和操作系统可以采取的减轻这些威胁的措施。学习本章的概念能够帮助读者成为更好的程序员,因为你们懂得程序在机器上是如何表示的。另外一个好处就在于读者会对指针有非常全面而具体的理解。
●第4章:处理器体系结构。这一章讲述基本的组合和时序逻辑元素,并展示这些元素如何在数据通路中组合到一起,来执行x86-64指令集的一个称为“Y86-64”的简化子集。我们从设计单时钟周期数据通路开始。这个设计概念上非常简单,但是运行速度不会太快。然后我们引入流水线的思想,将处理一条指令所需要的不同步骤实现为独立的阶段。这个设计中,在任何时刻,每个阶段都可以处理不同的指令。我们的五阶段处理器流水线更加实用。本章中处理器设计的控制逻辑是用一种称为HCL的简单硬件描述语言来描述的。用HCL写的硬件设计能够编译和链接到本书提供的模拟器中,还可以根据这些设计生成Verilog描述,它适合合成到实际可以运行的硬件上去。
●第5章:优化程序性能。在这一章里,我们介绍了许多提高代码性能的技术,主要思想就是让程序员通过使编译器能够生成更有效的机器代码来学习编写C代码。我们一开始介绍的是减少程序需要做的工作的变换,这些是在任何机器上写任何程序时都应该遵循的。然后讲的是增加生成的机器代码中指令级并行度的变换,因而提高了程序在现代“超标量”处理器上的性能。为了解释这些变换行之有效的原理,我们介绍了一个简单的操作模型,它描述了现代乱序处理器是如何工作的,然后给出了如何根据一个程序的图形化表示中的关键路径来测量一个程序可能的性能。你会惊讶于对C代码做一些简单的变换能给程序带来多大的速度提升。
●第6章:存储器层次结构。对应用程序员来说,存储器系统是计算机系统中最直接可见的部分之一。到目前为止,读者一直认同这样一个存储器系统概念模型,认为它是一个有一致访问时间的线性数组。实际上,存储器系统是一个由不同容量、造价和访问时间的存储设备组成的层次结构。我们讲述不同类型的随机存取存储器(RAM)和只读存储器(ROM),以及磁盘和固态硬盘 直译应为固态驱动器,但固态硬盘一词已经被大家接受,所以沿用。——译者注的几何形状和组织构造。我们描述这些存储设备是如何放置在层次结构中的,讲述访问局部性是如何使这种层次结构成为可能的。我们通过一个独特的观点使这些理论具体化,那就是将存储器系统视为一个“存储器山”,山脊是时间局部性,而斜坡是空间局部性。最后,我们向读者阐述如何通过改善程序的时间局部性和空间局部性来提高应用程序的性能。
●第7章:链接。本章讲述静态和动态链接,包括的概念有可重定位的和可执行的目标文件、符号解析、重定位、静态库、共享目标库、位置无关代码,以及库打桩。大多数讲述系统的书中都不讲链接,我们要讲述它是出于以下原因。第一,程序员遇到的最令人迷惑的问题中,有一些和链接时的小故障有关,尤其是对那些大型软件包来说。第二,链接器生成的目标文件是与一些像加载、虚拟内存和内存映射这样的概念相关的。
●第8章:异常控制流。在本书的这个部分,我们通过介绍异常控制流(即除正常分支和过程调用以外的控制流的变化)的一般概念,打破单一程序的模型。我们给出存在于系统所有层次的异常控制流的例子,从底层的硬件异常和中断,到并发进程的上下文切换,到由于接收Linux信号引起的控制流突变,到C语言中破坏栈原则的非本地跳转。
在这一章,我们介绍进程的基本概念,进程是对一个正在执行的程序的一种抽象。读者会学习进程是如何工作的,以及如何在应用程序中创建和操纵进程。我们会展示应用程序员如何通过Linux系统调用来使用多个进程。学完本章之后,读者就能够编写带作业控制的Linux shell了。同时,这里也会向读者初步展示程序的并发执行会引起不确定的行为。
●第9章:虚拟内存。我们讲述虚拟内存系统是希望读者对它是如何工作的以及它的特性有所了解。我们想让读者了解为什么不同的并发进程各自都有一个完全相同的地址范围,能共享某些页,而又独占另外一些页。我们还讲了一些管理和操纵虚拟内存的问题。特别地,我们讨论了存储分配操作,就像标准库的malloc和free操作。阐述这些内容是出于下面几个目的。它加强了这样一个概念,那就是虚拟内存空间只是一个字节数组,程序可以把它划分成不同的存储单元。它可以帮助读者理解当程序包含存储泄漏和非法指针引用等内存引用错误时的后果。最后,许多应用程序员编写自己的优化了的存储分配操作来满足应用程序的需要和特性。这一章比其他任何一章都更能展现将计算机系统中的硬件和软件结合起来阐述的优点。而传统的计算机体系结构和操作系统书籍都只讲述虚拟内存的某一方面。
●第10章:系统级I/O。我们讲述Unix I/O的基本概念,例如文件和描述符。我们描述如何共享文件,I/O重定向是如何工作的,还有如何访问文件的元数据。我们还开发了一个健壮的带缓冲区的I/O包,可以正确处理一种称为short counts的奇特行为,也就是库函数只读取一部分的输入数据。我们阐述C的标准I/O库,以及它与Linux I/O的关系,重点谈到标准I/O的局限性,这些局限性使之不适合网络编程。总的来说,本章的主题是后面两章——网络和并发编程的基础。
●第11章:网络编程。对编程而言,网络是非常有趣的I/O设备,它将许多我们前面文中学习的概念(比如进程、信号、字节顺序、内存映射和动态内存分配)联系在一起。网络程序还为下一章的主题——并发,提供了一个很令人信服的上下文。本章只是网络编程的一个很小的部分,使读者能够编写一个简单的Web服务器。我们还讲述位于所有网络程序底层的客户端服务器模型。我们展现了一个程序员对Internet的观点,并且教读者如何用套接字接口来编写Internet客户端和服务器。最后,我们介绍超文本传输协议(HTTP),并开发了一个简单的迭代式Web服务器。
●第12章:并发编程。这一章以Internet服务器设计为例介绍了并发编程。我们比较对照了三种编写并发程序的基本机制(进程、I/O多路复用和线程),并且展示如何用它们来建造并发Internet服务器。我们探讨了用P、V信号量操作来实现同步、线程安全和可重入、竞争条件以及死锁等的基本原则。对大多数服务器应用来说,写并发代码都是很关键的。我们还讲述了线程级编程的使用方法,用这种方法来表达应用程序中的并行性,使得程序在多核处理器上能执行得更快。使用所有的核解决同一个计算问题需要很小心谨慎地协调并发线程,既要保证正确性,又要争取获得高性能。
本版新增内容
本书的第1版于2003年出版,第2版在2011年出版。考虑到计算机技术发展如此迅速,这本书的内容还算是保持得很好。事实证明Intel x86的机器上运行Linux(以及相关操作系统),加上采用C语言编程,是一种能够涵盖当今许多系统的组合。然而,硬件技术、编译器和程序库接口的变化,以及很多教师教授这些内容的经验,都促使我们做了大量的修改。
第2版以来的最大整体变化是,我们的介绍从以IA32和x86-64为基础,转变为完全以x86-64为基础。这种重心的转移影响了很多章节的内容。下面列出一些明显的变化:
●第1章。我们将第5章对Amdahl定理的讨论移到了本章。
●第2章。读者和评论家的反馈是一致的,本章的一些内容有点令人不知所措。因此,我们澄清了一些知识点,用更加数学的方式来描述,使得这些内容更容易理解。这使得读者能先略过数学细节,获得高层次的总体概念,然后回过头来进行更细致深入的阅读。
●第3章。我们将之前基于IA32和x86-64的表现形式转换为完全基于x86-64,还更新了近期版本GCC产生的代码。其结果是大量的重写工作,包括修改了一些概念提出的顺序。同时,我们还首次介绍了对处理浮点数据的程序的机器级支持。由于历史原因,我们给出了一个网络旁注描述IA32机器码。
●第4章。我们将之前基于32位架构的处理器设计修改为支持64位字和操作的设计。
●第5章。我们更新了内容以反映最近几代x86-64处理器的性能。通过引入更多的功能单元和更复杂的控制逻辑,我们开发的基于程序数据流表示的程序性能模型,其性能预测变得比之前更加可靠。
●第6章。我们对内容进行了更新,以反映更多的近期技术。
●第7章。针对x86-64,我们重写了本章,扩充了关于用GOT和PLT创建位置无关代码的讨论,新增了一节描述更加强大的链接技术,比如库打桩。
●第8章。我们增加了对信号处理程序更细致的描述,包括异步信号安全的函数,编写信号处理程序的具体指导原则,以及用sigsuspend等待处理程序。
●第9章。本章变化不大。
●第10章。我们新增了一节说明文件和文件的层次结构,除此之外,本章的变化不大。
●第11章。我们介绍了采用最新getaddrinfo和getnameinfo函数的、与协议无关和线程安全的网络编程,取代过时的、不可重入的gethostbyname和gethostbyaddr函数。
●第12章。我们扩充了利用线程级并行性使得程序在多核机器上更快运行的内容。
此外,我们还增加和修改了很多练习题和家庭作业。
本书的起源
本书起源于1998年秋季,我们在卡内基梅隆(CMU)大学开设的一门编号为15-213的介绍性课程:计算机系统导论(Introduction to Computer System,ICS)\[14\]。从那以后,每学期都开设了ICS这门课程,每学期有超过400名学生上课,这些学生从本科二年级到硕士研究生都有,所学专业也很广泛。这门课程是卡内基梅隆大学计算机科学系(CS)以及电子和计算机工程系(ECE)所有本科生的必修课,也是CS和ECE大多数高级系统课程的先行必修课。
ICS这门课程的宗旨是用一种不同的方式向学生介绍计算机。因为,我们的学生中几乎没有人有机会亲自去构造一个计算机系统。另一方面,大多数学生,甚至包括所有的计算机科学家和计算机工程师,也需要日常使用计算机和编写计算机程序。所以我们决定从程序员的角度来讲解系统,并采用这样的原则过滤要讲述的内容:我们只讨论那些影响用户级C语言程序的性能、正确性或实用性的主题。
比如,我们排除了诸如硬件加法器和总线设计这样的主题。虽然我们谈及了机器语言,但是重点并不在于如何手工编写汇编语言,而是关注C语言编译器是如何将C语言的结构翻译成机器代码的,包括编译器是如何翻译指针、循环、过程调用以及开关(switch)语句的。更进一步地,我们将更广泛和全盘地看待系统,包括硬件和系统软件,涵盖了包括链接、加载、进程、信号、性能优化、虚拟内存、I/O以及网络与并发编程等在内的主题。
这种做法使得我们讲授ICS课程的方式对学生来讲既实用、具体,还能动手操作,同时也非常能调动学生的积极性。很快地,我们收到来自学生和教职工非常热烈而积极的反响,我们意识到卡内基梅隆大学以外的其他人也可以从我们的方法中获益。因此,这本书从ICS课程的笔记中应运而生了,而现在我们对它做了修改,使之能够反映科学技术以及计算机系统实现中的变化和进步。通过本书的多个版本和多种语言译本,ICS和许多相似课程已经成为世界范围内数百所高校的计算机科学和计算机工程课程的一部分。
写给指导教师们:可以基于本书的课程
指导教师可以使用本书来讲授五种不同类型的系统课程(见图2)。具体每门课程则有赖于课程大纲的要求、个人喜好、学生的背景和能力。图中的课程从左往右越来越强调以程序员的角度来看待系统。以下是简单的描述。
●ORG:一门以非传统风格讲述传统主题的计算机组成原理课程。传统的主题包括逻辑设计、处理器体系结构、汇编语言和存储器系统,然而这里更多地强调了对程序员的影响。例如,要反过来考虑数据表示对C语言程序的数据类型和操作的影响。又例如,对汇编代码的讲解是基于C语言编译器产生的机器代码,而不是手工编写的汇编代码。
●ORG+:一门特别强调硬件对应用程序性能影响的ORG课程。和ORG课程相比,学生要更多地学习代码优化和改进C语言程序的内存性能。
●ICS:基本的ICS课程,旨在培养一类程序员,他们能够理解硬件、操作系统和编译系统对应用程序的性能和正确性的影响。和ORG+课程的一个显著不同是,本课程不涉及低层次的处理器体系结构。相反,程序员只同现代乱序处理器的高级模型打交道。ICS课程非常适合安排到一个10周的小学期,如果期望步调更从容一些,也可以延长到一个15周的学期。
●ICS+:在基本的ICS课程基础上,额外论述一些系统编程的问题,比如系统级I/O、网络编程和并发编程。这是卡内基梅隆大学的一门一学期时长的课程,会讲述本书中除了低级处理器体系结构以外的所有章。
●SP:一门系统编程课程。和ICS+课程相似,但是剔除了浮点和性能优化的内容,更加强调系统编程,包括进程控制、动态链接、系统级I/O、网络编程和并发编程。指导教师可能会想从其他渠道对某些高级主题做些补充,比如守护进程(daemon)、终端控制和Unix IPC(进程间通信)。

图2 五类基于本书的课程
注:符号⊙表示覆盖部分章节,其中:(a)只有硬件;(b)无动态存储分配;(c)无动态链接;(d)无浮点数。ICS+是卡内基梅隆的15-213课程。

图2要表达的主要信息是本书给了学生和指导教师多种选择。如果你希望学生更多地了解低层次的处理器体系结构,那么通过ORG和ORG+课程可以达到目的。另一方面,如果你想将当前的计算机组成原理课程转换成ICS或者ICS+课程,但是又对突然做这样剧烈的变化感到担心,那么你可以逐步递增转向ICS课程。你可以从OGR课程开始,它以一种非传统的方式教授传统的问题。一旦你对这些内容感到驾轻就熟了,就可以转到ORG+,最终转到ICS。如果学生没有C语言的经验(比如他们只用Java编写过程序),你可以花几周的时间在C语言上,然后再讲述ORG或者ICS课程的内容。
最后,我们认为ORG+和SP课程适合安排为两期(两个小学期或者两个学期)。或者你可以考虑按照一期ICS和一期SP的方式来教授ICS+课程。
写给指导教师们:经过课堂验证的实验练习
ICS+课程在卡内基梅隆大学得到了学生很高的评价。学生对这门课程的评价,中值分数一般为5.0/5.0,平均分数一般为4.6/5.0。学生们说这门课非常有趣,令人兴奋,主要就是因为相关的实验练习。这些实验练习可以从CS:APP的主页上获得。下面是本书提供的一些实验的示例。
●数据实验。这个实验要求学生实现简单的逻辑和算术运算函数,但是只能使用一个非常有限的C语言子集。比如,只能用位级操作来计算一个数字的绝对值。这个实验可帮助学生了解C语言数据类型的位级表示,以及数据操作的位级行为。
●二进制炸弹实验。二进制炸弹是一个作为目标代码文件提供给学生的程序。运行时,它提示用户输入6个不同的字符串。如果其中的任何一个不正确,炸弹就会“爆炸”,打印出一条错误消息,并且在一个打分服务器上记录事件日志。学生必须通过对程序反汇编和逆向工程来测定应该是哪6个串,从而解除各自炸弹的雷管。该实验能教会学生理解汇编语言,并且强制他们学习怎样使用调试器。
●缓冲区溢出实验。它要求学生通过利用一个缓冲区溢出漏洞,来修改一个二进制可执行文件的运行时行为。这个实验可教会学生栈的原理,并让他们了解写那种易于遭受缓冲区溢出攻击的代码的危险性。
●体系结构实验。第4章的几个家庭作业能够组合成一个实验作业,在实验中,学生修改处理器的HCL描述,增加新的指令,修改分支预测策略,或者增加、删除旁路路径和寄存器端口。修改后的处理器能够被模拟,并通过运行自动化测试检测出大多数可能的错误。这个实验使学生能够体验处理器设计中令人激动的部分,而不需要掌握逻辑设计和硬件描述语言的完整知识。
●性能实验。学生必须优化应用程序的核心函数(比如卷积积分或矩阵转置)的性能。这个实验可非常清晰地表明高速缓存的特性,并带给学生低级程序优化的经验。
●cache实验。这个实验类似于性能实验,学生编写一个通用高速缓存模拟器,并优化小型矩阵转置核心函数,以最小化对模拟的高速缓存的不命中次数。我们使用Valgrind为矩阵转置核心函数生成真实的地址访问记录。
●shell实验。学生实现他们自己的带有作业控制的Unix shell程序,包括Ctrl+C和Ctrl+Z按键,fg、bg和jobs命令。这是学生第一次接触并发,并且让他们对Unix的进程控制、信号和信号处理有清晰的了解。
●malloc实验。学生实现他们自己的malloc、free和realloc(可选)版本。这个实验可让学生们清晰地理解数据的布局和组织,并且要求他们评估时间和空间效率的各种权衡及折中。
●代理实验。实现一个位于浏览器和万维网其他部分之间的并行Web代理。这个实验向学生们揭示了Web客户端和服务器这样的主题,并且把课程中的许多概念联系起来,比如字节排序、文件I/O、进程控制、信号、信号处理、内存映射、套接字和并发。学生很高兴能够看到他们的程序在真实的Web浏览器和Web服务器之间起到的作用。
CS:APP的教师手册中有对实验的详细讨论,还有关于下载支持软件的说明。
第3版的致谢
很荣幸在此感谢那些帮助我们完成本书第3版的人们。
我们要感谢卡内基梅隆大学的同事们,他们已经教授了ICS课程多年,并提供了富有见解的反馈意见,给了我们极大的鼓励:Guy Blelloch、Roger Dannenberg、David Eckhardt、Franz Franchetti、Greg Ganger、Seth Goldstein、Khaled Harras、Greg Kesden、Bruce Maggs、Todd Mowry、Andreas Nowatzyk、Frank Pfenning、 Markus Pueschel和Anthony Rowe。David Winters在安装和配置参考Linux机器方面给予了我们很大的帮助。
Jason Fritts(圣路易斯大学,St.Louis University)和Cindy Norris(阿帕拉契州立大学,Appalachian State)对第2版提供了细致周密的评论。龚奕利(武汉大学,Wuhan University)翻译了中文版,并为其维护勘误,同时还贡献了一些错误报告。Godmar Back(弗吉尼亚理工大学,Virginia Tech)向我们介绍了异步信号安全以及与协议无关的网络编程,帮助我们显著提升了本书质量。
非常感谢目光敏锐的读者们,他们报告了第2版中的错误:Rami Ammari、Paul Anagnostopoulos、Lucas Brenfnger、Godmar Back、Ji Bin、Sharbel Bousemaan、Richard Callahan、 Seth Chaiken、Cheng Chen、Libo Chen、Tao Du、Pascal Garcia、Yili Gong、Ronald Greenberg、Dorukhan Gülz、Dong Han、Dominik Helm、Ronald Jones、Mustafa Kazdagli、Gordon Kindlmann、Sankar Krishnan、Kanak Kshetri、Junlin Lu、Qiangqiang Luo、Sebastian Luy、Lei Ma、Ashwin Nanjappa、Gregoire Paradis、Jonas Pfenninger、Karl Pichotta、David Ramsey、Kaustabh Roy、David Selvaraj、Sankar Shanmugam、Dominique Smulkowska、Dag Srb、Michael Spear、Yu Tanaka、Steven Tricanowicz、Scott Wright、Waiki Wright、Han Xu、Zhengshan Yan、Firo Yang、Shuang Yang、John Ye、Taketo Yoshida、Yan Zhu和Michael Zink。
还要感谢对实验做出贡献的读者,他们是:Godmar Back(弗吉尼亚理工大学,Virginia Tech)、Taymon Beal(伍斯特理工学院,Worcester Polytechnic Institute)、Aran Clauson(西华盛顿大学,Western Washington University)、Cary Gray(威顿学院,Wheaton College)、Paul Haiduk(德州农机大学,West Texas A&M University)、Len Hamey(麦考瑞大学,Macquarie University)、Eddie Kohler(哈佛大学,Harvard)、Hugh Lauer(伍斯特理工学院,Worcester Polytechnic Institute)、Robert Marmorstein(朗沃德大学,Longwood University)和James Riely(德保罗大学,DePaul University)。
再次感谢Windfall软件公司的Paul Anagnostopoulos在本书排版和先进的制作过程中所做的精湛工作。非常感谢Paul和他的优秀团队:Richard Camp(文字编辑)、Jennifer McClain(校对)、Laurel Muller(美术制作)以及Ted Laux(索引制作)。Paul甚至找出了我们对缩写BSS的起源描述中的一个错误,这个错误从第1版起一直没有被发现!
最后,我们要感谢Prentice Hall出版社的朋友们。Marcia Horton和我们的编辑Matt Goldstein一直坚定不移地给予我们支持和鼓励,非常感谢他们。
第2版的致谢
我们深深地感谢那些帮助我们写出CS:APP第2版的人们。
首先,我们要感谢在卡内基梅隆大学教授ICS课程的同事们,感谢你们见解深刻的反馈意见和鼓励:Guy Blelloch、Roger Dannenberg、David Eckhardt、Greg Ganger、Seth Goldstein、Greg Kesden、Bruce Maggs、Todd Mowry、Andreas Nowatzyk、Frank Pfenning和Markus Pueschel。
还要感谢报告第1版勘误的目光敏锐的读者们:Daniel Amelang、Rui Baptista、Quarup Barreirinhas、Michael Bombyk、Jrg Brauer、Jordan Brough、Yixin Cao、James Caroll、Rui Carvalho、Hyoung-Kee Choi、Al Davis、Grant Davis、Christian Dufour、Mao Fan、Tim Freeman、Inge Frick、Max Gebhardt、Jeff Goldblat、Thomas Gross、Anita Gupta、John Hampton、Hiep Hong、Greg Israelsen、Ronald Jones、Haudy Kazemi、Brian Kell、Constantine Kousoulis、Sacha Krakowiak、Arun Krishnaswamy、Martin Kulas、Michael Li、Zeyang Li、Ricky Liu、Mario Lo Conte、Dirk Maas、Devon Macey、Carl Marcinik、Will Marrero、Simone Martins、Tao Men、Mark Morrissey、Venkata Naidu、Bhas Nalabothula、Thomas Niemann、Eric Peskin、David Po、Anne Rogers、John Ross、Michael Scott、Seiki、Ray Shih、Darren Shultz、Erik Silkensen、Suryanto、Emil Tarazi、Nawanan Theera-Ampornpunt、Joe Trdinich、Michael Trigoboff、James Troup、Martin Vopatek、Alan West、Betsy Wolff、Tim Wong、James Woodruff、Scott Wright、Jackie Xiao、Guanpeng Xu、Qing Xu、Caren Yang、Yin Yongsheng、Wang Yuanxuan、Steven Zhang和Day Zhong。特别感谢Inge Frick,他发现了我们加锁复制(lock-and-copy)例子中一个极不明显但很深刻的错误,还要特别感谢Ricky Liu,他的校对水平真的很高。
我们Intel实验室的同事Andrew Chien和Limor Fix在本书的写作过程中一直非常支持。非常感谢Steve Schlosser提供了一些关于磁盘驱动器的总结描述,Casey Helfrich和Michael Ryan安装并维护了新的Core i7机器。Michael Kozuch、Babu Pillai和Jason Campbell对存储器系统性能、多核系统和能量墙问题提出了很有价值的见解。Phil Gibbons和Shimin Chen跟我们分享了大量关于固态硬盘设计的专业知识。
我们还有机会邀请了Wen-Mei Hwu、Markus Pueschel和Jiri Simsa这样的高人给予了一些针对具体问题的意见和高层次的建议。James Hoe帮助我们写了Y86处理器的Verilog描述,还完成了所有将设计合成到可运行的硬件上的工作。
非常感谢审阅本书草稿的同事们:James Archibald(百翰杨大学,Brigham Young University)、Richard Carver(乔治梅森大学,George Mason University)、Mirela Damian(维拉诺瓦大学,Villanova University)、Peter Dinda(西北大学)、John Fiore(坦普尔大学,Temple University)、Jason Fritts(圣路易斯大学,St.Louis University)、John Greiner(莱斯大学)、 Brian Harvey(加州大学伯克利分校)、Don Heller(宾夕法利亚州立大学)、Wei Chung Hsu(明尼苏达大学)、Michelle Hugue(马里兰大学)、 Jeremy Johnson(德雷克塞尔大学,Drexel University)、Geoff Kuenning(哈维马德学院,Harvey Mudd College)、Ricky Liu、Sam Madden(麻省理工学院)、Fred Martin(马萨诸塞大学洛厄尔分校,University of Massachusetts, Lowell)、Abraham Matta(波士顿大学)、Markus Pueschel(卡内基梅隆大学)、Norman Ramsey(塔夫茨大学,Tufts University)、Glenn Reinmann(加州大学洛杉矶分校)、Michela Taufer(特拉华大学,University of Delaware)和Craig Zilles(伊利诺伊大学香槟分校)。
Windfall软件公司的Paul Anagnostopoulos出色地完成了本书的排版,并领导了制作团队。非常感谢Paul和他超棒的团队:Rick Camp(文字编辑)、Joe Snowden(排版)、MaryEllen N.Oliver(校对)、Laurel Muller(美术)和Ted Laux(索引制作)。
最后,我们要感谢Prentice Hall出版社的朋友们。Marcia Horton总是支持着我们。我们的编辑Matt Goldstein由始至终表现出了一流的领导才能。我们由衷地感谢他们的帮助、鼓励和真知灼见。
第1版的致谢
我们衷心地感谢那些给了我们中肯批评和鼓励的众多朋友及同事。特别感谢我们15-213课程的学生们,他们充满感染力的精力和热情鞭策我们前行。Nick Carter和Vinny Furia无私地提供了他们的malloc程序包。
Guy Blelloch、Greg Kesden、Bruce Maggs和Todd Mowry已教授此课多个学期,他们给了我们鼓励并帮助改进课程内容。Herb Derby提供了早期的精神指导和鼓励。Allan Fisher、Garth Gibson、Thomas Gross、Satya、Peter Steenkiste和Hui Zhang从一开始就鼓励我们开设这门课程。Garth早期给的建议促使本书的工作得以开展,并且在Allan Fisher 领导的小组的帮助下又细化和修订了本书的工作。Mark Stehlik 和 Peter Lee 提供了极大的支持,使得这些内容成为本科生课程的一部分。Greg Kesden 针对ICS在操作系统课程上的影响提供了有益的反馈意见。Greg Ganger和Jiri Schindler提供了一些磁盘驱动的描述说明,并回答了我们关于现代磁盘的疑问。Tom Striker 向我们展示了存储器山的比喻。James Hoe 在处理器体系结构方面提出了很多有用的建议和反馈。
有一群特殊的学生极大地帮助我们发展了这门课程的内容,他们是Khalil Amiri、Angela Demke Brown、Chris Colohan、Jason Crawford、Peter Dinda、Julio Lopez、Bruce Lowekamp、Jeff Pierce、Sanjay Rao、Balaji Sarpeshkar、Blake Scholl、Sanjit Seshia、Greg Steffan、Tiankai Tu、Kip Walker和Yinglian Xie。尤其是Chris Colohan 建立了愉悦的氛围并持续到今天,还发明了传奇般的“二进制炸弹”,这是一个对教授机器语言代码和调试概念非常有用的工具。
Chris Bauer、Alan Cox、Peter Dinda、Sandhya Dwarkadis、John Greiner、Bruce Jacob、Barry Johnson、Don Heller、Bruce Lowekamp、Greg Morrisett、Brian Noble、Bobbie Othmer、Bill Pugh、Michael Scott、Mark Smotherman、Greg Steffan和Bob Wier 花费了大量时间阅读此书的早期草稿,并给予我们建议。特别感谢Peter Dinda(西北大学)、John Greiner(莱茨大学)、Wei Hsu(明尼苏达大学)、Bruce Lowekamp(威廉&玛丽大学)、Bobbie Othmer(明尼苏达大学)、Michael Scott(罗彻斯特大学)和Bob Wier(落基山学院)在教学中测试此书的试用版。同样特别感谢他们的学生们!
我们还要感谢Prentice Hall出版社的同事。感谢Marcia Horton、Eric Frank和Harold Stone不懈的支持和远见。Harold还帮我们提供了对RISC和CISC处理器体系结构准确的历史观点。Jerry Ralya有惊人的见识,并教会了我们很多如何写作的知识。
最后,我们衷心感谢伟大的技术作家Brian Kernighan以及后来的W.Richard Stevens,他们向我们证明了技术书籍也能写得如此优美。
谢谢你们所有的人。

Randal E.Bryant
David R.OHallaron
于匹兹堡,宾夕法尼亚州

上架指导

计算机\硬件

封底文字

基于该教材的北大“计算机系统导论”课程实施已有五年,得到了学生的广泛赞誉,学生们通过这门课程的学习建立了完整的计算机系统的知识体系和整体知识框架,养成了良好的编程习惯并获得了编写高性能、可移植和健壮的程序的能力,奠定了后续学习操作系统、编译、计算机体系结构等专业课程的基础。北大的教学实践表明,这是一本值得推荐采用的好教材。本书第3版采用最新x86-64架构来贯穿各部分知识。我相信,该书的出版将有助于国内计算机系统教学的进一步改进,为培养从事系统级创新的计算机人才奠定很好的基础。
                                                                                                                           —— 梅 宏 中国科学院院士/发展中国家科学院院士

本书是一本将计算机软件和硬件理论结合讲述的经典教程,内容覆盖计算机导论、体系结构和处理器设计等多门课程。本书的最大优点是为程序员描述计算机系统的实现细节,通过描述程序是如何映射到系统上,以及程序是如何执行的,使读者更好地理解程序的行为,以及造成效率低下的原因。
  和第2版相比,本版最大的变化是,介绍从以IA32和x86-64为基础转变为完全以x86-64为基础。主要更新如下:
· 基于x86-64,大量地重写代码,首次介绍对处理浮点数据的程序的机器级支持。
· 处理器体系结构修改为支持64位字和操作的设计。
· 引入更多的功能单元和更复杂的控制逻辑,使基于程序数据流表示的程序性能模型预测更加可靠。
· 扩充关于用GOT和PLT创建与位置无关代码的讨论,描述了更加强大的链接技术(比如库打桩)。
· 增加了对信号处理程序更细致的描述,包括异步信号安全的函数等。
· 采用最新函数,更新了与协议无关和线程安全的网络编程。

作者简介

[美] 兰德尔 E.布莱恩特(Randal E. Bryant)大卫 R. 奥哈拉伦(David R. O'Hallaron) 著:
兰德尔 E.布莱恩特(Randal E. Bryant) 1973年获得密歇根大学学士学位,随即就读麻省理工学院的研究生院,并在1981年获得计算机博士学位。从1984年至今一直任教于卡内基-梅隆大学,现在是卡内基-梅隆大学计算机学院院长、教授,同时受邀任教于电子与计算机工程学院。他还是ACM院士、IEEE院士和美国国家工程院院士。其研究成果获得过数项大奖,其中包括Semiconductor Research Corporation颁发的两个发明荣誉奖和一个技术成就奖,ACM颁发的Kanellakis理论与实践奖,还有IEEE授予的W. R. G. Baker奖、Emmanuel Piore奖和Phil Kaufman奖。

大卫 R. 奥哈拉伦(David R. O'Hallaron) 在维吉尼亚大学(University of Virginia)获得计算机科学的博士学位,现为Intel匹兹堡实验室主任、卡内基-梅隆大学电子与计算机工程学院副教授。他曾获得卡内基-梅隆大学计算机学院颁发的Herbert Simon杰出教学奖,并同Quake项目中其他成员一起获得了高性能计算领域中的最高国际奖项——Gordon Bell奖。

译者简介

龚奕利 贺莲 译:暂无简介

译者序

本书第1版出版于2003年,第2版出版于2011年,去年发行的已经是原书第3版了。第3版还是采用以下组合方式:在经典的x86架构机器上运行Linux操作系统,采用C语言编程。这样的组合经受住了时间的考验。这一版的一个明显变化就是从讲解IA32和x86-64转变为完全以x86-64为基础,相应地修改了第3、4、5、6和7章。同时,还改写了第2章,使之更易读、好懂;用近期的新技术更新了第6、11和12章。这些变化使得本书既和新技术保持了同步,又保留了描述系统本质的内容以及从程序员角度出发的特色。
除了翻译本书,我们也开始以本书为教材讲授“计算机系统基础”课程,对这本书的理解也随之越来越深入,意识到除了阅读之外,动手实践更是学习计算机系统的必经之路。本书的官网提供了很多实验作业(Lab Assignment),其中不乏有趣且有一定难度的实验,比如Bomb Lab。有兴趣的读者除了阅读本书的内容之外,还应该试着去完成这些实验,让纸面上的内容在实际动手中得到巩固和加强。本书的官方博客也不断更新着有关这本书和配套课程的最新变化,这也是对本书的有益补充。
第3版从翻译的角度来说,我们尽量做到更流畅,更符合中文表达的习惯。对于一些术语,比如memory,以前怕出错就统一翻译成存储器,现在则尽可能地按照语境去区分,翻译成内存或者存储器。
在此,要感谢本书的编辑朱劼、姚蕾以及和静,有她们的支持、鼓励和耐心细致的工作,才能让本书如期与读者见面。
由于本书内容多,翻译时间紧迫,尽管我们尽量做到认真仔细,但还是难以避免出现错误和不尽如人意的地方。在此欢迎广大读者批评指正。我们也会一如既往地维护勘误表,及时在网上更新,方便大家阅读。(另外,本版第1次印刷时,我们已经根据官网2016年3月1日前发布的勘误进行了修正,就不在中文勘误中再翻译了。)

龚奕利 贺莲
2016年5月于珞珈山

图书目录

出版者的话
中文版序一
中文版序二
译者序
前言
关于作者
第1章 计算机系统漫游1
 1.1 信息就是位+上下文1
 1.2 程序被其他程序翻译成不同的格式3
 1.3 了解编译系统如何工作是大有益处的4
 1.4 处理器读并解释储存在内存中的指令5
  1.4.1 系统的硬件组成5
  1.4.2 运行hello程序7
 1.5 高速缓存至关重要9
 1.6 存储设备形成层次结构9
 1.7 操作系统管理硬件10
  1.7.1 进程11
  1.7.2 线程12
  1.7.3 虚拟内存12
  1.7.4 文件14
 1.8 系统之间利用网络通信14
 1.9 重要主题16
  1.9.1 Amdahl定律16
  1.9.2 并发和并行17
  1.9.3 计算机系统中抽象的重要性19
 1.10 小结20
 参考文献说明20
 练习题答案20
第一部分
程序结构和执行
 第2章 信息的表示和处理22
 2.1 信息存储24
  2.1.1 十六进制表示法25
  2.1.2 字数据大小27
  2.1.3 寻址和字节顺序29
  2.1.4 表示字符串34
  2.1.5 表示代码34
  2.1.6 布尔代数简介35
  2.1.7 C语言中的位级运算37
  2.1.8 C语言中的逻辑运算39
  2.1.9 C语言中的移位运算40
 2.2 整数表示41
  2.2.1 整型数据类型42
  2.2.2 无符号数的编码43
  2.2.3 补码编码44
  2.2.4 有符号数和无符号数之间的转换49
  2.2.5 C语言中的有符号数与无符号数52
  2.2.6 扩展一个数字的位表示54
  2.2.7 截断数字56
  2.2.8 关于有符号数与无符号数的建议58
 2.3 整数运算60
  2.3.1 无符号加法60
  2.3.2 补码加法62
  2.3.3 补码的非66
  2.3.4 无符号乘法67
  2.3.5 补码乘法67
  2.3.6 乘以常数70
  2.3.7 除以2的幂71
  2.3.8 关于整数运算的最后思考74
 2.4 浮点数75
  2.4.1 二进制小数76
  2.4.2 IEEE浮点表示78
  2.4.3 数字示例79
  2.4.4 舍入83
  2.4.5 浮点运算85
  2.4.6 C语言中的浮点数86
 2.5 小结87
 参考文献说明88
 家庭作业88
 练习题答案97
第3章 程序的机器级表示109
 3.1 历史观点110
 3.2 程序编码113
  3.2.1 机器级代码113
  3.2.2 代码示例114
  3.2.3 关于格式的注解117
 3.3 数据格式119
 3.4 访问信息119
  3.4.1 操作数指示符121
  3.4.2 数据传送指令122
  3.4.3 数据传送示例125
  3.4.4 压入和弹出栈数据127
 3.5 算术和逻辑操作128
  3.5.1 加载有效地址129
  3.5.2 一元和二元操作130
  3.5.3 移位操作131
  3.5.4 讨论131
  3.5.5 特殊的算术操作133
 3.6 控制135
  3.6.1 条件码135
  3.6.2 访问条件码136
  3.6.3 跳转指令138
  3.6.4 跳转指令的编码139
  3.6.5 用条件控制来实现条件分支…141
  3.6.6 用条件传送来实现条件分支…145
  3.6.7 循环149
  3.6.8 switch语句159
 3.7 过程164
  3.7.1 运行时栈164
  3.7.2 转移控制165
  3.7.3 数据传送168
  3.7.4 栈上的局部存储170
  3.7.5 寄存器中的局部存储空间172
  3.7.6 递归过程174
 3.8 数组分配和访问176
  3.8.1 基本原则176
  3.8.2 指针运算177
  3.8.3 嵌套的数组178
  3.8.4 定长数组179
  3.8.5 变长数组181
 3.9 异质的数据结构183
  3.9.1 结构183
  3.9.2 联合186
  3.9.3 数据对齐189
 3.10 在机器级程序中将控制与数据结合起来192
  3.10.1 理解指针192
  3.10.2 应用:使用GDB调试器193
  3.10.3 内存越界引用和缓冲区溢出194
  3.10.4 对抗缓冲区溢出攻击198
  3.10.5 支持变长栈帧201
 3.11 浮点代码204
  3.11.1 浮点传送和转换操作205
  3.11.2 过程中的浮点代码209
  3.11.3 浮点运算操作210
  3.11.4 定义和使用浮点常数212
  3.11.5 在浮点代码中使用位级操作212
  3.11.6 浮点比较操作213
  3.11.7 对浮点代码的观察结论215
 3.12 小结216
 参考文献说明216
 家庭作业216
 练习题答案226
第4章 处理器体系结构243
 4.1 Y86-64指令集体系结构245
  4.1.1 程序员可见的状态245
  4.1.2 Y86-64指令245
  4.1.3 指令编码246
  4.1.4 Y86-64异常250
  4.1.5 Y86-64程序251
  4.1.6 一些Y86-64指令的详情255
 4.2 逻辑设计和硬件控制语言HCL256
  4.2.1 逻辑门257
  4.2.2 组合电路和HCL布尔表达式257
  4.2.3 字级的组合电路和HCL整数表达式258
  4.2.4 集合关系261
  4.2.5 存储器和时钟262
 4.3 Y86-64的顺序实现264
  4.3.1 将处理组织成阶段264
  4.3.2 SEQ硬件结构272
  4.3.3 SEQ的时序274
  4.3.4 SEQ阶段的实现277
 4.4 流水线的通用原理282
  4.4.1 计算流水线282
  4.4.2 流水线操作的详细说明284
  4.4.3 流水线的局限性284
  4.4.4 带反馈的流水线系统287
 4.5 Y86-64的流水线实现288
  4.5.1 SEQ+:重新安排计算阶段288
  4.5.2 插入流水线寄存器289
  4.5.3 对信号进行重新排列和标号292
  4.5.4 预测下一个PC293
  4.5.5 流水线冒险295
  4.5.6 异常处理306
  4.5.7 PIPE各阶段的实现308
  4.5.8 流水线控制逻辑314
  4.5.9 性能分析322
  4.5.10 未完成的工作323
 4.6 小结325
 参考文献说明326
 家庭作业327
 练习题答案331
第5章 优化程序性能341
 5.1 优化编译器的能力和局限性342
 5.2 表示程序性能345
 5.3 程序示例347
 5.4 消除循环的低效率350
 5.5 减少过程调用353
 5.6 消除不必要的内存引用354
 5.7 理解现代处理器357
  5.7.1 整体操作357
  5.7.2 功能单元的性能361
  5.7.3 处理器操作的抽象模型362
 5.8 循环展开366
 5.9 提高并行性369
  5.9.1 多个累积变量370
  5.9.2 重新结合变换373
 5.10 优化合并代码的结果小结377
 5.11 一些限制因素378
  5.11.1 寄存器溢出378
  5.11.2 分支预测和预测错误处罚379
 5.12 理解内存性能382
  5.12.1 加载的性能382
  5.12.2 存储的性能383
 5.13 应用:性能提高技术387
 5.14 确认和消除性能瓶颈388
  5.14.1 程序剖析388
  5.14.2 使用剖析程序来指导优化390
 5.15 小结392
 参考文献说明393
 家庭作业393
 练习题答案395
第6章 存储器层次结构399
 6.1 存储技术399
  6.1.1 随机访问存储器400
  6.1.2 磁盘存储406
  6.1.3 固态硬盘414
  6.1.4 存储技术趋势415
 6.2 局部性418
  6.2.1 对程序数据引用的局部性418
  6.2.2 取指令的局部性419
  6.2.3 局部性小结420
 6.3 存储器层次结构421
  6.3.1 存储器层次结构中的缓存422
  6.3.2 存储器层次结构概念小结424
 6.4 高速缓存存储器425
  6.4.1 通用的高速缓存存储器组织结构425
  6.4.2 直接映射高速缓存427
  6.4.3 组相联高速缓存433
  6.4.4 全相联高速缓存434
  6.4.5 有关写的问题437
  6.4.6 一个真实的高速缓存层次结构的解剖438
  6.4.7 高速缓存参数的性能影响439
 6.5 编写高速缓存友好的代码440
 6.6 综合:高速缓存对程序性能的影响444
  6.6.1 存储器山444
  6.6.2 重新排列循环以提高空间局部性447
  6.6.3 在程序中利用局部性450
 6.7 小结450
 参考文献说明451
 家庭作业451
 练习题答案459
第二部分
在系统上运行程序
 第7章 链接464
 7.1 编译器驱动程序465
 7.2 静态链接466
 7.3 目标文件466
 7.4 可重定位目标文件467
 7.5 符号和符号表468
 7.6 符号解析470
  7.6.1 链接器如何解析多重定义的全局符号471
  7.6.2 与静态库链接475
  7.6.3 链接器如何使用静态库来解析引用477
 7.7 重定位478
  7.7.1 重定位条目479
  7.7.2 重定位符号引用479
 7.8 可执行目标文件483
 7.9 加载可执行目标文件484
 7.10 动态链接共享库485
 7.11 从应用程序中加载和链接共享库487
 7.12 位置无关代码489
 7.13 库打桩机制492
  7.13.1 编译时打桩492
  7.13.2 链接时打桩492
  7.13.3 运行时打桩494
 7.14 处理目标文件的工具496
 7.15 小结496
 参考文献说明497
 家庭作业497
 练习题答案499
第8章 异常控制流501
 8.1 异常502
  8.1.1 异常处理503
  8.1.2 异常的类别504
  8.1.3 Linux/x86-64系统中的异常505
 8.2 进程508
  8.2.1 逻辑控制流508
  8.2.2 并发流509
  8.2.3 私有地址空间509
  8.2.4 用户模式和内核模式510
  8.2.5 上下文切换511
 8.3 系统调用错误处理512
 8.4 进程控制513
  8.4.1 获取进程ID513
  8.4.2 创建和终止进程513
  8.4.3 回收子进程516
  8.4.4 让进程休眠521
  8.4.5 加载并运行程序521
  8.4.6 利用fork和execve运行程序524
 8.5 信号526
  8.5.1 信号术语527
  8.5.2 发送信号528
  8.5.3 接收信号531
  8.5.4 阻塞和解除阻塞信号532
  8.5.5 编写信号处理程序533
  8.5.6 同步流以避免讨厌的并发错误540
  8.5.7 显式地等待信号543
 8.6 非本地跳转546
 8.7 操作进程的工具550
 8.8 小结550
 参考文献说明550
 家庭作业550
 练习题答案556
第9章 虚拟内存559
 9.1 物理和虚拟寻址560
 9.2 地址空间560
 9.3 虚拟内存作为缓存的工具561
  9.3.1 DRAM缓存的组织结构562
  9.3.2 页表562
  9.3.3 页命中563
  9.3.4 缺页564
  9.3.5 分配页面565
  9.3.6 又是局部性救了我们565
 9.4 虚拟内存作为内存管理的工具565
 9.5 虚拟内存作为内存保护的工具567
 9.6 地址翻译567
  9.6.1 结合高速缓存和虚拟内存570
  9.6.2 利用TLB加速地址翻译570
  9.6.3 多级页表571
  9.6.4 综合:端到端的地址翻译573
 9.7 案例研究:Intel Core i7/Linux内存系统576
  9.7.1 Core i7地址翻译576
  9.7.2 Linux虚拟内存系统580
 9.8 内存映射582
  9.8.1 再看共享对象583
  9.8.2 再看fork函数584
  9.8.3 再看execve函数584
  9.8.4 使用mmap函数的用户级内存映射585
 9.9 动态内存分配587
  9.9.1 malloc和free函数587
  9.9.2 为什么要使用动态内存分配589
  9.9.3 分配器的要求和目标590
  9.9.4 碎片591
  9.9.5 实现问题592
  9.9.6 隐式空闲链表592
  9.9.7 放置已分配的块593
  9.9.8 分割空闲块594
  9.9.9 获取额外的堆内存594
  9.9.10 合并空闲块594
  9.9.11 带边界标记的合并595
  9.9.12 综合:实现一个简单的分配器597
  9.9.13 显式空闲链表603
  9.9.14 分离的空闲链表604
 9.10 垃圾收集605
  9.10.1 垃圾收集器的基本知识606
  9.10.2 Mark&Sweep垃圾收集器607
  9.10.3 C程序的保守Mark&Sweep608
 9.11 C程序中常见的与内存有关的错误609
  9.11.1 间接引用坏指针609
  9.11.2 读未初始化的内存609
  9.11.3 允许栈缓冲区溢出610
  9.11.4 假设指针和它们指向的对象是相同大小的610
  9.11.5 造成错位错误611
  9.11.6 引用指针,而不是它所指向的对象611
  9.11.7 误解指针运算611
  9.11.8 引用不存在的变量612
  9.11.9 引用空闲堆块中的数据612
  9.11.10 引起内存泄漏613
 9.12 小结613
 参考文献说明613
 家庭作业614
 练习题答案617
第三部分
程序间的交互和通信
 第10章 系统级I/O622 10.1 Unix I/O622
 10.2 文件623
 10.3 打开和关闭文件624
 10.4 读和写文件625
 10.5 用RIO包健壮地读写626
  10.5.1 RIO的无缓冲的输入输出函数627
  10.5.2 RIO的带缓冲的输入函数627
 10.6 读取文件元数据632
 10.7 读取目录内容633
 10.8 共享文件634
 10.9 I/O重定向637
 10.10 标准I/O638
 10.11 综合:我该使用哪些I/O函数?638
 10.12 小结640
 参考文献说明640
 家庭作业640
 练习题答案641
第11章 网络编程642
 11.1 客户端服务器编程模型642
 11.2 网络643
 11.3 全球IP因特网646
  11.3.1 IP地址647
  11.3.2 因特网域名649
  11.3.3 因特网连接651
 11.4 套接字接口652
  11.4.1 套接字地址结构653
  11.4.2 socket函数654
  11.4.3 connect函数654
  11.4.4 bind函数654
  11.4.5 listen函数655
  11.4.6 accept函数655
  11.4.7 主机和服务的转换656
  11.4.8 套接字接口的辅助函数660
  11.4.9 echo客户端和服务器的示例662
 11.5 Web服务器665
  11.5.1 Web基础665
  11.5.2 Web内容666
  11.5.3 HTTP事务667
  11.5.4 服务动态内容669
 11.6 综合:TINY Web服务器671
 11.7 小结678
 参考文献说明678
 家庭作业678
 练习题答案679
第12章 并发编程681
 12.1 基于进程的并发编程682
  12.1.1 基于进程的并发服务器683
  12.1.2 进程的优劣684
 12.2 基于I/O多路复用的并发编程684
  12.2.1 基于I/O多路复用的并发事件驱动服务器686
  12.2.2 I/O多路复用技术的优劣690
 12.3 基于线程的并发编程691
  12.3.1 线程执行模型691
  12.3.2 Posix线程691
  12.3.3 创建线程692
  12.3.4 终止线程693
  12.3.5 回收已终止线程的资源693
  12.3.6 分离线程694
  12.3.7 初始化线程694
  12.3.8 基于线程的并发服务器694
 12.4 多线程程序中的共享变量696
  12.4.1 线程内存模型696
  12.4.2 将变量映射到内存697
  12.4.3 共享变量698
 12.5 用信号量同步线程698
  12.5.1 进度图701
  12.5.2 信号量702
  12.5.3 使用信号量来实现互斥703
  12.5.4 利用信号量来调度共享资源704
  12.5.5 综合:基于预线程化的并发服务器708
 12.6 使用线程提高并行性710
 12.7 其他并发问题716
  12.7.1 线程安全716
  12.7.2 可重入性717
  12.7.3 在线程化的程序中使用已存在的库函数718
  12.7.4 竞争719
  12.7.5 死锁721
 12.8 小结722
 参考文献说明723
 家庭作业723
 练习题答案726
附录A 错误处理729
参考文献733

教学资源推荐
作者: 马礼 等编著
作者: [美]戴维·A. 帕特森(David A. Patterson),[美]约翰·L. 亨尼斯(John L. Hennessy) 著
参考读物推荐
作者: Mark Artiges等
作者: 刘火良 杨森 编著
作者: 陆平 赵培 左奇 等编著
作者: (美)Elecia White 著