计算机系统:系统架构与操作系统的高度集成
作者 : (美)阿麦肯尚尔·拉姆阿堪德兰(Umakishore Ramachandran) 小威廉 D. 莱希(William D. Leahy, Jr.)著
译者 : 陈文光 等译
丛书名 : 计算机科学丛书
出版日期 : 2015-07-17
ISBN : 978-7-111-50636-2
定价 : 99.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 548
开本 : 16
原书名 : Computer Systems: An Integrated Approach to Architecture and Operating Systems
原出版社: Pearson Education Asia
属性分类: 教材
包含CD :
绝版 :
图书简介

本书采用集成方法,系统地讲解了计算机系统的软件和硬件知识。全书分为5个模块:处理器、内存系统、存储系统、并行系统和网络,分别介绍并讨论了处理器及其相关的软件问题、内存系统和内存分级体系、I/O和文件系统、操作系统问题及支持并行编程的多处理器中相应体系结构特点、网络硬件的发展和处理各种网络行为的网络协议堆的特点等。

图书特色

传统的计算机课程体系人为地割裂了解决问题时所需技能的综合性。例如汇编语言、计算机原理、计算机系统结构、操作系统和编译原理分别从不同角度介绍了计算机的硬件和软件系统,但是随着多核系统日渐成为主流,这种软硬件分离的教学方法变得不切实际。
国内外大学都在这方面展开了探索,即如何用一种综合的方法来介绍计算机系统的相关内容。卡内基·梅隆大学 的《深入理解计算机系统》是目前比较成功的探索,它主要从程序员视角来讲解计算机系统,内容偏向系统软件(特别是操作系统),国内外很多大学已采用该教材作为课程的基础。而佐治亚理工学院的这本教材则是另一个有益的尝试,书中计算机系统结构和操作系统的内容基本平衡,旨在让学生了解计算机体系结构和系统软件之间的关系,为进一步深入学习计算机体系结构、操作系统和网络的高级课程或研究生课程,在这些领域进一步深造奠定良好的基础。
本书采用软硬件集成的方法,系统地讲解了计算机系统的软件和硬件知识及其相互关系。全书分为5个模块:处理器、内存系统、存储系统、并行系统和网络,分别讨论了处理器及其相关的软件问题、内存系统和分级存储体系、I/O 和文件系统、操作系统问题及支持并行编程的多处理器中相应体系结构的特点、网络硬件的发展和处理各种网络行为的网络协议栈的特点等。


Umakishore Ramachandran 
拥有威斯康星大学麦迪逊分校计算机科学专业博士学位。现在是佐治亚理工学院计算机系教授,STAR Center & Korean Programs中心主任。主要研究兴趣是体系结构设计、程序设计和并行分布式系统分析。曾获得NSF授予的美国总统青年研究人员奖、佐治亚理工学院优秀博士论文指导奖、杰出教师奖等。 2014年,他被选为IEEE会士。





William D. Leahy Jr. 
现为佐治亚理工学院计算机系讲师,讲授计算机科学的入门课程。他拥有佐治亚理工学院计算机科学硕士学位,在加入学术界之前,他有24年工业界的从业经验。


陈文光
清华大学计算机系教授。现为ACM中国理事会副主席;中国计算机学会杰出会员和杰出讲者,副秘书长。主要研究领域为操作系统、编译器与并行计算。讲授《计算机原理与系统结构》《计算机系统性能分析》等本科生、研究生课程。获国家科技进步二等奖一次,部级科技一等奖两次,部级科技进步二等奖两次。在计算机系统结构、程序设计语言与编译器、并行计算和软件的国际一流会议(如PLDI、PPoPP、PACT、ICSE、OOPSLA、Supercomputing CGO等)上连续发表多篇论文。PLDI 2012、PPoPP 2013、2014和CGO 2014程序委员会委员。任《Communication of ACM China Edition》主编,《Journal of Computer Science and Technology》《软件学报》等学术期刊编委。

图书前言

为什么在计算机系统领域需要有一本新书
和高中生谈论计算机会让人感到兴奋。人们对“盒子(计算机机箱)里”有什么东西有一种神秘感,正是那个盒子里的东西使计算机能够完成诸如让用户玩有很棒图形的视频游戏、播放音乐(不管是RAP还是交响乐)、发送即时消息给用户的朋友等功能。本书的目的就是与读者一起开展一段揭示盒子里有什么秘密的旅程。作为即将开展的旅程的一瞥,让我们在一开始就表明,让这个盒子变得有趣的并不仅仅是硬件,还包括软件和硬件是如何结合起来完成各种功能的。因此,本书所采用的途径是把软件和硬件放在一起观察,看它们是如何相互帮助以及如何协同起来让计算机变得有趣而且有用的。我们把这个过程称作“打开盒子”—即揭开盒子里有什么这个秘密:我们查看盒子内部并理解如何设计关键的硬件单元(处理器、内存以及外设控制器),理解要管理计算机中的所有硬件资源,包括处理器、内存、I/O和硬盘、多处理器以及网络所需的操作系统抽象。因此,这是一本计算机系统教学的入门课程教材,采用了一种新颖的集成教学法来介绍相关内容。
本书的目标是让学生在本科生涯(计算机科学或计算机工程专业)的早期就在相关主题方面接触足够宽泛的知识。本书的内容是为用软硬件集成的方式进行课程教学而写的,这种方式使得学生可以了解计算机体系结构和系统软件之间的关系。书中的材料可以作为4学分的半年学期课程教材,或者作为5学分的季度课程教材,或是作为每季度3学分的两季度的课程系列的教材。基于本书的课程可以为学生打下很好的基础,以进一步深入学习计算机体系结构、操作系统和网络的高级课程或研究生课程,在这些领域进一步深造。此外,这类课程可以尽早激发学生对计算机系统的兴趣,对学生在本科期间参加研究工作也有帮助。
本书的主要特点(除了处理器和内存系统之外)如下:
1)详细介绍了存储系统;
2)专门用一章介绍了网络问题;
3)专门用一章介绍了多线程和多进程编程。
教学风格
本书采用的教学风格是“发现”而非“教导”或“灌输”。此外,内容是以“自顶向下”的方式展现的,读者首先看到我们要解决的问题,然后看到解决方案。以内存管理部分(第8章)为例。我们首先提出问题“什么是内存管理”,一旦理解了内存管理的需求,我们再开始探讨内存管理所需的软件技术和相应的硬件支持。因此,本书是以一种讲故事的方式来进行概念展现,学生们看起来很喜欢这种方式。在适当的地方,我们在不同章节用一些例题来阐明观点。
我们在撰写本书的时候始终以学生为中心。书中包含大量例题,可以帮助学生固化刚刚讨论过的概念。从我们作为教师的经验来看,学生确实喜欢了解历史背景(那些对计算的演化起到重要影响的著名的计算机科学家和机构)和现状,以及我们是怎么一步一步发展过来的。这些历史片段遍布在全书中。除此之外,在必要的时候,在若干章我们都包括了一节从历史角度进行的回顾。我们从学生那里学到并采用的另一个措施是在文中直接给出参考文献,而不是在文末才给出。读者可以看到贯穿本书的大量脚注。此外,我们在每章末尾专门有一节给出外部链接(教材和开创性的著作),包括参考文献和扩展阅读的建议,这些内容在正文中不一定都被引用了,但是有助于增强学生的知识基础。今天,随着因特网上的信息日益丰富,为附加的信息提供URL链接是一件很有诱惑力的事情。但是,我们拒绝了这一诱惑(除了那些权威信息源的可靠链接)。尽管如此,我们知道现在学生在去图书馆之前会先搜索因特网,当然他们也应该这么做。在这种情况下,我们给学生一个提示:在利用因特网作为信息源的时候要慎重。通常,使用Google搜索是获取某种信息的最快方法。但是,必须对这些信息进行筛选以保证其准确性。作为经验法则,使用因特网上的信息来满足好奇心或是回答与流言有关的问题。(DEC是如何衰落的?为什么Linux成功了而Unix BSD却没有?Burroughs公司的历史是什么?计算机系统的真正先驱是哪些人?)对于技术问题(Pentium 4处理器的流水线结构是什么?VAX 11/780的指令集体系结构是什么?)则要从已出版的书籍、相关会议和期刊论文(当然它们中的大多数也可以在线获取)中寻求答案。
佐治亚理工学院计算机学院从1999年秋季学期开始,每学期都开设这门软硬件集成的课程,本教材就是这门课程的副产品。在一开始,本书作者为课程开发了完整的讲义和幻灯片,并使用两本标准的教材(一本体系结构教材和一本操作系统教材)作为课程的背景参考资料来补充课程的材料。从2005年春季开始,我们将课件转换成了本教材的手稿,因为学生一直想要一本与课程内容和风格匹配的教材。本教材的在线版本从2005年春季开始在佐治亚理工学院用于本课程,使用集成的方法介绍计算机系统。本课程每年开设3次(包括夏季学期),每学期有80多名学生选课。因此,书稿在付印之前经过了连续15个学期的教学,从选修本课的学生那里接受了持续不断的反馈与改进意见。
在设计产生本书的课程时,以及在撰写本书的时候,我们从其他机构开设的系统入门课程以及一些优秀教材中学到了很多东西。例如,MIT的计算机系统入门课程拥有很长的历史和传统,而且是真正独一无二的。从这门课程中总结的教材[Saltzer,2009]对激发学生深入学习计算机系统来说是极好的资源。在撰写本书的时候,我们坦承受到了[Ward,1989]和[Kurose,2006]的教学法的启发。
本书的结构和可能的阅读路径
本书的知识内容可以分为5个模块。下面的路线图建议了一些可能的阅读路径。这些路径假设关于体系结构和操作系统的内容一样多。
1)处理器 本书的第一个模块是关于处理器以及与处理器相关的软件问题的。我们从探索如何设计盒子中的大脑(处理器)开始。有哪些软件问题?既然计算机的大部分部件主要是使用高级语言编程的,我们考虑了高级语言结构是如何影响处理器的指令集的(第2章)。一旦理解了指令集的设计,我们就开始关注实现处理的硬件技术。我们从实现一个简单的处理器开始(第3章),然后考虑实现一个使用流水线技术的性能优化的处理器(第5章)。处理器是计算机系统中的宝贵资源,因此必须在多个相互竞争的程序间复用,正如第1章中视频游戏的例子所揭示的一样(见1.3节)。操作系统的职责就是保证资源的有效使用。本模块以用于处理器调度的操作系统算法结束(第6章)。
我们预计第2、3、5和6章每章需要3小时的课堂讲授时间和1小时的练习题时间。
2)内存系统 第二个模块介绍了内存系统和内存层次。计算机程序包括代码和数据,并且都需要存放的空间。计算机的内存系统可能是决定性能最为关键的因素。如果内存系统不能以匹配处理器速度的方式提供执行程序所需的代码和数据,处理器速度(现在以Ghz为量度)就毫无意义。由于技术的进步,内存系统的大小一直在跨越式发展,但应用程序使用内存的胃口也在以同样的速度增长着,如果不是增长得更快的话。因此,内存也是宝贵资源,操作系统的作用就是保证用好资源。本模块的第一部分是关于有效管理内存的操作系统算法以及相应的体系结构支持的(第7章和第8章);第二部分则介绍内存层次,可以帮助降低处理器在访问代码和数据时的延迟(第9章)。
我们预计第7、8和9章每章需要3小时的课堂讲授时间和1小时的练习题时间。
3)存储系统 第三个模块是关于I/O(特别是稳定存储)和文件系统的。只有与计算机进行交互才能让计算机有用且有趣。首先,我们讨论能够把处理器的注意力从当前执行的程序中脱离出来的硬件机制(第4章)。这些机制既包括外部事件也包括处理器执行程序时遇到的内部异常。与硬件机制相关的软件问题是解决正常程序执行的“不连续”性,包括记录原有程序的执行位置以及程序的当前执行状态。然后,我们介绍处理器与I/O设备的接口机制以及相应的底层软件技术(第10章),并特别强调了磁盘子系统。随后,我们完整地介绍了在稳定的存储设备(如磁盘)上如何构建文件系统(第11章)。
我们预计第4章和第10章每章需要3小时的课堂讲授时间和1小时的练习题时间,第11章需要6小时的课堂讲授时间和2小时的练习题时间。
4)并行系统 计算机体系结构是一个快速变化的领域。芯片密度、处理器速度、内存容量等在过去20年中都呈现出指数增长速度,并在可预见的未来仍然保持这样的增长速度。并行处理已不再是超级计算机独有的深奥概念。随着在一个芯片上集成多个CPU的多核技术的到来,并行性已经变得很常见。因此,理解与并行性有关的软件和硬件技术对于回答“盒子里有什么”这样的问题十分必要。这个模块包括多处理器中支持并行编程的操作系统问题以及相应的体系结构功能(第12章)。
我们预计第12章需要6小时的课堂讲授时间和2小时的练习题时间。
5)网络 在我们生活的世界上,单独一个盒子几乎没有任何用处,除非它与外部世界相连。与你的朋友在网络上对战多人视频游戏(在第1章介绍)是一个很好的例子。但即使在日常生活中,我们也需要利用网络来收发电子邮件或浏览因特网等。网络与其他输入/输出设备的不同之处在于,现在你的盒子得以连接世界了!你需要一种语言让你的盒子与外部世界交谈,并处理网络的各种情况,例如暂时或永久的连接中断。这一模块讨论了网络硬件的进化,以及用来处理各种网络状况的网络协议栈(操作系统的一部分)的功能(第13章)。 
我们预计第13章需要6小时的课堂讲授时间和2小时的练习题时间。
总而言之,第2章~第10章每章需要用1周时间授课;第11章~第13章每章需要2周时间授课,正好在15周的一个学期里讲完。五个模块中的软件和硬件问题在本书中是一起介绍的,上述建议的阅读路径也是按照这种处理方式进行的。
读者也可以选择在体系结构和操作系统主题之间重点关注某部分的内容,而不会损失连续性。以处理器模块为例,第3章和第5章都是关于处理器的硬件实现问题的。对于偏重操作系统的课程,可以考虑少讲授或者完全跳过介绍流水线处理器实现(从5.7节开始)的第5章,而不会损失课程的连续性。类似地,在偏重体系结构的课程里,可以跳过介绍处理器调度算法的第6章,而不会损失课程的连续性。
在内存模块中,第8章从操作系统角度涉及页式内存管理的细节。偏重体系结构的课程可以跳过这一章,而不会损失连续性。类似地,偏重操作系统的课程可以选择淡化第9章中对缓存的细节描述。
在存储模块中,面向体系结构的课程可以选择淡化第11章中文件系统的内容,而不必担心损失连续性。
在并行模块中(第12章),面向体系结构的课程可以跳过多线程的操作系统支持,以及一些高级主题,包括多处理器调度、死锁以及并发性的经典问题和解决方案;类似地,面向操作系统的课程可以选择跳过体系结构方面的高级主题,例如多处理器缓存一致性、并行机的分类以及互连网络等。考虑到并行性的重要性,在任何课程中,只要时间许可,应尽量覆盖这一章的全部内容。
在网络模块中(第13章),面向体系结构的课程可以跳过传输层和网络层的细节(分别是13.6节和13.7节)。面向操作系统的课程可以选择少讲一些协议栈的链路层(13.8节)和网络硬件(13.9节)的内容。
本教材在计算机科学课程体系中的位置
图P-1显示了计算机系统的抽象层次。我们可以尝试将图P-1中的不同层次的抽象与传统计算机科学课程体系中的课程相关联。诸如基础程序设计、面向对象程序设计、图形学以及HCI(人机交互)的课程通常使用较高层次的抽象。通常计算机科学和计算机工程的课程体系中包含数字电路和逻辑电路设计的基础课程,然后是计算机组成原理,介绍计算机的硬件设计。在计算机组成原理课程之上(在图P-1的抽象层次级别之上),大部分课程使用烟囱方法:不同的课程分别覆盖计算机体系结构、操作系统和计算机网络的高级概念。
应用程序(高级语言表示的算法) 更高
系统软件(编译器和操作系统)
计算机体系结构
机器组成原理(数据通路和控制)
时序和组合逻辑器件
逻辑门
晶体管
固体物理 更低

图P-1 计算机系统中的抽象层次
今天,设计计算机系统已经是软硬件集成的过程,这使人们对烟囱模式提出了质疑,特别是对计算机科学本科的课程体系中学生发展专业技能的早期。
以本书为基础围绕上述主题的课程是一种独特的尝试,用集成的方法在计算机系统的入门课程中介绍中间层次的概念(覆盖了图P-1中的深色区域—系统软件及其与计算机体系结构的关系)。这门课程将为渴望学习计算机体系结构、操作系统和网络中的高级主题(图P-2)的学生提供坚实的基础。


图P-2 系统课程系列
使用本书内容的课程的先修课程很直接:逻辑设计基础和高级语言程序设计(最好是C语言)基础。换句话说,对在本书内容之上和之下的抽象层次需要有基本的理解(见图P-1)。
在数字电路和逻辑设计基础以及程序设计基础方面都有非常优秀的教科书。类似地,在计算机体系结构、操作系统和计算机网络的高级主题方面,也有优秀的教科书。唯独缺少的是对计算机系统进行简单、集成化的介绍,使其成为基础课程和高级主题之间桥梁的图书。本书的目标就是成为这样一座桥梁。
计算机科学作为一门学科其边界已经扩展了。相应地,学习计算机科学的学生的兴趣也各不同。计算机科学的课程需要为学生在本科阶段的学习提供不同的选择。另一方面,课程也有责任保证,不论学生的选择是什么,都能学到计算机系统(广义)的核心知识。我们相信基于本书的课程可以满足这样一种系统核心知识的要求。如果正确地讲授本课程,可以给学生提供充足的机会,通过其他课程来深入学习计算机系统。例如,我们建议在大学二年级开设将本书作为教材的课程。在大三的时候,学生可能可以学习更加面向设计的课程—针对体系结构、操作系统或是网络—以他们在大二从本书中学到的基本概念为基础。最后,在大四的时候,学生可以选修在这些领域中更具概念性的高级主题课程。
本书在体系结构和操作系统的内容方面是大致平衡的。我们认为,计算机科学专业的学生在本科期间应该对这两方面同等重视,不管他们的职业目标是什么。当然,希望成为系统架构师的学生必须了解本书中介绍的软件和硬件之间的互动。即使是希望进行软件开发的学生,了解这些知识对于成为更好的程序员也是必需的。但是,这取决于每个老师对这两个主题强调的程度。好消息是,本教材允许教师选择他们认为必需的课程深度,以与他们所在学校的课程结构相适应。例如,如果教师选择减少体系结构方面的内容,可以很轻松地简单介绍处理器实现的有关章节(第3章和第5章),而不必担心内容的衔接问题。在讨论本书结构的时候,我们已经对五个模块给出了类似的建议。
讲授系统的集成课程的补充材料
我们充分理解教师在讲授需要介绍体系结构、操作系统和网络的计算机系统的集成课程时所面临的挑战。
为此,我们已经提供了一组在线资源。我们已经讲授了11年本课程,每年3次,作为所有计算机专业学生的必修课,因此我们已经积累了相当多的在线资源。
1)我们有本课程所有内容的PowerPoint讲稿,使得准备课程和转换(从原有的烟囱模型)更加容易。
2)每个模块都有一个重要的实验部分。我们提供了这些已经迭代过多次的实验的详细描述,以及用于实验特定方面的软件模块(例如模拟器)。
3)除了每章后的练习题之外,我们针对本课程的不同模块还有附加的问题集、家庭作业以及本课程迄今为止的期中和期末考试题。
在补充材料中包含的样例实验
处理器设计
我们给学生提供一个完成了90%的处理器数据通路设计。通过完成数据通路可以帮助学生熟悉相关设计。然后他们要设计基于微码的控制逻辑(使用类似LogicWorks的逻辑设计工具),利用数据通路实现一个简单的指令集。这能帮助学生理解数据通路的工作原理并体会一些设计权衡。学生会得到真实电路设计的经验,并通过逻辑设计软件内置的模拟器对设计进行功能测试。
中断和输入/输出
学生在第一个实验的基础上增加电路以实现中断系统。然后他们(使用汇编语言)写一个中断处理程序。实验的电路设计部分再次通过LogicWorks软件系统实现并进行功能模拟。此外,我们还给学生提供了处理器模拟器,他们需要在其中增加中断支持,并与他们用汇编语言写的中断处理器程序一起工作。这个实验不仅可使中断系统的操作变得清晰,还展示了底层设备输入/输出的基本概念。
虚存子系统
学生在处理器模拟器上实现虚存子系统。在这个实验中,学生可通过实现和实验不同的页替换策略,获得开发操作系统中内存管理部分的经验。这个实验是用C语言实现的。
多线程操作系统
在我们提供的模拟器上,学生实现多线程操作系统的基本模块,包括CPU和I/O调度队列等。他们可实验不同的处理器调度策略。这个模块是用C语言和pthread实现的。学生可从实验中获得并行编程经验,并接触不同的CPU调度算法。
可靠传输层
学生在我们提供的一个模拟的网络层上实现一个简单的可靠传输层。在传输层必须处理的问题包括损坏的包、丢包以及乱序到达。这个实验也是用C语言和pthread实现的。
注意
在开始探索计算机系统内部的旅程之前,我们要提醒读者注意:在展示计算机系统设计的教科书中,习惯上会通过有数字的例子来说明和支持相关概念。历史可以揭示未来。如果说在技术发展中有什么东西不变的话,那就是变化。当你买了一辆新车,在车驶出展厅的那一刻,这辆车就变成了二手车。同样地,我们使用的任何有数字的例子中的数字,如处理器速度、内存容量或是外设的传输速率马上就会过时。真正不变的是原理,这也是本书的核心内容。一个让人欣慰的因素是,尽管绝对数字可能会随时间变化,从MHz到GHz,从MB到GB,相对数字随着技术的发展相对保持不变,这使得书中的数字示例也具有持久性。
致谢
我们极大地受惠于若干国内外同行,他们直接或间接促成了本书的出现。首先,我们要感谢Yale Patt,从2004年夏天我们介绍了在佐治亚理工学院开设的这门课程后,他用具有无与伦比的说服力的方式告诉我们应该把课程的内容写成教材,因为大家迫切需要一本用集成方式介绍系统概念的图书。我们可以很诚实地说,如果没有他的鼓励,我们可能不会走上写书这条路。下面这些其他学校的同行也鼓励我们进行本书的写作,因此需要特别致谢:Jim Goodman(威斯康辛大学麦迪逊分校和新西兰奥克兰大学),Liviu Iftode(Rutger大学),Phil McKinley(密歇根州立大学)以及Anand Sivasubramaniam(宾州州立大学和TCS)。我们要特别感谢Jim Goodman,他仔细阅读了本书手稿的早期草稿,并提出了详细的反馈,使本书的叙述得到了极大的改进。除了这些人以外,我们还从其他学校的一些同行那里得到了很多对本书实验的积极支持。
写书的第一步是创建一份书稿供佐治亚理工学院的学生内部使用。对选择佐治亚理工学院CS 2200课程的学生,我们怎么感谢也不为过。从2005年春季学期开始,几代学生使用了本书的在线版本,并提出了反馈意见,对改进本书表达的清晰性、精炼例题、提供读者可能有兴趣的历史链接等起到了重要的作用。此外,有3名本科生帮助绘制了本书中的部分插图:Kristin Champion、John Madden和Vu Ha。
计算机学院的部分同事,包括Nate Clark、Tom Conte、Constantine Dovrolis、Gabriel Loh、Ken Mackenzie以及Milos Prvulovic,对本书给予了建议和有洞察力的评论,帮助本书的叙述更加清晰。我们受惠于Constantine Dovrolis对本书网络一章早期版本的建议和反馈,使得我们不仅改进了内容,还改变了这一章的叙述顺序。Ken Mackenzie的建议让我们在第3章的处理器设计中给出了一种简单的控制方法。Tom Conte对流水线一章给出了详细的评论,帮助我们更清晰地表达内容。北卡州立大学的Eric Rotenberg为流水线一章的早期草稿提出了非常有意义的反馈。Junsuk Shin写了本书附录中的简单客户端-服务器的套接字代码。我们向他们所有人表示特别的感谢。
我们要感谢佐治亚理工学院,以及计算机学院的远见卓识,鼓励我们在教学方面进行创新。实际上,从1996年开始对本科课程体系的改革使得我们开始批判性地思考应该如何教育本科生并了解在课程体系中缺少了什么,这最终导致我们开发了第一门集成方式的系统课程,包括体系结构、操作系统和网络等。
作为图书出版方面的新手,我们从成功的教科书作者那里学到了经验。我们需要特别感谢Yale Patt(德州大学)、Jim Kurose(麻省大学)、Jim Foley(佐治亚理工学院)、Andy van Dam(布朗大学)、Sham Navathe(佐治亚理工学院)、Rich LeBlanc(佐治亚理工学院)和Larry Synder(华盛顿大学)等。我们怎么感谢他们都不为过,他们分享了很多经验,包括出版社的选取、与编辑的合作、为可能的评阅人编制问题,以及如何有效地利用评阅意见修订书稿。
书稿经过了几轮的外部评审。大部分匿名评阅人深思熟虑而且有技巧地精准指出了改进书稿的方式。我们对匿名审稿人付出时间和精力帮助本书最后成型表示非常感谢。
特别感谢Addison-Wesley出版我们这本教科书。Matt Goldstein是一个极好的编辑,他负责本书的评阅流程,并建议我们如何修改书稿。他具有一种既能督促我们工作,又不显得傲慢的独特风格。当我们没有按计划完成任务时他表现出了极大的耐心,并对本书背后的愿景给予了毫无保留的支持。我们要感谢Marilyn Lloyd,Pearson的高级产品经理,他负责我们的教科书产品。我们还要感谢Pearson的Jeff Holcomb、Chelsea Bell和 Dan Parker。作为管理产品流程日常事务的项目经理,Aptara公司的Dennis Freee 以及Apatara公司的职员,包括Jawwad Ali Khan和Rajshri Walia,以及Write With公司的Brian Baker,都值得特别提及。他们为本书尽快生产印刷做出了贡献。
最后,我们要感谢我们的家人,他们的爱、理解与支持使我们能够持续撰写本书。补充一点,Umakishore的父亲是一位著名的小说家(笔名“Umachandran”),他著有多本小说,对他的回忆是写作本书的灵感。

上架指导

计算机\计算机组成

封底文字

传统的计算机课程体系人为地割裂了解决问题时所需技能的综合性。例如汇编语言、计算机原理、计算机系统结构、操作系统和编译原理分别从不同角度介绍了计算机的硬件和软件系统,但是随着多核系统日渐主流,这种软硬件分离的教学方法变得不切实际。
国内外大学都在这方面展开了探索,即如何用一种综合的方法来介绍计算机系统的相关内容。卡内基-梅隆大学 的《深入理解计算机系统》是目前比较成功的探索,它主要从程序员视角来讲解计算机系统,内容偏向系统软件(特别是操作系统),国内外很多大学已采用该教材作为课程的基础。而佐治亚理工学院的这本教材则是另一个有益的尝试,书中计算机系统结构和操作系统的内容基本平衡,旨在让学生了解计算机体系结构和系统软件之间的关系,为进一步深入学习计算机体系结构、操作系统和网络的高级课程或研究生课程,在这些领域进一步深造奠定良好的基础。
本书采用软硬件集成的方法,系统地讲解了计算机系统的软件和硬件知识及其相互关系。全书分为5 个模块:处理器、内存系统、存储系统、并行系统和网络,分别讨论了处理器及其相关的软件问题、内存系统和分级存储体系、I/O 和文件系统、操作系统问题及支持并行编程的多处理器中相应体系结构特点、网络硬件的发展和处理各种网络行为的网络协议栈的特点等。

译者简介

陈文光 等译:暂无简介

译者序

美国未来学家阿尔温·托夫勒在1980年3月出版了他的经典著作《第三次浪潮》,该书在全世界引起了巨大的反响。在这本书中,他将人类社会发展分为农业阶段、工业阶段和以信息时代为主要特征的后工业化社会阶段。从历史视角来看,信息化具有与工业革命等同的重要性,将重塑我们的社会结构和日常生活。
计算机是信息化的核心,随着信息化与社会生活的深度融合,人们对计算机专业毕业生的要求也越来越高。他们不仅需要掌握计算机本身的知识,还需要了解相关行业的知识。这就给计算机专业教学带来了很大的挑战,如何在有限的课时里面,能够覆盖计算机专业的核心内容,提供给学生足够的基础使其能够在所选的方向上继续深造呢?
传统的计算机课程体系有一个重要问题,就是课程人为地割裂了解决问题时所需技能的综合性。例如汇编语言、计算机原理、计算机系统结构、操作系统和编译原理分别从不同角度介绍了计算机的硬件和软件系统,但人们在面临一个具体问题的时候,比如优化一个数据分析程序时需要的技能是综合性的,需要知道高级语言程序变成了什么样的汇编语言,这些汇编语言在操作系统的调度下如何加载和运行,运行时的指令如何在处理器的流水线里乱序执行,其访存是缓存命中还是缓存缺失,并发访问是如何相互隔离的,等等。
因此,国内外大学都在这方面展开了探索,即如何用一种综合的方法来介绍计算机系统的相关内容,这样不但可以减少课时,也能让相关知识的衔接更加平滑,整体的知识体系更加系统化。CMU的《深入理解计算机系统》是目前比较成功的探索,国内外很多大学都已采用该教材作为课程的基础。我们翻译的这本书则是另一个有益的尝试。本书中计算机系统结构和操作系统的内容基本平衡,而《深入理解计算机系统》则明显偏向操作系统,对计算机系统结构的相关内容介绍相对较少。例如,本书对I/O中断处理专门安排了硬件实验,要求学生用硬件设计语言设计CPU并支持中断处理,这类实验对学生理解整个计算机系统是如何运作的非常重要,但在《深入理解计算机系统》中没有这部分内容。
我们希望本书的翻译出版,能够为国内的计算机系统教育提供一种新的选择。对希望未来研究、设计新型计算机系统的学生来说,本书提供了更加完整的基础。
本书的翻译是由我和我的学生完成的,我本人翻译了前言和第1章,汤雄超翻译了第2~4章,杨弋翻译了第5~7章,张峰翻译了第8~10章,朱晓伟翻译了第11~12章,陈力维翻译了第13章和附录。本人对全书进行了审校,因此书中的错误都应该由本人负责。
感谢机械工业出版社华章分社将这本书引入国内,感谢温莉芳副总经理、朱劼编辑和关敏编辑在本书翻译过程中给予我们的极大耐心。

陈文光
2015年6月

图书目录

出版者的话
译者序
前言
第1章 概述 1
1.1 盒子里有什么 1
1.2 计算机系统中的抽象层次 1
1.3 操作系统的作用 3
1.4 盒子里正在发生什么事 5
1.4.1 在计算机上启动应用程序 7
1.5 计算机硬件的演化 7
1.6 操作系统的演化 9
1.7 本书导读 9
练习题 10
参考文献注释和扩展阅读 10
第2章 处理器体系结构 12
2.1 处理器设计涉及什么 12
2.2 如何设计指令集 13
2.3 常见的高级语言功能集 13
2.4 表达式和赋值语句 14
2.4.1 操作数放在哪里 14
2.4.2 在指令中如何指定内存地址 17
2.4.3 每个操作数应该有多宽 18
2.4.4 字节序 19
2.4.5 操作数打包以及字操作数的对齐 21
2.5 高级数据抽象 22
2.5.1 结构 23
2.5.2 数组 23
2.6 条件语句和循环 24
2.6.1 if-then-else语句 25
2.6.2 switch语句 26
2.6.3 循环语句 27
2.7 检查点 27
2.8 编译函数调用 27
2.8.1 调用者的状态 28
2.8.2 过程调用剩余的工作 30
2.8.3 软件惯例 31
2.8.4 活动记录 35
2.8.5 递归 36
2.8.6 帧指针 36
2.9 指令集体系结构选择 38
2.9.1 额外的指令 38
2.9.2 额外的寻址模式 39
2.9.3 体系结构类型 39
2.9.4 指令格式 39
2.10 LC-2200指令集 42
2.10.1 指令格式 42
2.10.2 LC-2200寄存器组 43
2.11 影响处理器设计的问题 44
2.11.1 指令集 44
2.11.2 应用程序对指令集设计的影响 45
2.11.3 其他驱动处理器设计的问题 46
小结 47
练习题 47
参考文献注释和扩展阅读 49
第3章 处理器实现 51
3.1 体系结构与实现 51
3.2 处理器实现涉及什么 51
3.3 重要的硬件概念 52
3.3.1 电路 52
3.3.2 数据通路的硬件资源 52
3.3.3 边沿触发逻辑 53
3.3.4 连接数据通路元件 54
3.3.5 基于总线的设计 57
3.3.6 有限状态机 59
3.4 数据通路设计 60
3.4.1 ISA与数据通路宽度 61
3.4.2 时钟脉冲宽度 62
3.4.3 检查点 62
3.5 控制单元设计 62
3.5.1 ROM加状态寄存器 63
3.5.2 FETCH宏状态 65
3.5.3 DECODE宏状态 68
3.5.4 EXECUTE宏状态:ADD指令(R型指令部分) 68
3.5.5 EXECUTE宏状态:NAND指令(R型指令部分) 71
3.5.6 EXECUTE宏状态:JALR指令(J型指令部分) 71
3.5.7 EXECUTE宏状态:LW指令(I型指令部分) 72
3.5.8 EXECUTE宏状态:SW和ADDI指令(I型指令部分) 75
3.5.9 EXECUTE宏状态:BEQ指令(I型指令部分) 75
3.5.10 设计微程序中的条件分支 78
3.5.11 再谈DECODE宏状态 79
3.6 控制单元设计的另一种选择 80
3.6.1 微程序控制 80
3.6.2 硬连线控制 81
3.6.3 在两种控制设计风格中选择 82
小结 82
历史回顾 83
练习题 84
参考文献注释和扩展阅读 86
第4章 中断、陷入及异常 87
4.1 程序执行中的不连续性 88
4.2 处理程序不连续性 89
4.3 处理程序不连续性的体系结构改进 91
4.3.1 修改FSM 91
4.3.2 一个简单的中断处理过程 92
4.3.3 处理级联中断 92
4.3.4 从处理过程中返回 95
4.3.5 检查点 95
4.4 处理程序不连续性的硬件细节 96
4.4.1 中断的数据通路细节 96
4.4.2 获得处理过程地址的细节 97
4.4.3 保存/恢复栈 99
4.5 信息汇总 100
4.5.1 体系结构和硬件改进总结 100
4.5.2 工作中的中断机制 100
小结 102
练习题 103
参考文献注释和扩展阅读 104
第5章 处理器性能与流水线处理器的设计 105
5.1 时间和空间性能指标 105
5.2 指令频率 107
5.3 基准测试程序 108
5.4 提升处理器的性能 111
5.5 加速比 112
5.6 提升处理器的吞吐量 114
5.7 流水线简介 115
5.8 指令处理流水线 115
5.9 简单指令流水线的问题 117
5.10 修正指令流水线里的问题 118
5.11 指令流水线的数据通路元件 120
5.12 针对流水线的体系结构与实现 121
5.12.1 指令穿过流水线的过程
         详解 122
5.12.2 流水线寄存器的设计 124
5.12.3 各个阶段的实现 125
5.13 冒险 125
5.13.1 结构性冒险 126
5.13.2 数据冒险 126
5.13.3 控制冒险 135
5.13.4 冒险总结 141
5.14 在流水线处理器里处理程序
      不连续性 142
5.15 处理器设计的高级话题 144
5.15.1 指令级并行 144
5.15.2 更深的流水线 145
5.15.3 在乱序执行下再次讨论
       程序不连续性 147
5.15.4 管理共享资源 148
5.15.5 功耗 149
5.15.6 多核处理器设计 149
5.15.7 Intel Core微架构:
       一个流水线 150
小结 151
历史回顾 152
练习题 152
参考文献注释和扩展阅读 156
第6章 处理器调度 157
6.1 引言 157
6.2 程序和进程 158
6.3 调度环境 161
6.4 调度基础 162
6.5 性能指标 165
6.6 非抢占式调度算法 167
6.6.1 先到先服务 167
6.6.2 最短作业优先 170
6.6.3 优先级 171
6.7 抢占式调度算法 172
6.7.1 轮转调度器 175
6.8 结合优先级和抢占 178
6.9 元调度器 178
6.10 评价 179
6.11 调度对处理器体系结构的影响 180
小结和展望 181
Linux调度器—一个案例研究 181
历史回顾 183
练习题 185
参考文献注释和扩展阅读 186
第7章 内存管理技术 187
7.1 内存管理器提供的功能 187
7.2 内存管理的简单方案 189
7.3 内存分配方案 192
7.3.1 固定尺寸分区 192
7.3.2 变长分区 193
7.3.3 缩并 195
7.4 分页虚拟内存 196
7.4.1 页表 197
7.4.2 支持分页的硬件 199
7.4.3 页表的建立 199
7.4.4 虚拟和物理内存的相对大小 200
7.5 分段虚拟内存 200
7.5.1 支持分段的硬件 204
7.6 分页和分段的比较 204
7.6.1 解读CPU生成的地址 206
小结 207
历史回顾 208
MULTICS 209
Intel的内存体系结构 210
练习题 211
参考文献注释和扩展阅读 212
第8章 页式内存管理 213
8.1 按需分页 213
8.1.1 按需分页的硬件 213
8.1.2 页错误处理程序 214
8.1.3 按需分页内存管理的
      数据结构 214
8.1.4 页错误解析 215
8.2 进程调度器和内存管理器间交互 217
8.3 页替换策略 218
8.3.1 Belady的Min算法 219
8.3.2 随机替换 219
8.3.3 先进先出策略 219
8.3.4 最近最少使用策略 221
8.3.5 第二次机会页替换算法 223
8.3.6 页替换算法回顾 225
8.4 优化内存管理 225
8.4.1 空闲页帧池 225
8.4.2 颠簸 226
8.4.3 工作集 228
8.4.4 颠簸控制 229
8.5 其他考虑 229
8.6 旁路转换缓存 230
8.6.1 TLB的地址转换 231
8.7 内存管理的高级话题 232
8.7.1 多级页表 232
8.7.2 局部页表项的访问权限 234
8.7.3 反向页表 234
小结 234
练习题 234
参考文献注释和扩展阅读 236
第9章 分级存储体系 237
9.1 缓存的概念 238
9.2 局部性原理 238
9.3 基本术语 238
9.4 多级存储层次 239
9.5 缓存结构 241
9.6 直接映射缓存结构 241
9.6.1 缓存查找 243
9.6.2 缓存项中的字段 244
9.6.3 用于直接映射缓存的硬件 245
9.7 流水线处理器设计的影响 247
9.8 缓存读/写算法 247
9.8.1 CPU对缓存的读访问 248
9.8.2 CPU对缓存的写访问 248
9.9 处理器流水线中的缓存缺失处理 251
9.9.1 在流水线性能上缓存缺失
      对内存延迟的影响 252
9.10 利用空间局部性提高缓存性能 253
9.10.1 增加块大小对性能的影响 256
9.11 灵活的布局策略 257
9.11.1 全相关缓存 258
9.11.2 组相关缓存 259
9.11.3 组相关的极端情况 261
9.12 指令和数据缓存 263
9.13 降低缺失损失 264
9.14 缓存替换策略 264
9.15 缺失类型简要说明 266
9.16 TLB和缓存整合 268
9.17 缓存控制器 269
9.18 虚拟索引物理标记的缓存 270
9.19 缓存设计因素概述 271
9.20 主存的设计因素 272
9.20.1 简单的主存 272
9.20.2 与缓存块大小相匹配的主
       存和总线 273
9.20.3 交错式内存 273
9.21 现代主存系统分析 274
9.21.1 页式DRAM 278
9.22 分级存储体系的性能影响 279
小结 280
现代处理器的分级存储体系(一个例子) 281
练习题 281
参考文献注释和扩展阅读 283
第10章 输入/输出和稳定性存储 284
10.1 CPU和I/O设备间的通信 284
10.1.1 设备控制器 284
10.1.2 内存映射I/O 285
10.2 程控I/O 287
10.3 DMA 288
10.4 总线 290
10.5 I/O处理器 291
10.6 设备驱动 292
10.6.1 例子 293
10.7 外围设备 295
10.8 磁盘存储器 296
10.8.1 磁盘技术的传奇故事 302
10.9 磁盘调度算法 304
10.9.1 先到先服务 305
10.9.2 最短寻道时间优先 305
10.9.3 SCAN 305
10.9.4 C-SCAN 306
10.9.5 LOOK和C-LOOK 307
10.9.6 磁盘调度总结 307
10.9.7 算法比较 308
10.10 固态硬盘 309
10.11 I/O总线和设备驱动的演化 310
10.11.1 设备驱动的动态负载 311
10.11.2 信息汇总 312
小结 314
练习题 314
参考文献注释和扩展阅读 315
第11章 文件系统 317
11.1 属性 317
11.2 在磁盘子系统上实现文件系统
      的设计选择 321
11.2.1 连续分配 322
11.2.2 带有溢出区域的连续分配 324
11.2.3 链接分配 324
11.2.4 文件分配表 325
11.2.5 索引分配 327
11.2.6 多级索引分配 328
11.2.7 混合索引分配 328
11.2.8 不同分配策略的比较 331
11.3 信息汇总 331
11.3.1 索引节点 336
11.4 文件系统的组件 336
11.4.1 创建、写入文件的剖析 337
11.5 各种子系统的交互 337
11.6 文件系统在物理媒介上的布局 340
11.6.1 内存中的数据结构 342
11.7 处理系统崩溃 343
11.8 其他物理媒介上的文件系统 343
11.9 现代文件系统一览 344
11.9.1 Linux 344
11.9.2 Microsoft Windows 348
小结 349
练习题 350
参考文献注释和扩展阅读 352
第12章 多线程编程与多处理器 353
12.1 为什么需要多线程 353
12.2 线程所需的编程支持 354
12.2.1 线程创建和终止 354
12.2.2 线程之间的通信 356
12.2.3 读/写冲突、竞争条件及不确定性 357
12.2.4 线程之间的同步 361
12.2.5 线程库中数据类型的内部表示 365
12.2.6 简单的编程示例 366
12.2.7 死锁和活锁 369
12.2.8 条件变量 370
12.2.9 视频处理示例的完整解决方案 373
12.2.10 解决方案的讨论 374
12.2.11 重新检查条件 375
12.3 线程函数调用和多线程编程概念总结 377
12.4 线程编程的一些注意事项 379
12.5 使用线程作为软件结构抽象 379
12.6 POSIX pthread库调用总结 379
12.7 操作系统对线程的支持 382
12.7.1 用户级线程 383
12.7.2 内核级线程 385
12.7.3 Solaris线程:一个内核级线程例子 386
12.7.4 线程和库 387
12.8 在单处理器上的多线程的硬件支持 388
12.8.1 线程创建、终止以及线程间的通信 388
12.8.2 线程之间的同步 388
12.8.3 原子的Test-and-Set指令 388
12.8.4 使用Test-and-Set指令的Lock算法 390
12.9 多处理器 391
12.9.1 页表 391
12.9.2 分级存储体系 391
12.9.3 保证原子性 393
12.10 高级话题 393
12.10.1 操作系统话题 393
12.10.2 架构话题 403
12.10.3 未来之路:多核与众核架构 412
小结 413
历史回顾 414
练习题 415
参考文献注释和扩展阅读 417
第13章 网络与网络协议基础知识 419
13.1 预备知识 419
13.2 基本术语 419
13.3 网络软件 423
13.4 协议栈 424
13.4.1 因特网协议栈 424
13.4.2 OSI模型 426
13.4.3 分层的实际问题 427
13.5 应用层 427
13.6 传输层 428
13.6.1 停止并等待协议 429
13.6.2 流水线协议 431
13.6.3 可靠的流水线协议 432
13.6.4 处理传输错误 436
13.6.5 因特网上的传输协议 437
13.6.6 传输层总结 438
13.7 网络层 439
13.7.1 路由算法 439
13.7.2 因特网寻址 444
13.7.3 网络服务模式 446
13.7.4 网络路由与转发 449
13.7.5 网络层总结 450
13.8 链路层和局域网 450
13.8.1 以太网 451
13.8.2 CSMA/CD 451
13.8.3 IEEE 802.3 453
13.8.4 无线局域网与IEEE 802.11 453
13.8.5 令牌环 454
13.8.6 其他链路层协议 456
13.9 网络硬件 456
13.10 协议栈各层之间的关系 460
13.11 用于数据包传输的数据结构 460
13.11.1 TCP/IP包头 461
13.12 消息传输时间 462
13.13 协议层功能总结 466
13.14 网络软件与操作系统 466
13.14.1 套接字库 467
13.14.2 在操作系统中实现协议栈 468
13.14.3 网络设备驱动程序 468
13.15 使用UNIX套接字进行网络编程 469
13.16 网络服务与高层协议 474
小结 475
历史回顾 475
练习题 480
参考文献注释和扩展阅读 482
第14章 尾声:旅途回顾 483
14.1 处理器设计 483
14.2 进程 483
14.3 虚拟内存系统和内存管理 483
14.4 分级存储体系 484
14.5 并行系统 484
14.6 输入/输出系统 484
14.7 永久性存储 484
14.8 网络 485
结束语 485
附录A 使用UNIX套接字进行网络编程 486
参考文献 495
索引 500

教学资源推荐
作者: Kunle Olukotun Lance Hammond James Laudon
作者: (加)Carl Hamacher女皇大学 Zvonko Vranesic多伦多大学 Safwat Zaky多伦多大学 Naraig Manjikian女皇大学 著
作者: [美] 爱德华·阿什福德·李(Edward Ashford Lee) 桑吉特·阿伦库马尔·塞希阿(Sanjit Arunkumar Seshia) 著
参考读物推荐
作者: 国际商业机器中国有限公司
作者: (美)Elecia White 著
作者: 汪文祥 邢金璋 著
作者: [丹麦]克劳斯·埃尔克(Klaus Elk) 著