R语言经典实例
作者 : (美)Paul Teetor 著
译者 : 李洪成 朱文佳 沈毅诚 译
出版日期 : 2013-05-02
ISBN : 978-7-111-42021-7
定价 : 79.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 423
开本 : 16
原书名 : R Cookbook
原出版社: OReilly Microsoft
属性分类: 教材
包含CD :
绝版 :
图书简介

本书通过200多个应用实例,阐明了如何用R快速、有效地进行数据分析。主要内容包括软件安装和帮助、基础知识、软件导航、输入输出、数据结构、数据变换、字符串和日期、概率、一般统计、图形、线性回归和ANOVA、实用技巧、时间序列分析等。R语言功能强大,可以帮你处理一切统计工作,但是其结构却不容易掌握,本书通过简洁的、面向任务的案例,可以帮助读者快速利用R解决实际问题。

图书特色

本书涵盖200多个R语言实用方法,可以帮助读者快速而有效地使用R进行数据分析。R语言给我们提供了统计分析的一切工具,但是R本身的结构可能有些难于掌握。本书提供的这些面向任务、简明的R语言方法包含了从基本的分析任务到输入和输出、常用统计分析、绘图、线性回归等内容,它们可以让你马上应用R高效地工作。
  每一个R语言方法都专注于一个特定的问题,随后的讨论则对问题的解决方案给出解释,并阐释该方法的工作机理。对于R的初级用户,本书将帮助你步入R的殿堂;对于R的资深用户,本书将加深你对R的理解并拓展你的视野。通过本书,你可以使你的分析工作顺利完成并学习更多R语言知识。

本书主要内容:
■ 建立向量,处理变量,以及执行其他基本函数。
■ 数据的输入和输出。
■ 处理矩阵、列表、因子和数据框等数据结构。
■ 分析概率、概率分布和随机变量。
■ 计算统计量和置信区间,进行统计检验。
■ 创建各种图形。
■ 构建线性回归和方差分析(ANOVA)等统计模型。
■ 探索高级统计技术,如聚类分析等。
Paul Teetor是一位定量分析专家,他曾获统计学硕士学位和计算机科学硕士学位。他擅长投资管理、证券交易和风险管理等领域的分析与软件工程。

“本书不仅是一本解决方案手册,也提供了一种真正令人愉悦的学习R的方法——每次给出一个实际的例子,非常容易阅读!”
    ——Jeffrey Ryan 
   软件咨询专家和R添加包作者
  “带着95%的信心,我不能拒绝 ‘本书是学习、应用R中的统计功能的最好的教材’这一结论。”
    —— JD Long CerebralMastication.com上的R博客作者

图书前言

R软件是进行统计分析、绘图和统计编程的强大工具。现在成千上万的人用它来进行日常的重要统计分析。R软件是一个自由、开源的软件平台,它是许多聪明、勤奋工作的人们集体工作的成果。R软件有超过两千多个软件包插件。R软件是其他所有商业统计软件包的强劲竞争对手。
但是,开始使用R软件可能感到无从下手。对于许多任务,即便是一些基本的任务,R的实现也不是很明显。当了解了R的使用方法后,简单的问题自然能得心应手地解决,但学习“如何”使用R的过程有时会让人感到发狂。
本书介绍了如何使用R软件的一些方法,其中每一个方法对应解决某个特定的问题。介绍这些方法的途径是这样的:首先给出待解决的问题,然后给出解决方案的简单介绍,之后再给出对解决方案的讨论,深入剖析解决方案,给出该方案的原理。我知道这些方法有效实用,我也知道这些方法可行,因为我本人也使用它们。
这些方法所涉及的范围较为广泛。首先从基本的任务开始介绍,然后介绍数据的输入和输出、基础统计、绘图以及线性回归。与R有关的工作都将或多或少地涉及本书介绍的方法。
通过本书的讲解,初学者能快速地了解R并获得提高。如果你对R软件有一定的了解,那么本书也能帮助你巩固已学的知识,拓宽你的思维(例如,“下一次我应该怎么使用K-S检验”)。
从严格意义上来说,本书并不是一本关于R软件的教程,但你将会从中学习到许多R软件的应用技巧。本书也不是一本关于R的参考手册,但它确实包含了许多实用的内容。本书也不是一本R软件的编程指南,但书中很多方法都可以应用到R的编程脚本中。
最后,本书不是统计学理论的参考书。本书假设读者对统计理论和方法有一定的了解,他们需要知道的是如何在R软件中实现。
方法
本书介绍的大部分方法,都是由一两个R函数命令来解决某一特定问题。需要注意的是,书中不会对某一函数的全部功能进行详细解释,而是仅仅介绍那些为了解决某个问题所需要涉及的函数功能。R软件中几乎所有的函数都远远不止本书中所介绍的这些功能,其中有的函数具有更强大的功能。因此强烈建议读者阅读这些函数的帮助页面,你可能会从中得到不少收获。
每个方法都为读者提供了解决某个问题的一条途径。当然对于每个问题有可能存在多个正确的解决方案。在这种情况下,我一般会选择最为简单的方法介绍。对于书中给出的任何问题,你自己或许可以找到其他一些解决方案。本书着重介绍解决问题的方法,类似“菜谱”书,不是R软件的大全书籍。
尤其是,R软件有大量的可添加包,这几千个R软件包都可以通过网络下载的方式得到。这些包中含有许多替代算法和统计方法。本书侧重于R基础发布版所带的核心功能,因此你可以从其他的R添加包中找到相关的替代方案(参见方法1.11)。
对术语的说明
每个方法旨在迅速地解决问题,而非长篇大论地进行叙述。因此我可能会采用一些术语来简化相关内容的解释,这些术语有时候可能不精确,但是正确的。比如对于“泛型函数”一词。我把函数print(x)和函数plot(x)称为泛型函数,原因是它们能适当地处理多种输入参数x。计算机学家可能会质疑这一术语,因为严格地说这些都不是简单的“函数”,它们是多态方法并且动态调度。但是,如果我仔细地精确定义所有这样的技术细节,那么关键的解决方案将会埋没于这些细枝末节的技术问题中。所以为了便于阅读,我就将它们称为函数。
另一个例子是统计学中假设检验所用语义的严格性。若使用概率论的严格定义,就会使读者难以清晰理解这些检验的实际应用,所以我以更通俗的语言描述各个统计检验。更多有关假设检验方法的细节请查看第9章的简介。
我的目标是用通俗易懂而非严格的正式语言,让R软件能被更多的读者所理解和接受。因此希望各个领域的专家对于我所给出的某些并不严谨的术语定义予以谅解。

软件及平台说明
虽然R软件时常进行有计划的版本更新,但其语言定义和核心实现是稳定的。本书所介绍的方法将适用于基础发布版的任何最新版本。
有些方法对于操作平台有特殊的要求,我会在文中对其加以标注,这些方法大多数是一些有关软件本身的问题,如程序的安装和配置。据我所知,书中的其他所有方法都能在R的三个主要平台中得到兼容,即Windows、OS X和Linux / UNIX。
其他资源
网络
R项目网站(http://www.r-project.org)汇集了所有R软件的相关资源。从中可以下载R程序代码、R添加包、文档、源代码以及许多其他资源。
除了R项目网站以外,我建议使用一个针对R软件的搜索引擎,比如Sasha Goodman 开发的Rseek搜索引擎(http://rseek.org)。也可以使用谷歌这样的通用搜索引擎,但在搜索“R”搜索词时可能会得到许多无关的搜索结果。更多有关网络搜索的细节参见方法1.10。
浏览博客也是学习R软件和掌握相关R最新动态的一种有效方式。网络中存在许多这样的博客,我推荐其中两个:Tal Galili的R-bloggers(http://www.r-bloggers.com/)和PlanetR的(http://planetr.stderr.org)。可以通过订阅他们的网站了解许多相关网站上有趣且实用的文章。
R软件参考书籍
市面上有许多学习和应用R软件的书籍。下面列出一些我发现会有帮助的R软件教程。R项目网站收录并编制了大量与R相关的书目(http://www.r-project.org/doc/bib/R-books.html)。我所推荐的书目有:
Network Theory Limited出版的《An Introduction to R》,作者是William Venables等。该书涵盖了许多对初学者很有帮助的知识。可以通过CRAN网站免费下载该书的PDF版本(http://cran.r-project.org/doc/manuals/R-intro.pdf),或者推荐购买纸质书籍,此书所获利润将捐赠给R项目。
O扲eilly公司出版的《R in a Nutshell》(http://oreilly.com/catalog/978059680717),该书的作者是Joseph Adler,此书可以随时作为你R软件的使用参考,并且它比本书涵盖了更多的内容。
任何应用R绘制正式图形的工作都可以参考《R Graphics》一书,该书的作者为Paul Murrel(Chapman & Hall/CRC)。根据应用的R图形包的不同,也可以参考《Lattice:Multivaritate Data Visualiation with R》,作者为Deepayan Sarkar,由Springer出版社出版;《ggplot2: Elegant Graphics for Data Analysis》,作者为Hadley Wickham,由Springer公司出版。
《Modern Appied Statistic With S(4th ed.)》, 作者为William Venables等,由Springer公司出版。该书采用S软件来说明一些高级的统计技术。该书所涉及的函数和数据可通过下载R软件标准发布版MASS获得。
市面上定期会有关于R编程的新书出版,但我并不提倡不加区分地选择。关于R软件编程,我推荐《R in a Nutshell》和William Venables与Brian Ripley等的《S Programming》(Springer)。我还推荐下载《R Language Definition》一书(http://cran.r-project.org/doc/manuals/R-lang.pdf),通过它可以解决许多R软件编程中遇到的细节问题。
统计学书籍
在你学习的过程中需要一本好的统计学参考书作为指导,它可以帮助你准确地理解在R中进行的统计检验。目前市面上有许多优秀的统计学参考书,因此我所推荐的书很难说这本比那本更优秀。
由John Verzani编写的《Using R for Introductory Statistic》(Chapman & Hall/CRC),是一本优秀的统计学教材。它结合统计学与R软件,讲述应用统计方法的一些必要的计算机技巧(http://www.r-project.org/doc/bib/R-books.html)。
越来越多的统计学作者选择R软件来讲述相应的统计方法。某一特定专业领域的工作者可以在R项目网站收录的书目中寻找所需要的书籍。
本书约定
在本书中使用以下排版方式:
斜体(Italic)
此类字体表示新出现的术语、网址、电子邮件地址、文件名、文件扩展名等。
等宽字体(Constant width)
此类字体用于程序清单,以及正文中出现的程序元素(如变量名或函数名、数据库名、数据类型、环境变量、程序语句、关键字等)。
等宽粗体(Constant width bold)
此类字体表示读者需要完整无误地输入该文本给出的指令或其他文字。
等宽斜体(Constant width italic)
此类字体表示读者应提供用户指定的值来替换这里的文字,或者根据上下文给出的值来替换这里的文本。
注意: 表示作者给出的提示、建议或标记内容。
警告: 表示读者阅读时要特别注意和慎重的内容。
代码示例的规定
本书内容旨在帮助读者完成工作。一般情况下,你都可以不受限制地在程序和文档中使用本书中的代码,除非你要复制本书中的大部分代码。例如,你可随意使用本书中的代码来编写程序,或者通过引用书中的案例和代码来解决一个问题,这都不需要获得许可。若将O扲eilly公司出版的书中的例子制成CD来销售或发行,或者引用书中大量的案例和代码作为自己产品的文档,则需要获得我们的许可。
我们希望但并不强制你在引用本书的内容时,说明引文的文献出处。一般标准的文献出处格式包括:标题,作者,出版商和ISBN号。例如:《R Cookbook》by Paul Teetor. Copyright 2011 Paul Teetor, 978-0-596-80915-7。
如果你对你所引用的本书代码和案例是否属于合理使用范围之内有所疑惑,可通过邮箱permissions@oreilly.com联系我们。
联系我们
有关本书的任何建议和疑问,可以通过下列方式与我们取得联系:
美国:
O扲eilly Media, Inc.
1005 Gravenstein Highway North
Sebastopol, CA 95472
中国:
北京市西城区西直门南大街2号成铭大厦C座807室(100035)
奥莱利技术咨询(北京)有限公司
要评论或询问本书的技术问题,请发送电子邮件到:
bookquestions@oreilly.com
有关我们的书籍、会议、资源中心以及O扲eilly网络,可以访问我们的网站:
http://www.oreilly.com
http://www.oreilly.com.cn
本书专设如下网站,我们会在其中公布书中的勘误、示例和其他附加信息。
http://www.oreilly.com/catalog/9780596809157。
对本书有任何疑问或意见,欢迎发送邮件到:
bookquestions@oreilly.com。
更多信息请访问我们的网站http://oreilly.com。
Facebook: http://facebook.com/oreilly。
Twitter: http://twitter.com/oreillymedia。
YouTube: http://www.youtube.com/oreillymedia。
致谢
我要对整个R社区,尤其是R软件的核心开发团队表示衷心感谢。他们的无私付出对世界统计学的贡献巨大。
我要感谢本书的技术审校者:James D. Long、Timothy McMurry、David Reiner、Jeffery Ryan和John Verzani。同时感谢Joe Adler给予本书的意见。他们做出的反馈对于本书得以有高质量、严谨并且实用的内容至关重要。他们的意见也帮助我节省了许多时间,避免了我传播错误的内容。
Mike Loukides是一位出色的编辑,我在此深深感谢他的智慧和指导。开始本书的项目时有人宣称Mike是出版行业里最棒的编辑,现在我完全相信这一事实。
我要对我的妻子Anna表达最大的谢意。她的支持使本书出版成为可能。她的参与使得编写本书的过程充满快乐。

上架指导

数学\统计学

封底文字

“本书令人难以置信地容易阅读。本书不仅是一本解决方案手册,也提供了一种真正愉悦的学习R的方法――每次给出一个实际的例子。”
Jeffrey Ryan 软件咨询专家 R添加包作者
“带着95%的信心,我不能拒绝‘本书是学习、应用R中的统计功能的最好的教材’这一结论。”
JDLong 在CerebralMastication.com上的R博客

本书有200多个R的方法集锦,它们可以帮助R用户快速而有效地进行数据分析。R语言给我们提供了统计分析的一切工具,但是R本身的结构可能有些难于掌握。本书提供的这些面向任务、简明的R方法集锦包含了从基本的分析任务到输入和输出、常用统计分析、绘图、线性回归等内容,它们可以让你马上应用R高效地工作。
每一个方法都专注于一个特定的问题,随后的讨论则对问题的解决方案给出解释,并阐释该方法的工作机理。对于R的初级用户,本书将帮助你步入R的殿堂;对于R的资深用户,本书将加深你对R的理解并拓展你的视野。通过本书,你可以使你的分析工作顺利完成并学习更多R的知识。
主要内容包括:
建立向量,处理变量,执行其他基本函数。
数据的输入和输出。
处理矩阵、列表、因子和数据框等数据结构。
分析概率、概率分布和随机变量。
计算统计量和置信区间,进行统计检验。
创建各种图形。
构建线性回归和方差分析(ANOVA)等统计模型。
探索高级统计技术,例如聚类分析等。

作者简介

(美)Paul Teetor 著:Paul Teetor是一位定量分析专家,他曾获统计学硕士和计算机科学硕士。他从事投资管理、风险交易和风险管理等领域的分析与软件工程。

译者简介

李洪成 朱文佳 沈毅诚 译:暂无简介

译者序

本书的英文版从出版后就在亚马逊美国网站上收到了极高的评价。机械工业出版社以极快的速度引进这本书的中文版,使国内读者在原版出版一年左右的时间里读到中文版,不得不赞扬他们独到的眼光。这本书中文稿完成的时候(2012年6月),其英文版的销量还是排在专业书籍的前列,并稳居生物信息学类书籍的第一位,排在建模和仿真类书籍的第7位。
  本书的作者Paul Teetor是一位统计学专家和计算机专家,他同时也是一位量化投资分析和风险管理专家。他和大芝加哥地区的对冲基金、投资组合经理一起工作,因此有丰富的投资量化分析经验。他把R软件用户在学习和应用R软件中常见的问题进行系统整理和总结,汇集成了本书。书中涵盖了从R软件的基础知识(安装、帮助系统、解决实际问题的途径、R数据结构、R编程、R的输入和输出等)到用R进行数据分析的具体方法(数据变换、概率和统计基础、R绘图、回归分析和方差分析、R常用技巧、高级数据分析方法和时间序列分析等)。全书以问题、解决方案和对解决方案的讨论与拓展为主线来组织内容。读者既可以把本书作为学习R的一本优秀教材,也可以根据自己的需要参考书中的某些具体方法,找到自己实际问题的解决方案。
  R本身是一款十分优秀的统计分析软件,R的书籍和文档也是相当多的。但是缺乏一本适合R初学者的书籍,尤其是针对那些对R不甚精通但是急切需要用R来解决问题的R用户。本书以问题和解决方案的形式组织内容,脉络清晰,读者很容易找到自己需要的内容。不管是R初学者,还是熟练的R用户都能从书中找到对自己有用的内容。
  本书的译者从2003年年初接触R,那时国内几乎没有多少R用户。现在情况发生了极大的变化,R成为数据分析从业者谈论最多的软件之一,许多学校的统计系在教学中也广泛地应用R。从2008年开始,国内的R用户每年召开R用户大会,大力传播和推广R。从2011年开始国内出版社也开始出版和引进R书籍,这对国内R的推广都起到了极大的作用。
  在本书的翻译过程中,得到了原作者Paul Teetor的大力帮助,他解答了译者在翻译过程中遇到的各种问题。美国统计教育学院Statistics.com是目前世界上开设R在线课程最多的机构,十分感谢他们的总裁彼得·布如斯先生欣然为本书中文版作序。另外,十分感谢机械工业出版社的王春华老师的大力支持和帮助,感谢盛思源编辑对本书一丝不苟的校对与检查。本书的翻译工作由李洪成、朱文佳和沈毅诚共同完成,由于水平所限,中间可能会有翻译不当之处,希望读者多加指正。
——李洪成

图书目录

前言 1
第1章 R入门和获得帮助 7
1.1 下载和安装R软件 8
1.2 开始运行R软件 10
1.3 输入R命令 13
1.4 退出R 15
1.5 中断R正在运行的程序 16
1.6 查看帮助文档 17
1.7 获取函数的帮助文档 18
1.8 搜索帮助文档 20
1.9 查看R软件包帮助信息 21
1.10 通过网络获取帮助 23
1.11 寻找相关函数与数据包 26
1.12 查询邮件列表 27
1.13 向邮件列表提交问题 27
第2章 基础知识 30
2.1 显示内容 30
2.2 设定变量 32
2.3 列出所有变量 34
2.4 删除变量 35
2.5 生成向量 36
2.6 计算基本统计量 37
2.7 生成数列 40
2.8 向量比较 42
2.9 选取向量中的元素 43
2.10 向量的计算 46
2.11 运算符优先级问题 48
2.12 定义函数 50
2.13 减少输入,得到更多命令 52
2.14 常见错误 54
第3章 R软件导览    58
3.1 获取和设定工作目录 58
3.2 保存工作空间 59
3.3 查看历史命令记录 60
3.4 保存先前命令产生的结果 60
3.5 显示搜索路径 61
3.6 使用R包中的函数 62
3.7 使用R的内置数据集 64
3.8 查看已安装的R包列表 65
3.9 从CRAN网站安装R包 67
3.10 设定默认CRAN网站镜像 69
3.11 隐藏启动信息 70
3.12 运行脚本 70
3.13 批量运行R代码 71
3.14 获取和设定环境变量 74
3.15 找到R的主目录 75
3.16 R的客户化 76
第4章 输入与输出 80
4.1 使用键盘输入数据 81
4.2 显示更少的位数(或更多的位数) 82
4.3 将输出结果重定向到某一文件 84
4.4 显示文件列表 85
4.5 解决无法在Windows中打开文件的问题 86
4.6 阅读固定宽度数据记录 87
4.7 读取表格数据文件 88
4.8 读取CSV文件 90
4.9 写入CSV文件 92
4.10 从网络中读取表格或CSV格式数据 93
4.11 读取HTML表格数据 94
4.12 读取复杂格式数据文件 96
4.13 读取MySQL数据库中的数据 100
4.14 保存和传送目标 102
第5章 数据结构 104
5.1 对向量添加数据 111
5.2 在向量中插入数据 112
5.3 理解循环规则 113
5.4 构建因子(即分类变量) 115
5.5 将多个向量合并成单个向量以及平行因子 117
5.6 创建列表 118
5.7 根据位置选定列表元素 119
5.8 根据名称选定列表元素 121
5.9 构建一个名称/值关联表 122
5.10 从列表中移除元素 124
5.11 将列表转换为向量 125
5.12 从列表中移除取值为空值(即NULL)的元素 126
5.13 使用条件来移除列表元素 127
5.14 矩阵初始化 129
5.15 执行矩阵运算 130
5.16 将描述性名称赋给矩阵的行和列 131
5.17 从矩阵中选定一行或一列 132
5.18 用列数据初始化数据框 133
5.19 由行数据初始化数据框 134
5.20 添加行至数据框 136
5.21 预分配数据框 137
5.22 根据位置选择数据框的列 138
5.23 根据列名选定数据框的列 142
5.24 更便捷地选定行和列 143
5.25 修改数据框的列名 145
5.26 编辑数据框 146
5.27 从数据框中移除NA值 148
5.28 根据名称排除列 149
5.29 合并两个数据框 150
5.30 根据共有列合并数据框 151
5.31 更便捷地访问数据框内容 152
5.32 基本数据类型之间的转换 154
5.33 不同结构化数据类型间的转换 156
第6章 数据转换 159
6.1 向量分组 160
6.2 将函数应用于每个列表元素 161
6.3 将函数应用于每行 163
6.4 将函数应用于每列 164
6.5 将函数应用于组数据 166
6.6 将函数应用于行组 168
6.7 将函数应用于平行向量或列表 170
第7章 字符串和日期 172
7.1 获取字符串长度 174
7.2 连接字符串 175
7.3 提取子串 176
7.4 根据分隔符分割字符串 176
7.5 替代子串 178
7.6 查看字符串中的特殊字符 179
7.7 生成字符串的所有成对组合 179
7.8 得到当前日期 181
7.9 转换字符串为日期 181
7.10 转换日期为字符串 182
7.11 转化年、月、日为日期 183
7.12 得到儒略日期 185
7.13 提取日期的一部分 185
7.14 创建日期序列 187
第8章 概率 189
8.1 计算组合数 191
8.2 生成组合 192
8.3 生成随机数 193
8.4 生成可再生的随机数 194
8.5 生成随机样本 196
8.6 生成随机序列 197
8.7 随机排列向量 198
8.8 计算离散分布的概率 198
8.9 计算连续分布的概率 200
8.10 转换概率为分位数 201
8.11 绘制密度函数 203
第9章 统计概论 206
9.1 汇总数据 208
9.2 计算相对频数 210
9.3 因子制表和列联表创建 211
9.4 检验分类变量独立性 212
9.5 计算数据集的分位数(和四分位数) 212
9.6 求分位数的逆 213
9.7 数据转换为z分数 214
9.8 检验样本均值(t检验) 215
9.9 均值的置信区间 216
9.10 中位数的置信区间 217
9.11 检验样本比例 218
9.12 比例的置信区间 219
9.13 检验正态性 220
9.14 游程检验 222
9.15 比较两个样本的均值 223
9.16 比较两个非参数样本的位置 225
9.17 检验相关系数的显著性 226
9.18 检验组的等比例 228
9.19 组均值间成对比较 229
9.20 检验两样本的相同分布 230
第10章 图形 232
10.1 创建散点图 234
10.2 添加标题和标签 236
10.3 添加网格 237
10.4 创建多组散点图 238
10.5 添加图例 240
10.6 绘制散点图的回归线 242
10.7 多变量散点图的绘制 243
10.8 创建每个因子水平的散点图 244
10.9 创建条形图 246
10.10 对条形图添加置信区间 248
10.11 给条形图上色 249
10.12 绘制过点x和y的线 251
10.13 改变线的类型、宽度或者颜色 253
10.14 绘制多个数据集 254
10.15 添加垂直线和水平线 256
10.16 创建箱线图 257
10.17 对每个因子水平创建箱线图 258
10.18 创建直方图 259
10.19 对直方图添加密度估计 261
10.20 创建离散直方图 262
10.21 创建正态Q-Q图 264
10.22 创建其他Q-Q图 265
10.23 用多种颜色绘制变量 266
10.24 绘制函数 269
10.25 图形间暂停 270
10.26 在一页中显示多个图形 271
10.27 打开另一个图形窗口 273
10.28 在文档中绘制图形 274
10.29 改变图形参数 275
第11章 线性回归和方差分析 277
11.1 简单线性回归 279
11.2 多元线性回归 281
11.3 得到回归统计量 282
11.4 理解回归的汇总结果 286
11.5 运行无截距的线性回归 289
11.6 运行有交户项的线性回归 290
11.7 选择最合适的回归变量 292
11.8 对数据子集回归 295
11.9 在回归公式中使用表达式 296
11.10 多项式回归 298
11.11 转换数据的回归 299
11.12 寻找最佳幂变换 301
11.13 回归系数的置信区间 304
11.14 绘制回归残差 304
11.15 诊断线性回归 306
11.16 识别有影响的观察值 309
11.17 残差自相关检验 310
11.18 预测新值 311
11.19 建立预测区间 312
11.20 运行单因素方差分析 313
11.21 创建交互关系图 315
11.22 找到组间均值的不同 316
11.23 执行稳健方差分析 318
11.24 运用方差分析比较模型 320
第12章 有用的方法 323
12.1 查看你的数据 323
12.2 拓宽你的输出 324
12.3 输出赋值结果 325
12.4 对行和列求和 325
12.5 按列输出数据 326
12.6 对数据分级 328
12.7 找到特定值的位置 329
12.8 每隔n个选定一个向量元素 330
12.9 找到成对的最小值或者最大值 331
12.10 生成多个因子的组合 332
12.11 转换一个数据框 333
12.12 对数据框排序 334
12.13 对两列排序 335
12.14 移除变量属性 336
12.15 显示对象的结构 337
12.16 代码运行时间 340
12.17 抑制警告和错误消息 341
12.18 从列表中提取函数参数 342
12.19 定义你自己的二元运算符 344
第13章 高级数值分析和统计方法 347
13.1 最小化或者最大化一个单参数函数 347
13.2 最小化或者最大化多参数函数 348
13.3 计算特征值和特征向量 350
13.4 主成分分析 351
13.5 简单正交回归 352
13.6 数据的聚类 354
13.7 预测二元变量(逻辑回归) 357
13.8 统计量的自助法 359
13.9 因子分析 361
第14章 时间序列分析 366
14.1 表示时间序列 367
14.2 绘制时序图 370
14.3 提取最老的观测值或者最新的观测值 373
14.4 选取时间序列的子集 374
14.5 合并多个时间序列 376
14.6 缺失时间序列的填充 378
14.7 时间序列的滞后 380
14.8 计算逐次差分 381
14.9 时间序列相关的计算 382
14.10 计算移动平均 383
14.11 在日历时间范围内应用函数 384
14.12 应用滚动函数 386
14.13 绘制自相关函数图 388
14.14 检验时间序列的自相关 389
14.15 绘制偏自相关函数 390
14.16 两个时间序列间的滞后相关性 391
14.17 剔除时间序列的趋势 393
14.18 拟合ARIMA模型 394
14.19 剔除ARIMA模型中不显著的系数 397
14.20 对ARIMA模型进行诊断 399
14.21 用ARIMA模型进行预测 400
14.22 均值回归的检验 402
14.23 时间序列的平滑 404

教学资源推荐
作者: Thomas Leonard, John S.Hsu
作者: Ruey S.Tsay
作者: [美] 迈克尔·巴伦(Michael Baron) 著
参考读物推荐
作者: [美] 朱迪亚·珀尔(Judea Pearl)
作者: [美] 贝内迪克特·格罗斯(Benedict Gross) 乔·哈里斯(Joe Harris) 埃米莉·里尔(Emily Riehl) 著