基于R语言的金融分析
作者 : [美]马克·J.班纳特(Mark J. Bennett)德克·L.胡根(Dirk L. Hugen)著
译者 : 朱轩彤 董宁 岳蕾 吕指臣 译
出版日期 : 2020-07-02
ISBN : 978-7-111-65821-4
定价 : 119.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 324
开本 : 16
原书名 : Financial Analytics with R: Building a Laptop Laboratory for Data Science
原出版社: Cambridge University Press
属性分类: 教材
包含CD : 无CD
绝版 :
图书简介

本书关注计算机模拟技术,提供了一种用R语言开发金融分析程序的系统方法,旨在指导读者建立一个软件模拟实验室,并在实验室的重要工作模块上回答分析问题,向读者,无论是金融从业者还是学者,提供了许多金融分析方面的解决方案。具体内容包括市场概率和统计的背景知识、R语言入门、金融证券、数据分析和风险度量、时间序列分析、集群分析、模拟交易策略、利用基本原理进行预测、期权的二项式模型等。每章都配有习题,可以帮助读者巩固所学知识。

图书特色

基于R语言的
金融分析
Financial Analytics with R
Building a Laptop Laboratory for Data Science
[ 美 ]  马克·J. 班纳特(Mark J. Bennett)
      德克·L. 胡根(Dirk L. Hugen)     著
      朱轩彤 董宁 岳蕾 吕指臣   译

图书前言

1994年,英国和法国之间的海峡隧道开通,欧洲之星高速列车得以将欧洲大陆的乘客大规模地送往英国,然后再返回。这在当时是多么令人惊叹的壮举(超出了当时许多人的想象),但在今天,我们却认为这是一件理所当然的事情。1994年,阿波罗登月舱的总承包商格鲁曼航空公司被诺斯罗普公司收购,成立了新的航空巨头诺斯罗普格鲁曼公司。它同时也是新部署的先进技术B-2隐形轰炸机的主要承包商。同样是1994年,在芝加哥城外的一个联排别墅里,我进行着一项单调的日常练习:每天晚上在Investor’s Business Daily报纸上查找两个即将被收购的股票的每日收盘价。这不仅是为了了解它们的运行收益率,而且是为了在持仓之前了解它们相对于其他股票的历史波动性。进行这个手工计算既慢又乏味。第二年,万维网以Mosaic浏览器的形式出现。不久之后,雅虎发布股票报价、历史价格图表和图表技术指标,通过新的网络浏览器只需几秒钟就可以免费获得这些内容。
电子表格软件的出现使分析师们的分析性思维提升到了新的层级。活生生的手工计算不再仅限于一个维度。每一行或每一列都可以显示一个时间维度、一个生产类别或一个业务场景。自动化的依赖功能使修改变得非常容易。现在,基于大型计算机分析程序的电子表格可以用来制作更复杂、更持久的分析产品的原型。
有了R语言和Python这样的现代编程语言,如今一个熟练的分析师可以用雅虎或其他免费历史报价服务等资源,设计其分析逻辑,这大大减少了他们的工作量。有人说Python的语法非常简洁,以至于实现与Java程序相同的功能,代码行数仅为Java的四分之一。我们怀疑R语言与之类似。一个小型的金融实验室可以建立在一台笔记本电脑上,几周内花费不到200美元,能根据需要模拟多个市场变量。或者,通过具有更多驱动空间的高端笔记本电脑,能以前所未有的规模装载整个市场10~20年的历史数据。
实验室一旦建成,人们就可以开始进行深刻理解。“知识发现”曾经是人类成长过程中的一个术语。现在我们讨论的是计算机自动化。“知识发现”似乎是一个大胆的术语,对于计算机程序所能创造的任何东西来说,都有点过于雄心勃勃。例如,计算机科学领域中,计算机协会(ACM)有一个名为知识发现和数据挖掘(KDD)的特殊兴趣小组。但几乎没有人会挑战其中的“数据挖掘”部分。毕竟,对于统计学家和计算机科学家来说,掌握数据就是他们的工作。但是用机器发现知识,自动分析数据,这会是真的吗?在现在看来,这似乎有点夸张了。然而,我们再体验一遍本书描述的算法,很快就意识到,使用数据科学技术的这些程序,不仅可以自动进行非常烦琐的计算,而且可以对人类思维水平产生积极、深刻的影响。
也许人们可以用体育运动来类比这种体验。在许多运动中,我们都用防守来保护我们现在的位置,防止对手再得分。进攻是一种按顺序运用运动专长,从而能多得分的能力。KDD的数据挖掘部分可以被认为是防守,即运动中纪律性更强、组织更严密的一方。只要成功一次就是有效的,如伸出手来阻挡传球,投一个曲线球来防止击球手在球场上连续传球。另一方面,“知识发现”是一种进攻性的技能,它超越了所需和预期的数据分析,类比于体育运
动,是创造性的一方。在进攻方面,只有一系列的比赛都成功才能取得进步,如足球比赛需要全配合进球得分,或者棒球在三次出局得分之前连续三次击垒。进攻成功的可能性较小。
因此,在KDD模型和体育运动的类比中,数据挖掘是防御,知识发现是进攻。实现知识发现虽然罕见,却会产生惊人的影响。知识发现可以像人类的想法一样强大,并能进一步增强它们。例如,我们可能会发现有一种公开交易的股票具有独特的理想属性。KDD领域触及了这些机器在计算机科学的所有进步中所能做到的极限。
1968年,在好莱坞电影和小说《太空漫游》中,作者Arthur C. Clarke预测了自动推理、自然语言语音识别、视频通话和面部识别等技术。HAL9000计算机控制着飞往木星的飞船,同时与宇航员Frank Poole博士进行对话和下棋,并监控着300多名宇航员的生活状况。从那时起,计算机科学,特别是模拟科学,在许多领域对研究和发现过程产生了巨大的影响,并有效地实现了许多科幻小说的目标。除此之外,还有计算生物学、计算宇宙学和计算语言学等领域也取得了长足的发展,如图1所示。
本书关注的是计算机模拟技术。计算机模拟技术已经取得了巨大的成功,现在已被广泛接受,它是除了理论和物理实验之外的第三种科学方法。运用书中知识可以帮助我们建立一个金融模拟实验室。本书是芝加哥大学格雷厄姆学院分析学硕士项目的研究生财务分析课程和艾奥瓦大学蒂皮商学院财务系的本科生投资课程的研究材料。也可作为具有良好数学背景和计算机科学背景的高等院校本科生的教材。
想要更好地理解本书,读者最好学习过统计分析、概率和统计等课程,或者了解本书所涉及的数学统计知识,大部分所需资料都已在正文和附录中介绍。读者最好具备本科水平的微积分、线性代数和计算机科学背景,熟悉一种或多种程序设计语言,如C、C++、Java、C#、Python或Matlab。但读者无须具备财务背景。当然,任何关于R语言的经验都是有用的。
比起用电子表格,用R语言构建的计算机模拟金融可能更复杂、更具挑战性。当定量优化器的逻辑从周围的程序代码中即时显示时,可以更好地控制和定制定量优化器。我们的读者需要更多的计算机科学知识来构建更鲁棒和复杂的平台,以及深入理解编译器和运行时系统。但当完成这些后,金融分析的构建者、运营商或学生会逐渐认识到用设计语言进行统计模拟的优势。构建模拟器和从观察模拟中获得的见解将有助于加深对未来专业领域的理解。那些观点,现在看来是关于机器的,但是对于人们来说却总是关于学习的。

图1 来自计算生物学、计算宇宙学和计算语言学的样本图像
数据科学涉及统计和计算模型的研究。在这本书中,意味着我们正在释放金融市场中存在的经济价值。数据工程是在计算机上把文件、程序逻辑、测试和持续改进等实现应用于大型数据集的模型的过程。每章末尾的习题将引导我们利用之前章节中的数据科学原理来构建和设计我们的金融实验室。
做这些练习时,可能需要不时地安装各种R语言包。通过互联网,读者可找到加载R语言包、排除故障的正确说明。涉及的语言包、条件和用例太多,在此无法一一说明。
为便于我们了解逻辑和数据,习题有不同的侧重。新的内容都建立在对前期知识的理解之上,以适应我们进行财务分析所需的复杂程度。

上架指导

计算机/数据分析

封底文字

“这是一本非常好的金融分析教材,聚焦于开发统计模型和使用模拟来更好地理解金融数据。所有示例都使用了R,允许读者使用文本和代码来积极参与金融市场。这绝对是该领域我所见过的为数不多的优秀教材。强烈推荐!”
——Joseph M. Hilbe, 亚利桑那州立大学
“这是一站式的解决方案,涵盖你使用R语言进行金融分析所需要知道的一切知识。这本书将R语言培训和金融分析相关问题解决方案有机结合,还结合了近期极端金融事件的例子,如房贷危机和欧元危机。本书提供了很多相关代码,如计算夏普比率或实现贝叶斯推理的函数,并回答你在尝试编程时可能遇到的许多问题。无论你的目标是什么,这本书都会帮助你成为一个更好的实践者/学生/分析师/企业家。”
——Carrie Shaw, Quandl公司
“这本书对于初学者来说是不寻常的,对于把R语言当作一个通用的数字处理工具来说也是不寻常的。这也是少数真正为非统计学家和非程序员编写的R语言教程之一。 对于STEM学生来说,学习一种编程语言是有益的,R语言也是一种可行的编程语言。这本书是实现这一目标的最佳选择。”
Robert W. Hayden, 美国数学协会评论(www.maa.org)

译者序

R语言是一套用于数据处理、统计计算和制图的软件系统,在当今的金融分析世界中是一种优秀的工具。在R朴素的界面下,可以实现丰富的复杂运算、统计和展示功能。在进行探索性的统计分析预测和创建机器学习模型时,R的功能是十分强大的。
熟练掌握R等现代编程语言可以大大减少金融分析师的工作量,特别是由于R语言提供了很多针对专业程序员和非专业程序员的软件包与库,那些不那么擅长编程的金融分析师经过训练之后也可以得心应手地使用R语言进行金融分析。
近年来,我们组织翻译了多本计算机专业图书,这本书可以说是精品之一。在翻译的过程中虽然觉得这本书有一定的难度,但对它仍爱不释手。本书通过梳理金融分析方法,解释数学概念,展示代码和图示,配合相关案例和习题,清晰简练地向读者介绍了如何利用R语言进行金融分析。
本书是芝加哥大学格雷厄姆学院分析学硕士项目的研究生财务分析课程和艾奥瓦大学蒂皮商学院财务系的本科生投资课程的研究材料,也可作为具有良好数学背景和计算机科学背景的高等院校本科生的教材。本书对于计算机专业人士和金融人士都会有较大帮助。有较好的统计概率知识基础的读者能够在本书中找到更多乐趣。

朱轩彤  
2019年11月

图书目录

译者序
前言
第1章 分析性思维 1
1.1 什么是金融分析 1
1.2 什么是数据科学笔记本电脑实验室 2
1.3 什么是R语言,如何将其用于专业分析领域 4
1.4 习题 5
第2章 统计计算使用的R语言 6
2.1 R语言入门 6
2.2 语言功能:函数、赋值、参数和类型 9
2.3 语言功能:绑定和数组 11
2.4 错误处理 14
2.5 数字、统计和字符函数 15
2.6 数据帧和输入/输出 16
2.7 列表 17
2.8 习题 19
第3章 金融统计学 20
3.1 概率 20
3.2 排列组合 21
3.3 数学期望 27
3.4 样本均值、标准差和方差 29
3.5 样本偏度和峰度 30
3.6 样本协方差和相关矩阵 31
3.7 金融收益率 33
3.8 资本资产定价模型 34
3.9 习题 35
第4章 金融证券 37
4.1 债券投资 38
4.2 股票投资 40
4.3 证券数据集和可视化 41
4.4 股票分拆 43
4.5 为并购进行调整 48
4.6 绘制多个序列 49
4.7 证券数据导入 51
4.8 证券数据清理 57
4.9 证券报价 60
4.10 习题 61
第5章 数据集分析和风险测量 62
5.1 用对数收益率来生成价格 62
5.2 价格变动的正态混合模型 64
5.3 2015年货币价格的突变 70
5.4 习题 73
第6章 时间序列分析 74
6.1 时间序列入门 74
6.2 平稳型时间序列 78
6.3 自回归移动平均过程 79
6.4 幂变换 79
6.5 TSA包 80
6.6 自回归积分移动平均过程 87
6.7 案例研究:强生公司的收益 89
6.8 案例研究:乘客飞行月度数据 92
6.9 案例研究:电力生产 95
6.10 广义自回归条件异方差 97
6.11 案例研究:谷歌公司股票收益的波动性 97
6.12 习题 104
第7章 夏普比率 106
7.1 夏普比率公式 107
7.2 时间段和年化 107
7.3 排名投资候选选项 108
7.4 quantmod包 111
7.5 衡量损益表增长 116
7.6 损益表增长的夏普比率 119
7.7 习题 128
第8章 马科维茨均值方差优化 129
8.1 两种风险资产的最优投资组合 129
8.2 二次规划 132
8.3 利用投资组合优化进行数据挖掘 133
8.4 约束、惩罚和套索 135
8.5 向高维度延展 140
8.6 案例研究:2003~2008年标准普尔500指数成分股 147
8.7 案例研究:2008~2014年几千只候选股票 150
8.8 案例研究:交易所交易基金 154
8.9 习题 161
第9章 集群分析 163
9.1 k-means聚类 163
9.2 剖析k-means算法 169
9.3 无向图的稀疏性和连通性 172
9.4 协方差和精度矩阵 175
9.5 可视化协方差 177
9.6 Wishart分布 184
9.7 Glasso:无向图的惩罚 186
9.8 运行Glasso算法 187
9.9 多年追踪价值股 187
9.10 年度稀疏度回归 191
9.11 季度稀疏度回归 195
9.12 月度稀疏度回归 196
9.13 架构和扩展 197
9.14 习题 198
第10章 衡量市场情绪 199
10.1 马尔可夫区制转移模型 199
10.2 读取市场数据 202
10.3 贝叶斯推理 206
10.4 Beta分布 207
10.5 先验和后验分布 207
10.6 检验对数收益率的相关性 210
10.7 态势图 211
10.8 习题 215
第11章 模拟交易策略 217
11.1 外汇市场 217
11.2 图表分析 218
11.3 初始化及结束 219
11.4 动量指标 220
11.5 在头寸中使用贝叶斯推理 221
11.6 入场 223
11.7 离场 224
11.8 获利能力 224
11.9 短期波动性 225
11.10 状态机 225
11.11 模拟总结 232
11.12 习题 233
第12章 使用基础知识进行数据探索 235
12.1 RSQLite包 235
12.2 计算市净率 236
12.3 Reshape2包 238
12.4 案例研究:谷歌 240
12.5 案例研究:沃尔玛 242
12.6 价值投资 243
12.7 实验室:试图战胜市场 246
12.8 实验室:财务实力 247
12.9 习题 247
第13章 使用基本原理进行预测 248
13.1 最佳损益表投资组合 248
13.2 重新格式化损益表增长数据 249
13.3 获取价格统计 251
13.4 合并损益表和价格统计数据 255
13.5 使用分类树和递归划分进行预测 257
13.6 分类器之间的预测率比较 262
13.7 习题 264
第14章 期权的二项式模型 266
14.1 应用计算金融学 266
14.2 风险中性定价和无套利 269
14.3 高风险率环境 269
14.4 期权数据二项模型的收敛 271
14.5 买卖权平价 274
14.6 从二项到对数正态 275
14.7 习题 276
第15章 Black-Scholes 模型和期权的隐含波动率 277
15.1 几何布朗运动 277
15.2 几何布朗运动的蒙特卡罗模拟 279
15.3 Black-Scholes 推导 280
15.4 隐含波动率的算法 283
15.5 隐含波动率的实现 284
15.6 Rcpp包 290
15.7 习题 292
附录 概率分布与统计分析 293
参考文献 312

教学资源推荐
作者: 周启海
作者: (美)Joseph Phillips 著
作者: 黄传河 主编 杜瑞颍 吴黎兵 吕慧 张春林 张沪寅 张健 参编
作者: (美)Philip J.Pratt
参考读物推荐
作者: [美]卡蒂克·雷迪·博卡(Karthiek Reddy Bokka) [印]舒班吉·霍拉(Shubhangi Hora) [德]塔努吉·贾因(Tanuj Jain) [美]莫尼卡·瓦姆布吉(Monicah Wambugu) 著
作者: [印尼]伊凡?伊德里斯(Ivan Idris)著
作者: Bruce Schneier