现代应用统计学:大数据分析基础
作者 : 王建军 宋香荣 编著
出版日期 : 2016-08-22
ISBN : 978-7-111-53962-9
适用人群 : 经济类本科生
定价 : 35.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 247
开本 : 16
原书名 :
原出版社:
属性分类: 教材
包含CD :
绝版 :
图书简介

本书将统计学定义为分析数据信息的科学,用专门章节阐述了统计学中最重要、最基本的两个概念——数据与变量,详尽描述数据特点与分类,为以后各章统计分析方法的选择作铺垫。本书作者极为重视变量,认为统计学是从变量开始确定研究现象的量化,然后才搜集数据、选择数据,而目前多数统计学教材忽视变量,主要原因是从数学的角度看统计学的变量。变量既可以抽象为某个符号(而符号恰恰又极不重要),又可以用任何字母代替。数学将变量分为统计学认为并不那么重要的连续变量与离散变量、确定性变量与随机性变量等。这种变量的分类法对统计分析方法的选择没有多少实际意义。本书作者认为应用统计学解决问题,首先是从变量入手,先有变量,然后才有数据。即使是先有数据,统计学也是根据变量的需要选择数据的。
本书按现实中的问题类型将探索性统计分析分为一个定性变量探索、一个定量变量探索、两个定性变量与两个定量变量关系、多个数值变量关系的探索分析。验证性统计分析分为一个变量的分布验证分析、两个变量关系的验证分析、多个变量关系的统计分析。将预测分析单独列出,显示其极为重要。

图书特色

本教材是在作者20多年教学经验总结的基础上,为适应大数据时代的统计学教学要求,既注重基础知识和理论介绍,又注重理论与实践相结合,将统计体系按可能遇到的问题排列,突出统计学中最重要的两个概念:数据和变量,强调实用方法,并将统计基础分为探索性统计分析、验证性统计分析和统计预测。同时,作者将统计学中传统的参数统计与现代非参数统计方法,将常用软件Excel与统计专业软件R语言有机结合为一体,突出应用统计特点和当代数据分析的要求,体系上具有最新统计理念和实用统计方法的特点。
本书可作为高等院校各类经济管理、社会学、科学技术管理等专业学生学习统计学的教科书,也可作为有关管理部门干部培训的参考教材。

图书前言

现代应用统计学为适应大数据时代的要求将统计学最常用的方法分为探索性统计分析、验证性统计分析和预测分析三类。本书将统计学中传统的参数统计与现代非参数统计方法有机结合为一体,将常用软件Excel与统计专业软件R语言有机结合为一体,突出应用统计特点和当代数据分析的要求,体系上具有最新统计理念和实用统计方法的特点。
目前多数统计学的课程体系是根据数理统计逻辑体系排列的,本书打破传统,将统计体系按可能遇到的问题排列,形成问题导向型的体系,突出统计方法的实用性,分为统计学基础概念、探索性统计分析、验证性统计分析和预测分析。
本书将统计学定义为分析数据信息的科学,用专门章节阐述了统计学中最重要、最基本的两个概念——数据与变量,详尽描述数据特点与分类,为以后各章统计分析方法的选择作铺垫。本书作者极为重视变量,认为统计学是从变量开始确定研究现象的量化,然后才搜集数据、选择数据,而目前多数统计学教材忽视变量,主要原因是从数学的角度看统计学的变量。变量既可以抽象为某个符号(而符号恰恰又极不重要),又可以用任何字母代替。数学将变量分为统计学认为并不那么重要的连续变量与离散变量、确定性变量与随机性变量等。这种变量的分类法对统计分析方法的选择并无多少实际意义。本书作者认为应用统计学解决问题,首先是从变量入手,先有变量,然后才有数据。即使是先有数据,统计学也是根据变量的需要选择数据。
本书按现实中的问题类型将探索性统计分析分为一个定性变量探索、一个定量变量探索、两个定性变量与两个定量变量关系、多个数值变量关系的探索分析。验证性统计分析分为一个变量的分布验证分析、两个变量关系的验证分析、多个变量关系的统计分析。将统计预测方法单独列出,显示其极为重要。
经典统计源自数学,置信区间理论显得重要,95%的置信区间的准确含义是“抽100次样本,有95次样本构造的置信区间可能包含总体参数”。可是实际上只有一次抽样,总体参数是否包含在此次置信区间内并不知道。实际应用最多的是点估计,用样本均值作为总体均值的点估计,样本比例作为总体比例P的点估计是经过数学极大似然法证明的。其实,区间估计也是以样本均值为中心构造置信区间的,为了提高置信度,置信区间的半径估计过大从而失去实用的参考价值,置信区间过大对数学并无任何影响,对结论应用的统计学就显得无所适从了。
验证性统计分析对用归纳法得出的理论假设进行检验,强调的是现实数据是否支持理论假设,是否得到与理论一致的结论。验证方法分为经典参数统计与非参数统计,本书将其合并使用,验证性统计方法与计量经济理论检验是一致的,所以本书中融入了一些计量经济学的基本理念,强调统计检验的理论分析,并先分析为什么会有影响,再用统计数据验证。这样避免了盲目套用模型,也免得出现极为荒谬的伪回归模型。
本书极为重视预测分析,将回归模型预测单独列出,与时间序列预测合并为一篇。截面数据回归模型预测插入值,时间序列预测外推值,各有应用范围和价值。
统计学中的数学原理讲到多深才够?通常一般的教材为了体系上的逻辑需要从概率论讲起,而本教材认为大学的高等数学部分已经讲过,就不必简单而无用地重复,同时验证性统计分析在应用统计学中只用到结论就行了,不必再强调数学体系的完整。另外,统计调查中抽样调查的理论需要讲多少才够呢?其实很多统计学教材会讲到抽样的各类方法,如简单随机抽样、分层抽样、整群抽样、等距抽样,等等。然而这些方法非一两节课能讲清楚,主要是因为估计的方差理论不是简单推导可得的,所以作者认为花费大量篇幅讲这些看似重要,但只有专业统计人士才有机会用到抽样调查理论知识,大可不必。因此在本教材中一概略去,特别是在统计调查方法部分。
统计学应用主要是将数学原理与实际问题相结合,其中复杂的计算部分已由专业统计软件完成。本教材在众多的统计软件中,选择的是R软件与Excel相结合,其出发点是Excel办公软件普及率高,探索性统计分析计算功能较强,可完成大部分统计计算。同时复杂的统计计算由R软件完成,主要是因为R软件除了具有免费的优势而且功能强大,普及已成趋势,为了赶上时代发展,所以本书也采用R软件。全书更加体现统计算法为主的现代统计学理念。
统计学是一门科学与艺术的学问,其中艺术性是指需要统计分析的经验。本书的一个重要特点就是强调实践的经验部分,突出实践中容易错误的地方,放弃了一些似乎有用、其实无用的统计概念与方法,如离散系数、峰度与偏度、置信区间,同时吸取了一些现代统计知识,如稳健性的方法、截尾平均、MAD、中位数回归等。值得一提的是,在面临多种统计方法供选择时,作者也进行了比较说明。
本书创新性地以大数据分析为基础,难免观点不妥,恳请广大读者不吝赐教,以便及时更正。书中数据可通过邮箱xjcdtjx@sina.com 与作者联系获得。
本书获得“新疆高等学校地方特色和民文教材项目”的推荐与资助。

2016年1月

上架指导

统计

封底文字

本教材是在作者20多年教学经验总结的基础上,为适应大数据时代的统计学教学要求,既注重基础知识和理论介绍,又注重理论与实践相结合,将统计体系按可能遇到的问题排列,突出统计学中最重要的两个概念:数据和变量,强调实用方法,并将统计基础分为探索性统计分析、验证性统计分析和统计预测。同时,作者将统计学中传统的参数统计与现代非参数统计方法,将常用软件EXCEL与统计专业软件R语言有机结合为一体,突出应用统计特点和当代数据分析的要求,体系上具有最新统计理念和实用统计方法的特点。
本书可作为高等院校各类经济管理、社会学、科学技术管理等专业学生学习统计学的教科书,也可作为有关管理部门干部培训的参考教材。

图书目录

前言
第一篇 统计学基础概念
第1章 统计学概论 2
1.1 统计学的定义 2
1.2 统计学的作用 3
1.3 统计学的分类 6
1.4 统计学与数学和计算机的关系 9
1.5 统计学的发展前景 11
第2章 统计学的数据 13
2.1 统计数据的定义 13
2.2 统计数据的特征 14
2.3 统计数据的类型 16
2.4 统计数据的规范格式 23
2.5 验证性研究数据需要量 23
2.6 统计数据的近似与误差 24
2.7 R软件的数据导入 25
第3章 统计学的变量 27
3.1 统计学变量的涵义 27
3.2 统计学变量的类型 29
3.3 统计学变量的功能分类 32
3.4 变量的变换与构造 34
3.5 变量类型与统计分析方法的选择 37
第二篇 探索性统计分析与验证性统计分析
第4章 一个变量的探索性统计分析 42
4.1 一个变量的探索性统计分析概述 42
4.2 一个定性变量的探索性分析方法 50
4.3 一个数值型变量的探索性分析方法 59
4.4 一个数值型变量的探索扩展 67
4.5 一维时间序列数据的探索分析 81
第5章 两个变量关系的探索性统计分析 84
5.1 两个变量关系的探索性统计分析概述 84
5.2 两个变量关系的探索统计原理 84
5.3 两个字符型变量的关系探索 94
5.4 两个数值型变量的关系探索分析 97
5.5 一个数值型变量与一个字符型变量关系的探索分析 101
5.6 两个变量关系探索的综合案例 108
第6章 实证研究与验证性统计分析 110
6.1 统计检验问题的提出 110
6.2 验证性统计分析的基本概念 113
6.3 验证性统计方法分类 120
第7章 一个变量的分布验证分析 124
7.1 一个变量的分布验证分析概述 124
7.2 一个变量的分布验证分析与原理 125
7.3 一个字符型变量的分布验证分析 129
7.4 一个数值型变量的分布验证分析 135
7.5 一个变量分布验证分析的案例 142
第8章 两个变量关系的验证分析 144
8.1 两个变量关系的验证分析概述 144
8.2 两个字符型变量关系的验证分析 145
8.3 两个数值型变量相关关系的验证分析 151
8.4 两个数值型变量的回归模型检验 156
8.5 一个数值型变量与一个字符型变量关系的验证分析 168
8.6 两个变量关系验证的综合案例 177
第9章 多个变量关系的统计分析 181
9.1 多个变量关系的统计分析概述 181
9.2 多元数据探索分析 190
9.3 建立多元回归模型 193
9.4 综合多元分析 197
9.5 有虚拟变量的模型logistic 207
9.6 多变量模型分析案例 209
第三篇 预测分析
第10章 时间序列的预测分析 212
10.1 时间序列分析的统计方法概述 212
10.2 平均增长速度预测 215
10.3 时间序列的预测模型 219
10.4 时间序列组合模型的预测法 224
10.5 时间序列预测分析的综合案例 235
参考文献 240

教学资源推荐
作者: 宫春子 刘卫东 刘 宝 刘振东 编著
作者: (美)罗伯特 R.强森(Robert R. Johnson)帕特里西亚 J. 库比(Patricia J. Kuby) 著夏国风 姜爱萍 等译
作者: 曾五一 朱平辉 主编
作者: 张兆丰 编著
参考读物推荐
作者: 美国麦肯锡(McKinsey & Company)
作者: (美)詹姆斯M.卡普兰(JamesM.Kaplan)