对统计学基本概念的梳理,其中普通字体为贾俊平著《统计学(第六版)》中的重要概念,引用字体的内容为书中没有但相关的概念。
《统计学(第六版)》贾俊平 第1章 导论
统计学 statistics
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
描述统计 descriptive statistics
描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计 inferential statistics
推断统计是研究如何利用样本数据来推断总体特征的统计方法。通过抽取部分样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断。
分类数据 categorical data
分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据变现为类别,使用文字来表述的。【批:在其他统计学教材中多使用定类数据】
顺序变量 rank data
顺序数据是只能归于某一有序列表的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。【批:在其他统计学教材中多使用定序数据】
数值型数据 metric data
数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。【批:在其他统计学教材中多使用定距数据和定比数据,区分是否存在绝对零值的情况】
定型数据/品质数据 qualitative data
分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或品质数据。
定量数据/数量数据 quantitative data
数值型数据说明的是现象的数量特征,通常使用数值来表现的,因此也可称为定量数据或数量数据。
观测数据 observational data
观测数据是通过调查或观察而收集到的数据,这类数据实在没有对事物认为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。
实验数据 experimental data
实验数据是在实验中控制实验对象而收集到的数据。
截面数据 cross-sectional data
截面数据似乎在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。
时间序列数据 time series data
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
总体 population
总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。
无限总体 infinite population
对于无线总体,每次抽取一个单位,并不影响下一次的抽样结果,因此每次抽样可以看做是独立的。
有限总体 finite population
对于有限总体,抽取一个单位后,总体元素就会减少一个,前一次的抽样结果往往会影响第二次的抽样结果,因此每次抽取式不独立的。
样本 sample / 样本量 sample size
样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。
参数 parameter
参数是用来描述总体特征的概况性数字度量,它是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等。
统计量 statistic
统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。
变量 variable
变量是说明现象某种特征的概念,其特点似乎从以此观察到下一次观察结果会呈现出差别或变化。
分类变量 categorical variable
分类变量是说明事物类型的一个名称,其取值是分类数据。【批:在其他统计学教材中多数使用定类变量而非分类变量的名称】
定类变量 norminal variable
最低层级的变量类型,不同数字仅作为标志,相互之间没有次序关系。
顺序变量 rank variable
顺序变量是说明事物有序类别的一个名称,其取值是顺序数据。【批:在其他统计学教材中多使用定序变量而非顺序变量】
定序变量 ordinal variable
不同数字不仅作为标志,互相之间也有顺序关系,可以比较大小,但是不能对数据进行四则预算。
数值型变量 metric variable
数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。【批:在其他统计学教材中多使用定距变量和定比变量,而非合并在一起使用数值型变量;定距变量和定比变量在应用时还是有所区别的】
定距数据 interval variable
不同数字之间不仅可以比大小,而且相互之间的距离是有意义的(具有测量单位),可以进行加减运算;但是因为没有绝对零点所以无法进行乘除运算。
定比变量 ratio variable
最高层级的变量类型,存在绝对零点,不同数字之间不仅可以进行加减运算,也可进行乘除运算。
离散型变量 discrete variable
离散型变量是只能取可数值的变量,它只能取有限个值,而且其取值都以整位数断开,可以一一列举。
连续型变量 continuous variable
连续型变量是可以在一个或多个区间内取任何值的变量,它的取值是连续不断的,不能一一列举。
经验变量 empirical variable
经验变量是指用于描述我们周围可以观察到的事物的变量。
理论变量 theoretical variable
理论变量是指由统计学家用数据方法构造出来的变量,例如z统计量、t统计量、F统计量等。
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站不拥有所有权,不承担相关法律责任。如发现有侵权/违规的内容, 联系QQ15101117,本站将立刻清除。