《行为科学统计精要》书评

郭文玉

(长江大学地球科学学院, 武汉 430100)

摘要: 为了解决在统计的教与学中存在的各种问题, 弗雷德里克·J·格雷维特和拉里·B·瓦尔诺使用通俗的语言描述统计过程, 深刻地揭示了统计学原理。通过一步一步地逻辑推演, 向读者展示每个统计概念的意义, 帮助读者理解为什么要使用某种统计方法, 以及这个统计方法的“命脉”在哪里。全书内涵深刻, 并提供生动的例子, 帮助读者真正理解统计思想, 掌握统计分析的技能。弗雷德里克·J·格雷维特和拉里·B·瓦尔诺撰写的《行为科学统计精要》, 包含5个部分共12章内容。主要涉及入门和描述统计、推论统计基础、使用t统计量推断总体均值和均值差异以及方差分析; 最后是相关和非参数检验; 该著作的特点在于不仅要教授统计方法, 而且会传授客观性和逻辑性的基本准则, 它们对于科学和日常决策都是非常重要且有价值的。

关键词: 统计学, 行为科学研究, 书评

DOI: 10.48014/jcss.20240416001

引用格式: 郭文玉. 《行为科学统计精要》书评[J]. 中国统计科学学报, 2023, 1(3): 15-19.

文章类型: 书评

收稿日期: 2023-09-16

接收日期: 2023-11-09

出版日期: 2023-12-28

0 引言

《行为科学统计精要》是一本揭示统计学原理的应用统计学教材,它是由纽约州立大学布鲁克波特学院教授弗雷德里克·J·格雷维特和拉里·B·瓦尔诺撰写。弗雷德里克·J·格雷维特和拉里·B·瓦尔诺十几年来一直从事应用统计和实验设计的一线教学工作,他们深知统计教与学中存在的各种问题,为此编写了这本应用统计学教材[1]。本书由北京师范大学心理学院教授,中国教育学会教育统计与测量分会秘书长刘红云以及北京师范大学心理学院副教授,中国教育学会教育统计与测量分会副秘书长骆方的两个团队共同翻译完成,并由大型综合性出版社中国人民大学出版社出版。

统计学是一门收集、处理、分析、解释数据并从数据中得出结论的科学,它提供了一套各学科领域通用的数据分析方法,统计研究的是来自各领域的数据[2]。统计方法是适用于所有学科领域的通用的数据分析方法,只要有数据的地方就会用到统计方法[3]。并且要针对不同的研究采用不同的方法。描述统计目标是通过组织和总结来实现大量数据的简化。频数分布表和频数分布图能够将所有数据组织起来,因此可以用这两种方式来对数据的整体进行观察。描述统计的任务就是描述随机变量的统计规律,要完整地描述随机变量的统计特性需要用分布函数,但求随机变量的分布函数并不容易[4]。这就需要根据样本的信息,对总体的分布以及分布的数学特征进行统计推断,即推论性统计分析。其主要内容包括方差分析、回归分析等内容[5]。但是有些资料分布情况未知,不能用有效的参数进行描述,此时就需要采用非参数检验方法对总体分布或分布位置进行检验。非参数检验主要是相对参数检验而言的,它是统计分析方法的重要组成部分。它可以不考虑总体分布,适应性强,稳定性好;但是损失了部分信息,检验效率较低。所以对于适合参数检验的资料,仍然建议首选参数检验,而对于研究测量过程中可能不会对总体分布形态作简单推断的资料,就需要应用非参数检验进行统计分析。

科学的首要目的就是建立变量间的关系,并用样本数据来代替总体过程。本书从简单的描述性统计开始,并补充基础数学复习,引领读者从零开始一步一步理解统计学原理,建立统计学整体的知识框架,并通过练习进行实际运用,它对于科学和日常决策都是非常重要且有价值的。

国内外很多人难以把统计学原理讲解透彻,由于缺少合适的参考资料,学习统计学的学生们只好死记公式,一直徘徊在统计学的大门之外。《行为科学统计概要》中提供了生动的例子和大量的练习,为那些对统计学感兴趣,但对数学感到恐惧的读者解答理解上的盲点,让他们重拾学习统计学的信心,还为那些数学基础薄弱的读者真正理解统计思维,掌握统计思维的技能指明方向。

1 内容解读

本书的章节是按照统计课程的框架和顺序进行的,首先是描述统计,然后介绍各种重点为样本均值和方差的统计流程,最后介绍相关性的方法和非参数统计。

第一部分为入门和描述统计。这部分概述了统计方法并为描述统计做了一些铺垫。统计是用来表示组织、总结和解释数据的方法;统计方法被分为组织和总结数据的描述统计,以及通过样本数据来推论总体的推论数据。本部分包括第1章、第2章,第3章和第4章。第1章主要阐述了统计学入门知识,包括统计、科学和样本;总体和样本;数据结构,研究方法和统计方法;变量和测量以及统计符号。第2章对频数分布进行了阐述,包括频数分布图,频数分布表以及频数分布图的形状。第3章阐述了集中趋势的测量,包括集中趋势的定义、平均值、中数、众数,选择测量集中趋势的方法以及集中趋势和分布的形态。第4章对变异性进行了阐述,包括全距、总体标准差与方差以及样本标准差与方差。

第二部分为推论统计基础。在这部分本书介绍一些推论统计的基础概念和技术,建立了样本与总体之间正式的数量关系,而且介绍了判断样本中的数据能否代替总体的过程。本部分包括第5章、第6章,第7章和第8章。第5章主要阐述了使用z分数标准化某分布。第6章对概率和正态分布进行了阐述。第7章阐述了概率和样本,包括样本均值的分布以及更多关于标准误的知识。第8章对假设检验进行了介绍,包括假设检验的逻辑、假设检验中的不确定性和误差、有方向的假设检验,测量效应的大小以及测量检验力。

第三部分为使用t统计量推断总体均值和均值差异。在这部分,本书开始介绍在行为科学研究中真的会使用的推论统计方法,并介绍三种t统计量适用于三种不同的研究情景,以及一个新的推论技术:置信区间。具体来说,本部分包括第9章,第10章和第11章。第9章主要介绍了t检验,包括t统计量:z分数的替代形式、t检验的假设检验,测量t检验的效应大小以及有方向的假设和单侧检验。第10章对两个独立样本的t检验进行了阐述。包括独立测量设计、独立测量研究设计的t检验,独立测量t检验的假设检验和效应大小以及独立测量t检验的基本假设。第11章阐述了两个独立样本的t检验,包括重复测量设计概述、重复测量研究设计的t检验、重复测量设计的假设检验和效应值以及重复测量t检验的使用和假设。

第四部分为方差分析:检验两个或多个总体均值的差异。在这部分,本书介绍应用于三个不同应用领域的三种方差分析方法:独立测量设计,重复测量设计和双因素设计。本部分包括第12章和第13章。在这两章,本书将继续检验使用样本均值来推断总体均值差异的统计方法。这些推论方法的主要应用是帮助研究者解释他们的研究结果。第12章主要介绍了方差分析,包括方差分析的逻辑、符号和公式;F比值的分布;假设检验的例子和方差分析的效应值;事后检验以及方差分析和t检验之间的关系。第13章对重复测量和双因素方差分析进行了阐述。

第五部分为相关和非参数检验,在这部分,本书为分布情况未知的研究情景提出新的统计方法,这些新的研究情景仍然在提出有关变量之间的关系问题,它们仍然使用样本数据对总体做出推论。本部分包括第14章和第15章。第14章主要介绍了皮尔逊相关、皮尔逊相关的应用,解释和假设检验;除皮尔逊相关之外的其他相关以及回归简介。第15章对卡方检验进行了阐述,包括参数和非参数统计检验、拟合优度的卡方检验、独立性的卡方检验,独立性卡方检验效应大小的度量以及卡方检验的假设和限制。

第六部分是附录,附录部分复习了本书中所出现的统计计算中必须掌握的一些数学基本技巧,其中部分是已经学习过知识。通过对这部分知识的全面学习和复习,能使读者们学习本书的内容更加容易。附录A是基础数学复习,本部分有一个技能评估预先测试,通过测试,读者能找到自己的知识漏洞,具有针对性地进行查漏补缺。附录B是统计表,附录C是奇数题目的参考答案,附录D是社会科学的统计包的介绍,最后是介绍统计的组织结构:为研究的数据选择合适的统计方法。

2 研究发现和主要贡献

《行为科学统计精要》一书的研究发现和主要贡献如下。

(1)本书主要带读者理解描述统计的目标是通过组织和总结来实现对大量数据的简化。频数分布表和频数分布图能够将所有数据组织起来,因此可以通过这两种方式来对数据的整体进行观察。对集中趋势的测量通过找到一个分布的中心来描述这个分布。集中趋势还能够把所有分数压缩为一个具有代表性的值。变异性能够描述一组数据是分散的还是聚集的,并能提供一个指标来表示离散或者聚集的程度。在这个部分呈现的这些基本的方法中,最常用的是计算数值型数据的均值和标准差。本书能够让读者对统计的目标有总体的理解,也会让读者熟悉一些基本的术语和符号。并且会熟悉描述统计的技术,这些技术是用来帮助研究者组织以及总结研究结果的。读者也能在图表中完整而清晰地呈现一系列数据,学会用一两个值(如平均数)来描述整个数据集。

(2)本书阐述了推论统计的目的是使用样本中的有限信息来回答关于未知总体的问题。本书介绍了假设检验,也就是最普遍的推论统计方法。它把z分数、概率,样本均值的分布整合起来,使研究者能够用来自未知总体的样本均值来评估关于总体均值的假设。本书建立了样本与总体之间正式的数量关系,而且介绍了判断样本中的数据能否代表总体的过程。让我们学习使用从研究中得到的样本数据来回答关于总体的问题。

(3)作者介绍了在行为科学研究中真的会使用到的推论统计方法:一系列t统计量。本书介绍了三种用来对未知总体的均值和均值差异做推论的t统计量。因为总体都是未知的,我们需要从样本中得到必需的信息。每一次推论都是从计算样本均值和样本方差开始。研究者根据样本均值和均值差异得到t统计量并对相应的总体均值和均值差异做出推论。本书还介绍了一个推论技术:置信区间。置信区间可以让研究者使用样本数据来计算极有可能的未知参数的值的范围,并估计总体均值或均值差异。

(4)本书在t检验基础上介绍一种新的假设检验技术:方差分析。t检验仅限于比较一个或两个总体的均值,通常情况下,一个研究问题会包括两个以上均值。ANOVA允许研究者使用样本数据检验两个或两个以上总体之间的均值差异。本书介绍了应用于三个不同研究领域的三种方差分析方法,分别是独立测量设计,重复测量设计和双因素设计。

(5)科学的首要目的就是建立变量间的关系。变量间存在一定的关系,但对于研究过程中不会出现数值型的研究情景,本书为这类研究提出了新的统计方法,它们仍然使用样本数据对总体做出推论。即通过计算相关系数,建立回归方程,并运用卡方检验来进行拟合优度和独立性检验。最常用的相关是皮尔逊相关,它衡量了两个等距或等比尺度的变量之间的相关的方向和大小。当用皮尔逊的相关公式来计算来自顺序量表的数据时,所得的结果称为斯皮尔曼相关。斯皮尔曼相关衡量了相关的方向,以及相关保持一个方向的程度。另外还有点二列相关和φ相关。点二列相关主要用于处理一个连续数据的变量和另一个只有两个值的变量之间的关系程度。当两个变量都是二分变量时,这两个变量的相关称为φ相关。φ相关衡量了相关的强度。卡方检验是一种对总体频数分布形式的假设进行测量的非参数检验。两种卡方检验的类型是拟合优度检验和独立性检验。这些检验的数据,包括实际频数或每个类别内的个体的数量。拟合度卡方检验运用样本的频数分布来评价关于对应总体分布的假设。独立性卡方检验运用样本的频数分布来评价关于总体中两个变量之间关系的假设。

(6)这本书帮助了很多的读者,既有高校的统计学老师,也有在校的本科生和研究生,还有在社会科学领域耕耘的研究和实践人员,让他们重拾对教授和学习统计学的信心,能够正确使用统计分析方法来避免种种研究谬误。统计的流程也给研究者们提供了描述和解释他们的研究结果的目标和系统性的方法。这本书不仅要教授统计方法,而且会传授客观性和逻辑性的基本准则,它们对于科学和日常决策都是非常重要且有价值的。全书内涵深刻,还提供了生动的例子和大量练习,帮助基础薄弱的学生真正理解统计思想,掌握统计分析的技能。

3 结束语

《行为科学统计精要》出版后一直是美国心理学、社会学、经济学等领域中使用最广的应用统计学教材。作者使用通俗的语言描述统计过程,深刻地揭示了统计学原理。通过一步一步地逻辑推演,向读者展示每个统计概念的意义,帮助读者理解为什么要使用某种统计方法,以及这个统计方法的“命脉”在哪里。带领他们理解统计学的精髓,掌握统计分析的技能。同时,本书也为高校师生以及社会科学领域耕耘的研究和实践人员提供了帮助,解决在统计教与学过程中存在的各种问题,统计的流程给研究者们提供了描述和解释他们的研究结果的目标和系统性的方法。这本书不仅要教授统计方法,而且会传授客观性和逻辑性的基本准则,它们对于科学和日常决策都是非常重要且有价值的。

利益冲突: 作者声明无利益冲突。


[①] 通讯作者 Corresponding author:郭文玉13849001763@163.com
收稿日期:2023-09-16; 录用日期:2023-11-09; 发表日期:2023-12-28

参考文献(References)

[1] 弗雷德里克·J·格雷维特, 拉里·B·瓦尔诺, 等. 行为科学统计精要[M]. 北京: 中国人民大学出版社, 2016: 330.
[2] 贾俊平. 统计学[M]. 北京: 中国人民大学出版社, 2021: 255.
[3] 林侠. 统计学原理与实务[M]. 北京: 清华大学出版社, 2020.
[4] 蒲括, 邵朋. 精通Excel数据统计与分析[M]. 北京: 人民 邮电出版社, 2014: 269.
https://doi.org/10.3969/j.issn.1007-9106.2014.07.016
[5] 陈海平, 李明. 统计数据分析方法探析[J]. 社科纵横, 2014, 29(07): 58-60.
https://doi.org/10.16745/j.cnki.cn62-1110/c.2014.07.031.

Book Review of Statistical Highlights of Behavioral Science

GUO Wenyu

(School of Geosciences, Yangtze University, Wuhan 430100, China)

Abstract: In order to solve various problems in the teaching and learning of statistics, Frederick J. Grewitt and Larry B. Varnow used common language to describe the statistical process and provide insights into the principles of statistics. Through logical deduction step by step, they show readers the significance of each statistical concept, helping them to understand why a certain statistical method is used, and where the “lifeblood” of this statistical method is. The book is profound and provides vivid examples to help readers truly understand statistical ideas and master statistical analysis skills. Frederick J. Grevett and Larry B. Varnow's Statistical Essentials of the Behavioral Sciences, contains 12 chapters in five parts. It mainly involves introductory and descriptive statistics, inferring the fundamentals of statistics, using t-statistics to infer overall means and mean differences, and analysis of variance. Finally, correlation and nonparametric test; This work is characterized not only by the fact that not only are statistical methods to be taught, but also the basic norms of objectivity and logic, which are so important and valuable for both science and everyday decision making.  

Keywords: statistics, behavioural science research, book review

DOI: 10.48014/jcss.20240416001

Citation: GUO Wenyu. Book review of Statistical Highlights of Behavioral Science[J]. Journal of Chinese Statistical Sciences, 2023, 1(3): 15-19.