导读:
第七章 假设检验
第一节 检验原理
一.提出原假设(Null Hypothesis)和备择假设(Alternative Hypothesis); 所谓假设,是指需要进行验证的统计结论。
原假设是作为统计分析前提的假设,备择假设是在原假设不成立的情况下所接受的假设。
二.确定适当的检验统计量T; 检验统计量T是用于检验原假设是否成立的标准,在原假设成立的前提下,统计量T满足某种特征,
三.规定显著性水平a(犯弃真错误的概率); 显著性水平是设定一个弃真错误的概率,理论上说,没有一个检验是百分之百正确的,必然有一定的概率犯错误。
检验的错误分为两种类型,一是弃真错误,二是取伪错误。
所谓弃真错误,是指原假设为真,但检验的结果拒绝了原假设;
取伪错误,是指原假设为假,但检验的结果接受了原假设。
当在原假设条件下,T值出现的概率小于a时,拒绝原假设。
一个小概率事件出现,因此拒绝原假设。
a值越大,表明犯弃真错误的概率越大,越容易拒绝原假设,此时称检验越严格。
如果减小拒绝域,就意味着扩大接受域,从而扩大了犯取伪错误的概率。弃真和取伪是一对矛盾体,只有通过改进检验方法,例如扩大样本量,或者使用更好的统计量,才可以使二者同时缩小。
a值需要由检验目的来确定,当取伪造成的损失大于弃真造成的损失时,应扩大a值。
四.计算检验统计量T的值; 根据检验中获得的数据,计算统计量T的值。
五.作出统计决策。 根据T的取值特征,计算取该值的概率,如果此概率小于a,则拒绝原假设。
例子: 某裁判观察到球员A有类似于上肢触球的表现,现需决定是否判其为手球。
1.确定原假设:球员A没有上肢触球
2.确定统计量T:球在接触球员A的身体后反弹的角度
3.确定显著性水平:a=0.05
4.计算T值:根据裁判的观察确定球的反弹角度为X
5.统计判断:当一名球员使用上肢之外的身体部分触球时,球的反弹角度为X的概率为0.03。由于0.03<0.05,拒绝原假设,即认为球员A存在上肢触球。
在本例中,有3%的可能性发生弃真错误,即球员A没有上肢触球,但裁判作出了错误判断。
第二节 利用正态分布的假设检验案例
利用正态分布的特征进行假设检验是比较常用的方法,有许多统计量符合正态分布,因此可以利用正态分布进行分析。
例题:
某厂产品使用寿命符合正态分布,其中m0=1020,s=100,从最近生产的产品中抽选16件,测得m1=1080,试在a=0.05的水平下,检验产品质量是否有显著提高。
本例使用正态分布的前提条件,H0:m1= m0=1020
计算统计量z
因此,拒绝原假设。
统计软件中提供的 P-level 为统计量处于T值范围之外的概率,当此概率小于a值时,拒绝原假设。
在本例中,P(Z>2.4)=0.0082 因此拒绝原假设。
在统计软件中,对于左侧、右侧和双侧检验需进行区分。
第三节 非参数统计
非参数统计方法不涉及描述总体分布的有关参数,例如正态分布的方差、期望等内容,因此称为与分布无关的(Distribution Free)。
在推断过程中,仍需利用样本的其他分布信息,尤其是关于秩(rank)的信息。
将数据从小到大进行排列,每一个具体数据项所处的位置或次序,称为该数据的秩。
一.卡方检验(Chi-Square Goodness-of-Fit Test) 卡方检验一直有极其广大的应用领域,所有这些应用有一个共同点,即拥有足够大的样本使得在零假设下通过多元的正态中心极限定理来保证检验统计量有渐近的Chi-Square 分布
一个重要的Chi-Square 检验类型为Pearson拟合优度统计量
在r个不重叠的类中,所观察到的计数O与在零假设下的期望值E之间的差距。在零假设成立时,Q满足(r-1)个自由度的分布。
例题:
已知某型生态群落中A、B、C、D四类植物的比重分别为80%,12%,7%和1%。现观察某地共500株植物,发现四类植物的数量分别为380、69、43和8株。
试在5%的显著性水平下,判断该地生态群落是否为某型。
植物 O E O-E (O-E)^2 (O-E)^2/E
A 380 400 -20 400 1.00
B 69 60 9 81 1.35
C 43 35 8 64 1.83
D 8 5 3 9 1.80
合计 500 500 - - 5.98
查表得(4-1)=3个自由度,a=0.05的分布值为7.82,所以不能拒绝原假设。
二.列联表分析 列联表是调查数据处理中最常见的形式。列联表分析的目的在于研究两个变量之间是否存在相互影响的关系。可以认为是一种定类尺度的相关分析。
例题:
下例为三种不同类型电风扇在三个不同地带销售的数量情况。欲了解电风扇类型与地带之间是否存在相关关系。
热带 温带 寒带 合计
台式 14 30 4 48
落地式 67 105 60 232
台地式 30 13 14 57
合计 111 148 78 337
假定销售地区与销售产品类型之间没有相关关系,则同为台式电风扇,在热带、温带、寒带的销售数量比例应当等同于这三个地带购买电风扇数量的比例。
即:台式-热带=48111/337
同样可求出其余各单元格的期望数值
利用观察值与期望值之间的差异,可进行检验。
热带 温带 寒带 合计
台式 14/15.81 30/21.08 4/13.19 48
落地式 67/76.42 105/101.88 60/3.70 232
台地式 30/18.77 13/25.04 14/11.11 57
合计 111 148 78 337
Q值满足自由度为(R-1)(C-1)的分布
查表得4个自由度,a=0.05的值为9.49,拒绝原假设。
三.符号检验 对于一个只存在+、-两种符号的序列,考察两种符号的出现是否具有倾向性。
建立原假设 H0:P+=P-
计算两种符号的数量S+和S-,利用二项分布计算S+或S-出现的概率是否处于接受域。
在n>20的情况下,二项分布可以用正态分布进行近似
四.游程检验 游程检验又称连贯检验或串检验,用于考察一个序列中两种符号的出现次序是否随机。
一种符号连续出现的段称为一个游程。序列AABBAB共有四个游程,即AA、BB、A、B。
在符号随机出现的情况下,游程数应当适中。符号出现非随机的情况包括:
游程数过少:序列有成群的倾向
游程数过多:序列有混合的倾向
例题:
观察一个系列,分析30个脸谱的出现是否有规律AAAABBBBBBBBBBBBBBBBAAABBBBBBB。
H0:脸谱的出现是随机的
H1:脸谱的出现具有成群的倾向
当两种符号的数量之和m+n=N>20时,游程总数目U近似符合正态分布:
平均值:1+2mn/N
方差:2mn(2mn-N)/N*N*(N-1)
在本例中:m=7,n=23,N=30,U=4
计算Z值
P-level值为0.0002,拒绝原假设,即认为U过小,原序列有成群的倾向。
五.上下游程检验 上下游程(Runs Up and Down)亦称升降串,是利用观察值前后大小变化来进行游程检验的一种方法。
将数据按获得的先后顺序进行排列,将每个观察值与其前面的观察值进行比较,如果前面的数值较小,记+号,如果前面的数值较大,记-号。+、-号构成一个新的游程序列。
例如序列:7、15、1、2、5、8,经处理后转化为+、-、+、+、+。其中N=6,游程数V=3。
例题:
对24名儿童依次进行一项测试活动,获得下列分数序列:
31,23,36,43,41,44,12,26,43,75,2,3,15,13,78,24,13,27,86,61,13,7,6,8
转化成上下游程,为:-,+,+,-,+,-,+,+,+,-,+,+,-,+,-,-,+,+,-,-,-,-,+
其中游程数V=14,N=24
当N>25时,V满足正态分布:
均值:(2N-1)/3
方差:(16N-29)/90
分享到:
相关推荐
教育统计学课件假设检验部分适用于学习教育统计学或者统计学者
"统计学实验—SPSS与R软件应用与实例-第12章假设检验-R.ppt" 统计学实验第12章假设检验是统计学实验课程的重要组成部分,该章节主要介绍了假设检验的基本概念和方法,并通过R软件的应用来实现假设检验的操作。 一...
《统计学(第七版)》是由贾俊平教授编著,中国人民大学出版社出版的一本权威统计学教材。这本书深入浅出地介绍了统计学的基本概念、方法和应用,旨在帮助读者理解并掌握统计学的核心知识。提供的压缩包文件包含了50...
教程会详细讲解点估计(如均值的矩估计和极大似然估计)和区间估计,以及假设检验(如t检验、Z检验、卡方检验和F检验)。这些方法在科学研究和决策中广泛应用。 五、回归与相关性分析 回归分析用于探究两个或多个...
第7章 CDF和统计泛函的估计 第8章 Bootstrap方法 第9章 参数推断 第10章 假设检验和p值 第11章 贝叶斯推断 第12章 统计决策理论 第13章 线性回归和Logistic回归 第14章 多变量模型 第15章 独立性推断 第16章 因果...
假设检验是统计学中的核心概念,它用于确定一个观察到的数据模式是否可能源自于某个假设的总体分布。在科学实验、市场研究、医疗试验等领域,假设检验被广泛应用于验证假设或推翻理论。本章我们将深入探讨这个主题,...
《使用SPSS进行统计》第一章“统计学的必要性”中,作者们详细介绍了统计学在科学研究中的重要作用,以及如何利用SPSS软件有效地管理这些阶段。 #### 三、描述性统计基础 第二章“描述性统计”是统计分析的基石,...
假设检验是统计学中的核心概念,用于判断一个假设在给定的数据下是否合理。它主要应用于确定两个数据集之间的差异是否具有统计意义,或者在实验结果和预期之间是否存在显著性差异。在本章中,我们将深入理解假设检验...
2. 正态分布与假设检验:文档提及了正态分布的检验,比如“u^2”可能指的是正态分布的检验统计量,它与样本均值的平方有关。在统计学中,我们经常使用正态分布的性质来对总体参数进行推断。 3. 假设检验的基本概念...
《统计学-第七章-相关分析与回归分析》的学习教案主要涵盖了相关分析的基本概念和方法。相关分析是统计学中研究变量间关系的一种重要手段,它可以帮助我们理解两个或多个变量之间的关联程度和方向。 首先,相关关系...
第七章“统计指数”主要介绍各种经济和社会指标,如消费价格指数、生产价格指数等,它们用于衡量经济现象的变化趋势和幅度。 第八章“时间数列分析”专注于随时间变化的数据序列,涉及趋势分析、季节性分析、周期性...
#### 第7章:模型、统计推断和学习 - **统计模型**:介绍统计模型的概念及其构建过程。 - **参数估计**:讲解参数估计的方法,包括矩估计法、最大似然估计法等。 - **假设检验**:解释假设检验的基本原理,包括零...
而在第7章中提到的方差分析(ANOVA)更是处理多组数据均值比较问题的利器。这些方法和理论的掌握,为学生未来在学术研究或职业生涯中进行科学分析和决策提供了有力的支撑。 当学生已经掌握了统计推断的基础后,课程...
不过,根据文件名“统计学原理第5版第一章习题答案.pdf”,我们可以推测这部分内容可能涉及统计学基础知识、习题解答过程,以及一些统计学中的专业术语和概念。下面尝试按照这些信息碎片,整理出一些可能与统计学...
4. **第5章 假设检验**:假设检验是判断样本数据是否支持或否定某个统计假设的方法,常见的如t检验、卡方检验、F检验等,对决策制定至关重要。 5. **第6章 方差分析(ANOVA)**:方差分析用于比较多个组间的差异,...
- 假设检验流程:建立零假设和备择假设,计算统计量,确定显著性水平,做出决策。 7. **回归与相关** - 相关系数:衡量两个变量间线性关系的强度和方向。 - 线性回归模型:预测因变量与自变量之间的关系。 - ...
4. **第五章 假设检验1**:假设检验是判断样本数据是否支持某种假设的统计方法,本章可能涉及单样本t检验、Z检验等,用于判断差异是否显著。 5. **第六章 方差分析**(ANOVA):方差分析用于比较多个组间的平均差异...
《贾俊平统计学(第六版)》是统计学领域一本经典的教材,它全面系统地介绍了统计学的基本概念、原理和方法。这份压缩包文件包含了该教材的例题和练习题数据,对于学习和理解统计学知识具有极大的帮助。下面,我们将...