今天看为了准备排队论考试复习了下概率论,看到样本的方差公式除数是n-1,对此很不解。因此查了一些资料并请教了一个学数学出身的朋友。
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
X表示样本均值=(X1+X2+...+Xn)/n
以下是我的理解(感性的认识):
要求总体分布的方差,而我们使用的是样本。计算的是样本值和样本均值的距离。但是如果客观来说,我们应该计算样本值和u的距离。也就是说,我们用样本值代表u是有一定误差的。为了减小这个误差,我们使用了n-1.
百度知道的回答:
首先,用真正的(Xi-μ)^2来看,方差本应该是与μ的差,而不是样本均值的差,增加一个数,就多一个(Xi-μ)^2,n个数据,这n个数据与μ是无关的,就该是n个这相加后除n。也就是自由度是n
但是,用样本均值来减,从这来看X1+X2+...+Xn=nX,这个地方也就是说n个数据与X相关,这就少了一个自由度,从而,用(Xi-X)^2计算时,会相当少了一个原本(Xi-μ)^2。故除n-1。其实这讲得也不太准确,我也不知道怎么说好。
主要还是X1+X2+...+Xn=nX,这个计算出的X,Xi-X这所有相加为0,也就是少了个了,少了什么,我也不知怎么说,自己想吧
验证n-1的正确性
总体方差为σ2
均值为μ
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
X表示样本均值=(X1+X2+...+Xn)/n
设A=(X1-X)^2+(X2-X)^2....+(Xn-X)^2
E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=E[(X1)^2-2X*X1+X^2+(X2)^2-2X*X2+X^2+(X2-X)^2....+(Xn)^2-2X*Xn+X^2]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(X1+X2+...+Xn)]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(nX)]
=E[(X1)^2+(X2)^2...+(Xn)^2-nX^2]
而
E(Xi)^2=D(Xi)+[E(Xi)]^2
=σ2+μ2
E(X)^2
=D(X)+[E(X)]^2
=σ2/n+μ2
所以
E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=n(σ2+μ2)-n(σ2/n+μ2)
=(n-1)σ2
所以为了保证样本方差的无偏性
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
E(S)=(n-1)σ2/(n-1)=σ2
分享到:
相关推荐
\[ V_n = cV_{n-1} + \frac{1}{n}\left[\frac{(n-1)^2\mu_{n-1}^2 - 2(n-1)\mu_{n-1}X_n + nX_n^2 - (n-1)^2\mu_{n-1}^2 + 2(n-1)\mu_{n-1}X_n - nX_n^2}{n^2}\right] \] 6. 简化并合并同类项,注意到 \( \frac{(n-...
对于样本方差,我们证明 E[(n-1)S^2/σ^2] = n-1,这表明 S^2 是 σ^2 的无偏估计量。 总结来说,抽样分布是理解样本统计量如何围绕总体参数波动的关键。在正态总体的假设下,样本均值的抽样分布为正态分布,样本...
- **样本方差**:设\( X_1, X_2, \ldots, X_n \)是从总体中抽取的一个简单随机样本,则样本方差\( S^2 \)定义为\( S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2 \),其中\( \bar{X} \)为样本均值。...
9. **统计软件应用**:在实际应用中,概率论与数理统计往往与统计软件结合,书中可能包含如何使用R、SPSS等软件进行数据分析的实例。 这本书不仅适合大学数学专业学生学习,也适用于对统计学感兴趣的其他领域的学者...
2. 计算μ的95%置信区间,使用t分布,公式为(1-sx/tn)±t(α/2, n-1),其中s为样本标准差,t为t分布的临界值,n为样本量。 3. 对于σ的95%置信区间,当σ未知时,使用t分布进行估计,公式为(Sn/S) * t(α/2, n-1) ±...
3. **统计推断**:这部分可能涉及到样本统计量的计算,如均值、方差、标准差,以及参数估计,包括点估计和区间估计。此外,可能还会有假设检验,比如t检验、Z检验、卡方检验等,用于判断样本数据是否支持某一假设。 ...
数理统计中的方差分析(Analysis of Variance,简称ANOVA)是一种强大的统计方法,用于比较两个或多个组之间的平均差异是否显著。这种方法基于方差的分解,通过检验不同来源的方差来判断各组间是否存在显著差异。...
- 题目中提到随机变量$X$服从二项分布$X \sim b(n, p)$,其累积分布函数$F(x)$的性质有$F(1) = (1 - p)^n + np(1 - p)^{n-1}$和$F(n) - F(n - 1) = pn$。 3. **二维随机变量的分布**: - 对于二维随机变量$(X, Y)...
《概率论与数理统计》是一门在数学、统计学、计算机科学以及众多工程领域中至关重要的课程。它主要研究随机现象的规律性,通过量化不确定性的概念来理解和预测复杂系统的性质。本压缩包包含的是这门课程第1至8章的...
主要内容包括概率论中的一些课题、统计模型、估计方法、估计的比较——最优化理论、从估计到置信区间和假设检验、最优化检验与置信区间——似然比检验及有关方法,线性模型——回归和方差分析,离散数《数理统计习题...
综上所述,这些知识点覆盖了数理统计中的一些基本概念和方法,包括经验分布函数、参数估计(如矩估计和极大似然估计)、克拉默-拉奥不等式、置信区间以及方差分析等。这些方法和技术在实际应用中非常有用,可以帮助...
2. 抽样分布:当样本容量足够大时,样本统计量会遵循特定的分布,如t分布、z分布和卡方分布,这些抽样分布是进行假设检验的基础。 三、假设检验 1. 假设检验是数理统计中重要的一环,用于判断观察到的数据是否支持...
本文将介绍概率论与数理统计中一些基本的概念、公式及定理。 首先,概率论中涉及的随机事件与概率的基本公式包括了概率的加法原理、减法原理、乘法原理和全概率公式。概率的加法原理指出,两个不相容事件A和B发生的...
1. 题目中提到的考试可能是某大学的概率论与数理统计课程的期中或期末试卷,重点考察学生对概率分布、期望值、条件概率等基本概念的理解和应用。 2. 第一题涉及到的是概率的计算。问题1要求计算某个事件发生的概率...
数理统计则是从数据中提取信息的科学,包括参数估计、假设检验、回归分析、方差分析、卡方检验等。如2015-2016学年秋季学期的试卷中,可能会涉及求样本均值、标准差,进行t检验或F检验,或者运用线性回归分析数据...
- 样本方差(sample variance):文档中提到的s²表示样本方差,它是衡量数据分散程度的一个统计量。 3. 概率密度函数(probability density function, PDF)和累积分布函数(cumulative distribution function, CDF):...
总结来说,数学期望和方差作为概率论与数理统计中的基石,为我们在复杂多变的现实世界中提供了理解和处理随机性的科学方法。通过本课件的学习,我们希望同学们能够在理解概念的基础上,熟练掌握数学期望和方差的计算...
《概率论与数理统计》是现代数学中一个极其重要的分支,它主要研究随机现象和不确定性问题。自20世纪以来,该学科的发展日益成熟,为科研、工程、经济、金融等多个领域提供了坚实的理论基础和解决问题的方法。在这一...