`
384444165
  • 浏览: 256285 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

正态概率图

阅读更多

最近复习概率统计,今天拿起来买回来放置了一段时间的《统计思维》看,第四章连续分布讲到一个陌生的名字,正态概率图,书上写的感觉不清楚,起码翻译版的是这样的。没记错的话本科老师也没有讲到,就写一下起码为没讲的学弟学妹们补充补充必要知识。

先摘录一下书上说的,对于指数分布(x & ln(1-cdf(x)))、帕累托分布(lnx & ln(1-cdf(x)))、威布尔分布(lnln(1/(1-cdf(x))) & lnx),都可以通过简单的转换来判断一个连续分布数是否能用于某份数据集的建模(上述括号内的对应函数均为直线,只需要判断样本数据是否能拟合成一条直线即可)。但是正态分布就不存在这样的变换,这里就需要正态概率图来判断。

先说《统计学》上讲到的标准做法(貌似书的bug也比较严重,修正了一下):

1. 将数据从小到大排列,并从1~n标号,为x1,x2,…,xj,…,xn。     

2. 求出样本观测值的标准正态分数zi,使得zi满足

1-α= (j-0.5)/n = P(Z<=z) = Φ(z)

例如,如果(j-0.5)/n=0.95,即Φ(zi)=0.95,也就意味着zi=1.645。[F(ua) =1-a, 上侧分位数P{U≥ua}=a]

3. 将zi作为纵轴,xj作为横轴,绘图,就是标准正态概率图。(即排序后的第j个数据xj对应zi,这里j和i取不同我觉着是为了说明数据不一定完全符合正态分布,zi中的i表示z的序列中第i个对应xj。)

4. 最后画一条拟合大多数点的直线。原理就是如果数据严格意义上服从正态分布,点将形或一条直线。将点形成的图形与画的直线相比较,判断数据拟合正态分布的好坏。对于为什么-0.5我认为应该是为了保证所有的阿尔法值处在(0,1)区间,两个数相差1,所以取0.5这个中间值,覆盖所有n+1个数的中间位置。

 

以上是理想方法,或者手工方法。这样再看统计思维说的方法就很明白了,因为更实用的方式肯定不是一直去查表得到一个结果,更通用的方式是用大量符合N(0,1)的数值拟合标准正态分布,只要能生成满足分布的随机数值,那么对于其他分布的验证,这个方式也同样适用。

随后文中提到大数据量的生成和计算也是代价较大的,因此提出了一种近似方案。

1. 从N(0,1)分布生成一个跟数据大小一样的样本。

2. 升值排序

3. 作图

 

其实跟理论方法差不多,只是可能操作起来更方便一些,理想方法可以在程序维持一个分数表就可以实现了,也不是太复杂;后面讲到的方法更有普适性。

 

抽了点时间写博分享一下,理解也更透彻了一些。最近写博少,期待最近还有东西可以分享。

 

参考文献:

1. Think Stats(Probability and Statistics for Programmers) 作者 Allen B. Downey

2. 统计学  作者:贾俊平

3. 正态概率图讲解http://wenku.baidu.com/view/03c56baddd3383c4bb4cd2ae

4. 再附上一个Weibull分布的说明吧

http://www.phsciencedata.cn/Share/wiki/wikiView?id=5d817414-eebf-401a-9b44-1d394e335de6

 

0
0
分享到:
评论

相关推荐

    正态分布概率分布图进行推理.doc

    以贝叶斯序惯理性和共轭先验分布为前提,把的先验分布设定为平均值,标准偏差的正态分布,观测的信息遵循平均值,标准偏差的正态分布。

    正态分布概率密度图及其模板.zip

    由于分析数据的需要,研究了一下正态分布图,经过在网上的总结,自己通过Excel绘制出了正态分布图,实际也可以叫正态分布概率密度图,正态分布图里面包含着积分学和概率学知识,大学学的东西到现在已经还给老师了,...

    正态分布曲线图计算

    正态分布曲线图,也称为高斯分布,是统计学中一种极其重要的概率分布模型,广泛应用于各种领域,如自然科学、社会科学、经济金融等。它描述了一种对称分布,其中数据集中在平均值(均值)周围,且分布的形状由均值和...

    正态分布图2021高级版.zip

    正态分布图是一种在统计学中广泛使用的图表类型,它描绘了数据集的分布情况,尤其是在数据呈现对称性、单峰性和集中趋势时。2021高级版的正态分布图可能包含了更先进的功能和特性,以帮助用户更好地理解和分析数据。...

    使用C语言产生正态分布的随机数的源代码

    为了验证随机数符合正态分布,可以进一步使用`normfit`函数进行拟合,获取理论上的均值和标准差,以及`normplot`函数创建正态概率图,对比实际数据与理论正态分布的吻合程度。 总的来说,这个压缩包包含了一个C程序...

    二维正态概率密度

    用Microsoft Mathematics打开

    SAS数据的描述性统计分析答案.doc

    4. 在使用UNIVARIATE过程进行数据分析时,需要添加plot选项来输出茎叶图、正态概率图等。 5. 在输出结果中,Prob &gt; |t|是对样本均值为零的T检验的概率值。 第二部分:实验题 本部分通过实验来演示SAS数据的描述性...

    使用python绘制3维正态分布图的方法

    今天使用python画了几个好玩的3D展示图,现在分享给大家。 先贴上图片 使用的python工具包为: from matplotlib import pyplot as plt import numpy as np from mpl_toolkits.mplot3d import Axes3D 在贴代码...

    matlab 概率图纸代码 正态分布 对数正态分布 伽马分布

    matlab 概率图纸代码 正态分布 对数正态分布 伽马分布

    Excel直方图和正态分布图.rar

    Excel直方图和正态分布图.rar,直方图是将某期间所收集的计量值数据经分组整理成次数统计表,并使用柱形予以图形化的图表...正态分布是在统计中使用最频繁的分布,正态分布图描述收集的数据在分组区间内出现的概率,其曲

    sas各过程笔记 描述性统计 线性回归 logistic回归 生存分析 判别分析 聚类分析 主成分分析 因子分析 典型相关分析

    描述性统计是对数据的基本描述,包括均值、方差、标准差、 四分位数、百分位数、茎叶图、箱形图、正态概率图等。SAS 中使用proc means 过程来计算这些统计量。 freq 语句 freq 语句用于计算频数表,例如(proc freq...

    二元正态分布密度函数图像

    在二维平面上,二元正态分布形成一个连续的概率密度函数(PDF),其形状由相关系数ρ、两个变量的标准差σ1和σ2以及它们的均值μ1和μ2决定。 首先,让我们详细了解二元正态分布的密度函数。该函数形式为: f(x, ...

    正态分布图EXCEL教程

    在数据分析和统计学中,正态分布是一种非常重要的概率分布模型,它被广泛应用于各种自然和社会现象中。Excel是一款强大的电子表格工具,其中包含了多种数据分析功能,包括绘制正态分布图。本教程将深入讲解如何利用...

    017_标准正态分布概率计算1

    分布如图:其概率密度公式为:其中为标准差,为均值当μ=0,σ=1时称随机变量X服从标准正态分布,其概率密度为:标准正态分布的概率即为φ(x)的标准正态分布的概率

    WPF利用visifire画正态曲线分布图

    正态分布,也称为高斯分布,是一种在统计学中非常常见的连续概率分布。它在许多自然现象中都有所体现,如人的身高、体重等。正态分布以一个平均值(均值)为中心,分布形状对称,具有一个标准偏差,用于衡量数据的...

    正态分布和线性回归.doc

    正态分布和线性回归是统计学中的两个重要概念,它们在数据分析和预测模型中扮演着关键角色。...通过正态概率图或Shapiro-Wilk检验,我们可以判断残差是否近似服从正态分布,从而对线性回归模型的适用性进行评估。

    用labview实现的正态分布的随机数并生成对应的直方图

    用labview实现的正态分布的随机数并生成对应的直方图(Achieved with labview normally distributed random numbers and generate the corresponding histogram)

    SPC统计过程控制课件.pptx

    第二章介绍了Minitab的基本技能,这是一个广泛使用的统计软件,能够帮助用户进行数据分析和图表制作,包括对数据进行正态性检验的正态概率图。正态分布是统计学中的一个重要概念,许多自然现象和过程数据往往遵循...

    用Excel做数据分析——回归分析.docx

    残差图可以显示数据点与拟合直线之间的差距,线性拟合图可以显示拟合直线的参数,正态概率图可以显示数据的分布情况。 在回归分析中,我们可以获得许多有价值的信息,例如残差分析、线性拟合分析、正态概率分析等,...

    正态分布的定义与表格.pptx

    如果直方图呈现出钟形且对称,可以考虑用正态分布进行拟合,并通过正态概率图或Q-Q图进一步验证。此外,还可以使用Shapiro-Wilk、Kolmogorov-Smirnov等统计检验来检验数据是否符合正态分布。 总之,正态分布是...

Global site tag (gtag.js) - Google Analytics