统计学
官方一点的定义:
统计学是一门通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学
统计可以这样简单的来理解.统计就是收集各种各样的数据,然后对这些数据做一些分析,得出一些有用的结论.政府不是有个部门叫统计局嘛
收集的数据相同,结论未必相同.有些比较坑爹的会拿些不具普遍性的数据来得出些结论.比如某个地方的村民去年收入几千元,但可能村里有一个比较有钱的煤老板,年收入同千万.结论可以是村民的平均收入几十万啊.所以一些特殊的数据应该剔除掉才行.在一些歌唱比赛节目中有时不有啥去掉最高分最低分这样的场景嘛.
为了使收集的数据比较有代表性.就出现了一些专业的方法,比如啥简单随机抽样,分层抽样,等距抽样,整体抽样,多阶段抽样.
分析收集到的数据时会使用啥标准差,方差来衡量下样本数据波动大小啊. 会以一些图表来形象的展示数据反映的一些规律啊.有些规律还可以用些函数表示,比如有啥二次分布,正太分布之类的啊.
统计在各行各业应用的非常广泛.
统计学在计算机中领域的应用
在计算机领域跟统计学相关的最热门的可能算自然语言处理(Natural Language Processing),简称NLP.
传统的语言处理是以乔姆斯基的理论为代表,根据完善的语法规则来推导出哪些语言表达是正确的,哪些是不正确的.这在计算机程序语言的处理中非常有用,比如编译器编译你的源码时就按照那些标准的语法规则来判断你的代码是否写错了,就算词法和句法没错,但语义有歧义也会报错.
但我们用的自然语言可比程序语言复杂的多了,按固定的语法来推导一来嘛很难做到绝对正确,因为人们在使用语法的过程中总会扩展和改变一些语法规则.二来嘛我们很多时候使用语言不需要做到有多精确,只要能满足交流,获取信息的目的就行了.于是统计自然语言处理就出现了. 我们会收集很多语料,然后形成一个个的语库.这样我们就不再管一些语句或短语是否符合语法规则.而是看常用的使用形式是啥样.比如一些词之间有些啥常用的搭配(有可能符合语法规则也有可能不符合).
这样通过统计得到的经验规律用在输入法的智能提示,用在翻译,搜索引擎中会带来非常大的用处.
概率
统计的思想是比较好理解,但概率思想其实是非常非常不好理解的,很多人是很难想通的(当然了前提是你真有去深入的想了).当然了描述下什么是概率大家基本都知道.简单的说就是一件事有多大的可能性发生.刚开始大家不知道概率的理论,认为很多事情都是随机发生,比如抛骰子,抛硬币都是随机的.但通过多次实验,多次统计.就会得到规律,知道某些事情会有多大的可能性发生.进而可以事前进行推断了.所以可以这样说概率是从统计中归纳推理出来的规律,经验.当然了还有些独立于统计的概率计算的公式.
概率与平行宇宙
那可能会问为什么为有概率这东西啊? 如果说抛骰子,抛硬币这样的事你还可以认为反正都是受物理规律影响,你如果能做到初始条件完全一样,比如抛的角度和方面,周围的其他因素完全一样那结果永远是确定的,不存在啥忽悠人的概率.但量子力学里面有个著名的故事叫薛定谔的猫http://baike.baidu.com/view/4559339.htm
这个故事我们可以知道即使初条件一样也会存在概率.有一个理论叫平行宇宙,这理论可以很好的解释概率论的问题.平行宇宙的大概意思是,实际上我们周围存在着无数多个平行的宇宙与空间,当有概率发生一件事,实际上各种可能性都同时发生了,只不过发生在平行的不同宇宙中.比如你抛一个硬币后,从此刻起分划分出两个空间和宇宙,一个里面是硬币朝上,另一个是朝下.不过关于这两宇宙之间的联系,以及你在同一个宇宙中会啥会有延续的同一的感觉,不同宇宙中的你会有联系不,这个貌似就有点复杂的,想不太明白了啊.哎反正平行宇宙本身是比较抽象,不太容易用经验感性思维来类比的,不好理解.
概率在日常中的用处其实可以用句简单的话来说:就是趋吉避凶.哪个有利的事发生的概率越高我们就去做,某个有害的事发生的概率越高我们就要尽量去避免.当然了计算出概率的过程可能比较复杂,涉及到很多公式.
另外实际上很多人做决定时都是非理性的,不按概率来,像买彩票,赢的概率都非常小.但大学都抱着侥幸的心态,认为自己可能会碰到那小概率
分享到:
相关推荐
北京科技大学的研究生数理统计期末考试试卷为学生们提供了一个宝贵的复习资源,尤其对于正在学习随机过程或数理统计课程的同学来说,这些试卷能够帮助他们深入理解和掌握课程的核心知识点。 首先,数理统计的学习离...
这些课件,如"01-第一次课(第一章前四节).pdf"、"02-第二次课.pdf"等,通常包含了课程的主要内容和教学重点,能够帮助学生回顾课堂讲解,清晰地梳理出课程脉络。课件中的图表和例子有助于直观理解抽象的概念,如随机...
《概率论与数理统计》是一门在数学、统计学、计算机科学以及众多工程领域中至关重要的课程。它主要研究随机现象的规律性,通过量化不确定性的概念来理解和预测复杂系统的性质。本压缩包包含的是这门课程第1至8章的...
《统计学习方法》是清华大学开设的一门重要课程,旨在教授如何利用统计理论和算法来解决实际的机器学习问题。这门课程涵盖了多个经典的统计学习模型和技术,包括k-最近邻(k-nearest neighbors, k-NN)、朴素贝叶斯...
《东北大学概率论前四章思维导图整理及课后习题答案》是针对学习概率论与数理统计课程的学生们的重要参考资料。本资源包含了该课程前四个章节的思维导图整理,帮助学生系统地理解和掌握概率论的基础概念、原理和方法...
对于青岛科技大学各专业学生而言,掌握概率论与数理统计的知识至关重要,无论你是理工科生,还是经济管理类学生。这门课程不仅有助于提高逻辑思维能力,也是许多高级课程如机器学习、金融工程的基础。 通过完成这35...
这是一套由华中科技大学精心制作的课程资源,旨在深入探讨应用语言学与统计学在实践中的结合,特别是如何利用SPSS这一强大的统计分析工具进行数据分析和数据挖掘。课程共计54页的英文PPT,内容详实丰富,对于希望...
浙江大学的"概率和习题word版"是一套针对概率论与数理统计课程的教学资源,主要面向学习者提供深入理解和掌握概率论基本概念、理论和方法的材料。这份资料涵盖了概率论的基础知识,如随机事件、概率的定义、条件概率...
总的来说,华南理工大学的数理统计课程注重理论与实践相结合,通过历年试题和课后习题的回顾,帮助学生掌握统计学的核心概念和技术,为他们在未来的学习和工作中处理数据和做决策打下坚实基础。
通过研习浙大概率论与数理统计课后答案,学生可以系统地回顾课程内容,加深对概率分布、统计推断和假设检验等核心概念的理解,提升数据分析和问题解决的能力。同时,通过解题训练,可以提高逻辑思维和计算技巧,为...
10. **第十三讲:感知机与统计学习方法总结** - 感知机是最早的机器学习算法之一,本讲回顾了其基本原理,并对整个课程的学习进行了总结,强调了统计学习方法的重要性。 这些课件不仅涵盖了机器学习的基础理论,还...
"随机一页纸"可能是教师整理的一份复习资料,浓缩了课程的重点,适合考试前快速回顾和记忆。 PDF文档如“[随机过程及应用习题集].张晓军.陈良均.扫描版-1.PDF”等可能是教师推荐的额外阅读材料,可能包含更深入的...
高数,全称高等数学,是理工科学子必修的基础课程,它涵盖了微积分、线性代数、概率统计等多个领域。对于学生来说,理解和掌握高数的知识点至关重要,因为它不仅在后续的专业课程中广泛应用,也是衡量一个人逻辑思维...
总的来说,这本教材不仅适用于大学本科阶段的数学学习,也适合自学者或者需要回顾基础知识的专业人士。通过深入学习,可以提升对数学的理解,培养逻辑思维能力和抽象思考能力,为未来的学习和工作打下坚实的基础。
《信号检测与估计》是电子科技大学研究生研一的一门核心课程,主要研究的是在噪声环境中的信号处理技术,包括信号的检测和参数估计。这门课程涵盖了矩阵与向量的回顾、概率论基础以及信号检测与估计的理论,旨在培养...
在大学物理的学习中,气体动理论是一门非常重要的课程,它深入探讨了气体的基本性质、行为规律以及微观粒子运动的统计规律。这份“大学物理复习思维导图 气体动理论.zip”压缩包文件,显然是为了帮助学生系统地整理...
马尔科夫模型是自然语言处理中的一个重要概念,尤其在哈尔滨工业大学计算机学院的智能技术与自然语言处理技术课程中被详细讲解。这门课程面向需要学习自然语言处理的研究生,内容涵盖从基础知识到具体应用的多个方面...
【概率论与数理统计】是数学领域中的一个重要分支,主要研究随机现象的数量规律性,为其他科学领域如统计学、计算机科学、经济学等提供理论基础。浙大的这门课程以其深入浅出的教学方式和丰富的学习资源深受学生喜爱...