一.什么是贝叶斯
贝叶斯是数学统计分类发放.可以预测类成员关系的可能性.如果直接说起贝叶斯.那么他就是一个数学模型.
数学模型我的理解就是.将显示生活中的一些现象通过.数学公式予以表示.
二.关于贝叶斯朴素分类
我们希望得出P(C|D) D=document(文档) C=category(类别) 如果八股一点可以这么陈述.在条件C下.D的后验概率.
那么完整的贝叶斯公式就是 P(C|D) = P(D|C)*P(C)/P(D)
下面我们分别讲述每一个概率的含义
我们做个大胆的假设.每篇文章只有一个单词.那么就认为是一个term(向量) T
于是我么的公式可以改写为 P(C|T) = P(T|C)*P(C)/P(T)
其中
P(C|T) 是这个T(向量,单词) 属于C类别的概率
P(T|C) 是这个分类中T出现的概率
P(C) 是这个分类在总体情况下所占的比例
P(T) 是这个单词在所有情况下所占的比例
Ok.解释清楚了现在我们套用这个做个例子
有如下结构
C1(0.4) |
C2(0.6) |
IOS:30, JAVA:10 |
Android:30,JAVA:20 |
D:用户输入的document 中假设只有一个词 java 那么让我们来计算这篇文章应该属于哪个分类
假设 当用户发表一个文章.属于C1的概率为0.4 属于C2的概率为0.6
将'java'(单词)认为为T
P(T|C1) = 10/40 = 0.25
P(T|C2) = 20/50 = 0.4
P(C1) = 0.4
P(C2) = 0.6
P(T)=P(T|C1)*P(C1)+P(T|C2)*P(C2)=0.25*0.4+0.4*0.6=0.34
P(C1|T) = P(T|C1)*P(C1) /P(T) :这个就是这篇文章属于分类1的概率
带入公式 P(C1|T) = 0.25*0.4/0.34=0.29411764705882352941176470588235
计算属于C2的概率如下
P(C2|T) = P(T|C2)*P(C2) /P(T) :这个就是这篇文章属于分类1的概率
带入公式 P(C2|T) = 0.4*0.6/0.34= 0.70588235294117647058823529411765
可以看出P(C1|T)<P(C2|T) 那么这个文章应该属于分类2
恩介绍完了.
分享到:
相关推荐
朴素贝叶斯学习笔记完整版 本资源摘要信息涵盖了朴素贝叶斯学习笔记的完整版,涵盖贝叶斯分类的基本概念、贝叶斯定理、条件概率、朴素贝叶斯分类等知识点。 贝叶斯分类 贝叶斯分类是一类分类算法的总称,这类算法...
朴素贝叶斯算法学习笔记2 朴素贝叶斯算法是一种经典的机器学习算法,它的应用范围非常广泛,涵盖了自然语言处理、信息检索、数据挖掘等多个领域。朴素贝叶斯算法的优点是简单、易于实现、计算效率高,且对数据的...
朴素贝叶斯算法学习笔记 一、朴素贝叶斯算法与分类问题 朴素贝叶斯算法是机器学习中的一种常用算法,它的基础是概率问题,分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的...
朴素贝叶斯学习笔记,和文本分类代码实现。可用于不明白朴素贝叶斯算法或者不知道改如何调用python的sklearn实现朴素贝叶斯算法的初学者
1. 处理不完全数据:贝叶斯学习能有效处理缺失值,因为它考虑了变量间的相关性。 2. 学习因果关系:贝叶斯网络能够建模变量间的因果联系,有助于理解和预测。 3. 结合领域知识和数据:贝叶斯网络结合了先验信息和...
朴素贝叶斯分类器是一种基于概率的机器学习算法,广泛应用于文本分类、垃圾邮件过滤、情感分析等场合。学习朴素贝叶斯分类器,需要了解贝叶斯定理、朴素贝叶斯算法原理以及三种常见的朴素贝叶斯模型:高斯模型、...
贝叶斯机器学习笔记本 该存储库是有关贝叶斯机器学习的笔记本的集合。 以下链接通过显示了一些笔记本,以确保正确呈现公式。 依赖关系在子目录中的requirements.txt文件中指定。 。 贝叶斯线性回归简介。 用普通的...
《机器学习学习笔记》是由Jim Liang编写的700多页的PPT教程,它为初学者提供了全面而深入的机器学习入门指导。这份资料涵盖了广泛的机器学习主题,包括基础概念、算法以及实践应用。以下是对每个主要知识点的详细...
朴素贝叶斯是一种广泛应用的机器学习算法,尤其在文本分类和垃圾邮件过滤等领域表现出色。它的理论基础是贝叶斯定理,同时依赖于特征条件独立性的假设。 **贝叶斯定理** 是概率论中的一个核心概念,它描述了在已知...
本资源包含中文版和英文版电子档,以及学习笔记和习题解答,对于自学者或教师来说,都是非常宝贵的学习材料。 首先,我们要理解模式识别是机器学习的一个重要分支,其主要目标是从数据中提取有用信息,识别出隐藏的...
学习了机器学习的基础以及相关理论,颇有收获,并做了相关笔记,对于机器学习有了更为深入的理解,为以后的学习以及研究打下基础。 主要内容包含以下相关主题: - 模型的评估与选择 - 神经网络 - 支持向量机 - ...
这份"深度学习高数学习笔记"包含了山时光团队在网易云课堂上讲解的《深度学习数学基础》系列课程的精华内容,是深入理解深度学习必备的数学基础知识。 高等数学是所有理工科专业学生的基础课程,对于深度学习来说,...
贝叶斯机器学习笔记本本资料库是有关贝叶斯机器学习的笔记本的集合。 以下链接通过nbviewer显示笔记本,以确保正确呈现公式。 更新:PyMC3和贝叶斯机器学习笔记本该存储库是有关贝叶斯机器学习的笔记本的集合。 以下...
### 机器学习笔记 Bishop版PAML #### 一、引言 在《模式识别与机器学习》(Pattern Recognition and Machine Learning, PRML)这本由Christopher M. Bishop撰写的著作中,作者系统地介绍了机器学习的基本理论和技术...
《机器学习笔记》是基于Andrew Ng的机器学习课程编写的,包含了作者的个人理解和实践心得。这份笔记深入浅出地探讨了多个机器学习的核心概念和技术,旨在帮助读者掌握这一领域的关键知识。 首先,我们从“线性回归...
《机器学习》贝叶斯分类器学习笔记前半部分实现代码,包含“朴素贝叶斯分类器”和“半朴素贝叶斯分类器”。从数据集正、反样例各挑选3例,“半朴素贝叶斯分类器”判断结果完全正确。“朴素贝叶斯分类器”仅对1例正例...
机器学习主要分为监督学习、无监督学习、半监督学习和强化学习四大类。本部分主要介绍监督学习与无监督学习中的几种常见方法。 ##### 二分类 二分类是机器学习中最基本的分类任务之一。在二分类中,数据样本被分为...
标题“BLnotebooks:贝叶斯学习教材的笔记本”揭示了这是一个与贝叶斯学习相关的资源集合,特别是以笔记本的形式呈现,这通常意味着它包含了一系列的代码示例和解释,便于学习者理解贝叶斯理论并进行实践。贝叶斯学习...