`

机器学习1-基本概念

 
阅读更多

参考: https://www.jianshu.com/p/cbe8e0fe7b2c

 

 

数据集 

(色泽=青绿;根蒂=蜷缩;敲声=浊响)
(色泽=墨绿;根蒂=稍蜷;敲声=沉闷)
(色泽=浅白;根蒂=硬挺;敲声=清脆)
······

 

基本概念:

1、样本——这批数据里的每对括号。
2、数据集——样本的集合。
3、特征、属性——色泽、根蒂、敲声等反映事物的本质的可观察方面。
4、属性值——青旅、墨绿、蜷缩、浊响等,是属性的取值。
5、属性空间、样本空间、输入空间——属性张成的空间。把属性当作坐标轴,形成一个空间,那么样本就是这个空间中一个个的点。例如,吧“色泽”、“根蒂”、“敲声”作为坐标轴,则生成一个三维空间,每个西瓜都是这个空间里的一个点。
6、维数——数据集的特征数量。本例中的维数是3。
7、假设——也称假设函数,指计算机通过学习后得到的一个函数(预测模型)。
8、标记——关于样本结果的信息,比如一个(色泽=青绿;根蒂=蜷缩;敲声=浊响)的西瓜是好瓜,那么“好瓜”就是(色泽=青绿;根蒂=蜷缩;敲声=浊响)这个样本的标记。
9、样例——带有标记的样本,比如((色泽=青绿;根蒂=蜷缩;敲声=浊响),好瓜)
10、标记空间、输出空间——所有标记的集合。本例中就是指{好瓜、坏瓜}。
11、泛化——如果用某个数据集的样本训练出的一个模型(假设函数),能够适用于新的样本数据,就说这个模型具有泛化能力。模型能适用于越多的新数据,则说明其泛化能力越强。
12.假设空间----所有假设组成的空间,假设颜色有2种(深绿,浅绿),根蒂有2种(蜷缩,稍蜷),敲声有2种(浊响,沉闷),有可能好瓜与颜色无关,因此颜色有3种可能性(深绿,浅绿,无关),依次类推,根蒂,敲声都有3种可能性,共有3*3*3种可能, 还有可能好瓜这种假设根本不成立,因此一共有3*3*3+1种假设
推广: 假设一个事物有2个特征,每个特征的属性分别有x 种和y种,那么假设空间就有(x+1)*(y+1)+1种
 
13. 版本空间: 可能对于一个训练集,有多种假设都满足要求,这多种符合要求的假设构成了版本空间

分类 : 预测离散值,比如好瓜和坏瓜

回归:预测连续值,比如房价与面积的关系

 

归纳偏好: 算法对某种类型假设的偏好

 过拟合: 机器学习需要从训练集训练处一个模型,能够很好的应用于新的样本,当模型把训练集中的某些特征当做了普遍规律,很可能无法适用于新集合,就产生了过拟合

分享到:
评论

相关推荐

    机器学习-卷积神经网络

    卷积神经网络的基本概念 卷积神经网络是由多个卷积层和池化层组成的。卷积层负责提取图像中的特征,而池化层则负责降低维度和减少参数。卷积神经网络的输出结果是通过反向传播算法来优化的。 卷积层 卷积层是卷积...

    哈工大机器学习课件-1

    哈工大机器学习课件-1详细介绍了机器学习的各个方面,不仅包括了基本概念、理论基础和算法,还对机器学习的未来进行了展望。课程内容深入浅出,既适合于专业研究人员,也适合于对人工智能感兴趣的初学者。通过学习...

    吴恩达机器学习作业-Notes-ML-AndrewNg-master.zip

    通过吴恩达的机器学习课程,学习者不仅可以掌握基本的机器学习算法,还能了解到如何在实际问题中选择合适的模型,进行特征工程,优化模型参数,以及评估模型性能。这个过程中,理论与实践相结合,确保学习者具备解决...

    机器学习-概念学习 PPT

    ### 机器学习之概念学习详解 #### 一、引言 机器学习中的概念学习是一种重要的学习方式,它涉及从特定的训练样例中提取出一般性的概念或规则。这一过程通常被视为从训练样本中推导出能够应用于更广泛场景的通用...

    机器学习--龙星计划

    1. 基础概念:包括机器学习的基本定义、模型、损失函数、优化算法等。 2. 线性代数与概率统计:这是理解机器学习的基础,包括矩阵运算、向量、多元统计分析等。 3. 模型选择:讨论线性回归、逻辑回归、支持向量机、...

    python机器学习教程-从零开始掌握Python机器学习:十四步教程.pdf

    在具备了Python基础之后,可以开始学习机器学习的基本概念和技巧。机器学习是一门涉及统计学、概率论和优化算法的学科,旨在让计算机通过数据学习并做出预测。不必一开始就深入理论,而是应该关注实践中常用的算法,...

    项目九 认识机器学习-任务1掌握机器学习的基本概念.pptx

    ### 项目九 认识机器学习—任务1掌握机器学习的基本概念 #### 一、引言 本项目旨在介绍机器学习的基本概念及其应用场景。通过一个生动的故事引入机器学习的概念,并结合实际生活中的例子来帮助理解机器学习的工作...

    daacheng#pythonForMachineLearning#机器学习笔记一--基本概念1

    1. 决策树Decision Tree(ID3决策树归纳算法) 2. 临近取样Nearest Neighbor(KNN) 3. 支持向量机Support Vec

    机器学习---线性代数

    本资源摘要信息讲解了机器学习中的线性代数知识点,包括矩阵的基本运算、特殊矩阵、伴随矩阵、行列式计算、矩阵的秩、求解矩阵的逆与解矩阵方程等。这些知识点是机器学习的数学基础,理解这些知识点是学习机器学习的...

    机器学习实践-案例应用解析-Python机器学习-Python机器学习及实践

    本章节将对机器学习的基础概念进行简要介绍,并探讨其在不同领域的应用。 **定义与分类** - **定义**:机器学习是人工智能的一个分支,它使计算机能够在不进行明确编程的情况下学习和改进。 - **分类**: - 监督...

    机器学习--斯坦福(2012最新)中文字幕

    这门课程是全球范围内广受欢迎的在线教育项目,旨在教授学生理解和应用机器学习的基本概念、算法和实践技巧。 课程涵盖了一系列关键的机器学习主题,包括监督学习、无监督学习、特征选择、线性回归、逻辑回归、神经...

    吴恩达机器学习ex2-Matlab实现

    【标题】"吴恩达机器学习ex2-Matlab实现"是关于吴恩达教授的机器学习课程中的第二个练习,该练习使用Matlab编程语言进行。这个练习旨在帮助学习者深入理解并应用基本的线性回归模型,以及如何在实际问题中评估和优化...

    机器学习实战-中文版1

    在《机器学习实战-中文版1》中,第一章主要介绍了机器学习的基础概念和关键术语。机器学习是人工智能的一个分支,它让计算机系统能够从数据中自动学习和改进,而无需显式编程。书中强调了随着传感器技术的发展和海量...

    机器学习入门-PPT.pdf

    根据提供的文档信息,我们可以提取并解释出以下几个关键的机器学习概念和知识点: ### 1. 机器学习概览 文档标题“机器学习入门-PPT.pdf”表明这是一份关于机器学习基础的介绍性资料。机器学习是人工智能的一个...

    机器学习理论知识 机器学习基础入门教程 1-1.机器学习简介-上课版part1(共31页).pptx

    课程内容涵盖分类、决策树、贝叶斯学习、神经网络、支持向量机、k近邻、模式选择与评估、计算学习理论、聚类分析、特征选择等多个关键主题,旨在全面而系统地介绍机器学习的核心概念和技术。 通过这个系列的教程,...

    机器学习算法-java版

    书中可能涵盖了监督学习、无监督学习和强化学习的基本概念,以及训练集、测试集和验证集的划分方法。此外,还会介绍评估模型性能的关键指标,如准确率、精确率、召回率和F1分数等。 二、Java编程基础 在深入机器...

    唐宇迪-机器学习-代码PPT

    首先,我们来谈谈“机器学习”的基本概念。机器学习是通过让计算机从数据中自动学习规律和模式,从而实现自我改进的一种方法。它主要分为监督学习、无监督学习和半监督学习三类。监督学习包括了线性回归、逻辑回归、...

    COURSERA 吴恩达老师机器学习课程笔记-机器学习笔记-[机器学习与推荐算法].pdf

    在吴恩达老师的COURSERA机器学习课程中,他深入浅出地介绍了机器学习的基本概念和核心算法。课程笔记涵盖了从机器学习的介绍到具体模型的实现,如单变量和多变量线性回归。以下是这些知识点的详细解释: 1. **机器...

    基于Python的机器学习K-means聚类分析NBA球员案例

    首先,让我们了解K-means的基本概念。K-means算法的目标是找到最佳的K个中心点,使得所有数据点到最近的中心点的距离之和最小。这个过程包括两个主要阶段:初始化和迭代。在初始化阶段,选择K个初始质心(通常是随机...

    《模式识别与机器学习》 - Christopher Bishop 详细介绍了模式识别和机器学习的基础理论和技术

    《模式识别与机器学习》系统地介绍了模式识别和机器学习的基本概念、理论和方法,覆盖了从概率分布、贝叶斯方法,到图模型、神经网络等一系列主题。该书以统计学习理论为基础,详细讨论了各种算法和模型,并通过大量...

Global site tag (gtag.js) - Google Analytics