一.机器学习算法的分类:
最主要包括两类:监督性学习和非监督性学习。
其它应用包括:增强性学习,推荐系统等
其运用的的领域非常广泛:
数据挖掘领域,自然语言处理,计算机视觉,电子商务的推荐等。。
二.关于监督性学习主要分为回归分析(regression)和分类(classification)
supervised learning最主要特点就是有training examples,通过training examples,结合相关算法,学习得到数据模型。然后根据学习的数学模型进行预测,对新来的样本,得了相关结果。
如果predict continuous valued output,即预测的结果是连续数值,则称为regression(回归) ,如预测房子价钱
如果要预测的结果是discrete(离散的),则称为分类。如垃圾邮件的分类等。
三.线性回归(linear regession)
线性回归主要分为,只有一个变量的回归和含有多个变量的回归。课程中主要讲解了两种方法Gradient descent(梯度下降)和normal equation(标准方程)两种方法来作回归分析。
1.问题描述
一个变量的作为入门,下面这个例子是讲一幢房子的价钱跟四个因素的关系:面积,房间数量,层数,年限。
Size (feet2)
|
Number of bedrooms
|
Number of floors
|
Age of home (years)
|
Price ($1000)
|
2104
|
5
|
1
|
45
|
460
|
1416
|
3
|
2
|
40
|
232
|
1534
|
3
|
2
|
30
|
315
|
852
|
2
|
1
|
36
|
178
|
…
|
…
|
…
|
…
|
…
|
这是一个多变量问题,多变量的线性回归问题。
假设函数可以表示为:
其中x0=1。x1....xn代表的就是特征量(feature).
问题的结果就是要寻找参数
使得下面这个cost function最小:
其中 i表示第几个训练集。
2.梯度下降方法求解上述问题
上述公式的一个非常重要的常数a,这个参数的选择对算法的质量和效率影响很大。
梯度下降的方法,在数学上实际上就是高等数学里面的切变量的下降问题,在这个在也就是参数,在不断地向自己的最小cost function的最小值靠近的过程。而a参数的大小就代表了这个过程的速度,当a很小时,这个速度比较慢,但是找到最小值的概率很大。当a很大时,可能会找不到这个值,或者在这过程中,值反而会变大。
3.上述问题的一些注意点:
feature scaling主要是指把feature的范围变化到同一个范围内,就像上述例子中的房子面积是1000多,而导数却只有1,2,3几个小数值。
通过,
这样每个feature的范围都在-0.5到0.5的范围内。
4.nomal equation方法,这个访求主要是通过线性代数计算得到结果。比较直观,但是要通过大量的矩阵运算来求得,当训练样本非常多的时候,非常耗时。当训练样本较小时,比较合适。
Size (feet2)
|
Number of bedrooms
|
Number of floors
|
Age of home (years)
|
Price ($1000)
|
2104
|
5
|
1
|
45
|
460
|
1416
|
3
|
2
|
40
|
232
|
1534
|
3
|
2
|
30
|
315
|
852
|
2
|
1
|
36
|
178
|
3000
|
4
|
1
|
38
|
540
|
其中
则
通过上面这个公式示得最好的参数。
分享到:
相关推荐
《斯坦福机器学习公开课笔记1-5》是博主“心张烟酰胺”根据斯坦福大学的机器学习公开课整理的一系列学习笔记。这些笔记详细记录了课程的前五讲内容,旨在帮助读者深入理解机器学习的基本概念、原理和应用。在这一千...
《斯坦福机器学习笔记》是基于世界知名学府斯坦福大学公开课程的深度学习与机器学习精华内容的总结。这份笔记涵盖了广泛的机器学习主题,旨在帮助读者深入理解这一领域的核心概念、算法及其应用。以下是对笔记中关键...
本资源是关于斯坦福大学机器学习(Machine Learning)公开课的中文笔记,由著名华人学者吴恩达(Andrew Ng)教授主讲。吴恩达是深度学习领域的先驱,他的这门公开课在全球范围内广受欢迎,为无数人打开了机器学习的...
Stanford CS229 机器学习笔记 本资源为斯坦福大学吴恩达老师的机器学习笔记,内容涵盖机器学习的各个方面,包括监督学习、分类和逻辑回归、广义线性模型、生成学习算法、支持向量机、学习理论、正则化与模型选择、...
线性回归是机器学习中最基础的预测模型之一。它假设一个线性关系存在于输入的特征变量和目标变量之间。线性回归模型的目标是找到最佳的参数,使模型预测值和实际值之间的差异最小化。它通常通过最小化损失函数(例如...
1. **斯坦福ML公开课笔记5.pdf**:这部分可能涉及监督学习的基础,如线性回归(Linear Regression)和逻辑回归(Logistic Regression)。线性回归用于预测连续值,而逻辑回归则用于二分类问题,通过sigmoid函数将...
这些笔记详细记录了Stanford大学机器学习课程的关键内容,对于理解并掌握机器学习的基础知识非常有帮助。通过深入学习这些概念,可以为进一步研究深度学习、强化学习等复杂机器学习技术打下坚实基础。
作者的总结参考了Stanford大学Andrew Ng老师的公开课内容,以及《机器学习实战》中的相关章节,为读者提供了完整的理解。 最后,笔记中还提及了参考文献和感谢阅读者的批评指正,显示了作者对知识共享和学术交流的...
总之,Stanford University的CS229机器学习课程是一份宝贵的入门资源,它不仅介绍了机器学习的基本概念和算法,还注重培养解决问题和实际应用的能力。无论你是初涉机器学习的新人,还是希望深入研究的学者,都能从中...
### Stanford University机械学习笔记 #### 第三章 逻辑回归 **第一节 分类** 在机器学习领域,特别是监督学习中,分类是一项重要的任务。本节主要介绍逻辑回归算法应用于分类问题的基础概念及其工作原理。 首先...
【机器学习】是计算机科学的一个分支,它涉及让计算机通过经验改进其性能,而无需显式编程。在【斯坦福大学】的这门【机器学习】课程中,学生将深入理解机器学习的基本概念、算法和应用,从而为解决实际问题打下坚实...
机器学习是当今信息技术领域的热门学科,它研究如何使计算机具备类似人类的学习能力,以获取新的知识或技能,并能对已有知识结构进行优化,从而不断提升性能。作为人工智能领域的核心,机器学习的应用非常广泛,涉及...
监督学习是应用最广泛的一种机器学习类型,包括了线性回归、逻辑回归、支持向量机(SVM)、决策树、随机森林以及神经网络等。这些模型在预测和分类问题中表现出色,如图像识别、自然语言处理等领域。 无监督学习则...
《Python-20182019校招春招秋招算法NLP深度学习机器学习面试笔记》 本资料集主要针对2018年至2019年期间的校园招聘,特别是春季和秋季招聘,面向那些对自然语言处理(NLP)、深度学习(Deep Learning)以及机器学习...
【吴恩达机器学习课程代码分享】是一份与著名计算机科学家吴恩达(Andrew Ng)的在线机器学习课程相关的编程资源。吴恩达是深度学习和人工智能领域的先驱,他在Coursera上开设的机器学习课程深受全球学习者喜爱。这...
1. 机器学习:涵盖了线性回归、逻辑回归、决策树、随机森林、支持向量机、神经网络、深度学习等算法。 2. Python 编程:使用 Python 语言进行实现,强调代码的可读性和效率。 3. 数据处理:可能涉及到数据预处理、...
1. 讲义:详细阐述了机器学习的基础理论,如线性回归、逻辑回归、神经网络、支持向量机、决策树、集成学习、聚类、降维、推荐系统等。 2. 实验:提供实际操作的编程作业,让学习者通过Python或其他编程语言实现各种...
监督学习是机器学习中最常见的一种,包括了线性回归、逻辑回归、支持向量机、决策树等算法;无监督学习则涉及聚类、降维等技术;半监督学习和强化学习在实际应用中也占有重要地位。 MATLAB是一种强大的数值计算和...
吴恩达机器学习CS229讲义译文是一份宝贵的学习资源,它包含了吴恩达教授在其知名在线课程CS229(Stanford大学的机器学习课程)中的讲义内容,以及相关的学习笔记。这份资料是中文版的,使得国内的学习者能够更加便捷...