原文地址:http://www.iteye.com/news/30030
Metacademy的创始人Colorado Reed发布过一篇名为“机器学习练级攻略”,文中回答了初学者经常问他的一个问题:如何才能更好地学习机器学习?这篇文章将总结Colorado的建议并分步讲解他文中的路线图。
如何更好地掌握机器学习
Colorado是伯克利大学的在读博士,同时也是Metacademy的创始人。Metacademy是一个优秀的开源平台,许多专业人员共同在这个平台上编写wiki文章。目前,这些文章主要围绕着机器学习和人工智能这两个主题。
在Colorado的建议中,更好地学习机器学习的方法就是不断的通过书本学习。他认为读书的目的就是让心中有书。
一个博士在读生给出这样的建议并不令人惊讶,以前本站可能还推荐过类似的建议。这个建议还可以,但我不认为适用每个人。如果你是个开发者,想实现机器学习的算法。下面列出的书籍是一个很好的参考,可以从中逐步学习。
机器学习路线图
他的关于机器学习的路线图分为5个级别,每个级别都对应一本书必须要掌握的书。这5个级别如下:
Level 0(新手):阅读《Data Smart: Using Data Science to Transform Information into Insight》。需要了解电子表格、和一些算法的高级数据流。
Level 1(学徒):阅读《Machine Learning with R》。学习在不同的情况下用R语言应用不同的机器学习算法。需要一点点基本的编程、线性代数、微积分和概率论知识。
Level 2(熟练工):阅读《Pattern Recognition and Machine Learning》。从数学角度理解机器学习算法的工作原理。理解并调试机器学习方法的输出结果,同时对机器学习的概念有更深的了解。需要有算法、较好的线性代数、一些向量积分、一些算法实现经验。
Level 3(大师):阅读《Probabilistic Graphical Models: Principles and Techniques》。深入了解一些高级主题,如凸优化、组合优化、概率论、微分几何,及其他数学知识。深入了解概率图模型,了解何时应该使用以及如何解释其输出结果。
Leval 4(宗师):随便去学吧,记得反馈社区。
Colorado针对每个级别中列出的书中章节阅读建议,并给出了建议去了解的相关顶级项目。
Colorado后来重新发布了一篇博客,其中对这个路线图做了一点修改。他移除了最后一个级别,并如下定义了新的级别:好奇者、新手、学徒、熟练工、大师。他说道,Level 0中的机器学习好奇者不应该阅读相关书籍,而是浏览观看与机器学习有关的顶级视频。
机器学习中被忽视的主题
Scott Locklin也阅读了Colorado的那篇博客,并从中受到了启发,写了一篇相应的文章,名为“机器学习中被忽视的想法”(文中有Boris Artzybasheff绘制的精美图片)。
Scott认为Colorado给出的建议并没有充分的介绍机器学习领域。他认为很少有书籍能做到这一点,不过他还是喜欢Peter Flach所著的《Machine Learning: The Art and Science of Algorithms that Make Sense of Data》这本书,因为书中也接触了一些隐晦的技术。
Scott列出了书本中过分忽视的内容。如下所示:
实时学习:对流数据和大数据很重要,参见Vowpal Wabbit。
强化学习:在机器人方面有过讨论,但很少在机器学习方面讨论。
“压缩”序列预测技术:压缩数据发现学习模式。参见CompLearn。
面向时间序列的技术。
一致性预测:为实时学习精确估计模型。
噪声背景下的机器学习:如NLP和CV。
特征工程:机器学习成功的关键。
无监督和半监督学习。
这个列表很好的指出了机器学习中没有注意到的领域。
最后要说明的是,我自己也有一份关于机器学习的路线图。与Colorado一样,我的路线图仅限于分类/回归类型的监督机器学习,但还在完善中,需要进一步的调查和添加所有感兴趣的主题。与前面的“读这些书就可以了”不同,这个路线图将会给出详细的步骤。
分享到:
相关推荐
该方法可以将数据拟合为多项式曲线,以便更好地预测新的数据。多项式曲线拟合可以将数据分为训练数据和测试数据,以便评估模型的性能。 模型评估与模型选择是机器学习中一个重要的步骤,它可以对机器学习模型的性能...
先简单介绍下这门课程,这门课是在著名...在何时可以使用机器学习? Why can Machine Learn? 为什么机器可以学习? How can Machine Learn?机器可以怎样学习? How can Machine Learn Better?怎样能使机器学习更好?
机器学习期末复习试卷 机器学习是人工智能的核心技术之一,涉及到计算机科学、数学、统计学、神经网络等领域。机器学习的主要目标是使机器能够自主学习、...通过掌握这些知识点,可以更好地理解和应用机器学习技术。
机器学习和数据挖掘技术的结合可以使人类更好地从大量数据中发现有价值的信息,从而对人类决策和行动产生重要影响。机器学习和数据挖掘技术的结合可以使人类更好地理解和分析复杂的系统,从而对人类决策和行动产生...
机器学习是计算机科学的一个分支,它的核心目标是使计算机系统通过经验学习和改进,从而更好地完成特定任务。这一领域的研究受到了多位学者的贡献,如桑克(sank)提出的观点,强调了学习对于实现智能的重要性。西蒙...
在这个概念下,机器学习技术不再是仅仅用于数据分析和预测,而是可以作为一项服务来提供,帮助企业和个人更好地解决问题和决策。 机器学习即服务的概念是基于云计算和IT外包的发展壮大。如果说云计算是将计算资源...
《机器学习实战》是一本...通过阅读这本书,你可以系统地学习机器学习的基本理论,并通过实际操作加深理解,提升技能。配合提供的数据集和代码,你将能够独立完成一系列的机器学习项目,为你的学习之路打下坚实的基础。
在计算机视觉领域,机器学习技术可以帮助人们更好地理解和分析图像数据,如人脸识别、目标检测等。在自然语言处理领域,机器学习技术可以实现自然语言生成、文本分类等应用,提高人机交互的效率。在医疗诊断领域,...
随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...
通过解答这些习题,学习者可以更好地理解模型的工作原理,掌握如何运用这些模型解决实际问题。 例如,在监督学习部分,习题可能涉及到如何用梯度下降法求解线性回归的最小二乘问题,以及如何理解和应用逻辑回归进行...
5. 长短期记忆网络(LSTM):为解决RNN中的梯度消失问题而设计,能更好地捕获长期依赖关系。 四、学习过程与优化 1. 损失函数:衡量模型预测与真实结果之间的差距,如均方误差(MSE)和交叉熵损失。 2. 反向传播:...
熟悉Python基础将有助于你更好地理解和编写机器学习程序。 机器学习算法PPT是教学资料的核心部分,它可能涵盖了监督学习、无监督学习和半监督学习等多种算法。监督学习中,你可能会学到经典的线性回归、逻辑回归、...
机器学习实验报告旨在深入理解和应用一系列关键的机器学习算法,包括搜索树、KMeans算法等。...通过这样的实验,学生能够更好地掌握机器学习的核心概念,为未来在人工智能领域的研究和工作奠定坚实基础。
随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...
在本文中,我们将深入...通过深入研究这些案例,你将能够更好地应用机器学习技术解决实际问题,并为你的数据分析技能添砖加瓦。在学习过程中,记得不断思考如何将理论知识与实际项目相结合,以提升你的机器学习能力。
随着统计学的发展,统计学习在机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的...
两者之间的交叉应用可以带来更好的研究结果和应用前景。 本文对复杂网络领域的主要网络演化模型进行了综述,包括度分布模型、BBV模型、Kleinberg模型等。这些模型可以用来描述complex network的结构和演化过程。在...