机器学习资源大全zz
发表于:2012年04月21日 00:32 1
发信人: pennyliang (pennyliang), 信区: MachineLearning
标 题: 机器学习资源大全(欢迎补充,持续更新)
发信站: 水木社区 (Tue Jan 17 17:15:15 2012), 站内
Harvard机器学习资料(video) [antinucleon]
http://cm.dce.harvard.edu/2011/02/23101/publicationListing.shtml
分享一些资料[antinucleon]
1. ml-class.org
级别相当于S校的CS229A,注重Application,适合大二的学生学习,产生兴趣。但这个理论性差的太多,按Ng的说法是计算机系的学这个只能给个C
2. CS229
see.stanford.edu有SCPD的视频作业等等,我现在正在学习,正常的Advanced Undergraduate/ Graduate课程
3. CMU的Tom Mitchell的Lecture
http://www.cs.cmu.edu/~tom/10701_sp11/lectures.shtml
教育网速度太慢,不清楚如何
4. PGM
pgm-class.org, 明年一月开课,猜测可能和CS229A情况相似
stanford machine learning cs299其他相关课程 [pennyliang]
http://www.newsmth.net/bbscon.php?bid=1327&id=407
水牛大学课件,视频,例子,课件都有
http://www.cedar.buffalo.edu/~srihari/CSE574/
凸优化slides[SPAM]
http://math.nju.edu.cn/~hebma/slides/01C.pdf
http://math.nju.edu.cn/~hebma/slides/07C.pdf
书籍分享[SPAM]
http://115.com/file/bhttr6yy#
Statistics for High-Dimensional Data: Methods, Theory and Applications By P. Buhlmann and S. van de Geer
http://www.eecs.berkeley.edu/~wainwrig/Papers/WaiJor08_FTML.pdf
Graphical models, exponential families, and variational inference
By M. Wainwright and M. Jordan
数值分析 [Pennyliang]
作 者:(美)索尔 著 吴兆金,王国英,范红军 译
http://book.360buy.com/10064039.html
推荐理由:这本书我看过,通俗易懂,例子简单,章节系统,很全,巨好。
林达华blog书单
前面几篇谈了一些对数学的粗浅看法。其实,如果对某门数学有兴趣,最好的方法就是走进那个世界去学习和体验。
这里说说几本我看过后觉得不错的数学教科书。
1. 线性代数 (Linear Algebra):
我想国内的大学生都会学过这门课程,但是,未必每一位老师都能贯彻它的精要。这门学科对于Learning是必备的基础,对它的透彻掌握是必不可少的。我在科大一年级的时候就学习了这门课,后来到了香港后,又重新把线性代数读了一遍,所读的是
Introduction to Linear Algebra (3rd Ed.) by Gilbert Strang.
这本书是MIT的线性代数课使用的教材,也是被很多其它大学选用的经典教材。它的难度适中,讲解清晰,重要的是对许多核心的概念讨论得比较 透彻。我个人觉得,学习线性代数,最重要的不是去熟练矩阵运算和解方程的方法——这些在实际工作中MATLAB可以代劳,关键的是要深入理解几个基础而又 重要的概念:
子空间(Subspace),正交(Orthogonality),特征值和特征向量(Eigenvalues and eigenvectors),和线性变换(Linear transform)。从我的角度看来,一本线代教科书的质量,就在于它能否给这些根本概念以足够的重视,能否把它们的联系讲清楚。Strang的这本书 在这方面是做得很好的。
而且,这本书有个得天独厚的优势。书的作者长期在MIT讲授线性代数课(18.06),课程的video在MIT的Open courseware网站上有提供。有时间的朋友可以一边看着名师授课的录像,一边对照课本学习或者复习。
http://ocw.mit.edu/OcwWeb/Mathematics/18-06Spring-2005/CourseHome/index.htm
2. 概率和统计 (Probability and Statistics):
概率论和统计的入门教科书很多,我目前也没有特别的推荐。我在这里想介绍的是一本关于多元统计的基础教科书:
Applied Multivariate Statistical Analysis (5th Ed.) by Richard A. Johnson and Dean W. Wichern
这本书是我在刚接触向量统计的时候用于学习的,我在香港时做研究的基础就是从此打下了。实验室的一些同学也借用这本书学习向量统计。这本书 没有特别追求数学上的深度,而是以通俗易懂的方式讲述主要的基本概念,读起来很舒服,内容也很实用。对于Linear regression, factor analysis, principal component analysis (PCA), and canonical component analysis (CCA)这些Learning中的基本方法也展开了初步的论述。
之后就可以进一步深入学习贝叶斯统计和Graphical models。一本理想的书是Introduction to Graphical Models (draft version). by M. Jordan and C. Bishop.
我不知道这本书是不是已经出版了(不要和Learning in Graphical Models混淆,那是个论文集,不适合初学)。这本书从基本的贝叶斯统计模型出发一直深入到复杂的统计网络的估计和推断,深入浅 出,statistical learning的许多重要方面都在此书有清楚论述和详细讲解。MIT内部可以access,至于外面,好像也是有电子版的。
3. 分析 (Analysis):
我想大家基本都在大学就学过微积分或者数学分析,深度和广度则随各个学校而异了。这个领域是很多学科的基础,值得推荐的教科书莫过于
Principles of Mathematical Analysis, by Walter Rudin
有点老,但是绝对经典,深入透彻。缺点就是比较艰深——这是Rudin的书的一贯风格,适合于有一定基础后回头去看。
在分析这个方向,接下来就是
泛函分析(Functional Analysis)。
Introductory Functional Analysis with Applications, by Erwin Kreyszig.
适合作为泛函的基础教材,容易切入而不失全面。我特别喜欢它对于谱论和算子理论的特别关注,这对于做learning的研究是特别重要的。 Rudin也有一本关于functional analysis的书,那本书在数学上可能更为深刻,但是不易于上手,所讲内容和learning的切合度不如此书。
在分析这个方向,还有一个重要的学科是测度理论(Measure theory),但是我看过的书里面目前还没有感觉有特别值得介绍的。
4. 拓扑 (Topology):
在我读过的基本拓扑书各有特色,但是综合而言,我最推崇:
Topology (2nd Ed.) by James Munkres
这本书是Munkres教授长期执教MIT拓扑课的心血所凝。对于一般拓扑学(General topology)有全面介绍,而对于代数拓扑(Algebraic topology)也有适度的探讨。此书不需要特别的数学知识就可以开始学习,由浅入深,从最基本的集合论概念(很多书不屑讲这个)到Nagata- Smirnov Theorem和Tychonoff theorem等较深的定理(很多书避开了这个)都覆盖了。讲述方式思想性很强,对于很多定理,除了给出证明过程和引导你思考其背后的原理脉络,很多令人 赞叹的亮点——我常读得忘却饥饿,不愿释手。很多习题很有水平。
5. 流形理论 (Manifold theory):
对于拓扑和分析有一定把握时,方可开始学习流形理论,否则所学只能流于浮浅。我所使用的书是
Introduction to Smooth Manifolds. by John M. Lee
虽然书名有introduction这个单词,但是实际上此书涉入很深,除了讲授了基本的manifold, tangent space, bundle, sub-manifold等,还探讨了诸如纲理论(Category theory),德拉姆上同调(De Rham cohomology)和积分流形等一些比较高级的专题。对于李群和李代数也有相当多的讨论。行文通俗而又不失严谨,不过对某些记号方式需要熟悉一下。
虽然李群论是建基于平滑流形的概念之上,不过,也可能从矩阵出发直接学习李群和李代数——这种方法对于急需使用李群论解决问题的朋友可能更加实用。而且,对于一个问题从不同角度看待也利于加深理解。下面一本书就是这个方向的典范:
Lie Groups, Lie Algebras, and Representations: An Elementary Introduction. by Brian C. Hall
此书从开始即从矩阵切入,从代数而非几何角度引入矩阵李群的概念。并通过定义运算的方式建立exponential mapping,并就此引入李代数。这种方式比起传统的通过“左不变向量场(Left-invariant vector field)“的方式定义李代数更容易为人所接受,也更容易揭示李代数的意义。最后,也有专门的论述把这种新的定义方式和传统方式联系起来。
分享到:
相关推荐
综上所述,《Machine Learning in Action》及其附带的Python源码是一套非常宝贵的资源,对于想要深入了解机器学习领域的学习者来说具有极高的价值。通过阅读本书并实践其中的代码示例,不仅可以掌握基本的理论知识,...
综上所述,文件“Python机器学习十大算法英文文档EM”涉及到了使用Python语言进行机器学习的实践,并且提供了十大机器学习算法的英文资料,用户可以通过百度网盘分享地址获取这些资源。文档内容可能包括算法的详细...
这份名为“吴恩达机器学习作业.zip”的压缩包包含了该课程的习题和相关代码,为学习者提供了一手的学习资源。 首先,我们要理解机器学习的基本概念。机器学习是人工智能的一个分支,通过让计算机在数据中学习规律,...
首先,从标题来看,“Python机器学习机器学习十大算法英文文档SVM”揭示了文档涉及的核心内容是Python编程语言在机器学习领域中应用的十大算法之一——支持向量机(Support Vector Machine,简称SVM)。SVM是一种...
最后,“python 机器学习 算法 范文/模板/素材”这些标签说明了这份文档很可能包含了机器学习算法的实际应用代码、模板或素材,对于希望学习和实践Python机器学习的用户来说,这是一个非常宝贵的学习资源。...
这对于学习机器学习算法的初学者来说是十分宝贵的资源。它们可以被用于学习算法的基本应用,也可作为项目开发的起点。 综上所述,这份文档可能是一份包含了 Python 语言编写的机器学习算法的英文资料,其中详细介绍...
Python语言因为其简洁的语法、强大的库支持以及众多社区资源,成为机器学习领域非常流行的编程语言。Python中的机器学习库如scikit-learn、TensorFlow、Keras等为数据科学家提供了实现各种机器学习算法的工具。 ...
标题和描述提到了“Python机器学习”、“十大算法”以及“K-means”。结合这些信息,以下是对这些知识点的详细说明: 1. Python在机器学习中的应用 Python是一种广泛用于机器学习的编程语言,它的优势在于其简洁的...
Python机器学习Python机器学习及实践教程源码提取方式是百度网盘分享地址
标题中提到的“Python机器学习十大算法”及“C4.5”指代的是一些在Python环境下可以实现的机器学习算法,以及特别提及了C4.5算法,这是一个经典的决策树分类算法。在机器学习领域,算法的选择对于构建有效的预测模型...
标题中提到的“Python机器学习十大算法”以及特别指出的“kNN”代表了文档的核心内容是关于在Python中实现机器学习的十大算法,其中“kNN”代表了最近邻算法,这是一种基础且广泛应用的分类与回归算法。kNN算法简单...
本资源摘要信息是关于机器学习和深度学习面试题的合集,共300题,涵盖了机器学习、深度学习、算法岗面试题等方面的知识点。 1. SVM (Support Vector Machine):SVM是一个面向数据的分类算法,目标是确定一个分类超...
通过上述分析,我们可以看到Kubeflow是一个极具潜力的工具,它不仅简化了机器学习流程,还极大地提高了开发效率和资源利用率。随着社区的不断发展和完善,Kubeflow有望成为机器学习领域的重要基础设施之一。
本资源为机器学习基本库:opencv/tensorflow/keras的pytho3离线安装包。版本号分别为:Keras-2.2.2-py2.py3-none-any/opencv_python-3.4.2-cp36-cp36m-win_amd64/tensorflow-1.9.0-cp36-cp36m-win_amd64
4. **人工智能技术**:应用机器学习算法,提高作物病虫害预测准确率,实现精准农业。 5. **移动互联网技术**:通过移动终端提供便捷的信息查询和服务。 #### 三、智慧农业按需实施 1. **综合运营支撑平台**:该...
【基于BP神经网络的各学院就业率预测研究——以ZZ高校为例】 本文主要探讨了如何利用BP(Back Propagation)神经网络对高校各学院的就业率进行预测,以ZZ高校为实际案例。BP神经网络是一种多层前馈网络,常用于解决...
在这种情况下,这些图片可能被用来训练机器学习模型识别七段数码管显示的数字或符号,类似于光学字符识别(OCR)技术,但针对的是数码管而非印刷文本。 标签“机器视觉”进一步确认了这个数据集的主要用途。在机器...
- **人工智能技术**:通过机器学习、深度学习等算法,实现生产过程的智能优化。 - **移动通信技术**:支持高速、低延迟的无线通信,保障数据的实时传输。 #### 关键技术应用 - **数字孪生**:构建虚拟模型,模拟...
2. **深度学习定义**:深度学习是机器学习的一个分支,它主要利用多层非线性处理单元(即神经网络)来模拟和学习复杂的数据表示。相比于传统的机器学习算法,深度学习能够自动地从原始数据中提取特征。 #### 二、...
4. 机器学习:利用神经网络、支持向量机等机器学习算法,可以从大量历史数据中学习规律,优化控制策略。 三、智能系统开发 1. 人机交互界面:设计友好的操作界面,使得操作人员能够直观地监控和调整排管机的工作...