本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sichunli_030
- sam123456gz
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
- kingwell.leng
最新文章列表
机器学习&数据挖掘笔记_11(高斯过程回归)
原帖地址:http://www.cnblogs.com/tornadomeet/archive/2013/06/15/3137239.html
前言:
高斯过程回归(GPR)和贝叶斯线性回归类似,区别在于高斯过程回归中用核 ...
MahoutDriver运作机制-mahout源码学习及总结
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911
mahout入口类MahoutDriver
如果我们想要研究MahoutDriver的源码,没有什 ...
mahout脚本调用流程分析
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911
剖析mahout脚本
mahout 位于$MAHOUT_HOME/bin目录下,是所有mahout调用的 ...
机器学习在公司的分享
机器学习在公司的分享,ppt见附件,主要简单介绍了机器学习:
机器学习概念
相关学科
机器学习三大要素
生成模型和判别模型
频率派和贝叶斯派
基本算法的直观理解
模型选择
模型组合-Ensemble Method
Online Learning
Structure Learning
Deep Learning
机遇和挑战
机器学习适用场景
自然语言处理--从规则到统计
目前各大互联网公司都如火如荼的在研发者自己的推荐业务,因此机械学习、人工智能,数据统计分析建模变成了一个当下很热门的研究方向,那么计算机如何智能的处理自然语言呢,比如最近流行的小黄鸡应用,你的一问一答,他都会憨态可掬的作出很黄很暴力的回答。那么他是怎么处理和分析语言的呢,其实任何一种语言都是一种编码方式,人说话其实就是把想表达的意思进行编码, 编码形式 可以使声音 也可以是电流也可以 ...
Jubatus: 分布式在线机器学习框架
Jubatus http://jubat.us/en/overview.html 是一个面向大数据数据流的分布式在线机器学习的开源框架,和storm有些类似,但是从介绍上来看,它提供了更多的功能。
Jubatus认为未来的数据分析平台应该同时向三个方向展开:处理更大的数据,深层次的分析和实时处理;而当前还没有一种能够处理不断生成的流式大数据的水平可扩展的分布式架构。Hadoop的mapred ...
机器学习推荐论文和书籍
转自http://blog.csdn.net/chl033/article/details/4822922
好好地学习吧。。
发信人: zibuyu (得之我幸), 信区: NLP
标 题: 机器学习推荐论文和书籍
发信站: 水木社区 (Thu Oct 30 21:00:39 2008), 站内
我们组内某小神童师弟通读论文,拟了一个机器学习的推荐论文和书籍列表。
经授权发布在这儿,希望对 ...
Machine Learning系列实验--SoftMax Regression
SoftMax回归可以用来进行两种以上的分类,很是神奇!实现过程实在有点坎坷,主要是开始写代码的时候理解并不透彻,而且思路不清晰,引以为戒吧!
SoftMax Regression属于指数家族,证明见( http://cs229.stanford.edu/notes/cs229-notes1.pdf 及http://ufldl.stanford.edu/wiki/index.php/Soft ...
Machine Learning系列实验--Logistic function解决分类问题
分类问题的值是离散的,区别于之前的线性回归问题。本次采用Logistic回归来解决分类问题,实验还是参考了pennyliang的http://blog.csdn.net/pennyliang/article/details/7045372#comments。
Logistic回归问题的,写出likelihood function
Machine Learning系列实验--参数theta的数学求法
梯度下降方法通过学习样本不断修改theta值,使得h(x)不断拟合,今天实验的是一种数学的方式来进行theta值的确定,目的跟之前是一样的,求J(θ)达到最小(极小)值,那么有:
令上式等于0,得:
下面用昨天的实验进行验证:
from numpy import *
x=mat('[1,1,4;1,2,5;1,5,1;1,4,2]')
y=mat('[19,26, ...
Machine Learning系列实验--梯度下降(批量梯度,随机梯度)
看了3集斯坦福大学的机器学习课程,很有意思,开始着手回顾以及一些代码的实现,这次做的是批量梯度下降以及随机梯度下降。讲义在 http://cs229.stanford.edu/notes/cs229-notes1.pdf1)批量梯度下降: 2)随机梯度下降: 实验内容借鉴了pennyliang 在CSDN上的博文http://blog.csdn.net/pennyliang/article/de ...
模型选择的几种方法:AIC,BIC,HQ准则
经常地,对一堆数据进行建模的时候,特别是分类和回归模型,我们有很多的变量可供使用,选择不同的变量组合可以得到不同的模型,例如我们有5个变量,2的5次方,我们将有32个变量组合,可以训练出32个模型。但是哪个模型更加的好呢?目前常用有如下方法:
AIC=-2 ln(L) + 2 k <wbr></wbr> 中文名字:赤池信息量 akaike information ...
openCv学习笔记(十三)—贝叶斯分类器的实现
第一个是用c语言做的关于文本的分类,主要是对待分类文本所有单词在模板中概率的后验计算。算法比较简单,从网上下的(没记下地址,若不愿意公开,请留言,自当处理),稍作了一点修改。。,等有时间可以实现垃圾邮件的分类,利用斯坦福机器学习公开课中方法,统计高频词,利用朴素贝叶斯。等有时间和大家分享。
#include <stdio.h>
#include <string.h>
#i ...