最新文章列表

机器学习&数据挖掘笔记_11(高斯过程回归)

原帖地址:http://www.cnblogs.com/tornadomeet/archive/2013/06/15/3137239.html    前言:   高斯过程回归(GPR)和贝叶斯线性回归类似,区别在于高斯过程回归中用核 ...
wyqj 评论(0) 有1937人浏览 2013-06-15 11:42

享有盛誉的R语言图书

  数据挖掘与R语言 http://book.douban.com/subject/24153573/ 本书首先简要介绍了R软件的基础知识(安装、R数据结构、R编程、R的输入和输出等)。然后通过四个数据挖掘的实际案例 (藻类频率的预测、证券趋势预测和交易系统仿真、交易欺诈预测、微阵列数据分类)介绍数据挖掘技术。这四个案例基本覆盖了常见的数据挖掘技术,从无监督的 数据挖掘技术、有监督的数据挖掘技 ...
hzbook 评论(0) 有1391人浏览 2013-05-29 11:29

MahoutDriver运作机制-mahout源码学习及总结

欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   mahout入口类MahoutDriver   如果我们想要研究MahoutDriver的源码,没有什 ...
davidxiaozhi 评论(0) 有1577人浏览 2013-05-28 22:19

mahout脚本调用流程分析

欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   剖析mahout脚本   mahout 位于$MAHOUT_HOME/bin目录下,是所有mahout调用的 ...
davidxiaozhi 评论(0) 有1702人浏览 2013-05-28 22:11

模式识别__习题2.1贝叶斯决策可以错误率最小证明

题目简述: 多类分类任务重,贝叶斯决策规则可以使错误率最小。二元证明参考《模式识别》P10,此推理也是按照这个流程来的。   方法1:复杂点,跟二元同样的方法,从Pe直接出发,多个变量满足同分布。    方法2:按照习题提示,从正确答案出发:      
384444165 评论(0) 有5044人浏览 2013-05-22 00:02

集体智慧编程 简介

Netflix 是一家在线租片儿的公司, 并且更具用户过去租片的行为来进行推荐, 他悬赏100万美元去奖励第一个把租片成功率提高10%的团队,以及5 万美元给这个团队的leader,通过提供用户以前租片的纪录给团队们进行推荐,现在做的最牛屄的团队是提高了 7%。    google 是意见搜索公司,创立当时有很多其他的公司, 但是google 通过其他网页对他的外链来进行排序 ...
sharp-fcc 评论(0) 有932人浏览 2013-05-06 21:11

2012年读的一些书

今年看了比较多的书,主要上班比较远,1个多小时,大部分都是在坐地铁看的。 程序员系列 1、《程序员修炼之道 : 从小工到专家 》: 主要介绍了软件 ...
fuliang 评论(2) 有3283人浏览 2013-03-02 08:45

机器学习在公司的分享

机器学习在公司的分享,ppt见附件,主要简单介绍了机器学习: 机器学习概念 相关学科 机器学习三大要素 生成模型和判别模型 频率派和贝叶斯派 基本算法的直观理解 模型选择 模型组合-Ensemble Method Online Learning Structure Learning Deep Learning 机遇和挑战 机器学习适用场景
fuliang 评论(1) 有2909人浏览 2013-02-23 12:38

自然语言处理--从规则到统计

      目前各大互联网公司都如火如荼的在研发者自己的推荐业务,因此机械学习、人工智能,数据统计分析建模变成了一个当下很热门的研究方向,那么计算机如何智能的处理自然语言呢,比如最近流行的小黄鸡应用,你的一问一答,他都会憨态可掬的作出很黄很暴力的回答。那么他是怎么处理和分析语言的呢,其实任何一种语言都是一种编码方式,人说话其实就是把想表达的意思进行编码, 编码形式 可以使声音 也可以是电流也可以 ...
davidxiaozhi 评论(3) 有2672人浏览 2013-01-29 18:13

Jubatus: 分布式在线机器学习框架

  Jubatus http://jubat.us/en/overview.html 是一个面向大数据数据流的分布式在线机器学习的开源框架,和storm有些类似,但是从介绍上来看,它提供了更多的功能。   Jubatus认为未来的数据分析平台应该同时向三个方向展开:处理更大的数据,深层次的分析和实时处理;而当前还没有一种能够处理不断生成的流式大数据的水平可扩展的分布式架构。Hadoop的mapred ...
xuwenq 评论(0) 有2708人浏览 2012-10-22 10:01

机器学习推荐论文和书籍

转自http://blog.csdn.net/chl033/article/details/4822922 好好地学习吧。。 发信人: zibuyu (得之我幸), 信区: NLP 标 题: 机器学习推荐论文和书籍 发信站: 水木社区 (Thu Oct 30 21:00:39 2008), 站内 我们组内某小神童师弟通读论文,拟了一个机器学习的推荐论文和书籍列表。 经授权发布在这儿,希望对 ...
jaent 评论(0) 有1448人浏览 2012-10-18 09:15

Machine Learning系列实验--感知机学习

感知机时二分类的线性分类模型,其目的就是寻找通过训练将实例划分为正负两类的分离超平面,其采用的策略是根据现有的超平面和输出值来识别出 ...
daweibalong 评论(0) 有2407人浏览 2012-08-28 00:12

Machine Learning系列实验--SoftMax Regression

SoftMax回归可以用来进行两种以上的分类,很是神奇!实现过程实在有点坎坷,主要是开始写代码的时候理解并不透彻,而且思路不清晰,引以为戒吧! SoftMax Regression属于指数家族,证明见( http://cs229.stanford.edu/notes/cs229-notes1.pdf 及http://ufldl.stanford.edu/wiki/index.php/Soft ...
daweibalong 评论(0) 有6981人浏览 2012-08-23 18:15

Machine Learning系列实验--Logistic function解决分类问题

  分类问题的值是离散的,区别于之前的线性回归问题。本次采用Logistic回归来解决分类问题,实验还是参考了pennyliang的http://blog.csdn.net/pennyliang/article/details/7045372#comments。 Logistic回归问题的,写出likelihood function
daweibalong 评论(0) 有1328人浏览 2012-08-23 18:13

Machine Learning系列实验--参数theta的数学求法

  梯度下降方法通过学习样本不断修改theta值,使得h(x)不断拟合,今天实验的是一种数学的方式来进行theta值的确定,目的跟之前是一样的,求J(θ)达到最小(极小)值,那么有: 令上式等于0,得: 下面用昨天的实验进行验证: from numpy import * x=mat('[1,1,4;1,2,5;1,5,1;1,4,2]') y=mat('[19,26, ...
daweibalong 评论(0) 有1216人浏览 2012-08-23 18:10

Machine Learning系列实验--梯度下降(批量梯度,随机梯度)

看了3集斯坦福大学的机器学习课程,很有意思,开始着手回顾以及一些代码的实现,这次做的是批量梯度下降以及随机梯度下降。讲义在 http://cs229.stanford.edu/notes/cs229-notes1.pdf1)批量梯度下降: 2)随机梯度下降:  实验内容借鉴了pennyliang 在CSDN上的博文http://blog.csdn.net/pennyliang/article/de ...
daweibalong 评论(0) 有6274人浏览 2012-08-23 18:08

模型选择的几种方法:AIC,BIC,HQ准则

经常地,对一堆数据进行建模的时候,特别是分类和回归模型,我们有很多的变量可供使用,选择不同的变量组合可以得到不同的模型,例如我们有5个变量,2的5次方,我们将有32个变量组合,可以训练出32个模型。但是哪个模型更加的好呢?目前常用有如下方法: AIC=-2 ln(L) + 2 k <wbr></wbr> 中文名字:赤池信息量 akaike information ...
motontop 评论(0) 有10人浏览 2012-08-21 15:33

openCv学习笔记(十三)—贝叶斯分类器的实现

第一个是用c语言做的关于文本的分类,主要是对待分类文本所有单词在模板中概率的后验计算。算法比较简单,从网上下的(没记下地址,若不愿意公开,请留言,自当处理),稍作了一点修改。。,等有时间可以实现垃圾邮件的分类,利用斯坦福机器学习公开课中方法,统计高频词,利用朴素贝叶斯。等有时间和大家分享。 #include <stdio.h> #include <string.h> #i ...
sihesizhu 评论(0) 有7人浏览 2012-08-20 17:16

openCv学习笔记(十二)—贝叶斯分类

这几天在学习贝叶斯分类,据说它的文本分析很给力,主要是应用简单,所以就小试以下。。。。 首先看一下贝叶斯应用的一个小例子: 一个士兵射 ...
pengli_ki 评论(0) 有4人浏览 2012-08-20 15:56

梯度、Hessian矩阵、平面方程的法线以及函数导数的含义

想必单独论及“ 梯度、Hessian矩阵、平面方程的法线以及函数导数”等四个基本概念的时候,绝大部分人都能够很容易地谈个一二三,基本没有问题。 ...
zhenqiaoeye 评论(0) 有8人浏览 2012-08-19 22:17

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客电子书下载排行

    >>浏览更多下载

    相关资讯

    相关讨论

    Global site tag (gtag.js) - Google Analytics