最新文章列表

大数据系列9:Mahout – 机器学习

wget http://mirrors.ustc.edu.cn/apache/mahout/0.8/mahout-distribution-0.8.tar.gz tar -xzvf mahout-distribution-0.8.tar.gz cd mahout-distribution-0.8 sudo vi /etc/profile 增加:     export PATH=$PAT ...
yangshangchuan 评论(0) 有7055人浏览 2013-10-03 00:15

mahout的对数似然相似源码分析

    mahout中有个对数似然相似的方法,可以计算用户1和用户2之间的相似程度,如2个用户具有共同偏好item数量k11,用户1还偏好item数k12(不含共同k11,也 ...
shenxhwl 评论(0) 有708人浏览 2013-09-16 14:34

推荐系统的评价指标

最近一直在看推荐系统相关的东西,深深感到人过30后记忆力下降,一些概念看过很容易就忘了,还是记录到这里。 -------------------------- 评价一个推荐系统的好坏,有很多种方式,项亮的《推荐系统实践》中已经有比较全面的描述。书中给出了十种评价的维度,其中准确率、召回率、多样性这三种指标可以通过离线实验计算得出。其余的用户满意度、信任度等指标则需要通过问卷调查和在线实验得出。 ...
yuxie 评论(1) 有3350人浏览 2013-08-04 03:16

mahout之Kmeans使用及结果分析

Mahout-Kmeans 1,两个输入路径:一个是数据的点;一个是初始集群。      点的输入文件是SequenceFile(Key, VectorWritable)格式;       而初始集群的输入文件格式是SequenceFiles(Text, Cluster | Canopy) 2,每次迭代会产生一个输出目录“cluster-N”,输出文件格式为SequenceFile(Te ...
ghost_face 评论(0) 有4499人浏览 2013-07-12 19:32

mahout0.7成功编译总结

  欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   一直在学习mahout,工作中使用的是0.7跑算法,进行测试,但是在使用maven导入eclipse中构建的时候出现了问题, 首先由于m2e的lifeStyle覆盖问题,两个插件不能使用,如下图   m2e插件现在已经被eclipse托管,在看eclipse官方网站看过文 ...
davidxiaozhi 评论(0) 有2326人浏览 2013-07-05 22:14

MahoutDriver运作机制-mahout源码学习及总结

欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   mahout入口类MahoutDriver   如果我们想要研究MahoutDriver的源码,没有什 ...
davidxiaozhi 评论(0) 有1580人浏览 2013-05-28 22:19

mahout脚本调用流程分析

欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   剖析mahout脚本   mahout 位于$MAHOUT_HOME/bin目录下,是所有mahout调用的 ...
davidxiaozhi 评论(0) 有1708人浏览 2013-05-28 22:11

自然语言处理--信息模型

今天拜读了数学之美的第一章,例举的例子感觉真是浅显易懂,这里不禁要对吴军老师的写作功底拜服,下面谈谈对信息模型的理解,数字、文字和语言作为信息的载体,他们的目的都是记录和传播信息,就像我们的老祖先一样乌拉乌拉几句,对方就明白了,你丫的骂我,拿起石头就扔过去了,其实他们的这种交流可以概括为 信息1--编码(也就是怪叫)---信息2(听到的声音)-----解码----信息1(得到原始信息),其实这 ...
davidxiaozhi 评论(0) 有1169人浏览 2013-02-01 09:45

自然语言处理--从规则到统计

      目前各大互联网公司都如火如荼的在研发者自己的推荐业务,因此机械学习、人工智能,数据统计分析建模变成了一个当下很热门的研究方向,那么计算机如何智能的处理自然语言呢,比如最近流行的小黄鸡应用,你的一问一答,他都会憨态可掬的作出很黄很暴力的回答。那么他是怎么处理和分析语言的呢,其实任何一种语言都是一种编码方式,人说话其实就是把想表达的意思进行编码, 编码形式 可以使声音 也可以是电流也可以 ...
davidxiaozhi 评论(3) 有2676人浏览 2013-01-29 18:13

Mahout各种推荐器的主要特点

    Mahout有很多推荐的实现,各有特点,在这里一并记录。     GenericUserBasedRecommender: 基于用户的推荐,用户数量相对较少时速度较快。     GenericItemBasedRecommender:基于物品的推荐,物品数量较少时速度较快,外部提供了物品相似度数据后会更加有效率。     SlopeOneRecommender:基于slope-one算法(想 ...
AngelAndAngel 评论(0) 有3006人浏览 2012-12-06 15:17

Mahout的taste里的几种相似度计算方法

  欧几里德相似度(Euclidean Distance) 最初用于计算欧几里德空间中两个点的距离,以两个用户x和y为例子,看成是n维空间的两个向量x和y,  xi表示用 ...
anylin 评论(1) 有3861人浏览 2012-11-09 18:00

mahout安装测试

mahout 安装 软件准备:hadoop-0.20.2,mahout-0.4,ubuntu 11.10,jdk1.6  mahout的版本0.4只对hadoop-0.20.2版本兼容 如果fs版本为hadoop0.20.2 请下载mahout0.4版本   ...
duguyiren3476 评论(0) 有5907人浏览 2012-09-26 11:22

mahout in action 协同过滤

public class myMahout { public static void main(String args[]) throws Exception { DataModel model = new FileDataModel(new File("C:/total.csv")); // 选择数据文件MovieLen RecommenderEvalua ...
长安长宁 评论(0) 有1628人浏览 2012-07-07 02:23

Mahout介绍

What is Mahout, why need it? Mahout 是机器学习和数据挖掘的一个分布式框架,区别于其他的开源数据挖掘软件,它是基于hadoop之上的; 所以hadoop的优势就是Mahout的优势。官网http://mahout.apache.org/ 上说的Scalable就是指hadoop的可扩展性。 Mahout用map-reduce实现了部分数据挖掘算法,解决了并行 ...
zhou85xin 评论(1) 有36919人浏览 2012-05-07 15:25

五个最给力的Hadoop项目

  1.Cascading:Cascading是基于Hadoop集群之上的数据处理API。它通过实现了丰富的功能化API,使你不需要接触MapReduce任务就能使用分布式计算能力,其核心概念是基于管道和流的数据处理。 2.Mahout:Mahout是一个基于Hadoop实现各种机器学习与数据挖掘算法库。被用来提供推荐服务。 3.Hive:Hive由Facebook出品,它为Hadoop提供 ...
yaweidai 评论(0) 有1364人浏览 2012-04-10 11:26

mahout in action 中文翻译 第2章 推荐系统简介

博文迁移至: http://www.mannyisbusy.com/mahout-in-action-02/
binma85 评论(4) 有4228人浏览 2012-03-25 22:03

mahout in action 中文翻译 第1章 初识mahout

该博文已迁往: http://www.mannyisbusy.com/mahout-in-action-01/
binma85 评论(4) 有5512人浏览 2012-03-09 12:16

mahout 逻辑回归算法详述

mahout自带了逻辑回归算法,SGD 随机梯度下降,https://cwiki.apache.org/MAHOUT/logistic-regression.html mahout官方wiki其实对算法做的介绍其实不清不楚,笔者辛苦了周把的时间终于“破解”了此算法,share给大家了。
badxy 评论(2) 有6233人浏览 2012-01-18 21:57

mahout(Taste)初探

mahout是 Apache Software Foundation (ASF)开发的一个开源项目,主要包括了一些经典机器学习算法的实现,并且通过对hadoop的支持可以很容易的拓展到云上,对mahout的关注主要是因为它收纳了Taste框架。 一、关于安装 有两种方式可以使用mahout,一种是直接安装:按照JDK->maven->mahout->hadoop的顺序,参照 ...
JokerT 评论(0) 有1508人浏览 2011-09-27 15:55

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics