本月博客排行
-
第1名
龙儿筝 -
第2名
zysnba -
第3名
johnsmith9th - wy_19921005
- sgqt
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- wy_19921005
- benladeng5225
- fantaxy025025
- javashop
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- ranbuijj
- arpenker
- tanling8334
- kaizi1992
- sichunli_030
- xpenxpen
- gaojingsong
- wiseboyloves
- xiangjie88
- ganxueyun
- xyuma
- wangchen.ily
- jh108020
- zxq_2017
- jbosscn
- lemonhandsome
- luxurioust
- Xeden
- lzyfn123
- forestqqqq
- zhanjia
- nychen2000
- ajinn
- wjianwei666
- johnsmith9th
- hanbaohong
- daizj
- 喧嚣求静
- silverend
- mwhgJava
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
最新文章列表
大数据系列9:Mahout – 机器学习
wget http://mirrors.ustc.edu.cn/apache/mahout/0.8/mahout-distribution-0.8.tar.gz
tar -xzvf mahout-distribution-0.8.tar.gz
cd mahout-distribution-0.8
sudo vi /etc/profile
增加:
export PATH=$PAT ...
mahout之Kmeans使用及结果分析
Mahout-Kmeans
1,两个输入路径:一个是数据的点;一个是初始集群。
点的输入文件是SequenceFile(Key, VectorWritable)格式;
而初始集群的输入文件格式是SequenceFiles(Text, Cluster | Canopy)
2,每次迭代会产生一个输出目录“cluster-N”,输出文件格式为SequenceFile(Te ...
mahout0.7成功编译总结
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911
一直在学习mahout,工作中使用的是0.7跑算法,进行测试,但是在使用maven导入eclipse中构建的时候出现了问题,
首先由于m2e的lifeStyle覆盖问题,两个插件不能使用,如下图
m2e插件现在已经被eclipse托管,在看eclipse官方网站看过文 ...
MahoutDriver运作机制-mahout源码学习及总结
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911
mahout入口类MahoutDriver
如果我们想要研究MahoutDriver的源码,没有什 ...
mahout脚本调用流程分析
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群 推荐系统之Mahout 135918911
剖析mahout脚本
mahout 位于$MAHOUT_HOME/bin目录下,是所有mahout调用的 ...
自然语言处理--信息模型
今天拜读了数学之美的第一章,例举的例子感觉真是浅显易懂,这里不禁要对吴军老师的写作功底拜服,下面谈谈对信息模型的理解,数字、文字和语言作为信息的载体,他们的目的都是记录和传播信息,就像我们的老祖先一样乌拉乌拉几句,对方就明白了,你丫的骂我,拿起石头就扔过去了,其实他们的这种交流可以概括为
信息1--编码(也就是怪叫)---信息2(听到的声音)-----解码----信息1(得到原始信息),其实这 ...
自然语言处理--从规则到统计
目前各大互联网公司都如火如荼的在研发者自己的推荐业务,因此机械学习、人工智能,数据统计分析建模变成了一个当下很热门的研究方向,那么计算机如何智能的处理自然语言呢,比如最近流行的小黄鸡应用,你的一问一答,他都会憨态可掬的作出很黄很暴力的回答。那么他是怎么处理和分析语言的呢,其实任何一种语言都是一种编码方式,人说话其实就是把想表达的意思进行编码, 编码形式 可以使声音 也可以是电流也可以 ...
Mahout各种推荐器的主要特点
Mahout有很多推荐的实现,各有特点,在这里一并记录。
GenericUserBasedRecommender: 基于用户的推荐,用户数量相对较少时速度较快。
GenericItemBasedRecommender:基于物品的推荐,物品数量较少时速度较快,外部提供了物品相似度数据后会更加有效率。
SlopeOneRecommender:基于slope-one算法(想 ...
mahout安装测试
mahout 安装
软件准备:hadoop-0.20.2,mahout-0.4,ubuntu 11.10,jdk1.6 mahout的版本0.4只对hadoop-0.20.2版本兼容 如果fs版本为hadoop0.20.2 请下载mahout0.4版本
...
mahout in action 协同过滤
public class myMahout {
public static void main(String args[]) throws Exception {
DataModel model = new FileDataModel(new File("C:/total.csv")); // 选择数据文件MovieLen
RecommenderEvalua ...
mahout(Taste)初探
mahout是 Apache Software Foundation (ASF)开发的一个开源项目,主要包括了一些经典机器学习算法的实现,并且通过对hadoop的支持可以很容易的拓展到云上,对mahout的关注主要是因为它收纳了Taste框架。
一、关于安装
有两种方式可以使用mahout,一种是直接安装:按照JDK->maven->mahout->hadoop的顺序,参照 ...