最新文章列表

K近邻算法

        原理:有一个训练样本集,而且训练集中的每组数据都有一个分类。输入分类不确定的数据后,输入数据的每个特征会和训练集中数据对应的特征进行比较,计算出它们之间的“距离”。把这些“距离”排序,选择距离较“近”的K个,统计这K个样本的类别,数目最多的就认为是输入数据所在的分类。       关键点:1.K值的选取。2.选择哪些特征来描述对象。3.“距离”的定义
wmyyx091 评论(0) 有887人浏览 2014-03-03 19:38

Mahout – 机器学习

wget http://mirrors.ustc.edu.cn/apache/mahout/0.8/mahout-distribution-0.8.tar.gz tar -xzvf mahout-distribution-0.8.tar.gz cd mahout-distribution-0.8 sudo vi /etc/profile 增加:     export PATH= ...
wbj0110 评论(0) 有826人浏览 2013-12-03 09:43

HMM三个问题

HMM有三个典型问题: 1.已知模型参数,计算某一特定输出序列的概率.通常使用forward算法解决. 2.已知模型参数,寻找最可能的能产生某一特定输出序列的隐含状态的序列.通常使用Viterbi算法解决. 3.已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Welch算法以及Reversed Viterbi算法解决.
thd52java 评论(0) 有2293人浏览 2013-11-24 22:51

梯度下降算法

回归在数学上来说是给定一个点集,能够用一条曲线去拟合之,如果这个曲线是一条直线,那就被称为线性回归,如果曲线是一条二次曲线,就被称为二 ...
wang4674890 评论(0) 有690人浏览 2013-11-23 23:20

伽马贝塔函数

在数理方程、概率论等学科经常遇到以下的含参变量的积分            ,  它们依次为第一类和第二类欧拉(Euler 1707~1783 瑞士数学家)积分,或依次称为贝塔(Bata)函数和伽马(Gamma)函数,这一节主要讨论这两个函数的若干性质。  11.3.1  伽马函数 显然,我们应首先考虑伽马函数                                        ...
thd52java 评论(0) 有2586人浏览 2013-11-13 09:56

Mahout系列之----kmeans 聚类

Kmeans是最经典的聚类算法之一,它的优美简单、快速高效被广泛使用。 Kmeans算法描述 输入:簇的数目k;包含n个对象的数据集D。 输出:k个簇的集合 ...
thd52java 评论(2) 有3252人浏览 2013-11-10 12:26

weka 算法大全

关联规则挖掘   (一)  Apriori    (二)  FilteredAssociator    (三)  FPGrowth    (四)  GeneralizedSequentislPatterns   (五)  PredictiveApriori   (六)  Tertius    Cluster    (一)  CLOPE   (二)  Cobwe ...
thd52java 评论(0) 有7117人浏览 2013-11-10 12:24

mahout系列之-----相似度

Mahout推荐系统中有许多相似度实现,这些组件实现了计算不能User之间或Item之间的相似度。对于数据量以及数据类型不同的数据源,需要不同的 相似度 ...
thd52java 评论(0) 有2244人浏览 2013-11-09 14:47

Mahout 系列之----距离度量

x = (x1,...,xn) 和y = (y1,...,yn) 之间的距离为   (1)欧氏距离   EuclideanDistanceMeasure     (2)曼哈顿距离  ManhattanDistanceMeasure      (3)马氏距离MahalanobisDistanceMeasure 马氏距离是由印度统计学家马哈拉诺比斯提出的,表示数据的协方差距离。 ...
thd52java 评论(0) 有1156人浏览 2013-11-09 14:43

推荐系统初探之一 —— 寻找相似的用户

       推荐系统初探之一  —— 寻找相似的用户        不知当你登陆亚马逊、淘宝等购物网站时,是否留意过那神奇推荐栏:当你买过一部手机,那里会出现你需要的手机配件;但你买过一本书,它会给你推荐一大堆类似的书籍;而有时候它甚至会向你推荐你可能喜欢的影片,即使你可能只在这买过食品……         其实,大多数购物网站都会有一个推荐系统,通过分析你的兴趣偏好,找到与你有相同品味的 ...
t1174779123 评论(1) 有1720人浏览 2013-10-16 01:22

大数据系列9:Mahout – 机器学习

wget http://mirrors.ustc.edu.cn/apache/mahout/0.8/mahout-distribution-0.8.tar.gz tar -xzvf mahout-distribution-0.8.tar.gz cd mahout-distribution-0.8 sudo vi /etc/profile 增加:     export PATH=$PAT ...
yangshangchuan 评论(0) 有7052人浏览 2013-10-03 00:15

【原】斯坦福大学Andrew Ng教授主讲的《机器学习》公开课观后感

近日,在网易公开课视频网站上看完了《机器学习》课程视频,现做个学后感,也叫观后感吧。 学习时间 从2013年7月26日星期五开始,在网易公开课视 ...
liliphd 评论(1) 有17522人浏览 2013-08-22 17:28

推荐系统的评价指标

最近一直在看推荐系统相关的东西,深深感到人过30后记忆力下降,一些概念看过很容易就忘了,还是记录到这里。 -------------------------- 评价一个推荐系统的好坏,有很多种方式,项亮的《推荐系统实践》中已经有比较全面的描述。书中给出了十种评价的维度,其中准确率、召回率、多样性这三种指标可以通过离线实验计算得出。其余的用户满意度、信任度等指标则需要通过问卷调查和在线实验得出。 ...
yuxie 评论(1) 有3345人浏览 2013-08-04 03:16

mahout0.7成功编译总结

  欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   一直在学习mahout,工作中使用的是0.7跑算法,进行测试,但是在使用maven导入eclipse中构建的时候出现了问题, 首先由于m2e的lifeStyle覆盖问题,两个插件不能使用,如下图   m2e插件现在已经被eclipse托管,在看eclipse官方网站看过文 ...
davidxiaozhi 评论(0) 有2323人浏览 2013-07-05 22:14

机器学习 四 基本方法一

摘自: 《数据挖掘-实用机器学习技术》 一、推断基本规则,1规则(1-rule) 定义:建立一个只对单个属性进行测试的规则,并进行不同的分支。 , ...
blackproof 评论(0) 有1417人浏览 2013-07-03 17:43

机器学习 三 输出

  机器学习:输出   机器学习的输出时一系列的模式的表达方式,是推断数据输出结构的技术 以下就是输出结构的表达方式:   一、决策表 与输 ...
blackproof 评论(0) 有1876人浏览 2013-06-28 18:39

机器学习 二 输入

机器学习:输入   一、四种学习方式: 1.分类学习 classification learning : 用一个已分类的样本集表示学习方法 2.关联学习 association learning : 寻找任何特征之间的关联 3.聚类 clustering : 寻找能够组合在一起的样本,并以此分组 4.数值预测 numeric prediction : 预测出的是一个数值量,不是离散类 ...
blackproof 评论(0) 有1872人浏览 2013-06-27 15:15

机器学习 一 基本概念

机器学习基本概念:(定义) 1.机器学习:从数据中寻找有价值的模式(操作)           通过学习表现更好的行为(操作)   2.属性列表法:属性的组合,对应结果   3.决策列 decision list : 属性组合对应结果明确结果(可以减少决策判断次数,如下雨yes,玩no。之后的条件就无需判断),有上下文。   4.决策树法:指出做出的决策顺序,和建议       ...
blackproof 评论(0) 有1222人浏览 2013-06-26 19:49

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客电子书下载排行

    >>浏览更多下载

    相关资讯

    相关讨论

    Global site tag (gtag.js) - Google Analytics