最新文章列表

RocketMQ(05)——消息的群集消费和广播消费

消息的群集消费和广播消费 RocketMQ的消费者进行消息消费时有两种消费方式,群集消费和广播消费。默认是群集消费。 群集消费 Consumer都有一个Group,当两个Consumer实例属于同一个Group时,它们会共享消息队列中的消息消费位移,即同一条消息只会由一个消费者实例消费。实际上一个队列只会分配给一个消费者实例,那么属于该队列中的消息就只能被一个消费者实例消费了。当一个消费者 ...
234390216 评论(0) 有2240人浏览 2020-02-02 00:28

Minimum Spanning Tree

1.  Definition: Given an undirected graph G with positive edge weights (connected). A spanning tree of G is a subgraph T that is connected and acyclic. A minimum spanning tree is a min weight spannin ...
leonzhx 评论(0) 有1290人浏览 2014-01-07 19:11

MST application to Clustering

1.  Problem Definition of Clustering:     Informal goal: Given n "points" [Web pages, images, genome fragments, etc.] classify into "coherent groups" -- cluster      Assumptions ...
leonzhx 评论(0) 有993人浏览 2013-10-04 12:08

Jvm级别的集群(转)

Java的垃圾回收机制(转)   一。谁在做Garbage Collection?       一种流行的说法:在C++里,是系统在做垃圾回收;而在Java里,是java自身在做。   ...
longgangbai 评论(0) 有2327人浏览 2013-07-22 20:14

Clustering: K-Means

K-Means 算法步骤 a. 设置聚类的个数K b. 从样本集中任意选K个样本作为初始簇的中心 c. 计算每个样本与簇中心的距离,划分到最近的簇中 d. 重新计算每个簇的中心, 簇内所有点的平均值 e. 重复c和d,直到簇中心点不再变化,或者自定义的终止条件,例如迭代的最大次数等。
zhou85xin 评论(0) 有1146人浏览 2012-05-09 09:02

Clustering: Canopy

Canopy 本文介绍聚类算法:canopy   该算法的主要特点:无需设置集群个数   算法的步骤 1. 设置参数T1和T2, 其中T1>T2, 参数敏感 2. 在样本集和钟任务一个样本P, 计算P与所有Canopy之间的距离,初始的时候Canopy为空,直接把P     当成一个Canopy.  如果P与某个Canopy距离在T1以内,则将P认为是一个Canopy。如果在T ...
zhou85xin 评论(0) 有1743人浏览 2012-05-08 15:12

mahout in action 中文翻译 第1章 初识mahout

该博文已迁往: http://www.mannyisbusy.com/mahout-in-action-01/
binma85 评论(4) 有5512人浏览 2012-03-09 12:16

最最最简单的URL聚类

我们要发现一个富文本中的http链接,发现一些群体行为,获取URL 第一步:提取http链接 使用 Jsoup 来做 Document doc = Jsoup.parse(stream.getText()) Elements links = doc.select("a[href]") for (Element eleme ...
beneo 评论(0) 有2574人浏览 2011-09-23 22:57

一个基于Mahout与hadoop的聚类搭建

    mahout是基于hadoop的数据挖掘工具,因为有了hadoop,所以进行海量数据的挖掘工作显得更为简单。但是因为算法需要支持M/R,所以不是所有常用的数据挖掘算法都会支持。这篇文章会告诉你,如何使用hadoop + mahout搭出一个简易的聚类工具。     第一步:搭建hadoop平台。 我使用的是ubuntu 11.04,如果没有ubuntu的开发环境,就参考我的帖子《Ubun ...
beneo 评论(2) 有8821人浏览 2011-09-23 22:37

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics