Parallel K-Means Clustering Based on MapReduce - The Best or Nothing! - ITeye博客

`

chenwq

浏览: 569497 次
性别:
来自: 济南

最近访客更多访客>>

thtf2001

u012363178

jiumoji

song0394

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

brandNewUser：楼主你好，问个问题，为什么我写的如下的：JobConf pha ...
Hadoop ChainMap
Molisa： Molisa 写道mapred.min.split.size指 ...
Hadoop MapReduce Job性能调优——修改Map和Reduce个数
Molisa： mapred.min.split.size指的是block数， ...
Hadoop MapReduce Job性能调优——修改Map和Reduce个数
heyongcs：请问导入之后，那些错误怎么解决？
Eclipse导入Mahout
a420144030：看了你的文章深受启发，想请教你几个问题我的数据都放到hbase ...
Mahout clustering Canopy+K-means 源码分析

Parallel K-Means Clustering Based on MapReduce

博客分类：

MapReduce
Hadoop

阅读更多

K-means is a pleasingly parallel algorithm that very easily fits into the Iterative map- reduce model.!

附件是一篇论文，伪代码和算法解释都很清楚。

Parallel_K-Means_Clustering_Based_on_MapReduce.rar (109.2 KB)
下载次数: 28

分享到：

rsync、pscp、ssh | Michael Mitzenmacher：如何阅读论文

2012-08-04 20:28
浏览 1437
评论(1)
分类:行业应用
查看更多

评论

1 楼 Genie13 2012-08-05

好文章···

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Python用K-means聚类算法进行客户分群的实现: ### Python运用K-means聚类算法进行客户分群的实现详解 #### 一、背景与问题陈述在当今商业环境中，了解客户群体特征对于制定有效的市场策略至关重要。本篇文章将探讨如何利用Python中的K-means聚类算法对超市...

K-Means聚类算法C#实现: K-Means聚类算法是一种广泛应用的无监督学习方法，主要用于数据的分组或分类。在C#中实现K-Means，可以帮助开发者在各种数据分析和机器学习项目中进行数据处理。以下是关于K-Means聚类算法及其C#实现的关键知识点： ...

基于Spark的主动重叠K-means聚类算法.docx: 为了加快收敛速度、提高聚类质量，利用主动策略改进并行重叠K-means聚类算法，简称AI_POKM（Active Improved Parallel Overlapping K-means Cluster）算法。 AI_POKM算法可以解决POKM算法的缺陷，提高聚类效率和...

A parallel approximate SS-ELM algorithm based on MapReduce: 本文介绍了一种基于MapReduce的并行近似SS-ELM算法，该算法专为处理大规模数据集而设计。SS-ELM算法是半监督的ELM(极端学习机)算法，其前身ELM算法由于其优越的泛化性能和学习速度，在大数据处理领域获得了广泛关注...

K-Means代码: K-Means聚类算法是一种广泛应用的无监督学习方法，常用于数据的分组或分类。在MATLAB中实现K-Means算法可以帮助我们对大量数据进行有效的分析和理解。以下将详细介绍K-Means算法的基本原理、MATLAB实现过程以及相关...

c#实现k-means算法: k-均值（k-Means）算法是一种经典的聚类分析方法，在数据挖掘和机器学习领域广泛应用。它通过迭代过程将数据集中的样本点分配到预先设定的k个聚类中，目标是使得每个聚类内部的样本点尽可能相似，而不同聚类之间的...

基于主成分分析和K-means聚类的平行坐标可视化技术研究: 提出基于主成分分析和K-means聚类的平行坐标（PCAKP,principal component analysis and k-means clustering parallel coordinate）可视化方法。该方法首先对多维数据采用主成分分析方法进行降维处理，其次对降维后的...

k-means-parallel:实现 K-Means++ 和 K-Means Parallel: 《K-Means 并行实现与扩展：Python 中的 k-means-parallel 框架解析》在机器学习领域，K-Means 是一种广泛使用的无监督聚类算法，用于将数据集中的样本点分配到预先设定的K个类别中。然而，随着数据量的增加，传统...

基于并行遗传算法的K_means聚类研究: 为了解决这些问题，研究人员提出了一种新的方法——基于并行遗传算法(Parallel Genetic Algorithm, PGA)的K-means聚类算法。这种方法结合了K-means算法的高效性和并行遗传算法的全局优化能力，从而能够更好地处理...

parallel-k-means-FMI: 平行k均值FMI（Parallel K-Means with FMI）是一种优化的聚类算法，它结合了传统的k均值算法和互信息（Mutual Information, MI）的概念，旨在提高聚类效果和处理大数据集时的效率。在IT行业中，聚类是数据挖掘中的一...

parallel-studio-xe-2019u4-install-guide-lin.pdf: parallel-studio-xe-2019u4-install-guide-lin.pdf parallel-studio-xe-2019u4-install-guide-lin.pdf parallel-studio-xe-2019u4-install-guide-lin.pdf parallel-studio-xe-2019u4-install-guide-lin.pdf

Parallel extreme learning machine for regression based on MapReduce: Through analyzing the mechanism of ELM algorithm, an efficient parallel ELM for regression is designed and implemented based on MapReduce framework, which is a simple but powerful parallel progr

Parallel two-step phase-shifting microscopic interferometry based on a cube beamsplitter: Parallel two-step phase-shifting interferometry for microscopy is presented, and the recording condition for generalized two-step phase-shifting interferometry is discussed. A 45 degrees tilted cube ...

Parallel-Based-on-Cloud-Computing-to-Achieve-Larg_cloud_cloud co: Parallel Based on Cloud Computing to Achieve Large Data Sets Clustering

mahout数据挖掘: K-Means Mapper 在 MapReduce 框架中负责处理数据映射任务。它在初始化时读取上一次迭代产生的或初始的聚类中心。对于每个输入数据点，Mapper 计算其与所有聚类中心的距离，然后将其归入距离最近的聚类，并输出聚类 ...

jmeter-parallel-0.9.jar: 拷贝jmeter-parallel-0.9.jar到Jmeter/lib/ext上。启动Jmeter。根据需要添加Parallel Controller： 1）在Jmeter的线程组下面的逻辑控制器，选择bzm并行控制器； 2）把浏览器或者wireShark观察到的同一批次的并发...

Global site tag (gtag.js) - Google Analytics