聚类算法中基于链接的算法大致有三种:单链接算法(single link),平均链接算法(average link),最小生成数算法(minimum spanning tree)。现在实现单链接算法,其他算法以后再续吧。
单链接算法的过程是 首先生成各个元素的距离矩阵,根据距离和阀值的比对来控制生成的聚类个数,阀值越大,生成的聚类越少,直到同属一类。
下面例子实现了根据经纬度来实现城市的聚类。
package test.algorithm; import java.util.ArrayList; import java.util.List; import java.util.Set; public class SingleLinkTest { public static void main(String[] args) { List<City> citys = new ArrayList<City>(); City city0 = new City(); city0.setName("北 京"); city0.setX(116.28); city0.setY(39.54); citys.add(city0); City city1 = new City(); city1.setName("上 海"); city1.setX(121.29); city1.setY(31.14); citys.add(city1); City city2 = new City(); city2.setName("天 津"); city2.setX(117.11); city2.setY(39.09); citys.add(city2); City city3 = new City(); city3.setName("重 庆"); city3.setX(106.32); city3.setY(29.32); citys.add(city3); City city4 = new City(); city4.setName("哈尔滨"); city4.setX(126.41); city4.setY(45.45); citys.add(city4); City city5 = new City(); city5.setName("长 春"); city5.setX(125.19); city5.setY(43.52); citys.add(city5); City city6 = new City(); city6.setName("南 京"); city6.setX(118.50); city6.setY(32.02); citys.add(city6); City city7 = new City(); city7.setName("武 汉"); city7.setX(114.21); city7.setY(30.37); citys.add(city7); City city8 = new City(); city8.setName("台 北"); city8.setX(121.31); city8.setY(25.03); citys.add(city8); City city9 = new City(); city9.setName("香 港"); city9.setX(114.10); city9.setY(22.18); citys.add(city9); SingleLink sing = new SingleLink(citys); List<Set<City>> list = sing.compute(); for (Set<City> list0 : list) { System.out.println("============="); for (City city : list0) { System.out.println(city.getName() + " : (" + city.getX() + "," + city.getY() + ")"); } } } }
package test.algorithm; import java.util.ArrayList; import java.util.HashSet; import java.util.List; import java.util.Set; /** * 聚类之 单链接算法 */ class SingleLink { private List<City> data; // 默认阀值 private double distanceX = 8; public SingleLink(List<City> list) { data = list; } public List<Set<City>> compute() { List<Set<City>> list = new ArrayList<Set<City>>(); // 距离矩阵 double[][] ds = new double[data.size()][data.size()]; for (int i = 0; i < data.size(); i++) { City city1 = data.get(i); for (int j = i + 1; j < data.size(); j++) { City city2 = data.get(j); ds[i][j] = getDistance(city1, city2); // 矩阵 对称性 ds[j][i] = ds[i][j]; } ds[i][i] = 0.0; } for (int i = 0; i < ds.length; i++) { for (int j = 0; j < ds.length; j++) { System.out.print((int) ds[i][j] + ","); } System.out.println(); } boolean[] hasUsed = new boolean[ds.length]; for (int i = 0; i < ds.length; i++) { Set<City> setDs = new HashSet<City>(); if (hasUsed[i]) { continue; } for (int j = i; j < ds.length; j++) { if (ds[i][j] <= distanceX && hasUsed[j] == false) { setDs.add(data.get(j)); hasUsed[j] = true; } } if (setDs.size() > 0) { list.add(setDs); } } return list; } // 计算空间距离 private double getDistance(City city1, City city2) { double distance = Math.pow(city1.getX() - city2.getX(), 2) + Math.pow(city1.getY() - city2.getY(), 2); return Math.sqrt(distance); } }
package test.algorithm; /** * 城市 */ class City { private String name; // 经度 private double x; // 纬度 private double y; public double getX() { return x; } public void setX(double x) { this.x = x; } public double getY() { return y; } public void setY(double y) { this.y = y; } public String getName() { return name; } public void setName(String name) { this.name = name; } public boolean equals(Object obj) { if (obj == null) { return false; } if (this == obj) { return true; } City other = (City) obj; if (this.getX() == other.getX() && this.getY() == other.getY()) { return true; } return false; } }
相关推荐
Java语言是实现k-means聚类算法的不二之选。 在学习k-means聚类算法之前,需要了解一些基本概念: 1. 聚类分析:聚类分析是指对数据进行分类,将相似的数据点聚类到一起,形成不同的簇。 2. 无监督学习:无监督...
K-means聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象...
java版的DBSCAN聚类算法实现,是典型的算法思路实现,遍历未访问的所有点,如果是核心点,就新建一个簇,然后遍历其邻域内的所有点集A,不断扩展,如果簇内的点时核心点,就将其邻域所有点纳入点集A,并从点集移除已...
java实现FCM聚类算法java实现FCM聚类算法java实现FCM聚类算法java实现FCM聚类算法
在这个场景中,我们讨论的是使用Java编程语言实现的一种基于网格的聚类算法。 1. **Java编程基础** Java是一种广泛使用的面向对象的编程语言,具有跨平台性、高效性和丰富的库支持。在处理大数据和算法实现时,...
聚类算法,使用欧氏距离实现,可通过文件对算法功能进行测试
K-means聚类算法是一种广泛应用的数据挖掘方法,用于无监督学习中的分类问题。它通过将数据点分配到最近的聚类中心来组织数据,从而自动发现数据的分组结构。在JAVA程序实现中,K-means算法的关键步骤包括初始化、...
综上所述,Java实现的KMeans聚类算法可以很好地处理数据库中的字段聚类,通过与MySQL的结合,能有效地对数据进行分析和整理,从而为业务决策提供有力支持。在实际应用中,我们需要关注算法的性能优化和结果的准确性...
本文将介绍聚类算法的原理、应用场景以及如何在Java中实现一个简单的聚类算法。 聚类算法在多个领域有着广泛的应用,以下是一些常见的应用场景: (1)图像处理:聚类算法可用于图像分割、图像检索等场景。 (2)...
Mahout 聚类算法 Mahout 聚类算法是数据挖掘和机器学习领域中的一种重要算法,它可以将相似的数据点聚集在一起,以便更好地理解和分析数据。Mahout 聚类算法可以分为多种类型,如 Canopy、KMeans、Fuzzy-KMeans、...
AP聚类算法,即Affinity Propagation(亲和传播)算法,是由Michael E. Fisher、David M. Bickel和Seth S. Meyer等人在2007年提出的一种无中心、非层次的聚类方法。它不同于传统的K-means或层次聚类,AP算法不需要...
### Hadoop 实现聚类算法 #### 一、引言 在大数据处理领域,Hadoop已经成为了一种不可或缺的工具。其核心组件包括分布式文件系统HDFS(Hadoop Distributed File System)和并行处理框架MapReduce。这些技术为数据...
这是一种数据挖掘中的k均值聚类算法的简单实现,基于Java语言
本项目实现了层次聚类算法的Java版本,下面将详细介绍其关键概念和技术。 首先,层次聚类分为两种类型:凝聚型(Agglomerative)和分裂型(Divisive)。凝聚型是从单个数据点开始,逐步合并成更大的簇,直到满足...
通过上述解释,我们可以看出,"多维k-means聚类算法java实现,导入直接运行"项目提供了一个方便的数据聚类工具,用户只需运行指定的Java程序,即可对多维数据进行有效的分类。文件89d2e98083ce4138aaa151e6efde2e00...
网上很多python的聚类算法有很多,找的Java的,里面是个jar,直接调用就好了
DBSCAN聚类算法的实现,对图片内的物体进行分类,综合考虑了像素和像素点的位置,运行速度较慢。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
【聚类算法】使用numpy实现的聚类算法(包括时空聚类算法).zip 介绍 1.1 数据介绍 data/cluster_time:按时间顺序排列的用户行为轨迹 data/cluster_unix_time:按时间顺序(时间已经转换为时间戳)排列的用户行为...
《Canopy算法:改进聚类算法的探索与实践》 在大数据分析领域,聚类算法是一种重要的无监督学习方法,其目标是将数据集中的对象按照相似性进行分组,形成不同的类别。然而,传统的聚类算法如K-means、DBSCAN等在...