`
coderplay
  • 浏览: 578046 次
  • 性别: Icon_minigender_1
  • 来自: 广州杭州
社区版块
存档分类
最新评论

关于canopy聚类的几点思考

F# 
阅读更多
1. 首先是轻量距离量度的选择,是选择数据模型其中的一个属性,还是其它外部属性这对canopy的分布最为重要。
2. T1, T2的取值影响到canopy重叠率f,以及canopy的粒度。
3. Canopy有消除孤立点的作用,而K-means在这方面却无能为力。建立canopies之后,可以删除那些包含数据点数目较少的canopy,往往这些canopy是包含孤立点的。
4. 根据canopy内点的数目,来决定聚类中心数目k,这样效果比较好
分享到:
评论
1 楼 skyleaf 2010-03-28  
请问t1,t2的取值,有什么规律或者公式吗?我在用canopy的时候怎么确定t1,t2的值才能让聚类结果更好一点呢?

相关推荐

Global site tag (gtag.js) - Google Analytics