我的那个聚类方法备忘 - - ITeye博客

`

gushuizerotoone

浏览: 176241 次
性别:
来自: 杭州

最近访客更多访客>>

rbaggio10

KnightMCH

牛哄哄

wenming6688

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

qjm201000：您好，问下怎么进入后台管理啊？管理员后台管理在哪边？
Jforum的安装使用
yuchao86： src/ext/thrift_protocol/modules ...
安装thrift
灵魂工程师： -intel-2.7/src/protocol/fastbin ...
安装thrift
左看右看：学习了，不错！
hbase的安装配置
asialee：谢谢了，我对linux不熟悉，装了maven后也出现这样的问题 ...
permission denied的解决方法

我的那个聚类方法备忘

博客分类：

我的那个聚类方法备忘

阅读更多

1. 注意reduce(IntWritable key, Iterable<Text> values, Context context)函数，不是Iterator(旧版的hadoop)

2.每次mapper, context(new IntWritable(center),new Text(""));的时候，传送给reducer 的new IntWritable(center), 虽然center值相同，但是new 出来的IntWritable(center)的对象是不同的,　参照我的AssignPointsToCenterMapper做法写一个intWritableFactoryMap

3.要madreduce, value 的类必须implements Writable借口,实现 readFields(), write(). readFields()的写法参照write(),write是自己想怎么存就怎么存(主要是一个存的顺序问题和读的顺序问题),参照我的SimilarityCell 和SimilarityCellMapWritable

4.好像maper的value输出和reducer的value输出必须是同一class类型,如Text,不能mapper是IntWritable, reducer 是Text,别人虽然说setMapOutPutValueClass()可以,但我试了不行,会抛出error.

5.Mapper 和 Reducer可以通过override setup()函数进行一些初始化工作,如读入centers

6.可以写一个类专门存其他类要用到的变量名,参照ClusterParameters

===========================================================
1.sequenceFile的读和写,参照ClusterUtil里面的函数
2.Text对象里面的字符串可以通过Text.toString()获得

分享到：

Flexible Collaborative Filtering In JAVA ... | JavaEye 中Lucene的一些链接

2010-01-18 17:05
浏览 951
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

mlcheatsheet:线性分类器和聚类算法的机器学习备忘单: 1. **k均值**：是最简单的聚类方法之一，通过迭代找到k个质心，然后将数据分配到最近的质心所在的簇。k值的选择对结果有很大影响，它是一种迭代算法，直到簇不再变化或达到预设迭代次数。 2. **高斯混合模型**：GMM...

人工智能应用技术备忘录: 人工智能的应用技术备忘录旨在总结和整理人工智能相关的概念、方法和技术，以便更好地理解和应用人工智能技术。 1. 回归模型（Linear Predictors）在机器学习中，回归模型是指使用数学函数来预测连续值输出的模型...

python 常用库速查表备忘单 cheaksheets numpy pandas sklearn: 它提供了多种监督和无监督学习算法，如线性回归、逻辑回归、决策树、随机森林、支持向量机、聚类算法等。此外，Sklearn还包括了模型选择、特征选择、数据预处理和评估工具。 4. **Scipy**： Scipy是科学计算的扩展...

MyCheatSheets：数据科学的出色备忘单: 备忘单可能会包括基础语法、Numpy（数值计算）、Pandas（数据处理）和Matplotlib（数据可视化）等模块的关键使用方法。 2. **Machine Learning**: 机器学习是数据科学的核心部分，包括监督学习（如回归、分类）、无...

matlab代码影响-Dominant-Sets-Clustering:关于如何使用图论聚类来检测尖峰排序中稀疏触发神经元的教程: 用于MATLAB的备忘录脚本和示例数据可重现教程中显示的结果。评论在教程提供的示例中，聚类将应用于ISOMAP空间中数据（峰值）的坐标。可以使用任何其他多维坐标/特征（甚至原始波形）。每次结果都不相同，因为在...

数据科学-备忘单：备忘单: - 无监督学习：聚类（K-Means、DBSCAN）、降维（主成分分析）、关联规则挖掘（Apriori）。 - 模型评估：交叉验证、ROC曲线、AUC、精确率、召回率、F1分数等。 5. 模型调优： - 参数调优：使用网格搜索、随机搜索...

Data-Science-Cheatsheet:一份有用的4页数据科学备忘单，可帮助您进行考试复习，面试准备以及介于两者之间的任何内容: 涵盖的主题（比其他主题更深入）包括：常见分布线性和逻辑回归决策树和随机森林支持向量机知识网络聚类助推降维（PCA，LDA，因子分析）自然语言处理神经网络推荐系统强化学习异常检测链接屏幕截图为什么本备忘单...

Awesome-DataScience-Cheatsheets：用于数据科学，机器学习和深度学习的备忘单的集合:): 备忘单涵盖了Python的基础语法、控制结构、函数定义、类和对象等核心概念，同时强调了Pandas、NumPy和Matplotlib等常用库的使用方法，帮助初学者快速上手数据处理工作。二、数据科学工具与实践数据科学涉及从数据...

2024年美赛35篇特等奖O奖论文-C-2406324.pdf: 本论文聚焦于“动量”这一在网球比赛中复杂而又重要的现象，通过分析2023年温布尔登男子比赛的数据来探讨动量的变化及其预测方法。该研究构建了一个评估模型，利用指数加权移动平均（Exponential Weighted Moving ...

cheatsheets-ai：面向深度学习和机器学习研究人员的必备备忘单https：medium.com@kailashahirwaresential-cheat-sheets-for-machine-learning-and-deep-learning-researchers-efb6a8ebd2e5: 备忘单会涵盖监督学习、无监督学习和强化学习的基础知识，包括常见的分类算法（如逻辑回归、支持向量机、决策树）、回归算法（如线性回归、岭回归）以及聚类算法（如K-means、DBSCAN）。 2. **深度学习原理**： ...

MIT的人工智能英语论文: Church语言的独特之处在于它定义了评估历史和条件分布，以及引入了一种创新的语言结构——随机备忘录器（stochastic memoizer），这使得许多复杂的非参数模型可以被简单地描述出来。例如，Church可以用来描述一个...

HCDE438-Cheatsheets:HCDE 438 2020年夏季备忘单: - 基本算法：理解监督学习（如线性回归、逻辑回归、决策树等）和无监督学习（如聚类、主成分分析等）的概念。 - 深度学习：学习神经网络、卷积神经网络和循环神经网络，以及它们在医疗图像识别和自然语言处理中的...

2021年美国数学建模题目中文版分享.pdf: 2. 分类模型：利用机器学习或统计方法，比如聚类分析，对叶子进行分类。特征可以包括形状参数、纹理、颜色等，这些可以通过图像处理技术提取。 3. 光照优化：利用微分几何和优化理论，模拟叶子的排列方式，以最大化...

ML-DL-算法：包含注释，备忘单，数据集以及不同ML和DL算法和库用法的存储库。这些文件可用作下一个项目的基础模板: - 非监督学习：如聚类（K-means、DBSCAN）、主成分分析（PCA）、关联规则（Apriori、FP-Growth）等。 - 半监督学习和强化学习也有所涉及。 2. **深度学习算法**： - 深度神经网络（DNN）：基础的多层感知器模型...

c-cpp-python:我的个人备忘单，用于学习CC ++和python编程语言，包括C ++中的STL库，numpy，sklearn和python的pandas: scikit-learn（简称sklearn）是Python中一个强大的机器学习库，它包含了大量的监督和无监督学习算法，如线性回归、逻辑回归、支持向量机、决策树、随机森林、聚类算法等。sklearn还提供了数据预处理工具，如特征缩放...

leetcode中文版-Star-Collection-of-Machine-learning:原作者链接：https://github.co: 教程和备忘单 1.2 书籍源代码 1.3 编程竞赛 2. 机器学习与深度学习 2.1 机器学习 2.2 深度学习 2.3. 强化学习 2.4 工具包或库 2.5 生成对抗网络 2.6 NLP（自然语言处理）语言建模文本生成工具包词聚类文本处理 ...

leetcode中文版-stars-collection::star2：很棒的存储库的集合（分为不同的类别）: 教程和备忘单 1.2 书籍源代码 1.3 编程竞赛 2. 机器学习与深度学习 2.1 机器学习 2.2 深度学习 2.3. 强化学习 2.4 工具包或库 2.5 生成对抗网络 2.6 NLP（自然语言处理）语言建模文本生成工具包词聚类文本处理 ...

notes:我的笔记-PWA笔记本: 沙里亚尔的笔记原则 ...聚类机器学习资源图分析并行预处理深度学习神经网络自然语言处理图像处理计算机视觉 AI-强化学习工具朱皮特大熊猫脾气暴躁的张量流火炬可视化备忘单斯坦福

nvivo使用教程: 用户可以利用NVivo执行各种查询，比如词频查询，来分析数据中的常见词汇和短语，生成词云、树形图和聚类分析等可视化结果，以帮助理解数据趋势和模式。教程还提供了如何将查询结果转化为节点，并排除搜索中的不相关...

Algorithm Design（英文版）: 6.2 动态规划原理：备忘录或者子问题迭代 6.3 分段的最小二乘：多重选择 6.4 子集和与背包：加一个变量 6.5 RNA二级结构：在区间上的动态规划 6.6 序列比对 6.7 通过分治策略在线性空间的序列比对 6.8 图中的最短...

Global site tag (gtag.js) - Google Analytics