- 浏览: 156217 次
- 性别:
- 来自: 内蒙古
文章分类
最新评论
-
linest:
ethi_teye 写道id可能是0开头的,你用int保存再输 ...
pat-1022 Digital Library -
ethi_teye:
id可能是0开头的,你用int保存再输出,这些0就被忽略了。
pat-1022 Digital Library -
lixuanchong:
在lz的代码上稍作修改即可:
#include<iost ...
pat-1010* Radix -
air_sky:
确实。。result=a0*base^0+a1*base^1+ ...
pat-1010* Radix -
linest:
air_sky 写道
关于“方程只有一个正整数解,就可以用二分 ...
pat-1010* Radix
用到:泛型类 counter 哈希实现
package org.apache.mahout.clustering.minhash;
public final class MinHashDriver extends AbstractJob
输入Sequence格式
输出根据debug模式可选向量和文本格式,文件可以Sequence和Text格式
package org.apache.mahout.clustering.minhash;
public class MinHashMapper extends Mapper<Text,VectorWritable,Text,Writable>
setup函数中
根据类型和数量生成hash函数组
map函数
对于每个哈希函数
将函数应用于item的每个feature,将feature值转成4字节,取最小的哈希值
聚类id的组合和分发
keyGroups控制id的组成段数
格式为XXX-XXX-XXX格式
每个item对每个哈希函数都分发一次
package org.apache.mahout.clustering.minhash;
public class MinHashReducer extends Reducer<Text,Writable,Text,Writable>
reduce函数
根据debug类型解析不同类型
counter使用,参数是enum类型
数量小于最小聚类数的被舍弃掉
package org.apache.mahout.clustering.minhash;
public final class HashFactory
哈希的实现
三种哈希类型
孪生素数,相差为2的两个数都是质数的情况
整型范围内最大孪生素数的较小值
RandomUtils.MAX_INT_SMALLER_TWIN_PRIME = 2147482949
哈希用素数取模冲突小
线性哈希
多项式哈希
MurMur哈希
package org.apache.mahout.clustering.minhash;
public final class MinHashDriver extends AbstractJob
输入Sequence格式
输出根据debug模式可选向量和文本格式,文件可以Sequence和Text格式
Class<? extends Writable> outputClass = debugOutput ? VectorWritable.class : Text.class; Class<? extends OutputFormat> outputFormatClass = debugOutput ? SequenceFileOutputFormat.class : TextOutputFormat.class; job.setMapperClass(MinHashMapper.class); job.setReducerClass(MinHashReducer.class); job.setInputFormatClass(SequenceFileInputFormat.class); job.setOutputFormatClass(outputFormatClass); job.setMapOutputKeyClass(Text.class); job.setMapOutputValueClass(outputClass); job.setOutputKeyClass(Text.class); job.setOutputValueClass(outputClass);
package org.apache.mahout.clustering.minhash;
public class MinHashMapper extends Mapper<Text,VectorWritable,Text,Writable>
setup函数中
根据类型和数量生成hash函数组
hashFunction = HashFactory.createHashFunctions(hashType, numHashFunctions);
map函数
对于每个哈希函数
将函数应用于item的每个feature,将feature值转成4字节,取最小的哈希值
for (int i = 0; i < numHashFunctions; i++) { for (Vector.Element ele : featureVector) { int value = (int) ele.get(); bytesToHash[0] = (byte) (value >> 24); bytesToHash[1] = (byte) (value >> 16); bytesToHash[2] = (byte) (value >> 8); bytesToHash[3] = (byte) value; int hashIndex = hashFunction[i].hash(bytesToHash); if (minHashValues[i] > hashIndex) { minHashValues[i] = hashIndex; } } }
聚类id的组合和分发
keyGroups控制id的组成段数
格式为XXX-XXX-XXX格式
每个item对每个哈希函数都分发一次
for (int i = 0; i < numHashFunctions; i++) { StringBuilder clusterIdBuilder = new StringBuilder(); for (int j = 0; j < keyGroups; j++) { clusterIdBuilder.append(minHashValues[(i + j) % numHashFunctions]).append('-'); } String clusterId = clusterIdBuilder.toString(); clusterId = clusterId.substring(0, clusterId.lastIndexOf('-')); Text cluster = new Text(clusterId); Writable point; if (debugOutput) { point = new VectorWritable(featureVector.clone()); } else { point = new Text(item.toString()); } context.write(cluster, point); }
package org.apache.mahout.clustering.minhash;
public class MinHashReducer extends Reducer<Text,Writable,Text,Writable>
reduce函数
根据debug类型解析不同类型
Collection<Writable> pointList = new ArrayList<Writable>(); for (Writable point : points) { if (debugOutput) { Vector pointVector = ((VectorWritable) point).get().clone(); Writable writablePointVector = new VectorWritable(pointVector); pointList.add(writablePointVector); } else { Writable pointText = new Text(point.toString()); pointList.add(pointText); } }
counter使用,参数是enum类型
数量小于最小聚类数的被舍弃掉
if (pointList.size() >= minClusterSize) { context.getCounter(Clusters.ACCEPTED).increment(1); for (Writable point : pointList) { context.write(cluster, point); } } else { context.getCounter(Clusters.DISCARDED).increment(1); }
package org.apache.mahout.clustering.minhash;
public final class HashFactory
哈希的实现
三种哈希类型
public enum HashType { LINEAR, POLYNOMIAL, MURMUR }
孪生素数,相差为2的两个数都是质数的情况
整型范围内最大孪生素数的较小值
RandomUtils.MAX_INT_SMALLER_TWIN_PRIME = 2147482949
哈希用素数取模冲突小
线性哈希
static class LinearHash implements HashFunction { private final int seedA; private final int seedB; LinearHash(int seedA, int seedB) { this.seedA = seedA; this.seedB = seedB; } @Override public int hash(byte[] bytes) { long hashValue = 31; for (long byteVal : bytes) { hashValue *= seedA * byteVal; hashValue += seedB; } return Math.abs((int) (hashValue % RandomUtils.MAX_INT_SMALLER_TWIN_PRIME)); } }
多项式哈希
static class PolynomialHash implements HashFunction { private final int seedA; private final int seedB; private final int seedC; PolynomialHash(int seedA, int seedB, int seedC) { this.seedA = seedA; this.seedB = seedB; this.seedC = seedC; } @Override public int hash(byte[] bytes) { long hashValue = 31; for (long byteVal : bytes) { hashValue *= seedA * (byteVal >> 4); hashValue += seedB * byteVal + seedC; } return Math .abs((int) (hashValue % RandomUtils.MAX_INT_SMALLER_TWIN_PRIME)); } }
MurMur哈希
static class MurmurHashWrapper implements HashFunction { private final int seed; MurmurHashWrapper(int seed) { this.seed = seed; } @Override public int hash(byte[] bytes) { long hashValue = MurmurHash.hash64A(bytes, seed); return Math.abs((int) (hashValue % RandomUtils.MAX_INT_SMALLER_TWIN_PRIME)); } }
发表评论
-
Mahout LDA CVB
2012-08-17 15:40 0起始的log说明了各个参数的含义 Will run Col ... -
读代码-LDADriver及相关
2012-02-07 23:59 0用到写文件,mapred迭代收敛框架,内部迭代收敛框架,向量每 ... -
读代码-BayesFileFormatter
2012-02-03 22:51 1095用到: 文件读写,文件夹下遍历文件处理 package or ... -
读代码-CanopyDriver及相关
2012-01-27 13:22 0用到:classloader动态加载 hadoop setu ... -
ToolRunner机制
2012-01-26 11:57 3561定义框架接口 由具体实现类实现 public interf ... -
mahout 启动对应
2011-12-22 12:11 0org.apache.mahout.utils.vectors ... -
读代码-Pattern和FrequentPatternMaxHeap
2011-12-01 19:52 946package org.apache.mahout.fpm.p ... -
读代码-TransactionTree
2011-11-25 15:19 0package org.apache.mahout.fpm.p ... -
读代码-FPGrowthDriver及相关
2011-11-25 09:57 0Key points: 平均分组 堆结构 结构序列化传递 ... -
读代码-TopKStringPatterns
2011-11-24 14:25 988package org.apache.mahout.fpm.p ... -
读代码-BayesDriver及相关
2011-11-18 10:18 0用到:重载key value类型,重载outputFormat ... -
读代码-TrainClassifier和TestClassifier
2011-11-17 19:44 1455package org.apache.mahout.class ... -
读代码-RandomSeedGenerator
2011-11-04 17:01 1232package org.apache.mahout.clust ... -
读代码-VectorWritable
2011-11-01 11:04 1360package org.apache.mahout.math; ... -
读代码-Vector
2011-10-28 11:26 0package org.apache.mahout.mat ... -
读代码-KMeansDriver
2011-10-31 11:14 1525package org.apache.mahout.clust ... -
读代码-SequenceFilesFromDirectory
2011-10-27 20:53 1937package org.apache.mahout.text; ... -
读代码-InputMapper
2011-10-27 16:46 1059package org.apache.mahout.clust ...
相关推荐
以下是RC滤波、LC滤波、CRC滤波、CLC滤波、DLC滤波、LCL滤波的概述: RC滤波 原理:利用电阻(R)和电容(C)对不同频率信号的阻抗变化来实现滤波。低频信号下,电容充电和放电较慢,对信号形成阻碍;高频信号下,电容能够快速充放电,对信号的阻碍较小。 类型: 低通RC滤波器:允许低频信号通过,抑制高频信号。当信号频率升高时,电容器充放电速度加快,使得高频信号在电阻两端产生压降,从而降低输出信号的幅度。 高通RC滤波器:允许高频信号通过,抑制低频信号。在低频时,电容器相当于开路,电路的大部分信号都会被电阻所吸收;在高频时,电容器相当于短路,输入信号能较完整地传到输出端。 优点:电路简单,成本低廉,易于设计和实现。 缺点:滤波效果相对较弱,对高频噪声的抑制能力有限。 应用:常用于简单的信号处理、去噪、音频系统中的低通和高通滤波等。 LC滤波 原理:基于电感(L)和电容(C)元件对频率的响应差异。电感对高频信号呈现高阻抗(近似短路),对低频信号呈现低阻抗(近似开路);电容则相反,对低频信号呈现高阻抗(近似开路),对高频信号呈现低阻抗(近似短路)。 类型: 低通滤波器:允许低频信号通过
校园服务系统 免费JAVA毕业设计 2024成品源码+论文+录屏+启动教程 启动教程:https://www.bilibili.com/video/BV1jKDjYrEz1 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
**快速进阶:西门子PLC编程高手养成记** 这个标题涵盖了您提供的文字中的关键信息,包括“西门子PLC编程”、“高手养成”等元素,同时也保持了简洁明了的风格。,如何短时间内成为西门子PLC编程高手 看这里:码垛搬运模型 【功能块】码垛搬运功能块 【品牌】西门子 【PLC】1200 【编程软件】博图v16 【编程语言】scl 【特色】以设定的上限和下限为范围,生成随机数。 可以用作模拟量仿真,方便调试程序; 学习用SCL语言编程; 作为数据源演示给领导或客户看; 可无限复制使用。 【说明】:程序不要把时间用来造轮子,这里有的你拿走,保留精力用来创造优质的功能快让你在工作中事半功倍factory Io和博途软件进行联合仿真,码垛搬运层数可以自定义设置,最大层数3,有报警显示功能,位置监视,复位,停止功能。 程序通俗易懂,规范模块化,可以随意增加新功能。 物品有,Factory IO仿真模型+博途v16安装包+博途码垛程序+HMI程序+factory IO安装包2.50版本。 ,关键词
,电机控制器,IGBT结温估算(算法+模型)国际大厂机密算法,多年实际应用,准确度良好…… 能够同时对IGBT内部6个三极管和6个二极管温度进行估计,并输出其中最热的管子对应温度。 可用于温度保护,降额,提高产品性能。 simulink模型除仿真外亦可生成代码…… 提供直流、交流两个仿真模型 提供底层算法模型库(开源,带数据 ) 提供说明文档
"COMSOL模拟:双层多孔介质中油类物质地下渗透扩散现象的时空演变研究",comsol模拟油往地下渗透现象,考虑两层多孔介质,结果显示出油随着时间逐渐向下扩散。 ,comsol模拟;油渗透;两层多孔介质;时间扩散;结果展示,COMSOL模拟两层多孔介质中油渗透扩散现象。
4b076399e3f709dc8990bd0e12720254.part7
基于深度学习的钢轨病害检测算法研究.pdf
西门子Smart200PLC与多台台达变频器实现Modbus轮询通讯:读写参数、控制启停、设置频率及电流监控实用指南,西门子smart200plc与4台台达变频器modbus轮询通讯 VFD-EL小型矢量变频器 1,读写变频器的内部参数 2,控制变频器启停,读频率电流 3,设置变频器输出频率 4,有彩色接线图,和参数设置说明, 有详细注释,简单易懂,可以学习可用项目, ,西门子Smart200PLC; Modbus轮询通讯; 变频器控制; 读写参数; 输出频率设置; 彩色接线图; 参数设置说明; 简单易懂注释。,西门子PLC与台达变频器Modbus轮询通讯项目指南
EI复现:碳减排背景下综合能源服务商合作策略的纳什谈判理论与自适应交替方向乘子法求解,EI复现: 《考虑碳减排的综合能源服务商合作运行优化策略》 纯手工复现,主要通过纳什谈判理论进行博弈,并采用自适应交替方向乘子法进行分布式求解 ,核心关键词:EI复现; 碳减排; 综合能源服务商; 合作运行优化策略; 纳什谈判理论; 博弈; 自适应交替方向乘子法; 分布式求解,EI复现:纳什谈判理论下的碳减排能源服务商合作运行优化策略
"扬子YD9850A耐压仪的LabVIEW通讯源码解析与应用",扬子YD9850A耐压仪labVIEW通讯源码 ,扬子YD9850A; 耐压仪; labVIEW通讯; 源码,扬子YD9850A耐压仪LabVIEW通讯源码
全覆盖与随机碰撞路径规划——AGV避障技术在扫地机器人移动仿真中的应用与对比,AGV全覆盖移动避障路径规划 扫地机器人路径规划 第一类算法 全覆盖智能算法 %% 基于深度优先搜索算法的路径规划—扫地机器人移动仿真 % 返回深度优先搜索实现全覆盖的运行次数 % 将栅格模型的每一个栅格看成一个点 % 实际中栅格模型是连续的,在计算机处理时看作离散的 % 将栅格模型抽象为标识矩阵,矩阵对应位置的标记表示栅格对应位置的状态 第二对比算法 %% 随机碰撞的路径规划—扫地机器人移动仿真 % 返回深度优先搜索实现全覆盖的运行次数 % 将栅格模型的每一个栅格看成一个点 % 实际中栅格模型是连续的,在计算机处理时看作离散的 % 将栅格模型抽象为标识矩阵,矩阵对应位置的标记表示栅格对应位置的状态 ,核心关键词: AGV全覆盖移动避障; 扫地机器人路径规划; 全覆盖智能算法; 深度优先搜索算法; 栅格模型; 标识矩阵。,基于全覆盖智能算法的AGV避障路径规划
"基于Matlab仿真的15kW三相离网逆变器在不对称负载下的正负序控制策略研究及其实验验证",15kW三相离网逆变器在不对称负载下的正负序控制matlab仿真 【1】卖家的研究方向,可提供简单,提供参考文献。 【2】不对称控制包括: 正序分量处理+负序分量处理+正序控制环+负序控制环; 【3】正序控制路与负序控制路都采用dq轴上的电容电压外环+电感电流内环控制; 【4】直流电压Vdc=700V,总功率15kW,LC滤波,阻性负载; 【5】轻重负载切+不对称负载投切均可稳定运行,具体波形如图所示; ,1. 15kW三相离网逆变器; 2. 不对称负载下的正负序控制; 3. MATLAB仿真; 4. 正负序分量处理; 5. 环路控制; 6. dq轴控制; 7. LC滤波; 8. 阻性负载; 9. 轻重负载切换; 10. 不对称负载投切稳定运行。,15kW三相离网逆变器的不对称负载控制Matlab仿真研究
电影数据分析及可视化系统 免费Python毕业设计 2024成品源码+论文+录屏+启动教程 启动教程:https://www.bilibili.com/video/BV1jKDjYrEz1 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
"COMSOL光学模型解析:点光源与平面波穿越透镜的动态演变过程",COMSOL光学模型演示:点光源和平面波穿过透镜动态过程 ,COMSOL光学模型;点光源;平面波;透镜;动态过程,COMSOL透镜中光波动态传播模型演示
"基于CEEMD-GWO-SVM算法的时间序列预测:风电、光伏、负荷预测通用解决方案",基于CEEMD+GWO+SVM的时间序列预测,风电,光伏,负荷预测,替数据就可以使用。 ,CEEMD; GWO; SVM; 时间序列预测; 风电; 光伏; 负荷预测; 替换数据,基于CEEMD-GWO-SVM算法的能源时间序列预测模型
基于85三菱组态王PLC的药片装瓶自动控制系统的设计与实现,85三菱组态王基于PLC的药片装瓶自动控制系统 ,基于该内容,核心关键词可以是:85三菱组态王;PLC;药片装瓶;自动控制系统。这些关键词用分号分隔的结果为:85三菱组态王; PLC; 药片装瓶; 自动控制系统。,基于PLC的85三菱组态王药片装瓶自动控制系统
《CARSIM与Simulink联合仿真:实现变道及复杂路径规划的MPC轨迹跟踪算法》,carsim+simulink联合仿真实现变道 包含路径规划算法+mpc轨迹跟踪算法 可选simulink版本和c++版本算法(价格一样,如需要2个版本多加30元) 可以适用于弯道道路,弯道车道保持,弯道变道 carsim内规划轨迹可视化 Carsim2020.0 Matlab2017b (可安装包) ,汽车仿真联合;变道与轨迹规划;MPC轨迹跟踪算法;路径规划算法;Carsim2020.0版使用。,"Carsim与Simulink联合仿真:变道与轨迹跟踪算法实现"
在tf.Keras中使用Scikit-Learn优化模型
基于EEMD-PCA-LSTM的优化模型:特征处理与预测效果提升的新方法,EEMD-PCA-LSTM(集合经验模态分解-主成分分析-长短期记忆网络) 将输入特征进行EEMD分解后,通过KPCA判定分解分解累计贡献率,将大于98%的作为新的输入特征同预测序列导入到LSTM进行预测。 与LSTM、EEMD-LSTM进行对比,预测效果获得提升。 该模型可提升度高。 ,EEMD; PCA; LSTM; 特征处理; 预测效果提升; 模型可提升度高,EEMD-PCA-LSTM混合模型:预测效果提升显著的可提升模型
shopping_basket.xlsx