We are pleased to introduce a new open source proejct today. It's another machine learning library using hadoop besides the mahout of ASF(Apache Software Foundation). The name of this project is redpoll, which means any of several small finches of northern North America and Eruasia, having a red crwon and black chin. We hope our project will grow agilely like these kinds of birds and we intent to parallelize some traditional classification, clustering algorithms like Navie Bayes, K-Means, EM using apache's hadoop and compare the speed up on data sets of various size. It's Apache 2.0 licensed.
About us
We are two guys in school whose interests are parallel computing. Since last year, we began to pay attentions to hadoop, which exerts quite an attraction to us. And we have been looking for opportunities to work on this implementation of MapReduce for a long time and meanwhile implemented some traditional machine learning algorithms in c/java. Last year we accidentally found the article
Map-Reduce for Machine Learning on Multicore by University of Stanford, which perfectly matches our interests. Later we learnt that the ASF has begun to implement a machine learning library called mahout, which is according to the thoery of that article, and planned to invite students to participate the google summer project 2008 to finish this job.
But our english are quite poor that we may not obtain any chance, so we decided to launch this new project to let our dreams come true.
for more informations please check out http://code.google.com/p/redpoll
分享到:
相关推荐
它可以用于聚类、分类、主题建模等任务,对于对文本数据感兴趣的研究者和开发者来说,Redpoll提供了一种高效的数据处理方式。通过使用PageRank、LSI等算法,Redpoll能够从大量文本数据中提取有价值的信息,帮助用户...
MapReduce研究 调试、监控等 优化、扩展等 常用API Hadoop改造 数据挖掘项目Redpoll Canopy, k-means Naive bayes, SVM
系统选用B/S模式,后端应用springboot框架,前端应用vue框架, MySQL为后台数据库。 本系统基于java设计的各项功能,数据库服务器端采用了Mysql作为后台数据库,使Web与数据库紧密联系起来。 在设计过程中,充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面简洁等特点。
useTable(1).ts
内容概要:本文介绍了Matlab实现基于DBN-SVM(深度置信网络和支持向量机)的数据分类预测方法及其应用。首先,背景部分阐述了当前信息技术环境下,深度学习在多个领域的重要性及DBN和SVM各自的优势。文中详细描述了项目的目标与意义,包括实现DBN与SVM的联合优化、提升分类性能、扩展DBN应用领域及增强数据预处理与特征选择的能力。接着指出了项目面临的几大挑战,比如DBN的训练难度、高维数据处理、SVM参数选择等问题。项目的特点与创新在于充分利用了两种技术的优点,在自动化特征提取和精确分类等方面表现出色。最后探讨了该项目在金融、医疗、智能制造、自然语言处理及物联网等多个领域的具体应用案例,并给出了相关模型架构和技术实现细节。 适用人群:具备机器学习基础知识的研发人员,特别是对DBN和SVM有一定了解的研究人员和技术爱好者。 使用场景及目标:旨在解决数据分类预测任务,特别是在面对高维数据或小样本情况时需要提升分类准确性的问题;同时也适用于希望减少手动特征工程工作量的专业人士。目标是在复杂的数据集中提供更加可靠的预测解决方案,以应对诸如金融风险评估、医疗影像诊断、工业设备维护等领域内的具体业务挑战。 其他说明:提供的Matlab代码示例包括DBN-SVM模型的基本配置及训练过程,便于使用者根据实际情况调整参数设置。此外还包括了一些关于如何评估模型效果的方法,如通过可视化工具监测训练过程中损失值和准确度的变化趋势。
基于Carsim与Simulink联合仿真的汽车ESP系统单侧双轮制动控制模型与说明,汽车ESP系统仿真建模及控制方法研究:基于carsim与simulink联合仿真的单侧双轮制动,汽车ESP系统仿真建模,基于carsim与simulink联合仿真做的联合仿真,采用单侧双轮制动的控制方法。 有完整的模型和说明 ,汽车ESP系统仿真建模; 基于carsim与simulink联合仿真; 单侧双轮制动控制方法; 完整模型与说明。,基于CarSim与Simulink联合仿真的汽车ESP系统单侧双轮制动建模研究
爱分析2024智慧灯塔照亮企业AIAgent实施的明路应用实践报告35页.pdf
系统选用B/S模式,后端应用springboot框架,前端应用vue框架, MySQL为后台数据库。 本系统基于java设计的各项功能,数据库服务器端采用了Mysql作为后台数据库,使Web与数据库紧密联系起来。 在设计过程中,充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面简洁等特点。
更多毕业设计https://cv2022.blog.csdn.net/article/details/124463185
单LEO多天线单天线多用户.docx
“1990-2019年城市的绿色专利申请量和授权量”数据集覆盖中国地级市及以上城市在绿色技术创新领域的专利活动。该数据整合了国家知识产权局及WIPO标准筛选的绿色专利信息,包含发明专利、实用新型专利等类型,重点涵盖能源节约、污染控制、可再生能源等绿色技术领域。 数据显示,中国绿色专利授权量在近30年间呈现显著增长趋势。以2016-2021年为例,中国绿色低碳专利授权量年均增长6.5%,其中氢能、储能等领域增速尤为突出(如氢能领域年均增长20.5%),且北京、江苏、广东等省市领跑全国,合计占全国总量的30.1%。城市层面,绿色专利布局与区域产业政策密切相关,例如长三角、珠三角地区因新能源产业集聚,相关专利密度较高。 该数据为研究绿色技术创新的时空分布特征、政策驱动效应及国际竞争力提供了基础支撑,尤其适用于分析“双碳”目标下地方绿色技术转型的路径与成效。
UDEC7.0煤层建模开挖全代码实例详解:逐段逐句剖析与高效学习模板,UDEC7.0煤层建模全代码实例及详解:事半功倍的开采位移应力裂隙发育研究学习模板,UDEC7.0煤层建模开挖全代码实例+逐段逐句讲解。 非常好的学习模板,让你事半功倍,迅速的分析研究煤层开采位移 应力 裂隙的发育规律。 部分讲解见第3张图。 ,UDEC7.0煤层建模; 开挖全代码实例; 逐段逐句讲解; 学习模板; 煤层开采位移; 应力裂隙发育规律,UDEC7.0煤层建模全代码实例与详解
chromedriver-mac-x64-136.0.7055.0.zip
深度解析:利用动力学仿真数据绘制的滚动轴承分布图制作技术——百分之百博主亲笔编程代码详解,根据滚动轴承动力学仿真数据精准出图:博主原创设计程序,详尽注释助你轻松获取多维分布曲线变换图,根据已知的滚动轴承动力学仿真数据 出图。 程序百分百为博主亲自设计的,代码注释很详细,根据你的仿真数据使用我的程序就可以得到这样的效果。 可以出承载区与非承载区的1载荷分布、2摩擦力分布、3打滑率分布等各种时域变角度域分布曲线变图。 ,1. 滚动轴承动力学仿真数据; 2. 程序; 3. 载荷分布; 4. 摩擦力分布; 5. 打滑率分布; 6. 时域变角度域分布图。,基于滚动轴承仿真数据的图形化分析与处理程序
本数据集主要整合了 Middlebury2014 以及自建的 RGB 训练集,用于深度图像超分辨率及相关视觉任务研究。其中,Middlebury2014 数据集体量较大,包含高质量的立体对、深度图及配套标注信息,适合进行深度估计、立体匹配与超分辨率等多种实验;RGB TRAIN 则为针对深度超分所准备的配套 RGB 数据,可与深度图进行联合训练或引导。整体数据规模在数 GB 级别,覆盖多样场景和视角,能够支持深度学习模型在深度重建、融合超分和立体匹配等方向的深入研究与评测。
《绝热压缩空气储能系统:基于EBSILON 13.02的文献研究与分析》,《绝热压缩空气储能系统:基于EBSILON 13.02的文献研究与分析》,绝热压缩空气储能系统 带文献 ebsilon13.02 ,绝热压缩空气储能系统; 带文献; EBSILON 13.02;,绝热压缩空气储能系统:基于文献的Ebsilon13.02研究
昆仑通泰MCGS 7.7嵌入版仿真程序:六层电梯的优先级控制与管理系统,昆仑通泰MCGS 7.7嵌入版仿真程序:六层电梯控制,带优先级设置功能,6六层电梯昆仑通泰mcgs7.7嵌入版仿真程序带优先级 ,六层; 电梯; 昆仑通泰; mcgs7.7; 嵌入版; 仿真程序; 优先级,昆仑通泰MCGS 7.7六层电梯仿真程序带优先级
LabVIEW与TensorFlow深度学习:高效调用的实践教程,LabVIEW深度学习实践:基于TensorFlow框架的调用与应用教程,labview调用TensorFlow深度学习教程 ,LabView; TensorFlow; 深度学习; 调用教程,LabView深度集成TensorFlow教程
信捷PLC电子凸轮追剪飞剪样例程序:适用于枕式包装机的运动控制与技术解析。,信捷PLC电子追剪凸轮样例程序:基于XDH-60T4系列PLC的枕式包装机飞剪与电子凸轮控制策略详解,信捷PLC电子追剪凸轮样例程序 信捷XDH-60T4系列plc 基于枕式包装机开发的追剪,飞剪程序 飞剪滚切,PLC,运动控制,电子凸轮 信捷 电子凸轮追剪飞剪资料 多产品配方程序 A1517信捷PLC电子追剪凸轮样例程序 ,信捷PLC; 电子追剪凸轮样例程序; XDH-60T4系列PLC; 追剪飞剪程序; 运动控制; 飞剪滚切; 电子凸轮; 多产品配方程序; A1517信捷资料。,信捷PLC:多产品配方电子追剪凸轮与飞剪程序样例(XDH-60T4系列)
更多毕业设计https://cv2022.blog.csdn.net/article/details/124463185