Jubatus
http://jubat.us/en/overview.html 是一个面向大数据数据流的分布式在线机器学习的开源框架,和storm有些类似,但是从介绍上来看,它提供了更多的功能。
Jubatus认为未来的数据分析平台应该同时向三个方向展开:处理更大的数据,深层次的分析和实时处理;而当前还没有一种能够处理不断生成的流式大数据的水平可扩展的分布式架构。Hadoop的mapreduce能够处理大数据,但不能做复杂的机器学习算法;Apache Mahout是基于Hadoop的机器学习平台,但不适用于在线处理数据流。
Jubatus将在线机器学习,分布式计算和随机算法等的优势结合在一起用于机器学习,并支持分类,回归,推荐等基本元素。根据其设计目的,Jubatus有如下的特点:
- 可扩展:支持可扩展的机器学习处理。在普通硬件集群上处理数据速度高达100000条/秒
- 实时计算:实时分析数据和更新模型
- 深层次的数据分析:支持各种分析计算:分类,回归,统计,推荐等
Jubatus还是一个很年轻的项目,当前最新的发布版本是0.3.2(c++), 但暂时还没有看到有商业使用的例子;如果有基于流数据的机器学习方面的需求,还是关注一下的。
分享到:
相关推荐
Jubatus 是一个分布式处理框架和机器学习库,包含以下功能:在线机器学习库,包括:分类、聚合和推荐fv_converter: 数据预处理(用自然语言)在线机器学习框架,支持容错 标签:Jubatus
Storm-jubatus 支持的算法 求解器类型 Jubatus算法客户端 用例 回归 回归客户端 对于回归问题 推荐人 推荐客户端 推荐 如何使用 public class JubatusTrainTopology { public static void main ( String [] args )...
eval "$(~/.jubaenv/bootstrap)"用法列出所有可用的 Jubatus 版本: $ jubaenv install -l安装 Jubatus: $ jubaenv install 0.6.3列出安装的 Jubatus 版本: $ jubaenv shell0.5.4 0.6.3为当前 shell 切换 Jubatu
jubatus-node-client 适用于Node.js的Jubatus客户端(非官方) 用法 另请参阅 分类器 const jubatus = require ( "jubatus" ) ; const classifier = new jubatus . classifier . client . Classifier ( 9199 , ...
朱巴图斯经理和提出的新流程管理工具的原型实现...要求朱巴图斯 0.6.0+ Jubatus Python 客户端 0.6.0+用法 $ jubavisor -z localhost:2181$ jubamgr start server server01$ jubamgr stop server server01执照LGPL 2.1
资源来自pypi官网。 资源全名:embedded_jubatus-1.1.0.tar.gz
请参阅 此 frsyuki/mpio 存储... 但是多亏了一个名为的开源项目,mpio 库被维护为jubatus-mpio 。 我建议改为检查存储库: 如果您正在寻找 RPC (msgpack-rpc-cpp),这里是jubatus-msgpack-rpc/cpp : 谢谢,古桥贞行