阅读更多

4顶
0踩

开源软件

原创新闻 bboss 大数据抽取工具 v4.0.9 发布

2015-09-09 14:58 by 正式记者 yin_bp 评论(0) 有6514人浏览

bboss 大数据抽取工具 4.0.9 发布

相较上一版本(v4.0.8),v4.0.9增加了以下特性:

  • 按照按日期字段切分任务,抽取db数据到hdfs,可以在第一次切分任务的基础上,将日期范围任务块进一步切分为更小的任务块

  • 在数据库表分区的基础上,可以按照分区字段类型将分区切分为日期范围任务块或者数字范围任务块,同时可以将已经切分的任务快进行二次切分

  • 增加为作业处理节点中的作业添加指定数目的工作线程功能。当节点中作业工作线程全忙情况下,还有排队等待处理的作业任务时,可以通过增加工作线程数来处理这些正在排队等待处理的作业任务,从而加快数据抽取进度

    修复了一系列bug。

bboss大数据抽取工具功能特点如下:

  • 实 现db到hadoop hdfs数据导入功能,提供高效的分布式并行处理能力,可以采用数据库表分区、按字段分区、表分区+分区字段二次分区三种方式并行 抽取db数据到hdfs文件系统中;能有效解决按字段分区抽取数据时,各分区数据不均匀导致作业任务处理节点负载不均衡的问题,分区字段可以是数字类型和 日期类型(采用日期类型时,每个任务块的数据分布更加均匀)。

  • 灵活的作业任务处理模式:可以增量方式执行作业任务,作业可以停止后重新执行,重新执行时只需执行未完成的作业任务,也可以全部重新执行所有作业任务;当停止作业后,可以在原有作业切分的基础进一步切分出子任务,然后再重新执行作业,提升系统处理数据效率。

  • 作业处理服务器为每个作业分配独立的作业任务处理工作线程和任务执行队列,作业之间互不干扰

  • 作业执行过程中,可以为作业添加工作线程,从而加快数据抽取进度。

  • 采用异步事件驱动模式来管理和分发作业指令、采集作业状态数据。

  • 通过管理监控端,可以实时监控作业在各个数据处理节点作业任务的实时运行状态,记录并查看作业的历史执行状态,方便地实现提交新的作业、重新执行作业、停止正在执行的作业、清除作业执行监控数据、同步作业任务执行状态等操作

工具架构拓扑图: 

 

工具采用的技术体系:

  • Bboss ioc轻量级ioc容器,ioc扩展属性配置语法

  • Bboss持久层:高效数据查询行处理器,灵活动态数据源管理(连接池数据源/非连接池数据源),表分区信息查询等,动态创建作业配置表和作业监控记录表

  • Bboss分布式事件框架:基于JGroups,提供异步分布式事件驱动模型,动态管理作业节点(服务节点和数据处理节点),包括作业节点的动态加入、动态离开等;在管理节点、数据处理节点之间分发和接收各种作业处理指令事件

  • Bboss mvc实现监控管理应用模块,在监控服务节点中,通过mvc 容器启动监听器启动作业管理节点

  • Bboss序列化组件:用来将作业监控数据序列化存储到sqllite中的作业监控表,同时在查看作业执行历史时将序列化存储的作业监控数据还原为对象状态的监控对象,便于界面展示

  • Bboss 标签库,jquery等:实现监控管理应用的视图层

  • Hadoop Hdfs客户端:用来连接hadoop hdfs文件系统

  • Sqllite在监控节点中保存作业配置,保存作业执行状态数据

  • Jetty运行监控管理应用模块的web应用容器

  • Bboss应用执行容器:用来启动作业管理监控应用、作业数据处理应用、启动jetty容器

bboss大数据抽取工具源码github托管地址:

https://github.com/bbossgroups/bigdatas

版本源码和发布包下载地址:

https://github.com/bbossgroups/bigdatas/releases

操作使用文档:大数据抽取工具管理操作手册.docx

4
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 立人软件大补帖 000007

    包含dos、win31时代各种老软件。此处用作备份。

  • 自然码软件发明人周志农致贺洪涛软件成立

    自然码软件发明人周志农: 昔日老友,雄心依旧,十年拼搏,再创洪涛。

  • 周志农对中关村的思考

    本文写于1999年。中关村给中国软件业带来了什么?中关村的起源我同意很多人的中关村不仅仅是中关村的看法。中关村实际上是中国新技术产业的一个窗口。新技术不都是高科技,但是新技术是高科技的...

  • 程序五杰

         ----影响中关村的50个人《知识英雄》(Wednesday, December 26, 2001 4:01 PM) 刘韧     吴晓军、鲍岳桥、周志农、刘旭、朱崇君作为中国第一代成名的程序员,他们个人奋斗的酸甜苦辣同中国软件地起落同步。国内接触过计算机的人都使用过或仍然使用着他们用智慧和心血凝结而成的程序。也许他们中的有些人会随着时间的流逝而失去昔日的光彩

  • 程序五杰(吴晓军,鲍岳桥,周志农,刘旭,朱崇君)

    吴晓军、鲍岳桥、周志农、刘旭、朱崇君作为中国第一代成名的程序员,他们个人奋斗的酸甜苦辣同中国软件地起落同步。国内接触过计算机的人都使用过或仍然使用着他们用智慧和心血凝结而成的程序。也许他们中的有些人会随着时间的流逝而失去昔日的光彩 。有些会在新一轮的角逐中再次成为赢家,无论如何,在他们身上会有许多值得玩味的东西,这可能是中国软件的一笔特殊财富。 吴晓军痴心不改2.13 吴晓军

  • bboss hadoop hdfs大数据抽取工具

    bboss大数据抽取工具功能特点如下: [list] [*]实现db到hadoop hdfs数据导入功能,提供高效的分布式并行处理能力,可以采用数据库分区、按字段分区、分页方式并行批处理抽取db数据到hdfs文件系统中;能有效解决...

  • J2EE企业级开源框架bboss v5.0

    bboss是一个j2ee开源框架,为企业级应用开发提供一站...bboss功能涵盖ioc,mvc,jsp自定义标签库,持久层,全局事务托管,安全认证,SSO,web会话共享,cxfwebservice服务发布和管理,hessian服务发布和管理等功能。另

  • J2EE企业级开源框架bboss v5.0.8

    bboss是一个j2ee开源框架,为企业级应用开发提供一站式解决方案,并能有效地支撑移动应用开发。bboss功能涵盖ioc,mvc,jsp自定义标签库,持久层,全局事务托管,安全认证,SSO,web会

  • J2EE企业级开源框架bboss v5.0.3.6

    bboss是一个j2ee开源框架,为企业级应用开发提供一站式解决方案,并能有效地支撑移动应用开发。bboss功能涵盖ioc,mvc,jsp自定义标签库,持久层,全局事务托管,安全认证,SSO,web会

  • J2EE企业级开源框架bboss v5.0.2.9

    bboss是一个j2ee开源框架,为企业级应用开发提供一站式解决方案,并能有效地支撑移动应用开发。bboss功能涵盖ioc,mvc,jsp自定义标签库,持久层,全局事务托管,安全认证,SSO,web会

  • 雷军的留名,不是以程序员身份

    (点击上方蓝字,快速关注我们)转自:刘韧(LiuRenNews),作者:刘韧本文首发于1997年《中国计算机报》雷军,1969 年 2 月 16 日出生于湖北省仙桃市;1...

  • J2EE企业级开源框架bboss v5.0.6.8

    bboss是一个j2ee开源框架,为企业级应用开发提供一站式解决方案,并能有效地支撑移动应用开发。bboss功能涵盖ioc,mvc,jsp自定义标签库,持久层,全局事务托管,安全认证,SSO,web会

  • bboss-elastic-tran:bboss 数据同步工具

    弹性Tran老板数据交换模块使用文档: : Bboss是一个很好的Elasticsearch Java Rest客户端。 它运行并访问像mybatis这样的elasticsearch来关联数据库。环境要求JDK要求:JDK 1.7+ Elasticsearch版本要求:1.X,2.X,5...

  • bboss v5.5.3 发布,Elasticsearch Rest Client

    The best Elasticsearch HighlevelRest Client API-----bbossv5.5.3 发布。 主要功能特色 E...

  • Elasticsearch Rest Client bboss v5.5.6 发布

    The best Elasticsearch HighlevelRest Client API-----bbossv5.5.6 发布。 主要功能特色 E...

  • Elasticsearch Rest Client bboss v5.6.6 发布

    The best Elasticsearch HighlevelRest Client API-----bbossv5.6.6 发布。 bboss elasticsear...

Global site tag (gtag.js) - Google Analytics