`

MongoDB Hadoop Connector 1.0 正式版发布

 
阅读更多

原文 http://www.iteye.com/news/24811

 

10gen(MongoDB数据库开发商)今天发布了MongoDB Hadoop Connector 1.0 正式版本。

MongoDB Hadoop Connector的核心功能是允许读取MongoDB数据到Hadoop MapReduce工作中,以及将MapReduce工作的结果写回到MongoDB。用户可以针对每个实例来选择结合使用或单独使用MongoDB的读、写操作。该连接器的目标是根据用户的反馈和需求,继续完善对Hadoop生态系统中组件的支持。


10gen称,1.0版是一个长期支持版本,将提供超过1年的维护,并致力于为用户带来MongoDB部署和Hadoop集群之间的坚实的整合层。该连接器支持Hadoop 0.20.x及之后发布的主要Hadoop版本。

该版本还提供了如下功能:

  • 从Apache Pig(大数据集分析平台)写入到MongoDB
  • 从Flume分布式日志系统写入到MongoDB
  • 在MapReduce中使用Python,并通过Hadoop Streaming读取和写入MongoDB数据
详细信息参阅:10gen博客

源码地址:https://github.com/mongodb/mongo-hadoop
分享到:
评论

相关推荐

    mongo-hadoop-core-1.2.1-SNAPSHOT-hadoop_1.0

    The MongoDB Connector for Hadoop is a library which allows MongoDB (or backup files in its data format, BSON) to be used as an input source, or output destination, for Hadoop MapReduce tasks....

    文件系统、Mongodb、Hadoop_存取方案分析

    【文件系统、MongoDB、Hadoop 存取方案分析】 在大数据时代,高效的数据存取方案至关重要。本文将深入探讨三种常见的数据存取方案:文件系统、MongoDB 和 Hadoop,以及它们各自的特点和适用场景。 一、文件系统 ...

    mongoSpark:MongoSpark是一个基于Maven的Java项目,它显示了使用Mongodb Hadoop Connector将Spark与MongoDb集成。 最初,它不包含任何大数据分析,但在不久的将来将包含

    MongoSpark是一个基于Maven的Java项目,它显示了使用Mongodb Hadoop Connector将Spark与MongoDb集成。 最初,它不包含任何bigData分析,但将在不久的将来包含。 最初,该项目仅将一个馆藏的所有文档复制到另一个...

    mongoDB_课程讲义_1.0

    MongoDB 是一款流行的开源、分布式、面向文档的 NoSQL 数据库系统,因其强大的查询语言、灵活性和高性能而在现代Web开发中被广泛采用。本课程讲义将带你深入了解 MongoDB 的核心概念、安装启动流程以及基本的增删改...

    Spring-data-mongodb 1.0 API 英文版

    Spring-data-mongodb的文档太少了,基本都是网页版,我把网页做成了chm方便开发人员查看,文档是英文原版,是从官网抓下来的

    Flink CDC MongoDB Connector 的实现原理和使用实践.pdf

    MongoDB CDC Connector 实现原理和使用实践 Flink CDC MongoDB Connector 是一种实时数据同步解决方案,旨在解决 MongoDB 数据变更捕获和实时数据同步问题。本文将详细介绍 MongoDB CDC Connector 的实现原理和使用...

    Centos下安装mongodb v1.0

    如何在centos 7.2上面安装mongodb数据库 单机版安装 已经亲自测试安装成功。

    MongoDB北京2014 - MongoDB和Hadoop 完美大数据方案 - 周思远

    MongoDB Connector 作为一个桥梁,连接了 MongoDB 和 Hadoop,使得两者之间的数据交换更加便捷。 - **数据同步**:实现实时数据同步,确保 Hadoop 能够及时获取最新的 MongoDB 数据。 - **数据转换**:支持数据格式...

    MongoDB与Hadoop MapReduce的海量非结构化数据处理方案.pdf

    该方案通过MongoDB Cluster、MongoDB-Connector for Hadoop和MapReduce Cluster的整合,实现了对非结构化数据的高效处理。 首先,MongoDB Cluster承担对非结构化数据的分片存储工作,而MapReduce Cluster负责并行...

    Bset507同学录程序 v1.0 正式版

    【标题】"Bset507同学录程序 v1.0 正式版"是一个针对学生群体设计的应用程序,主要用于管理班级或集体内的个人信息,帮助成员保持联系并记录珍贵的回忆。这个正式版本可能经过了多轮测试和优化,旨在提供稳定、安全...

    基于Hadoop与MongoDB整合技术的大数据处理分析.pdf

    Hadoop与MongoDB的整合主要通过中间件Hadoop Connector来实现,它允许Hadoop MapReduce作业可以直接访问MongoDB中的数据。这种方式可以让Hadoop引擎处理数据,然后将结果存储回MongoDB,或者将MongoDB中的数据读取到...

    mongo-hadoop:适用于HadoopMongoDB连接器

    MongoDB Hadoop连接器 目的 用于HadoopMongoDB连接器是一个库,该库允许将MongoDB(或数据格式为BSON的备份文件)用作Hadoop MapReduce任务的输入源或输出目标。 它旨在提供更大的灵活性和性能,并使MongoDB中的数据...

    MongoDB 1.0

    MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 编辑本段特点  它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有: *面向集合...

    php_mongo:长期维护的mongodb封装类1.0

    版本1.0的发布,标志着该库已经经过充分测试和优化,为开发者提供了可靠的稳定性和性能保障。这个库不仅包含了对MongoDB基本操作的支持,还引入了一些高级特性,使得数据管理更加灵活。 首先,php_mongo支持连接和...

    Book of MongoDB and Hadoop

    《MongoDB和Hadoop》这本书主要探讨了两个大数据领域的关键组件——MongoDB和Hadoop,它们在现代数据处理和分析中扮演着重要角色。MongoDB是一款流行的开源文档型数据库,而Hadoop则是一个用于大规模数据处理的开源...

    [文档]Mongodb&Hadoop技术交流.pptx

    【MongoDB&Hadoop技术交流】 本篇技术交流主要探讨了MongoDB和Hadoop两种在大数据处理领域中广泛应用的技术。MongoDB是一种NoSQL数据库,而Hadoop是分布式计算框架,两者在处理大规模数据方面有着各自的优势。 **...

    geoserver发布mongodb矢量数据地图服务.docx

    Geoserver发布MongoDB矢量数据地图服务 Geoserver是一款功能强大且开源的地理信息系统(GIS)服务器,能够实现空间数据的存储、处理和发布。MongoDB是一款NoSQL数据库,能够存储大量的矢量数据。本文将介绍如何使用...

    mongodb c#驱动最新驱动mongodb.driver.dll 版本2.12.0-beta1

    MongoDB 是一个流行的开源、基于分布式文件存储的数据库系统,主要设计用于处理大量数据的分布式环境。C# 驱动是 MongoDB 提供的一种客户端库,允许 .NET 开发者与 MongoDB 数据库进行交互。标题提到的是 MongoDB 的...

    MongoDB权威指南 + Hadoop权威指南

    MongoDB和Hadoop是当前大数据处理领域中的两个关键工具,它们各自在数据存储与处理方面发挥着重要作用。这里,我们分别深入探讨这两个技术的核心概念、功能以及如何在实际应用中利用它们。 首先,MongoDB是一种...

Global site tag (gtag.js) - Google Analytics