`

大数据时代,野心勃勃的MongDB为你处理海量数据!

阅读更多

MongoDB是一个基于分布式文件存储的数据库,由C++语言编写,旨在为WEB应用提供可扩展的高性能数据存储解决方案。其名字来自humongous这个单词的中间部分,从名字可见其野心所在就是海量数据的处理。

一、MongoDB简介

  2011年将被记住,因为这一年SQL将死;这一年,关系数据库从一线退下;这一年开发人员发现他们没必要为了持久化数据,而将每个对象转化为表格结构。

  2011年是文档数据库的一年,尽管一直在稳步发展势头,通过过去八年多的发展,现在有各种稳定的文档数据库——从基于亚马逊和谷歌的云,到各种开放源码工具,尤其是MongoDB。

  那么,MongoDB是什么?这里的五件事是每个开发人员应该知道的:

    • MongoDB是一个独立的服务器;

    • 它是基于文档的,而不是基于表格的;

    • 它是非结构化的;

    • 不必去学习另一种查询语言;

    • 它具有强大的主流开发语言支持,如 C#、C++、Java、PHP、Perl、Python、Ruby。

  1、MongoDB 是一个独立的服务器

  如MySQL或PostgreSQL一样,MongoDB提供侦听端口以便接入。它提供了用于查询,创建,更新和删除的工具。从理论上讲,你使用它的工作方式与你使用MySQL或PostgreSQL的工作方式相同:连接,执行任务,并关闭连接。

  2、MongoDB是非结构化的

  MongoDB 没有结构化语言。如果你想创建一个新的文档类型,你不用做任何事来告诉数据库关于这些数据的结构,而仅仅是存到数据库中即可。

  简单的说,MongoDB使用类似JavaScript或PHP的类型处理方式。也就是说,数据库是灵活的弱类型。

  虽然有一些数据是有限制条件的(大块的数据可能需要一些明确的处理),但在大多数情况下,你可以像写PHP代码一样编写你的MongoDB代码。

  3、不必去学习另一种查询语言

  还记得这些你写的数据库抽象层吗?还记得那些你处理过的ORM层吗?现在,你可以将它们全部丢弃。在MongoDB中你不需要他们。MongoDB没有很多查询语句。在大多数情况下,只需给它一个数组指定你想要的信息,然后它会给你返回文档的数组。如果你想运行一些非常复杂的查询(如Map-Reduce操作),可以向MongoDB传递JavaScript,其内部的JavaScript引擎可以解析这个脚本。

  4、MongoDB是神速的

  开发时间也短,因为没有结构需要管理和很少(如果有的话)的数据映射。

  学习曲线很平滑,因为没有新的查询语言学习。代码是简洁的。毕竟,无须任何其他ORM,封装可以非常简单。你的代码是未来的保证。向你的对象增加更多的字段是很轻松的。因此,需求变化了,你可以很快修改代码以便适应。

  MongoDB足以让我意识到它有改变游戏规则的潜力。这也是让大家主张使用新一代的文档数据库代替基于SQL的关系数据库的原因。将关系数据库留在尘土里,更可能的是让它们做它们能做好的事情:存储属于行和表的数据。

图灵关于MongoDB的图书:



一、《MongoDB实战》



如上文所述MongoDB是为处理大数据而生的一款面向文档的数据库,而且MongoDB由10gen公司开发和维护。《MongoDB实战》作者Kyle Banker曾在该公司负责MongoDB驱动程序的维护,对各方面技术细节都了如指掌,本书也是在大量第一手资料的基础上形成的,其权威性毋庸置疑。

作者介绍:Kyle Banker  软件工程师,曾工作于10gen公司,负责维护Ruby及C语言的官方MongoDB驱动、领导MongoDB文档项目并开发培训课程,且为客户提供咨询、商业支持和培训;现任职于Snapjoy(为用户提供默认私有的在线照片备份和自动管理服务)。个人网站http://kylebanker.com/blog。

译者介绍:丁雪丰  一线“攻城师”一枚,InfoQ中文站小编,满江红翻译组核心成员,常年混迹于各种社区,业余时间写作、翻译、汉化软件,《RESTful Web Services Cookbook中文版》、《Spring攻略》等多部书的译者。
内容简介:

本书基于MongoDB 2.0+,全面系统地讲解了设计、实现、安装和维护MongoDB的各方面内容。全书分三部分,第一部分从基于文档的数据与传统关系型数据库的差别讲起,介绍了MongoDB的基本概念及安装使用。第二部分是一个实战式教程,结合示例讲解了MongoDB的CRUD操作,以及实现系统安全、灵活和高效的设计原则及模式。第三部分侧重数据库的维护和管理,深入到MongoDB背后的技术细节,给出了对管理员和开发者都极有价值的建议。

本书篇幅适中,内容深浅得当,文字通俗易懂,再配以直观形象的插图和贴近实战的代码示例,非常适合MongoDB学习者、开发人员及管理员学习参考。

本书内容:

MongoDB介绍及其优劣势

MongoDB的Shell界面

使用MongoDB的简单应用

如何通过以文档为中心的方式看待数据

编写查询,以MapReduce方式聚合数据

更新和删除数据及相关性能考量

寻找和改进慢查询

MongoDB的复制与分片

MongoDB的监控、备份及恢复
二、《深入学习MongoDB》



内容简介:

本书分两部分,分别对应O’Reilly 公司出版的Scaling MongoDB 和50 Tips and Tricks forMongoDB Developers 两本书的内容。第一部分全面讲解了有关建立和使用集群的内容,不仅从应用开发人员的角度讲解了MongoDB 的使用,而且从运维方面介绍了集群的管理。其中内容包括通过分片设置MongoDB 集群,分片的工作原理,查询和更新数据,操作、监控和备份集群,错误处理。第二部分依次从应用设计、实现、优化、数据安全和管理方面介绍了使用MongoDB构建应用的技巧,内容包括范式化与反范式化的利弊权衡,复制组的故障恢复等。 本书适合所有MongoDB 用户阅读参考。

具体的主题有:

  通过分片设置MongoDB集群;
  在集群中查询和更新数据;
  操作、监控和备份集群;
  从程序设计角度,考虑如何应对分片、配置服务器或者mongos进程停止运行的情况。
遵照其中建议,你很快就可通过MongoDB构建和运行一个高效的、可预测的分布式系统。 对 于用户而言,MongoDB上手很容易,但是构建使用MongoDB的应用程序时,一些棘手的问题便会接踵而来。怎样权衡范式化与反范式化?怎样处理复制 组失效的情况并进行故障恢复?本书第二部分“MongoDB开发技巧50例”呈现了一系列的MongoDB提示和技巧,可帮助用户解决与应用程序设计与实 现、数据安全和监控有关的各种问题。

作者简介:
Kristina Chodorow  10gen公司的软件工程师,MongoDB项目的核心成员,从事与数据库服务器、PHP驱动、Perl驱动等相关的工作。她常在世界级技术大会上作报告,包括OSCON、LinuxCon、FOSDEM和Latinoware。
三、《MongoDB权威指南》



内容简介:

本书是一本广受好评的MongoDB方面的图书。与传统的关系型数据库不同,MongoDB是一种面向文档的数据库。书中介绍了面向文档的存储方式及利用MongoDB的无模式数据模型处理文档、集合和多个数据库,讲述了如何执行基本的写操作以及如何执行各种复杂的条件查询,还介绍了索引、聚合工具以及其他高级查询技术,另外对监控、安全性和身份验证、备份和修复、水平扩展MongoDB数据库等内容也有所涉及。 本书适合数据库开发人员阅读。

 

分享到:
评论

相关推荐

    大数据__mongoDB_R语言分析_RAnalysis.zip

    大数据__mongoDB_R语言分析_RAnalysis

    基于Hadoop与MongoDB整合技术的大数据处理分析.pdf

    Hadoop与MongoDB都是在大数据时代被广泛使用的技术,它们在处理和分析大规模数据方面拥有各自的优势。为了更好地处理日益增长的数据量,Hadoop与MongoDB之间的整合技术变得越来越重要。 Hadoop是一个由Apache基金会...

    大数据存储MongoDB实战指南

    资源名称:大数据存储MongoDB实战指南内容简介:MongoDB是一种面向文档的分布式数据库,可扩展,表结构自由,并且支持丰富的查询语句和数据类型。时至今日,MongoDB以其灵活的数据存储方式逐渐成为IT行业非常流行的...

    大数据存储MongoDB实战指南1

    - **大数据处理**:通过实际案例展示如何使用MongoDB处理海量数据,包括数据导入导出、数据清洗等操作。 - **实时数据分析**:探讨如何利用MongoDB进行实时数据处理,支持实时查询和数据分析的需求。 #### 八、总结...

    大数据时代经典入门教材

    在大数据时代,我们正经历着信息爆炸性的增长,这使得数据成为了新的石油,驱动着现代社会的发展。本套经典入门教材正是针对这一趋势,为初学者提供了深入理解和掌握大数据技术的宝贵资源。以下将对其中涉及的主要...

    MongoDB与Hadoop MapReduce的海量非结构化数据处理方案.pdf

    MongoDB与Hadoop MapReduce的海量非结构化数据处理方案 ...本文的MongoDB与Hadoop MapReduce的海量非结构化数据处理方案旨在解决大数据时代下的数据处理难题,为大数据处理提供了一种高效、可靠的解决方案。

    大数据时代背景下计算机信息处理技术分析.zip

    总结来说,大数据时代背景下的计算机信息处理技术不仅是对海量数据的存储和分析,更是对数据价值的深度挖掘和利用。随着技术的不断创新,这些技术将在各个领域发挥越来越重要的作用,驱动社会进步,改变人们的生活。

    MongoDB大数据处理权威指南

    ### MongoDB大数据处理权威指南 #### MongoDB简介 MongoDB是一种非关系型数据库系统,它使用JSON风格的数据存储方式(称为BSON格式),这使得数据存储更加灵活高效。MongoDB支持动态查询、索引、聚合等多种功能,...

    大数据时代关系数据库MySQL的创新与发展.docx

    数据时代的关系数据库MySQL的创新与发展 在大数据时代,关系型数据库技术仍然是信息领域的重要支柱,尤其是在软件学科中占据着核心地位。尽管面临大数据的挑战,MySQL作为一款流行的关系数据库管理系统,通过持续...

    大数据下MongoDB数据库档案文档存储去重研究.pdf

    MongoDB采用内存映射的方式作为存储引擎,能够显著提高I/O效率,特别适用于大规模数据的实时处理。此外,MongoDB还支持分布式系统,包括分片存储(Mongod)、客户端请求(Clients)、集群配置(Config Server)和路由协议...

    大数据存储 MongoDB实战指南-高清版-完整目录-2015年2月

    大数据存储 MongoDB实战指南-高清版-完整目录-2015年2月

    大数据时代计算机信息处理技术分析.zip

    3. **数据存储与管理**:NoSQL数据库适应了大数据的多样性需求,如MongoDB、Cassandra等,它们支持非结构化数据,能够处理PB级别的数据。同时,列式存储如HBase和Google Bigtable,更适合大数据分析场景,因为它们...

    mongodb-测试数据

    1. **基本 CRUD 操作**:这些数据可以帮助你练习插入(Insert)、查询(Find)、更新(Update)和删除(Delete)操作,理解如何在MongoDB中处理单个文档和批量文档。 2. **聚合框架**:可能包含各种聚合管道示例,...

    大数据时代网络信息处理技术探讨.zip

    在大数据时代,网络信息处理技术的重要性不言而喻。...综上所述,大数据时代网络信息处理技术是多维度、多层次的,涉及到数据的全生命周期管理。随着技术的不断进步,我们有望更好地挖掘数据价值,驱动社会创新和发展。

    大数据时代下计算机信息处理技术.zip

    在大数据时代,计算机信息处理技术已经发展成为各行各业的核心驱动力,极大地推动了科技进步和社会发展。这一主题涵盖了多个关键领域,包括数据采集、存储、分析、挖掘以及应用等。以下是关于这些领域的详细介绍: ...

    MongoDB大数据处理

    MongoDB大数据处理权威指南 MongoDB大数据处理权威指南 MongoDB大数据处理权威指南

    大数据时代计算机信息处理技术.zip

    在处理大数据时,传统的数据库管理系统往往力不从心,因此,分布式计算框架如Hadoop应运而生。Hadoop是基于Apache开源项目的,它提供了分布式文件系统(HDFS)和MapReduce编程模型,使得在廉价硬件上处理大规模数据...

    大数据技术基础大作业数据.zip

    大数据技术是21世纪信息化时代的基石之一,它涵盖了多种技术和工具,用于处理、分析和存储海量数据。在这个“大数据技术基础大作业数据.zip”压缩包中,我们可以预见到与大数据处理相关的各种学习材料和实例。这可能...

    大数据时代计算机信息处理技术探析.zip

    Amazon Web Services (AWS)、Microsoft Azure和Google Cloud Platform等云服务提供商提供了丰富的数据处理工具和服务,如Amazon EMR(用于Hadoop和Spark)、Azure Data Lake以及Google BigQuery等,使得企业无需投入...

    大数据时代下计算机信息处理技术分析.zip

    在大数据时代,计算机信息处理技术已经发展成为各行各业的核心驱动力,尤其在数据分析、决策支持、模式识别和预测性建模等方面发挥着至关重要的作用。本文将深入探讨大数据环境下的计算机信息处理技术,揭示其关键...

Global site tag (gtag.js) - Google Analytics