摘要:随着大数据的不断发展,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。现今的计算机体系结构在数据存储方面要有庞大的水平扩展性,而NoSQL也正是致力于改变这一现状。
目前Google的 BigTable和Amazon 的Dynamo使用的就是NoSQL型数据库,本文介绍了10种出色的NoSQL数据库。
虽然NoSQL流行语火起来才短短一年的时间,但是不可否认,现在已经开始了第二代运动。尽管早期的堆栈代码只能算是一种实验,然而现在的系统已经更加的成熟、稳定。不过现在也面临着一个严酷的事实:技术越来越成熟——以至于原来很好的NoSQL数据存储不得不进行重写,也有少数人认为这就是所谓的2.0版本。这里列出一些比较知名的工具,可以为大数据建立快速、可扩展的存储库。
1. Casssandra
Cassandra最初由Facebook开发,后来成了Apache开源项目,它是一个网络社交云计算方面理想的数据库。它集成了其他的流行工具如Solr,现在已经成为一个完全成熟的大型数据存储工具。Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。其主要功能比Dynomite(分布式的Key-Value存储系统)更丰富,但支持度却不如文档存储MongoDB。Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra的一个写操作,会被复制到其他节点上去,而对Cassandra的读操作,也会被路由到某个节点上面去读取。在最近的一次测试中,Netflix建立了一个288个节点的集群。
2. Lucene/Solr
Lucene是Apache软件基金会4 jakarta项目组的一个子项目,这是一个开放源代码的全文检索引擎工具包,就是说它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构。不过大多数人并不认同Lucene是一个数据库,因为大多数人只是用它来检索大量的文本块,不过它的确采用了与其他NoSQL数据存储相似的模型。如果说查询并不是仅仅局限于精确的匹配,而是寻找出那些出现在块中的字或者字段的话,毫无疑问,Lucene/Solr是最好的查询方式。
3. Riak
Riak是由技术公司basho开发的一个类似Dynamo的分布式Key-Value系统。其以分布式,水平扩展性,高容错性等特点著称。从事Riak工作最有趣的部分是可以使用JavaScript或者Erlang来做Map/Reduce查询,它们会查询每个节点,收集结果,而且可以重复,如果需要使用的结果进行重新进行搜寻的话。该系统还为类似于Solr的搜索提供全文索引,同时还提供一个控制面板,可以查看集群的信息。
4. CouchDB
CouchDB是用Erlang开发的面向文档的数据库系统,不过它不是一个传统的关系数据库,而是面向文档的数据库,其数据存储方式有点类似lucene的index文件格式,CouchDB最大的意义在于它是一个面向web应用的新一代存储系统。作为一个分布式的数据库,CouchDB可以把存储系统分布到n台物理的节点上面,并且很好的协调和同步节点之间的数据读写一致性。CouchDB支持REST API,可以让用户使用JavaScript来操作CouchDB数据库,也可以用JavaScript编写查询语句,可以想像一下,用AJAX技术结合CouchDB开发出来的CMS系统会是多么的简单和方便。
CouchDB还有一个更加商业化的“表亲”——Couchbase,不过它提供缓存功能,更好的分片,增量查询,更好的索引和一些其他的功能。其实Couchbase与CouchDB也是紧密相关的,Couchbase产品包含了CouchDB的一个副本。
5. Neo4J
大多数的NoSQL数据库只是存储键和值的一个灵活的捆绑。不过Neo4J的存储的是对象之间的关系,或者说这种结构就是数学中的“图”。Neo4J是一个面向网络(“图”)的数据库,也就是说,它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络上而不是表中,当然也可以把Neo4J看作是一个高性能的图引擎,该引擎具有成熟和健壮的数据库的所有特性。该工具包括很多有关搜索和分析的关系的算法,它能够帮助寻找谁是我的朋友,或者寻找朋友的朋友。这些“图的遍历”算法,可以节省很多指针查询的麻烦。
6. Oracle的NoSQL
也许是NoSQL运动太红火的原因,Oracle决定开发一款产品,将键/值对拆分在整个节点集上,这样的优势在于提供了一个灵活的事务保护措施,进而可以确保从数据在节点上等待存储开始到通过网络被成功备份结束,都尽在掌握之中。
Oracle的NoSQL Database,是在10月4号的甲骨文全球大全上发布的Big Data Appliance的其中一个组件,Big Data Appliance是一个集成了Hadoop、NoSQL Database、Oracle数据库Hadoop适配器、Oracle数据库Hadoop装载器及R语言的系统。
7. MongoDB
MongoDB是一个基于分布式文件存储的数据库,介于关系数据库和非关系数据库之间,是非关系数据库当中功能最丰富,最像关系数据库的。MongoDB最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。MongoDB支持RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
MongoDB是高性能开源文档数据库,也是目前最受关注的NoSQL技术之一,以敏捷、可扩展和对企业应用友好(支持事务,一致性和数据完整性保证,有大企业应用案例)而著称。有人甚至认为LAMP中的M应该用MongoDB取代MySQL,其火热程度可见一斑。使用MongoDB的公司包括Foursquare, Craiglist, 迪士尼,SAP,Intuit,EA等,国内淘宝、大众点评、视觉中国等公司有应用。(最新版MongoDB 2.2下载)
8. Hadoop的HBase
HBase(Hadoop Database),是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据。
虽然大多数人都认为Hadoop及其所有的工具都是作为管理大规模集群的一种机制,其实不然,Hadoop也包括数据库,在HBase中也是通过节点来传播数据。Hadoop的Map /Reduce的架构是非常适合于复杂的计算任务或查询工作。领土在不断的扩张,新的数据库像Accumulo就是Hadoop平台的一个延伸。(Apache Accumulo是一个可靠的、可伸缩的、高性能的排序分布式的Key-Value存储解决方案,基于单元访问控制以及可定制的服务器端处理。使用Google BigTable设计思路,基于Apache Hadoop、Zookeeper和Thrift构建)
9. BigTable/ Accumulo/ Hypertable
BigTable是非关系的数据库,是一个稀疏的、分布式的、持久化存储的多维度排序Map。Bigtable的设计目的是可靠的处理PB级别的数据,并且能够部署到上千台机器上。Bigtable已经实现了下面的几个目标:适用性广泛、可扩展、高性能和高可用性。Bigtable已经在超过60个Google的产品和项目上得到了应用,包括Google Analytics、GoogleFinance、Orkut、Personalized Search、Writely和GoogleEarth。
谷歌的BigTable开启了NoSQL的热潮,现在很多公司都模仿谷歌的架构搭建了自己的平台。谷歌的AppEngine用户可以把键/值对存储在数据库中,而Hadoop的用户可以把它们放在Accumulo上,其他的可以使用Hypertable。所有的这些基本上都属于键/值存储,只不过添加了一些额外的功能,增加了搜索的速度而已。
10. DynamoDB
DynamoDB是亚马逊的key-value模式的存储平台,可用性和扩展性都很好,性能也不错:读写访问中99.9%的响应时间都在300ms内。DynamoDB的NoSQL解决方案,也是使用键/值对存储的模式,平且通过服务器把所有的数据存储在SSD上的三个不同的区域。如果有更高的传输需求,DynamoDB也可以在后台添加更多的服务器。
英文原文:10 standout NoSQL databases to try
中文转自:10个出色的NoSQL数据库(phpChina)
分享到:
相关推荐
NoSQL数据库是近年来在大数据处理和分布式存储领域中越来越受欢迎的一种非关系型数据库模型,它打破了传统的关系型数据库的限制,提供了更为灵活的数据模型和更高的可扩展性。本文将深入探讨两种常见的NoSQL数据库:...
总体而言,MongoDB作为一种强大的NoSQL数据库解决方案,在大数据处理和高度动态的应用场景中表现出色。然而,它的安装和配置过程可能对新手来说较为复杂,需要一定的技术背景和经验才能顺利进行。
6. **NoSQL在大数据处理中的应用**:NoSQL数据库在处理大规模数据时表现出色,如Web应用、社交网络、物联网、日志分析等领域,可以快速存储和检索大量数据。 7. **案例研究**:课程可能会通过具体的企业级项目或...
10. **安全性与备份**:介绍NoSQL数据库的安全机制,如权限控制、加密,以及数据备份和恢复策略,确保数据安全和业务连续性。 综上所述,《Professional NoSQL (2011)》这本书将带领读者全面了解NoSQL的世界,深入...
### NOSQL内存数据库选型...综上所述,NOSQL数据库因其独特的特性和优势,在解决Web2.0时代面临的高并发读写、海量数据存储及访问以及数据库的高扩展性和高可用性方面表现出色,为企业提供了更为灵活和高效的解决方案。
NoSQL 数据库是一种非关系型数据库,近年来在处理大规模数据和高并发交易方面表现出色,逐渐成为应对现代互联网时代数据管理的重要工具。以下是对 NoSQL 数据库你需要了解的十件关键事项的详细解释: 1. 弹性扩展:...
10. **社区支持与生态**:NoSQL数据库通常有活跃的社区,提供了丰富的教程、文档和插件,这对于学习和解决问题非常有帮助。 综上所述,这个压缩包文件的内容可能会涵盖NoSQL数据库的基础概念、类型特性、源码分析、...
NoSQL数据库因其非关系型设计和高扩展性而受到欢迎,但同时也存在被误用的情况。例如,循环网络调用是一种常见的错误使用方式。具体来说,当开发者在获取多个键值时,采用循环的方式逐一获取数据,这会导致网络请求...
NoSQL数据库在大数据、高并发、分布式场景下表现出色,尤其适合实时数据处理和大数据存储。 Redis是一种开源的、基于键值对的NoSQL数据库,它支持多种数据结构,包括字符串(String)、哈希(Hash)、列表(List)...
在大数据、实时分析和高并发场景下,NoSQL 数据库如 MongoDB 通常表现出色。 "NoSQL Manager for MongoDB" 是一款专为 MongoDB 设计的管理工具,它提供了直观的图形用户界面(GUI),使用户能够更轻松地管理 ...
3. MongoDB:MongoDB 是一款流行的NoSQL数据库,支持强大的查询语言和灵活的数据模型,适合处理非结构化数据。其特点是高性能、易部署和易使用,特别适用于需要快速存储和检索大量数据的应用场景。 4. Hadoop ...
9. **NoSQL数据库**: 非关系型数据库在处理大规模、高并发的数据场景中表现出色,如文档型、键值对、图形和列族数据库。理解NoSQL数据库的优势和适用场景是现代数据库知识的重要组成部分。 10. **云数据库服务**: ...
10. **数据库扩展**:随着数据量的增长,可能需要考虑水平扩展(分布式数据库)或垂直扩展(硬件升级),了解如何设计可扩展的数据库架构。 11. **数据库设计原则**:如KISS(保持简单和愚蠢)、YAGNI(你不会需要...
- **CAP理论**:一致性、可用性和分区容错性,NoSQL数据库通常牺牲一致性换取可用性和扩展性。 9. **数据库架构** - **集中式与分布式**:集中式数据库单点故障风险较高,分布式可以提高可扩展性和容错性。 - **...
10. 最新趋势和技术:可能会涉及NoSQL数据库、云计算数据库服务(如Amazon RDS、Google Cloud SQL等)以及大数据处理工具(如Hadoop、Spark)与SQL的交互。 通过"第三部分:数据库分析和设计(第二期).pdf"这个...
Sophia的特性使其在NoSQL数据库领域中脱颖而出,下面将详细探讨其关键知识点。 1. **键值存储模型** Sophia 采用键值对(Key-Value)存储模型,其中每个键与一个特定的值关联。这种模型非常适合简单的读写操作,...
总之,Elasticsearch作为一款强大的NoSQL数据库,以其高效、分布式、易用的特性,为大数据时代的数据处理和搜索需求提供了解决方案。通过`elasticsearch-sql-2.2.0.1`插件,用户可以更自然地使用SQL进行查询,进一步...
8. **NoSQL数据库**:NoSQL数据库以其非关系型、高可扩展性和高性能的特点在大数据时代得到了广泛应用。考生需要理解NoSQL的主要类型(键值对、列族、文档型、图形数据库)及其应用场景。 9. **数据库安全**:这...
SQL数据库适合结构化数据,NoSQL数据库则在非结构化数据处理、大数据分析和物联网场景中表现出色。关系型、分层、网络和面向对象数据库各有优缺点,应根据数据模型和应用场景选择。 3. **保持一致性**:表和列的...