随着互联网web2.0网站的兴起,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。而传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如:
1、High performance - 对数据库高并发读写的需求
web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系数据库应付上万次SQL查询还勉强顶得住,但是应付上万次SQL写数据请求,硬盘IO就已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求,例如像JavaEye网站的实时统计在线用户状态,记录热门帖子的点击次数,投票计数等,因此这是一个相当普遍的需求。
2、Huge Storage - 对海量数据的高效率存储和访问的需求
类似Facebook,twitter,Friendfeed这样的SNS网站,每天用户产生海量的用户动态,以Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下乃至不可忍受的。再例如大型web网站的用户登录系统,例如腾讯,盛大,动辄数以亿计的帐号,关系数据库也很难应付。
3、High Scalability && High Availability- 对数据库的高可扩展性和高可用性的需求
在基于web的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,你的数据库却没有办法像web server和app server那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移,为什么数据库不能通过不断的添加服务器节点来实现扩展呢?
在上面提到的“三高”需求面前,关系数据库遇到了难以克服的障碍,而对于web2.0网站来说,关系数据库的很多主要特性却往往无用武之地,例如:
1、数据库事务一致性需求
很多web实时系统并不要求严格的数据库事务,对读一致性的要求很低,有些场合对写一致性要求也不高。因此数据库事务管理成了数据库高负载下一个沉重的负担。
2、数据库的写实时性和读实时性需求
对关系数据库来说,插入一条数据之后立刻查询,是肯定可以读出来这条数据的,但是对于很多web应用来说,并不要求这么高的实时性,比方说我(JavaEye的robbin)发一条消息之后,过几秒乃至十几秒之后,我的订阅者才看到这条动态是完全可以接受的。
3、对复杂的SQL查询,特别是多表关联查询的需求
任何大数据量的web系统,都非常忌讳多个大表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询,特别是SNS类型的网站,从需求以及产品设计角度,就避免了这种情况的产生。往往更多的只是单表的主键查询,以及单表的简单条件分页查询,SQL的功能被极大的弱化了。
因此,关系数据库在这些越来越多的应用场景下显得不那么合适了,为了解决这类问题的非关系数据库应运而生,现在这两年,各种各样非关系数据库,特别是键值数据库(Key-Value Store DB)风起云涌,多得让人眼花缭乱。前不久国外刚刚举办了NoSQL Conference,各路NoSQL数据库纷纷亮相,加上未亮相但是名声在外的,起码有超过10个开源的NoSQLDB,例如:
Redis,Tokyo Cabinet,Cassandra,Voldemort,MongoDB,Dynomite,HBase,CouchDB,Hypertable, Riak,Tin, Flare, Lightcloud, KiokuDB,Scalaris, Kai, ThruDB, ......
分享到:
相关推荐
而非关系型数据库(NoSQL),采用键值对、文档、图形等非表格数据模型,适合处理大规模分布式数据。 【数据库管理系统DBMS】 DBMS(数据库管理系统)是一种专门用于管理和控制数据库的软件,它负责管理数据库文件...
图数据库和NoSQL数据库都属于非关系型数据库的范畴,它们提供了更多的数据模型和扩展性,但图数据库更专注于解决复杂关系网络的存储和查询问题。 6. DSE图数据库: 文档提到了DSE图(DataStax Enterprise Graph),...
NoSQL/NewSQL 数据库的出现是为了解决传统关系数据库的局限性,但是在实际应用中,它们也存在一些缺陷。例如,NoSQL 数据库难以实现事务一致性,NewSQL 数据库虽然可以实现高性能读写,但是在数据一致性和可扩展性...
### 为什么选择NoSQL数据库:三大趋势颠覆传统数据库格局 #### 一、引言 在过去的15年里,互动应用程序经历了翻天覆地的变化,这些变化不仅体现在规模上,更在于数据处理方式的根本转变。NoSQL(Not Only SQL)...
例如,一个名为`harmony-development`的数据库中可能包含`accounts`、`activities`等多个集合。 **3. 文档(Document)** 文档则是MongoDB中的基本数据单位,类似于关系型数据库中的行。每个文档都是一个JSON格式...
1. **设计目标**:OceanBase被设计为一款关系型数据库,专注于处理结构化数据,并具备高度的分布式和扩展性。它可以处理千亿级别的数据量,支持跨行跨表事务,同时兼容SQL和MySQL协议。 2. **对比传统数据库**:与...
MongoDB是一种NoSQL数据库,与传统的关系型数据库管理系统(RDBMS)相比,它在设计上有着本质的不同。它采用了一种叫做BSON(类似于JSON)的格式存储数据,支持动态的模式设计。MongoDB的灵活性、高性能、高可用性以及...
- **前言**:书中提供了对Python语言的基本介绍,并解释了为什么人们会选择使用Python。此外,还列举了一些实际案例,展示了Python在不同领域的应用情况。 - **第一部分:入门**:这部分内容非常适合新手,从Python...
标题 "Cassandra write performance test (为什么Cassandra的写入如此慢)" 暴露了一个关键问题,即在某些情况下,Cassandra数据库系统的写入性能可能不如预期。这通常与多种因素有关,包括但不限于架构设计、硬件...
·为数据库架构和规模日益增长带来的隐患考虑通用的处理方法 ·学习如何处理宕机和降级相关的人为因素 ·找到在蜂拥而至的巨大流量后避免灾难的方法 ·问题发生后了解症结所在,防止其再次发生 目录...
·为数据库架构和规模日益增长带来的隐患考虑通用的处理方法 ·学习如何处理宕机和降级相关的人为因素 ·找到在蜂拥而至的巨大流量后避免灾难的方法 ·问题发生后了解症结所在,防止其再次发生 ·查看全部>...
1. **Why(为什么)**:研究大数据是因为其潜在的巨大价值。随着互联网、社交媒体、物联网等的快速发展,数据量呈指数级增长,企业、政府和科研机构需要大数据分析来挖掘其中的洞察,以提高决策效率、优化运营、创新...
9. **数据库管理**:存储和管理大量的地点、路线、用户数据,可能需要用到关系型数据库(如MySQL)或NoSQL数据库(如MongoDB)。 10. **用户界面**:最后,设计友好的用户界面,使用户能够轻松输入起点和终点,查看...