阅读更多

关系数据模型已经流行了几十年了,但是一种新型的数据库(即NoSQL)正在吸引各大企业的关注.下面是对其优势与劣势的一个简单总结.

在过去的1/4世纪中,关系型数据库(RDBMS)一直是数据库管理系统的主导模型.但是,今天,非关系型,”云,”或者”NoSQL”数据库正以数据库 管理系统的替代模型而获得认知.在本文中,我们将考察这些非关系型NoSQL数据库的10个关键因素:最重要的5个优势以及5个挑战.

可以通过此链接下载本文的PDF格式.

NoSQL的5个优势

1. 弹性扩展

多年来,数据库管理员一直依赖于向上扩展(scale up)-随着数据库负载的增加购买更大的数据库服务器―而不是向外扩展-随着负载的增加将数据库分不到多个不同的主机上.然而,随着每秒事务数与可用性需 求的提高,以及数据库往云或虚拟环境的迁移,向外扩展到廉价硬件的经济优势越来越难以抵挡.

RDBMS或许比较难以在廉价的集群上进行向外扩展,但是,NoSQL数据库的新品从设计之初就是为了利用新节点的优势进行透明扩展,他们通常在设计时就考虑使用低成本的廉价硬件.

2. 大数据量

在过去10年,与每秒事务数的增长超出了认知一样,存储的数据的规模也出现了极大的增长.O’Reilly明智的称此为”数据的工业革命.”RDBMS的 容量也在增长以匹配这些数据的增长,但是,与每秒事务数一样,单个RDBMS可有效管理的数据规模限制让部分企业越来越难以忍受.今天,大规模数据量可以 交由NoSQL系统来处理,比如Hadoop,超过目前最大的RDBMS可以管理的数据规模.

3. 再见了,DBA(回头见,DBA?)

这些年,虽然RDBMS的提供商宣称推出了很多的可管理性方面的改进,高端的RDBMS系统还是只能交由昂贵的、高度受训的DBA来进行维护.高端RDBMS系统从设计到安装以及后续的调优,都需要DBA们深度介入.

从理论上,通常,NoSQL数据库的最初的设计目标就是更少的管理介入:自动修复、数据分布以及更简单的数据模型,从而更少的管理与调优需求.实际上,关于DBA将死的谣言很可能被略微放大了.对于任何关键的数据存储,总是需要有人来关心它的性能以及可用性.

4. 经济性

NoSQL数据库通常使用廉价服务器集群来管理暴增的数据与事务规模,而RDBMS倾向于依赖昂贵的专有服务器与存储系统.其结果是,NoSQL数据库的每GB数据或每秒事务数的成本要远远低于RDBMS,使得你可以以更低的价格来存储与处理更多的数据.

5. 灵活的数据模型

在大量的生产环境数据库中,变更管理是一个非常棘手的问题.哪怕是对数据模型的很小的变更,在RDBMS中也需要进行小心的管理,甚至还需要停机或降低服务级别.

在数据模型的限制这一点上,NoSQL数据库要宽松的多,或者完全不存在. NoSQL的键值存储(Key value Store)与文档数据库(Document Database)允许应用在一个数据单元中存入它想要的任何结构.即使是定义更加严格的基于BigTable的NoSQL数据库,通常也允许创建新的字 段而不致带来麻烦.

其结果是,应用的变更与数据库结构的变更不需要绑定在一个变更单元中进行管理.理论上,这可以提高应用的迭代速度,然而,显然,如果应用无法管理数据的完整性,它将带来不良的副作用.

NoSQL的5个挑战

NoSQL数据库的可能性空间引发了大量的关注,但是,在它们成为企业级应用的主流之前,还有大量的障碍有待克服.下面是几个主要的挑战.

1. 成熟度

RDBMS已经存在了很长一段时间. NoSQL的支持者认为它们的年纪是它们过时的象征,但是,对于大部分CIO(首席信息官)来讲,RDBMS的成熟度是可以让人放心的.通常,RDBMS 系统都很稳定,功能也很丰富.相比而言,大部分NoSQL的替代品都还处于前-生产环境阶段,还有大量的关键特性有待实现.

生活在科技前沿对于大部分开发人员来讲,是令人兴奋的,但是,企业在实施时必须非常谨慎.

2. 支持力度

企业还希望获得保证,当关键系统出现故障时,他们可以获得及时而有效的支持.所有的RDBMS提供商都在竭尽全力地为企业提供高级别的支持.

相比而言,大部分的NoSQL系统都是开源项目,虽然,每一个NoSQL数据库通常都会有一家或多家公司为其提供支持,这些公司通常都是小的创业公司,没有能力提供全球的支持,没有足够的支持资源,或者没有类似于Oracle、Microsoft或者IBM的信用.

3. 分析与商业智能

NoSQL数据库经过不断的演化,已经可以满足现代的Web 2.0应用的扩展需求.相应地,它们的大部分功能集也旨在满足这些应用的需求.然而,应用程序中的数据的价值,要超出一个典型的Web应用的插入-阅读- 更新-删除的周期.从公司数据库中挖掘信息以提高公司的效率与竞争力的业务,以及商业智能(BI)是所有大中型公司的关键议题.

NoSQL数据库提供了新型的工具来做即时的查询与分析.哪怕是一个简单的查询,也需要可观的编程技能,通常使用的BI工具都无法访问NoSQL数据库.

稍显宽慰的是,还有类似于HIVE与PIG的这类解决方案,通过它们可以较为简单地访问Hadoop集群中的数据,或许最终,可以较为简单的访问其他的 NoSQL数据库.Quest软件公司开发一个产品,Toad For Cloud Database,它提供了对各种不同的NoSQL数据库的即时查询功能.

4. 管理

NoSQL的设计目标可能是提供零-管理的解决方案,但是,当前的现实是,此目标远远没有实现.目前的NoSQL系统需要大量的技能来进行安装,以及需要大量的努力来进行维护.

5. 专业技能

坦率的讲,目前世界上有上百万的程序员非常熟悉RDBMS的原理与编程,他们分布在各种业务场景中.相比而言,几乎每一个NoSQL开发人员都还处于学习 阶段.随着时间的流逝,这种状况将得到解决,但是,现在,寻找一个有经验的RDBMS开发人员与RDBMS管理员要比寻找一个NoSQL专家要容易的多.

结论

NoSQL数据库正在成为越来越多的数据库环境的重要的组成部分,如果使用得当的话,它可以提供实实在在的收益.然而,企业在推进它们的使用时需要非常谨慎,需要明白这些数据库的相关内在限制与问题.

关于作者

Guy Harrison是Quest 软件公司的研发部门的总监. 知名的数据库专家,有着20多年的应用与数据库管理、性能调优与软件开发相关经验,Guy是出版了多本关于数据库技术的书籍,发表了大量相关的文章,并经常在技术会议上做演讲.

来自: dbthink
9
3
评论 共 1 条 请登录后发表评论
1 楼 czwlucky 2012-01-29 16:22
引用
从公司数据库中挖掘信息以提高公司的效率与竞争力的业务,以及商业智能(BI)是所有大中型公司的关键议题.

商业智能究竟是什么? 让人头疼啊
红色标记部分+商业智能这个词,更是让人纠结.

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • .NET基础示例系列之十六:制做进程监视器

    1)可以查看进程的各项基本信息,如cpu,内存,父进程,执行路径,创建者等 2)可以中止进程,创建新进程 3)可以配置目标进程,配置刷新速度 最终效果图:   (以下给出部分代码,其余像进程的创建、中止等,使用process类将很容易实现) 1)使用wmi获取父进程id,进程创建者 (注意,使用wmi获得的内容,不宜循环刷新,这样代价比较大) 添加命名空间: using ...

  • 使用 WMI 和 Visual Studio 获取硬盘信息

    介绍 再一次问好!今天我就讲讲如何通过WMI来检索硬盘信息。有时有必要知道磁盘上有多少可用空间、它是什么类型的驱动器和/或正在使用的文件系统。不是很常见,我们可能需要知道硬盘的序列号是什么;特别是当我们想让用户为我们的程序购买许可证时。我将使用 VB 和 C# 涵盖所有这些内容。让我们开始派对吧! WMI 引用自MSDN的 WMI(Windows 管理规范)是在基于 Windows 的操作系统上管理数据和操作的基础结构。好的,通俗地说,这意味着通过使用WMI,我们可以检索硬件和/或服务核心的数据。我们

  • Windows获取磁盘信息

    Windows下磁盘相关操作: 1. 使用FindFirstVolume, FindNextVolume查询所有磁盘; 2. QueryDosDevice获取设备名称; 3. GetVolumePathNamesForVolumeName获取路径信息,如C:, D:; 4. GetDriveType获取磁盘类型,不同返回值代表的类型如下图: #include #include #

  • windows api 获取磁盘信息

    使用的API函数有: 1、GetLogicalDriveStrings 用于获取逻辑驱动器字符串 函数原型:DWORD GetLogicalDriveStrings(DWORD nBufferLength, LPTSTR lpBuffer); LPTSTR:字符/字符串指针 函数需要提供一个内存缓冲区lpBuffer来供它保存获取的逻辑驱动器的分区号(C:\ ,D:\等)信息。 2、...

  • Windows10 通过命令行查看本机硬盘信息

    打开 Windows 的命令行 cmd 程序 输入 diskpart,启动磁盘 diskpart 工具 在 diskpart 磁盘工具中依次输入命令 list disk select disk 0 # 根据实际情况选择不同磁盘编号 detail disk 使用完毕后,输入如下命令推出 diskpart 磁盘工具 exit ...

  • 查询硬件信息

    WMI技术介绍和应用——查询硬件信息 - cssealine 时间 2013-10-13 03:21:00 博客园-所有随笔区 相似文章 (0) 原文  http://www.cnblogs.com/cnsealine/p/3366300.html         因为一台电脑上可以有多块硬盘,所以在查询硬盘信息之前,我们需要明确我们要查询哪块硬盘。其中我们将要使用到《WMI技术

  • VB中使用WMI获取系统硬件和软件有关信息

    原帖地址:http://blog.csdn.net/ericbai/article/details/474308 WMI是英文Windows Management Instrumentation的简写,它的功能主要是:访问本地主机的一些信息和服务,可以管理远程计算机(当然你必须要拥有足够的权限),比如:重启,关机,关闭进程,创建进程等。 实例如下: '用WMI,先

  • 利用WMI获取系统的软硬件信息的学习与总结

    文章学习于 http://blog.csdn.net/breaksoftware/article/details/8439975 感谢博主。

  • 获取磁盘大小

    系统磁盘:File file = new File(“c:/”) 当前磁盘:File file = new File("/"); long totalSpace = file.getTotalSpace(); long freeSpace = file.getFreeSpace(); long usedSpace = totalSpace - freeSpace; ...

  • 【C++】WMI获取系统硬件信息(CPU/DISK/NetWork etc)

    官网找到一个例子,根据例子修改下可以获取很多信息 原文链接:http://blog.csdn.net/u010352603/article/details/51400769 [cpp] view plain copy  #define _WIN32_DCOM   #include    using namespace std;   #include   

  • 读取硬盘序列号

    #pragma hdrstop #pragma argsused #include #include #include #include "hdd.h" const WORD IDE_ATAPI_IDENTIFY = 0xA1; // 读取ATAPI设备的命令 const WORD IDE_ATA_IDENTIFY = 0xEC; // 读取ATA设备的命令 const in

  • 使用SSIS WMI Data Reader 通过WMI收集数据库维护信息

    作为DBA来讲,不光要关注SQLServer本身的信息,还需要关注Windows的信息比如磁盘,性能,硬件信息等等。通过SQLServer提供的一些选项比如xp_cmdshell,OLEautomation或者CLR都可以实现,但是可能对SQLServer有一些影响比如安全性方面。比较常用的办法是使用WMI查询远程机器上的硬件,软件配置等信息。在SSIS中,提供了SSISWM...

  • 常用WMI获取系统信息的代码

    usingSystem; usingSystem.Collections.Generic; usingSystem.Text; usingSystem.Management; usingSystem.Net.Sockets; usingSystem.Net; namespaceSystemInfo { classProgram { ...

  • django cpu监控之七-----使用wmi获取CPU数据

Global site tag (gtag.js) - Google Analytics