阅读更多

2顶
0踩

数据库
【编者按】作者Yiftach Shoolman是Redis Labs的联合创始人兼CTO,拥有着丰富的实践经验。Yiftach 之前曾是Crescendo Networks(后被F5收购)的总裁、创建者兼CTO,更早还是Native Networks的技术副总裁。在本文中,Yiftach直述了当下开发者对内存数据库所存在的偏见,并提出了一些技术选型参考意见。

以下为译文

时下,我们正处于一个日新月异的时代,而优秀应用的响应时间往往需要被控制在0.1秒内。这也意味着,如果可接受网络通信时间为50毫秒,那么开发者必须在剩余的50毫秒内处理数据并进行响应。要实现这一点毫无疑问会需求毫秒级的数据库响应时间,在同时支撑上万个请求的场景中更是如此,而这样的需求当下只有少数几个灵活度极高、功能齐全的数据库才能满足。

在大数据处理情景中,洞见必须被快速收集并做出决策,而在没有复杂优化或折中的情况下,内存数据库可以在数秒内完成以往传统数据库数小时或者数分钟的工作。尽管如此,当下在内存数据库领域仍然存在诸多流言,大量人仍然认为内存数据库不可靠性、不一致并且伴随着昂贵的开销。然而最重要的是,还有人认为只要把数据库放到内存中就可以获得所需的性能。

流言1:所有内存数据库都很快

答案显然是否定的。即使当下大部分内存数据库都使用非常高效的语言编写,比如C和C++,但是它们仍然无法得到所需的响应需求,这主要基于以下几点原因:

1. 在不同数据库中,处理命令的复杂性是不同的。在高性能数据库中,处理命令会在最小复杂度下执行。最直接的影响就是就是,在数据集不断增大的情况下,你可能需要一直优化查询时间。

2. 查询效率同样不同。有些时候,数据库会把全部加载进内存的数据当做单一的BLOB(类似memcached的缓存机制),这显然是没有效率的——数据库应该具备分散存储和查询值的能力,以及有效地节约网络和内存开销,从而显著地降低应用程序处理时间。

3. 单线程和多线程架构的权衡。

多线程会尽可能的利用计算能力,无需数据库用户做任何处理,但是这个解决方案同样需要做大量的内部管理和同步,从而消耗大量的计算资源。在多线程模式下,锁开销可能会大幅度降低数据库性能。

单线程使用了一个非常简单的执行模型,在这个解决方案中不存在锁的问题,同时也只会耗费少许的计算性能,但毫无疑问的是,计算资源的管理将从数据库移交给用户。理想的解决方案肯定是让用户尽可能少地做资源管理,因为数据库管理本来就是个轻度资源密集型工作。

4. 零共享vs. 共享vs. 共享一切。共享会影响到系统的扩展性。在数据库体积不断增长的同时,性能也必须时刻满足实例的需求。零共享模型让所有实体都以独立单元的形式存在,从而避免了处理暴增后的通信开销,实现线性扩展能力。

5. 通过避免网络方面任务和减少TCP协议开销, 零延时分布式代理等内置加速组件可以显著地提升数据库性能。在某些情况下,代理也可能与数据库通信,以确定其是否作为主机上服务远程客户端的另一个本地客户端进程。

如果吞吐量和延时是主要目标,那么机构很显然需要选择一个可以实现毫秒级延时并最小化服务器需求的数据库。

流言2:内存计算是不可靠和不一致的

大多数NoSQL数据库(不只是内存数据库)在提交数据到磁盘或者副本之前都为客户端提供了acknowledgements (ack)。因此,这里很可能会造成数据不一致的情况。



CAP定理标明任何分布式计算机系统都不能同时具备一致性、可用性和分区容错性。不同的数据库会选择不同的类型,具体情形如下:选择CP模型表示开发者不用去关心一致性,但是在网络分割事件中写命令则是不允许的。如果选择AP模型则意味着数据库对读写一直可用,但是开发者在写应用程序代码时就需要考虑一致性问题,而不是期望数据库去完成这个操作。因此,请根据使用场景来选择合适的数据库模型。

流言3:内存计算很难扩展

扩展共有两个途径。首先通过给托管数据库的服务器纵向扩展,比如增加更多的CPU和内存;其次,通过向内存集群中添加更多的主机实现横向扩展。在许多数据库中,你可以在同一个节点上运行同一个数据集的多个分片,因此可以通过更有效率的计算资源利用来延缓扩展需求。同样,这里也可以将多个服务器的内存整合起来成为一个共享内存池,从而突破单机内存大小限制。现下,很多内存数据库同时允许这两种方法的扩展,通过动态的增加分配给数据库的核心和内存节点数量来最大化应用程序的响应能力。

流言4:内存计算是昂贵的

任何需要快速提升吞吐量的应用都面临着相同的问题:“一定等级的吞吐量究竟需要花多少钱”。举个例子,在1500万OPS情景下,运行在单Amazon EC2实例上的内存数据库会比非内存数据库便宜,但是如果使用数百台服务器达到同样的效果结果可能就会截然相反。

如果数据集规模是TB级别,内存的花费很显然会成为问题,然而当下已经有使用闪存扩展内存的技术存在,从而降低花费。但需要注意的是,使用闪存来扩展内存势必会影响到系统性能,因此这里理想的技术是控制闪存和内存的比例以达到一个理想的性价比。

综上所述,根据实际场景来选择合适的数据库技术将会大幅度提高资源利用效率。同时,新型数据库出现已有很长一段时间,因此抛弃不必要的成见才能让工作事半功倍。

原文链接:Busting 4 Myths of In-Memory Databases (翻译/OneAPM工程师 责编/仲浩)
  • 大小: 35.3 KB
来自: CSDN
2
0
评论 共 1 条 请登录后发表评论
1 楼 aa1asdasd 2015-09-24 16:50
孟一丹???

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • shell 命令执行顺序 一

    shell 命令执行顺序 一shell执行命令的步骤顺序如上图,看起来有些复杂。 当命令行被处理时,每一个步骤都是在Shell的内存里发生的;Shell不会真的把每个步骤的发生显示给你看。 所以,你可以假想这事我们偷窥Shell内存里的情况,从而知道每个阶段的命令行是如何被转换的。shell执行命令的原理 Shell 从标准输入或脚本中读取的每一行称为管道(pipeline);它包含了一个或多

  • 转载-综合

    https://zhuanlan.zhihu.com/p/22142170 https详解 https://coolshell.cn/articles/17416.html/comment-page-3#comments 缓存更新策略 https://www.jianshu.com/p/929b9aa70dc8spring-boot profile https://www.cnblo...

  • 转载博客

    第一步 原博客 右键 检查按钮 得到原网页 如上图所示,找到这个玩意 ,然后点击选中他们 第二步骤: 点击右键 选择 copy, copy—element 复制博客文本内容 第三步:打开写博客,选择 markdown 点进去,将刚刚复制的内容选择进去就行了 ...

  • Linux基础篇(一)-- Shell与Bash的区别和联系

    本文主要对学习的Shell和Bash相关知识点进行了总结,对于每一部分的详细介绍,可以参考《鸟哥的Linux私房菜:基础学习篇》和文末推荐的博客进行深入了解。全文主要介绍了Shell的由来、Shell的工作原理、如何进入Shell和常用的Shell,随后又对大多数 Linux 系统默认的Shell——Bash进行了详细描述,主要向大家介绍我们在使用Bash时会使用到的特性,比如命令补全、通配符、命令历史记录、重定向、管道等。

  • MD5加密算法的java实现

    package other; import java.security.MessageDigest;import java.security.NoSuchAlgorithmException;/** MD5 算法*/public class MD5 { // 全局数组 private final static String[] strDigits = { "0", "1",...

  • 转载4

    CSDN新首页上线啦,邀请你来立即体验! 旧版 立即体验 博客 学院 下载 GitChat 更多 论坛 问答 活动 码云 商城 ITeye 极客头条 写博客 发布Chat 登录注册 RECHER_ZHANG 我的博客 消息(99) 设置 反馈 退出

  • Shell与Bash介绍

    Linux图形化桌面算不上精美。幸好,Linux提供了更好的与树莓派互动的方式:Shell。 1、Shell和Bash:hell是运行在终端中的文本互动程序;bash(GNU Bourne-Again Shell)是最常用的一种shell,是当前大多数Linux发行版的默认Shell。即:shell是总称,bash是shell的一个版本。 2、原理:Shell相当于是一个翻译,把我们在计算机上的操作或我们的命令,翻译为计算机可识别的二进制命令,传递给内核,以便调用计算机硬件执行相关的操作;同时,计算机执

  • Linux下shell脚本:bash的介绍和使用(详细)

    Shell:一般我们是用图形界面和命令去控制计算机,真正能够控制计算机硬件(CPU、内存、显示器等)的只有操作系统内核(Kernel),由于安全、复杂、繁琐等原因,用户不能直接接触内核,需要另外再开发一个程序,让用户直接使用这个程序;该程序的作用就是接收用户的操作(点击图标、输入命令),并进行简单的处理,然后再传递给内核,内核和用户之间就多了一层“中间代理”,Shell 其实就是一种脚本语言,也是...

  • 引用概念

    20、引用 我们知道,参数的传递本质是一次赋值的过程,赋值就是对内存进行拷贝,所谓的内存拷贝,是指将一块内存上的数据复制到另一块内存上。 b.c/C++禁止在函数调用时直接传递数组的内容,而是强制传递数组指针,而对于结构体和对象没有这种限制,调用函数时既可以传递指针,也可以直接传递内容;但是在C++中,我们有了一种比指针更加便捷的传递聚合类型数据的方式,那就是引用(Reference)

  • 引用类型(一)

    引用类型的值是引用类型的一个实例。1、Object 实例2、Array 类型检测数组:(a) value instanceof Array (b) Array.isArray()方法:push\pop\shift\unshiftsort 方法会调用数组中每一个项的 toString 方法,可传入一个比较函数来比较数值数组。function compare(v1, v2) { if (v1 ...

  • Linux中"Shell"与"Bash"的关系

    Linux中"Shell"与"Bash"的关系 此文属于我在学习Linux中的学习记录,便于回头查找相应文档使用,大多数解释都为其它网站引用,也用来分享给大家做个参考, 1、认识Shell 在计算机科学中,Shell俗称壳(用来区别于核),是指“为使用者提供操作界面”的软件(命令解析器)。它类似于DOS下的command.com和后来的cmd.exe。它接收用户命令,然后调用相应的应用程序。1 基...

  • shell基础篇:Bash特性和shell变量

    单引号变量,不能识别特殊语法双引号变量,能识别特殊符号变量定义与赋值,注意变量与值之间不得有空格name= "wang" 变量名变量类型,bash默认把所有变量都认为是字符串bash变量是弱类型,⽆需事先声明类型,是将声明和赋值同时进⾏。

  • Bash和Shell有什么区别?

    但其他的 Shell,比如 sh、csh、zsh,也是可用的。,但不是所有的 Shell 都是 Bash。

  • bash手册

    bash手册 蓝森林 http://www.lslnet.com 2000年3月28日 22:53作 者: con前言      本文译自《Slackware Linux Unleashed》(第三版)一书的 bash 一章,但做了一些必要的删节,并且有的地方根据实际情况作了较大的改动,必要的话请参考原文。对本文有任何问题的话请与我联系:con@nease.net  

  • bash和shell的区别

    Linux 中的 shell 有很多类型,其中最常用的几种是: Bourne shell (sh)、C shell (csh) 和 Korn shell (ksh), 各有优缺点。Bourne shell 是 UNIX 最初使用的 shell,并且在每种 UNIX 上都可以使用, 在 shell 编程方面相当优秀,但在处理与用户的交互方面做得不如其他几种shell。Linux 操作系统缺省的 sh

  • shell、bash、cmd之间的关系浅谈

    部分内容引用自http://www.cnblogs.com/panchanggui/p/9582481.html Windows系统中,操作系统可以分为kernel和shell两部分。shell位于操作系统的外层,是操作系统和外部的主要接口,为用户提供与操作系统核心沟通的途径。再说到shell,shell其实有图形shell和命令行shell之分,在Windows操作系统中,我们知道图形shel...

  • linux中的shell与bash的关系

    Linux中的Shell与Bash的关系**Linux中"Shell"与"Bash"的关系**1、认识Shell2、认识Bash3、Shell与Bash关系 Linux中"Shell"与"Bash"的关系 此文属于我在学习Linux中的学习记录,便于回头查找相应文档使用,大多数解释都为其它网站引用,也用来分享给大家做个参考, 1、认识Shell 在计算机科学中,Shell俗称壳(用来区别于核),是指“为使用者提供操作界面”的软件(命令解析器)。它类似于DOS下的command.com和后来的cmd.exe。

  • Shell与Bash学习

    Shell与Bash学习1.什么是Shell1.1查看Linux下的shell 1.什么是Shell 什么是shell呢?shell的作用,在我看来就是建立一个我们(用户)与计算机内核之间的桥梁。计算机的内核通过操作系统控制,而用户通过操作系统上发展的应用程序来控制计算机工作。简而言之就是通过shell将我们输入的命令与内核进行通信。 值得注意的是,在Linux系统下,当我们打开一个终端的时候,...

  • [转载]

    1.webdriver的协议是什么? 答:The WebDriver Wire Protocol   2.启动浏览器的时候用到的是哪个webdriver协议? 答:http   3.怎样去选择一个下拉框中的value=xx的option? 答:二次定位   4.如何在定位元素后高亮元素(以调试为目的)? 答:重置元素属性,给定位的元素加背景、边框   5.什么是断言? ...

  • linux和shell的关系

    shell的理解       shell翻译成壳的意思,它是包裹在linux内核外层的,一个可通过一系列的linux命令对操作系统发出相关指令的人机界面。 shell可以通过其条件语句和循环语句等,把一系列linux命令结合在一起,形成一个相当于面向过程的程序,shell script,来实现一些较为复杂的功能。       shell是linux命令集的概称,是属于命令行的人机界面。She...

Global site tag (gtag.js) - Google Analytics