阅读更多

3顶
0踩

互联网

转载新闻 Yahoo! 的数据仓库:世界上最大最忙- by Fenng

2008-05-27 14:42 by 资深记者 galaxystar 评论(3) 有3300人浏览

微软对 Yahoo! 的收购持久战可能让很多人都新闻疲劳了。但今天看到的这个关于 Yahoo! 的技术新闻还是值得看一下的:Size matters: Yahoo claims 2-petabyte database is world's biggest, busiestYahoo! 的 VP Waqar Hasan 在文中披露 Yahoo!的数据仓库当前容量为 2PB。用于分析每月5亿的用户访问行为,每天处理 240 亿次的事件,号称世界上单个最大、最忙的数据库。

尽管有的数据仓库容量要比雅虎的大。但那些 DB 或是存储非关系性数据,或是存储的压缩后的原始数据,不能进行即时分析,雅虎之前的也有数百 T 这样的数据。眼下 Yahoo!数据仓库存储的是结构化、可分析的数据。预计下一年可能膨胀到数十 PB 。eBay 号称数据总量有 6PB ,不过根据一些消息来看,单个最大的 DB 只有 1.4 PB。

Yahoo! 在 2005 年买了一家叫 Mahat Technologies 的初创公司(就是 Waqar Hasan 操刀的),这家公司以 PostgreSQL 数据库为基础,开发了一个新型 DB,其特点是 基于列 的而不是基于行的模式。不难理解,这样数据写入的速度会慢下来,但是读取的速度会快很多【去年的侠客行上,雷鸣在演讲的时候讲过他在百度的时候做的一个优化的例子。和这个思想非常相似,所以当时我说对我"有启发"】。Yahoo! 买了之后,对该产品进行了持续性的改进(内部代号: ELCARO ?) ,比如压缩,并行处理能力加强、优化查询等等特性的添加改进。而针对使用者的接口仍是 PostgreSQL 。这应该也算 PostgreSQL 在顶级企业又一个成功案例。

这么大的数据库并没有采用传统的 SMP 架构构建,而是采用普通 PC 作集群(用了不到 1000 台) 。很明显这是 Share Nothing 而不是 Share Storage 的 DB 集群。通过上述独特的设计方式,能够对此海量数据进行有效的分析,这是个不小的技术革新,也是与 Google Map Reduce 完全不同的计算模式。

让人感慨的是 关于世界上的超大数据库 一文中罗列的数据,现在看起来已经并不惊人了。以前总说信息爆炸,这个时代刚刚来临。

来自: dbanotes
3
0
评论 共 3 条 请登录后发表评论
3 楼 sunyujing 2009-07-01 20:55
是的,不用这个teradata,自己实现分布式数据库集群
2 楼 sunyujing 2009-07-01 10:31
   上面的文章的核心我想应该是向我们展示了分布式数据库是怎么一回事,其实思路上说说很容易,当数据库很大,并发也很大的时候,我们靠单个的大型服务器来支持,尽管服务器很强悍了,但是对一个大的数据库的操作不论是写入还是查询肯定要慢,所以大家就想着应该将数据分开。不论是数据库厂商还是其他的集群厂商,大家的做法又略有不同。
    我个人觉得,我们国人不应该只停留在,看国外Yahoo、google、msn、myspace等等这些数据库如何实现分布式,如何用成千上万台PC机做成一个大集群。这些可以说和我们关系不是非常大,大家也只能是看看,也用不上,永远只能是个想法,或更多的是故事。
    在国内我觉得更多的去探讨或者研究一些对于我们来说可以实际使用的技术,这些才是真正能过帮助大家解决系统中遇到的问题。我把我看到的一些产品和技术拿出来和大家分享。这个技术是在现有的商用数据库上开发的,SQL Server,MySQL 等;基本结构是两层访问层和数据层,
访问层:访问层数据库只有原来数据库的结构没有数据,处理提交上来的SQL语句并调度执行。用户和业务程序面对的是访问层数据库。
数据层:数据是在数据层进行分区,每个分区又可以有多个冗余。可以有多个冗余对查询进行负载均衡,以提高整个系统 的性能 。  
这样的结构,对外来说,就和使用一个数据库一样,只暴露出一个IP。内部来说是由多台服务器组成的。

其实这样的思路我们好多技术人员也自己也知道,甚至好多公司的技术人员也在业务上分割,自己来开发这样的系统,这个又可能回到一个国内流传的故事,说青岛啤酒前两年传出来快不行了,后来调查发现,他们都自己研究酒瓶就盖子,在社会化大分工的现在,还要这么做,我估计得类似人的,我觉得更多时候要去整合,专业的技术要交给专业的技术公司来研究。
这个产品是我见到的分布式数据库产品一级的应该是比较接近用户了。更多过于数据库集群、分布式数据库的介绍,可以到官方网站去看http://www.grqsh.com/soft_03.asp
1 楼 eyejava 2008-05-27 16:11
不用teradata?

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 银行在线支付接口相关说明和开发文档

    银行接口、网银支付接口 银行在线支付接口 在线支付接口、各类接口说明书、返回码、异常处理、接口描述等等,支持实现在线支付。

  • 【设计师必备】1888 枚扁平化丰富多种类型的 icon 图标打包

    Travel Real Estate Sports Communication Food Music Hotel and Restaurant Electronics 资源下载 链接: https://pan.baidu.com/s/1eRZWA2m 密码: 扫描下方二维

  • 建行支付接口 php,ecshop下用php语言和jar包实现建设银行在线支付接口

    最近应一个客户的要求在ecshop下开发建行网银的在线支付接口。原来以为很简单,后来发现不是这么回事。先看看建行的开发接口和实例代码。因为ecshop是Php的,所以在php的实例代码中有这么一段代码:$rsasig=new COM...

  • Java集成建行龙支付接口(详细)

    Java集成建行龙支付接口(详细),持续更新!

  • java实现对接建行支付及其回调

    最近公司要对接建行支付,也是查了很多资料,走了很多弯路,还问了建行的技术员,现把它记录下来,直接上代码。 调用支付所需常量 @Value("${ccb.MERCHANTID}") private String MERCHANTID; //商户代码,固定写死的,...

  • java如何实现建行支付_微信小程序,调用建行支付。

    /*** 统一添加订单 * *@parampaymentOrder *@return */@WeiXinLogin @RequestMapping("/addOrder")publicResponseModel addOrder(OrderVO orderVO) { LoginUserVO user=RequestContext.... } //PayApi 接口的实现类

  • java如何实现建行支付_Android java对接建行支付SDK

    /*** @description: 支付参数* @copyright: Copyright (c) 2020* @author: liwei* @date: 2020/5/25* @version: 1.00* @history:*/public class PayConstant {/*** 商户代码--由建行统一分配*/public static final ...

  • Java实现建行聚合支付对接及其回调

    Java实现建行聚合支付对接及其回调 文章目录 Java实现建行聚合支付对接及其回调 前言 产生订单 说明 银行回调 支付回调实体类 httpclient工具类 MD5工具类 建行无感支付实体类 后记 前言 本文原文基础上,进行完善而...

  • nodejs调用建行互联网银企被扫支付接口加密及验签Demo+java封装jar包

    该java源代码将建行互联网银企被扫支付接口java版加密及验签Demo 封装成jar包,方便nodejs调用。 1.将建行Java版加密Demo打包成jar包:CCBParam.jar。并将jar包放到服务器的相应文件夹下。 2.根据订单号、金额、付款...

  • 网络支付的安全解决办法 思考

    支付的安全问题与需求 网络支付因涉及到最敏感的资金流动,所以是最需要保证安全的,也是最容易出现安全问题的地方。信用卡密码被盗,支付金额篡改,收款抵赖等等。 安全问题: 1、支付系统不稳定 网络故障,操作...

  • 微信建行支付对接

    微信支付调用建行支付

  • nodejs调用建行互联网银企被扫支付接口Java版加解密Demo

    node js调用建行互联网银企被扫支付接口Java版加解密Demo

  • 在线支付功能实现代码

    在线支付一般来说有两种实现方式,一种是调用各个银行提供的接口,另一种是使用第三方集成好的支付功能。两种方式各有优劣,这个相信行内人士都是非常了解的了。对于第三方支付来说会需要提交企业5证来验证,还会有...

  • java聚合支付之建行

    因为工作的需要,需要聚合支付来完成收费,因为本人写过工行聚合支付,来对比一下俩家聚合支付,工行聚合文档网上直接有(https://open.icbc.com.cn/icbc/apip/service.html),建行的话,还得申请,有银行人员给你...

  • 支付系统设计:银行卡支付

    作者:凤凰牌老熊公众号:凤凰牌老熊(转载已取得作者授权)支付和交易说到支付就不得不提交易。这两个概念在不同公司中是不一样的。我们的定义是,交易是生成订单;支付是对订单进行付款。订单生...

  • 建行提示找不到服务器,中国建设银行E路护航网银安全组件常见问题解答

    答:中国建设银行E路护航网银安全组件包括网银安全检测工具、网银安全控件、密码保护控件等一系列安全增值服务,并且通过升级至最新版的网银盾管理工具,可进一步提升网银盾的安全性,实现“所见即所签”功能,有效...

  • 中国建设银行-跨境易支付

    跨境贸易业务横跨多个国家和地区,涉及面广、交易链条长、贸易信息复杂,区块链技术可以构建高效的跨境支付体系,有效解决信息共享不畅、跨地区多主体协同困难、支付交易费用高、交易不安全等问题。跨境交

  • 详述银行卡支付方式

    本文主要讲述了银行卡支付的几种方式以及对接银行接口时需要着重注意的一些点。 正文 说说大家比较熟悉的银行卡支付,它分为线上支付和线下支付两种形式。线下支付就是通常说的 POS 收单,这里不介绍这个内容。对...

Global site tag (gtag.js) - Google Analytics