作者: Fenng
|
可以转载, 转载时务必以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://www.dbanotes.net/arch/ebay_storage.html
前年在帖子里介绍过 eBay 数据量超过 2PB
,这么大的数据量管理和规划是需要一些艺术的,可惜网络上能得到的信息太少。最近又找到一篇关于 eBay 存储的介绍
,这篇文章通过访问 William Crosby-Lundin
(这位老兄现在已经跳槽到 SalesForce了)披露了一些数据,虽然该文距离现在有一年了,还是对我有不少参考价值。
eBay 存储团队当时 12 个人,管理 13 套存储,总容量 2PB 左右(不要刻舟求剑,现在超过 8 PB
,2008-08-04)
了,8000 个左右光纤口,可用性 99.94%,工作量肯定不小。每周要起用 10TB 存储,这些存储有 75 个 LUN(也就说平均每个
LUN 135GB 左右,这个数据有些怪异)。连接到 SAN 环境的主机大约有 1000 台,数据库集群有 600
个左右,据我所知,这里的集群应该只是指 Data Guard。
这么多的数据库,I/O 开销肯定不小,如何消除存储热点呢? 该文只是笼统的说通过存储层与主机层的数据分片
达到的。如果应用上 I/O 均衡做的好一些,可能存储热点问题不会成为瓶颈。
这个存储环境的部署应该有好几年了。所以最近一两年比较火爆的存储虚拟化与 Provisioning 技术都没有大规模起用。个人觉得 eBay 这么大的数据量, Provisioning 技术对于 eBay 的环境会是比较适合的。
有的时候,盲人摸象
也是一种乐趣呀。
补充一下,超过 140 套集群。另外,提醒一下,这些数据是随着时间而变化的。切莫刻舟求剑。
--EOF--
Refer
:
Our systems process in excess of 20 billion newly added
records per day, 40TB being added every 24h, serving thousands of users
and delivering hundreds of millions of queries per month in a true
global 24x7 operation with distributed teams around the globe on
systems over 8 PB in size (largest cluster >3PB), processing more
than 30 PB of data per day.
分享到:
相关推荐
关于ebay的存储及架构内容的一些介绍,从最初的版本,到现在到支持上亿用户,上亿次请求的发展过程。
根据提供的文件信息,我们可以从中提炼出与eBay入门相关的几个重要知识点: ### 1. eBay基础知识 - **定义**:eBay是一个全球知名的在线购物网站,用户可以在上面进行商品的买卖活动。 - **发展历程**:自1995年...
《eBay SDK v581.0 for Java:探索eBay API的核心技术与应用》 eBay SDK(Software Development Kit)v581.0 for Java是针对Java开发者设计的一套工具包,它允许开发人员能够轻松地与eBay平台进行交互,实现各种...
eBay作为全球知名的在线拍卖与购物网站,自成立以来便在全球范围内拥有庞大的用户基础和广泛的市场影响力。eBay的收费结构一直是其商业模式的重要组成部分,它直接关系到卖家的成本和收益,同时也影响着买家的购物...
这个源码可以用于创建类似eBay的在线市场,允许用户进行商品拍卖、购买和销售。 【描述】"Ebay,克隆源码,测试可以用,php代码写"说明了这个源码已经过测试,可正常运行。使用PHP编写意味着它依赖于PHP语言,这是一...
最初,Ebay是使用单一数据库进行数据存储的,这在用户数量较少时是可行的。随着用户基数的不断增长,单一数据库的性能逐渐成为瓶颈,Ebay开始转向分布式数据库,以支持更大的数据量和更高的访问量。 随后,Ebay开始...
《eBAY教程详解》 eBAY,作为全球最大的在线拍卖及购物网站之一,吸引了无数卖家和买家参与其中。本教程将全方位地解析eBAY平台的操作与策略,帮助您从新手快速成长为精通eBAY交易的专业人士。 一、eBAY注册与认证...
在缓存层,eBay利用高性能的缓存系统(如Redis或Memcached)来存储经常访问的数据,减少对数据库的直接访问,提高查询速度。此外,使用缓存还可以减轻后端服务器的压力,提升用户体验。 eBay的搜索功能是其核心竞争...
通过上述内容,我们可以看到使用Python结合BeautifulSoup和Urllib2可以有效地抓取Ebay网站上的商品信息,并将其存储到MySQL数据库中。这种技术不仅可以应用于Ebay,还可以扩展到其他电商平台,为后续的数据分析和...
【标题】"eBay平台分析与运营策略" 在IT行业中,eBay是一个全球知名的电子商务平台,它为全球卖家和买家提供了在线交易的便利。这份名为"eBay ppt.rar"的压缩包文件,很可能是关于eBay平台的业务分析、运营策略或是...
2. **数据抓取**:数据抓取是指从网站上提取并储存信息的过程。在这里,用户通过"eBay小爬虫"可以抓取自己的商品名称、价格、描述、图片等关键数据。 3. **API与爬虫的区别**:通常,电商平台会提供API接口供开发者...
根据提供的文件信息,我们可以总结出一系列与eBay成功策略相关的知识点。这些知识点主要围绕着如何在eBay上取得成功,包括识别适合在eBay销售的商品、拓展全球市场、提高生产力、增加利润以及如何将eBay作为全职业务...
标题与描述均提到了“ebay架构原则,架构演变历史及ebay的自动化”,这实际上指代了eBay在IT架构设计、发展以及自动化技术应用上的深入探索与实践。以下是对这一主题的深入分析,旨在解析eBay如何通过其独特的架构...
**Ebay API SDK 747 完整包** Ebay API SDK 747 是一个专门为开发者设计的工具包,用于与eBay电子商务平台进行集成。这个版本的SDK提供了全面的功能,允许开发者通过编程方式访问eBay的各种服务,如商品上架、交易...
例如,使用分布式缓存系统如Memcached或Redis,可以存储频繁查询的商品信息,减少数据库的读取压力,显著提高性能。 五、数据库设计 在数据库层面,Ebay可能采用了主从复制、分区和分片等策略来应对大数据量。主从...
接入eBay支付的SDK是开发电商应用,尤其是与eBay平台进行深度整合的重要步骤。这个SDK包含了一系列核心工具,使得开发者能够轻松地在自己的应用程序中集成eBay的支付功能。以下将详细介绍这些核心组件和相关知识点。...
### Ebay API技术开发白皮书知识点详解 #### 一、简介 本白皮书主要针对Ebay API的应用与开发,提供了详细的指导与建议。对于希望通过Ebay API进行应用开发的技术人员来说,这份文档非常有价值。 #### 二、API概述...
eBay API/SDK Tutorial for Java 本 tutorial旨在展示使用 eBay API/SDK 的基本步骤,旨在帮助开发者快速上手使用 eBay API/SDK。为了完成本 tutorial,需要具备以下几个条件: 1. eBay Trading SDK for Java 2. ...
关于eBay 基础知识的考试 对于eBay卖家有极大的参考作用
ebay账户注册申请ebay账户认证美国ebay账户ebay电商服务