`
huangxx
  • 浏览: 321904 次
  • 来自: ...
社区版块
存档分类
最新评论

eBay 的数据量 - zt

阅读更多
作为电子商务领头羊的 eBay 公司,数据量究竟有多大? 很多朋友可能都会对这个很感兴趣。在这一篇 
Web 2.0: How High-Volume eBay Manages Its Storage(从+1 GB/1 min得到的线索) 报道中,eBay 的存储主管 Paul Strong 对数据量做了一些介绍,管中窥豹,这些数据也给我们一个参考。

站点处理能力
平均每天的 PV 超过 10 亿 ; 
每秒钟交易大约 1700 美元的商品 ; 
每分钟卖出一辆车A ; 
每秒钟卖出一件汽车饰品或者配件 ; 
每两分钟卖出一件钻石首饰 ; 
6 亿商品,2 亿多注册用户; 超过 130 万人把在 eBay 上做生意看作是生活的一部分。
在这样高的压力下,可靠性达到了 99.94%,也就是说每年 5 个小时多一点的服务不可用。从业界消息来看,核心业务的可用性要比这个高。

数据存储工程组控制着 eBay 的 2PB (1Petabyte=1000Terabytes) 可用空间。这是一个什么概念,对比一下 Google 的存储就知道了。每周就要分配 10T 数据出去,稍微算一下,一分钟大约使用 1G 的数据空间。

计算能力
eBay 使用一套传统的网格计算系统。该系统的一些特征数据: 
170 台 Win2000/Win2003 服务器; 
170 台 Linux (RHES3) 服务器; 
三个 Solaris 服务器: 为 QA 构建与部署 eBay.com; 编译优化 Java / C++ 以及其他 Web 元素 ; 
Build 整个站点的时间:过去是 10 个小时,现在是 30 分钟; 
在过去的2年半, 有 200 万次 Build,很可怕的数字。
存储硬件
每个供货商都必须通过严格的测试才有被选中的可能,这些厂家或产品如下: 
交换机: Brocade 
网管软件:IBM Tivoli 
NAS: Netapp (占总数据量的 5%,2P*0.05, 大约 100 T) 
阵列存储:HDS (95%,这一份投资可不小,HDS 不便宜, EMC 在 eBay 是出局者) 负载均衡与 Failover: Resonate ;

搜索功能: Thunderstone indexing system ;
数据库软件:Oracle 。大多数 DB 都有 4 份拷贝。数据库使用的服务器 Sun E10000。另外据我所知, eBay 购买了 Quest SharePlex 全球 Licence 用于数据复制.


应用服务器

应用服务器有哪些特点呢? 

使用单一的两层架构(这一点有点疑问,看来是自己写的应用服务器)

330 万行的 C++ ISAPI DLL (二进制文件有 150M)

数百名工程师进行开发

每个类的方法已经接近编译器的限制 

非常有意思,根据eWeek 的该篇文档,昨天还有上面这段划掉的内容,今天上去发现已经修改了:

架构
高分布式 
拍卖站点是基于 Java 的,搜索的架构是用 C++ 写的 
数百名工程师进行开发,所有的工作都在同样的代码环境下进行
可能是被采访者看到 eWeek 这篇报道,联系了采访者进行了更正。我还有点奇怪原来"两层"架构的说法。

其他信息
集中化存储应用程序日志; 
全局计费:实时的与第三方应用集成(就是eBay 自己的 PayPal 吧?) 
业务事件流:使用统一的高效可靠消息队列. 并且使用 Cookie-cutter 模式用于优化用户体验(这似乎是大型电子商务站点普遍使用的用于提高用户体验的手法)。
后记
零散作了一点流水帐。作为一个 DBA, 或许有一天也有机会面对这样的数据量。到那一天,再回头看这一篇电子垃圾。 
更新:更详细信息请参考:Web 2.0: How High-Volume eBay Manages Its Storage。可能处于 Cache 的问题,好几个人看到的原文内容有差异

--EOF-- 
分享到:
评论

相关推荐

    ebay-node-api:节点的eBay API客户端

    let ebay = new eBay ( { clientID : "-- Client APP ID ----" , env : "SANDBOX" , // optional default = 'PRODUCTION' headers : { // optional "X-EBAY-C-MARKETPLACE-ID" : "EBAY_GB" // For Great Britain ...

    PyPI 官网下载 | ebay_rest-0.0.9-py3-none-any.whl

    关于`ebay_rest-0.0.9-py3-none-any.whl`这个具体的文件,其内容可能包括Python源代码、元数据(如作者信息、版本信息、依赖库等)、以及可能的测试文件。一旦安装,这些源代码会被添加到用户的Python环境路径中,...

    PyPI 官网下载 | ebay_feedsdk-0.2.0-py3-none-any.whl

    通过PyPI下载并安装这个轮子文件,开发者可以轻松地将其集成到他们的Python项目中,实现各种基于eBay数据的定制功能。为了充分利用这个库,开发者应熟悉eBay的API规定,理解库的使用方法,并参考库的文档以获取详细...

    python爬虫ebay-spider-master

    python基本数据结构python爬虫ebay_spider-master

    QCon 2009 beijing全球企业开发大会ppt:9.来自eBay的教训--可扩展站点的最佳实践

    eBay作为一个大型在线市场,每天需要处理的数据量惊人: - 全球活跃用户超过8630万。 - 销售中的商品超过1.2亿件,分布于5万个不同类别。 - 日均页面浏览量超过20亿次。 - 每秒交易额超过2000美元,年交易额达到600...

    ebay-trading-api

    ebay-trading-api eBay 交易 API 的节点客户端。配置将 env.js.production 或 env.js.sandbox 复制到 env.js 文件中。 如果您使用设置和检索用户身份验证令牌的调用(这些调用是:GetSessionID、FetchToken、...

    ebay-cors-filter-1.0.1-3.el7.noarch.rpm

    官方离线安装包,测试可用。使用rpm -ivh [rpm完整包名] 进行安装

    ebay-cors-filter-javadoc-1.0.1-3.el7.noarch.rpm

    官方离线安装包,测试可用。使用rpm -ivh [rpm完整包名] 进行安装

    ebay-item-checker:易趣商品价格检查器

    ebay-item-checker 脚本在 ebay 上检查商品的价格,并通知它是否找到了低价商品描述package.json - 项目依赖config.js包含: 电子邮件通知, 检查之间的延迟, ebay 查询和所需的商品最高价格, 和其他设置。...

    ebay-sdk-1055:适用于eBay API的Java 9 SDK

    - 搜索与浏览:利用eBay的搜索API获取商品数据,支持定制化的搜索策略。 3. **API调用** 使用eBay SDK,开发者可以通过调用预定义的类和方法来访问eBay的RESTful API。这些API遵循HTTP协议,支持JSON和XML格式的...

    ebay-view-bot:最简单的请求机器人来提高 ebay 浏览量

    ebay-view-bot 最简单的请求机器人来提高 ebay 浏览量。 只需输入所需的产品链接(请不要缓存链接)和所需的观看次数,瞧TODO(可能永远不会完成) txt 文件的所有所需链接 完成后开始一个新链接而不是完成脚本 多...

    ebay-scraper-wintr:从Ebay搜索和产品URL中提取产品数据

    从Ebay搜索和产品URL中提取产品数据 开始吧 在WINTR上以获取API密钥 访问您的并复制您的API密钥 安装 $ npm install ebay-scraper-wintr 刮擦产品 const Ebay = require ( 'ebay-scraper-wintr' ) const scraper = ...

    ebay-oauth-python-client:Python OAuth SDK:获取eBay公共API的OAuth令牌

    OAuth是一种授权框架,允许第三方应用在用户授权下访问受保护的资源,如eBay上的数据。在这个案例中,SDK帮助开发者获取到OAuth令牌,从而能够安全地调用eBay的公共API。 **OAuth认证流程** OAuth认证通常分为四个...

    eBay数据仓库实践:元数据管理及应用

    ### eBay数据仓库实践:元数据管理及应用 #### 一、eBay的诞生与成长 eBay成立于1995年,由皮埃尔·奥米迪亚(Pierre Omidyar)创立,最初源于一个简单的想法——拍卖一个坏掉的激光指示器。这一简单尝试迅速发展...

    Laravel开发-ebay-legacy

    本文将深入探讨“Laravel开发-ebay-legacy”项目,这是一个专门为与eBay交易平台进行API交互而设计的软件层。 首先,我们要明白“legacy”一词在此上下文中的含义。在技术领域,“legacy”通常指的是旧版或过时的...

    ebay-bucks-animations

    "eBay-bucks-animations"这个项目显然专注于为eBay平台设计和实现一系列与雄鹿(bucks)相关的动画组件。这些动画可能用于促销活动、用户交互或者其他视觉表现,旨在增强用户对eBay品牌的认知和购物体验。 首先,...

    eBay-tools-开源

    这款工具的核心特性在于它将所有拍卖数据和图片存储在本地的SQL数据库中,允许用户在没有网络连接的情况下也能进行搜索和浏览,极大地提升了使用的便利性和效率。 首先,让我们深入了解这个工具的主要功能: 1. **...

    eBay Architecture-Scalability with Agility

    标题“eBay Architecture - Scalability with Agility”及描述同名,揭示了eBay如何通过灵活且可扩展的架构来应对日益增长的数据量、用户需求以及业务挑战。下面,我们将深入探讨这一主题,理解eBay是如何实现其架构...

Global site tag (gtag.js) - Google Analytics