视频巨头NetFlix云存储
使用亚马逊的公有云,两者形成公有云生态环节,互相促进,亚马逊将在Netflix成功方案推广给其他客户服务,Netflix则通过每晚占据全美60%网络下载量的巨大流量检验亚马逊云平台。
Netflix几个功能块
分发 CDN
存储 包括内存存储和磁盘存储
消息 效率协调。
计算 包括同步计算和异步并发计算
支付 各种支付接口
分析 数据挖掘分析
Netflix遭遇关系数据库瓶颈:
- 内容 用户资料 产品模型等等都有存储,防止当机丢失。随着用户规模扩大,用户写入数据巨大,需要巨量存储
- 传统的集中式关系数据库无法水平扩展,分布分区能力很差。
- 一旦表结构改变,导致停机重启。
Netflix视频数据模型特点:
- 用户资料 AAA
多种格式媒体描述,flv MP4
本地差异化内容
中心统一推送内容
用户本地触发内容
特点:数据的主键比较容易获得。主要是用户主键和视频主键。
需要解决巨量登录Session
- 用户登录后,必须在服务器保留Session,以确认其已经登录。
Session数据在服务器间复制,效率差,影响服务器处理正向处理能力
过去使用负载平衡器将用户发往其Session创建后的服务器,负载实际不均衡。
容易导致集中式过程编程,一个服务干很多事情
云存储Session
- Cassandra保存Session,易于修改。
跟踪终端用户每次操作事件,记录在Session中,可作为其回放缓存。
Cassandra前端再添加memcached,提高Seesion快速就近读取能力。
最前端通过负载平衡球进行请求级别的分发。
迁移到健壮的协议
- 云服务协议:REST + JSON
支持单个请求包含复杂的数据类型。 - Apache Avro:数据序列化更加快速,适合在http上更快交换数据。
- REST结合OAuth
NetFlix持久化方案
- 将Avro保存在memcached。包括定义
节省空间,降低延迟(zigzag编码减少一半) - Avro能够使用JSon表达,由POJO产生。但是比较难,需要专门工具。
SQS消息中间件
- 消息异步中间件,提供异步分布式处理能力。
- 事件监听模式。发布者-订阅者。类似JMS,有Topic和Queue两种。
- 可实现cron类型 繁重 巨大计算任务。
消息在视频制作流程应用
异步后弹性易于扩展
消息的订阅提醒服务
Amzon EC2
- 弹性 多租户系统,可评估内存和CPU。
底层使用IAAS虚拟化
Eucalyptus, OpenNebula, OpenStack, OpenQRM, XenServer, Oracle VM, CloudStack, ConVirt 比较
Map/reduce计算开源工具:GridGain;GigaSpace 和Hadoop。
Netflix重点自己整合运维监视管理工具
Netflix的监视界面AppDynamics
性能线程实时监视和评估
建立大规模的真实世界推荐系统Building Large-scale Real-world Recommender Systems - Recsys2012 tutorial
解剖了Netflix的个性化特点(“一切都是个性化”),在这篇PPT中谈了Netflix的数据模型(包括物流/线性回归,弹性网,矩阵分解和马尔可夫链),消费数据科学(用户离线和在线测试),
Netflix hystrix入门教程
Netflix是如何用大数据捧火《纸牌屋》的 | 36氪
Netflix基于AWS的大数据平台Hadoop架构解析-CSDN.NET
IBM的WebSphere实施案例使用了大半netflix oss工具
NetFlix源码开放中心
如何基于开源构架设计一个视频平台?
NetFlix测试Cassandra:-每秒百万次写
美国视频巨头Netflix的云存储方案
Netflix开源Hystrix
开源真正分布式实时大数据分析仓库Druid
Blitz4j - 可伸缩的日志框架
Apache Curator :让ZooKeeper使用更容易
FaceBook大数据架构
集群专题
伸缩性scalable
大数据BigData
云计算Cloud
http://www.jdon.com/artichect/netflix.html
相关推荐
王晓中作为Netflix云平台架构师,领导了一系列以云计算为基础的架构设计与开发工作。Netflix云架构的建设基于众多开源软件,并实现了诸多独特的功能,如动态服务注册、寻址和动态配置等。王晓中在SDCC2012会议上对...
在微服务架构中,Spring Cloud Netflix提供了多种组件来解决分布式系统中的常见问题,如服务发现、容错管理、负载均衡等。 1. **服务注册与发现**:核心组件Eureka负责服务的注册与发现。每个服务启动时,会向...
【Netflix基于AWS的大数据平台Hadoop架构解析】 Netflix是一个全球知名的在线流媒体服务平台,其背后的大数据处理能力至关重要。为了支持海量数据的分析和决策,Netflix构建了一个基于Amazon Web Services (AWS)的...
本项基于Spring Cloud Netflix架构的Java服务设计源码,总计包含86个文件,涵盖21个YAML配置文件、20个Java源文件、16个XML配置文件、10个IML项目文件、9个lst列表文件、5个原始文件、2个Git忽略文件、2个Markdown...
Netflix个性化和推荐系统架构 Netflix公布的个性化和推荐系统架构是基于机器学习算法的,旨在提供精准的个性化推荐。该架构由多种机器学习算法组成,包括在线计算、离线计算和接近在线计算等。在线计算能够快速响应...
Netflix是全球知名的流媒体服务提供商,其背后强大的技术支撑就是其独特的微服务架构设计。本文将深入探讨Netflix的微服务架构,包括其架构组件、设计目标以及实现这些目标所面临的权衡与挑战。 1. 简介 Netflix的...
【全面解析 Netflix 的微服务架构设计】 Netflix 是全球领先的在线订阅制视频流媒体服务,其技术架构因其高可用性和可扩展性而备受赞誉。在2008年的一次重大服务中断后,Netflix 决定进行一次重大的基础架构转型,...
【Netflix 微服务技术架构详解】 Netflix,作为全球知名的在线影片租赁服务商,以其创新的微服务和DevOps实践成为行业的典范。该公司通过分析海量的用户观看数据,成功创作出热门剧集《纸牌屋》,并在此过程中积累...
全面解析Netflix的微服务架构设计,这个PDF文档深入探讨了这家全球知名流媒体巨头如何构建其复杂且高度可扩展的服务架构。Netflix是微服务架构的先驱之一,其设计原则和技术实践对整个IT行业产生了深远影响。 1. **...
Netflix架构的核心原则是可扩展性、容错性和自愈能力。为了实现这些目标,他们采用了微服务架构,将复杂的应用程序拆分为数十个甚至数百个独立的、可独立部署的小型服务。每个微服务都有自己的数据库和业务逻辑,...
这些库通常包含特定于Netflix架构的组件,但也可以作为其他分布式系统的参考实现。 在"压缩包子文件的文件名称列表"中,我们看到"spectator-master",这表明这个压缩包可能包含了Spectator项目的源代码主分支。通常...
【Netflix基于AWS的大数据平台Hadoop架构解析】 Netflix作为一个全球知名的在线流媒体服务平台,其背后依赖着强大的大数据处理能力。这个能力主要通过基于Amazon Web Services(AWS)的Hadoop架构实现。Netflix的...
自2009年起,Netflix开始将其系统架构从单体应用转变为云原生微服务架构,并于2016年完成了全面的云端迁移工作。如今,Netflix拥有超过500个独立的微服务,相较于迁移前,其业务流量增长了1000倍。这种转变极大地...
Netflix的个性化和推荐系统是其成功的关键因素之一,该系统基于复杂的架构,融合了离线、接近在线和在线计算方式,以实现高效、精准的推荐。以下是对这一系统架构的详细解析: 首先,Netflix的系统架构包含多种机器...
【微服务架构基础】 微服务架构是一种将单一应用程序拆分为一组小型、独立的服务的方法,每个服务都运行在其自己的进程中,并且通常围绕业务能力进行构建。这些服务之间通过轻量级的通信机制(如HTTP RESTful API)...