Autodesk基于Mesos的通用事件系统架构

0顶
0踩

2015-08-28 17:12 by 副主编 mengyidan1988 评论(0) 有5694人浏览

Mesos kafka scala

声明：ITeye资讯文章的版权属于ITeye网站所有，严禁任何网站转载本文，否则必将追究法律责任！

【编者按】本文由Autodesk Cloud软件架构师Olivier Paugam撰写，解释了如何集合Mesos、Kafka、RabbitMQ、Akka、Splunk、Librato、EC2等基础设施解决实际问题。此外，以如此小规模的团队解决问题确实令人赞叹。

以下为分享原文：

数月前分到了一项新的任务：做一个集中事件系统（central eventing system），允许各个后端彼此通讯——包括动态流式（activity streaming）后端、渲染、数据转换、BIM、日志报告、分析等等。最终确定，这应该是一个可以匹配多种负载、使用场景与可扩展配置文件的通用系统。此外，这个系统还需要具备简单易用的接口。最后，这个系统的每部分都应当能够自动扩展。

然而，笔者根本没有那么多的时间去深入开发，再选用稳定通用、性能良好的Kafka作为存储核心（当然这里Kafka并不是唯一选择）。同时需要注意的是，这里还需要通过一些API将之以前端的方式提供。而在一些思考后，使用后端管理offset同样被否决，因为这样做在处理实例错误时需要建立大量约束。

基于这些需求，这里设置了两个独立的层：一个API层，处理接收的信息；还有一个后端层，托管常驻、有状态的Kafka做通信的流处理服务（比如执行生产者和消费者）。这两个独立的层分别具备良好的扩展性，只需要一致的路径以确保客户端与同一个后端流处理服务通讯不会中断。

这两个独立的层完全用Scala实现，并使用了Play！框架。同时，这两个层都非常依赖Akka的actor系统（每个节点通常运行着几百个actor）。后端层执行了定制的Kafka producer与consumer，并使用了独立的actor设置来管理预读与写入缓存。在整套系统中，“ Everything is implemented as nested finite-state machines ”被一直执行。使用Librato收集度量数据，随后转到Splunk处理。

如上所述，这里实现了两个独立的层，那么它们之间的路由机制该如何完成？非常简单，这里使用的是用RabbitMQ——可靠且兼具弹性！对于实现这个“phone-switch”，AMQP队列是良医妙药。同时，使用逻辑分片对其扩展也十分简单（比如对每个事务中出现的cookie使用哈希），它将会把一组固定的后端节点与一个RabbitMQ broker连接起来。

那么，这里为什么不聚合RabbitMQ broker？其主要原因在于这么做并不会带来显著地提升，同时也非常耗时。实际上，各独立broker之间的分区流量更高效易控。跟收益比起来，附加的工作量微不足道。

简而言之，在一些容器拓扑中执行针对路径路径，其取决于不同后端节点主导的是什么样的streaming session。扩展整体与分层拓展一样简单，取决于具体的需求。实际中唯一的限制来自虚拟网络适配器与其带宽。

现在有趣的部分来了：流量的稳定该如何确保，同时还需要避免byzantine 故障？其实这里并不存在太多的挑战，只需使用一个简单的二阶段提交协议，将客户端与后端作为镜像的状态机（比如始终同步），这可以通过让读写操作需求明确的确认请求来实现。尝试读取的做法在失败后进行重试，直到获得确认，接下来会对后端更新（比如将Kafka offset转发，或者编排一系列事件发布）。这样，客户端与后端之间的传输就类似于“分配session”、“读取”、“确认”、“读取”、“确认”……“处理”。

通过这些处理，系统的巨大优势在于可以有效地呈现操作幂等，同时还可以在状态机上编译所有逻辑，无需使用烦人的说明语句（PS，请原谅我追求酷炫的思想）。此外，任何网络故障都可以通过重试解决，从而可以自由地实现control-flow和back-pressure。

这样一来，所有功能都通过Apache ThriftAPI提供（汇聚了压缩和HTTS，并准备实现某些情况下场景的TCP切换）。当下，平台客户端已经使用了Python、Scala、NET和Ruby等多个语言，并使用了大量炫酷的技术。值得一提的是，Kafka offset是由客户端控制的，使得控制后台更为简单。

到了这里，你肯定想问，后端节点挂掉的话该如何处理？这里需要感谢的是二阶段提交协议让读取数据变得简单——客户端复制失败后会使用现有的offset重新分配一个新的streaming session。因此这里的问题存在于向Kafka写入数据，因为它是异步的，因此可能会面临受到下游back-pressure的情况（在节点失败后，Kafka broker也会出现问题，这一点必须注意）。因此这里需要为后端系统实现一个优雅的关闭功能，从而在等待写入时关闭阻止新的请求进入。再不济，也可以将任何等待数据刷新到磁盘中，等待稍后处理。

这里你肯定想问，基础设施问题该如何解决？这里的原理是相同的，任何与处理streaming session的实际后端节点传输中断必然会导致速度变慢，但是由于二阶段提交，这里不会产生令人不快的影响。

此外，在落入Kafka log之前数据会被自动加密（AES 256），当然你一定要在Kafka producers和consumers之间共享秘钥那么只能祝你好运了。关于安全，streaming session通过OAUTH2认证，每个请求单独用MD5-HMAC，并通过TLS向后端集群传输。

那么，这个炫酷的系统是如何部署的？这里使用是Mesos/Marathon集群来运行（现在还不是DCOS，不过在未来会转换过去，并享受其强大的控制面板）。当下，集群托管在AWS EC2 上，在多个c3.2xlarge实例上被复用（在给定区域中执行一个小型部署，10到20算不少了）。请注意，在Kubernetes（不管是EC2还是GCE）也可以使用同样的方法。

使用Ochopod技术完成部署（自集群容器），它同样是开源的。将操作减到最少。比如推进build时，API层只负责分配一些新的容器，等分配好之后再逐步清理旧的。所有这些操作都通过一个专门的、在集群中运行的Jenkins从节点来处理（其本身也是一个Ochopod容器）。

事实上，笔者也开发了Ochothon mini-PaaS，只是为了快速开发运维（devops）所有的容器。

下面让你体会Ocho-* 平台的强大：1个人（笔者）可以管理跨越2个regions上的5个系统部署，包括所有备份基础设施……而且还有时间写写博客和代码。

所以，总体来讲，对它设计与编码是件很有意思的事情，再加上它现在作为Autodesk Cloud基础设施的关键部分在生产环境运行（相当不错）。也欢迎各位提交问题。

相关阅读：

原文链接：How Autodesk Implemented Scalable Eventing Over Mesos（译者/孙薇审校/朱正贵责编/仲浩）

查看图片附件

分享到：

0
顶

0
踩

评论共 0 条请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Autodesk基于Mesos和Kafka的通用事件系统架构

【编者的话】我非常喜欢这篇博客，因为它揭示了许多简单架构模块—例如：Mesos、Kafka、RabbitMQ、Akka、Splunk、Librato和EC2可以整合起来来解决实际问题。而且一个小团队就可以获得非常令人惊讶的成就。几个月...

Autodesk基于Mesos的可扩展事件系统

几个月前，我接到一个任务，要拿出一个集中式的事件系统，可以让我们的各种后端组件相互通信。我们讨论了后端活动流、渲染、数据转换、建筑信息模型（BIM）、个性身份（identity）、日志报表、分析等等。找寻其中...

Mesos入门介绍

2016年会火的技术之一， Mesos。花了一些时间，将Mesos相关的知识整理了一下，以做备忘。水平有限，如有疏漏或谬误之处，还望指出。 Mesos是什么 Mesos是一个集群管理平台。可以理解为是一种分布式...

Docker 与 Mesos 的前生今世 | 数人云CTO肖德时@KVM分享实录

今天小数给大家带来一篇技术正能量满满的分享——...十五年计算机行业从业经验，曾为红帽 Engineering Service 部门内部工具组 Team Leader，Docker/Mesos 社区代码贡献者。现负责数人云云计算的研发及架构设计工...

2018年开源容器云，你的技术路线选对了吗？

同时，Mesos通过两级调度架构管理多种类型的应用程序，第一级调度由Mesos监控集群的空余资源，并将空余资源按照一定规则分配给各个计算框架；第二级调度由框架（Framework）组成，各个计算框架会根据需要选择接受...

qconshanghai2016

http://2016.qconshanghai.com/schedule 大会日程 2016年10月20日星期四 07:45 开始签到 ...大数据应用与系统优化实践（厂商共建）微服务架构，我们该如何实践？地点百...

2016 上海 Qcon 值得关注的技术

虚拟机层面加入虚拟化的支持，能有效解决传统热更新方案的痛点，高效精确的回收系统资源。对于大规模 Java 应用，可以做到不重启 Java 进程而达到更新应用的目的，整体更新操作时间也被大大缩短。 ...

qconshanghai2015

Uber首席系统架构师 Matt Ranney Slides下载高性能数据分析平台架构实践：SequoiaDB + Power Linux IBM资深售前技术工程师孔皓 Slides下载 10:40 短休专题可扩展、高可用...

我关注的一周技术动态 2015.08.30

服务化和资源管理技术 1. Docker基础技术：AUFS ... ...要点: 支持层次化镜像是 docker 的一大创新之一, 本文详细介绍了实现层次化镜像的技术手段之一 aufs 的使用...2. Autodesk基于Mesos的通用事件系统架构 ...

（转）那些年不容错过的硅谷IT公司

是由 dotCloud 创建的一款开源应用引擎，它相当于是加在 LXC（LinuX Containers，一种轻量、基于容器、操作系统层的虚拟化技术）上的管道，通过高级 API 为进程单独提供了一个轻量级的虚拟环境。Docker 镜像犹如一个...

最受IT公司欢迎的50款开源软件

Sencha Touch 自称是“一种用于构建通用移动应用程序的领先的跨平台移动 Web 应用程序框架，基于 HTML5 和 JavaScript”。它既有开源许可证版本，也有商业许可证版本。据官方网站声称，《财富》100 强中 60% 使用它...

那些年不容错过的115家硅谷IT公司

外加热强制循环蒸发器装配图（CAD).rar

数控车床纵向进给系统设计.zip

vault_side_off_ominous.png

爬虫 bangumi名称和评论数

基于SpringBoot的垃圾分类回收系统(源码+数据库+万字文档)526

基于SpringBoot的垃圾分类回收系统，系统包含两种角色：管理员、用户主要功能如下。【用户功能】首页：浏览垃圾分类回收系统信息。个人中心：管理个人信息，查看历史记录和订单状态。运输管理：查看运输信息，垃圾回收的时间和地点。公告管理：阅读系统发布的相关通知和公告。垃圾回收管理：查看垃圾回收的信息，回收类型和进度。垃圾出库申请管理：提交和查看垃圾出库申请的状态。【管理员功能】首页：查看垃圾分类回收系统。个人中心：管理个人信息。管理员管理：审核和管理注册管理员用户的信息。用户管理：审核和管理注册用户的信息。运输管理：监管和管理系统中的运输信息。公告管理：发布、编辑和删除系统的通知和公告。垃圾回收管理：监管和管理垃圾回收的信息。垃圾出库申请管理：审批和管理用户提交的垃圾出库申请。基础数据管理：管理系统的基础数据，运输类型、公告类型和垃圾回收类型。二、项目技术编程语言：Java 数据库：MySQL 项目管理工具：Maven 前端技术：Vue 后端技术：SpringBoot 三、运行环境操作系统：Windows、macOS都可以 JDK版本：JDK1.8以上都可以开发工具：IDEA、Ecplise、Myecplise都可以数据库: MySQL5.7以上都可以 Maven：任意版本都可以

这篇文章是台湾大学（NTU）计算机科学与信息工程系（CSIE）2021年秋季学期算法设计与分析课程的第一份作业（Homework#1）的具体要求和题目描述以下是主要内容的总结：

内容概要：本文档是台湾大学计算机科学与信息工程系2021年秋季学期《算法设计与分析》课程的第一次作业（Homework#1）。作业包含四道编程题和三道手写题，旨在考察学生对算法设计和分析的理解与应用能力。编程题涉及汉诺塔、数组计算、矩形点对、糖果分配等问题；手写题涵盖渐近符号证明、递归方程求解、幽灵腿游戏优化、不公平的卢卡斯问题等。文档详细描述了每个问题的具体要求、输入输出格式、测试用例以及评分标准。此外，还提供了编程技巧和注意事项，如避免延迟提交、正确引用资料、处理大输入文件等。适合人群：具备一定编程基础的本科生或研究生，特别是修读过或正在修读算法设计与分析相关课程的学生。使用场景及目标：①帮助学生巩固课堂所学的算法理论知识；②通过实际编程练习提高解决复杂问题的能力；③为后续更深入的学习和研究打下坚实的基础。其他说明：此作业强调团队合作和个人独立思考相结合的重要性，鼓励学生在讨论后用自己的语言表达解决方案，并注明参考资料。对于编程题，特别提醒学生注意输入文件可能较大，建议采取适当的优化措施以确保程序运行效率。

基于SpringBoot的铁路订票管理系统(源码+数据库+万字文档+ppt)528

基于SpringBoot的铁路订票管理系统，系统包含两种角色：管理员、用户主要功能如下。【用户功能】首页：浏览铁路订票管理系统的主要信息。火车信息：查看火车的相关信息，包括车次、出发地、目的地和票价等。公告资讯：阅读系统发布的相关通知和资讯。后台管理：进行系统首页、个人中心、车票预订管理、车票退票管理等操作。个人中心：管理个人信息，查看订单历史记录等。【管理员功能】首页：查看铁路订票管理系统。个人中心：修改密码、管理个人信息。用户管理：审核和管理注册用户的信息。火车类型管理：管理系统中的火车类型信息。火车信息管理：监管和管理系统中的火车信息，添加、编辑、删除等。车票预订管理：处理用户的车票预订请求。车票退票管理：处理用户的车票退票请求。系统管理：管理系统的基本设置，公告资讯、关于我们、系统简介和轮播图管理。二、项目技术编程语言：Java 数据库：MySQL 项目管理工具：Maven 前端技术：Vue 后端技术：SpringBoot 三、运行环境操作系统：Windows、macOS都可以 JDK版本：JDK1.8以上都可以开发工具：IDEA、Ecplise、Myecplise都可以数据库: MySQL5.7以上都可以 Maven：任意版本都可以

塑料架注射模具设计.rar

0顶0踩