摘要:容器通过集装箱式的编译、打包、部署,大大提高了应用的迭代速度。对于架构师而言,容器带来的是分钟级的部署、秒级的伸缩与恢复、一个量级的迭代速度提升、50%左右的基础成本节省。
简介
容器通过集装箱式的编译、打包、部署,大大提高了应用的迭代速度。对于架构师而言,容器带来的是分钟级的部署、秒级的伸缩与恢复、一个量级的迭代速度提升、50%左右的基础成本节省。但是对于落地实施容器的开发者而言。80%的工作处理的是容器前和容器后的问题,容器前指的是如何本地开发、集成、测试并部署到容器环境;而容器后指的是如何对部署到容器环境后的监控、运维、告警与调优。今天我们主要来探讨的是如何在容器的环境中进行资源维度的监控。
先谈容器与监控
关于容器的监控方案有非常多的种类,大家耳熟能详的一些组件包括:prometheus、Telegraf、InfluxDB、Cadvisor、Heapster等等。但是从原理上来讲无外乎分为推模式采集与拉模式采集。推模式采集是指通过部署相应的agent,将监控的指标推送到server再进行数据聚合和报警的方式,例如Telegraf就是这种模式的代表。拉模式采集是指通过中心化的server使用API或者脚本等方式从容器直接拉取资源利用率的方式,而prometheus则是这种方式的集大成者。和传统应用监控相比,容器监控面临更大的挑战:首先由于容器更多的是在资源池中调度,传统的静态配置化的监控agent就变得非常麻烦,如果只在宿主机部署监控agent则会造成缺乏必要信息来识别监控对象;其次容器的生命周期与传统应用相比而言会更加短暂,而由容器抽象的上层概念例如swarm mode中的service或者kubernetes中的ReplicaSet、Deployment等等则没有太好的办法从采集的数据中进行反向的抽象,造成单纯的容器监控数据无法有效的进行监控数据的聚合和告警,一旦应用的发布可能会导致原有的监控与报警规则无法生效;最后容器的监控需要更多的维度,资源维度、逻辑资源的维度、应用的维度等等。
如何在容器服务上进行资源监控
其实容器之所以难以监控的主要原因在于无法将逻辑的概念和物理概念无法在监控数据、生命周期上面实现统一。阿里云容器服务Kubernetes与云监控进行了深度集成,用应用分组来抽象逻辑概念,今天我们来看下如何进行Kuberbetes的资源监控和告警。
首先Kubernetes节点从职能上分为Worker和Master两种不同的节点。Master节点上面通常会部署管控类型的应用,整体的资源要求以强鲁棒性为主;而Worker节点更多的承担实际的Pod调度,整体的资源以调度能力为主。当你创建一个Kubernetes集群时,容器服务会为你自动创建两个资源分组,一个是Master组,一个是Worker组。Master组中包含了Master节点以及与其相关的负载均衡器。Worker组包含了所有的工作节点。
可以通过点击列表视图显示当前资源分组中的资源,例如本例中Master分组包含了三个Master节点以及2个SLB。另外任何在资源组下的资源的报警规则都会被自动继承,因此在拓扑总览页面即可看到所有资源的健康状态。
在监控视图中可以详细的在组级别以及实例级别查看详细的监控数据
对于Mater节点而言,其上运行的各种组件的健康状态是更加重要的,因此在Master分组中设置了所有节点的核心组件的健康检查,健康检查状态出现问题时即可通过钉钉、邮件、短信的方式在第一件获取到Kubernetes的集群状态。
对于版本在1.8.4及以上的老集群而言,可以通过升级监控服务的方式快速建立资源报警分组。对于资源组中的资源可以通过新建报警规则的方式设置自定义的报警,而报警规则会自动应用到资源组中,且在集群自动伸缩等场景也会自动添加。
最后
本片文章我们讲解了如何如何通过资源分组进行监控与告警,针对kubernetes的pod、service的监控也即将在4月份进行发布,尽请期待。
阅读更多干货好文,请关注扫描以下二维码:
相关推荐
【阿里云原生实践15讲】是一份深入探讨云原生技术和阿里云实践的资料,涵盖的内容广泛且深入,旨在揭示云原生时代的技术趋势和阿里云在云原生领域的创新实践。以下是对其中主要知识点的详细说明: 1. **云原生应用...
阿里云开源插件Log-Pilot(也称为logpilot)是一款强大的日志收集工具,专为在Kubernetes(k8s)环境中运行的应用程序设计。它能够高效地从各个容器中提取日志,并将这些日志发送到指定的存储或分析系统,以便于监控...
阿里云容器服务是企业级的Kubernetes托管平台,为企业提供了高效、灵活、可扩展的容器化应用管理和部署解决方案。在购买阿里云容器服务时,了解其计费方式和优惠政策至关重要,这将直接影响到您的成本控制和资源利用...
阿里云专有云企业版 V3.12.0 容器服务Kubernetes版技术白皮书旨在为用户提供了一个详细的技术指南,以帮助用户快速了解和使用阿里云容器服务Kubernetes版的功能和特性。本文档涵盖了容器服务Kubernetes版的概述、...
阿里云开源插件Log-Pilot是一款专为Kubernetes(k8s)设计的日志收集工具,它能够有效地从运行在集群中的容器内收集应用程序日志,以帮助运维人员进行监控、故障排查和数据分析。Log-Pilot支持多种数据源,包括容器...
在IT领域,特别是容器编排和云原生技术中,Kubernetes(K8S)扮演着核心角色。Prometheus作为一款流行的开源监控系统和时间序列数据库,被广泛用于收集和分析K8S集群中的各种指标。为了实现全面的监控,包括对外部...
阿里云专有云企业版V3.9.0的容器服务Kubernetes版运维指南主要针对的是使用阿里云Kubernetes服务的企业用户,旨在提供详细的管理和维护指导。Kubernetes(简称K8s)是一种流行的容器编排系统,用于自动化容器化应用...
【阿里云开源插件log-pilot搜集Kubernetes(k8s)部署应用容器内日志】 在现代云计算环境中,Kubernetes(简称k8s)已成为容器编排的主流平台,而日志管理是运维和故障排查的重要环节。阿里云推出的开源插件log-...
K8S是一个广泛应用的容器编排系统,而阿里云提供了自己的K8S服务——ACK(AliCloud Container Service for Kubernetes)。 ### 理论篇 #### 集群控制器理解 集群控制器是K8S的核心组成部分,它相当于整个集群的...
3. **监控与分析**:利用阿里云日志服务 SLS 和应用性能管理 APM 收集和分析监控数据,为后续决策提供依据。 4. **自动扩缩容**:借助 alibaba-cloud-metrics-adapter 等工具,将外部监控数据接入到 Kubernetes 自动...
《阿里云专有云企业版 V3.9.0 容器服务Kubernetes版 用户指南》是针对阿里云Kubernetes服务的一份详细文档,旨在帮助用户理解和使用这一服务。此文档适用于V3.9.0版本,日期为20191017。以下是对其中关键知识点的...
**阿里云容器服务**是一种基于Kubernetes的企业级容器管理平台,能够提供高度自动化、安全可靠的容器环境管理和运维能力。通过阿里云容器服务,企业能够轻松部署、管理和扩展容器化应用程序。 **应用高可用服务(A...
一、阿里云开源书合集 2020微服务领域开源数字化报告 阿里巴巴云原生技术与实践13讲 阿里巴巴云原生实践15讲 不一样的双11技术:阿里巴巴经济体云原生实践 深入浅出Kubernetes 云原生架构白皮书 Knative云原生应用...
阿里云专有云企业版V3.9.0的容器服务Kubernetes版是为企业级用户设计的一款基于Kubernetes的云原生平台。该版本的技术白皮书详细介绍了该服务的功能、特性和使用方法,旨在帮助用户更好地理解和部署Kubernetes集群,...
- **监控与日志**:集成阿里云监控和日志服务,实时监控容器和集群的健康状况,便于问题诊断。 5. **法律条款**:用户需遵守阿里云的使用协议,包括但不限于保密义务、禁止未经授权的传播和复制文档内容,以及对...
总之,阿里云专有云企业版V3.6.2的容器服务开发指南是开发者和运维团队的宝贵资源,它详细阐述了如何有效地利用阿里云的容器服务来构建、运行和管理分布式应用程序,同时强调了法律约束和操作规范,确保了服务的合规...
阿里云专有云企业版V3.8.2的容器服务Kubernetes版是一款针对企业级用户的高级容器管理服务,它基于Kubernetes,为企业提供了一站式的容器化应用生命周期管理解决方案。这款产品旨在简化云环境中Kubernetes集群的部署...
- **阿里云ACK (Alibaba Cloud Container Service for Kubernetes)**:阿里云的托管Kubernetes服务,提供了无缝集成阿里云服务的能力。 - **AWS EKS (Elastic Kubernetes Service)**:AWS 的Kubernetes托管服务,...