摘要: 业务实时监控服务 ARMS 很好的提供了这么一个入口,为公司提供了一个实时查询Tengine运行情况的解决方案。在未来,ARMS将很好的和ODPS为公司监控形成互补方案,tengine日志日后可同时投递到ARMS和MaxCompute中: ARMS响应第一时间的多维度报警; MaxCompute来做深层次分析,例如接口的请求数、响应时长等,并有针对性地进行调优。
来自 深圳市小亿网络有限公司 王昕岩
最近公司通过业务实时监控服务 ARMS 成功搭建了基于tengine的日志监控系统。这里简单分享一下使用ARMS用于监控tengine日志的经验。
公司发展至今,现阶段所有接口都使用阿里的tengine作为web容器,类似nginx,在日志中也记录了包括host, url, ip, 包体大小,响应时长等信息。目前的业务需求场景是希望有一套系统来监控接口的异常,来及时发现系统的异常,并能具体到哪些项目、哪些服务器、甚至哪些URL出现异常,提高分析问题和解决问题的速度。
tengine日志分布到不同服务器上,首先使用日志服务来分别收集这些日志。再以logHub作为日志源,来进行监控。想到使用ARMS的其中一个最重要原因是因为我们系统tengine的日志格式有一定的定制,需要有一个端到端监控产品提供的定制化特别强的数据清洗功能,以及聚合计算+报警功能。
这里详细介绍一下ARMS吊炸天的日志切分功能。
第一步,一个开始节点;
第二步,LogHub数据源过来默认是JSON格式,进行JSON解析,如下图:
注意日期类型的时间格式,尤其是“小时”部分,默认格式是hh(12小时),需要改为HH(24小时)。
第三步,清洗,过滤掉这里不需要监控的host,如下图:
通过函数,过滤掉不以指定域名结尾的host。
第四步,解析URL。使用“单分隔符切分器”,将request字段按照空格切分,分别获取调用方式(GET/POST)、完整URL、协议版本。
第五步,区分错误码。这里主要是为了区分,返回码是代表正常、还是错误。这里只对错误的返回码进行监控。下图的例子是,返回码是4xx或5xx的表示错误,其他表示正常。新增字段is_error表示是否是“错误码”,赋值1或0表示是或否。
第六步,配置服务器IP和服务器名称的对应关系。配置了一个映射表如下:
注意,这里一定要配置一个127.0.0.1的k-v关系,否则日志切分预览的时候会看不到这个“服务器名称”字段。
最后,再简化一下host,把域名的后缀去掉,只保留前缀。
至此,日志切分全部结束。点击“日志切分预览”,即可查看切分效果。点击保存,下一步。
配置数据集,例如要监控接口的访问次数,使用count(_line);要监控平均包体大小,使用sum(包体大小)÷count(_line);要监控平均响应时长,使用sum(响应时长)÷count(_line)。维度根据需要配置,此处配置为先服务器,后接口域名。
至此配置全部结束,点击保存,完成配置。即可启动任务了。以上为简单示例。
这边展示我制作的其中几项监控的大盘。
请求数效果图:
响应时长效果图:
包体大小效果图:
错误码个数效果图:
运维人员通过对几个图表的观察分析,可以很快得出一些异常情况发生的原因,并及时处理掉。
一个年轻的互联网公司,需要不断的成长。系统也一样,需要不断的提升、优化。业务实时监控服务 ARMS 很好的提供了这么一个入口,为公司提供了一个实时查询Tengine运行情况的解决方案。在未来,ARMS将很好的和ODPS为公司监控形成互补方案,tengine日志日后可同时投递到ARMS和MaxCompute中: ARMS响应第一时间的多维度报警; MaxCompute来做深层次分析,例如接口的请求数、响应时长等,并有针对性地进行调优。
业务实时监控ARMS正在公测
了解全部阿里云互联网中间件产品和使用场景
原文链接:http://click.aliyun.com/m/28209/
相关推荐
Tengine 用户使用手册 Tengine是一款轻量级模块化高性能的神经网络推理引擎,专门针对Arm嵌入式设备优化,支持Arm Cortex CPU、Arm Mali GPU、Arm DLA以及第三方DSP。开发者可以使用Tengine在主流框架模型和嵌入式...
4. **配置文件**:Tengine的配置文件一般为`nginx.conf`,包含了服务器的各种设置,如监听端口、虚拟主机、日志配置、路由规则等。用户可以根据需求修改此文件。 5. **命令行工具**:Tengine提供了一些命令行工具,...
2. 访问统计:Tengine内置了访问统计功能,可以实时监控网站的访问情况,包括访问次数、访问速度、用户来源等,有助于网站性能分析和优化。 3. URL重写:通过配置规则,Tengine可以实现URL的重写,这对于SEO(搜索...
为了确保Tengine的稳定运行,需要定期检查日志,监控性能指标,例如CPU使用率、内存占用、网络带宽等。可以使用工具如Nginx的status模块、Prometheus、Grafana等进行监控。 总结,Tengine是Nginx的一个强大分支,...
安装和使用Tengine通常包括编译源码、配置参数、安装软件以及编写和应用配置文件等步骤。通过阅读官方文档和示例,开发者可以了解如何充分利用Tengine的各项功能,以满足自己的业务需求。 总的来说,Tengine 2.2.0...
Nginx和Tengine使用pcre进行URL匹配和重写规则,允许更复杂和灵活的路由配置。 3. **openssl-1.0.2g**: OpenSSL是一个强大的安全套接层(SSL)和传输层安全(TLS)协议实现库。在Tengine中,OpenSSL用于处理HTTPS...
在实际应用中,Tengine网关的使用可以带来多方面的优势,包括但不限于负载均衡、服务化处理、分布式存储以及统一网关架构。 在讨论Tengine网关的最佳实践时,我们首先要了解它的核心功能和优势: 1. 负载均衡:...
Tengine包含了一系列内置模块,如access_log模块用于记录访问日志,limit_conn模块限制并发连接数,还有url重写、缓存管理等模块,用户可以根据需求自由选择和配置。 5. **安全防护**: 提供了防止DDoS攻击的模块...
#运行用户 #user nobody; #启动进程,通常设置成和cpu的数量相等 worker_processes auto;...#全局错误日志及PID文件 #error_log logs/error.log; #error_log logs/error.log notice; #error_log logs/error.log info;
为了保持Tengine的良好运行,需要定期检查日志文件,监控性能指标,以及根据业务需求调整配置。此外,还可以利用Tengine的模块功能进行更复杂的任务,如限流、缓存控制等。 总结,Tengine作为一个强化版的Nginx,...
这个压缩包资料可能包含Tengine的配置示例、Lua脚本代码、GraphicsMagick的使用教程以及相关的说明文档,帮助开发者理解和实现这个功能。对于需要在服务器端处理图片的项目来说,这是一个非常实用的技术方案,可以...
7. **日志管理和监控**:Tengine可能会提供更灵活的日志格式和统计工具,帮助管理员更好地监控服务器状态,及时发现并解决问题。 8. **模块热更新**:Tengine支持模块的热更新,无需重启服务器即可实现配置的变更,...
6. **监控与管理**:Tengine提供了丰富的命令行工具,如`nginx -s reload`用于热更新配置,`nginx -s stop`用于平滑停止服务等。 总的来说,Tengine作为Nginx的增强版,不仅继承了其优秀特性,还额外提供了许多针对...
编译好的文件 ---- ------------- ------ ---- -a---- 2022/8/25 下午 08:06 416256 tm_alphapose.exe -a---- 2022/8/25 下午 08:06 388096 tm_apollo_smoke.exe -a---- 2022/8/25 下午 08:06 304640 tm_...
在 Cygwin 下编译 Tengine 可能涉及到解决依赖问题、配置环境以及解决与 Windows 系统交互的兼容性问题。经过了编译和测试,这个版本已经被确认在 Windows 平台上可以正常运行。 标签 "tengine-2.3.2 nginx cygwin...
6. **日志管理**:Tengine提供了更精细的日志记录和分析功能,便于运维人员监控和分析服务器运行状态。 7. **故障恢复**:Tengine具备自动故障检测和恢复机制,当主服务器出现问题时,能快速切换到备份服务器,保证...
Tengine是由淘宝发起的Web服务器项目。它在Nginx的基础上,针对大访问量网站的需求,添加了很多高级功能和特性。Tengine的性能和稳定性已经在大型的网站如淘宝,天猫,优酷,全球速卖通,Lazada,阿里云等得到了很好...
3. **日志查看**:日志文件一般在`/var/log/nginx`目录下,可用于监控和调试。 4. **更新升级**:如果需要升级到新版本,可以重复上述制作和安装过程,但需注意备份现有配置和数据。 综上所述,基于Tengine-2.3.3的...