`
gaozhonghui
  • 浏览: 241897 次
  • 性别: Icon_minigender_1
  • 来自: 内蒙古自治区
社区版块
存档分类
最新评论

Web服务自动监控shell _v2

阅读更多
在线上运行了一段时间发现有时候后台的进程没有down掉,但是web服务不能正常的解析jsp。把web服务重启后,一切恢复正常。

现在,把以前扫描端口的方式修改监控http请求返回的状态码来实现。

操作步骤:
具体实现参考 Web服务自动监控shell

#!/bin/sh
#####################################################
#desc:扫描后台服务器的应用服务器,若不能正常访问则重启
#author:gaozhonghui
#mail:gaozhh@cdeledu.com
#date:20121127
#######################################################
year=`date -d "today" +"%Y"`
monthday=`date -d "today" +"%m"`
date=$(date -d "today" +"%Y%m%d")

#被监控服务器、端口列表
#str = web服务文件夹:端口号
server_all_list=(
	'www.test.com^http://127.0.0.1:8050/portal'
)

#应用服务器基路径
serverBasePath="/web/webserver/jboss/"
#日志路径
logBasePath="/web/webserver/logs/$year/$monthday/"

function_getPID(){
   local PID=`ps -ef|grep $1|grep java |awk '{print $2}'`
   echo $PID
}

function_jstackinfo(){
 PID=`function_getPID $1`
 if [ x$PID != x"" ] ;then
    if [ ! -d ${logBasePath} ];then
       mkdir -p ${logBasePath}  	
    fi

    jstack -l ${PID} >> ${logBasePath}"jstack_$1_${date}.log"	
 fi
}

function_shutdown(){
  local shutdownSh=${serverBasePath}$1"/bin/shutdown.sh"
  if [ -f $shutdownSh ];then
        local PID=`function_getPID $1`

        if [ x$PID != x"" ] ;then
                sh $shutdownSh > /dev/null 2>&1
                sleep 2
        fi

        local PID2=`function_getPID $1`

        if [ x$PID2 != x"" ];then
                kill -9 $PID2
        fi
  fi	
}

function_startup(){
 local startupSh=${serverBasePath}$1"/bin/startup.sh"
 if [ -f $shutdownSh ];then
	sh $startupSh > /dev/null 2>&1
 fi
}


function_restart(){
  function_shutdown $1
  sleep 5
  function_startup $1
}


#获得http 状态码
function_getHttpCode(){
  local http_code=`curl -o /dev/null -s -m $1 --connect-timeout $1 -w %{http_code} $2`
  local first_http_code=${http_code:0:1}
  echo $first_http_code
}


for server in ${server_all_list[@]}; do
   server_ip=127.0.0.1
   server_name=$(echo ${server} | awk -F '^' '{print $1}')
   server_url=$(echo ${server} | awk -F '^' '{print $2}')   
   http_code_10s=`function_getHttpCode 10 $server_url`

   if [ "$http_code_10s" != "0" ] && [ "$http_code_10s" != "4" ] && [ "$http_code_10s" != "5" ];then
       #status:    0,http down    1,http ok    2,http down but ping ok 
       status=1
   else
       http_code_30s=`function_getHttpCode 30 $server_url`	
	
       if [ "$http_code_30s" != "0" ] && [ "$http_code_10s" != "4" ] && [ "$http_code_10s" != "5" ];then
           status=1
       else
           if ping -c 1 $server_ip > /dev/null 2>&1;then
               status=2
           else
               status=0
           fi
       fi
   fi
		
   #根据不同状态操作服务
   if [ x$status != x"1" ];then
	PID=`function_getPID  ${server_name}`
	
	if [ x$PID != x ];then
		function_jstackinfo  ${server_name}
		function_restart  ${server_name}
	else
		function_startup ${server_name}
	fi	
   fi
	
done


1
0
分享到:
评论
4 楼 gaozhonghui 2013-04-13  
freezingsky 写道
gaozhonghui 写道
freezingsky 写道
大概看了,应该就是类似于Tomcat运行一段时间后,当机了。这时候通过 http访问已经是无效的。于是需要一个监控,一旦无法正常连接,就让APP自动重启。是这个意思吧。。。

恩,是这么回事。

那你应该考虑的不是监控它是否运行的问题,而是应用服务器的问题,毕竟治标不治本。

这个主要监控应用服务器应用意外中断,无需人工干预。
记录当时dump 情况,我们可以分析日志,查找原因。

如应用服务中断时,需人工干预费时而且影响用户访问。
freezingsky 写道
gaozhonghui 写道
freezingsky 写道
大概看了,应该就是类似于Tomcat运行一段时间后,当机了。这时候通过 http访问已经是无效的。于是需要一个监控,一旦无法正常连接,就让APP自动重启。是这个意思吧。。。

恩,是这么回事。

那你应该考虑的不是监控它是否运行的问题,而是应用服务器的问题,毕竟治标不治本。


这个主要是监控应用服务器意外中断,可以无需人工干预可以马上恢复。
并且dump当时运行日志,方便查找原因。

如服务意外中断我们人工干预,即费时而且又影响用户的访问。

3 楼 freezingsky 2013-04-13  
gaozhonghui 写道
freezingsky 写道
大概看了,应该就是类似于Tomcat运行一段时间后,当机了。这时候通过 http访问已经是无效的。于是需要一个监控,一旦无法正常连接,就让APP自动重启。是这个意思吧。。。

恩,是这么回事。

那你应该考虑的不是监控它是否运行的问题,而是应用服务器的问题,毕竟治标不治本。
2 楼 gaozhonghui 2013-04-13  
freezingsky 写道
大概看了,应该就是类似于Tomcat运行一段时间后,当机了。这时候通过 http访问已经是无效的。于是需要一个监控,一旦无法正常连接,就让APP自动重启。是这个意思吧。。。

恩,是这么回事。
1 楼 freezingsky 2013-04-13  
大概看了,应该就是类似于Tomcat运行一段时间后,当机了。这时候通过 http访问已经是无效的。于是需要一个监控,一旦无法正常连接,就让APP自动重启。是这个意思吧。。。

相关推荐

    Alfa Shell v2.5.3_alfashell_V2_

    《Alfa Shell v2.5.3:网络安全的双刃剑——深度剖析 alfashell V2》 在当今数字化的世界中,网络安全成为了每个互联网用户关注的焦点。而Alfa Shell v2.5.3,一个名为"alfa shell spamming"的工具,引发了广泛的...

    华为HS8546VR017补全shell固件

    升级过程通常直接且简单,用户只需要将HS8546VR17补全shell固件.bin文件通过华为提供的升级工具或者设备的Web管理界面进行刷入。在升级前,确保备份当前配置,以防意外发生。同时,遵循正确的升级步骤至关重要,避免...

    hadoop2安装和常用shell命令

    3. **Web界面监控**: - 访问NameNode和ResourceManager的Web界面,例如: - NameNode: `http://192.168.6.239:50070` - ResourceManager: `http://192.168.6.239:8088` #### Hadoop集群维护 1. **SSH配置**: ...

    zabbix服务端安装配置_version3.2

    ./configure --prefix=/usr/local/nginx --with-http_v2_module \ --with-http_stub_status_module --with-http_ssl_module --with-pcre make && make install ``` 配置 Nginx,特别注意 PHP 的 FastCGI 配置。 ``...

    统计Nginx日志里前一个小时的IP数量以及IOS占比

    Nginx作为一款高性能的Web服务器,其日志记录了服务器与客户端交互的详细信息,这些信息对于监控、性能优化、安全分析等至关重要。本话题将围绕“统计Nginx日志里前一个小时的IP数量以及iOS占比”这一主题展开,讲解...

    Nginx源码编译安装.md

    ### Nginx源码编译安装详解 #### 一、前言 Nginx是一款高性能的HTTP和反向代理Web服务器,它以其出色的稳定性、丰富的功能集、简单的配置方式和低资源消耗而闻名。...这将有助于提高Web服务的安全性和性能。

    Zabbix4.0的中文用户手册

    - **应用程序状态监控:** 可以监控各种服务的状态,如数据库、Web服务等。 - **报警与通知机制:** 当监控指标超出预设阈值时,能够及时发送报警信息。 - **丰富的图表展示:** 提供多种图形化展示方式,帮助用户...

    Westermo 网络时间服务器LANTIME M600说明书.pdf

    例如,在金融服务、电信、能源、交通和工业自动化等对时间准确性要求极高的领域,LANTIME M600能够提供稳定且精确的时间信号。 此外,LANTIME M600具备高可用性和容错能力,支持自动故障切换和时间源的备份。服务器...

    深入挖掘Windows脚本技术.doc

    WBEM对象则提供了对Web-Based Enterprise Management(基于Web的企业管理)的支持,它与Windows Management Instrumentation(WMI)紧密关联,提供系统管理功能。 【WMI服务】 Windows Management Instrumentation...

    车联网业务安全浅析.pdf

    车联网是信息技术与交通运输领域的深度融合,它涉及到汽车、通信、交通等多个行业,为驾驶者提供了丰富的服务,如导航、娱乐、远程监控等。然而,随着技术的发展,车联网业务的安全问题日益凸显,这包括Web安全、...

    网络具体配置详解1

    交换机版本升级也类似,启用Web服务器服务(`enable service web-server`),使交换机能够接受Web管理,然后将PC机IP配置到与交换机同一网段,通过Web界面完成升级。 端口聚合(Port Aggregation或Link Aggregation...

    Westermo 网络时间服务器LANTIME M300说明书.pdf

    设备上的三个LED指示灯(绿/红)显示了三个主要组件的状态:参考时间(GPS)、时间同步服务(NTP)和网络(链路状态)。此外,还有一个标记为“ALARM”的红色LED,可以配置为在通知处理程序发现的任何事件时发出信号...

    常用端口列表[参照].pdf

    12. **ssh** (端口22):安全Shell服务,提供加密的远程登录和文件传输。 13. **telnet** (端口23):远程登录服务,允许用户访问远程主机。 14. **smtp** (端口25):简单邮件传输协议,用于发送电子邮件。 15. **...

    GAE中整合SSH2的空项目备份

    标题中的“GAE中整合SSH2的空项目备份”指的是在Google App Engine (GAE) 平台上集成Secure Shell (SSH) v2协议的一个空白项目,可能是为了实现远程管理和调试应用的功能。GAE是一个托管服务,它允许开发者部署Java...

    K2P-Padavan-Build:适用于K2&K2P的Auto Action Build Padavan固件

    在路由器固件中,Shell通常用于执行系统级操作,如配置网络设置、管理用户权限、监控系统状态等。用户可能需要一定的Linux基础来使用这类固件。 【文件名称解析】 "K2P-Padavan-Build-main" 这个文件名可能是固件的...

    RouterOS2.9.6.with.crack及配置动画

    l Telnet – telnet服务默认运行在23TCP端口 l SSH - SSH (安全shell) 服务默认运行在22 TCP端口 l MAC Telnet - MikroTik MAC Telnet协议被默认启用在所以类以太网卡接口上。 l Winbox – Winbox是RouterOS的一个...

    BROCADE交换机配置

    - **SSH v2**:安全Shell版本2,在FabricOS v4.1中可用。 ##### 2. GUI管理 - **Brocade Web Tool**:适用于小型SAN网络的简单管理工具,可通过支持JRE的Web浏览器访问。 - **Brocade Fabric Manager v4.0**:提供...

Global site tag (gtag.js) - Google Analytics