linux下通过脚本监控程序运行,JoeyChou

linux下通过脚本监控程序运行

应用程序运行过程中,任何人都无法保证它永远不死定,因此自动重启就十分必要。以下是自动重启的shell脚本实现方法,shell脚本来自网络。 

假定需要实现重启的程序名为 test ,我们这里通过判断进程数目来判断程序是否正常。 ps -ef | grep “1"|grep?v"grep"|wc–l其中的1"|grep?v"grep"|wc–l其中的1 是要监控的进程名称(本例中为 test的进程 ),这个命令将返回该进程的进程个数。脚本根据进程数来决定下一步的操作。

通过一个死循环,每隔 1 秒检查一次系统中的指定程序的进程数。 代码如下:


#!/bin/sh

#------------------------------------------------------------------------------
# 函数: CheckProcess
# 功能: 检查一个进程是否存在
# 参数: $1 --- 要检查的进程名称
# 返回: 如果存在返回0, 否则返回1.
#------------------------------------------------------------------------------
CheckProcess()
{
  # 检查输入的参数是否有效
  if [ "$1" = "" ];
  then
    return 1
  fi

  #$PROCESS_NUM获取指定进程名的数目,为1返回0,表示正常,不为1返回1,表示有错误,需要重新启动
  PROCESS_NUM=`ps -ef | grep "$1" | grep -v "grep" | wc -l` 
  if [ $PROCESS_NUM -eq 1 ];
  then
    return 0
  else
    return 1
  fi
}

# 检查test实例是否已经存在
while [ 1 ] ; do
 CheckProcess "test"
 CheckQQ_RET=$?
 if [ $CheckQQ_RET -eq 1 ];
 then

# 杀死所有test进程,可换任意你需要执行的操作


  killall -9 test
  exec ./test &  
 fi
 sleep 1
done


总结

1、比如进程名叫aaa,可以执行如下命令:ps -ef|grep aaa,如果有内容说明活着。

2、如果你知道进程占用的端口号,比如7777,可以执行:netstat -anp | grep 7777,检查有没有程序占用该端口,若有的话,看pid或pname是否是你想要找的。

3、如果想要找的是某个服务,比如nfs、smb等,可以用service nfs status查看。