通常我们在进行服务器的健康性检查,和在出现问题的时候都会去考虑查看系统的日志。
我在学习aix的过程中发现,aix的日志跟solaris或linux的日志存储和查看的方式有着相当大的区别,为了使自己对aix的日志认识的更系统就总结了一下。
相当一部分是参考的 于宁斌《AIX 5L系统管理技术》
1.一旦系统的某个功能模块检测到一个错误或定义的需要记录日志的事件,则记录到/dev/error设备,把它保存在NVRAM中,这样可以保证即使在系统崩溃的情况下也不会丢失最新的错误日志。
2.同时,错误日志进程errdemon从/dev/error文件中读取错误日志,然后根据错误模版库(/var/adm/ras/errtmpit)和错误消息库(/usr/lib/nls/msg/$LANGcodepoint.cat) 对其进行处理后写入系统的错误日志/var/adm/ras/errlog中。
错误日志进程由/usr/lib/errdemon命令启动,/usr/lib/errstop停止,默认是启动的。
以上并不是重点,了解过程而已
errdemon进程:
从/dev/error逻辑设备文件中读取纪录,然后在系统错误日志中创建错误日志纪录,显然这才是重点。
Errdemon的配置:
/usr/lib/errdemon 命令可以启动errdemon进程,同样我们也可以通过使用参数来修改我们的errdemon,显然如果我们不是太了解还是系统初始的配置更适合我们!
例如:
/usr/lib/errdemon –s 20000 设定我们的日志文件大小为20000bytes
最可能用到的可能就是-l参数了
/usr/lib/errdemon –l
# /usr/lib/errdemon -l
Error Log Attributes
--------------------------------------------
Log File /var/adm/ras/errlog
Log Size 1048576 bytes
Memory Buffer Size 16384 bytes
Duplicate Removal true
Duplicate Interval 100 milliseconds
Duplicate Error Maximum 1000
上面显示我的错误日志文件是/var/adm/ras/errlog,这也是系统默认的错误日志的存放位置。
具体其他的参数可以参看man 手册。
查看错误日志:errpt命令
用more或者其他文本的查看命令来打开errlog文件我们看到的只是一对乱码,为了能够查看错误日志文件需要使用aix的errpt命令。
使用errpt命令查看日志,可能根据使用的参数来确定输出什么样的日志,甚至排序的方式,这是使用纯文本的日志不能做到的,或者说不能轻易做到的。
下面我们来看errpt命令的使用。
# errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
9DBCFDEE 0109034400 T O errdemon ERROR LOGGING TURNED ON
192AC071 0109034300 T O errdemon ERROR LOGGING TURNED OFF
C092AFE4 0109033500 I O ctcasd ctcasd Daemon Started
A6DF45AA 0109033500 I O RMCdaemon The daemon is started.
9DBCFDEE 0109033400 T O errdemon ERROR LOGGING TURNED ON
192AC071 0106130900 T O errdemon ERROR LOGGING TURNED OFF
369D049B 0106082400 I O SYSPFS UNABLE TO ALLOCATE SPACE IN FILE SYSTE
这里的输出分为六列依次为:
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。
2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。
3.类型TYPE:错误的类型,或者说严重的程度。
分为6个:
PEND 设备或功能组件可能丢失 简写P
PERF 性能严重下降 P
PERM 硬件设备或软件模块损坏,确诊了的 P
TEMP 临时性错误,经过重试后已经恢复正常 T
INFO 一般消息,不是错误 I
UNKN 不能确定错误的严重性 U
4.种类CLASS c:指出错误源
H 硬件或介质故障
S 软件故障
O 人为错误
U 不能确定
5. 资源名RESOURCE_NAME
最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。
6.描述
显示详细的日志信息
# errpt -a|more
Standard input
---------------------------------------------------------------------------
Standard input
LABEL: ERRLOG_ON
IDENTIFIER: 9DBCFDEE
Date/Time: Sun Jan 9 03:44:04 BEIS
Sequence Number: 309
Machine Id: 004250B94C00
Node Id: ibm-5L
Class: O
Type: TEMP
Resource Name: errdemon
Description
ERROR LOGGING TURNED ON
Probable Causes
ERRDEMON STARTED AUTOMATICALLY
User Causes
/USR/LIB/ERRDEMON COMMAND
Recommended Actions
NONE
其它
指定日志文件 –I可以用来查看一个非errdemon指定位置的日志文件,例如某个日志文件备份。
-t 参数,只显示-t参数指定的错误类型TYPE。
-s 显示指定时间之后的日志文件.
-d 指定种类CLASS.
详细的参数只能看man 手册了
# errpt -a -j 74533D1A
# errpt -s 0108100100
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
9DBCFDEE 0109034400 T O errdemon ERROR LOGGING TURNED ON
192AC071 0109034300 T O errdemon ERROR LOGGING TURNED OFF
C092AFE4 0109033500 I O ctcasd ctcasd Daemon Started
A6DF45AA 0109033500 I O RMCdaemon The daemon is started.
9DBCFDEE 0109033400 T O errdemon ERROR LOGGING TURNED ON
日志的清理
errclear命令可以用来清理错误日志
并且默认情况下cron会每天清理错误日志
# crontab -l
0 11 * * * /usr/bin/errclear -d S,O 30
0 12 * * * /usr/bin/errclear -d H 90
0 15 * * * /usr/lib/ras/dumpcheck >;/dev/null 2>;&1
显然,找上面的例子,S,O 类的错误会保留30天,而H的错误会保留90天
errclear 0 删除多有记录
errclear 7 删除7天以前的记录
smit errclear
syslogd
unix普遍用到的日志系统,配置文件/etc/syslog.conf
没有什么多说的,比较普遍,定义的话是修改syslog.conf,保存的日志为文本格式
syslog.conf配置文件格式
信息类别.错误等级 记录的位置
其中,各项的含义
信息类别
auth used by authorization systems (login)
cron used for the cron and at systems
daemon system/netword daemon
kern produced by kernel messages
lpr printing system
mail mail system
mark internally used for time stamps
news reserved for the news system
user default facility, used for any program
uucp reserved for the uucp system
错误等级
debug normally used for debugging
info informational messages
notice conditions that may require attention
Warning any warnings
err any errors
crit critical conditions like hardware problems
Alert any condition that demand immediate attention
emerg any emergency condition
none Do not send messages from the indicated f
acility to the selected file.
记录的位置
可以是本地的文件(包括设备文件如/dev/console)或远程syslog日志服务器。
假如我要记录cron的所有错误信息,则可以在/etc/syslog.conf加入下面一行
cron.err /var/cronerr.log
定义记录cron的err信息到/var/cronerr.log文件
具体syslog的具体配置,网上遍地都是。
分享到:
相关推荐
AIX 操作系统错误日志及日常维护 AIX 操作系统错误日志是系统管理员维护和排除系统故障的重要工具。系统错误日志记录了系统的各种故障信息,包括硬件、软件和其他操作信息。 一、系统故障记录 (errorlog) error...
#### 一、AIX日志系统概述 AIX(Advanced Interactive Executive)是由IBM开发的一种基于Unix的操作系统,广泛应用于各种IBM小型机和其他兼容平台。AIX的日志系统对于系统管理员来说至关重要,因为它可以帮助诊断...
总的来说,AIX日志管理涉及到对系统资源的实时监控和历史数据分析,通过使用如`vmstat`、`sar`、`ps`、`svmon`和`iostat`等命令,系统管理员能够全面了解系统状态,优化资源分配,预防潜在的问题,从而提高系统的...
### AIX系统errpt日志分析方法 #### 一、概述 在AIX系统中,errpt 是一个非常重要的工具,用于查看系统错误日志。这些日志包含了系统运行过程中出现的各种异常信息,对于系统管理员来说是排查问题的重要依据。本篇...
总结起来,AIX日志收集涉及对日志数据的安全处理,如使用HMAC进行数据完整性检查,以及对系统资源的监控。通过理解这些基本操作,管理员可以更有效地维护AIX系统的健康状态,确保数据的安全性和完整性。同时,定期...
在AIX系统中管理Oracle数据库时,归档日志的清理是一个重要的维护任务,它涉及到数据库的安全性、性能以及磁盘空间的有效利用。归档日志是Oracle数据库在归档模式下运行时产生的,用于记录数据库事务的完整历史,...
- **错误日志检查**:使用`errpt | more`查看系统错误日志,`Errclear 0`清除日志。 - **系统时间校验**:通过`last`命令检查系统时间是否正确同步。 - **核心转储文件**:使用`find / -name core -print`查找并定期...
2. **文件系统管理**:AIX支持多种文件系统,如JFS(Journaling File System)、JFS2(第二代日志文件系统)和NFS(网络文件系统)。理解这些文件系统的特性和管理方法,包括挂载、卸载、空间分配、文件权限和日志...
3. JFS(Journal File System):日志文件系统提供了一种增强的数据保护机制,通过日志记录文件系统的更改,确保在系统崩溃或异常关机后能够快速恢复数据一致性。 AIX操作系统的启动过程分为多个阶段。首先,ROM...
AIX系统日常管理是系统管理员的基本任务,包括系统监控、日志记录、系统备份和恢复、系统更新等。AIX系统管理员需要了解系统的运行状态,监控系统的性能,记录系统的日志,备份重要数据,恢复系统等。 AIX版本号...
中国移动AIX操作系统安全配置规范对AIX操作系统的安全配置提出了明确的要求,涵盖了账号管理、认证授权、日志配置、IP协议安全配置等多个方面。这些要求旨在确保AIX操作系统的安全性和稳定性,为中国移动集团的业务...
其中,JFS是一个日志文件系统,它通过记录文件系统的更改来确保数据的一致性和可靠性。JFS的结构包括以下几个关键部分: 1. 超级块:存储文件系统的基本信息,如文件系统的大小、状态和分配策略。 2. inode:每个...
AIX的系统日志包括“syslog”、“errorlog”等,通过分析日志信息,可以快速定位并解决问题。 ### 高可用集群建设 高可用集群是指由多台计算机组成的集群系统,能够提供无间断的服务,即使其中一台或多台机器出现...
**AIX操作系统培训手册** AIX(Advanced Interactive eXecutive)是IBM开发的一种高性能、稳定且安全的Unix操作系统,广泛应用于大型机和Power Systems服务器上。本手册将深入探讨AIX的操作系统安装、使用以及日常...
AIX(Advanced Interactive eXecutive)是IBM开发的一款基于UNIX的高级操作系统,主要用于IBM的Power Systems服务器。这款操作系统以其稳定性和安全性著称,广泛应用于企业级服务、数据库管理、高性能计算等领域。本...
《AIX操作系统手册》是专为学习和管理IBM的AIX操作系统而编写的详细指南。AIX,全称Advanced Interactive eXecutive,是IBM基于UNIX系统的一种强大且可靠的服务器操作系统,广泛应用于企业级服务器环境。本手册的...
AIX使用JFS2(Journaling File System 2)作为其主要文件系统,支持日志记录,提高数据一致性。磁盘管理涉及LVM(Logical Volume Manager),允许动态调整卷大小,创建RAID配置,以及进行故障恢复。 ### 3. 用户与...
- **故障排查**:当遇到系统问题时,可以通过查看系统日志、使用调试工具等方式进行故障排查,从而快速定位问题根源并采取相应的解决措施。 #### 五、AIX系统与其他系统的互操作性 - **与Windows系统的集成**:AIX...
JFS(Journal File System)日志文件系统则增强了文件系统的稳定性和可靠性,通过日志记录文件系统的修改,提高数据安全性。 AIX的启动过程相当复杂,涉及多个阶段。首先,ROM进行初始化和自检,然后装载引导块...
- JFS:日志文件系统,引入了数据库的事务处理机制,提高了文件系统的可靠性和性能。 5. **AIX的引导过程**: - 系统从ROM开始启动,进行自我检测(POST),然后加载引导块(IPL)到内存中,接着启动内核、配置...