`
文章列表
服务概述 服务(常称作后台进程)是后台运行的的特殊程序,它们常常是非交互性的(没有控制台)。它可以用于各种用途:管理硬件,网络连接,监测,日志等等。几乎所有的操作系统都通过服务来运行一些自动化的任务。 rc 脚本负责启动用户需要的所有服务。就像名字所描述的一样,所谓服务就是系统提供的有用的工具。可能会有很多服务需要启动。大部分的 Linux 系统会启动 sshd(安全Shell服务)、syslog(系统日志工具)和 lpd(打印服务),但还会有更多的服务需要启动。过多的服务会增加开机的时间,优化关闭不需要的服务将会提高启动时间。 运行级别 运行级别(r ...
Watchdog概述 在日常使用heartbeat接管资源的应用中,由于heartbeat无法对操作系统自身出现的问题进行监控。如果主节点操作系统挂起,一方面可能导致服务中断,另一方面由于主节点资源无法释放,而备份节点却接管了主节点的资源,此时就发生了两个节点同时争用一个资源的状况。 针对这个问题,就需要在Linux内核中启用一个叫watchdog的模块。watchdog是一个Linux内核模块,它通过定时向/dev/watchdog设备文件执行写操作,从而确定系统是否正常运行。如果watchdog认为内核挂起,就会重新启动系统,进而释放节点资源。 watchdog代码也支持用 ...
前言 前一阵,在为广发银行搭建HA集群时,客户总希望在出现脑裂问题后能很好的解决。当时由于没有深刻的理解heartbeat的各个模块,crm、ccm、ipfail各个插件试试得我是晕头转向的,最后的解决方式是加了两根心跳线。说白 ...
日志是我们跟踪系统和应用程序最好的方式,在Heartbeat中日志可以自定义输出位置,只需在ha.cf文件配置即可,具体可参见笔者的 http://czmmiao.iteye.com/blog/1174010 下面跟着笔者我们来看详细看下Heartbeat的日志启动主机Heartbeat服务 #/etc/init.d/heartbeat start Heartbeat启动时,通过"tail -f /var/log/ messages"查看主节点系统日志信息,输出如下:# tail -f /var/log/messages      Nov 2 ...
安装Heartbeat前的准备 Heartbeat集群必须的硬件 从下图看出,构建一个Heartbeat集群系统必须的硬件设备有: 节点服务器; 网络和网卡; 共享磁盘。 节点服务器 安装Heartbeat至少需要两台主机,并且对主机的要求不高,普 ...
Heartbeat 概述 Heartbeat 是 Linux-HA 工程的一个组件, 1999 年开始到现在,发布了众多版本,是目前开源 Linux-HA 项目最成功的一个例子,在行业内得到了广泛的应用。随着 Linux在关键行业应用的逐渐增多,它必将提供一些原来由 IBM 和 SUN 这样的大型商业公司所提供的服务,这些商业公司所提供的服务都有一个关键特性,就是高可用集群。 高可用集群是指一组通过硬件和软件连接起来的独立计算机,它们在用户面前表现为一个单一系统,在这样的一组计算机系统内部的一个或者多个节点停止工作,服务会从故障节点切换到正常工作的节点上运行,不会引起服务中断。从这个 ...
作为一个DBA,对操作系统及底层硬件的了解也许不是那么至关重要,但是越好的了解数据库所运行的环境就能越好的了解数据库。这里笔者简单介绍下LPAR与DLPAR 为什么服务器需要分区 近来,UNIX服务器的分区技术成为一个热点。分区技术在某些应用领域的确能带来实际的好处,但也不能一概而论。这些年分区技术的作用有被逐渐夸大的趋势,在有些时候还被描述成无所不能的技术,目前主流的分区技术可以分为物理分区、逻辑分区和动态逻辑分区。 分区的优点 服务器集中 服务器的集中管理和应用模式的集中可以减少总拥有成本(TCO)。这是目前的一个趋势。这种集中式的应用模式加上服务器的分区管理为客户提供 ...
前阵子生产库上发生了一次ora-00600错误,这里简要记录分析下,如有错误,希望大家给以建议。 报错信息 ORA-00600: internal error code, arguments: [kcblasm_1], [103], [], [], [], [], [], [] 查看告警日志有如下信息 Mon Aug 29 16:46:08 GMT+08:00 2011Errors in file /oracle10g/app/oracle/admin/zgscdb/bdump/ zgscdb2_j003_14024898.trc: ORA-00600: intern ...
本文主要是通过一次对AIX服务器的硬件故障排查过程来引进一个故障排查的思路,希望大家拍砖。 # errpt IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION BFE4C025   0416192308 P H sysplanar0     UNDETERMINED ERROR # errpt -aj BFE4C025 --------------------------------------------------------------------------- LABEL:          SCAN_ERROR_ ...
经过笔者使用发现OOO相比于Office实在还是很有差距,在这里笔者推荐Libreoffice作为Linux底下的办公处理软件 系统要求 Linux 内核版本 2.6.18 或更高; glibc2 版本 2.5 或更高; gtk 版本 2.10.4 或更高; 兼容 Pentium 的 PC(推荐 Pentium III 或 Athlon); 256 MB RAM(推荐 512 MB RAM); 高达 1.55 GB 的可用硬盘空间; 至少 256 色的 1024x768 分辨率 (建议更高) 的 X Server; Gnome 2.16 或更高,需要 gail 1. ...
HBA概述 主机总线适配器(Host Bus Adapter,HBA)是一个在服务器和存储装置 间提供输入/输出(I/O)处理和物理连接的电路板和/或集成电路适配器。因为HBA减轻了主处理器在数据存储和检索任务的负担,它能够提高服务器的性能。一个HBA和与之相连的磁盘子系统有时一起被称作一个磁盘通道。 HBA的常规定义:就是连接主机I/O总线和计算机内存系统的I/O适配器。按照这个定义,像显卡就是连接视频总线和内存,网卡就是连接网络 总线和内存,SCSI-FC卡就是连接SCSI或者FC总线和内存的,它们都应该算是HBA。HBA卡有FC-HBA和iSCSI HBA将来还有其 ...
LUN概述 LUN的全称是Logical Unit Number,也就是逻辑单元号,是SCSI中的概念。 我们用Target ID(也有称为SCSI ID的)来描述这些设备,设备只要一加入系统,就有一个代号,我们在区别设备的时候,只要说几号几号就ok了。 早期 ...
vmstat概述 vmstat 命令报告关于内核线程、虚拟内存、磁盘、陷阱和 CPU 活动的统计信息。由 vmstat 命令生成的报告可以用于平衡系统负载活动。系统范围内的这些统计信息(所有的处理器中)都计算出以百分比表示的平均值,或者计算其总和。 Interval 参数指定每个报告之间的时间量(以秒计)。第一个报告包含系统启动后时间的统计信息。后续报告包含自从前一个报告起的时间间隔过程中所收集的统计信息。如果没有指定 Interval 参数,vmstat 命令生成单个报告然后退出。Count 参数只能和 Interval 参数 ...
sar概述 sar 命令将 操作系统中选定的累计活动计数器的内容写到标准输出。基于 Number 和 Interval 参数的值,记帐系统以指定的时间间隔(以秒为单位)和指定间隔次数写入信息。Number 参数的缺省采样时间间隔为 1 秒。收集的数据也可以保存在由 -o File 标志所指定的文件中。   计算等待磁盘 I/O 所花费 CPU 时间(wio 时间)百分比的方法的改进。 在 AIX 4.3.2 及早期操作系统版本中采用的方法在某些情况下会在 SMP 上显示出夸大的 wio 时间。wio 时间是由 sar(%wio)命令 ...
topas概述 topas 命令报告选定的本地系统活动的统计信息。该命令使用 curses 库以合适的格式来显示其输出,该格式适合于在一个 80x25 基于字符的显示器上或至少同样大小的图形显示器的窗口中进行查看。topas 命令需要在系统中安装 perfagent.tools 文件集。 如果 topas 命令调用时没有标志,则运行时正如用以下命令行来调用: topas -d20 -i2 -n20 -p20 -w20 -c20 程序按由 monitoring_interval_in_seconds 参数指定的时间间隔从系统抽取统计信息。缺省输出如下所示,包含两个固定部分和一个 ...
Global site tag (gtag.js) - Google Analytics