linux 运维手册
中信国际系统巡检表
报告周期: 报告提供: 提交人员: 提交时间:
文档版本页
修改记录
1. 填报信息
事件等级划分附录:
2. 事件管理
2.1. 待处理事件记录
2.2. 本日事件记录
3. 操作日志
4. 巡视、维护内容
4.1. LINUX 操作系统
5.1.1 系统信息检查
查看命令及结果:
1. 用uname –a 来查看操作系统版本
2. 用hostname 查看主机名
3. 主机网络配置:ifconfig –a
4. 用date 查看主机日期时间
5. 用java –version 查看java 版本
5.1.2 性能检查
查看命令及结果:
1. 用top 查看CPU 占用率、内存使用率、内存交换区使用率、进程占用的资源等信息。
2. 用df –h 查看文件系统占用率
3. 用uptime 查看CPU 负载情况
4. 系统I/O情况:
iostat 1 3
备注:
avg-cpu 段:
%user: 在用户级别运行所使用的CPU 的百分比 %nice:优先进程消耗的CPU 时间,占所有CPU 的百分比 %system: 在系统级别(kernel)运行所使用CPU 的百分比 %iowait: CPU等待硬件I/O时, 所占用CPU 百分比
%steal: 管理程序维护另一个虚拟处理器时,虚拟CPU 的无意识等待时间百分比 %idle: CPU空闲时间的百分比 Device 段:
tps: 每秒钟发送到的I/O请求数 Blk_read /s: 每秒读取的block 数 Blk_wrtn/s: 每秒写入的block 数 Blk_read: 启动到现在 读入的block 总数
Blk_wrtn: 启动到现在写入的block 总数
5、系统资源使用情况:vmstat [root@train ~]# vmstat
vmstat 110 (每隔1秒刷新一次, 刷新10次)
备注:
r: 等待运行的进程数 b: 处在非中断睡眠状态的进程数 si: 从磁盘交换到内存的交换页数量,单位:KB/秒 so: 从内存交换到磁盘的交换页数量,单位:KB/秒 bi: 发送到块设备的块数,单位:块/秒 bo: 从块设备接收到的块数,单位:块/秒
一般情况下:r ,b 基本情况下为0,如果fre ,将会出现连续不断的页面调度,将导致系统性能问题。对于page 列,re ,pi ,po ,cy 维持于比较稳定的状态,PI 率不超过5。在内存相对紧张的环境下pagein 会强制对不同的页面进行steal 操作。如果系统正在读一个大批的永久页面,你也许可以看到po 和pi 列会出现不一致的增长,这种情景并不一定表明系统负载过重,但是有必要对应用程序的数据访问模式进行见检查。
在稳定的情况下,扫描率和重置率几乎相等,在多个进程处理使用不同的页面的情况下,页面
会更加不稳定和杂乱,这时扫描率可能会比重置率高出。faults 列sy ,cs 会不断跳跃,这里没有明确的限制,唯一的就是这些值最少大于100。
5.1.3 安全检查
查看命令及结果:
1. 用who 查看当前登录用户
2. 用less /var/log/boot.log查看系统重启情况
3. 用less /var/log/messages查看系统日志
4. 系统账户检查more /etc/passwd、more /etc/shadow
5. 系统登录情况检查的命令是lastlog ,信息保存在文件 /var/log/lastlog中
6. 系统运行时间:uptime
5.1.4 硬件信息
查看命令及结果:
1. 用dmidecode 查看硬件信息
2. 用dmesg 查看硬件启动信息