总体的机房管理制度目录
目录
一、机房总体管理制度 ........................................
资产管理制度(固定资产、流动资产)........................
配置管理制度............................................
安全管理制度............................................
日志报告管理制度(性能报告、故障报告)....................
二、机房分项管理制度........................................
日常操作管理制度.........................................
人员管理制度(职责、考核、培训、职业规划)...............
出入管理制度............................................
值班值守制度............................................
用电制度................................................
用水制度................................................
空调管理制度.............................................
三、应急管理制度.........................................
应急手册.................................................
故障处理手册.............................................
一、机房总体管理制度
1.1资产管理制度(固定资产、流动资产)
1. 机房的日常物品、设备、消耗品等必须有清晰的数量、型号登记记录,对于公共使用的物品
和重要设备,必须建立一套较为完善的借取和归还制度进行管理。
2. 工作人员应有义务安全和小心使用机房的任何设备、仪器等物品,在使用完毕后,应将物品
归还并存放于原处,不应随意摆放。
3. 对于使用过程中损坏、消耗、遗失的物品应汇报登记,并对责任人追究相关责任。
4. 未经主管领导同意,不允许向他人外借或提供机房设备和物品。
1.2 配置管理制度
1.2.1综合布线管理手册
综合布线管理系统(Premises Distributed System,简称PDS )是一种集成化通用传输系统,在楼宇和园区范围内,利用双绞线或光缆来传输信息,可以连接电话、计算机、会议电视和监视电视等设
备的结构化信息传输系统。综合布线管理系统的兼容性和灵活性注定需要大量维护工作来支撑。人员的流动性,日志的频繁改动,各种不同的笔迹,线缆的更换等等,这些变化都会对综合布线管理系统的维护带来很大的困难。如果管理不善,机房很快就会变成线缆的“盘丝洞”。
实时综合布线管理系统通过扫描仪对电子配线架进行扫描,实时监控每个端口的变化,通过主机将扫描仪信号进行整理,生成最终的电子表单,给用户一个实时而且直观的报告。实时布线系统通过使用计算机生成的工作单,可以简化移动、增加和改动过程。通过网络连接或通信间中综合布线管理系统支持的网络端口,可以在异地监测这些工作单的进展情况。网络管理员可以确定执行移动、增加和改动的顺序,因为这与有源设备和无源设备的物理布局息息相关。技术人员可以获得实时反馈,精确了解接插工作执行情况,检验所有连接是否正确,功能是否正常。
实时综合布线管理系统的基本原理很简单,它是利用了电路开关的原理,在配线架每个RJ-45端口上增加了一个金属感应垫(sensor pad ),跳线外部增加了一根金属针,这根金属针与配线架的感应垫相接触,配线架通过I/O电缆与网络分析器相连。网络分析器及软件可以实时、动态监视到配线架之间、网络设备与配线架之间的连接状态。在布线链路连通时接通检测开关,在布线链路断开时切断检测开关,综合布线管理系统通过对开关状态的检测来确定端口连接的状态。它由硬件和软件两大部分组成,硬件监测配线间中的连接情况,软件则记录整个网络中所有设备的文档资料。
硬件部分由扫描仪、配线架、跳线、连接电缆、扩展仪、主机、服务器等组成;软件部分则主要是专有的软件包。通过硬件和软件的紧密集成,协同工作,共同来实现对布线系统的综合管理。 用户可采用任何厂家的网络产品,不同的是该系统硬件与软件系统的结合弥补了以往集成网络管理系统中缺少的
物理层环节,是网络控制和归档管理的革命性方法,这种统一的基础设施管理系统可以在电信间或数据中心里自动生成网络系统完整的物理拓扑结构图,通过实时的物理层自动管理,提供一份实时、完整的网络故障诊断和灾难恢复文档资料,不间断地实时记录网络布线系统的增加、移动及删除。
实时综合布线管理系统是结构化布线文档和管理系统的最新发展,它的价值是独特的。因传统的布线管理主要有书面记录、电子表格或数据库管理软件等方法,这些方法的一个主要缺点就是管理人员的工作量大,所有的数据更新都需要管理人员手工操作。很多情况下,由于网络管理员没能及时更新数据,导致管理数据库中的数据失效,管理人员因此需要花费大量的时间和精力更新记录,给工作带来困难。但这些方法并不能实时查看网络连接状况。同样,尽管简单网络管理协议(SNMP )可以实时查看网络业务量,但只有通过综合布线管理系统(因为这是物理层管理),网络管理员才能全面查看通信间内完整的物理互连情况,而且是实时提供。换句话说,由于布线系统处于信息系统的最底层(物理层),而布线设备不具备综合通信功能,所以传统的网管软件无法对这一层次的设备进行直接管理,这就是实时综合布线管理系统区别网管软件的根本,也是其价值所在。
随着企业布线设施越来越复杂,布线系统的管理工作也变得耗时费力,综合布线管理系统可以降低中断时间、实现综合维护、避免手动文档编制等工作,使网络管理员从耗时长、又容易出现人为错误的工作中摆脱出来,大大节约了信息技术基础设施的管理成本。这正是实时综合布线管理系统的最大价值。
对布线系统的综合管理主要涉及信息的记录和更新、错误识别、配置变更以及出错报警等功能。具体来讲,自动检测和发现布线端口、自动检测端口之间的连接、了解端口的状态、记录跳线的连接事件、实时管理远端的布线系统、了解跳线的连接是否经授权、对触发事件做出反应、控制工作完成的顺序、
了解与布线系统连接的网络设备端口、记录所有跳线的改变并形成日志文件以及可以与网管系统进行互操作等成为了综合布线管理系统最主要的功能。
实时综合布线管理系统比较强大但是如果布线工程规模较小,可能就会得不偿失,因为实时综合布线管理系统适用于大型的布线工程,如果布线系统拥有大约500条以上水平连接就应该使用实时综合布线管理系统。
实时布线系统的安装问题是用户关心的。事实上,综合布线管理系统的物理安装并不比标准结构化布线系统复杂。它通常只安装某些电子装置,其过程并不是很麻烦,用户只需把这些电子装置放到机架中,然后把其连到来自水平配线架的传感器电缆和集线器端口传感器上就可以了。综合布线系统安装的真正技巧在于配置。这些系统依赖一个数据库提供连接信息,如果设置不当,其信息结果可能会不正确或发生误导。
1.3安全管理制度
1.3.1机房硬件设备安全使用制度
1、机房人员必须熟知机房内设备的基本安全操作和规则。
2、应定期检查、整理硬件物理连接线路,定期检查硬件运作状态(如设备指示灯、仪表),定期调阅硬件运作自检报告,从而及时了解硬件运作状态。
3、禁止随意搬动设备、随意在设备上进行安装、拆卸硬件、或随意更改设备连线、禁止随意进行硬件复位。
4、禁止在服务器上进行试验性质的配置操作,需要对服务器进行配置,应在其它可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
5、对会影响到全局的硬件设备的更改、调试等操作应预先发布通知,并且应有充分的时间、方案、人员准备,才能进行硬件设备的更改。
6、对重大设备配置的更改,必须首先形成方案文件,经过讨论确认可行后,由具备资格的技术人员进行更改和调整,并应做好详细的更改和操作记录。对设备的更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先准备好后备配件和应急措施。
7、不允许任何人在服务器、交换设备等核心设备上进行与工作范围无关的任何操作。未经上级允许,更不允许他人操作机房内部的设备,对于核心服务器和设备的调整配置,更需要小组人员的共同同意后才能进行。
8、要注意和落实硬件设备的维护保养措施。
1.3.2软件安全使用制度
1、必须定期检查软件的运行状况、定期调阅软件运行日志记录,进行数据和软件日志备份。
2、禁止在服务器上进行试验性质的软件调试,禁止在服务器随意安装软件。需要对服务器进行配置,必须在其它可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
3、对会影响到全局的软件更改、调试等操作应先发布通知,并且应有充分的时间、方案、人员准备,才能进行软件配置的更改。
4、对重大软件配置的更改,应先形成方案文件,经过讨论确认可行后,由具备资格的技术人员进行更改,并应做好详细的更改和操作记录。对软件的更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先备份原有软件系统和落实好应急措施。
5、不允许任何人员在服务器等核心设备上进行与工作范围无关的软件调试和操作。未经上级允许,不允许带领、指示他人进入机房、对网络及软件环境进行更改和操作。
6、应严格遵守张贴于相应位置的安全操作、警示以及安全指引。
1.4日志报告管理制度(性能报告、故障报告)
制作相关的值班日志安全报告手册,放置在值班台固定的位置,值守人员必须定期定时巡检机
房相关的硬件设施,观察每一部设备的实时运作情况,并予以记录。
1.5性能监控及优化手册
1.1. 监控系统的基本要求
对通信电源、机房空调实施集中监控管理,是对分布的各个独立的电源系统和系统内的各个设备进行遥测、遥信、遥控,实时监视系统和设备的运行状态,记录和处理相关数据,及时侦测故障,通知人员处理,从而实现通信局(站) 的少人或无人值守,以及电源、空调的集中监控维护管理,提高供电系统的可靠性和通信设备的安全性。
监控系统是采用数据采集技术、计算机技术和网络技术以有效提高通信电源、机房空调维护质量的先进手段。
监控系统所监控设备的遥信、遥控、遥测项目参照信息产业部下发的《通信电源、机房空调集中监控管理系
统暂行规定》。
1.2. 监控系统安全管理
1.2.1. 安全机制
1. 系统应从主机配置或网络配置上得到双机热备份或各主机之间互为备份的功能,使监控中心系统运行安全。
2. 监控系统应有自诊断功能,随时了解系统内各部分的运行情况,做到对故障的及时反应。
3. 非专线方式,通过拨号进入监控主机用的号码资源不对外公开。
1.2.2. 用户权限
1. 为保证监控系统的正常运行,在监控中心和监控站分别对维护人员按照对监控系统拥有的权限分为一般用户、系统操作员和系统管理员。
2. 一般用户指完成正常例行业务的用户,能够登录系统,实现一般的查询和检索功能,定时的打印所需报表,响应和处理一放告警;系统操作员除具有一般用户的权限以外,还能够通过自己的帐号与口令登录系统,实现对具体设备的遥控功能;系统管理员除拥具有系统操作员的权利外,还具有配置系统参数,用户管理的职能。系统参数是保障系统正常运行的关键数据,必须由专人设置和管理;用户管理实现对一般用户和系统操作员的帐号、口令和权限的分配与管理。
3. 所有登录口令均作机密处理,维护人员之间不需相互打听;系统管理员有必要时可以更改某帐号的口令。
4. 不同的操作人员应有不同的口令,所有系统登录和遥控操作数据必须保存在不可修改的数据库内,定
期打印,作为安全记录。
5. 对于设备的遥控权,下级监控单位具有获得遥控的优先权。对关键设备进行遥控时,应该确认现场无人维修或调试设备;有人员在现场操作设备时,应该通知上级监控单位在监控主机上设置禁止远端遥控的功能,在人员撤离时,通知恢复。
6. 系统所有技术手册、安装手册、软件等资料作机密保管。
2.1. 监控系统运行现状描述
为了保证本地区监控端局数据的实时性、准确性,监控系统中,各单元的运行与维护检查工作,一直属于重要工作内容。通过不懈的努力,对当前监控系统的各子系统进行重点设备的定期优化与日常维护相结合的办法,使得监控中心各单元系统没有发生过重大监控事故,有力的支撑了监控系统的正常运转,提高了
监控基站环境数据的可靠性。
2.2. 监控系统维护现状分析
l 系统化、条理化是维护工作的核心内容。
通过整理监控维护经验,当前机房的维护工作主要包括了监控数据的日常分析、设备的例行检查、故障告警处理等几大部分。根据维护内容,进行维护工作的开展,在完成每日例行检查的基础上,对属于数据的问题,原则上都能在第一时间内得到处理。
l 日常巡检与定期系统检修相结合,将减少监控故障的产生。
日常的巡检工作,将保证故障问题在较短的时间内得到处理。为系统的高效运行,提供保障。
l 值班工作十分重要,直接关系到系统运行的效率问题。
维护工作的前期主要工作量都集中在监控,如:分析告警、判断故障、优化数据等。为了提高维护效率,针对监控系统进行的日常维护梳理工作将十分必要。
3. 值班工作任务
3.1. 系统维护相关规定
Ø 机房系统设备包括:各级服务器和配套设备、计算机网络、模块。
Ø 机房主机和配套设备应安装在干燥、通风良好、无腐蚀性气体的房间,室内应有防静电措施及空调。
Ø 机房主机和配套设备应由不间断电源供电,交流电压的变化范围应在额定值的-15%--+20%内;直流电压的变化范围应在额定值的-15%----十20%内。
Ø 机房主机和配套设备应有良好的接地。
Ø 保持机房主机和配套设备的整齐和清洁。
Ø 机房系统应有例行的常规巡检、维护操作和定期的对系统功能与性能指标的测试。
Ø 分析每天的各种告警数据报表、历史数据报表和参数曲线,结合月、季的阶段汇总报表,了解设备运行情况,制定相应的设备维护计划。
Ø 日常值班人员应对系统终端发出的各种声光告警,立即作出反映。对于一般告警,可以记录下来,进一步观察;对于紧急告警,应通知维护人员去处理,如涉及设备停止运行或出现严重故障,影响电信网的正常运行,应立即通知维护人员抢修,并通知主管领导。
3.2. 系统使用和日常维护注意事项
机房的正常温湿度,保持环境清洁干净,防尘防潮,防止鼠虫进入机房。
系统一次电源的稳定可靠,定期检查系统接地和防雷地的情况。尤其是在雷雨季节来临前和雷雨后,应检查防雷系统,确保设施完好。
建立完善的机房维护制度,对值班和维护人员的日常工作进行规范。应有详细的值班日志,对系统的日常运行情况、版本情况、数据变更情况、升级情况和问题处理情况等做好详细的记录,便于问题的分析和处理。应有接班记录,做到责任分明。
严禁在计算机终端上玩游戏、上网等,禁止在计算机终端安装、运行和拷贝其它任何与系统无关的软件,禁止将计算机终端挪作它用,不得随意更改计算机的IP 地址,不得使用完全共享功能共享任何目录,不允许共享整个逻辑磁盘,仅在需要的时候以只读方式共享某个目录,并在使用结束后立刻去掉共享设置。操作系统中必须安装防病毒软件并及时升级。
网管口令应该按级设置,严格管理,并只能向系统相关值班和维护人员开放。
值班和维护人员应该进行上岗前的培训,了解一定的设备和相关网络知识,维护操作时要按照ZXM10相关手册的说明来进行,接触设备硬件前应佩带防静电手环,避免因人为因素而造成事故。值班和维护人员应该有严谨的工作态度和较高的使用和维护水平,并通过不断学习提高使用和维护技能。
不要盲目对设备复位、加载或改动数据,尤其不能随意改动网管数据库数据。
数据前要做数据备份,改动数据时要及时作好记录。
应配备常用的工具和仪表,如螺丝刀(一字、十字)、网线钳、万用表等。应定期对仪表进行检测,确保仪表的准确性。
经常检查备品备件,要保证常用备品备件的库存和完好性,防止受潮、霉变等情况的发生。备品备件与维护过程中更换下来的坏品坏件应分开保存,并做好标记进行区别,常用的备品备件在用完时要及时补充。 维护过程中可能用到的软件和资料应该指定位置就近存放,在需要使用时能及时获得。
机房照明应达到维护的要求,平时灯具损坏应及时修复,不要有照明死角,防止给使用和维护带来不便。 发现故障应及时处理,无法处理的问题应及时与监控当地维护人员联系,或拨打客服热线电话。
将监控维护人员的姓名和联络方法放在醒目的地方,以便在需要支持时能及时联络。注意及时更新联络方法。
3.3. 值班人员工作规程
值班期间,经常查看系统告警情况,对于告警不要轻易确认(比如在门磁告警时,确认有工作人员下站
维护)。一定要慎用批量告警确认功能。一定要杜绝因为告警确认后又没有及时处理而造成生产上的安全事故。(这需要在日常工作中注意积累经验)。
当系统发生故障时,如不能自行解决而需要技术支持的,要做好协调和配合工作。
系统的声光告警功能要用上,平时相关声光告警设备不能关闭,可以把一般告警设置成静音,而把重要监控量的告警级别提高,以减少声光告警给值班工作带来的干扰,同时又可以及时发现系统的告警,保证监控功能的正常使用。
做好交接班记录,特别是当班时的运行情况,对于需要重点监控的区域要标出,以便接班人员能尽快投入工作,实现交接班的无缝衔接。
值班人员自身对相关设备的了解也十分重要,值班人员要多学习动力环境设备的相关知识,为本职工作和提高自身技术技能打下坚实的理论基础,更好地完成监控值班工作,保证系统安装稳定运行。
3.4. 作好定期巡检记录
系统巡检要点:
机房内设备,服务器、大型显示设备等运行是否正常;查看系统操作记录、操作系统和数据库日志,是否有违章操作和错误发生。
前端采集设备的数据采集、处理以及上报数据是否正常。
机房局域网和整个传输网络工作是否稳定和正常。
对于所有机房设备应当定期进行巡检,巡检时,应当检查各模块的工作情况,打扫模块和计算机内的灰尘(可购置皮老虎用来吹掉设备内部的灰尘),对于计算机中地散热风扇,应当清洁掉上面的灰尘,以利风扇的转动,避免计算机损坏和性能下降。
机房硬件设备的功能和性能指标每季抽查一次,每半年检测一次,抽查检测过程以不影响供电系统的正常工作为原则。
3.5. 数据的管理与维护
系统数据管理和维护:
为确保系统安全,此操作非系统管理员不允许操作,详细操作流程见相关章节的网管系统的数据库维护管理。系统配置参数发生改变时,自身配置数据要备份,在出现意外时,用来恢复系统。系统操作记录数据,每季备份一次,以作备查。
监控中心和监控站中主机的系统软件有正规授权,应用软件有自主版权,系统软件应有安装盘,在系统出现意外情况下,重新安装恢复。具备完善的安装手册、用户手册与技术手册,整套软件和文档由专人保管。
数据库内保存的历史数据在定期倒入外存后,作上标签妥善保管。每日、每月、每季和每年打印出的报表,装订成册,妥善保管。
3.6. 每日维护任务
为保证系统运行的稳定性,工作的可靠性,发现问题能得到及时处理。机房值班人员应该严格作到以下几方面工作内容。
1. 运行设备的检查工作:
Ø 门禁运行检查。重点应该检查当前信息收集的准确性,与工作的稳定性。并应能对使用情况进行统计。 Ø 机房监控系统的检查。主要检查看看各区域的显示是否在规划的上下限。
2. 保证系统运行的稳定性,检查数据上报的准确性。
3. 告警的检查与处理。通过系统上报的告警信息,记录并判断需如何处理该告警。
3.7. 每周维护任务
每周的检查工作,具体应安排在每周的星期六,在完成日常维护检查工作的同时,作好以下几点工作内容。
1. 服务器的检查工作。检查运行状态、数据日志等。
2. 图像采集设备的检查工作。检查编码器、
3. 机柜、服务器的接插件检查工作。
4. 网管设备及机柜清洁。
5. 数据的维护。检查本地库是否运行正常;版本是否一致;是否根据最新文件进行了升级;对错误数据进行更正。
3.8. 每月维护任务
每月的最后一个工作日,值班人员应该作好以下具体的值班工作:
1. 备份数据库。并通过文本文档存放,方便日后的数据调用查询。
2. 全网系统时钟校验。校对监控系统时间的一致性,保证上报数据的实时、可用性。
3. 统计报表(停电统计报表、监控故障报表、监控日常维护表、备件使用登记表)
3.9. 故障与告警的处理
1,故障的发现与上报
日常的值班工作,最重要的内容就是对监控系统进行实时监控,出现问题,及时上报、处理。值班人员在第一时间发现问题后,填写故障记录单后,判断是否属于重大动力故障事故,如果是重大事故,需在第一时间报告上级备案后,根据故障处理流程进行处理,在最短的时间内处理完毕,故障恢复后,应以书面的形式报告。对于一般性的故障,在记录故障后,联系技术人员现场处理。故障恢复后,备案即可。
2,动力监控故障上报流程
值班人员发现故障问题,填写故障记录单,并作详细记录与备案。
判断是否属于重大动力故障事故,并说明故障的详细情况,供分析备案
属于重大动力故障事故,书面上报主管部门。
重大动力故障处理完毕后,以书面形式向主管领导汇报情况。并按相关规定进行处理。
故障恢复后,应及时备案。
故障的处理及处理后的措施:
故障处理完毕后,需填写故障处理单(应该详细说明现场故障情况,分析故障过程,故障的解决过程,及遗留问题的说明等),报监控中心值班人员备案,在值班人员确认故障恢复正常无误后,方可结束(如是现场维护人员,则需在故障恢复确认后,方可离开现场)。
故障的处理,应该作到以下几点:
1. 处理问题要彻底,不能有遗留故障隐患。
2. 故障处理单,要有故障处理的记录详细,分析问题要有深度。
3. 现场处理,值班人员和技术人员要及时沟通,保证监控数据的准确性。
4. 严禁私自更改其它厂家设备运行状态与参数。需要操作其它厂家设备时,需和用户、第三方厂家进行沟通,确认后方可进行。
3.11. 资料整理工作
资料的整理与维护是一项长期的工作,涉及到日常机房设备的数据库、基站监控数据、及日常维护的记录等,重点以机房设备的实时运行数据为重点,保证保存数据的准确性与完整性,方便维护人员的查阅。具体应以备份资料PC 机作为资料备份用电脑,分类建立目录,如:数据库备份、办公资料、维护记录、下载程序及人员个人的相关资料等都可存入电脑中,
日常维护过程中,必须将各机房设备的数据库、维护记录资料,保持一份拷贝在库房PC 机中的相关目录中,方便日后的资料查阅。本着谁处理,谁保存,此项要求,需要严格长期执行。数据的记录与保存,将直接影响到后期维护工作的效率。而且在资料的维护过程中,对相同文件进行更新后,原则上要删除原有文件,防止出现多个相同文件同时出现,无法准确核对数据的问题。
3.12. 备件管理与返修流程
机房设备的维护工作中,较多的涉及到备件的使用与返修问题,备件管理与返修的效率好坏,直接影响
维护工作的实施进度,在具体的管理中,应当对备件的使用去向、好坏等进行分类管理。
二、机房分项管理制度
2.1日常操作管理制度
1、必须注意环境卫生。禁止在机房内吃食物、抽烟、随地吐痰;对于意外或工作过程中弄污机房地板和其它物品的,必须及时采取措施清理干净,保持机房无尘洁净环境。
2、必须注意个人卫生。工作人员仪表、穿着要整齐、谈吐文雅、举止大方。
3、机房用品要各归其位,不能随意乱放。
4、机房应安排人员值日,负责机房的日常整理和行为督导。
5、进出机房按要求必须换鞋,雨具、鞋具等物品要按位摆放整齐。
6、注意检查机房的防晒、防水、防潮,维持机房环境通爽,注意天气对机房的影响,下雨天时应及时主动检查和关闭窗户、检查去水通风等设施。
7、机房内部不应大声喧哗、注意噪音/音响音量控制、保持安静的工作环境。
8、坚持每天下班之前将桌面收拾干净、物品摆放整齐。
9、 保持清洁卫生,地面、墙壁、门窗、设备及其它附属设施无积尘,无水渍。
2.2人员管理制度
2.2.1硬件维护人员岗位职责
1.及时高效地完成领导分配的硬件维修等各项任务,保证硬件的正常工作。
2.维护人员要熟悉计算机原理和操作规程,熟悉仪器仪表使用方法。维护工作应遵循微机故障与维修的操作步骤、基本原则和维修方法进行。
3.经常检查供电系统是否正常,电器连接点是否牢固,用电器温度有无异常;检查机柜的开关
是否完好,对硬件进行外观和静态检查,发现问题及时解决。
4.网络连接线路在使用过程中会出现各种故障,如某一工作站不能连接上网或一组工作站不能连接上网,这需要维护人员熟悉网络拓扑结构,通过检查网线、网络连接点、网卡、服务器以及集线器、交换器等网络设备,找出故障点给予排除。
5.当硬件发生故障时,及时排除故障,尽快恢复系统的运行。
6.定期进行硬件的例行维护,建立每台机器的维护档案。
7.每次维修必须进行登记,包括更换的设备和配件。
8.积极参加业务学习,不断提高业务水平。
2.2.2软件维护人员岗位职责:
1.及时高效完成软件维护等各项任务,保证机房各项设备的正常运行。
2.日常维护保养时,一定要严格遵守操作规程,不可随意进行,特别在服务器运行过程中不能随意冷启动机器。机器运行当中,软件维护人员应时刻观察有无异常情况,及时发现及时处理。
4.积极协调硬件维护人员排除硬件故障。
5.平时要做好系统保护与数据备份工作,系统出现问题后能够快速恢复。
6.认真参与业务学习,不断提高自身的软件维护水平。
7.作好机房各项信息的安全保密工作。
2.2.3机房维修人员工作考核细则
1、不服从领导正当命令。
2、对于上级领导安排的各种工作未在规定时间内完成。
3、上班时抽烟,喝酒,玩游戏,看电视,睡觉。
5、不着正装。
6、各班次不打扫机房卫生。
7、各班次交接不清楚的。
8、解决不了的问题未上报。
9、维修态度不好。
10、未按工作流程操作。
11、未经允许私自携带工具设备,软件或工作资料外出者。
13、未经允许在电脑上安装卸载与工作无关的软件。
14、维修工具丢失者。
15、下班后机房:照明,电视,电脑等相关设备未关。
16、工作期间不属于调试范围违规作业。
17、维修人员维修后不做记录者。
18、未经允许袋摄像机,照相机,DV 及易燃易爆品进入机房者。
19、未经允许用移动硬盘等类似工具拷贝,复制,刻录机房电脑内的程序,软件泄漏机密者和私刻光盘者。
2.3出入管理制度
1、严禁非机房工作人员进入机房,特殊情况需经主管领导批准,并认真填写登记表后方可进入。
2、进入机房人员应遵守机房管理制度,更换专用工作鞋或者穿鞋套;机房工作人员必须穿着工作服。
3、进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。
4、进入机房人员未经同意不得随意翻看机房内文件、软件等资料,不得随意碰触机房内电子仪器。
5、机房内严禁吸烟。
6、外来实习或因临时性工作需要进入机房,必须经有关部门批准,并有本中心管理人员在场。
2.4值班制度
1、机房实行24小时值班制。
2、未经上岗培训人员,不得单独承担值班工作和独立操作。
3、值班人员在值班时间内要集中精力,坚守岗位,不得借故离岗。
4、认真履行值班岗位职责,按时实时监测网络运行状态,发现异常情况,应及时处理或通报有关部门协助处理。
5、值班时间内发现故障,应按故障处理程序的规定准确、迅速地予以处理,或通知维护人员协助处理,并填报故障记录;严重故障,应及时上报部门业务主管,不得以任何理由推诿、拖延障碍处理时间。
6、未经业务领导批准,不得任意改变系统设备工作状态或关闭设备,不得随意切断用户电路。
7、及时、准确、完整地填写值班日记、《机房值班记录表》《进出机房登记表》及其他记录、报表。
8、严格遵守通信纪律和安全保密制度。
9、不准在机房内监控设备上运行非系统设备配置的其他软件,严防病毒侵害。
2.5用电制度
1、机房人员应学习常规的用电安全操作和知识,了解机房内部的供电、用电设施的操作
规程。
2、机房人员应经常实习、掌握机房用电应急处理步骤、措施和要领。
3、机房应安排有专业资质的人员定期检查供电、用电设备、设施。
4、不得乱拉乱接电线,应选用安全、有保证的供电、用电器材。
5、在真正接通设备电源之前必须先检查线路、接头是否安全连接以及设备是否已经就绪、人员是否已经具备安全保护。
6、严禁随意对设备断电、更改设备供电线路,严禁随意串接、并接、搭接各种供电线路。
7、如发现用电安全隐患,应即时采取措施解决,不能解决的必须及时向相关负责人员提
出解决。
8、机房人员对个人用电安全负责。外来人员需要用电的,必须得到机房管理人员允许,
并使用安全和对机房设备影响最少的供电方式。
9、机房工作人员需要离开当前用电工作环境,应检查并保证工作环境的用电安全。
10、最后离开机房的工作人员,应检查所有用电设备,应关闭长时间带电运作可能会产生严重后果的用电设备。
11、禁止在无人看管下在机房中使用高温、炽热、产生火花的用电设备。
12、在使用功率超过特定瓦数的用电设备前,必须得到上级主管批准,并在保证线路保险的基础上使用。
13、在危险性高的位置应张贴相应的安全操作方法、警示以及指引,实际操作时应严格执行。
14、在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作。
15、应注意节约用电。
2.6用水制度
1、禁止将供水管道和设施安装在机房内。
2、应格遵守张贴于相应位置的安全操作、警示以及安全指引。
2.7空调管理制度
一、空调机房平时应上锁,钥匙由值班人员保管,未经许可,禁止非工作人员入内。
二、保持机房内良好的通风和照明。
三、空调设备运行时,值班人员应按时巡查,检查各项运行参数,状态是否正常,如有异常,应及时调整处理,并做好记录。
四、定期清洗系的过统滤网各过滤器,保证送风管道和送水管道的通畅。
五、每周对空调主机、配电柜、水泵和机房进行一行清洁,定期对空调主机、配电柜、水泵检查
三.应急管理制度
为规范本网络中心机房设备管理,提高处理网络突发事件的能力,形成反应迅速的应急工作机制,确保重要网络设备和服务器硬件安全以及运行安全和数据安全,最大限度地减少突发事件造成的危害,特制定《网络中心机房应急手册及故障处理手册》。本文件适用于有计划性、有预防性地管理网络中心机房以及发生和可能发生的与机房有关的突发事件,对异常流量来源进行监控,并妥善处理各种异常情况。
3.1应急手册
第一条 机房内禁止明火禁止吸烟,机房内的所有设备需要定期维护并做巡检记录、根据机房实际情况进行清扫工作。
第二条 机房网络设备维护由网络管理员进行,如发现机器故障应及时排除故障,在遇到硬件三包范围内的故障时,应及时联系供应公司上门或将机器送供应公司维修;
第三条 工作人员必须严格遵守有关机房、设备及系统运行管理规定,不得在机房内从事与系统管理、运行维护、系统安装和调试等无关的工作;
第四条 做好防火、防雨、防湿、防盗工作,注意用电安全;机房内的环境要每周检查温度、湿度、电力系统、是否满足机房相关的标准要求。
第五条 机房内的交换机和服务器系酒店运营的关键设备,任何人不得自行配置或更改其系统参数。
第六条 要做好机房的安全工作,对服务器的各种帐户、密码严格保密。
第七条 应及时做好数据的备份工作,保证在系统发生故障时,数据能够快速、安全的恢复。所有备份数据不得更改,并要求做到本地和异地分别备份保存。
第八条 为了确保本酒店网络正常运行,每日对机房内的设备进行巡视,主要着重于服务器及网络设备运行正常与否。 1.对机房里的温度进行调节,如室内温度过高,调节空调对机房进行有效的通风。
2. 查看交换机与防火墙及接入设备的工作状态,如发生异常,对其进行及时有效的维护。3. 监测网络运行状况。
第九条 除本酒店网络管理员外,公司其他人员因工作需要进入机房的,需网络管理员陪同下进入机房。
第十条 严禁带外单位人员或无关人员进入机房,确因工作需要,如:系统故障诊断和处理,设备维修维护、系统或设备安装等进入机房,必须由网络管理员陪同进入,配合项目的实施。
第十一条 进入机房的设备应在进入机房前拆除外包装,以保证机房环境的清洁和安
第十二条 严禁携带易燃、易爆、易腐蚀等危险性物品进入机房。
第十三条 机房内提供的UPS 电源只允许为主机、服务器、网络及存储等核心设备供电,严禁安插其他设备,增加UPS 电源供电负荷。
第十四条 严禁擅自切断供电系统,确因工作需要断电时,首先应做好相应准备工作,经部门领导批准,然后给所有部门发放断电或断网通知,最后方可实施。
第十五条 机房内安装用电设备或有用电需求的项目时,必须经过专业人员或设备提供商的安装工程师进行现场勘查,经确认在满足或符合要求后工程才能实施。
3.2故障处理手册
第一条 机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的物理破坏、人为失误造成的安全事件等等。 针对突发事件的预防措施如下: 建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘;建立备份电源系统;加强防火、防盗意识。
第二条 机房漏水应急预案如下:
1. 发生机房漏水时,第一目击者应立即通知机房管理人员。
2. 若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,必要情况下可临时用电扇对服务器进行降温。3. 若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知工程人员及时清除积水,维修墙体或窗户,消除渗漏水隐患。
第三条 机房火灾应急预案如下:
1. 完善机房环境,确保机房放置灭火器;禁止携带易燃易爆物品进入机房。
2. 机房管理人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理,掌握消防应急处理步骤、措施和要领,懂得灭火的方法,会扑救初起火源。
3. 一旦发生火灾,迅速切断机房电源,避免灾情的扩散,并迅速和保安部联系必要时立即报火警。
第四条 机房停电应急预案如下:
1. 接到停电通知后,应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求在停电前停止业务、保存数据。
2. 机房管理人员每日检查UPS 电源的状态, 确保在突发停电时,UPS 电源能自动供应服务器正常工作15分钟以上, 保证员工工作的数据及时保存。
第五条 通信网络故障应急预案如下:
1. 发生通信线路中断、流量异常等故障后,发现状况的员工或部门领导应及时通知网络管理员。
2. 网络管理员了解情况后,迅速组织检测故障区域,并作相关故障处理,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
第六条 服务器故障应急预案如下:
1. 机房管理人员每日检查机房内各服务器状态。
2. 定期备份数据服务器数据。并将备份资料拷贝到移动设备。服务器出现严重硬件故障时启用备用服务器以保障正常运转。