我可以: 邀请好友来看>>
ZOL星空(中国) > 技术星空(中国) > 网络/安全技术星空(中国) > IT运维管理良方如何为故障处理对症下药
帖子很冷清,卤煮很失落!求安慰
返回列表
签到
手机签到经验翻倍!
快来扫一扫!

IT运维管理良方如何为故障处理对症下药

23浏览 / 0回复

betasoft2012

betasoft2012

0
精华
13
帖子

等  级:Lv.1
经  验:244
  • Z金豆: 0

    千万礼品等你来兑哦~快点击这里兑换吧~

  • 城  市:北京
  • 注  册:2012-08-16
  • 登  录:2013-12-05
发表于 2013-08-12 13:59:14
电梯直达 确定
楼主

 

IT运维管理人员几乎每天都在与故障打交道,而当业务系统足够复杂的时候,仅凭感觉往往无法再判别出故障的根源。那么,如何才能让IT运维管理跳出手工作坊阶段,在故障发生时准确定位、快速修复,乃至利用更先进的IT运维管理工具避免非计划性的停机事故呢?

一般来说,与故障分析难度成正比的,是系统的复杂性。业务系统越复杂,涉及的设备、软件、厂家、人员就越多,可能带来的故障分析难度也就越大,恢复的时间也就越长。虽然,有些网络故障解决办法是相通的,人的作用非常大,但从随时变化的网络架构和业务系统实际运行的复杂环境来看,解决相同现象的故障,方法可能迥然不同。如果我们在IT运维管理的过程中,过多的依靠个人经验,或者PINGTRACER等命令,都会让排错的时间变得不可控,并造成IT运维服务质量停滞不前的尴尬局面。

面对这种情况,我认为:依靠个人能力进行运维管理有许多缺点,比如无法做到事前发现、无法做到准确定位、故障原因可能出现误判、响应时间慢等等。因此,要想与时间赛跑,就需要一个高效而准确的故障发现机制,一个能够支撑故障分析策略的工具,这是企业建立故障处理体系的第一步。

 

基于ICMP的管理,只能对服务器和网络设备的连通性进行简单性测试,在网络建设阶段的作用很大,但在业务逐渐复杂的管理阶段就显得力不从心了。那么我们需要一种工具可以达到以下功能:

首先,通过TFS管理系统,实现了对网络设备、主机、数据库、中间件以及应用管理的实时监控。管理人员在业务层就能查看所有关键信息,而一旦出现告警事件,管理人员就可以通过TFS故障诊断路径直接定位源头。

其次:在故障处理的操作层面,提供业务流量分布图,以物理拓扑为基础,业务流量为骨干,透明化的展现了业务数据在网络中的真实路径,并实时展示各路径上的业务流量及用户接入设备。利用业务流量的路径图实现主动监测,更可以在庞大而复杂的网络中,发现隐患。管理员可以对业务各关键路径7X24小时监控,通过对于各关键路径的响应时间分析,并结合支撑组件的情况进行智能梳理,可帮助运维人员直击可能引发非计划性宕机的隐患点。

高级模式
星空(中国)精选大家都在看24小时热帖7天热帖大家都在问最新回答

针对ZOL星空(中国)您有任何使用问题和建议 您可以 联系星空(中国)管理员查看帮助  或  给我提意见

快捷回复 APP下载 返回列表