一、故障描述
1、虚机某节点不断报错:“由于连接性问题导致失去卷XX的访问权,正在进行还原尝试”,并同时间提示:“出现连接性问题后成功恢复对卷XX的访问权”;
2、映射到该节点卷的V7000链路由4条变为3条,V7000卷降级告警。
二、故障解决思路
1、初检为尽快解决问题,把精力全部放在故障点,各故障点未能统一串联导致思路混乱;
2、由于此case涉及到主机-光交-存储各层,所以首先应该梳理该系统所涉及的相关设备,整体考虑问题;
3、正所谓“磨刀不误砍柴工”,一个清晰的系统拓扑图是故障解决中十分必要的,可帮助我们找到发生问题的点;
4、系统拓扑图可直观展示设备间关联,我们可以对比故障发生前后拓扑变化以对链路故障排错。
三、故障分析
1、列出故障SAN网内相关设备:
2、抓取主机-光交-存储端口形成SAN网络梳理表:
3、按照梳理表形成SAN拓扑图:
4、按照拓扑图分析:
a、主机4个光口分别连1台光纤交换机;
b、光纤交换机08口对应链路10:00:00:90:fa:a8:ee:08→50:05:07:68:0b:21:bb:f8 10:00:00:90:fa:a8:ee:08→50:05:07:68:0b:21:bb:f9在V7000告警中F9丢失;
c、通过拓扑图查看,如果08口物理链路中断,那么光交1到存储2条链路都会丢失;光交1到存储2条链路没有丢失,说明物理链路并没有中断。但是存储端F9链路丢失又说明确实存在问题;
d、进一步对比查看其他节点主机50:05:07:68:0b:21:bb:f8 50:05:07:68:0b:21:bb:f9 存储端2条链路均正常,那么故障点在本主机10:00:00:90:fa:a8:ee:08上,物理连接正常,链路丢失;
e、物理连接正常,链路丢失,此时怀疑主机到光纤交换机的光纤线存在问题,或主机08口出现问题。
四、故障解决
1、光纤交换机08端口收值过高,光信号衰减;
2、更换该端口对应光纤线,故障解决。
五、经验总结
1、本次故障是光纤线老化或遭挤压导致光信号衰减进而引起传输问题;
2、问题发生时可能会有多个点告警,应从整体系统环境考虑,逐步剥离故障点间关系,最终找到真正引发问题的点。
如欲了解更多,请登录365bet足球比分官方网站:e6gi.svdxn96.com