136 9119 8096
  • 北京华为服务器经销商
您的位置:首页 > 信息中心  > 公司新闻
当华为RH5885H V3服务器2块系统盘同时出现故障该怎么办?
来源:www.server-huawei.com 发布时间:2021年06月07日

当华为RH5885H V3服务器2块系统盘同时出现故障该怎么办?作为专业的北京华为服务器经销商,就这个问题我来给大家讲解一下。


解决方案
1. 分析日志硬盘disk0和disk1无坏道,无异常,查看各盘的media error count、other error count和Predictive Failure Count,可以看到都是0。
2. 在message日志中,对应时间点无Raid卡,磁盘等异常打印。
3. 在Raid卡sasraidlog日志中,发现如下打印:

北京华为RH5885H V3服务器

在03:36:51时间,看到wide port 0 lost link on Phy X的打印时,说明RAID卡-SAS线缆-硬盘背板PortB之间的链路出现了不停的闪断。
 
16153: 19-01-14,03:36:40 WARNING:SAS wide port 0 lost link on PHY 4
 
16154: 19-01-14,03:36:40 WARNING:SAS wide port 0 lost link on PHY 5
 
16155: 19-01-14,03:36:40 WARNING:SAS wide port 0 lost link on PHY 6
 
16156: 19-01-14,03:36:40 WARNING:SAS wide port 0 lost link on PHY 7
 
同时查看链路误码,发现硬盘背板接收端之间确实存在有链路误码:
 

北京华为服务器经销商


但是在Raid卡接收端没有发现误码计数,说明是“硬盘背板PortB口-SAS线缆-Raid”的回路没有发现误码。
 
Disk0和disk1出现异常Error,随后状态从online置成sheild进行故障诊断,此时对应的RAID1从optimal变成degraded降级再变成offline状态;
 
16157: 19-01-14,03:36:51 WARNING:Error on PD 02(e0x00/s1) (Error f0)
 
16158: 19-01-14,03:36:51 Info:State change on PD 02(e0x00/s1) from ONLINE(18) to SHIELD(90)
 
16159: 19-01-14,03:36:51 Info:State change on VD 00/0 from OPTIMAL(3) to DEGRADED(2)
 
16160: 19-01-14,03:36:51 CRITICAL:VD 00/0 is now DEGRADED
 
16161: 19-01-14,03:36:51 WARNING:Error on PD 01(e0x00/s0) (Error f0)
 
16162: 19-01-14,03:36:51 Info:State change on PD 01(e0x00/s0) from ONLINE(18) to SHIELD(90)
 
16163: 19-01-14,03:36:52 Info:State change on VD 00/0 from DEGRADED(2) to OFFLINE(0)
 
16164: 19-01-14,03:36:52 FATAL:VD 00/0 is now OFFLINE
 
03:36:53磁盘disk0和disk1从shield状态变成 failed,系统挂死重启
 
16167: 19-01-14,03:36:53 CRITICAL:Diagnostics failed for PD 02(e0x00/s1)
 
16168: 19-01-14,03:36:53 Info:State change on PD 02(e0x00/s1) from SHIELD(90) to FAILED(11)
 
16169: 19-01-14,03:36:53 CRITICAL:Diagnostics failed for PD 01(e0x00/s0)
 
16170: 19-01-14,03:36:53 Info:State change on PD 01(e0x00/s0) from SHIELD(90) to FAILED(11)
 
16171: 0:0:0 Info:Firmware initialization started (PCI ID 005b/1000/d206/19e5)
结论:
“Raid卡-SAS线缆-硬盘背板”之间链路出现了闪断造成硬盘异常

解决方案:
需申请1块硬盘背板和1根SAS线缆,更换硬盘背板和SAS线缆。




返回列表
华为服务器系列
华为服务器
华为taishan服务器
华为kunlun服务器
华为存储
新闻中心
公司新闻
行业新闻
解决方案
热门搜索
华为服务器代理
北京浪潮服务器
北京联想服务器
北京华为昆仑服务器
北京华为服务器代理商
北京永昌高泰科技发展有限公司
咨询电话:136 9119 8096
公司 Q Q:550662662
公司地址:北京海淀区芙蓉里南街6号院1号楼8层
网站备案:京ICP备17012669号-3
技术支持:建站之家Y1.5
友情链接:中宝时门窗  
网站地图
   | 版权声明:本站所用文字图片部分来源于公共网络或者素材网,凡图文未署名者均为原始状况,作者发现后可告知认领,我们会及时署名或依照作者本人意愿处理,如未及时联系本站,本网站不承担任何责任。