본문 바로가기
HW Knowledge/Hewlett-Packard Enterprise

Diagnosis/Memory ECC Test failure

by 스쳐가는인연 2014. 2. 8.

System의 Rebooting 등으로 원인 분석을 진행 할 때,


진단 툴을 통해 하드웨어 오류 진단을 진행하는데, 메모리에 장애가 명확히 보이지 않는 데,
진단 툴에서 Memory 관련 ECC Test가 반복해서 오류가 확인되는 경우,
과거에 기록되었던 오류 정보를 진단툴에서 인식하여 잘못 표기되는 경우가 있다.


누적된 메모리 오류가 있는지 여부는 진단툴에서 Survey의 고급 정보를 통해 확인이 가능하다.



Correctable Error와 Uncorrectable Error를 통해 메모리의 이상 여부 확인이 가능하다.


부하 테스트를 통해 오류 여부를 추가로 확인할 수 있는데, 이때 다른 항목은 이상이 없는데 ECC test만 실패하는 경우가 있다.



문제가 없는데, 잘못 진단된 경우 아래 방법을 통해 재진단하면 해결된다.


Action Plan 1. 
What: IML, SEL log Clear 및 진단툴 재진행
Why : ECC test 이슈 해소를 위해
To do
1. SSCD 또는 SPP로 부팅 후 IML 및 SEL Clear (필요 시 백업 후 진행)
2. Test 재수행 및 결과 확인


Survey Report 확인 방법

Gen8 이상 - Intelligent Provisioning > Performance Maninternance > Insight Diagnostics > Survey Tab > View level: Advanced, Categories : all > Save
G7 이하 - SmartStart CD로 부팅-> Maintenance-> Insight Diagnostic-> Survey Tab-> View level: Advanced, Categories : all -> Save


Test Report 확인 방법

G7 이하 - SmartStart CD로 부팅 > Maintenance > Insight Diagnostic > Test Tab > Complete Test Tab > Number of loops 5회 > All Devices Checked > Begin Test (테스트 완료 후 Log Tab 선택 후 Save)
Gen8 이상 - Intelligent Provisioning > Performance Maninternance > Insight Diagnostics > Test Tab > Complete Test Tab > Number of loops 5회 > All Devices Checked > Begin Test (테스트 완료 후 상단 Log Tab 선택 후 Save)



반응형