본문 바로가기

HW Knowledge/Hewlett-Packard Enterprise214

MR(MegaRAID) Controller/How to collect storage logs MR(MegaRAID) Controller/How to collect storage logs LSIget Note. LSIget script download lsiget log bundle analysis information https://www.broadcom.com/support/knowledgebase/1211261522992/lsiget-log-bundle-analysis-information the LSIget data capture script https://www.broadcom.com/support/knowledgebase/1211161499563/lsiget-data-capture-script 1. Linux / VMware # ./lsigetlunix.sh -D -Q 2. Window.. 2022. 4. 13.
HPE/RHEL/GPU 환경에서, ACPI Power meter module로 인해 시스템 장애 발생 가능 GPU환경에서 ACPI power meter module로 인해 IOMCA/UMCE 장애 발생 가능 Set acpi_power_meter on blacklist to not use it. 1) unload acpi_power_meter # modprobe -r acpi_power_meter 2) acpi_power_meter를 사용하지 않도록 등록 # echo "blacklist acpi_power_meter" > /etc/modprobe.d/blacklist-acpi_power_meter.conf # echo "install acpi_power_meter /bin/false" >> /etc/modprobe.d/blacklist-acpi_power_meter.conf 3) power1을 열람하지 않도록 .. 2022. 4. 13.
SR Controller/How to collect ADUreport How collect SR(SmartRAID, ex SmartArray) Contoller Diagnostics Tool log. CLI General ADUreport #/> ssa -diag -f adureport.zip SSD WearGauge #/> ssa -ssd -f ssdwear.zip Serial Output log #/> ssa -logs -f SRsob.zip Note. Linux: /usr/sbin/ssa Windows: C:\Program Files\Smart Storage Administrator\ssa\bin\ssa.exe GUI Smart Storage Administrator (SSA) > select Array Controller or Server > Diagnose > A.. 2022. 4. 3.
Gen10 plus / System Board 교체 시, PCI 확장장치의 구성 초기화 및 데이터 손실 발생 주의 필요 Gen10 plus / System Board 교체 시, PCI 확장장치의 구성 초기화 및 데이터 손실 발생 주의 필요 증상 일부 Gen10 plus 시스템에서, 장애 조치로 System Board 교체 시, 기존 구성되어 사용되던 PCI 확장 장치들의 구성 정보가 삭제/초기화되는 현상이 발생 Smart Array와 같은 HBA의 경우, 증상이 발생되면, Array 정보 소실에 따라, 데이터 손실이 발생할 수 있음. 또한, 볼륨 재구성 후 OS 재설치 및 데이터 복원 절차가 필요함. 원인 Gen10 plus 시스템의 System Board 교체 후 초기화 절차로, PCI 장치 정보의 공장 초기화 진행을 하도록 설정을 추가했고, 관련 초기화 절차가 다음 부팅 중에 진행됨 Note. 다음 부팅에서 시스템의 .. 2022. 2. 4.
Qlogic SN1100Q HBA, MPI Heartbeat stop Qlogic HBA, MPI Heartbeat stop SN1100Q와 같은 Qlogic HBA의 fw가 "01.73.08"인 상황에서, 아래 패턴의 로그와 함께 운영 중 예기치 않은 포트 다운 또는 리부팅이 발생되는 경우 HBA fw의 오류일 수 있음Linux kernel: qla2xxx [0000:11:00.0]-ffff:0: MPI Heartbeat stop. Chip reset needed. MB0[8200h] MB1[100h] MB2[0h] MB3[0h] kernel: qla2xxx [0000:11:00.0]-d013:0: MPI Heartbeat stop. FW dump needed kernel: qla2xxx [0000:11:00.0]-d011:0: -> fwdt0 running... ker.. 2021. 11. 18.
iLO5/CPU 온도 표시 개선 iLO5/CPU 온도 표시 개선 환경: iLO 5를 사용하는 HPE ProLiant System 증상: HPE 시스템에서, iLO(IPMI)와 OS(MSR)의 측정 값이 다름: The third-party software read 74 degree value by CPU - OS 상의 Tool은 cpu의 MSR(Model specific register, Intel에서 정의한 cpu type에 따라 다른 정의된 정보를 갖는 레지스터) 정보를 접근 및 취합하여 보여줌 - 해당 값은 조회 당시의 순간(찰나)적인 값으로, cpu 운용 상황에 따라 매우 가변적 iLO(ipmi) read 56 degree value by CPU - iLO 상의 온도 값은 Intel ME(Management Engine)를 통해 .. 2021. 10. 19.
VMw 6.5.2/Online NIC fw upgrade Test System: DL380 Gen9+VMware ESXi 6.5 u2 Test device - 331x NIC. HPE Broadcom NX1 Online Firmware Upgrade Utility for VMware 1.28.6 (19 Apr 2021) https://support.hpe.com/hpesc/public/swd/detail?swItemId=MTX_648f0b90d7c2438b82851940e2#tab2 [root@DL380G9P5U25:/tmp/CP045013] ls CP045013.vmexe CP045013.vmfile CP045013_BUILD_13.data payload.json CP045013.vmexe64 CP045013.xml CP045013_VMw.zip [root@.. 2021. 7. 14.
Smart Storage Battery pre-failure 증상: IML: Smart Storage Battery pre-failure (Battery 1) Q. SSB의 pre-failure를 감지 및 표시 할 수 있는 iLO의 버전은? A. iLO 4: v2.55 / iLO 5: Any version Q. SSB의 pre-failure 발생 시, backup power의 상태는 어떠한지? A. 정상 동작 상태 SSB pre-failure는 실시간 감시에 따른 검출 기능으로, 로그 발생 시점 기준으로 정상 동작 상태이나, SSB 상태가 장애로 분류(마크)되는 이전 상태로 교체가 필요한 상태 HPE는 증상 발생 후 한 주 이내 교체를 권장. Note. pre-failure는 SSB 내부에 2개 배터리 셀이 존재하며, 각 셀의 충전 레벨이 서로 달라지는 상태를 감.. 2021. 7. 13.
Gen10/ilorest를 통해 Apollo XL270d Gen10 Power Supply 정보 열람 RESTful API를 사용하는 경우, GET https:///redfish/v1/chassis/1/power e.g.) GET https://192.168.0.10/redfish/v1/chassis/1/power Note. RESTful client의 credential 설정 필요. RESTful Interface Tool을 사용하는 경우, RESTful Interface Tool https://buy.hpe.com/kr/ko/software/infrastructure-management-software/system-server-management-software/hpe-system-server-software-management-software/restful-interface-tool/p/763040.. 2021. 5. 18.
반응형