본문 바로가기

HW Knowledge/Hewlett-Packard Enterprise207

kernel: smartpqi BDF: error updating time on controller Microchip SmartRAID(SR)/SmartArray HBA가 장착된 시스템 운용 중, Linux OS 상에 아래 메시지가 출력될 수 있음 kernel: smartpqi BDF: error updating time on controller smartpqi driver는 정기적으로, HBA와 OS 간의 시간을 동기화하는데, IO가 많아(busy) 가용 Cache가 고갈되어 부족에 따라, 동기화 작업을 수행하지 못해 발생된 메시지. 시간 동기화 실패는 시스템 운영에 영향을 주지 않으며, 진행중인 IO가 완료되어 Cache가 release 되면, 이 후, 동기화가 재 수행됨. The observed failure have no ill effect on any functional issues of th.. 2022. 4. 21.
OneView/How remove Alert Logs from Oneview via PowerShell Revised: 2022-04-19 1. HPE Oneview Powershell library 설치 a. 사용중인 Powershell 버전 확인 PS> $host PS> $PSVersionTable Note. POSH 5.1 이상 필요 필요 시, Powershell 5.1 이상 설치 https://docs.microsoft.com/ko-kr/powershell/scripting/install/installing-windows-powershell?view=powershell-7 https://docs.microsoft.com/en-us/powershell/scripting/install/installing-powershell-on-windows?view=powershell-7.2 b. 기존 설치 모듈 확.. 2022. 4. 19.
MR(MegaRAID) Controller/How to collect storage logs MR(MegaRAID) Controller/How to collect storage logs LSIget Note. LSIget script download lsiget log bundle analysis information https://www.broadcom.com/support/knowledgebase/1211261522992/lsiget-log-bundle-analysis-information the LSIget data capture script https://www.broadcom.com/support/knowledgebase/1211161499563/lsiget-data-capture-script 1. Linux / VMware # ./lsigetlunix.sh -D -Q 2. Window.. 2022. 4. 13.
HPE/RHEL/GPU 환경에서, ACPI Power meter module로 인해 시스템 장애 발생 가능 GPU환경에서 ACPI power meter module로 인해 IOMCA/UMCE 장애 발생 가능 Set acpi_power_meter on blacklist to not use it. 1) unload acpi_power_meter # modprobe -r acpi_power_meter 2) acpi_power_meter를 사용하지 않도록 등록 # echo "blacklist acpi_power_meter" > /etc/modprobe.d/blacklist-acpi_power_meter.conf # echo "install acpi_power_meter /bin/false" >> /etc/modprobe.d/blacklist-acpi_power_meter.conf 3) power1을 열람하지 않도록 .. 2022. 4. 13.
SR Controller/How to collect ADUreport How collect SR(SmartRAID, ex SmartArray) Contoller Diagnostics Tool log. CLI General ADUreport #/> ssa -diag -f adureport.zip SSD WearGauge #/> ssa -ssd -f ssdwear.zip Serial Output log #/> ssa -logs -f SRsob.zip Note. Linux: /usr/sbin/ssa Windows: C:\Program Files\Smart Storage Administrator\ssa\bin\ssa.exe GUI Smart Storage Administrator (SSA) > select Array Controller or Server > Diagnose > A.. 2022. 4. 3.
Gen10 plus / System Board 교체 시, PCI 확장장치의 구성 초기화 및 데이터 손실 발생 주의 필요 Gen10 plus / System Board 교체 시, PCI 확장장치의 구성 초기화 및 데이터 손실 발생 주의 필요 증상 일부 Gen10 plus 시스템에서, 장애 조치로 System Board 교체 시, 기존 구성되어 사용되던 PCI 확장 장치들의 구성 정보가 삭제/초기화되는 현상이 발생 Smart Array와 같은 HBA의 경우, 증상이 발생되면, Array 정보 소실에 따라, 데이터 손실이 발생할 수 있음. 또한, 볼륨 재구성 후 OS 재설치 및 데이터 복원 절차가 필요함. 원인 Gen10 plus 시스템의 System Board 교체 후 초기화 절차로, PCI 장치 정보의 공장 초기화 진행을 하도록 설정을 추가했고, 관련 초기화 절차가 다음 부팅 중에 진행됨 Note. 다음 부팅에서 시스템의 .. 2022. 2. 4.
Qlogic HBA, MPI Heartbeat stop Qlogic HBA, MPI Heartbeat stop SN1100Q와 같은 Qlogic HBA의 fw가 "01.73.08"인 상황에서, 아래 패턴의 로그와 함께 운영 중 예기치 않은 포트 다운 또는 리부팅이 발생되는 경우 HBA fw의 오류일 수 있음 Linux kernel: qla2xxx [0000:11:00.0]-ffff:0: MPI Heartbeat stop. Chip reset needed. MB0[8200h] MB1[100h] MB2[0h] MB3[0h] kernel: qla2xxx [0000:11:00.0]-d013:0: MPI Heartbeat stop. FW dump needed kernel: qla2xxx [0000:11:00.0]-d011:0: -> fwdt0 running... ke.. 2021. 11. 18.
iLO5/CPU 온도 표시 개선 iLO5/CPU 온도 표시 개선 환경: iLO 5를 사용하는 HPE ProLiant System 증상: HPE 시스템에서, iLO(IPMI)와 OS(MSR)의 측정 값이 다름: The third-party software read 74 degree value by CPU - OS 상의 Tool은 cpu의 MSR(Model specific register, Intel에서 정의한 cpu type에 따라 다른 정의된 정보를 갖는 레지스터) 정보를 접근 및 취합하여 보여줌 - 해당 값은 조회 당시의 순간(찰나)적인 값으로, cpu 운용 상황에 따라 매우 가변적 iLO(ipmi) read 56 degree value by CPU - iLO 상의 온도 값은 Intel ME(Management Engine)를 통해 .. 2021. 10. 19.
VMw 6.5.2/Online NIC fw upgrade Test System: DL380 Gen9+VMware ESXi 6.5 u2 Test device - 331x NIC. HPE Broadcom NX1 Online Firmware Upgrade Utility for VMware 1.28.6 (19 Apr 2021) https://support.hpe.com/hpesc/public/swd/detail?swItemId=MTX_648f0b90d7c2438b82851940e2#tab2 [root@DL380G9P5U25:/tmp/CP045013] ls CP045013.vmexe CP045013.vmfile CP045013_BUILD_13.data payload.json CP045013.vmexe64 CP045013.xml CP045013_VMw.zip [root@.. 2021. 7. 14.
반응형