본문 바로가기

HW Knowledge273

Apollo 6500 Gen10 plus/GPU available power limitation below than 400W GPU available power limitation below than 400W HW: Apollo 6500 Gen10 plus (XL675d Gen10 plus or XL645d Gen10 plus) Symptom: 일부 Apollo 6500 Gen10 plus System에 장착된 Modular GPU의 가용 전력 제한에 따른 성능 저하가 발생 nvidia-smi툴로 정보 열람 시, 전원 가용 한계치가 최대치(400W)가 아닌 정보로 설정됨 정상/기대 전력: Power Readings Power Management : Supported Power Draw : 66.18 W Power Limit : 400.00 W Default Power Limit : 400.00 W Enforced Power L.. 2023. 5. 4.
RHEL 8.x/Intel E810 NIC의 VF(가상화)를 운용 중 간헐적인 예기치 않은 리부팅 발생 RHEL 8.5/8.6 환경에서, Intel E810 NIC의 VF(가상화)를 운용 중 간헐적인 예기치 않은 리부팅 발생 증상 RHEL8.5/8.6 환경에서, Intel E810 장치의 VF(Virtual Function, 가상화) 운용 시, 간헐적으로 예기치 않은 리부팅 발생 IML 상에 아래 중 한 개 이상의 정보가 확인됨 IML - One or more events recorded - Uncorrectable Error Detected on the Previous Boot. Error information logged to the Integrated Management Log. - Uncorrectable Machine Check Exception (Processor 1, APIC ID 0x0000.. 2023. 3. 9.
Linux/운영 중 amsd/smad 오류 이벤트 누적 발생 HPE ProLiant Gen10/Gen10 plus(iLO5) 환경에서, 리눅스 OS 를 운용 중, 아래 형태의 이벤트가 누적 발생 OS event - messages smad[]:[ERR ]: No iLO available smad[]:[ERR ]: ccb has error, try next smad[]:[ERR ]: Failed on receiving OPEN_PDU response from iLO Note. amsd/smad의 iLO 통신 시도 및 실패에 대한 로그가 지속 발생 및 기록. 발생된 이벤트 설명: "ccb has error, try next": smad is trying to connect to BMC device such /dev/hpilo/d0ccb2 but it cannot so.. 2023. 2. 25.
RHEL8.x/Installing the SmartPQI Drivers from Source System Information DL360 Gen10 plus(SA P408i-a SR Gen10) 1. Set SW level with SPP2021.10.1. System ROM 1.64 / IE 1.0.0.22.0 / SPS 4.4.4.202.0 / iLO 2.71 / SA 4.11 / 2. Install RHEL 8.2 and RHEL 8.4 / Tested - Server with GUI - Development Tools 3. Install additional packages 1) Install Prerequisites a. configure yum repositories b. Install packages https://docs.fedoraproject.org/en-US/epel/#How_.. 2023. 2. 1.
HPE recognized in the top 10 JUST 100 RANKINGS FOR 2023 7 Hewlett Packard Enterprise Company HPE We’re proud to be recognized in the top 10 #Just100 companies and the leader in our industry. View the 2023 list: https://hpe.to/60473TbEz The 2023 Just 100 rankings The 2023 JUST 100 list ranks the public companies leading the market on the issues of most importance to Americans, from workers to ethics to climate change. www.cn.. 2023. 1. 11.
Lenovo x3650 M5/운영 중 "816f011b0c01ffff" 관련 snmp alert 발 리부팅 시 발생 가능한 이벤트로, 무시 가능. System Information: Lenovo x3650 M5(Machine Type: 5462AC1) SW version: IMM2(Active) 3.08 TCOO18Z 2016/08/12 UEFI(Active) 2.10 TCE124M 2016/06/23 DSA 10.2 DSALA8I 2016/04/07 IMM Event Log - The server was powered-up via power pushbutton. - The connector FP LCD Cable configuration error has been repaired. The connector [PhysicalConnectorElementName] has encountered a conf.. 2022. 12. 14.
IMM상에 "Sensor raid vol state has transitioned to non-recoverable from a less severe state" 발생 IMM reports "Sensor raid vol state has transitioned to non-recoverable from a less severe state" - Lenovo System x https://support.lenovo.com/kr/ko/solutions/HT501282 https://datacentersupport.lenovo.com/kr/ko/solutions/HT501282 Symptom The Integrated Management Module (IMM) reports one (1) of the following errors with the RAID subsystem, but upon inspecting the RAID subsystem logs, no correspon.. 2022. 11. 18.
Apollo Gen10/Gen10 plus - iLO에서, 서버와 섀시의 SN이 다르게 표시되는 현상 Apollo Gen10/Gen10 plus - 일부 부품을 교체/조치한 후, Apollo System의 iLO에서, 서버와 섀시의 SN이 다르게 표시되는 현상 증상 드문 경우로(In rare case), 일부 부품(backplane/midplane/power delivery board 등)을 교체/조치한 후, Apollo System의 iLO에서 서버와 섀시의 Serial Number가 다르게/잘못 표시되는 현상이 확인됨 e.g.) Chassis SN이 "1234567890" 또는 사용하지 않는 다른 장비의 SN으로 표시됨 Note. 운영에 영향이 없으나, Asset 관리에 영향이 있을 수 있음. 원인 부품 교체/조치 과정에 알 수 없는 원인으로, SMBIOS 정보가 정상적으로 업데이트 되지 않은 경우 .. 2022. 11. 9.
iLO/The iLO health monitoring status of the device / adapter is not responsive 발생 증상: iLO Event Log(IEL)에 아래 형태의 메시지 발생 The iLO health monitoring status of the device / adapter located in Embedded Unknown 01 is not responsive. 원인: 일부/특정 장치가 iLO와 통신(상태 정보 전달) 실패를 경험 Note. MCTP(Management Component Transport Protocol)는 관리 목적의 프로토콜로 시스템 운영/서비스에 직접적인 영향을 주지 않음 Action Plan 1. What: MCTP 재설정 What if / next: 아래 MCTP 재설정 진행 중, MCTP factory reset 관련 메시지가 발생되는 경우, Cold Reboot (전원 Cable.. 2022. 9. 23.
반응형