GPU available power limitation below than 400W
HW: Apollo 6500 Gen10 plus (XL675d Gen10 plus or XL645d Gen10 plus)
Symptom: 일부 Apollo 6500 Gen10 plus System에 장착된 Modular GPU의 가용 전력 제한에 따른 성능 저하가 발생
nvidia-smi툴로 정보 열람 시, 전원 가용 한계치가 최대치(400W)가 아닌 정보로 설정됨
정상/기대 전력:
Power Readings
Power Management : Supported
Power Draw : 66.18 W
Power Limit : 400.00 W
Default Power Limit : 400.00 W
Enforced Power Limit : 400.00 W
Min Power Limit : 100.00 W
Max Power Limit : 400.00 W
이상 전력:
Power Readings
Power Management : Supported
Power Draw : 81.09 W
Power Limit : 400.00 W
Default Power Limit : 400.00 W
Enforced Power Limit : 350.00 W
Min Power Limit : 100.00 W
Max Power Limit : 400.00 W
Recommended Action: Advisory 내용을 바탕으로, Power Updater를 이용하여, 전력 제한 이슈 해소
참고자료.
Advisory: (Revision) HPE Apollo - Restore Default GPU Power Limit on Servers Configured with HPE NVIDIA HGX A100 8-GPU/ HPE NVIDIA HGX A100 4-GPU Baseboards That Display Lower Than Specified Power Limit Values for Accelerator Modules
https://support.hpe.com/hpesc/public/docDisplay?docLocale=en_US&docId=a00117033en_us