본문 바로가기
Appz Knowledge/AI, DL, ML

CUDA/RHEL 7.9 + CUDA 11.4 + Driver 470.82.01

by 스쳐가는인연 2022. 8. 30.

System Information
ML350 Gen10 (51xx CPU)

1. Set SW level
System ROM 2.62 / IE 0.2.3.0.0 / SPS 4.1.4.601 / iLO 2.65

2. Set WP
a. Restore Set Default
b. Virtualization - Max Performance: Yes  

3. Install RHEL 7.9
a. Set "nomodeset" during Install
- Edit<E> GRUB: add "nomodeset"
  linuxefi /images/pxeboot/vmlinuz ... nomodeset

b. Server with GUI
+ Compatibility Libraries
+ Development Tools

c. Configure network

5. Install NVidia GPU Driver
a. blacklist nouveau and acpi_power_meter
# modprobe -r acpi_power_meter

# echo "blacklist acpi_power_meter" > /etc/modprobe.d/blacklist-acpi_power_meter.conf
# echo "install acpi_power_meter /bin/false" >> /etc/modprobe.d/blacklist-acpi_power_meter.conf

# vim /etc/sensors3.conf
   chip "power_meter-acpi-0"
   ignore power1


# modprobe -r nouveau

# echo "blacklist nouveau" > /etc/modprobe.d/blacklist-nouveau.conf
# echo "options nouveau modeset=0" >> /etc/modprobe.d/blacklist-nouveau.conf
# echo "install nouveau /bin/false" >> /etc/modprobe.d/blacklist-nouveau.conf

# cp /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.$(date +%m-%d-%H%M%S).bak
# dracut --omit-drivers nouveau -f

# grub2-editenv - set "$(grub2-editenv - list | grep kernelopts) nouveau.blacklist=1 rd.driver.blacklist=nouveau"
or grub2-editenv - set "$(grub2-editenv - list | grep kernelopts) nouveau.modeset=0"

# cp /boot/initramfs-$(uname -r)kdump.img /boot/initramfs-$(uname -r)kdump.img.$(date +%m-%d-%H%M%S).bak
# sed -i '/^KDUMP_COMMANDLINE_APPEND=/s/"$/ rd.driver.blacklist=nouveau"/' /etc/sysconfig/kdump
# kdumpctl restart
# mkdumprd -f /boot/initramfs-$(uname -r)kdump.img

# reboot


b. install GPU Driver
- configure yum repositories
# yum-config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/$distro/$arch/cuda-$distro.repo
# yum-config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repo

# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm

# yum clean expire-cache

# yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
# yum install gcc gcc-c++ freeglut-devel libX11-devel libXi-devel libXmu-devel make mesa-libGLU-devel freeimage-devel


# yum install elfutils-libelf-devel libglvnd-devel

cf.
$ sudo systemctl isolate multi-user.target
$ sudo systemctl start graphical.target

$ sudo systemctl set-default multi-user
$ sudo systemctl set-default graphical


$ sudo systemctl isolate multi-user.target

cf. CUDA 11.4 / 470.82.01
# wget https://developer.download.nvidia.com/compute/cuda/11.4.4/local_installers/cuda_11.4.4_470.82.01_linux.run
# chmod +x cuda_11.4.4_470.82.01_linux.run
# sh cuda_11.4.4_470.82.01_linux.run

Note. cf. Xserver관련 오류 예방
Driver: --no-opengl-files
CUDA: --no-opengl-libs 


$ sudo vim ~/.bashrc
PATH=/usr/local/cuda-11.4/bin:/usr/local/cuda-11.4/samples:/usr/local/cuda-11.4/samples/bin/x86_64/linux/release:${PATH:+:${PATH}}
LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

$ source ~/.bashrc

b. Install CUDA sample packages
$ cd /usr/local/cuda-11.4/samples
$ sudo make
$ sudo /usr/bin/nvidia-persistenced --verbose

$ sudo systemctl start graphical.target

 

Note. bandwidthTest / nbody 가 오류는 없는데(?) 생성이 되지 않음 ... 왜일까 ㅠ_ㅠ;;;

Note. CUDA 11.2로 변경 후, 패키지 설치는 되나, nbody GUI는 구동 실패... 뭐 땜시 안되는 것일깡 ... CLI는 되는데 ... 왱왱!!

 

 

 

 

반응형