nvidia-smi 시 에러가 나올때

TOLL TERRY·2022년 5월 20일
0

error_or_download

목록 보기
7/16

출처: https://biology-statistics-programming.tistory.com/158 [히비스서커스의 블로그]

lsmod | grep nvidia
sudo rmmod nvidia_drm 
sudo rmmod nvidia_modeset 
sudo rmmod nvidia_uvm 
sudo rmmod nvidia

rmmod: ERROR: Module nvidia_drm is in use

systemctl isolate multi-user.target 
modprobe -r nvidia-drm 
systemctl start graphical.target

rmmod: ERROR: Module nvidia_uvm is in use

rmmod: ERROR: Module nvidia is in use

sudo lsof /dev/nvidia*

543299

sudo kill pid 

출처: https://biology-statistics-programming.tistory.com/158 [히비스서커스의 블로그]


근데 이제 또하나의 문제가 발생해서 다시
작성한다.

rmmod: ERROR: Module nvidia_uvm is in use
이거 오류가 계속 나서 엄청 찾아봤는데,

sudo lsof /dev/nvidia*

이거를 해도 아무것도 안뜨는 경우가 발생했다. 즉 프로세스가 없는데
nvidia-smi 했을때 계속 무언가 켜져 있었다 .

그래서

reboot

재부팅을 시작하였다. 재부팅 해도 안되어서


nvidia-smi에 있던 값이 python train.py
라는 파일이 있었다.

 ps -ef | grep python

이게 뭐가 돌아가는 지 잘 몰라서
sudo kill를 못하고 있었는데


그냥 지웠다.

# pid = 4123
sudo kill -9 pid

이제 정상 작동 한다..

profile
행복을 찾아서(크리스 가드너)

0개의 댓글