SysFS had negative value (-1) 해결

ve.log·2023년 1월 27일
0

error_resolve

목록 보기
2/3

successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero

  • pthon gpu 연결하면서 해당 에러 발생 확인

  • NUMA란?
    불균일 기억 장치 접근(Non-Uniform Memory Access, NUMA)는 멀티프로세서 시스템에서 사용되고 있는 컴퓨터 메모리 설계 방법중의 하나로, 메모리에 접근하는 시간이 메모리와 프로세서간의 상대적인 위치에 따라 달라진다. NUMA구조에서 프로세서는 자기의 로컬 메모리에 접근할 때가 원격 메모리에 접근할 때보다 더 빠르다. 원격 메모리는 다른 프로세서에 연결되어 있는 메모리를 말하고 로컬 메모리는 자기 프로세서에 연결되어 있는 메모리를 말한다. 하나의 메인보드에서 여러 프로세서를 사용하면서 메모리 접근 효율을 높이기 위한 기술로 특정 프로세서가 메모리를 다 잡게되면 버스를 자기 혼자 독점하고있으니 다른 프로세서는 놀아야하는 상황이 발생하기 때문에 각 프로세서마다 메모리 구역을 나눠주고 ‘여기만 접근해’ 라고 지정하고 그걸 NUMA 노드라고 함.
    (https://lapina.tistory.com/137)
  1. device 확인 - 1)
lspci | grep -i nvidia

  1. device - 2)
cd /sys/bus/pci/devices
ll

  1. 연결확인
cat /sys/bus/pci/devices/0000\:01\:00.0/numa_node

-1 -> 연결이 안되었다는 표시

  1. 연결상태로 변경
echo 0 | sudo tee -a /sys/bus/pci/devices/0000\:01\:00.0/numa_node

해결

referces

https://sseongju1.tistory.com/17

profile
AI Engineer

0개의 댓글

관련 채용 정보