텐서플로우 GPU 문제 [ Non-OK-status: GpuLaunchKernel(FillPhiloxRandomKernelLaunch<Distribution>, num_blocks, block_size, 0, d.stream(), key, counter, gen, data, size, dist) status: INTERNAL: invalid configuration argument Aborted (core dumped)]

boingboing·2022년 4월 12일
0
  • RTX 2080과 호환된다고 알려진 CUDA 10.1을 설치
  • CUDA 10.1과 호환되는 CuDNN 8을 설치

-> 텐서플로우가 GPU를 정상적으로 인식한다.

이거까지 해서 텐서플로우 실행 시 에러뜨는 문제는 해결됨.

그러나 새로운 문제 발생

This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations: AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
2022-04-12 11:13:00.509951: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1525] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 6387 MB memory: -> device: 0, name: NVIDIA GeForce RTX 2080 SUPER, pci bus id: 0000:21:00.0, compute capability: 7.5
2022-04-12 11:13:00.628163: F ./tensorflow/core/kernels/random_op_gpu.h:246] Non-OK-status: GpuLaunchKernel(FillPhiloxRandomKernelLaunch, num_blocks, block_size, 0, d.stream(), key, counter, gen, data, size, dist) status: INTERNAL: invalid configuration argument
Aborted (core dumped)

해결 시도

  • CUDA 10.1, CuDNN 8과 호환되는 텐서플로우 버전을 재설치, 파이썬 버전도 재설치.

https://lamttic.github.io/2017/01/02/01.html
https://stackoverflow.com/questions/50622525/which-tensorflow-and-cuda-version-combinations-are-compatible

0개의 댓글