Error : Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
2019년 3월 5일 기준
Anaconda를 이용하여 TensorFlow 1.13.1 버전을 설치하고 코드를 돌렸을 때 아래와 같은 에러 메세지가 떴다.
구동 환경
Ubuntu 16.04
CUDA 10.0
cuDNN 7.3.1
Anaconda 4.3.0
Python 3.6
Error : Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
도대체 갑자기 Convolution algorithm을 찾을 수 없다니 ...
TensorFlow 버그인 것 같다...
해결책 관련 링크 1 : https://github.com/tensorflow/tensorflow/issues/24496
해결책 관련 링크 2 : https://github.com/tensorflow/tensorflow/issues/24828
해결법 1-1 :
일반 TensorFlow 1.x 버전에서는 아래와 같이 코드를 수정하여 에러를 해결했다고 한다.
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.Session(config=config)
해결법 1-2 :
tf-nightly-gpu-2.0 preview(TensorFlow 2.0) 에서는 아래와 같이 코드를 수정하여 에러를 해결했다고 한다.
from tensorflow.compat.v1 import ConfigProto
from tensorflow.compat.v1 import InteractiveSession
config = ConfigProto()
config.gpu_options.allow_growth = True
session = InteractiveSession(config=config)
해결법 2 :
엔비디아 드라이버 버전을 최신으로 업데이트
sudo apt-get update
apt-cache search nvidia-driver
sudo apt-get install nvidia-418
sudo reboot
'삽질 기록' 카테고리의 다른 글
RuntimeError: cuda runtime error (11) : invalid argument at /pytorch/aten/src/THC/THCGeneral.cpp:663 (0) | 2019.04.05 |
---|---|
ModuleNotFoundError: No module named 'pip._internal' (0) | 2019.03.06 |
AttributeError: module 'tensorflow' has no attribute 'constant' (0) | 2019.03.05 |
ModuleNotFoundError: No module named 'cv2' (0) | 2019.03.05 |
AttributeError: module 'pip' has no attribute 'main' (0) | 2019.03.05 |