728x90
반응형

에러 환경

  • Windows 10 64bits
  • CUDA 10.2
  • cudnn 8.0
  • TensorRT 7.2.1.6
  • Visual Studio 2019

 

위와 같은 환경에서 TensorRT 를 사용했을 때 cublas 와 관련된 에러가 다음과 같이 발생했었다. 

Assertion failed: cublasStatus == CUBLAS_STATUS_SUCCESS
C:\source\rtSafe\cublas\cublasLtWrapper.cpp:279
Aborting...
Builder timing cache: created 395 entries, 722 hit(s)
C:\source\rtSafe\cublas\cublasLtWrapper.cpp (279) - Assertion Error in nvinfer1::CublasLtWrapper::getCublasLtHeuristic: 0 (cublasStatus == CUBLAS_STATUS_SUCCESS)
Assertion failed: engine, file C:\path\test.cpp, line 418

 

"cublasStatus == CUBLAS_STATUS_SUCCESS" 라는 키워드로 구글링 했을 때 cuda 설정(환경설정 등)과 관련된 문제였고,

 

다시 cuda 설정을 하려던 참에 생각난게 있는데 

 

 

 

위와 같이 cuda 를 다운 받을 당시에 patch 1, patch 2 에 대한 생각이 스쳐 지나가서 

 

패치를 깔아 주었더니 문제가 싹 해결 되었다. 

 

자세히 내용은 읽어보지 않았지만 ...

 

cuBLAS 라는 키워드가 보여서 문득 이거 깔면 해결될거라고 생각했었는데, 

 

 

실제로 해결되서 기분이 좋다.

 

728x90
반응형