본문 바로가기

AI Development/GPU | CUDA | PyCUDA

(7)
[PyCUDA] PyCUDA 2019.1.2 소스 빌드하여 설치하기 CUDA 10.0 에서 CUDA 10.2 로 업데이트 하였을 때, 이미 설치가 되어있었던 pyCUDA 를 import 하였더니 아래와 같은 에러가 떴었다. ImportError: libcurand.so.10.0: cannot open shared object file: No such file or directory 이는 pyCUDA 가 자꾸 삭제된 CUDA 10.0 을 찾는 메세지 였고, linux 명령어인 find / -name "libcurand.so.10.0*" 으로 관련된 파일을 모두 삭제했는데도 불구하고 CUDA 10.0 을 찾는 문제가 발생하였다. 그래서 PyCUDA 를 다시 pip uninstall pycuda 하고 다시 설치하였는데도 불구하고 계속 같은 문제가 발생되어 cuda 10.2 을..
[CUDA] CUDA Driver Version CUDA Driver Running a CUDA application requires the system with at least one CUDA capable GPU and a driver that is compatible with the CUDA Toolkit. See Table 2. For more information various GPU products that are CUDA capable, visit https://developer.nvidia.com/cuda-gpus. Each release of the CUDA Toolkit requires a minimum version of the CUDA driver. The CUDA driver is backward compatible, meani..
[PyCUDA] 정리중 https://documen.tician.de/pycuda/driver.html Device Interface — PyCUDA 2019.1.2 documentation Pagelocked Allocation pycuda.driver.pagelocked_empty(shape, dtype, order='C', mem_flags=0) Allocate a pagelocked numpy.ndarray of shape, dtype and order. mem_flags may be one of the values in host_alloc_flags. It may only be non-zero on CUDA 2.2 and newer. documen.tician.de https://documen.tician.de/pyc..
[GPU] GPU Performance 및 Titan V, RTX 2080 Ti Benchmark TPU V100 TiTan V Titan RTX RTX 2080 Ti RTX 2080 Titan Xp Titan X GTX 1080 Ti RTX 2070 RTX 2060 GTX 1080 GTX 1070 Ti GTX 1070 GTX 1660 Ti GTX 1060 Titan V Benchmark FP32 TensorFlow Training Performance FP16 TensorFlow Training Performance RTX 2080 Ti Benchmark RTX 2080 Ti - FP32 TensorFlow Performance (1 GPU) For FP32 training of neural networks, the RTX 2080 Ti is... 37% faster than RTX 2080 35%..
[CUDA] PyCUDA documentation 간단한 예제 import pycuda.autoinit import pycuda.driver as drv import numpy from pycuda.compiler import SourceModule mod = SourceModule(""" __global__ void multiply_them(float *dest, float *a, float *b) { const int i = threadIdx.x; dest[i] = a[i] * b[i]; } """) multiply_them = mod.get_function("multiply_them") a = numpy.random.randn(400).astype(numpy.float32) b = numpy.random.randn(400).astype(numpy...
[CUDA] CUDA Capability 확인 CUDA 를 설치하면 아래와 같은 경로에 접속하여 ./deviceQuery 라는 명령어로 CUDA 정보를 확인 할 수 있다. 필자의 경우는 cuda 10.0 버전을 설치하였으므로 아래와 같은 경로에 들어갔고, 다른 버전인 경우 숫자를 바꾸어 폴더에 진입한다. $ cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery sudo make $ sudo make /usr/local/cuda-10.0/bin/nvcc -ccbin g++ -I../../common/inc -m64 -gencode arch=compute_30,code=sm_30 -gencode arch=compute_35,code=sm_35 -gencode arch=compute_37,code=sm_37 ..
[CUDA] Visual Studio 2015, OpenCV , CUDA 연동하기 opencv_cudaobjdetect300d.lib opencv_cudawarping300d.lib opencv_cudaimgproc300d.lib object tracking 관련 구글링을 하던 도중 써볼만한 코드가 생겨 테스트 해보려고 했는데 "cuda~~" 라는 헤더파일과 라이브러리 파일이 자꾸 없다고 떴다. 뭣도 모르고 opencv에 기본 내장되어있는 파일인줄알고 환경설정만 죽어라 삽질한 결과 CUDA 라는 프로그램을 opencv에 연동해야하고, 아래와 같은 cuda~~로 시작되는 라이브러리나 헤더파일은 그 프로그램에 들어있어서 연동하면 쓸 수 있게 되어있다고 한다. 간단히 말해서 GPU 관련된 클래스를 사용하기 위한 개발환경 설치 단계이다. 한참을 삽질하고 난 뒤에야 알게 된 결과... 조금 더..