[CUDA] CUDA C/C++ Basics Supercomputing 2011 Tutorial
참고자료 : https://www.nvidia.com/docs/IO/116711/sc11-cuda-c-basics.pdf
2022.02.22
[GPU] NVIDIA GPU 적정 온도 확인하기
NVIDIA 계열의 GPU의 온도를 확인하는 명령어는 다음과 같다. $ nvidia-smi -q -d temperature 아래는 현재 GPU의 Temperature 상태들을 나타낸다. ==============NVSMI LOG============== Timestamp : Thu Nov 18 15:52:50 2021 Driver Version : 460.73.01 CUDA Version : 11.2 Attached GPUs : 4 GPU 00000000:1A:00.0 Temperature GPU Current Temp : 64 C GPU Shutdown Temp : 90 C GPU Slowdown Temp : 87 C GPU Max Operating Temp : 83 C GPU Target Temper..
2021.11.18
no image
[GPU] GeForce 20 series
en.wikipedia.org/wiki/GeForce_20_series GeForce 20 series - Wikipedia Series of GPUs by Nvidia The GeForce 20 series is a family of graphics processing units developed by Nvidia.[4] Serving as the successor to the GeForce 10 series,[5] the line started shipping on September 20, 2018,[6] and after several editions, on July 2, en.wikipedia.org
2021.02.05
[CUDA] 기존 CUDA 버전 삭제하기
다음과 같이 간단하게 CUDA 관련 파일들을 제거할 수 있다. 이는 기존에 설치된 CUDA 를 제거하고 새로운 버전(다운 그레이드 또는 업그레이드)을 설치하기 위함이다. 1. CUDA 제거 sudo apt-get --purge remove 'cuda*' sudo apt-get autoremove --purge 'cuda*' 2. CUDA 관련 폴더 제거 sudo rm -rf /usr/local/cuda-11.0 sudo rm -rf /usr/local/cuda
2021.01.26
no image
[CUDA] Supported CUDA level of GPU and card
보다 더 자세한 사항은 맨 아래 링크를 참고하길 바란다. CUDA SDK 1.0 support for compute capability 1.0 – 1.1 (Tesla)[25] CUDA SDK 1.1 support for compute capability 1.0 – 1.1+x (Tesla) CUDA SDK 2.0 support for compute capability 1.0 – 1.1+x (Tesla) CUDA SDK 2.1 – 2.3.1 support for compute capability 1.0 – 1.3 (Tesla)[26][27][28][29] CUDA SDK 3.0 – 3.1 support for compute capability 1.0 – 2.0 (Tesla, Fermi)[30][31] CUD..
2021.01.11
[PyCUDA] PyCUDA 2019.1.2 소스 빌드하여 설치하기
CUDA 10.0 에서 CUDA 10.2 로 업데이트 하였을 때, 이미 설치가 되어있었던 pyCUDA 를 import 하였더니 아래와 같은 에러가 떴었다. ImportError: libcurand.so.10.0: cannot open shared object file: No such file or directory 이는 pyCUDA 가 자꾸 삭제된 CUDA 10.0 을 찾는 메세지 였고, linux 명령어인 find / -name "libcurand.so.10.0*" 으로 관련된 파일을 모두 삭제했는데도 불구하고 CUDA 10.0 을 찾는 문제가 발생하였다. 그래서 PyCUDA 를 다시 pip uninstall pycuda 하고 다시 설치하였는데도 불구하고 계속 같은 문제가 발생되어 cuda 10.2 을..
2020.07.13
[CUDA] CUDA Driver Version
CUDA Driver Running a CUDA application requires the system with at least one CUDA capable GPU and a driver that is compatible with the CUDA Toolkit. See Table 2. For more information various GPU products that are CUDA capable, visit https://developer.nvidia.com/cuda-gpus. Each release of the CUDA Toolkit requires a minimum version of the CUDA driver. The CUDA driver is backward compatible, meani..
2020.07.06
[PyCUDA] 정리중
https://documen.tician.de/pycuda/driver.html Device Interface — PyCUDA 2019.1.2 documentation Pagelocked Allocation pycuda.driver.pagelocked_empty(shape, dtype, order='C', mem_flags=0) Allocate a pagelocked numpy.ndarray of shape, dtype and order. mem_flags may be one of the values in host_alloc_flags. It may only be non-zero on CUDA 2.2 and newer. documen.tician.de https://documen.tician.de/pyc..
2020.05.14
no image
[GPU] GPU Performance 및 Titan V, RTX 2080 Ti Benchmark
TPU V100 TiTan V Titan RTX RTX 2080 Ti RTX 2080 Titan Xp Titan X GTX 1080 Ti RTX 2070 RTX 2060 GTX 1080 GTX 1070 Ti GTX 1070 GTX 1660 Ti GTX 1060 Titan V Benchmark FP32 TensorFlow Training Performance FP16 TensorFlow Training Performance RTX 2080 Ti Benchmark RTX 2080 Ti - FP32 TensorFlow Performance (1 GPU) For FP32 training of neural networks, the RTX 2080 Ti is... 37% faster than RTX 2080 35%..
2020.03.04
[CUDA] PyCUDA documentation
간단한 예제 import pycuda.autoinit import pycuda.driver as drv import numpy from pycuda.compiler import SourceModule mod = SourceModule(""" __global__ void multiply_them(float *dest, float *a, float *b) { const int i = threadIdx.x; dest[i] = a[i] * b[i]; } """) multiply_them = mod.get_function("multiply_them") a = numpy.random.randn(400).astype(numpy.float32) b = numpy.random.randn(400).astype(numpy...
2019.08.04
[CUDA] CUDA Capability 확인
CUDA 를 설치하면 아래와 같은 경로에 접속하여 ./deviceQuery 라는 명령어로 CUDA 정보를 확인 할 수 있다. 필자의 경우는 cuda 10.0 버전을 설치하였으므로 아래와 같은 경로에 들어갔고, 다른 버전인 경우 숫자를 바꾸어 폴더에 진입한다. $ cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery sudo make $ sudo make /usr/local/cuda-10.0/bin/nvcc -ccbin g++ -I../../common/inc -m64 -gencode arch=compute_30,code=sm_30 -gencode arch=compute_35,code=sm_35 -gencode arch=compute_37,code=sm_37 ..
2019.05.31
no image
[CUDA] Visual Studio 2015, OpenCV , CUDA 연동하기
opencv_cudaobjdetect300d.lib opencv_cudawarping300d.lib opencv_cudaimgproc300d.lib object tracking 관련 구글링을 하던 도중 써볼만한 코드가 생겨 테스트 해보려고 했는데 "cuda~~" 라는 헤더파일과 라이브러리 파일이 자꾸 없다고 떴다. 뭣도 모르고 opencv에 기본 내장되어있는 파일인줄알고 환경설정만 죽어라 삽질한 결과 CUDA 라는 프로그램을 opencv에 연동해야하고, 아래와 같은 cuda~~로 시작되는 라이브러리나 헤더파일은 그 프로그램에 들어있어서 연동하면 쓸 수 있게 되어있다고 한다. 간단히 말해서 GPU 관련된 클래스를 사용하기 위한 개발환경 설치 단계이다. 한참을 삽질하고 난 뒤에야 알게 된 결과... 조금 더..
2017.01.25