no image
[Paper Review] DCNv2 : Deformable Convolutional Networks v2
기존 DCN(Deformable Convolutional Networks) 설명은 아래 포스팅을 참고하기 바란다. 2020/03/08 - [AI Research Topic/Object Detection] - [Object Detection] Deformable Convolutional Networks Github : github.com/CharlesShang/DCNv2 CharlesShang/DCNv2 Deformable Convolutional Networks v2 with Pytorch. Contribute to CharlesShang/DCNv2 development by creating an account on GitHub. github.com Paper : arxiv.org/pdf/1811.111..
2020.11.01
no image
[Paper Review] An Image is Worth 16X16 Words : Transformers for Image Recognition at Scale
An Image is Worth 16X16 Words : Transformers for Image Recognition at Scale 위 논문은 자연어 처리(NLP) 분야에서 널리 사용되는 Transformer 개념을 컴퓨터 비전 분야에 적용해본 논문이다. 먼저 자연어 처리 분야에서 Transformer 개념은 어떤 것인지 살펴보는게 좋을 것 같다. NLP 에서의 Transformer 자연어 처리 분야에서는 문장과 같은 연결성이 중요한 시퀀스 데이터에서 RNN 계열의 모델이 많이 사용되는데 이는 직전의 출력 결과를 입력으로 사용하여 재귀적으로 활용하게 된다. 하지만 이는 좀 더 멀리 떨어진 단어 보다는 무조건 가까운 단어가 연관성이 높게 나타난다는 단점이 있다. 이러한 문제를 Long-term Depe..
2020.11.01
no image
꾸준함
2020.10.30 2년차 비긴어게인 교육 중 좋은 글
2020.10.31
no image
[Book Review] 나의 첫 파이썬
파이썬이라는 언어는 다른 언어에 비해 훨씬 적은 코드로 원하는 일을 할 수 있으며, 문법이 굉장히 깔끔한 편이다. 파이썬이 활용되는 분야는 굉장히 다양하여 프로그래밍을 처음 접하는 사람들에게 제일 먼저 추천해주고 싶은 언어이다. 우선 한빛미디어에서 출간된 "나의 첫 파이썬"이라는 책은 일단 무지 두꺼워서 파이썬 언어를 배우기 위한 바이블 같이 느껴진다. 책의 목차를 살펴보면 part 1 에서는 터미널에서 파이썬 실행하는 방법부터 시작해서 변수, 리스트 등의 가장 기초적인 부분부터 if, while 까지 다루고 있었다. 이후에 part 2 에서는 외계인 침공게임 이라는 게임 프로젝트에 대한 설명과 part 3 에서는 데이터 시각화를 위한 방법들을 설명하고 있다. 머신러닝을 파이썬으로 접하려는 학생들에게 더..
2020.10.25
[OpenCV] imwrite 시 확장자 지정 안할 시 나는 에러
cv::imwrite("result.jpg", frame); imwrite 시 확장자 지정 안할 시 나는 에러는 아래와 같다. OpenCV Error: Unspecified error (could not find a writer for the specified extension) in imwrite_, file ....../modules/imgcodecs/src/loadsave.cpp, line 677 terminate called after throwing an instance of 'cv::Exception' what(): ....../modules/imgcodecs/src/loadsave.cpp:677: error: (-2) could not find a writer for the specified..
2020.10.23
[TensorRT] Implicit vs Explicit
Pytorch 및 TensorFlow 등으로 생성된 deploy 모델의 배치 사이즈를 명시적으로 설정하여 TensorRT 모델을 변환 할 때 TensorRT 7 버전 부터 도입된 빌드 설정 값들 즉, Optimization Profiles 기능을 이용하여 모델을 변환하면 더욱 더 최적화 되어 변환 된다. * Optimization Profiles : docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html#opt_profiles Developer Guide :: NVIDIA Deep Learning TensorRT Documentation To optimize your model for inference, TensorRT takes your ne..
2020.10.21
[Video] ffmpeg, ffplay 및 vlc 간단 사용법
FFmpeg 이란? 마이클 니더마이어(Michael Niedermayer)의 주도하에 개발되고 있는 모든 동영상, 음악, 사진 포맷들의 디코딩과 인코딩을 목표로 만들어지고 있는 LGPL과 GPL 라이센스를 따르는 오픈소스 프로젝트 관련 프로그램(인코더와 디코더 등등)에서 표준이라 불리울 정도로 많은 프로그램들의 기반으로 이용되고 있다. 아래의 FFmpeg을 기반으로 하는 프로그램 리스트를 보면 알겠지만 거의 대부분의 비디오 관련 프로그램들이 사용하고 있다. FFmpeg 프로젝트 자체가 모든 영상의 디코딩/인코딩을 지향하기 때문에 추가적인 코덱의 설치가 필요없다. ffmpeg.exe 파일 하나로도 인코딩이 가능 멀티코어를 공식적으로 지원 한다. 따로 옵션을 적지않으면 모든 코어를 사용 VF(libavfil..
2020.10.20
no image
[Paper Review] ECA-Net : Efficient Channel Attention for Deep Convolutional Neural Networks
Paper : https://arxiv.org/pdf/1910.03151.pdf Github : https://github.com/BangguWu/ECANet BangguWu/ECANet Code for ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks - BangguWu/ECANet github.com ECA-Net 은 기존에 알려져있는 SENet 보다 성능이 좋아서 Object Detection, Image Classification, Object Segmentation 분야에서 사용되고 있는 모델이다. 기존 일반적인 CNN 구조에서는 Local Receptive Field 만을 가지고 학습을 하기 때문에 전체적인 ..
2020.10.10
no image
[Paper Review] BAM(Bottleneck Attention Module), CBAM(Convolutional-BAM)
BAM 및 CBAM 개요 Self-Attention 의 대표적인 네트워크인 BAM(Bottleneck Attention Module) 및 CBAM(Convolutional-BAM) 모듈을 잠깐 설명하도록 하겠다. 일단 두 모듈 모두 3D Attention Map 을 Channel-wise / Spatial-wise 로 분해하여 계산한다. 연산 및 파라미터 오버헤드는 1~2% 수준으로 매우 미미한 편이라고 한다. 이 두 모듈 모두 아주 단순한 pooling 및 convolution 으로 이루어져있다. BAM (Bottleneck Attention Module) 위와 같이 BAM 은 각 네트워크의 bottleneck 에 위치하게 된다. 여기서의 bottleneck 은 spatial pooling 이 이루어지..
2020.10.10
[참고자료] NVIDIA GTC 2020
TensorFlow Models github.com/tensorflow/models/tree/master/research/object_detection tensorflow/models Models and examples built with TensorFlow. Contribute to tensorflow/models development by creating an account on GitHub. github.com TensorFlow Models ZOO github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf2_detection_zoo.md tensorflow/models Models and examples built wit..
2020.10.06
no image
[Book Review] 처음 시작하는 딥러닝
책 리뷰 정말 오랜만인듯 하다. 먼저 이 책은 8월 20일날 한빛미디어에서 출간된 따끈따끈한 책이다. 제목에서도 알 수 있듯 딥러닝을 처음 접하는 사람들을 위해 만들어진 책이고, 기본적인 수학 이론 및 알고리즘, 가장 흔한 CNN, RNN 구현까지 한번에 해결 할 수 있는 책이다. 사실 딥러닝을 처음 입문하는 사람들은 "및바닥 부터 시작하는 딥러닝"이라는 책을 많이 접했을텐데, 그 책 못지않게 이 "처음 시작하는 딥러닝" 책도 입문서로 제격이다. 입문서 인 만큼 코드를 따라 하기 쉽도록 github 에서 예제 코드를 제공하고 있다. github.com/flourscent/DLFS_code flourscent/DLFS_code Code for the book Deep Learning From Scratch..
2020.09.27
no image
[TensorRT] Squeeze + Unsqueeze + expand_as 조합의 Pytorch 모델 사용 시 나타날 수 있는 이슈
환경 Pytorch 1.4.0 TensorRT 7.1.3.4 CUDA 10.2 cuDNN 8.0.0 본 포스팅은, Pytorch 모델 forward 일부 구현에서 squeeze + transpose + unsqueeze + expand_as 조합을 사용하여 Pytorch - ONNX - TensorRT 변환을 수행하였을 때 발생할 수 있는 이슈에 대하여 작성한 글이다. 결과적으로 위와 같은 조합을 이용하여 TensorRT 변환 과정에서 -1 이라는 dynamic 한 변수가 중간에 등장하여 변환 결과가 뒤틀리는 현상이 발생하는 것 같다. 이러한 결과는 (Pytorch 결과 == Onnx 결과) != TensorRT 결과 라는 결론을 짓게 된다. 이는 Output Node 가 여러 개 일 때 극명하게 드러날..
2020.09.16