no image
[Object Detection] Deformable Convolutional Networks
Paper : https://arxiv.org/abs/1703.06211 Deformable Convolutional Networks Convolutional neural networks (CNNs) are inherently limited to model geometric transformations due to the fixed geometric structures in its building modules. In this work, we introduce two new modules to enhance the transformation modeling capacity of CNNs arxiv.org Project Page : https://github.com/msracver/Deformable-Co..
2020.03.08
no image
[Object Detection] EfficientNet and EfficientDet
1. EfficientNet : Improbing Accuracy and Efficiency through AutoML and Model Scaling 2. EfficientDet:Scalable and Efficient Object Detection 1. EfficientNet EfficientNet 은 위 그래프와 같이 압도적인 성능을 자랑한다. 위 그림 1에서도 알 수 있듯 EfficientNet-B7 이 GPipe 를 능가하였으며, 그럼에도 불구하고 파라미터의 사용량은 1/8 수준이다. 또한 실제 inference time 도 6배 빠르다고 한다. 이러한 성능이 가능했던 이유는 "compound cofficient" 를 사용하여 모든 차원의 깊이(depth) / 폭 (width) / 해상도(res..
2020.02.23
no image
[Video Surveillance] 영상 감시 분야에서 이상 탐지(Anomaly Detection)
영상감시(Video Surveillance) 분야에서는 CCTV 영상에서 사람의 비정상적인 행위를 탐지하거나, 사물의 비정상 상황을 인식하는 일이 중요하다. 예를 들어, 고속도로에서 차량 전복 사고가 일어나거나, 어린이 보호구역 보행로에 자전거 및 차량 출현 또는 지하철역에서 싸움 등이 발생하는 비정상(Abnomal) 케이스들을 탐지하여 사고를 예방하거나, 사고에 대한 적절한 대응을 해야한다. 이상 탐지(Anomaly Detection) 기술은 사실 오래전부터 연구되어왔던 분야이다. 이는 영상감시 분야 뿐만 아니라, 머신비전(Machine Vision) 분야에서 장비로부터 측정된 시계열 데이터를 기반으로 한 고장 예측, 제품 결함 검사 등 다양한 환경에 접목 될 수 있다. 1. 이상 탐지(Anomaly ..
2020.02.21
no image
[Object Detection] The Car Connection Picture Dataset
64,467 장으로 이루어진 자동자 데이터 세트 https://github.com/nicolas-gervais/predicting-car-price-from-scraped-data/tree/master/picture-scraper nicolas-gervais/predicting-car-price-from-scraped-data Picture and specifications scraper. Contribute to nicolas-gervais/predicting-car-price-from-scraped-data development by creating an account on GitHub. github.com 이미지 파일들로만 구성되어있으며, 이는 Object Classification 에서 활용 될 ..
2020.02.03
no image
[Paper Review] Imbalance Problems in Object Detection : A Review
Paper : https://arxiv.org/pdf/1909.00169v1.pdf Project page : https://github.com/kemaloksuz/ObjectDetectionImbalance kemaloksuz/ObjectDetectionImbalance Lists the papers related to imbalance problems in object detection - kemaloksuz/ObjectDetectionImbalance github.com 본 게시물은 위 논문을 번역하여 나름 .. 다시 정리한 글 입니다. 1. Introduction 객체 탐지(Object Detection, OD) 분야에 있어서 불균형(Imbalance) 문제는 피할 수 없는 주제이다. 객체 탐지란..
2020.01.30
no image
[Object Detection] darknet 으로 Gaussian YOLOv3 학습하기 (linux)
darknet 학습하기는 아래 포스팅 참고하시길 바란다. darknet 학습 준비하기 : https://eehoeskrap.tistory.com/367 [Object Detection] Darknet 학습 준비하기 환경 Ubuntu 16.04 GeForce RTX 2080 1. 학습 준비하기 1.1 COCO 데이터 세트를 이용한 학습 COCO 데이터는 2014 , 2017 로 나뉘어져 있는데, 홈페이지에서 다운 받을 수도 있지만, 크기가 너무 커서 유틸리티 cur.. eehoeskrap.tistory.com darknet custom 학습하기 : https://eehoeskrap.tistory.com/370 [Object Detection] darknet custom 학습하기 darknet 학습을 위해 ..
2020.01.29
no image
[Paper Review] M2Det : A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network
객체 탐지(Object Detection) 분야에서 객체 인스턴스(Instance)의 스케일(Scale) 변화는 주요 challenge 중 하나이다. 일반적으로 이 문제를 해결하기 위한 두가지 방법은 이미지 피라미드(Image Pyramid)에서 객체를 탐지하는 것과 입력에서 추출된 Feature Pyramid 에서 객체를 탐지하는 것이다. 전자의 방법은 메모리와 계산 복잡성을 증가시키기 때문에 효율성이 떨어지며, 후자의 방법은 트레이닝 및 테스트 단계에서 활용할 수 있고, 전자의 방법보다는 메모리와 계산 비용이 적게 든다. 또한 이 Feature Pyramid 는 End-to-end 방식이기 때문에 쉽게 통합이 가능하다는 장점을 가진다. M2Det(Multi-level and Multi-scale De..
2020.01.09
no image
[Object Detection] Gaussian YOLOv3
이번에 ICCV 2019 에서 발표된 Gaussian YOLOv3 이다. 이 논문은 자율주행 환경을 기반으로 연구되었으며, 자율 주행 차량에서 객체 탐지 알고리즘의 사용이 점차 중요해지고 있으므로 안전한 자율주행을 위해서는 "높은 정확도"와 "빠른 추론 속도"의 객체 탐지가 필수적이라고 한다. 또한 자율 주행중에 False Localization으로 인한 오탐(FP, False Positive)은 치명적인 사고로 이어질 수 있다. 따라서 Mis-localization 에 대처할 수 있는 객체 검출 알고리즘이 필요하다고 한다. 본 논문에서는 Gaussian Modeling 방법을 이용하여 one-stage 검출기로 대표적인 YOLOv3 의 경계 상자(Bounding Box)를 모델링하고 손실 함수(Loss..
2019.12.27
no image
[Object Tracking] SiamMask
이 논문에서는 실시간 객체 추적(Object Tracking) 및 Semi-supervised 기반의 객체 세그먼트를 모두 수행하는 방법을 설명한다. SiamMask 라고 불리는 이 방법은 바이너리 세그먼트 작업으로 Loss 를 Augmentation 시켜 객체 추적을 위해 Full-convolutional Siamese 접근법을 적용하여 학습 과정을 개선시킨다. 학습된 SiamMask는 단일 경계 상자(a single bounding box) 초기값에만 의존을 받으며, 초당 35 프레임의 회전이 가능한 경계 상자를 생성한다. 단순하며, 추적이 가능하고, 세그먼트 까지 가능함에도 불구하고 빠른속도를 보장한다. 네트워크 구성은 위와 같은데, 4-th stage 의 최종 컨볼루션 레이어 까지 백본으로 res..
2019.12.27
no image
[3D Reconstruction] Deep Structured Implicit Functions
3일 전에 나온 따끈 따끈한 논문을 소개한다. 3D Reconstruction / Modeling / Representation 분야와 밀접한 연관이 있다. Deep Structured Implicit Functions 라는 논문인데, 제안하는 DSIF(Deep Structural Implicit Functions) 알고리즘을 통해 표면을 정확하게 재구성하고, 효율적으로 계산하며, 다양한 모양의 범주를 일반화하고, Depth 카메라로부터 추론을 가능하게 하는 3차원 모양을 나타내고 학습할 수 있다고 한다. SOTA 인 OccNet 보다 10.3 정도 높은 성능을 제공하면서도 일관성 있게 각 입력에 대해 구조화된 3D 양상을 생성해낸다. 3D Shape Representation 분야는 표면의 재구성, 분..
2019.12.15
no image
[Paper Review] YOLACT : Real-time Instance Segmentation
You Only Look At CoefficienTs 이번 ICCV 2019 에 발표된 YOLACT 논문이다. 파이토치로 구현되어있다. https://github.com/dbolya/yolact Abstract YOLACT 는 Instance Segmentation 를 수행하기 위해 단순한 컨볼루션 모델을 제시한다. 이는 MS COCO 기준 29.8 mAP 및 33.5 fps 를 달성하여 실시간으로 객체를 탐지할 수 있다. 처음엔 프로토타입 마스크 세트를 생성하고, 인스턴스 별 마스크 계수(coefficient)를 예측한다. 그 다음 프로토타입을 마스크계수와 선형으로 결합하여 인스턴스 마스크를 생성하게 된다. 이 프로세스는 repooling에 의존하지 않기 때문에 고품질의 마스크를 생성할 수 있다고 한다..
2019.11.16
no image
[Pose Estimation] SMPL eXpressive
Expressive Body Capture : 3D Hands, Face, and Body from a Single Image https://eehoeskrap.tistory.com/226?category=705415 [Pose Estimation] 3D Deformation Model Human Pose Estimation 분야에서 핫한 Convolutional Pose Machines 을 이용해서 연구중인데, 내가 시도하려고 했던, 아니 향후 시도할 예정이었던 내용의 연구가 이미 발표되었다. (따끈 따끈한 1월 5일에!) 대단.. eehoeskrap.tistory.com Total Capture : A 3D Deformation Model for Tracking Faces, Hands, and Bod..
2019.11.02