[Activity Recognition] 쓰러짐(Fall Down)행동 인식 관련 데이터 세트
Fall Down 관련 논문 UP-Fall Detection Dataset: A Multimodal Approach UP-Fall Detection Dataset: A Multimodal Approach Falls, especially in elderly persons, are an important health problem worldwide. Reliable fall detection systems can mitigate negative consequences of falls. Among the important challenges and issues reported in literature is the difficulty of..
[Pose Estimation] wrnchAI vs OpenPose
wrnchAI 의 포즈 추정 시스템과 OpenPose를 비교하였다. wrnchAI는 비디오로부터 인간의 모션과 행위를 분석하기 위한 Real-time 용 AI 소프트웨어 플랫폼 기업이다. 그 중 pose 를 추정하는 기술을 비교하였다. 홈페이지에서 보면 쏠쏠한 자료들이 많이 있다. wrnch - Artificial Intelligence For Real World Applications From making our world a safer place to staying healthier and having more fun, wrnchAI is changing how we interact with the world. Browse our enabled fe..
[Pose Estimation] PoseTrack Dataset
Introduction Pose Estimation 분야에서 가장 유명한 데이터 세트인 COCO, MPII 등에 이어 PoseTrack 이라는 데이터세트가 나왔다. PoseTrack 데이터 세트는 기존의 MPII Human Pose 데이터 세트가 포함되어 있다. 인간 포즈 추정 및 비디오 환경에서의 관절을 추적하기 위한 벤치마크를 담고 있다. 이 데이터 세트는 "Multi-Person Pose Estimation" 또는 "Multi-Person Pose Tracking" 에서 활용 할 수 있다. 1356 video sequences 46K annotated video frames 276K body pose annotations Annotaion 또한 비디오 시퀀스에는 다음과 같은 정보들이 포함되어있다. ..
[Pose Estimation] Upper Body Pose Dataset
VGG Human Pose Estimation Datasets : human upper-body pose dataset 총 5개의 데이터세트로 구성되어있다. YouTube Pose BBC Pose Extended BBC Pose Short BBC Pose ChaLearn Pose VGG Pose Datasets YouTube Pose [1] The YouTube Pose dataset is a collection of 50 YouTube videos for human upper body pose estimation. It consists of 50 videos found on YouTube covering a..
[Pose Estimation] CVPR 2019 accepted papers
"pose" 단어로 추출한 CVPR 2019 accepted papers 관련 분야 천천히 모두 정리할 예정 Pose2Seg: Detection Free Human Instance Segmentation Pushing the Envelope for RGB-based Dense 3D Hand Pose Estimation via Neural Rendering Self-Supervised Learning of 3D Human Pose using Multi-view Geometry FSA-Net: Learning Fine-Grained Structure Aggregation for Head Pose Estimation from a Single Image Does Learning Specific Features ..
[Object Detection] Image Labeling Tool
유명한 이미지 라벨링 툴 labelImg 이다. object detection 학습을 위해 영상에서 Bounding Box 를 지정하여 라벨링을 수행하고 그 bounding box 정보들을 .xml 로 저장 할 수 있다. tzutalin/labelImg :metal: LabelImg is a graphical image annotation tool and label object bounding boxes in images - tzutalin/labelImg 사용법은 간단하다. 1. 설치 $ pip install labelImg 2. 실행 $ labelImg 3. 폴더 지정 Open Dir Change Save Dir 4..
[Pose Estimation] Human Pose Estimation 최신 연구 동향 Papers With Code : Pose Estimation See leaderboards and papers with code for Pose Estimation 위 웹사이트에서 최신 Pose Estimation 에 관한 자료를 접할 수 있다. 본 포스팅은 위 자료에 근거하여 번역하고 정리한 글이다. Pose Estimation 컴퓨터 비전에서 객체의 위치(Position)와 방향(Orientation)을 탐지하는 일반적인 문제이다. 사람의 신체 관절인 키포인트(Keypoint)가 어떻게 구성되어있는지 위치를 측정(Localization)하고 추정(Estimation)하는 문제이다...
[Object Detection] Feature Pyramid Network (FPN)
석사 때는 Object Detection 이라는 분야를 컴퓨터비전 쪽으로 공부했었는데 최근들어 프로젝트를 수행하면서 당연히(?) 딥러닝 쪽으로 공부하고 있다. 원 논문 Lin, Tsung-Yi, et al. "Feature pyramid networks for object detection." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017. CVPR 2017 Open Access Repository Tsung-Yi Lin,..
[Pose Estimation] AlphaPose 정리 및 설치 방법
2018년 말 쯤 AlphaPose 라는 Real-Time 환경에서 Multi-Person Pose Estimation 및 Tracking 이 가능한 오픈 시스템이 발표되었다. 최근 (2019.04) 에는 MXNet 버전이 출시되었는데 이는 COCO validation set 기준으로 23 fps 를 달성한다고 한다. 23 fps 정도면 리얼타임 환경에서 적용 가능 할 수 있을 것으로 보인다. 이는 Pytorch 를 이용하여 작성되었으며 Linux 와 Windows를 모두 지원한다. 심지어 코드도 쓰레드로 구현되어있다. 아무튼 아마 이는 OpenPose의 뒤를 이을 자세 추정기가 되지 않을까 싶다. (내 생각) AlphaPose : Real-Time and Accurate Multi-Person Pose..
[Machine Vision] 머신비전 기술분석
머신비전 기술이란? 비전 센서를 이용한 검사/가공 장비들에 대한 자동화를 실현하는 기술이다. 최근 동향을 살펴보면 검사 대상이 소형화되고 내부 패턴이 복잡해지면서 고도의 영상처리 기술을 필요로 하고, 생산성 향상을 위한 고속처리 기술 또한 요구됨 기술적인 측면에서 알고리즘의 정확도 문제로 인해 완전 자동화는 힘들고 마지막 단계에서 검출된 결함들을 작업자가 한 번 더 확인하는 경우가 많아, 이러한 기술적인 한계를 극복하기 위해서는 빅데이터 기반의 딥러닝 기술을 활용해 검사 장비가 시간이 지남에 따라 자가 학습해 점점 정확도가 좋아지도록 해야 한다. 머신비전(machine vision) 시스템의 목표 머신비전의 목표는 영상으로부터 실제의 모델을 추출하는 것이다. 머신비전 시스템은 전경의 2 차원 투영(pro..
[Deep Learning] CNN(Convolutional Neural Network)
1. CNN, Convolutional Neural Network 개념 Convolutional Neural Network(이하 ConvNet)은 합성곱(Convolution) 연산을 사용하는 인공 신경망의 한 종류이다. ConvNet과 일반적인 신경망의 가장 큰 차이점은 ConvNet은 입력 데이터가 이미지라는 것이다. 이미지는 다음과 같이 행렬 형태로 이루어져있으며 또한, 이미지는 Width x Height x Depth 형태로 이루어져있다. 숫자 32가 의미하는 바는 픽셀 수를 뜻한다. 또한 ConvNet의 가장 큰 특징은 일반적인 신경망 앞에 여러 합성곱 계층을 붙인 형태로 이루어진다. (1). 특징 추출(Feature Extraction)(2). 분류(Calssification) 다음 그림과 같..
[Image Processing] Computer Vision 분류
컴퓨터 비전 분류 체계 하위 레벨 이미지 프로세싱과 피처 추출 컴퓨터 비전, 정규화, 연결주의, 형태론, 스케일-공간, 개념적 그룹화, 파형요소, 컬러, 센서, 광학, 레이저, 레이더 이미지 프로세싱, 복원, 개선, 필터, 이미지와 비디오 코딩 엣지 탐색과 분석, 라인, 세그먼트, 커브, 코너, 허프 변환 2D 피처 분석, 추출과 재현, 형상, 골조, 텍스쳐 2D 구역 세분화 기술, 스네이크, 활성 회곽선 이미지의 3D 재구성 X의 3D 형태, 쉐이딩, 텍스쳐, 레이저, 구조화된 빛, 포커스, 라인 드로잉 스테레오 : 2개 이상의 뷰를 통한 3차원 묘사, 양안으로 보는 시야, 3안으로 보는 시야 3D 사물 묘사와 계산 테크닉, 표면, 변형, 뷰 생성, 비디오 콘퍼런스 사물인식 등록, 포인트를 사용한 매칭..