AI Research Topic/Action Recognition
[Action Recognition] Challenges
꾸준희
2020. 11. 8. 02:59
728x90
반응형
인간 행동 인식 분야에서 행동을 인식하는데 어려운 요인들은 다음과 같이 정리 할 수 있다.
Intra- and inter-class Variations
- 사람들은 동일한 행동에 대해 다르게 행동함
- 예를 들어 “Running” 같은 의미론적 행동에 대해 어떤 사람은 빠르게 달리거나, 어떤 사람들은 느리게 달리거나, 점프하며 달릴 수 있음
- 즉, 하나의 행동 범주에는 다양한 스타일의 행동들이 포함될 수 있음
- 또한 동일한 행동을 다양한 시점에서 캡쳐 할 수 있음 (front, side, top, …)
- 이러한 appearance variation 으로 인하여 행동 인식이 힘듦
- 그리고 “Running” 및 “Walking” 은 유사한 동작 패턴을 내포하고 있으므로 이를 기계가 구별하기가 힘듦
Cluttered Background and Camera Motion
- 대부분의 인간 행동 인식 방법은 실내에 한해 통제된 환경에서 잘 작동하지만 통제되지 않은 실외 환경에서는 작동하기가 어려움
- 이는 Background Noise 때문
- 외부 요인으로 인하여 Camera Motion 이 일어날 수 있으며 동작 특징을 잘 추출하기 위해서는 카메라 움직임을 모델링하고 보정하는 것이 필요
- illumination condition, viewpoint change, dynamic background 등의 문제로 인해 어려움
Insufficient Annotated Data
- HMDB51 및 UCF-101 과 같은 데이터는 수 천개의 비디오가 포함되어 있지만 수 백만개의 매개 변수를 사용하여 딥러닝 모델을 학습 시키기에는 충분치 않음
- Youtube-8M 및 Sports-1M 데이터 세트는 수 백만개의 행동 비디오를 제공하지만 행동 라벨이 검색에 의해 생성되었기 때문에 신뢰성이 떨어짐
- 이러한 데이터들은 행동 인식의 성능을 저하시킴
- 따라서 레이블이 존재하는 데이터와 레이블이 존재하지 않는 데이터 모두에서 행동을 인식할 수 있도록 모델을 설계하는 것이 중요함
Paper
- Kong, Yu, and Yun Fu. "Human action recognition and prediction: A survey." arXiv preprint arXiv:1806.11230 (2018).
Link
Human Action Recognition and Prediction: A Survey
Derived from rapid advances in computer vision and machine learning, video analysis tasks have been moving from inferring the present state to predicting the future state. Vision-based action recognition and prediction from videos are such tasks, where act
arxiv.org
728x90
반응형