no image
[Backbone] DreamTeacher: Pretraining Image Backbones with Deep Generative Models
Overview 오늘 리뷰할 논문은 NVIDIA, University of Toronto, Vector Institute, MIT에서 낸 "DreamTeacher: Pretraining Image Backbones with Deep Generative Models" 입니다. ICCV 2023에 채택되었네요. 이 논문에서는 downstream image backbone을 사전 학습 하기 위해 generative network를 활용하는 DreamTeacher 기법을 소개합니다. 즉, 생성 모델의 knowledge를 특정 인식 작업을 위해 잘 설계된 standard image backbone으로 추출하는거죠. 어떻게 보면 역으로 사용했다고 보면 되네요. 먼저 label-efficient semantic se..
2023.07.17
no image
[Diffusion] DISCO: Disentangled Control for Referring Human Dance Generation in Real World
Project page : https://disco-dance.github.io/ DISCO: Disentangled Control for Referring Human Dance Generation in Real World Generative AI has made significant strides in computer vision, particularly in image/video synthesis conditioned on text descriptions. Despite the advancements, it remains challenging especially in the generation of human-centric content such as dance synt disco-dance.gith..
2023.07.13
no image
[Model Optimization] Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware Optimizations
Paper : https://arxiv.org/abs/2304.11267 Blog : https://ai.googleblog.com/2023/06/speed-is-all-you-need-on-device.html Speed is all you need: On-device acceleration of large diffusion models via GPU-aware optimizations Posted by Juhyun Lee and Raman Sarokin, Software Engineers, Core Systems & Experiences The proliferation of large diffusion models for image generation has led to a significant in..
2023.07.12
no image
[Diffusion] 생성모델에서의 Latent Space, Latent Space Vector 개념
생성 모델은 해당 데이터의 분포를 따르는 기존에는 없던 새로운 데이터를 생성해내는 모델이다. 생성모델은 데이터의 분포를 학습하게 되는데, 데이터는 Latent Space를 가지고 있으며 학습 할 때 이 Latent Space를 학습하는 것이라고 할 수 있다. 참고로 latent는 데이터가 가지고 있는 잠재적인 변수를 뜻한다. Latent Vector는 한 이미지가 가지고 있는 잠재적인 벡터 형태의 변수이고, Latent Vector들이 모여서 latent space가 형성이 되는 것이다. Latent Space에는 우리가 학습시킬 이미지들이 Latent Vector의 분포 형태로 존재하게 되고 모델을 통해서 이미지가 가지고 있는 Latent의 분포를 학습하게 된다. 기존의 이미지 분류, 탐지 모델들은 이..
2023.07.07
no image
[Diffusion] ControlNet, Adding Conditional Control to Text-to-Image Diffusion Models
오늘 리뷰할 논문은 ControlNet 입니다. Stable Diffusion 구조를 이용하여 specific-task condition을 학습 할 수 있도록 한 end-to-end 모델입니다. ControlNet의 핵심은 Zero Convolution이라고 할 수 있겠네요. 이번 리뷰 논문은 pdf로 작업했기 때문에 이미지로 대체하여 업로드 합니다. 🫶
2023.07.07
no image
CVPR 2023 트렌드 페이지
https://public.tableau.com/views/CVPR2023SubjectAreasbyTeamSize/Dashboard2a?:showVizHome=no CVPR 2023 Subject Areas by Team Size 예기치 않은 오류 예기치 않은 오류가 발생했습니다. 이 오류가 계속 발생하면 Tableau Server 관리자에게 문의하십시오.... public.tableau.com 가트너 사이클 보다는 비전쪽 트렌트 훑기 좋은 것 같다.
2023.07.06
no image
롤 모델 설정하기
며칠 전 Google Campus Talk Series에서 진행된 구글 UX Design Lead로 일하고 계시는 김은주님의 커리어 관련 강연을 듣게 되었다. 은주님은 생각이 많은 서른살에게 라는 책의 저자이기도 하다. 나는 처음에 이 책을 통해 처음에 은주님을 접하게 되었고, 은주님이 블로그에 올려주시는 커리어 노트들을 보고 많은 영감을 얻고 있다. 이번 강연에서는 커리어, 성장, 도전 이라는 주제로 진행이 되었고, 은주님이 커리어 포트폴리오를 어떻게 쌓아올렸는지, 많은 것을 이루기 위해서 필요한 철칙이 무엇인지, 워커홀릭 또는 완벽주의자가 경계해야하는 것들 등의 좋은 이야기들을 들을 수 있는 값진 기회였다. 그 중 가장 기억에 남았던 것은 이렇게 많은 것을 이루기까지는 (UX Design Lead, ..
2023.06.29
no image
[Book Review] 개발자를 넘어 기술 리더로 가는 길
한빛미디어에서 출간된 개발자를 넘어 기술 리더로 가는 길은 내가 감명 깊게 읽은 책 "개발 7년차, 매니저 1일차"의 저자가 쓴 책이다. 또한 한 원서를 김그레이스라는 분이 번역했는데, 이 분은 커리어리에서 킴코더 이름으로 코딩, 개발과 관련된 노하우를 많이 공유해주면서 활동하시는 분이다. 평소에 이 분의 글을 자주 보곤 했는데, 이렇게 책으로 나오게 되니 더 읽고 싶어졌다. 개발자라면 앞으로 매니저 트랙을 탈 것인지, 기술 리더의 트랙을 탈 것인지를 결정해야 하는데, 이 책은 그 결정을 함에 있어서 길잡이를 해주는 책이다. 개발자라면 언젠가 한번은 꼭 결정해야하는 일이고, 이 두 가지 길의 성격은 매우 다르다. 매니저의 길은 명확하게 의사소통하고, 동료들이 더 나은 일을 할 수 있도록 돕는 역할을 한다..
2023.06.25
no image
[Object Tracking] Simple Online and Realtime Tracking
Paper : https://arxiv.org/pdf/2203.14360.pdf GitHub : https://github.com/noahcao/OC_SORT GitHub - noahcao/OC_SORT: [CVPR2023] The official repo for OC-SORT: Observation-Centric SORT on video Multi-Object Tracking. OC- [CVPR2023] The official repo for OC-SORT: Observation-Centric SORT on video Multi-Object Tracking. OC-SORT is simple, online and robust to occlusion/non-linear motion. - GitHub - n..
2023.06.19
no image
[Object Tracking] Tracking Everything Everywhere All at Once
Paper : https://arxiv.org/abs//2306.05422 GitHub : https://omnimotion.github.io/ Tracking Everything Everywhere All at Once Tracking Everything Everywhere All at Once omnimotion.github.io Google Research가 연구에 참여한 Tacking Everything Everywhere All at Once 논문은 비디오 프레임 내에 있는 full-length motion trajectory를 추정하는 새로운 방법을 제안하였습니다. 이전 optical flow 또는 particle video tracking 알고리즘 같은 경우 일반적으로 제한된 window 내..
2023.06.19
[Linux] 전체 프로세스 메모리 사용량 상위 10개 확인하기
아래 명령어는 현재 실행중인 모든 프로세스의 메모리 사용량으로 정렬 후 PID와 각종 메모리 사용률 및 프로세스를 상세하게 보여준다. $ ps -eo user,pid,ppid,rss,size,vsize,pmem,pcpu,time,cmd --sort -rss | head -n 11 참고자료 : https://www.runit.cloud/2020/11/linux-process-memory-usage.html 리눅스 메모리 사용 프로세스를 확인하는 2가지 방법 리눅스 서버에서 프로세스의 메모리 사용량을 확인하기 위한 방법을 알아보고, 아래 실습 내용을 통해 쉽게 사용할 수 있습니다. 커맨드 라인에서 ps와 top 명령어를 사용해서 메모리 사용량에 www.runit.cloud
2023.06.07
no image
[Backbone] VanillaNet: the Power of Minimalism in Deep Learning
Paper : https://arxiv.org/abs/2305.12972 GitHub : https://github.com/huawei-noah/VanillaNet GitHub - huawei-noah/VanillaNet Contribute to huawei-noah/VanillaNet development by creating an account on GitHub. github.com 오늘 리뷰할 논문은 얼마 전 등장한 VanillaNet 입니다. (참고로 Vanilla 라는 뜻은 without any customization 이라는 의미를 가지고 있습니다. default, ordinary, basic의 의미라고 보시면 됩니다.) 원래 backbone의 정설은 레이어가 복잡하고, 깊을 수록 좋은 성능을..
2023.05.26