영진닷컴에서 2022년 1월에 출간된 “딥러닝을 위한 파이토치 입문” 책은 딥러닝을 배울 목적으로 파이토치를 배우고자 하는 입문자들을 위해 파이썬 자료형 개념부터 친절하게 설명하고있는 책이다. 파이토치를 능숙하게 다루기 위해서는 파이썬에서 리스트, 튜플, 딕셔너리를 자유자재로 다룰 수 있어야 한다. 이러한 개념을 포함하여 파이썬의 전반적인 개념을 2장에서 다루고 있다. 파이썬에서 필수적인 개념들만 쏙쏙 뽑아 다양한 예시를 통해 설명하고 있으며, 입문자들을 위해 쉽게 풀어쓰고 있기 때문에 이해가 훨씬 수월했다.
4장에서 다루는 파이토치 기본에서는 텐서의 개념부터 시작해서 커스텀 데이터와 커스텀 전처리를 사용하는 방법을 설명하고 있었다. 현업에서 데이터 엔지니어링을 하다보면 데이터를 전처리 할 때 딥러닝을 적용할 도메인에 맞는 전처리를 적용하게 되는데, 커스텀 전처리 함수를 작성하는 방법을 이 책에서 아주 자세하게 소개하고 있었다. 입문자들이 이해하기 쉽도록 __init__ 의 입력 값에 transfrom=None 값을 적게되면 아무 전처리도 사용하지 않겠다 라고 까지 상세하게 설명해주고 있어서, 딥러닝을 파이토치로 처음 배우는 사람들에게 친절한 입문 책이 되어줄 수 있을 것 같다.
CNN, LSTM, Auto Encoder, GAN 개념에 대해서도 이해하기 쉬운 그림을 통해 코드와 함께 자세하게 설명한다. 정말 필요한 대표적인 개념만 간단 명료하게 담고 있어서 좋았다. 만약 이것보다 더 자세하게 담거나, 입문에 적절치 않은 세세한 내용을 더 담았더라면 전반적인 개념을 이해하는데 도움이 되지 않았을 것 같다 라는 생각이 들었다. 이런 점에서 이 책은 이제 막 딥러닝을 배워보려고 시작한 사람들에게 추천하고 싶은 책이다.
특히 9장에서는 모델을 학습하면서 대표적으로 겪을 수 있는 문제인 과적합, 데이터 불균형, 데이터 부족을 해결하기 위한 방법들을 수록하였다. 실무에서 데이터 불균형 문제는 데이터 부족으로 인하여 자주 겪게 되는 문제이다. 이러한 데이터 불균형 문제를 해결하기 위해 이 책에서는 가중 무작위 샘플링(Weighted random sampling), 가중 손실 함수, 혼동 행렬(Confusion matrix) 기법들을 소개하고 있다. 또한 11장에서는 메타 러닝과 퓨샷 러닝의 개념을 소개하고 있다. 메타 학습이란 메타 데이터 즉 방대한 데이터를 이용하여 학습하는 방법을 학습하여 적은 데이터로도 새로운 문제를 빠르게 풀 수 있게 하는 방법론이다. 퓨샷 러닝은 적은 양의 데이터를 가진 여러가지 task 세트가 존재 할 때 그 task 세트를 가지고 학습하는 방법을 학습하여 새로운 task 에 대해 적은양의 데이터라도 빠르게 학습할 수 있는 메타 학습 방법 중 하나이다. 대표적인 방법에는 MAML(Model-Agnostic Meta-Learning)이 있다고 한다.
마지막으로 이 책의 부록에서는 딥러닝 정보 습득 방법에 대해서 다루고 있었다. 블로그, 뉴스, 유튜브, 캐글과 같은 Competition 사이트, 깃허브, 논문검색, 논문 참조 인용, 트위터 등을 추천하고 있다. 필자도 딥러닝에 관한 정보를 습득하기 위하여 위 방법들을 쓰고 있다. 특히 ECCV, ICCV CVPR 등 에서 채택된 논문들을 많이 참고 하였고, 그 논문들이 인용한 논문들을 여러개 많이 찾아보고 있다.
영진닷컴의 “딥러닝을 위한 파이토치 입문” 책은 딥러닝을 위해 필수적으로 배워야 할 개념들을 간단 명료하게 소개하고 있으며, 개념을 설명하기 위한 그림들을 다수 수록하여 폭 넓은 이해가 가능하도록 집필 되었다. 이 책을 파이토치를 통해 딥러닝을 배우고자 하는 입문러들에게 적극적으로 추천하고 싶다.
'Book Review' 카테고리의 다른 글
[Book Review] fastai와 파이토치가 만나 꽃피운 딥러닝 (0) | 2022.03.27 |
---|---|
[Book Review] 비전 시스템을 위한 딥러닝 (0) | 2022.02.23 |
[Book Review] 데이터 과학자 되는 법 (0) | 2021.12.25 |
[Book Review] 살아 움직이는 머신러닝 파이프라인 설계 (0) | 2021.11.21 |
[Book Review] 쉽게 시작하는 캐글 데이터 분석 (2) | 2021.10.30 |