Book Review

[Book Review] 데이터가 뛰어노는 AI 놀이터, 캐글

꾸준희 2021. 6. 20. 23:02
728x90
반응형

 

 

 

요즘 AI 관련 업계에서 취업을 하는데 있어서 필요한건 토익이나 컴퓨터 자격증 이런게 아니라 실무 경험이나 상위 컨퍼런스 논문 제출 경험, 외부 챌린지 참가 경험인 것 같다. 특히 이 외부 챌린지들 중에서 진입 장벽이 그나마 가장 쉬운 것은 캐글 아닐까 싶다. 캐글은 기업 및 단체에서 Prize를 걸고 데이터와 해결 과제를 등록하면, 데이터 사이언티스트들이 이를 해결하기 위해 모델을 개발하고 경쟁하게 되는 시스템이다.

 

캐글에서 과제들을 해결하고, 상위 랭킹을 진입을 한다면 해당 과제를 다루는 기업들에서 눈여겨 볼 만한 인재라고 생각하지 않을까 싶다. 이렇듯 캐글 상위 랭킹 진입을 위한 방법들을 소개한 "데이터가 뛰어 노는 AI 놀이터, 캐글" 이라는 고마운 책이 있다. 

 

아마 이 책도 한 2년 지나면 쓸모 없는 책이 될 수도 있을만큼 딥러닝 분야 발전 속도가 너무 빠르기 때문에, 책을 접하자마자 빠르게 모두 다 완독해야 기술을 바로 써먹을 수 있을 것 같은 기분이 들었다. 당연하겠지만 책에서는 머신러닝 활용의 비즈니스적 측면에 관한 이야기는 하지 않는다. 이 책에서는 경진대회에 참가하려는 독자를 대상으로 하는 가이드북이라고 보면된다. 예측 모델을 구축하여 데이터 분석을 하는 분들에게 널리 참고가 될 수 있는 책이기 때문에 특징을 생성하는 방법, 검증, 매개변수 튜닝 등의 노하우나 포인트들을 설명한다. 

 

그리고 이 책에서 가장 마음에 들었던 부분은 앙상블 기법을 소개하는 부분이였다. 앙상블은 실제 real world 에 적용할 때 나타날 수 있는 문제점들을 보완할 수 있는 최선 책 중 하나이다. 실무와 캐글대회도 비슷하게 수백 개의 모델을 조합하였을 때 더 높은 성능을 나타내기 때문에, 앙상블 기법들을 익혀 두고 시도해보는 것은 실무를 경험적인 측면에서 다루는데 정말 좋은 방법이라고 생각한다. 

 

필자는 이 책에서 필요한 부분만 뜯어 보느라, 책 전체를 완독하지는 못했지만 전체적으로 보았을 때 경진대회의 시작부터 끝까지 상세 과정을 알려주기 때문에 캐글을 접하는 AI 관련 업계 직장인들, 대학원생 또는 학부생에게 정말 도움이 될 것 이라고 생각한다. 

 

 

 

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다. 

728x90
반응형