no image
[Book Review] 데이터 과학자 되는 법
이 책은 한빛미디어에서 출간되었으며, 데이터 과학 분야에 진출하고 싶은 사람이나 아직 데이터 과학 분야에서 일한지 몇 년 안된 사람들을 위해 만들어진 책이다. 책 제목에서 그렇듯 “데이터 과학자 되는 법”에 대해서 설명하고 있다. 자세히는 데이터 과학자의 역할과 직함에 따른 여러 직무를 소개하고, 데이터 과학자가 되기 위해 필요한 기술을 습득하는 다양한 방법에 대해 구체적으로 담았으며, 포트폴리오를 만드는 방법까지 설명하고 있다. 또한 데이터 과학 직무의 구직과정에 대해서도 아주 자세히 담았다. 커버레터 작성하는 법에서 직무별로 이력서를 다듬는 방법, 그리고 처우를 협상하는 방법까지! 데이터 과학에 발 담군지 몇 년 안된 이 시점에 이 책을 지금이라도 접할 수 있게 해준 한빛미디어와 글쓴이에게 깊은 감사..
2021.12.25
no image
[Book Review] 살아 움직이는 머신러닝 파이프라인 설계
“살아 움직이는 머신러닝 파이프라인 설계” 라는 책은 한빛미디어에서 발간되었고, SAP Concur의 Concur Labs 의 수석 데이터 과학자인 하네스 하프케와 캐서린 넬슨이 집필하였으며, 인공지능 업계에서 유명한 송호연님이 옮긴 책이다. 인공지능 프로젝트는 상당히 많은 부분을 자동화 소프트웨어로 대체 할 수 있다. 이 책에서는 머신러닝 파이프라인 자동화를 시작하는 명확한 지침을 제공한다. 뤼이드의 송호연님이 제시하고 있는 인공지능 프로젝트의 미래는 꽤 설득력 있다. 머신러닝 파이프라인을 세팅해주기만 한다면, AutoML을 수행하는 인공지능 에이전트가 해당 문제를 확인하고, 리소스를 얼마나 사용할지 사람에게 컨펌받고, 스스로 모델을 디자인하여 하이퍼파라미터를 최적화하고 이를 평가, 배포, 모니터링까지..
2021.11.21
no image
[Book Review] 쉽게 시작하는 캐글 데이터 분석
길벗 출판사에서 출간된 "쉽게 시작하는 캐글 데이터 분석" 책은 데이터 분석을 처음 시작하고자 하는 "캐글(Kaggle)"에 관심 있는 사람들을 위한 책이다. 기본적인 개념 및 예제로 머신러닝과 데이터 분석을 설명할 뿐 아니라 같은 데이터를 어떻게 바라보고 더 자세히 분석하는지를 쉽고 기발하게 설명해놓았다. 기본 언어는 파이썬이며, 캐글을 위한 절차와 대회에 참가하는 방법을 소개해놓았다. 또한 이 책에서 대표적으로 '타이타닉 생존자 예측' 문제와 '주택 가격 예측' 문제를 실행하며 사전 준비 과정부터 정확도를 높이는 단계별 프로세스까지 코드로 알기 쉽게 설명해놓았다. 길벗출판사 웹 사이트 : http://www.gilbut.co.kr 길벗, 이지톡 IT, 어학, 자기계발, 재테크, 인문, 여행 등 학습과..
2021.10.30
no image
[Book Review] 제대로 배우는 수학적 최적화
한빛미디어에서 우메타니 슌지(현재 오사카대학교 교수 재직, 수학적 최적화 모델 및 알고리즘 구현 문제 연구중)가 집필한 "제대로 배우는 수학적 최적화"라는 책이 출간되었다. 수학적 최적화라는 개념 자체가 꽤나 다양한 영역에서 다양한 문제로 나타나고 있기 때문에, 베이직한 개념을 숙지해두고, 여러 기법들을 다 알진 못하더라도, 짧게라도 키워드 등으로 기억해두면, 앞으로 실무에서 다양한 문제를 푸는 중요한 Key가 될 수 있을 것 같기 때문에 이 책을 읽게 되었다. 나의 짧은 지식으로 수학에서의 최적화라는 것은 특정한 수학적 문제에 대한 값이 최대나 최소가 되는 방향으로 해결하는 것이라고 알고있다. 이 책에서 말하는 수학적 최적화란 아래와 같다. 주어진 제약조건 아래 목적 함숫값을 최소(또는 최대)로 만드는..
2021.10.24
no image
[Book Review] 만들면서 배우는 파이토치 딥러닝
이 책은 전이학습/파인튜닝을 활용한 화상 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터의 감정 분석 그리고 동영상 데이터의 클래스 분류를 다루고 있는 책이다. 오가와 유타로라는 연구원이 기술했으며, '아크몬드'라는 필명으로 활동하고 있는 블로거 박광수님이 번역을 진행하였다. 지은이는 다음과 같은 멋진 말을 남겼다. 머신러닝과 딥러닝은 '단독'으로 이뤄진 총 같은 무기나 도구가 아닌 'OO X 딥러닝' 이라는 형태일 때 비로소 진정한 가치를 발휘합니다. '인사 업무 X 딥러닝', '영업 X 딥러닝', '제조업 X 딥러닝', '의료 X 딥러닝', '소매업 X 딥러닝' 등 OO에는 기업과 산업 그리고 직무 특성에 따른 도메인 지식과 과제가 해당됩니다. ..
2021.09.22
no image
[Book Review] 텐서플로 라이트를 활용한 안드로이드 딥러닝
모바일 분야(안드로이드, IOS 등)에서의 개발은 많은 코더들이 존재한다. 또한 딥러닝 연구자, 개발자들도 많이 존재한다. 하지만 이 두 분야를 모두 다룰 수 있는 전문가는 많지 않다. 특히 딥러닝을 활용한 서비스들은 모바일에서 수요가 꾸준하게 증가하고 있기 때문에 딥러닝 모델들을 모바일에 이식하여 배포할 수 있는 기술이 매우 중요해진 실정이다. 나같은 필자 또한 모바일에 딥러닝 모델을 배포하고 서비스하는 것에 관심이 많고, 앞으로도 중요한 핵심 기술이 될 것 같기 때문에 개인적으로 TensorFlow Lite를 공부하고 있었다. 하지만 나는 모바일 프로그래밍이라고는 대학교 2학년 때 안드로이드 어플을 간단히 만들어 본 적 밖에 없고, 딥러닝 모델을 개발한 적은 있어도 모바일 기기에 배포한 적은 없었기 ..
2021.08.16
no image
[Book Review] 업무에 바로 쓰는 SQL 튜닝
이 책은 이제 막 DB를 배우고자 하는 사람들에게 적격인 책이다. 본 책의 구성은 5개의 파트로 나눠져있으며, MySQL과 MariaDB 개요부터 시작해서 초보자가 데이터베이스의 기본을 잘 이해할 수 있게끔 적절한 설명과, 적절한 예시들로 설명되어있다. 특히 효율적인 MySQL 계열에서 쿼리를 잘 짜고싶은 개발자들에게 추천한다. 책 두께도 그렇게 두껍지 않아 SQL 튜닝 입문자들이 갖고다니면서 개념설명과 간단한 예제들을 술술 읽어볼 수 있을 것 같다. 특히나 4장에서 악성 SQL 튜닝으로 초보자 탈출하기 챕터에서 쿼리를 재작성하여 튜닝을 수행하는 실습을 진행하는 부분이 알찼던 것 같다. 한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다.
2021.07.25
no image
[Book Review] 데이터가 뛰어노는 AI 놀이터, 캐글
요즘 AI 관련 업계에서 취업을 하는데 있어서 필요한건 토익이나 컴퓨터 자격증 이런게 아니라 실무 경험이나 상위 컨퍼런스 논문 제출 경험, 외부 챌린지 참가 경험인 것 같다. 특히 이 외부 챌린지들 중에서 진입 장벽이 그나마 가장 쉬운 것은 캐글 아닐까 싶다. 캐글은 기업 및 단체에서 Prize를 걸고 데이터와 해결 과제를 등록하면, 데이터 사이언티스트들이 이를 해결하기 위해 모델을 개발하고 경쟁하게 되는 시스템이다. 캐글에서 과제들을 해결하고, 상위 랭킹을 진입을 한다면 해당 과제를 다루는 기업들에서 눈여겨 볼 만한 인재라고 생각하지 않을까 싶다. 이렇듯 캐글 상위 랭킹 진입을 위한 방법들을 소개한 "데이터가 뛰어 노는 AI 놀이터, 캐글" 이라는 고마운 책이 있다. 아마 이 책도 한 2년 지나면 쓸모..
2021.06.20
no image
[Book Review] High Performance Python - 고성능 파이썬
파이썬은 누구나 쉽게 데이터 전처리나 데이터 분석에 사용할 수 있다. 하지만 파이썬이 너무 고수준 언어이기 때문에 이를 실행해주는 운영체제나 컴퓨터 시스템 전반을 충분히 이해하지 못할 때가 많다고 한다. 데이터 과학 즉 머신러닝 분야에서 다루는 데이터의 양이 일반 개발자가 다루는 데이터의 양보다 훨씬 많으므로 대용량 자료구조를 처리하는 과정에서 병렬 처리의 어려움이나 메모리 장법, 성능 저하등을 더 자주 겪게 된다. 따라서 저수준의 최적화 기법이나 시스템을 이해하는 것이 필요한데, 그 부분을 메꿔줄 수 있는 방법이 바로 고성능 파이썬책이다. 그러므로 이 책의 대상 독자는 파이썬을 충분히 사용해보았으며, 특정 부분이 왜 느린지 생각해 본적이 있는 독자들을 대상으로 한다. 또한 CPU 성능 관련 문제를 겪는..
2021.05.23
no image
[Book Review] 실전 아파치 카프카
카프카는 2011년 미국 링크드인에서 출시되어 2021년 아파치 재단의 인큐베이션 프로젝트로 시작해 "아파치 카프카"라는 이름으로 출시되었다고 한다. 이는 대규모 메시징 시스템을 구현하기 위한 오픈소스 소프트웨어인데, 현재에는 다양한 기능들이 추가되어 데이터 로드, 데이터 처리를 위한 기능들을 포함하여 통합적인 데이터 처리 플랫폼으로 변모하고 있다고 한다. 내가 제일 궁금했던 것은 카프카를 이용하여 데이터 파이프라인을 구축하는 방법이였는데, 이 책의 6장에서 카프카를 이용한 데이터 파이프라인의 구성 요소부터 시작해 7장의 카프카 커넥트로 데이터 허브를 구축하는 방법까지 보고나서 데이터 허브 아키텍쳐를 어떻게 응용해야 할지에 대한 감이 잡혔다. 또한 Part 1 에서는 아파치 카프카에 대한 기본 개념들을 ..
2021.04.17
no image
[Book Review] 처음 배우는 셸 스크립트
여태 셸 스크립트는 항상 필요할 때 마다 구글링 해서 사용하곤 했었기에 공부할 필요성을 못느꼈었는데 ^^;;; (간단한건 외워서 쓰지만, 조금이라도 명령어가 길어지면 무조건 검색해서 쓰는 스타일...) 한빛미디어에서 자주 사용하는 셸 스크립트를 한데 모아 '처음 배우는 셸 스크립트'라는 책이 출간되었다고 해서 한번 읽어보게 되었다. 이 책은 자주 사용하는 리눅스 명령어 뿐만 아니라, 현업에서 사용할만한 셸 스크립트를 활용하는 예제들을 충분히 담고 있기 때문에 리눅스 개발자라면 필수적으로 보면 좋을 것 같은 책이다. 사실 현업에서 사용할만한 셸 스크립트들은 프로젝트를 하지 않고서는 접할 기회가 드물기 때문에 수많은 프로젝트를 통해 쌓아온 저자의 경험을 대리 경험해봄으로써 내 지식으로 만드는 시간을 가져다 ..
2021.03.16
no image
[Book Review] 코딩진로 (적극 추천)
이 책은 개발자, 취업 컨설턴트, 인사 담당자가 모여 IT업계에 취업하고 싶은 사람들을 위해 현실 조언과 꿀팁을 아끼지 않고 모조리 적어놓은 백과사전 같은 책이다. 특히나 저자 중에서 맹윤호님은 문과 출신으로 외국계 IT기업에서 일하기까지의 시행착오 및 커리어 관련 조언들을 샅샅히 적어놔서 현직자인 나도 꽤나 도움이 많이 되었다. 극히 공감했던 이야기들은 아래와 같다. 책 내용을 그대로 적은 것도 있고, 내가 추려 쓴 내용도 있다. * 직업을 선택할 때 일상적이고, 내가 편안해하고, 이 직업을 가꾸고 싶고, 시간을 투입해서라도 발전시키고 싶은 직업을 선택해야 한다. * 현재 IT 업계는 호황기인데, 호황기의 혜택은 IT가 잘나간다고 해서 이제 막 공부를 시작한 사람들이 누리는 것이 아니라, 불황기에도 끊..
2021.02.27