본문 바로가기

Book Review

[책] 파이썬을 활용한 머신러닝 쿡북

 

 

파이썬을 활용한 머신러닝 쿡북

 

이 책은 머신러닝 입문 책이 아닌, 머신러닝의 실용적인 솔루션을 배울 수 있는 책이다. 

이미 딥러닝에 대해서 어느 정도 알고 있고, 유명한 모델들을 로드하여 실행해본 사람들이 타겟이며

또한 이 책이 "작업 기반" 접근 방식으로 머신러닝을 다루고 있다고 하는데, 목차를 보면 그 뜻을 알 수 있다. 

 

예를 들면 아래와 같다.

제 2장 데이터 적재 - 2.5 JSON 파일 적재하기

제 3장 데이터 랭글링 - 3.1 데이터프레임 만들기

제 6장 텍스트 다루기 - 단어 중요도에 가중치 부여하기

...

 

등으로 구성되어 있어서 머신러닝을 하는데 있어 필요한 팁들을 싸그리 모아놓은 책이라고 할 수 있다. 

옮긴이는 이 책이 일상적인 문제를 해결할 용도로 머신러닝 기술자의 책상에 모서리가 잔뜩 접힌 채 놓여 있으면 좋겠다고 했는데, 실제로 그럴만 한 책이다. 

 

또한 머신러닝으로 파이썬을 활용하여 기본적인 영상 처리를 하고자 하는 분들에게 꽤 도움이 될 수 있는 책이다. 

 

 

 

 

 

필자는 window 및 Pycharm 환경을 이용하여

이 책에 나와있는 간단한 영상처리 코드를 실행해보았다.

 

import cv2
import numpy as np
from matplotlib import pyplot as plt

image = cv2.imread("book.jpg", cv2.IMREAD_GRAYSCALE)
plt.imshow(image, cmap="gray"), plt.axis("off")
plt.show()

 

영상은 하나의 데이터이기 때문에 imread 를 사용할 경우 numpy.ndarray 라는 타입으로 변환하게 된다. 

$ type(image)
<class 'numpy.ndarray'>

 

이러한 이미지를 출력하여 실제 값을 확인 할 수도 있다. 

$ print(image)

[[211 196 155 ... 116 114 110]
 [182 199 172 ... 118 115 112]
 [199 215 202 ... 119 117 113]
 ...
 [  9   9   9 ...  15  15  15]
 [  9   9   9 ...  16  16  17]
 [  9  10  11 ...  16  15  13]]

 

 

또한 이미지의 해상도를 확인 할 수도 있는데, 이는 곧 행렬의 차원과 같다. 

$ print(image.shape)

(961, 720)