728x90
반응형


Decision Trees 


결정 트리는 어떤 항목에 대한 관측값과 목표값을 연결시켜주는 예측 모델에서 분류를 예측하기 위해 사용된다. 이는 통계학과 데이터마이닝, 기계학습에서 사용하는 예측 모델링 방법 중 하나이고, 의사를 결정하는데 있어서 아래 예시들 처럼 나무가지 형태로 내려가는 것이다. 


결정 트리의 과정은 다음과 같이 정의 될 수 있다.


 기존 데이터

↓ 학습 

 모델 구축

 ↓ 예측

 사용 가능 (input에 따른 output 도출)



아래 모델은 타이타닉호 탑승객의 생존 여부를 나타내는 결정트리이다. (sibsp는 탑승한 배우자와 자녀 수를 의미) 잎 아래의 숫자는 각각 생존 확률과 탑승객이 그 잎에 해당될 확률을 의미한다.





위 그림은 오늘 외출을 할지 말지 결정하는 결정트리이다. 루트노트에서부터 적절한 노드를 선택하면서 진행하다가 최종 결정을 내리게 되는 모델이다. 바람이 강해도 나갈 것이라고 결정을 바꾸고 싶으면 NO를 YES로 바꿔주기만 하면 간단하게 로직을 바꿀 수 있다. 


그러나 출력이 다양해지면 트리가 복잡해지고, 결과 신뢰도가 떨어질 수 있다는 단점이 있다. 그러므로 트리 사이즈를 최소화 할 수 있는 학습을 하는 것이 중요하다.




출처 : http://sanghyukchun.github.io/64/

728x90
반응형