"나의 첫 머신러닝/딥러닝" 책으로 공부하며 정리하는 시간!
1. 지도학습과 비지도학습
지도학습(Supervised learning)이란?
- 정답을 알려주면서 진행되는 학습
- 학습시 데이터와 함께 레이블(정답)이 항상 제공되어야 함
- 정답 ≒ 실제값 ≒ 레이블 ≒ 타깃 ≒ 클래스 ≒ y값
- 주로 주어진 데이터와 레이블을 이용해 새로운 데이터의 레이블을 예측해야 할 때 사용됨
- 머신러닝 모델을 통해 예측된 값 = 예측값 ≒ 분류값 ≒ y hat
- 장점 : 테스트할 때 데이터와 함께 레이블을 제동해서 손쉽게 모델의 성능을 평가할 수 있음
- 단점 : 테이터마다 레이블을 달기 위해 많은 시간을 투자해야 함
- 대표적인 예 : 분류, 회기
비지도학습(Unsupervised learning)이란?
- 레이블(정답)이 없이 진행되는 학습
- 학습할 때 레이블 없이 데이터만 필요
- 데이터 자체에서 패턴을 찾아내야 할 떄 사용
- 장점 : 레이블을 제공할 필요가 없음
- 단점 : 레이블이 없기 때문에 모델 성능을 평가하는 데에 다소 어려움이 있음
- 대표적인 예 : 군집화, 차원축소
2. 분류와 회귀
분류란?
- 데이터가 입력됐을 때 지도학습을 통해 미리 학습된 레이블 중 하나 또는 여러개의 레이블로 예측
- 분리된 값으로 예측
1) 이진분류
- (예, 아니오), (남자, 여자)와 같이 둘 중 하나의 값으로 분류하는 경우
2) 다중분류
- (빨강, 녹색, 파랑) 중 하나의 색으로 분류하거나,
0부터 9까지의 손글씨 숫자 중 하나의 숫자로 분류하기처럼 여러 개의 분류값 중에서 하나의 값으로 예측
3) 다중 레이블 분류
- 데이터가 입력됐을 때 두 개 이상의 레이블로 분류
회귀란?
- 입력된 데이터에 대해 연속된 값으로 예측
- 날씨를 더움, 보통, 추움이라는 3가지로만 예측하는 분류와 달리,
회귀는 35도, 34.5도, 34도와 같이 정해진 레이블이 아닌 연속성을 가진 수치로 예측
[출처]
허민석, 『나의 첫 머신러닝/딥러닝』, 위키북스(2019), p14-15.
'Study' 카테고리의 다른 글
multiprocessing 겅부.. (0) | 2022.09.18 |
---|---|
local에서 ssh 서버에 띄운 jupyter notebook 붙기 (0) | 2022.02.06 |
BERT 이해하기 (0) | 2021.09.15 |
Neural Search 관련 공부 (2) | 2021.07.07 |