"나의 첫 머신러닝/딥러닝" 책으로 공부하며 정리하는 시간!

1. 지도학습과 비지도학습

지도학습(Supervised learning)이란?

  - 정답을 알려주면서 진행되는 학습

  - 학습시 데이터와 함께 레이블(정답)이 항상 제공되어야 함

  - 정답 ≒ 실제값 ≒ 레이블 ≒ 타깃 ≒ 클래스 ≒ y값

  - 주로 주어진 데이터와 레이블을 이용해 새로운 데이터의 레이블을 예측해야 할 때 사용됨

  - 머신러닝 모델을 통해 예측된 값 = 예측값 ≒ 분류값 ≒ y hat

  - 장점 : 테스트할 때 데이터와 함께 레이블을 제동해서 손쉽게 모델의 성능을 평가할 수 있음

  - 단점 : 테이터마다 레이블을 달기 위해 많은 시간을 투자해야 함

  - 대표적인 예 : 분류, 회기

 

비지도학습(Unsupervised learning)이란?

  - 레이블(정답)이 없이 진행되는 학습

  - 학습할 때 레이블 없이 데이터만 필요

  - 데이터 자체에서 패턴을 찾아내야 할 떄 사용

  - 장점 : 레이블을 제공할 필요가 없음

  - 단점 : 레이블이 없기 때문에 모델 성능을 평가하는 데에 다소 어려움이 있음

  - 대표적인 예 : 군집화, 차원축소

 

2. 분류와 회귀

분류란?

  - 데이터가 입력됐을 때 지도학습을 통해 미리 학습된 레이블 중 하나 또는 여러개의 레이블로 예측

  - 분리된 값으로 예측

      1) 이진분류

      - (예, 아니오), (남자, 여자)와 같이 둘 중 하나의 값으로 분류하는 경우

      2) 다중분류

      - (빨강, 녹색, 파랑) 중 하나의 색으로 분류하거나,

        0부터 9까지의 손글씨 숫자 중 하나의 숫자로 분류하기처럼 여러 개의 분류값 중에서 하나의 값으로 예측

      3) 다중 레이블 분류

      - 데이터가 입력됐을 때 두 개 이상의 레이블로 분류

 

회귀란?

  - 입력된 데이터에 대해 연속된 값으로 예측

  - 날씨를 더움, 보통, 추움이라는 3가지로만 예측하는 분류와 달리,

    회귀는 35도, 34.5도, 34도와 같이 정해진 레이블이 아닌 연속성을 가진 수치로 예측

 

[출처]

허민석, 『나의 첫 머신러닝/딥러닝』, 위키북스(2019), p14-15.

'Study' 카테고리의 다른 글

multiprocessing 겅부..  (0) 2022.09.18
local에서 ssh 서버에 띄운 jupyter notebook 붙기  (0) 2022.02.06
BERT 이해하기  (0) 2021.09.15
Neural Search 관련 공부  (2) 2021.07.07

+ Recent posts