준지도 학습과 비지도 학습에 대해 알아보자

학습 방법의 종류

  • 지도 학습(supervised learning)
    • 정답을 알려주며 학습시키는 방법
    • 라벨을 이용하여 정답을 맞혀가며 학습하는 방법
    • 예) Classification, Regression
    • 장점 : 높은 정확도(모델이 예측한 값이 비슷한지 아닌지 판단할 수 있기 때문), 학습 데이터에 대한 정확한 학습
    • 단점 : 라벨이 필요, 라벨링 오류의 위험 
    • 직관적인 메카니즘을 가지고 있어서 많이 사용됨
  • 준지도 학습(semi-supervised learning)
    • 라벨이 없는 데이터와 라벨이 있는 데이터를 모두 학습에 사용
    • 예) PseudoLabel
    • 장점 : 더 많은 데이터의 확보(사람이 직접하지 라벨링 하지 않기 때문에 빠름), 지도 학습 효과
    • 단점 : 라벨링의 불확실성(모델이 학습을 잘 못한 상태에서 PseudoLabel을 적용할 경우, 라벨이 틀린 경우가 많아짐)
    • 기본적인 메카니즘은 지도 학습
    • 라벨이 없는 데이터(실제값이 없음)는 PseudoLabel 방법을 사용해서 실제 값을 생성함
    • PseudoLabel 방법은 모델에 라벨링 없는 데이터가 들어갈 경우 나온 예측값을 라벨링으로 사용하도록 함
    • 즉, 모델한테 라벨링을 맡기는 것
    • 실제값이 있는 데이터의 경우, 출력 값과 실제값을 비교하고
    • 실제값이 없는 데이터의 경우, Pseudo 라벨 값을 비교함
    • 초기에 모델을 잘 구축해뒀을 경우, PseudoLabel이 꽤 괜찮은 라벨링을 해줌
  • 비지도 학습(unsupervised learning)
    • 정답을 알려주지 않고 학습을 시키는 방법
    • 라벨 없이 데이터의 특성을 파악하는 학습 방법
    • 예) Clustering, Generative models - GAN, Autoencoder
    • 장점 : 라벨 불필요
    • 단점 : 상대적으로 낮은 정확도(모델한테 데이터의 특성을 알아서 파악하라고 하기 때문에 컨트롤하기 힘듦)
    • 일반적으로 지도 학습보다는 정확도가 낮음
    • 라벨이 불필요하기 때문에 더 많은 데이터를 사용할 수 있음
  • 강화 학습(reinforcement learning)
    • 주위 환경으로부터 정보를 받아들여 학습을 하는 방법

 

 

 

내용에 문제가 있으면 댓글로 알려주세요!

 

출처 : 인프런 - 실전 인공지능으로 이어지는 딥러닝 개념 잡기(딥러닝 호형)

+ Recent posts