'Loss Function' 태그의 글 목록

Loss Function

인공 신경망의 최적화 - 기울기 사라짐, 손실함수와 최적화

2021. 9. 23. 17:07

XOR 문제 다음으로 딥러닝 발전에 암흑기를 가져온 '기울기 사라짐(Vanishing Gradient)'에 대해 공부해본다.

인공신경망은 합성함수의 형태로 계산이 되어 결괏값이 나오는 형태이기 때문에, 그 미분은 연쇄 법칙을 통해서 계산이 됨
연쇄 법칙은 어떤 미분의 곱들로 계산이 됨
p1은 활성화 함수 a1에 가중치*x 해준 것
p1을 w1으로 미분한 값 = a1을 w1으로 미분한 값

최종적으로 입력값에 가중치들이 곱해지고 활성화 함수를 미분한 형태들을 볼 수 있음
역전파의 형태를 봤더니, 활성화 함수를 미분하는 과정이 들어 있는 것을 알 수 있음

빨간색으로 표시된 sigmoid는 스무스한 그래프를 가지고 있음
sigmoid를 미분하면 파란색 그래프로 표현됨
sigmoid 미분한 값들을 곱하면 엄청 작은 0에 가까운 수가 됨
우리가 구하고자 하는 미분 값이 0에 가까운 수가 될 수 있음

우리가 w1에 대해 업데이트하고 싶은데 미분 값이 0으로 가버리게 되면 w1이 되기 때문에
다음 가중치가 업데이터 되지 않는 현상이 발생함
이 것을 '기울기 사라짐'이라고 함
층을 깊게 하면 예측에 좋다고 생각을 했는데, 막상 업데이트를 하려고 하니까 연쇄 법칙이 이뤄지면서 미분 값이 0으로 가버리는 문제가 생김

ReLU 그래프의 0을 기준으로 왼쪽을 미분하면 0, 오른쪽을 미분하면 1
오른쪽 값의 경우 무조건 1이 나오기 때문에 sigmoid 보다는 좋음
Leaky ReLU 그래프를 사용하여 기울기 사라짐을 더 방지할 수 있음

손실 함수와 최적화에 대해 완벽한 이해가 되지 않더라도, 포인트는 꼭 알고 가자!!

하강법(Descent Method)의 한계

손실 함수 설계 시 W형 그래프인 경우 어디가 최솟값인지 알 수 없는 경우가 생기므로 U형 그래프로 설계하는 것이 좋음
대표적인 손실 함수(Loss function)의 특징 : MAE, MSE, Cross Entropy 함수는 볼록성(Convexity)을 지님
Loss Function은 Convex로 설계해주는 것이 가장 좋음

볼록성에 대해서는 아래에서 더 보자!

볼록성(Convexity)

두 점을 잡아 직선을 그었을 때 원래 있던 함수값보다 위에 있을 경우 Convex라고 이야기함

Loss Function을 Convex 형태로 만들 경우 최솟값을 찾기 쉬우므로 제일 좋음

Non-convex의 경우 시작 위치에 따라 global min으로 갈 수도 있고, local min으로 갈 수도 있기 때문에 최적화하는데 좋지 않음

Loss Function에서 max를 구하는 경우, Concave를 사용하면 좋음(-를 곱하면 min이 되므로 좋음)

두 점을 잡아 직선을 그었을 때 원래 있던 함수값보다 위에 있을 경우 Convex라고 이야기함

내용에 문제가 있으면 댓글로 알려주세요!

출처 : 인프런 - 실전 인공지능으로 이어지는 딥러닝 개념 잡기(딥러닝 호형)

저작자표시 비영리 변경금지

'딥러닝 공부' 카테고리의 다른 글

장단기 메모리와 게이트 순환 유닛(LSTM and GRU) (0)	2021.09.28
순환 신경망(Recurrent Neural Networks) (0)	2021.09.23
인공 신경망의 최적화 - 확률적 경사 하강법과 최적화 기법 (0)	2021.09.23
인공 신경망의 최적화 - 경사 하강법(Gradient Descent) (0)	2021.09.23
인공 신경망의 최적화 - 하강법(Descent Method) (0)	2021.09.23

인공 신경망 - 손실 함수(Regression & Classification)

2021. 9. 17. 01:15

손실 함수까지 공부하고 자러 가야게따 ㅠㅠ 화이팅!

손실 함수를 이해하려면 지도학습의 메카니즘을 알아야 한다고 한다.

지도학습이라고 하는 것은 모델이 학습하는 과정에서 정답을 알려주는 것이다.

Input 데이터가 들어오면 모델은 데이터를 분석함
모델에는 입력층과 은닉층, 출력층, bias로 구성되어 있음
output은 예측 값임
지도학습에서는 실제값과 예측값의 차이를 계산해서 예측을 잘했다 못했다를 판단함
예측이 얼마나 정확한지(실제 값과 예측 값이 얼마나 차이 나는지) 나타내는 척도를 손실 함수(Loss Function)라고 함
손실 함수가 작아지는 가중치를 찾는 것이 최적화
찾은 가중치로 모델을 업데이트함
업데이트된 모델에 다시 input을 넣고 output을 내서 예측 값을 확인함

손실 함수의 종류

회귀(Regression)
- 우리가 원하는 결괏값이 연속적인 변수인 것을 예측하는 문제
- 집값 예측, 온도 예측
- 단일 숫자, 실수 형태의 값을 얻을 수 있는 문제
분류(Classification)
- 우리가 원하는 결괏값이 클래스(class)라고 하는 유한한 모임으로 분류되는 문제
- 질병 예측(양성(1) 또는 음성(0)), 만족도 예측(1, 2, 3점)
  - 만족도를 1, 2, 3 이라고 구분 짓는 것을 라벨링(labeling)이라고 함
  - 1, 2, 3 숫자들을 라벨(label)이라고 함
  - 0과 1로만 구성된 원-핫 벡터(one-hot vector) (1,0,0), (0,1,0), (0,0,1)로 표현하는 방법은 원-핫 인코딩(one-hot encoding)이라고 부름
  - 호랑이, 개, 고양이를 0, 1, 2로 나타낼 때 숫자에 대소 관계가 존재하고, 이런 것이 모델에 예상하지 못한 영향을 미칠 수 있기 때문에 0과 1로 만들어진 원-핫 벡터를 사용함

Regression의 대표적인 함수

평균 절대 오차(Mean Absolute Error, MAE)
- 예측값과 실제값 차이의 절댓값을 기반으로 한 함수
- 예측값과 실제값의 수직 거리의 평균으로 표현한 함수
- 예측값과 실제값의 거리가 짧으면 손실이 작아짐
- V형 함수라서 미분 불가한 지점이 나옴
평균 제곱 오차(Mean Square Error, MSE)
- 예측값과 실제값 차이의 절댓값을 사용하지 않고 두 점의 거리를 이용하여 계산하는 함수
- 예측값과 실제값의 거리가 짧으면 손실이 작아짐
- U형 함수라서 모든 점에서 미분이 가능함
- 제곱식이 들어가기 때문에 절댓값 로스보다는 큰 로스 값이 나올 수 있기 때문에 MAE보다 성능이 좋지 않을 수 있음
평균 제곱근 오차(Root Mean Square Error, RMSE)
- MSE는 원래 단위를 제곱하여 결과를 내기 때문에, 같은 단위 크기로 만들어 주기 위해 MSE에 제곱근을 씌운 손실 함수

Classification의 대표적인 함수

교차 엔트로피 함수(Cross Entropy Function)
- 분류 문제를 위한 대표적인 손실 함수
- ^y(y_Hat)은 ont-hot vector로 나옴
- 주로 다중 분류에서 사용됨
이진 교차 엔트로피 함수(Binary Cross Entropy Function)
- 이진 분류 문제를 위한 교차 엔트로피 함수
- 이진 분류는 두 가지 상황을 분류하는 문제이므로 one-hot vector로 표현하지 않아도 됨
- 그래서 예측하는 단계에서 소프트맥스 함수를 사용하지 않고
- 시그모이드 함수를 사용함

내용에 문제가 있으면 댓글로 알려주세요!

출처 : 인프런 - 실전 인공지능으로 이어지는 딥러닝 개념 잡기(딥러닝 호형)

저작자표시 비영리 변경금지

'딥러닝 공부' 카테고리의 다른 글

인공 신경망의 최적화 - 하강법(Descent Method) (0)	2021.09.23
인공 신경망의 최적화 - 미분(Differentiation) (0)	2021.09.23
인공 신경망 - XOR 문제(XOR Problem) (0)	2021.09.17
인공 신경망 - 활성화 함수(Activation Function) (0)	2021.09.17
인공 신경망(Artificial Neural Networks) (0)	2021.09.16

PREV 1 NEXT

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

MINI

Loss Function

인공 신경망의 최적화 - 기울기 사라짐, 손실함수와 최적화

'딥러닝 공부' 카테고리의 다른 글

인공 신경망 - 손실 함수(Regression & Classification)

'딥러닝 공부' 카테고리의 다른 글

+ Recent posts

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역