컴공과컴맹효묘의블로그

수알못의 머신러닝 공부 : 학습률(learning rate)을 적절히 설정하는 방법 본문

컴퓨터/머신러닝

수알못의 머신러닝 공부 : 학습률(learning rate)을 적절히 설정하는 방법

효묘 2019. 8. 15. 19:58
반응형

경사하강법에서 학습률이란 한번 학습할때 얼만큼 변화를 주는지에대한 상수입니다.

 

예를들어 부산에서 서울까지 가는데에 순간이동을 한다고 합시다. 만약 서울방향으로 10km씩 순간이동을 하면 금방 갈것입니다. 하지만 만약 1m씩 순간이동을 하면 너무 오래걸리겠죠. 그리고 1000km씩 순간이동을 하면 서울을 지나 오히려 더 멀어질것입니다. 얼마큼씩 이동할때 이 거리가 바로 학습률입니다.

 

이 블로그에서 처음 학습률이 등장하는 포스트 : https://hyomyo.tistory.com/13?category=820909

 

수알못의 머신러닝 공부 : 경사하강법

저번 시간에는 비용함수에 대해서 공부했습니다. 다시 정리하지면, 비용함수는 "오차를 표현해주는 미분 가능한 함수" 입니다. 비용함수가 오차들의(제곱의)평균이므로 오차의 최소값을 구해야겠죠? 실제로 최소값..

hyomyo.tistory.com

 

위에 비유한것 처럼 학습률이 너무 작으면, 학습하는데 너무 오래걸릴것이고, 혹은 학습률이 너무크면, 오차함수(비용함수)가 발산해버릴수도 있습니다.

 

적당한 학습률
너무 낮은 학습률
너무 높은 학습률

 

학습률을 적절히 지정해주어야 학습을 빠르고 정확히할 수 있습니다.

 

그런데 문제는 학습률을 지정할 방법이 없습니다. 그냥 아무 값을 대입해보고 너무 크다싶으면 낮추고, 너무 작다싶으면 높히는 방법밖에 없답니다..

 

보통 3배를 증감시켜서 학습률을 맞추어 나간다고 합니다.

반응형
Comments