레플리
글 수 203

신경망에 활성화 함수가 필요한 이유

조회 수 23714 추천 수 0 2019.05.14 16:52:42


60166079_666492127143254_8955792056735760384_n.jpg

 

59913452_666495820476218_1254050581220163584_n.jpg

 

59926815_666498673809266_3128399370328735744_n.jpg

 

https://www.facebook.com/groups/TensorFlowKR/permalink/900098033664589/

 

 

 

신경망에서 활성화 함수가 필요한 이유를 잘 설명한 글입니다. 과거 단층신경망인 퍼셉트론은 XOR 연산을 할 수가 없었습니다. 당시 기호주의 인공지능의 대가인 마빈 민스키가 이를 공격했고, 그후 신경망의 첫 번째 겨울이 시작되었습니다.

 

XOR 연산을 풀기 위해서는 신경망의 출력인 가설 공간을 비선형으로 분리해야 합니다. 직선 하나만으로 4개의 입력을 제대로 구분할 수 없기 때문입니다. 이를 위해서는 먼저 히든 레이어가 필요합니다. 하나의 층으로는 한 번만 분리가 가능하므로 레이어를 중첩하여 여러번 가설 공간을 나눌 필요가 있습니다.

 

두 번째는 비선형으로 된 활성화 함수로 신경망의 출력을 변환해야 합니다. 단순히 중간층을 연결한다고 비선형이 되지 않습니다. 선형 행렬과 선형 행렬을 곱하면 선형이 될 뿐입니다. 그래서 활성화 함수로 한 번 비선형 변환을 거쳐야 합니다.

 

예전에는 활성화 함수로 sigmoid나 tanh를 주로 사용했습니다. 그러나 양 끝의 정보가 없어지면서 그래디언트 소실 문제가 발생하는 것을 발견했습니다. 지금은 ReLU 같이 출력의 정보가 계속 유지되는 함수를 많이 적용합니다.

List of Articles
제목 글쓴이 날짜 조회 수sort
GPT3를 기반으로한 OpenAI API 유료화 깊은바다 2020-06-12 2535
경쟁을 통해 이미지를 생성하는 법을 배우는 GAN file 깊은바다 2017-03-20 2520
Stable Diffusion 포토샵 플러그인 깊은바다 2022-12-25 2392
라온피플의 머신러닝과 딥러닝 강의 깊은바다 2017-05-07 2381
핸즈온 머신러닝 2판 영문 초고 다운로드 깊은바다 2019-05-12 2352
구글이 만든 이미지 생성 딥러닝 BEGAN file [2] 깊은바다 2017-04-05 2304
얀 르쿤이 만든 최초의 CNN 테스트 영상 깊은바다 2020-01-19 2216
아카라이브 반실사 채널 - Stable Diffusion 실사 그림 file 깊은바다 2023-03-01 2104
자습해도 모르겠던 딥러닝, 머리속에 인스톨 시켜드립니다 [2] 깊은바다 2017-09-12 2092
GTA5로 자율주행 구현 영상 깊은바다 2019-05-08 1982
뭔가가 웹사이트를 하나 발견했는데... file [4] LegenDUST 2017-08-23 1979
사진 한 장으로 GAN 영상 생성 깊은바다 2019-05-23 1961
Style Transfer [1] NeuroWhAI 2018-04-21 1897
얀 르쿤의 자기지도학습 강의 - The Power and Limits Of Deep Learning file 깊은바다 2019-07-13 1896
일기를 쓰면 그림을 그려주는 그림일기 서비스 file 깊은바다 2022-11-08 1895