레플리
글 수 203

신경망에 활성화 함수가 필요한 이유

조회 수 23723 추천 수 0 2019.05.14 16:52:42


60166079_666492127143254_8955792056735760384_n.jpg

 

59913452_666495820476218_1254050581220163584_n.jpg

 

59926815_666498673809266_3128399370328735744_n.jpg

 

https://www.facebook.com/groups/TensorFlowKR/permalink/900098033664589/

 

 

 

신경망에서 활성화 함수가 필요한 이유를 잘 설명한 글입니다. 과거 단층신경망인 퍼셉트론은 XOR 연산을 할 수가 없었습니다. 당시 기호주의 인공지능의 대가인 마빈 민스키가 이를 공격했고, 그후 신경망의 첫 번째 겨울이 시작되었습니다.

 

XOR 연산을 풀기 위해서는 신경망의 출력인 가설 공간을 비선형으로 분리해야 합니다. 직선 하나만으로 4개의 입력을 제대로 구분할 수 없기 때문입니다. 이를 위해서는 먼저 히든 레이어가 필요합니다. 하나의 층으로는 한 번만 분리가 가능하므로 레이어를 중첩하여 여러번 가설 공간을 나눌 필요가 있습니다.

 

두 번째는 비선형으로 된 활성화 함수로 신경망의 출력을 변환해야 합니다. 단순히 중간층을 연결한다고 비선형이 되지 않습니다. 선형 행렬과 선형 행렬을 곱하면 선형이 될 뿐입니다. 그래서 활성화 함수로 한 번 비선형 변환을 거쳐야 합니다.

 

예전에는 활성화 함수로 sigmoid나 tanh를 주로 사용했습니다. 그러나 양 끝의 정보가 없어지면서 그래디언트 소실 문제가 발생하는 것을 발견했습니다. 지금은 ReLU 같이 출력의 정보가 계속 유지되는 함수를 많이 적용합니다.

List of Articles
제목 글쓴이 날짜 조회 수
불쾌한 골짜기에서 대유쾌 마운틴으로 - 이미지 생성AI file 깊은바다 2023-03-08 7224
아카라이브 반실사 채널 - Stable Diffusion 실사 그림 file 깊은바다 2023-03-01 2176
사인필드 시트콤을 패러디한 AI 생성 애니메이션 방송 file 깊은바다 2023-02-01 405
글로 설명하면 음악을 만들어주는 딥러닝 모델 - MusicLM 깊은바다 2023-01-27 447
Stable Diffusion 포토샵 플러그인 깊은바다 2022-12-25 2411
GPT : 도래한 초거대 AI의 시대, 빅테크가 주도할 수 밖에 없는 이유 file 깊은바다 2022-12-22 331
Stable Diffusion을 사용한 사진 변환 앱 Lensa AI, 앱스토어 1위 달성 깊은바다 2022-12-09 786
NVIDIA가 발표한 Text-to-3D 모델 - Magic3D 깊은바다 2022-11-22 654
아이폰에서 실행하는 Stable Diffusion 앱 - Draw Things 깊은바다 2022-11-11 1311
일기를 쓰면 그림을 그려주는 그림일기 서비스 file 깊은바다 2022-11-08 1916
World Models를 만든 David Ha, 구글에서 StabilityAI로 이적 file 깊은바다 2022-10-11 366
인공지능 킬러앱의 등장, 그리고 모바일에서 인공지능으로 패러다임 변환 file 깊은바다 2022-10-10 513
Text-to-Image 모델을 정리한 글 - The State of AI and Art 2022 깊은바다 2022-10-06 1196
Text-to-3D인 DreamFusion과 Text-to-Video인 Make-A-Video 깊은바다 2022-10-01 440
Stable Diffusion으로 만든 뮤직비디오 영상 깊은바다 2022-09-25 1136