딥러닝 - 뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견

글 수 209

뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견

조회 수 868 추천 수 0 2021.03.12 17:18:02

깊은바다 *.52.246.214 http://aidev.co.kr/10277

뇌과학에서 오랫동안 논란이 되어왔던 개념으로 할머니 세포가 있습니다. 할머니의 기억이 담긴 뉴런을 찾는다는 소설에서 유래가 되었는데, 우리의 기억이 특정 세포 하나에 존재할지도 모른다는 주장입니다. 그러다 2005년 실제로 이런 뉴런을 발견합니다. 할리 배리를 보면 특정 뉴런이 활성화되고, 제니퍼 애니스톤을 보면 또 다른 뉴런이 활성화됩니다. 이때 사진만이 아니라 스케치 그림이나 '할리 베리'라고 쓰여진 글자를 봐도 마찬가지입니다. 이는 단순히 이미지가 아니라 개념 자체를 추상화한다고 볼 수 있습니다.

물론 뉴런 하나에 그런 정보가 모두 담겨있기는 불가능합니다. 대표적인 이미지 인식 모델인 CNN은 여러개의 층으로 구성되어 있습니다. 하위 층에서는 가로, 세로, 대각선 같은 단순한 패턴를 검출합니다. 상위층으로 올라갈수록 하위층의 패턴을 조합하여 복잡한 패턴을 인식합니다. 할리 배리 뉴런 역시 하위 뉴런들이 처리한 결과를 최종적으로 종합한 거라고 생각합니다.

http://aidev.co.kr/deeplearning/10254

얼마 전 OpenAI에서 발표한 CLIP을 소개한 적이 있습니다. 이 모델을 통해 딥러닝에서도 실제 뇌와 마찬가지로 할리 배리 뉴런이 있다는 것을 확인했다고 합니다. 스파이더맨의 사진이나 스케치, 글자 이미지를 봐도 동일한 뉴런 하나가 활성화됩니다.

이게 가능했던 이유는 CLIP의 학습방법 때문입니다. ImageNet에서는 정제된 사진만 포함되어 있습니다. 반면에 CLIP은 인터넷에서 사진과 그 설명 텍스트를 무작위로 수집했습니다. 예를 들어, 강아지라면 ImageNet에서는 강아지의 사진만 존재합니다. 하지만 CLIP은 강아지 사진, 강아지 스케치, 강아지 만화, 강아지라는 글자 등 모든 형태가 다 포함되어 있습니다. 그 사진에 대한 설명이 강아지이기만 하면 되니까요.

https://microscope.openai.com/.../image_block_4_5.../2364

OpenAI는 이런 각각의 뉴런을 시각화하기 위해 Microscope라는 도구를 제공하고 있습니다. 첫 번째 방법은 dataset examples입니다. 다양한 사진들을 입력으로 집어넣고 그 뉴런이 활성화되는지를 확인합니다. 두 번째는 feature visualizations입니다. 특정 뉴런이 최대로 활성화되도록 입력의 사진을 생성하는 방법입니다. 이 시각화 도구를 통해 지역, 사람, 감정, 종교 등 여러가지 개념들을 발견했습니다.

지금까지 딥러닝에서는 벡터를 통해 특정 개념을 표현했습니다. 워드임베딩에서는 사과라는 단어의 의미를 벡터로 나타냅니다. GAN에서는 얼굴 이미지가 하나의 벡터입니다. 여기에 안경 벡터를 더해주면 그 이미지에 자연스럽게 안경이 추가됩니다. 이제는 벡터가 아니라 뉴런 하나가 개념을 지닐 수 있다는 걸 알았습니다. 이를 활용하면 뭔가 새로운 돌파구가 생기지 않을까요. 최근 지식그래프와 같은 인과관계를 딥러닝에서 구현하려고 연구중입니다. 개념 뉴런을 조합하여 연결하면 신경망으로도 의미표현이나 추론이 가능할지도 모릅니다.

요즘은 딥마인드보다 OpenAI의 활약이 더 두드러지네요. 작년 GPT-3부터 올해 DALL-E와 CLIP까지 놀라운 모델들을 연이어 선보이고 있습니다. 앞으로 또 어떤 획기적인 발견을 보여줄지 기대가 됩니다.

< 블로그 >

https://openai.com/blog/multimodal-neurons/

< Distill >

https://distill.pub/2021/multimodal-neurons/

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator	깊은바다	2021-04-28	3109
말로 설명하여 이미지를 변형하는 GAN - StyleCLIP	깊은바다	2021-04-04	2201
GPT-3로 광고문구를 만드는 서비스 - Copy.ai	깊은바다	2021-03-22	857
딥러닝의 창시자인 제프리 힌튼이 구글에 합류하게 된 스토리	깊은바다	2021-03-18	645
뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견	깊은바다	2021-03-12	868
스냅챕의 디즈니 필터	깊은바다	2021-03-12	750
이젠 모델 구축도 학습도 필요없다, OpenAI의 이미지인식 모델 CLIP	깊은바다	2021-03-07	4951
사진 한 장으로 움직이는 얼굴을 만드는 사이트 - Deep Nostalgia	깊은바다	2021-03-01	4864
톰 크루즈의 딥페이크 영상	깊은바다	2021-02-28	885
문장을 사진으로 변환하는 GPT-3 모델, DALL-E	깊은바다	2021-01-09	1248
GAN으로 만든 얼굴을 테스트할 수 있는 뉴욕타임스의 기사	깊은바다	2020-11-24	955
알렉스넷과 Seq2Seq의 창시자 일리야 수츠케버(Ilya Sutskever)	깊은바다	2020-11-17	1118
GAN을 이용한 염색 및 헤어 스타일 합성 - 꽤 GAN찮은 헤어살롱	깊은바다	2020-10-29	3177
GAN의 상용화를 알리는 시작 - 포토샵 뉴럴 필터	깊은바다	2020-10-22	1111
이미지 생성모델에서 특징 벡터를 추출하여 사진을 조작하는 방법	깊은바다	2020-10-09	2017

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지