레플리
글 수 282

딥러닝 상식추론 모델- COMET

조회 수 463 추천 수 0 2020.05.04 21:50:06


EH20AaAU8AElUkc.jpg

 

EH271wWUcAAqvU0.jpg

 

 

 

게리 마커스는 뉴욕대 심리학과 교수로 그동안 딥러닝의 한계를 지적해왔습니다. 신경망이 인과관계를 파악하기 위해서는 과거와 같은 기호적인 방법을 도입해야 한다고 주장합니다. 반면에 힌튼, 벤지오, 르쿤은 딥러닝 안에서 인과적인 처리가 필요하다며 설전을 벌이기도 했습니다.

 

"What happens when you stack kindling and logs in a fireplace and then drop some matches is that you typically start a -> ick?"

 

작년 말에는 위과 같은 트윗을 남기며 또 다시 딥러닝을 비판했습니다. 사람은 정답인 fire를 쉽게 알 수 있습니다. 하지만 GPT2는 ick라는 잘못된 단어를 출력합니다. 여기에 워싱턴대 최예진 교수님이 반박하는 답글을 달았습니다. 현재 개발중인 딥러닝 상식추론 모델 COMET은 'to start a fire' 처럼 근접한 대답이 나옵니다.

 

 

 

COMET의 구현과정은 다음과 같습니다. 먼저 크라우드소싱으로 예문에 대한 원인과 결과 문장을 사람이 작성합니다. 그다음 트랜스포머에 (질문, 관계)를 넣으면 (대답)이 나오도록 학습니다.

 

(영화를 보고 싶다, 원인) -> (재미를 얻기 위해)
(영화를 보고 싶다, 결과) -> (극장에 간다)

 

딥러닝도 방법을 달리 하면 인과관계를 처리할 수 있음을 보여주고 있습니다. 아직은 기초적인 수준이지만 앞으로 계속 발전하길 기대해봅니다.

 

 

 

< COMET 테스트 >
-> https://mosaickg.apps.allenai.org/comet_atomic

 

< 관련 기사 >
-> https://www.quantamagazine.org/common-sense-comes-to-computers-20200430/

 

List of Articles
제목 글쓴이 날짜 조회 수
구글의 초거대모델 PaLM의 추론과 상식 능력 file 깊은바다 2022-05-20 838
글자, 사진, 영상을 동시에 처리하는 딥마인드의 딥러닝 모델 - Flamingo file 깊은바다 2022-05-10 1424
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개 깊은바다 2022-05-04 1188
GPT-3보다 3배 더 큰 구글의 초거대모델, PaLM file 깊은바다 2022-04-07 1407
초거대모델의 파인튜닝 방법 - P-tuning과 LoRA file 깊은바다 2022-04-05 12032
교육용 챗봇의 미래!? 구글 람다 (LaMDA) 깊은바다 2022-03-11 1361
하이퍼클로바 활용예 및 사용가이드 file 깊은바다 2022-03-05 3568
네이버의 초거대모델인 하이퍼클로바 사용 후기 깊은바다 2022-02-14 3169
구글의 대화기반 초거대모델 LaMDA, 논문 공개 file 깊은바다 2022-02-08 1359
프로그램을 작성하는 딥마인드의 알파코드 file 깊은바다 2022-02-04 1005
GPT-3를 강화학습으로 업그레이드한 InstructGPT file 깊은바다 2022-01-30 2561
DALL-E를 능가하는 OpenAI의 GLIDE 깊은바다 2021-12-27 836
검색기반 거대모델인 딥마인드의 RETRO 깊은바다 2021-12-20 511
HyperCLOVA로 만드는 캐릭터 챗봇 file 깊은바다 2021-11-26 761
여러 한국어 GPT 모델들 file [1] 봄눈 2021-11-21 3333