글 수 182

인공지능 기자 지피티

조회 수 647 추천 수 0 2019.05.14 00:12:08


K-002.png

 

K-001.png

 

http://symbiote-ai.com/gpt

 

 

 

GPT2는 OpenAI에서 최근 발표한 딥러닝 모델로, 글을 생성하는데 특화되어 있습니다. 예전부터 n-gram 같이 확률기반의 언어모델이 있었습니다. 이를 딥러닝으로 학습하면서 글의 품질이 훨씬 높아지고 있습니다.

 

언어모델은 입력으로 들어온 문장을 통해 다음 글자를 예측합니다. GPT2는 Byte Pair Encoding이란 방식을 쓰는데 기본적으로 단어가 아니라 캐릭터 단위입니다. 예를 들어, 다음과 같이 출력이 다시 입력으로 들어가면서 계속 반복하여 문장을 생성합니다.

 

동해물과 백두산 -> 이
해물과 백두산이 -> 마
물과 백두산이 마 -> 르

 

 

 

얼마 전 한글을 학습하여 기사를 쓰는 사이트가 공개되었습니다. 사용자가 직접 문장을 넣으면 거기에 맞는 글을 써주기도 합니다. 물론 OpenAI에서 만든 GPT2는 아닙니다. 악용될 소지가 있기 때문에 소스코드도 공개되지 않았고, 논문에서도 구현방법에 대해서 자세히 설명하고 있지 않기 때문입니다.

 

저도 테스트를 해봤는데 진짜 GPT2와 달리 아직 부족한 점이 많습니다. 스크린샷에서는 "스파이더맨과 아이언맨의 열애설이 크게 화제를 모은다는 것을 알고 있다"처럼 입력한 정보가 반영된 문장이 나옵니다. 하지만 스파이더맨과 배트맨으로 입력의 단어를 바꾸면 기사를 그대로 오려붙인 것 같은 대답만 합니다. 아마 학습 데이터에 스파이더맨과 아이언맨 열애설에 대한 기사가 있던게 아닐까 싶습니다.

 

하지만 GPT2와 비슷한, 아니 그것을 훨씬 능가하는 모델이 곧 대중화될 것이라 생각합니다. 앞으로 다양한 곳에서 유용하게 활용될 것이 분명합니다. 페이크 뉴스 같은 부작용에 대비를 해야겠지만 기술의 발전을 막을 수는 없으니까요.

 

List of Articles
제목 글쓴이 날짜sort 조회 수
자신의 복제 챗봇을 만들어주는 서비스 - Mind Bank AI 깊은바다 2021-10-19 759
왜 타로·사주 챗봇을 월 9900원에 구독할까 - 헬로우봇 깊은바다 2021-06-20 327
오프라인 매장도 없는 '카카오 뱅크'가 고속 성장한 이유는? 깊은바다 2021-04-26 275
네슬레의 버추얼 휴먼 - Ruth 깊은바다 2021-03-05 298
야마하의 노래하는 소셜로봇 - 찰리 깊은바다 2021-02-28 367
자동으로 화면을 이동하는 아마존 에코쇼 10 3세대 깊은바다 2021-02-25 253
일 파나소닉, 가정용 커뮤니케이션 로봇 '니코보' 발표 깊은바다 2021-02-19 240
카카오 i 랜선 친구 외개인아가 - 일상대화 챗봇 깊은바다 2020-11-30 434
카카오 스마트스피커를 목에 걸고 다녀야 하는 이유 - 미니링크 깊은바다 2020-09-30 191
어시스턴트, 시리, 빅스비, 알렉사에게 50개 질문 성능 테스트 깊은바다 2020-08-19 257
2020년 Alexa Prize 소셜봇 우승팀 - Emora file 깊은바다 2020-08-07 344
GPT3로 업그레이드한 텍스트 어드벤처 게임 - AI Dungeon 깊은바다 2020-07-22 732
구글 AI 스피커 써보니 - 네스트 허브 깊은바다 2020-07-08 230
핑퐁 이루다 사용기 - 루다는 우리의 친구가 될 수 있을까? file 깊은바다 2020-07-06 575
핑퐁의 인공지능 감성 챗봇 - 이루다 깊은바다 2020-06-29 659