글 수 149

기능형 챗봇에도 초거대모델이 필요

조회 수 655 추천 수 0 2022.07.03 18:18:37


챗봇은 크게 기능형과 감성형으로 구분됩니다. 기능형 챗봇은 목적지향 챗봇, task oriented dialog system, goal oriented dialog system이라고 불립니다. 시리나 구글 어시스턴트, 은행 챗봇 등 사람들에게 정보를 제공하거나 도와주는 역할을 합니다. 감성형 챗봇은 일상대화 챗봇, open domain chatbot이라고도 하는데, 사용자와 잡담을 주고받는데 주로 사용됩니다. 앞으로는 에이닷처럼 하나의 챗봇이 기능형과 감성형 기능을 모두 지원하는 방향으로 나아갈 것입니다. 영화 Her의 사만다처럼요.

 

감성형 챗봇은 최근 딥러닝 덕분에 크게 발전하고 있습니다. 여러 턴의 맥락을 이해할 뿐만 아니라, 다양한 지식들을 기억하고 이를 대답에 사용하기도 합니다.얼마 전 논란이 되었던 구글의 람다는 지각이 있는게 아니냐는 주장이 있을 정도였습니다. 그렇다면 왜 기능형 챗봇은 아직까지 그 성능이 크게 오르지 않는 것일까요.

 

현재 기능형 챗봇은 대부분 의도(intent)와 개체(entity)라는 방법을 사용합니다. 예를 들어, '어제 경제뉴스를 보여줘'라고 물어봤다면 '뉴스보기'라는 의도로 분류합니다. 그리고 '어제'와 '경제'라는 핵심 개체들을 추출합니다. 다음으로 프로그래머가 만들어놓은 각 의도에 해당하는 함수에 개체정보를 파라미터로 넘겨 실행합니다. 마지막으로 함수의 출력 결과를 템플릿 문장에 넣어 대답을 합니다.

 

intent_entity.jpg

 

 

 

이런 방식의 가장 큰 문제점은 다양성이 부족하다는 것입니다. 미리 사람이 정의하고 코드로 만들어 놓은 질문에만 대답이 가능합니다. 새로운 유형의 질문에 대답을 하려면, 개발자가 시간과 노력을 들여 하나씩 추가해야 합니다. 문맥을 고려하기도 어렵습니다. 맥락에 따라 대답하려면, 이 역시 규칙을 만들어서 시나리오를 사전에 설계해야 합니다. 그렇기 때문에 챗봇이 이해하고 처리할 수 있는 경우의 수가 너무 적습니다. 지금 대부분의 기능형 챗봇들이 사람들에게 외면을 받는 이유입니다.

 

이를 해결하려면 감성형과 마찬가지로 기능형 챗봇도 딥러닝을 적극 활용해야 합니다. 물론 지금 기능형 챗봇도 딥러닝을 일부 사용하고 있습니다. 다만 의도를 분류하거나 개체를 추출하는 영역에 국한되어 있습니다. 저는 입력을 받아 대답을 하는 전체 과정에 사람의 개입을 최소화해야 한다고 생각합니다. 람다같은 생성모델처럼 end-to-end 방식이 필요합니다.

 

 

 

메타가 만든 Blenderbot2.0을 보면 이런 기능이 일부 포함되어 있습니다. 이 챗봇은 사용자가 물어보면 그 내용을 인터넷에서 검색하고, 그 내용을 참조하여 대답을 합니다. 우선 학습데이터를 구축하기 위해 별도의 툴을 만들었습니다.

 

질문을 받으면 사람이 이 툴에서 키워드를 넣어 검색을 합니다. 여러 검색결과가 나오면 그 중 하나를 선택하고 거기에 맞게 대답을 합니다. 이렇게 어떤 키워드로 검색할지, 검색결과 중 어느 내용으로 대답을 만들지가 모두 데이터가 됩니다. 이렇게 학습한 모델 역시 같은 툴을 사용합니다. 사람이 물어보면 거기에 맞는 검색 키워드를 생성하여 검색을 하고, 어떤 검색결과를 사용하지 결정합니다. 그리고 이를 참조하여 최종적으로 대답문장을 만듭니다.

 

blenderbot2_1.jpg

 

blenderbot2_2.jpg

 

 

 

같은 방법을 콜센터 챗봇에 그대로 적용할 수 있습니다. 우선 데이터셋을 수집하는게 먼저입니다. 상담원은 이와 비슷한 툴을 통해서만 DB를 검색하거나 정보를 찾습니다. 그리고 그 행동 하나하나를 대답문장과 같이 데이터셋으로 만들고 학습을 합니다. 이렇게 하면 사람처럼 다양한 질문을 처리할 수 있는 딥러닝 챗봇을 구현할 수 있습니다. 물론 GPT-3 같은 초거대모델 정도가 되어야 복잡한 상황을 이해하고 대답할 수 있다고 봅니다.

 

아직은 데이터셋을 구축하는 것부터 쉽지 않습니다. 초거대모델을 새로 수집한 데이터로 파인튜닝하는 것도 필요합니다. 하지만 몇 년안에 초거대모델을 사용한 기능형 챗봇도 곧 등장할 거라고 예상합니다. 아마 지금도 어디선가 개발하고 있지 않을까요. 당장 올해 출시된다고 해도 그리 놀라지 않을 듯 합니다.

 

List of Articles
제목 글쓴이 날짜 조회 수
이루다를 만든 스캐터랩 대표 인터뷰 깊은바다 2022-08-30 301
LaMDA로 보는 챗봇의 미래 - ELIZA, BERT, Meena LaMDA 깊은바다 2022-08-11 518
카카오톡 챗봇기능 무료화 선언 file 깊은바다 2022-08-03 687
일상대화 챗봇의 두번째 혁신은 장기기억 능력 file 깊은바다 2022-07-19 681
기능형 챗봇에도 초거대모델이 필요 file 깊은바다 2022-07-03 655
심심이부터 이루다까지, 일상대화 챗봇 심층기사 깊은바다 2022-06-30 555
튜닙의 박규병 대표, 비목적성 챗봇 시장은 추후 몇백조 이상으로 성장 깊은바다 2022-06-12 524
네이버 초거대모델을 사용한 일상대화 챗봇 서비스 - 아루 / 클로바 케어콜 깊은바다 2022-06-06 765
챗봇에서 캐릭터는 사용자와 애착을 형성하는 중요한 요소 file 깊은바다 2022-05-19 551
스마일게이트에서 공개한 혐오표현과 인간성평가 데이터셋 깊은바다 2022-03-29 966
우리는 영원할 수 있을까 - 사람을 챗봇으로 복제하기 깊은바다 2022-03-17 875
GPT-3, Dialogflow, 카카오i 오픈빌더 요금 비교 file 깊은바다 2022-03-02 1151
70%의 사용자가 웹페이지 검색보다 챗봇을 선호 깊은바다 2022-03-01 827
더 인간적인 챗봇이 장사도 잘한다 깊은바다 2022-02-20 745
AI 기반 챗봇 구현을 위한 기술 동향 깊은바다 2022-01-21 725