레플리
글 수 282


요즘 전세계에서 ChatGPT로 난리가 났다. 인공지능 커뮤니티 뿐만 아니라 신문이나 방송에서 연일 주요한 이슈로 다뤄지고 있다. 이제는 나이 지긋한 어르신들도 한번쯤 다들 들어보셨을 정도다.

 

사실 ChatGPT는 GPT-3를 대화 형식으로 변경한 것이다. GPT-3가 2020년 6월에 출시했으니 벌써 3년이 다 되어간다. 이런 딥러닝 모델을 초거대AI라고 부른다. 기존의 모델보다 100배 이상 크기가 더 커졌기 때문이다. 비슷한 구조라도 사이즈가 늘어나면 성능이 급격하게 상승함을 보여줬다.

 

 

 

네이버도 하이퍼클로바라는 GPT-3 비슷한 모델을 개발했다. 2021년 11월쯤 몇몇 스타트업들을 대상으로 클로즈드베타를 진행했었다. 내가 다니던 회사도 거기에 참여할 수 있었다. 그때 댓글봇이라고 게시판에서 자동으로 댓글을 달아주는 기능을 마무리하고 있었다. 다음 프로젝트로 심리상담 챗봇을 개발하려고 준비하는 중이었다.

 

잠깐 쉬는 시간에 하이퍼클로바를 테스트할 겸 간단한 심리상담 챗봇을 만들어봤다. 초거대AI의 장점은 별도로 학습이 필요없다는 것이다. 대신 프롬프트라는 방식으로 입력을 넣을 때 설명을 같이 추가하면 된다. 예를 들면 다음과 같다.

 

"나는 내담자와 대화하는 심리상담 챗봇이다. 내담자의 말을 경청하고 개인 신상의 문제나 심리적 고민을 해결할 수 있도록 도와준다. 대화 예시는 다음과 같다.

 

챗봇 : 안녕하세요, 무슨 고민이 있으신가요.

내담자 : 요즘 너무 괴로워요.

챗봇 : 그 이유를 알려주실 수 있나요.

내담자 : 성적이 너무 떨어져서 죽고 싶어요."

 

 

 

대충 이렇게만 설정하고 대화를 해봤는데 너무 성능이 뛰어나서 깜짝 놀랐다. 우리 회사에서 아무리 자체 모델을 만들어봤자 이걸 넘어서기는 힘들 것 같았다. 그래서 차라리 다른 회사보다 먼저 하이퍼클로바를 도입하는게 가장 좋은 방법이라고 생각했다. 빨리 출시해서 빨리 피드백을 받을수록 서비스를 개선할 수 있다. 거기에 자신만의 강점을 살려 차별화를 하면 된다.

 

우리 회사는 업계 1위의 심리상담 플랫폼이라서 실제 상담사와의 대화 데이터가 가장 많았다. 이를 활용하여 초거대AI를 재학습(전체는 아니고 부분적으로만)하고 성능을 더 높일 수 있다. 또한 인지행동치료라는 기법을 자체적으로 개발해서 하이퍼클로바에 붙일 생각이었다. 이렇게 하이브리드 방식으로 점차 자체 모델의 비중을 늘려갈 계획이었다.

 

물론 아무리 초거대AI 챗봇이라도 인간 상담사를 능가할수는 없다. 내 목표는 심리상담의 파이 자체를 키우는 것이었다. 아직까지 상담을 받기 위해서는 큰 용기가 필요하다. 자신이 정신적으로 문제가 있다는 자책감이 들기 때문이다. 하지만 챗봇이라면 부담이 훨씬 덜하다. 이렇게 챗봇과 가볍게 고민을 나누다가 조금씩 사람 상담사로 연결해줄 수 있다. 아니면 챗봇에 과금을 할수도 있고.

 

 

 

최근 초거대AI를 기반으로 새로운 서비스를 개발하는 회사들이 많아졌다. 아마 ChatGPT의 성공으로 올해부터 급격하게 늘어날 것이다. 하이퍼클로바가 처음 나왔을 때부터 심리상담 챗봇을 개발했으면 벌써 출시를 해서 테스트를 하고 있었을 텐데. 하지만 난 창업을 위해 퇴사를 선택했고 더 이상 진행을 하지 못했다. 아마 빠르던 늦던 초거대AI를 활용한 심리상담 챗봇은 등장하리라 본다. 내 손으로 이를 실현하지 못해서 조금은 아쉽다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
사진을 인식할 수 있는 ChatGPT 멀티모달 버전 공개 file 깊은바다 2023-09-26 276
Poe에 추가된 업스테이지의 LLM, Solar-70b file 깊은바다 2023-09-18 431
RAG 아키텍처를 위한 임베딩 모델의 선택에 대해 깊은바다 2023-09-14 515
LLM의 미래는 자율행동과 멀티 에이전트 깊은바다 2023-08-30 298
LLM이 서로 협력하여 프로그램을 개발 - ChatDev file 깊은바다 2023-08-16 749
GPT-4에 CoT 프롬프를 적용하여 2023 수능 국어 1등급 달성 file 깊은바다 2023-08-08 620
LLM의 창발적인 현상인 CoT(Chain of Thouht) 소개 file 깊은바다 2023-07-27 704
RAG 아키텍처의 이해 깊은바다 2023-07-23 1323
GPT-4 세부구조에 대한 정보 유출 깊은바다 2023-07-20 456
Llama 2의 RLHF 구현 방법 깊은바다 2023-07-19 714
한국어 LLM 민주화의 시작 KoAlpaca file 깊은바다 2023-07-17 1053
레포트를 써주는 LLM - GPT Researcher file 깊은바다 2023-07-13 400
LLM 챗봇의 특징 2가지 - RAG와 Function 깊은바다 2023-07-06 1191
RAG(Retrieval-Augmented Generation) - LLM의 환각을 줄이는 방법 file 깊은바다 2023-07-04 9615
Generative AI — 시장 구조, 기회, moat에 대한 몇 가지 생각 깊은바다 2023-06-27 302