레플리
글 수 188

대화 프로그램 - ELIZA

조회 수 2048 추천 수 0 2016.03.25 02:15:24


튜링 테스트란 1950년 앨런 튜링(Alan Turing)이 고안해낸 것으로 지능적인 시스템인지, 즉 인공지능을 가지고 있는지 시험할 수 있는 기준이라 할 수 있습니다. 컴퓨터에게 질문을 하여 대화상대가 사람인지 기계인지 구분할 수 없으면 시험을 통과한 것으로 판정하고, 기계라고 판단할 수 있으면 실패한 것으로 판정하는 방법입니다. 

 

1966년 MIT의 교수인 조셉 웨즌바움(Joseph Weizenbaum)이 환자와 대화하면서 심리치료사의 역할을 수행할 수 있는 프로그램인 'ELIZA'를 개발하였는데, 실제로 메사츄세스 종합병원에서 사람들을 대상으로 시험한 결과 다수가 자신이 대화한 상대가 컴퓨터라는 것을 알지 못했다고 합니다.

 

하지만 이는 실제 인공지능이라기 보다 단순히 키워드을 비교하여 미리 저장되어 있는 대화를 출력하는 속임수라 할 수 있습니다

 

 

 

여기서는 이러한 ELIZA를 C코드로 구현한 프로그램을 살펴보도록 하겠습니다. 'C 인공지능 프로그래밍, Herbert Schildt, 신경숙 역, 도서출판 세웅'에 나온 프로그램입니다.

 

먼저 가장 기본적인 방법은 사용자가 입력한 문장에서 키워드들을 뽑아 미리 저장되어 있는 답변과 비교하여 일치하는 문장을 출력하는 것입니다. trans[] 배열이 키워드와 그에 맞는 답변을 저장하고 있습니다.

 

두 번째 방법은 사용자가 입력한 문장을 저장하고 있다가 적절한 순간에 이전의 주제를 꺼내 화제를 돌리도록 합니다. topics[][] 큐에 사용자의 입력문장을 저장하고 있다가 사용자의 입력문장이 너무 짧은 경우 이전의 문장을 다시 출력하여 줍니다.

 

 

 

여기서 사용된 키워드 매칭 방법은 일반적인 자연어처리(Natural Language Processing)와 전혀 관계가 없습니다. 자연어처리 기법은 먼저 문장을 파싱(parsing)하여 각 형태소별로 구분하는 구문분석(syntax analysis)를 하고 그 다음 각 형태소와 단어의 뜻을 분석하여 문장의 의미를 파악하는 의미분석(semantic analysis)를 해야합니다.

 

그리고 이전의 문장들을 저장해놓고 현재의 문장과의 연결과 현재 화제 등을 파악하는 담화분석(discourse analysis) 부분이 필요합니다. 그 밖에도 여러가지 복잡한 기법들이 필요한데 아직 더 많은 연구가 필요합니다.

 

 

 

다음은 ELIZA와의 대화 일부입니다.

 

ELIZA : How are you this beautiful day?

 

ME : I don't know, I feel bad

 

ELIZA : How do you know that?

 

ME : I feel like I could kill

 

ELIZA : I was wrong to kill

 

ME : I never seem to win

 

ELIZA : Don't be negative - be positive!

 

ME : why, are you sure?

 

ELIZA : Remember, therapy is good for you.

 

ME : why, are you sure?

 

ELIZA : Stop repeating yourself.

 

ME : Hey, who cares jerk

 

ELIZA : Don't ever call me a jerk!

 

ME : I'll call you a jerk any time I want to

 

ELIZA : Let's not talk about me.

 

ME : I am unhappy

 

ELIZA : Why are you unhappy?

 

 

 

---------------------------------------------------------------------------

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

#include <conio.h>

 

 

#define MAX   100  // 최대 토픽의 개수

#define SHORT  10

#define VERYSHORT 3

 

 

// 함수 선언

void respond(char *s);

void get_token(void);

int is_in(char c, char *s);

int lookup(char *token);

void assert_topic(char *t);

int find_topic(char *t);

int in_topics(char *s);

 

 

// 일반적인 컴퓨터의 대답 자료

char *response[] = {

"How are you?",

"Did you have a happy childhood?",

"Did you hate your father?",

"i'm not sure I understand",

""

};

 

// 키워드에 맞는 컴퓨터의 대답 자료

char *trans[] = {

"you", "Let's not talk about me.",

"think", "Why do you think that?",

"hate", "So you hate something - tell me more.",

"what", "Why do you ask?",

"want", "Why do you want that?",

"need", "We all need many things - is this special?",

"why", "Remember, therapy is good for you.", 

"know", "How do you know that?",

"bye", "Your bill will be mailed to you.",

"murder", "I don't like killing",

"kill", "It is wrong to kill",

"jerk", "Don't ever call me a jerk!",

"can't", "Don't be negative - be positive.",

"failure", "Strive for success.",

"never", "Don't be negative - be positive.",

"unhappy", "Why are you unhappy?",

""

};

 

char topics[MAX][80];

char token[80];

char *p_pos;

int  res = 0;

int  head = 0;

int  tail = 0;

 

 

 

 

 

//**************************************************************************

// Name : main()

// Desc : 메인 함수

//**************************************************************************

void

main(void)

{

char s[80];

 

 

 

printf("%s\n", response[res++]);

 

// 사용자의 입력을 받고 컴퓨터의 반응을 반복함

do

{

  printf(" : ");

  

  p_pos = s;

  gets(s);

 

  respond(s);

 

} while( strcmp(s, "bye") );

}

 

 

 

 

 

//**************************************************************************

// Name : respond()

// Desc : 사용자의 입력에 따라 적절한 대답을 출력

//**************************************************************************

void

respond(char *s)

{

char t[80];

int  loc;

 

 

 

// 입력문장이 너무 짧을 경우 이전에 사용자가 했던 말로 화제를 돌림

if( strlen(s) < VERYSHORT && strcmp(s, "bye") )

{

  if( find_topic(t) )

  {

   printf("You just said : ");

   printf("%s \n", t);

   printf("Tell me more.\n");

  }

  else

  {

   if( !*response[res] ) res = 0;

 

   printf("%s\n", response[res++]);

  }

 

  return;

}

 

 

 

// 사용자가 같은 말을 반복했을 경우 화를 내는 대답을 출력

if( in_topics(s) )

{

  printf("Stop repeating yourself!\n");

 

  return;

}

 

 

 

// 사용자의 입력문장이 짧지 않다면 토픽 큐에 저장해둠

if( strlen(s) > SHORT ) assert_topic(s);

 

 

 

// 사용자의 입력문장의 키워드와 trans[] 배열과 비교하여 일치하는 대답을 출력

do

{

  get_token();

 

  loc = lookup(token);

 

  if( loc != -1 )

  {

   printf("%s\n", trans[loc+1]);

 

   return;

  }

} while( *token );

 

printf("Tell me more...\n");

}

 

 

 

 

 

//**************************************************************************

// Name : lookup()

// Desc : 키워드가 trans[] 배열에 있는지 검색

//**************************************************************************

int

lookup(char *token)

{

int t;

 

 

 

t = 0;

 

while( *trans[t] )

{

  if( !strcmp(trans[t], token) ) return t;

 

  t += 2;

}

 

 

 

return -1;

}

 

 

 

 

 

//**************************************************************************

// Name : assert_topic()

// Desc : 사용자의 입력을 토픽 큐에 저장

//**************************************************************************

void

assert_topic(char *t)

{

if( head == MAX ) head = 0;

 

strcpy(topics[head], t);

head++;

}

 

 

 

 

 

//**************************************************************************

// Name : find_topic()

// Desc : 토픽 큐에서 하나를 꺼냄

//**************************************************************************

int

find_topic(char *t)

{

if( tail != head )

{

  strcpy(t, topics[tail]);

  tail++;

 

  if( tail == MAX ) tail = 0;

 

  return 1;

}

 

 

 

return 0;

}

 

 

 

 

 

//**************************************************************************

// Name : in_topics()

// Desc : 사용자의 입력이 토픽 큐에 있는지 검색

//**************************************************************************

int

in_topics(char *s)

{

int t;

 

 

 

for( t = 0; t < MAX; t++ )

{

  if( !strcmp(s, topics[t]) ) return 1;

}

 

 

 

return 0;

}

 

 

 

 

 

//**************************************************************************

// Name : get_token()

// Desc : 사용자의 입력문장에서 키워드(토큰)을 뽑아냄

//**************************************************************************

void

get_token(void)

{

char *p;

 

 

 

p = token;

 

// 앞에 있는 빈칸을 건너뜀

while( *p_pos == ' ' ) p_pos++;

 

// NULL이 나오면 리턴

if( *p_pos == '\0' )

{

  *p++ = '\0';

 

  return;

}

 

// ",.!?"이 나오면 리턴

if( is_in(*p_pos, ",.!?") )

{

  *p = *p_pos;

  p++; p_pos++;

  *p = '\0';

 

  return;

}

 

 

 

while( *p_pos != ' ' && *p_pos != '\0' && !is_in(*p_pos, ".,?!") )

{

  *p = tolower(*p_pos++);

  p++;

}

 

*p = '\0';

}

 

 

 

 

 

//**************************************************************************

// Name : is_in()

// Desc : 

//**************************************************************************

int

is_in(char c, char *s)

{

while( *s )

{

  if( c == *s ) return 1;

 

  s++;

}

 

 

 

return 0;

}

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
일상대화 챗봇의 가장 핵심은 방대한 데이터에 기반한 다양성 깊은바다 2021-10-06 778
일상대화 챗봇이 사람들간의 관계를 약화시키는게 아닐까 깊은바다 2021-08-31 1025
상담챗봇에 대한 뉴욕타임즈의 기사 깊은바다 2021-06-03 290
일상대화 챗봇 레플리카(Replika)의 의상과 AR 기능 file 깊은바다 2021-05-30 627
챗봇 분석을 위한 20가지 측정 항목 깊은바다 2021-05-19 999
챗봇을 위한 대화는 어떻게 디자인할까 - 챗봇의 기본 요소 정리 깊은바다 2021-04-20 446
컨슈머인사이트, 2019~2020 AI스피커 이용현황-만족도 비교 깊은바다 2021-03-26 231
목적지향 대화인 알렉사 프라이즈 태스크봇(Alexa Prize TaskBot) 대회 깊은바다 2021-03-17 203
제조사만의 음성비서를 만들 수 있는 Alexa Custom Assistant 깊은바다 2021-03-02 210
챗봇이란, 챗봇 개념 쉽게 이해하기 깊은바다 2021-02-19 641
전문가보다 아기 같은 페르소나를 가진 챗봇이 사용자에게 호감 깊은바다 2021-02-08 333
타로챗봇 라마마 대표 인터뷰 깊은바다 2021-02-05 335
챗봇 대화만으로 수익을 얻을 수 있을까 file 깊은바다 2021-02-01 407
인공지능 챗봇(Chatbot), 챗봇 역사의 모든 것 깊은바다 2021-01-27 374
일상대화 챗봇 이루다, 일시 중단 결정 깊은바다 2021-01-14 168