레플리
글 수 186

대화 프로그램 - ELIZA

조회 수 2041 추천 수 0 2016.03.25 02:15:24


튜링 테스트란 1950년 앨런 튜링(Alan Turing)이 고안해낸 것으로 지능적인 시스템인지, 즉 인공지능을 가지고 있는지 시험할 수 있는 기준이라 할 수 있습니다. 컴퓨터에게 질문을 하여 대화상대가 사람인지 기계인지 구분할 수 없으면 시험을 통과한 것으로 판정하고, 기계라고 판단할 수 있으면 실패한 것으로 판정하는 방법입니다. 

 

1966년 MIT의 교수인 조셉 웨즌바움(Joseph Weizenbaum)이 환자와 대화하면서 심리치료사의 역할을 수행할 수 있는 프로그램인 'ELIZA'를 개발하였는데, 실제로 메사츄세스 종합병원에서 사람들을 대상으로 시험한 결과 다수가 자신이 대화한 상대가 컴퓨터라는 것을 알지 못했다고 합니다.

 

하지만 이는 실제 인공지능이라기 보다 단순히 키워드을 비교하여 미리 저장되어 있는 대화를 출력하는 속임수라 할 수 있습니다

 

 

 

여기서는 이러한 ELIZA를 C코드로 구현한 프로그램을 살펴보도록 하겠습니다. 'C 인공지능 프로그래밍, Herbert Schildt, 신경숙 역, 도서출판 세웅'에 나온 프로그램입니다.

 

먼저 가장 기본적인 방법은 사용자가 입력한 문장에서 키워드들을 뽑아 미리 저장되어 있는 답변과 비교하여 일치하는 문장을 출력하는 것입니다. trans[] 배열이 키워드와 그에 맞는 답변을 저장하고 있습니다.

 

두 번째 방법은 사용자가 입력한 문장을 저장하고 있다가 적절한 순간에 이전의 주제를 꺼내 화제를 돌리도록 합니다. topics[][] 큐에 사용자의 입력문장을 저장하고 있다가 사용자의 입력문장이 너무 짧은 경우 이전의 문장을 다시 출력하여 줍니다.

 

 

 

여기서 사용된 키워드 매칭 방법은 일반적인 자연어처리(Natural Language Processing)와 전혀 관계가 없습니다. 자연어처리 기법은 먼저 문장을 파싱(parsing)하여 각 형태소별로 구분하는 구문분석(syntax analysis)를 하고 그 다음 각 형태소와 단어의 뜻을 분석하여 문장의 의미를 파악하는 의미분석(semantic analysis)를 해야합니다.

 

그리고 이전의 문장들을 저장해놓고 현재의 문장과의 연결과 현재 화제 등을 파악하는 담화분석(discourse analysis) 부분이 필요합니다. 그 밖에도 여러가지 복잡한 기법들이 필요한데 아직 더 많은 연구가 필요합니다.

 

 

 

다음은 ELIZA와의 대화 일부입니다.

 

ELIZA : How are you this beautiful day?

 

ME : I don't know, I feel bad

 

ELIZA : How do you know that?

 

ME : I feel like I could kill

 

ELIZA : I was wrong to kill

 

ME : I never seem to win

 

ELIZA : Don't be negative - be positive!

 

ME : why, are you sure?

 

ELIZA : Remember, therapy is good for you.

 

ME : why, are you sure?

 

ELIZA : Stop repeating yourself.

 

ME : Hey, who cares jerk

 

ELIZA : Don't ever call me a jerk!

 

ME : I'll call you a jerk any time I want to

 

ELIZA : Let's not talk about me.

 

ME : I am unhappy

 

ELIZA : Why are you unhappy?

 

 

 

---------------------------------------------------------------------------

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

#include <conio.h>

 

 

#define MAX   100  // 최대 토픽의 개수

#define SHORT  10

#define VERYSHORT 3

 

 

// 함수 선언

void respond(char *s);

void get_token(void);

int is_in(char c, char *s);

int lookup(char *token);

void assert_topic(char *t);

int find_topic(char *t);

int in_topics(char *s);

 

 

// 일반적인 컴퓨터의 대답 자료

char *response[] = {

"How are you?",

"Did you have a happy childhood?",

"Did you hate your father?",

"i'm not sure I understand",

""

};

 

// 키워드에 맞는 컴퓨터의 대답 자료

char *trans[] = {

"you", "Let's not talk about me.",

"think", "Why do you think that?",

"hate", "So you hate something - tell me more.",

"what", "Why do you ask?",

"want", "Why do you want that?",

"need", "We all need many things - is this special?",

"why", "Remember, therapy is good for you.", 

"know", "How do you know that?",

"bye", "Your bill will be mailed to you.",

"murder", "I don't like killing",

"kill", "It is wrong to kill",

"jerk", "Don't ever call me a jerk!",

"can't", "Don't be negative - be positive.",

"failure", "Strive for success.",

"never", "Don't be negative - be positive.",

"unhappy", "Why are you unhappy?",

""

};

 

char topics[MAX][80];

char token[80];

char *p_pos;

int  res = 0;

int  head = 0;

int  tail = 0;

 

 

 

 

 

//**************************************************************************

// Name : main()

// Desc : 메인 함수

//**************************************************************************

void

main(void)

{

char s[80];

 

 

 

printf("%s\n", response[res++]);

 

// 사용자의 입력을 받고 컴퓨터의 반응을 반복함

do

{

  printf(" : ");

  

  p_pos = s;

  gets(s);

 

  respond(s);

 

} while( strcmp(s, "bye") );

}

 

 

 

 

 

//**************************************************************************

// Name : respond()

// Desc : 사용자의 입력에 따라 적절한 대답을 출력

//**************************************************************************

void

respond(char *s)

{

char t[80];

int  loc;

 

 

 

// 입력문장이 너무 짧을 경우 이전에 사용자가 했던 말로 화제를 돌림

if( strlen(s) < VERYSHORT && strcmp(s, "bye") )

{

  if( find_topic(t) )

  {

   printf("You just said : ");

   printf("%s \n", t);

   printf("Tell me more.\n");

  }

  else

  {

   if( !*response[res] ) res = 0;

 

   printf("%s\n", response[res++]);

  }

 

  return;

}

 

 

 

// 사용자가 같은 말을 반복했을 경우 화를 내는 대답을 출력

if( in_topics(s) )

{

  printf("Stop repeating yourself!\n");

 

  return;

}

 

 

 

// 사용자의 입력문장이 짧지 않다면 토픽 큐에 저장해둠

if( strlen(s) > SHORT ) assert_topic(s);

 

 

 

// 사용자의 입력문장의 키워드와 trans[] 배열과 비교하여 일치하는 대답을 출력

do

{

  get_token();

 

  loc = lookup(token);

 

  if( loc != -1 )

  {

   printf("%s\n", trans[loc+1]);

 

   return;

  }

} while( *token );

 

printf("Tell me more...\n");

}

 

 

 

 

 

//**************************************************************************

// Name : lookup()

// Desc : 키워드가 trans[] 배열에 있는지 검색

//**************************************************************************

int

lookup(char *token)

{

int t;

 

 

 

t = 0;

 

while( *trans[t] )

{

  if( !strcmp(trans[t], token) ) return t;

 

  t += 2;

}

 

 

 

return -1;

}

 

 

 

 

 

//**************************************************************************

// Name : assert_topic()

// Desc : 사용자의 입력을 토픽 큐에 저장

//**************************************************************************

void

assert_topic(char *t)

{

if( head == MAX ) head = 0;

 

strcpy(topics[head], t);

head++;

}

 

 

 

 

 

//**************************************************************************

// Name : find_topic()

// Desc : 토픽 큐에서 하나를 꺼냄

//**************************************************************************

int

find_topic(char *t)

{

if( tail != head )

{

  strcpy(t, topics[tail]);

  tail++;

 

  if( tail == MAX ) tail = 0;

 

  return 1;

}

 

 

 

return 0;

}

 

 

 

 

 

//**************************************************************************

// Name : in_topics()

// Desc : 사용자의 입력이 토픽 큐에 있는지 검색

//**************************************************************************

int

in_topics(char *s)

{

int t;

 

 

 

for( t = 0; t < MAX; t++ )

{

  if( !strcmp(s, topics[t]) ) return 1;

}

 

 

 

return 0;

}

 

 

 

 

 

//**************************************************************************

// Name : get_token()

// Desc : 사용자의 입력문장에서 키워드(토큰)을 뽑아냄

//**************************************************************************

void

get_token(void)

{

char *p;

 

 

 

p = token;

 

// 앞에 있는 빈칸을 건너뜀

while( *p_pos == ' ' ) p_pos++;

 

// NULL이 나오면 리턴

if( *p_pos == '\0' )

{

  *p++ = '\0';

 

  return;

}

 

// ",.!?"이 나오면 리턴

if( is_in(*p_pos, ",.!?") )

{

  *p = *p_pos;

  p++; p_pos++;

  *p = '\0';

 

  return;

}

 

 

 

while( *p_pos != ' ' && *p_pos != '\0' && !is_in(*p_pos, ".,?!") )

{

  *p = tolower(*p_pos++);

  p++;

}

 

*p = '\0';

}

 

 

 

 

 

//**************************************************************************

// Name : is_in()

// Desc : 

//**************************************************************************

int

is_in(char c, char *s)

{

while( *s )

{

  if( c == *s ) return 1;

 

  s++;

}

 

 

 

return 0;

}

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
플레이브는 맞고 메이브는 틀리다? 엔터테인먼트에서 AI의 역할 file 깊은바다 2024-03-10 74
패스트벤처스 박지웅 대표, 버추얼 인플루언서가 조단위 시장이 될것 깊은바다 2024-02-21 103
Character.AI가 ChatGPT보다 앱 사용횟수 10배 높음 file 깊은바다 2024-02-07 197
일상대화 AI는 진통제일까 비타민일까 깊은바다 2024-02-04 153
이루다와 심심이가 우울증 완화에 효과 file 깊은바다 2024-02-01 183
GPT 스토어의 인기 분야 - 가상 연애와 심리 상담 file 깊은바다 2024-01-15 196
인스타그램에서 AI Friend 기능 개발중 file 깊은바다 2023-11-06 177
생성AI 시대의 엔터테인먼트 file 깊은바다 2023-11-05 175
장기기억은 일상대화 AI의 마지막 퍼즐 file 깊은바다 2023-11-02 185
Character.ai의 대표 인터뷰 - 우리는 엔터테인먼트 시장과 경쟁 깊은바다 2023-10-29 154
AI 걸프렌드가 출산율을 저하시킨다 [1] 깊은바다 2023-10-01 198
업스테이지, 버추얼 아이돌 메이브의 페르소나AI 구현 예정 [1] 깊은바다 2023-09-21 158
NC소프트의 AI Companion 연구 소개 file 깊은바다 2023-09-18 223
감성 AI 시장의 미래 삼씩씩 2023-09-07 214
에이닷에 들어간 스캐터랩의 AI 캐릭터 제작기 file 깊은바다 2023-08-25 241