레플리
글 수 72

NUGU Knowledge Base - 지식베이스

조회 수 1031 추천 수 0 2018.11.10 18:01:52


Domain + Domain ë¹ë± í í¬íìì¼ë¡ MEMBER í CAST T.O.P. (ëì´: 30) ë¹ë± 멤ë²ì ëì´, ë¹ë± 멤ë²ì ì¶ì°ì MUSIC MOVIE ë¹ë± (Bibim_PER_61) í¬íìì¼ë¡ (BiBim_...

 

https://www.slideshare.net/NUGU_developers/nugu-conference-2018-b31-1?fbclid=IwAR2c_LSQW1rHRGW76Tk8XZ4-ZmLqwh1BKB5zVcDVx8wEfLDUxPM_aBLqc50

 

 

 

SKT 누구의 지식베이스를 설명한 자료입니다. 특히 인공지능 스피커에서 가장 많이 사용하는 것 중 하나가 지식검색입니다. 이를 위해서는 첫째, 웹에서 데이터를 크롤링하여 구조적으로 저장을 합니다. 위키 같은 경우 일정한 형식에 맞게 이미 정리되어 있어 정보를 추출하기가 편합니다. 그리고 지식그래프로 각 항목과 속성별로 연결합니다.

 

아이유->키 : 160
아이유->나이 : 20
아이유->소속사 : 뮤직레코드

 

뮤직레코드->CEO : 김철수
뮤직레코드->위치 : 강남구 신사동

 

 

 

"아이유 소속사의 위치가 어디야?"라고 물어보면 먼저 의도와 개체를 파악합니다. 의도는 '정보검색'이고 개체는 '아이유, 소속사, 위치'입니다. 단순히 개체단어의 순서별로 추론을 할 수도 있습니다. 하지만 보다 정확하게 판단하기 위해서는 구문분석으로 의존관계를 검사해야 합니다.

 

아이유->소속사=>뮤직레코드->위치=>강남구 신사동

 

"지리산보다 높은 산은?", "서울에서 인구가 세번째로 도시는?" 같은 문장은 좀 더 복잡합니다. 우선 의도가 '정보검색'처럼 정형화된 방식이 아니라 '위치비교' 같은 별도의 의도로 처리해야 됩니다. 개체는 '지리산, 높은, 산' / '서울, 인구, 세번째, 도시'입니다. 그리고 수치를 비교하여 탐색을 합니다.

 

list = sort(mountain->height)
get_greater(list, 지리산->height)

 

 

 

문제는 "지구에서 달까지의 거리는", "소지섭과 공효진이 같이 나온 드라마는" 같이 처리 방법이 다른 문장들은 각각 개별 의도로 분류하고 직접 프로그래머가 코드를 작성해야 합니다.

 

사람이 일일히 카테고리나 속성을 지정하지 않고 자동으로 지식그래프를 생성하고, 추론 역시 인공지능이 알아서 해주는 알고리즘이 나올 수 있을까요. 그 전까지는 위와 같이 개발자가 모든 것을 미리 설계하여 구현을 해야될 듯 합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
APEACH – 혐오 발화 평가데이터를 만드는 새로운 방법 깊은바다 2022-04-22 1100
윈도우에서 간편하게 Mecab 설치방법 - pyeunjeon 깊은바다 2021-06-15 497
자연어처리 벤치마크 GLUE의 한글 버전인 KLUE 공개 file 깊은바다 2021-05-22 688
모두의 말뭉치에 새로운 일상 대화 추가 file 깊은바다 2021-04-06 562
자연어처리 벤치마크인 SuperGLUE도 인간의 기록을 경신 [1] 깊은바다 2021-01-21 550
한국어 문장 분리기, KSS(Korean Sentence Splitter) 파이썬 포팅 file 깊은바다 2020-12-23 6145
파이썬 한국어 말뭉치 패키지 - Korpora file 깊은바다 2020-09-12 1510
세종 말뭉치보다 9배 더 큰 한글 코퍼스 공개 - 모두의 말뭉치 file 깊은바다 2020-08-27 3141
한국어 전처리 기법 모음 깊은바다 2020-07-31 4539
예일대의 자연어-SQL 데이터셋, Spider 깊은바다 2020-07-12 525
IBM 왓슨의 자연어처리 방식 깊은바다 2020-06-26 626
매주 한편씩 글을 작성하는 자연어처리 블로그 - 위클리 NLP 깊은바다 2020-06-12 1129
인간의 언어를 이해하는 기계, NLU에는 어떤 것이 있을까? 깊은바다 2020-06-05 417
한글 자모 분리 및 합치기 파이썬 패키지 [1] 깊은바다 2020-03-03 3238
Machine Learning for Kids로 감정분석 깊은바다 2020-02-09 932