레플리
글 수 283

구글 딥러닝 자연어 처리 오픈소스 SyntaxNet

조회 수 2784 추천 수 0 2017.12.28 11:57:54


863a0d73b2cfa5d60d1f4ba543c55862.png

 

https://cpuu.postype.com/post/166917/

 

 

 

자연어처리는 보통 형태소분석, 구문분석, 의미분석, 문맥분석으로 구성됩니다.

 

형태소분석은 명사, 동사 등의 형태소로 문장을 분석합니다.

이때 동사는 '먹었다 -> 먹+었+다' 같이 어간 추출(stemming)을 같이 수행합니다.

 

구문분석은 명사구, 동사구 처럼 문장의 구문을 파악합니다.

같은 품사도 다른 구문에 속할 수 있습니다.

예를 들어, '사과는 맛있다'에서 '맛있다'란 동사는 동사구에 속합니다.

'맛있는 사과는 비싸다'에서는 '맛있다'란 동사가 '맛있는 사과는'이란 명사구에 속합니다.

이렇게 형태소분석과 구분문석은 큰 차이가 있습니다.

 

의미분석은 문장이 어떤 뜻을 가지고 있는지를 검사합니다.

챗봇의 경우 보통 의도와 개체를 파악하는 것을 의미합니다.

'불고기피자 주문할래'라는 문장에서는 의도는 '주문', 개체는 '불고기피자'라는 의미를 판단합니다.

 

문맥분석은 문장사이의 연결을 이해하는 것을 말합니다.

'철수는 중학생이다. 그는 서울에 산다.'에서 '그'는 '철수'라는 것을 파악할 수 있습니다.

 

 

 

일반적으로 구문분석은 룰베이스 기반으로 이루어집니다.

그런데 구글에서 딥러닝으로 학습하여 보다 정확하게 구문을 찾아내는 방법을 공개하였습니다.

 

구문분석의 가장 큰 어려움이 여러개의 구문이 가능할때 의미를 판단하여 정확한 구문을 결정하는 것입니다.

이것을 신경망을 사용하여 좀 더 직관적으로 정확하게 판단할 수 있다고 합니다.

 

List of Articles
제목 글쓴이 날짜sort 조회 수
5배 싸진 클로바X의 경량화 모델 - HCX-DASH file 깊은바다 2024-04-26 8
클로바X의 사용량 제한 - QPM과 TPM 깊은바다 2024-04-01 99
Pi를 만든 Inflection AI, MS로 대거 이직한 이유 깊은바다 2024-03-25 112
LLaMA나 Mistral이 계속 무료로 유지될 수 있을까 깊은바다 2024-03-05 242
GPT-3.5와 클로바X 가격 비교 file 깊은바다 2024-02-25 272
OpenAI, 성능은 높아지고 가격은 싸진 새로운 모델 공개 file 깊은바다 2024-01-26 325
AI 휴대용 기기 R1을 만든 Rabbit의 대표 Jesse Lyu 깊은바다 2024-01-12 252
화면을 보고 스마트폰 앱 사용방법을 배우는 모델 - AppAgent file 깊은바다 2024-01-08 301
LLM의 새로운 기법 - Merge와 DPO file 깊은바다 2024-01-02 1155
업스테이지 SOLAR 10.7B에서 사용한 DUS 모델 확장 방법 file 깊은바다 2023-12-27 464
죽은 아들의 AI 아바타를 만든 중국의 부모 file 깊은바다 2023-12-21 180
Private sLLM - 어떻게 만들고 어떻게 배포할까? file 깊은바다 2023-12-18 376
GPT-4가 내 여자친구보다 나를 더 잘 알까? file 깊은바다 2023-12-12 166
FSM과 생성 에이전트의 차이점 깊은바다 2023-11-22 187
RAG를 사용한 페르소나 챗봇 - ChatHaruhi file 깊은바다 2023-10-17 711