레플리
글 수 283

구글 딥러닝 자연어 처리 오픈소스 SyntaxNet

조회 수 2784 추천 수 0 2017.12.28 11:57:54


863a0d73b2cfa5d60d1f4ba543c55862.png

 

https://cpuu.postype.com/post/166917/

 

 

 

자연어처리는 보통 형태소분석, 구문분석, 의미분석, 문맥분석으로 구성됩니다.

 

형태소분석은 명사, 동사 등의 형태소로 문장을 분석합니다.

이때 동사는 '먹었다 -> 먹+었+다' 같이 어간 추출(stemming)을 같이 수행합니다.

 

구문분석은 명사구, 동사구 처럼 문장의 구문을 파악합니다.

같은 품사도 다른 구문에 속할 수 있습니다.

예를 들어, '사과는 맛있다'에서 '맛있다'란 동사는 동사구에 속합니다.

'맛있는 사과는 비싸다'에서는 '맛있다'란 동사가 '맛있는 사과는'이란 명사구에 속합니다.

이렇게 형태소분석과 구분문석은 큰 차이가 있습니다.

 

의미분석은 문장이 어떤 뜻을 가지고 있는지를 검사합니다.

챗봇의 경우 보통 의도와 개체를 파악하는 것을 의미합니다.

'불고기피자 주문할래'라는 문장에서는 의도는 '주문', 개체는 '불고기피자'라는 의미를 판단합니다.

 

문맥분석은 문장사이의 연결을 이해하는 것을 말합니다.

'철수는 중학생이다. 그는 서울에 산다.'에서 '그'는 '철수'라는 것을 파악할 수 있습니다.

 

 

 

일반적으로 구문분석은 룰베이스 기반으로 이루어집니다.

그런데 구글에서 딥러닝으로 학습하여 보다 정확하게 구문을 찾아내는 방법을 공개하였습니다.

 

구문분석의 가장 큰 어려움이 여러개의 구문이 가능할때 의미를 판단하여 정확한 구문을 결정하는 것입니다.

이것을 신경망을 사용하여 좀 더 직관적으로 정확하게 판단할 수 있다고 합니다.

 

List of Articles
제목 글쓴이 날짜sort 조회 수
DALL-E를 능가하는 OpenAI의 GLIDE 깊은바다 2021-12-27 838
GPT-3를 강화학습으로 업그레이드한 InstructGPT file 깊은바다 2022-01-30 2566
프로그램을 작성하는 딥마인드의 알파코드 file 깊은바다 2022-02-04 1005
구글의 대화기반 초거대모델 LaMDA, 논문 공개 file 깊은바다 2022-02-08 1361
네이버의 초거대모델인 하이퍼클로바 사용 후기 깊은바다 2022-02-14 3170
하이퍼클로바 활용예 및 사용가이드 file 깊은바다 2022-03-05 3570
교육용 챗봇의 미래!? 구글 람다 (LaMDA) 깊은바다 2022-03-11 1361
초거대모델의 파인튜닝 방법 - P-tuning과 LoRA file 깊은바다 2022-04-05 12093
GPT-3보다 3배 더 큰 구글의 초거대모델, PaLM file 깊은바다 2022-04-07 1407
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개 깊은바다 2022-05-04 1191
글자, 사진, 영상을 동시에 처리하는 딥마인드의 딥러닝 모델 - Flamingo file 깊은바다 2022-05-10 1428
구글의 초거대모델 PaLM의 추론과 상식 능력 file 깊은바다 2022-05-20 838
러시아의 구글 얀덱스, 100B 초거대모델 무료 공개 깊은바다 2022-06-26 806
최신 자연어처리 모델 소개 file 깊은바다 2022-07-11 1180
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3 file 깊은바다 2022-08-06 1154