- AI Dev - 인공지능 개발자 모임
- 정보공유
- 자연어처리
글 수 72
https://bitbucket.org/eunjeon/mecab-ko/
한글 형태소 분석기 중에서 가장 빠르고 정확하게 분석하는 프로그램이 아닐까 합니다.
예를 들어 '난책읽고싶어'라는 문장을 여러 형태소분석기로 처리를 해보았습니다.
< MeCab-Ko >
난책읽고싶어
난 NP+JX,*,T,난,Inflect,NP,JX,나/NP/*+ᆫ/JX/*
책 NNG,*,T,책,*,*,*,*
읽 VV,*,T,읽,*,*,*,*
고 EC,*,F,고,*,*,*,*
싶 VX,*,T,싶,*,*,*,*
어 EC,*,F,어,*,*,*,*
< open-korean-text >
[ "난책*(Noun: 0, 2)",
"읽고(Verb: 2, 2)",
"싶(PreEomi: 4, 1)",
"어(Eomi: 5, 1)" ]
< 국민대 KMA >
(N "난책읽고싶어")< :60>
'난' 같은 한글자 처리가 제대로 되는것은 MeCab-Ko가 유일합니다.
한글은 띄어쓰기를 잘 안하는 사람들이 많아서 이런 부분이 특히 중요합니다.
다만 C++로 되어 있어도 윈도우는 지원되지 않는게 아쉽네요.
윈도우에서 빌드하는 방법도 있는 것 같은데 좀 더 알아봐야 겠습니다.
< 챗봇 개발자 모임 >
- 페이스북 그룹에 가입하시면 챗봇에 대한 최신 정보를 쉽게 받으실 수 있습니다.