레플리
글 수 283

딥러닝으로 욕설 탐지하기

조회 수 1881 추천 수 0 2018.08.06 19:14:25


 

http://ndc.vod.nexoncdn.co.kr/NDC2018/slides/NDC2018_0033/index.html

 

 

 

NDC2018에 발표되었던 것으로 딥러닝으로 욕설을 탐지하는 방법을 설명하고 있습니다. 예전에 관련 기사를 소개한 적이 있었는데 최근에 발표자료가 공개되었습니다.

 

지금까지 유저들의 욕설을 방지하기 위해서는 금칙어를 검사하는 것이 보통이었습니다. 하지만 단어를 변형하거나 중간에 숫자를 넣는 등 우회할 방법이 다양하기 때문에 그리 효과적이지 않았습니다. 또한 '경제개발5개년계획'처럼 욕설로 오탐하는 경우도 많았습니다.

 

딥러닝의 CNN을 사용하여 새로운 욕설 탐지기를 개발하였는데, 문맥의 의미나 단어의 패턴을 정확하게 판단하기 때문에 90%의 정확도를 보인다고 합니다. 먼저 프로그램으로 한번 문장을 거르고 욕설일 확률이 높은 것만 따로 검토하여 운영자의 부담이 상당히 줄어들었습니다. 앞으로 대부분의 게임이나 웹서비스에서 이런 기술이 사용될 것이라 생각합니다.

 

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
딥러닝을 이용한 자연어 처리 입문 - 위키독스 깊은바다 2018-09-21 1108
다이나믹 메모리 네트워크 정리 file 깊은바다 2018-09-29 1135
딥러닝 질의응답 시스템인 cdQA-suite 깊은바다 2020-03-08 1144
WizardLM의 Evol-instruct로 직접 한글 데이터셋을 만든 모델 file 깊은바다 2023-06-19 1144
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3 file 깊은바다 2022-08-06 1154
커뮤니케이션과 AI - Multi-channel CNN을 이용한 한국어 감성분석 깊은바다 2018-11-22 1156
퓨샷(few-shot) 러닝에 최적화된 GPT3 모델 file 깊은바다 2020-05-30 1156
LLM의 새로운 기법 - Merge와 DPO file 깊은바다 2024-01-02 1172
쉽게 씌어진 Word2Vec [2] 깊은바다 2017-12-25 1178
딥러닝 기반 자연어 언어모델 BERT - Colab 실습 코드 포함 file 깊은바다 2019-09-02 1179
최신 자연어처리 모델 소개 file 깊은바다 2022-07-11 1180
스캐터랩의 오픈도메인 챗봇 루다 육아일기 - 모델의 구조 및 동작방식 file 깊은바다 2020-12-30 1191
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개 깊은바다 2022-05-04 1191
Word2Vec 테스트 사이트 file 깊은바다 2019-01-13 1198
LLM 챗봇의 특징 2가지 - RAG와 Function 깊은바다 2023-07-06 1215