챗봇 딥러닝 - 욕설을 찾는 BERT 모델

글 수 283

조회 수 3267 추천 수 0 2019.08.28 02:54:11

깊은바다 *.68.247.186 http://aidev.co.kr/8266

ap_graph

BERT로 욕설을 판단하는 모델입니다. 웹사이트에서 바로 테스트 해보실 수 있습니다. 띄어쓰기를 하지 않거나 중간에 기호가 삽입되면 약간 정확도가 떨어집니다. 그 외에는 상당히 잘 찾아냅니다.

욕설의 위치를 마스킹하는 기능도 추가되었습니다. 데이터셋은 단지 '욕설/정상'으로만 라벨이 달려있습니다. 설명에는 puri attention layer를 사용하여 욕설인 토큰을 찾는다고 합니다.

무엇보다 크롤링한 10만개의 문장들에 일일이 라벨을 달았다는게 대단합니다. 게다나 욕설을 읽는 스트레스까지 포함하면 고생이 상당했을 텐데요^^; 모델을 구현하는 능력도 중요하지만, 데이터 수집하고 정제하는 노력도 필수적인 것 같습니다.

< 테스트 사이트 >

List of Articles

제목	글쓴이	날짜	조회 수
BERT를 이용한 챗봇 구현	깊은바다	2019-01-07	4110
GPT-3 데모 사이트 - gpt3demo.com	깊은바다	2021-07-13	3707
한국어 자연어처리를 위한 딥러닝	깊은바다	2018-02-14	3651
하이퍼클로바 활용예 및 사용가이드	깊은바다	2022-03-05	3570
한국어로 대화하는 생성 모델의 학습을 위한 여정 - Transformer와 GPT2	깊은바다	2020-08-13	3565
KoGPT2를 파인튜닝하여 만든 챗봇	깊은바다	2020-06-23	3519
구글의 딥러닝 대화 알고리즘	깊은바다	2016-03-25	3356
여러 한국어 GPT 모델들 [1]	봄눈	2021-11-21	3335
네이버 영화 리뷰 감정 분석	깊은바다	2018-09-07	3292
욕설을 찾는 BERT 모델 - Purifier	깊은바다	2019-08-28	3267
딥러닝으로 챗봇 만들기	깊은바다	2017-05-03	3173
네이버의 초거대모델인 하이퍼클로바 사용 후기	깊은바다	2022-02-14	3170
6B 파라미터의 GPT-J_6B 오픈소스 모델	깊은바다	2021-07-01	3126
케라스로 만든 한글 Seq2Seq 챗봇 소스코드	깊은바다	2019-07-13	3091
구글의 Transformer 신경망 모델 [2]	깊은바다	2018-10-13	3022

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지