글 수 219
1. UnSmile 혐오데이터 (https://github.com/smilegate-ai/korean_unsmile_dataset)
- 단일 문장에 대해 8개의 혐오카테고리로 multi-labeling한 데이터
2. HuLiC 인간성 평가 데이터 (https://github.com/smilegate-ai/HuLiC)
- 사람과 챗봇간의 대화에 대해 모든 턴마다 인간성 평가 점수를 메긴 데이터
너무 좋은 데이터셋이 공개됐습니다. 특히 한글 혐오표현은 정말 찾기 힘든데요. 스마일게이트가 챗봇 발전에 큰 역할을 해주었네요.