레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
만화를 자동으로 번역하는 딥러닝 모델 깊은바다 2021-01-21 1641
딥러닝 대부 요슈아 벤지오, 깊고 좁게 알면 AI에 먹힌다 깊은바다 2021-01-21 185
인간은 결코 AI를 통제할 수 없다? 깊은바다 2021-01-21 159
4대 그룹 AI 큰 그림 그렸다 깊은바다 2021-01-14 206
구글의 Switch Transformer, 인간 뇌의 1/100 크기에 도달 깊은바다 2021-01-14 587
극한직업 상담사…AI로 날개다는 콜센터 깊은바다 2021-01-10 163
알렉사, 새로운 명령을 직접 가르치는 기능 추가 깊은바다 2020-12-29 205
내년부터 미래형 로봇택시 다닌다 깊은바다 2020-12-29 193
AI 개발, 전사 확대...'AI 투게더' 외치는 NHN 깊은바다 2020-12-22 23506
딥마인드 2019년 7000억 적자 깊은바다 2020-12-22 467
누구 AI 스피커 2020년 사용자 통계 깊은바다 2020-12-18 298
AI스피커, 사회적 약자층과 감정 나누는데 효과 깊은바다 2020-12-17 381
미 공군, Ghost Robotics의 로봇 개 도입 깊은바다 2020-12-17 225
감에 의지했던 공정, AI한테 맡겼더니 불량률 32→5%로 뚝 깊은바다 2020-12-15 430
챗봇 설문조사 결과 깊은바다 2020-12-13 368