레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
GTA5로 자율주행차 테스트 깊은바다 2017-04-23 63145
코로나 바이러스로 정신상담 챗봇 인기 깊은바다 2020-03-24 60164
자취 혼족, 똑똑한 집사 자처하는 'AI 스피커' 필요없다? 깊은바다 2020-06-07 56459
사람을 애니메이션으로 바꿔주는 틱톡의 필터 file 깊은바다 2020-06-21 47337
실제 뉴스 앵커처럼 말을 하는 알렉사의 새로운 기능 깊은바다 2019-01-19 37527
로봇, '라스트 마일'을 책임진다 깊은바다 2020-03-29 37104
인공지능이 옷을 추천하여 보내주는 쇼핑몰인 스티치 픽스 깊은바다 2017-11-05 31611
시리의 아버지 아담 체이어, 삼성을 떠나다 깊은바다 2020-08-01 30048
2019년 인공지능 스피커 전세계 출하량 깊은바다 2019-05-23 29418
또다른 행원 '챗봇', 어디가 더 똑똑할까 깊은바다 2020-09-10 27889
GPT3 모델을 훈련시키는데 드는 비용, 150억원 깊은바다 2020-06-03 26433
성균관대의 실험··· 신입생 전공 상관없이 AI 교육 [1] 깊은바다 2019-11-17 25933
국내 대기업들의 인공지능 선언 깊은바다 2020-01-05 25075
MS의 일상대화 챗봇 Xiaoice, 독립된 회사 설립 깊은바다 2020-07-15 24199
AI 개발, 전사 확대...'AI 투게더' 외치는 NHN 깊은바다 2020-12-22 23511