레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
알파고 쇼크 1년.. KAIST선 'AI 전공' 몰리고, 통역사 인기 하락 깊은바다 2017-03-22 174
경제성 떨어져 AI비서 '알렉사' 접는다?… 펄쩍 뛴 아마존 깊은바다 2022-11-14 173
AI 은행원도 나온다…불붙은 은행권 인공지능 개발 경쟁 깊은바다 2021-04-23 173
돈보내라, 영상통화도 가짜, CEO·기자도 AI가 만든 가짜였다 깊은바다 2021-04-15 173
SK텔레콤 손잡은 아마존, AI 비서 '알렉사' 한국 출시 준비 깊은바다 2021-04-10 173
'내가 로봇의 비서라니…' 인간 노동이 일구는 AI 깊은바다 2020-10-14 173
모든 단과대에 'AI 융합과목'…숭실대 AI 비전선포식 개최 깊은바다 2020-10-07 173
KT, 어린이·어르신 위한 AI 반려로봇 선보인다 깊은바다 2020-09-22 173
인간 'F16 탑건', AI 조종사에 모의공중전 0:5 완패 깊은바다 2020-08-22 173
말하지 않아도 알아...생각 읽는 인공지능 기술 공개 깊은바다 2020-04-14 173
트럼프 '1000달러 지급'이 불붙인 기본소득 논란 깊은바다 2020-03-18 173
상담사 대신 챗봇으로...LGU+ 고객 10명 중 7명 '디지털 상담' 깊은바다 2020-03-17 173
'갤럭시S20 사면 공짜'...삼성전자, AI스피커 시장공략 승부수 깊은바다 2020-02-21 173
이마트24, 걸으면서 계산되는 '한국형 아마존고' 이달말 오픈 깊은바다 2019-09-14 173
英 50 파운드 지폐 초상인물에 천재 수학자 앨런 튜링 선정 깊은바다 2019-07-16 173