레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
화웨이, PanGu-Alpha라는 중국어 GPT-3 공개 깊은바다 2021-05-02 239
AI 이루다, 자율점검표 구축예고 깊은바다 2021-04-30 162
EU의 '4단계 AI규제' 청사진 나왔다 깊은바다 2021-04-25 122
AI 은행원도 나온다…불붙은 은행권 인공지능 개발 경쟁 깊은바다 2021-04-23 173
Nvidia의 CEO 젠승 황 인터뷰, 인공지능과 메타버스 깊은바다 2021-04-21 208
AI 앵커가 '난 늙지 않아' 자신의 미래를 말하다 깊은바다 2021-04-18 147
네이버, 5월 채용행사서 국내 최초 초거대 언어모델 발표 깊은바다 2021-04-17 183
돈보내라, 영상통화도 가짜, CEO·기자도 AI가 만든 가짜였다 깊은바다 2021-04-15 173
MS, '시리' 기술 만든 음성인식업체 뉘앙스 18조원에 인수 깊은바다 2021-04-13 171
도로 쓰레기 투기 ‘인공지능 CCTV’로 잡는다 깊은바다 2021-04-11 147
SK텔레콤 손잡은 아마존, AI 비서 '알렉사' 한국 출시 준비 깊은바다 2021-04-10 173
안내견 대신할 '최첨단 AI 백팩' 등장 깊은바다 2021-04-07 117
디지털 세계엔 24시간 잠들지않는 그녀가 있다 깊은바다 2021-03-30 164
가상현실로 출근하고 가상현실에서 만나는 메타버스의 시대 깊은바다 2021-03-27 582
국가별 인공지능(AI) 경쟁력 분석해보니… 한국 14위 깊은바다 2021-03-25 175