레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
아마존, 더 작아진 스마트 디스플레이 에코쇼5 내놨다 깊은바다 2019-06-07 171
신경망 기계 번역, 챗봇, 채용 툴, 대화 검색 등 기업의 자연어처리 활용 분야 깊은바다 2019-06-08 972
동반자 로봇 '버디' 사업 흔들 깊은바다 2019-06-08 161
낯선 호텔방, 도움 필요할 때 '호텔지니'를 부르세요 깊은바다 2019-06-11 172
구글 딥마인드 AI, 이번에는 게임 정복? 깊은바다 2019-06-12 145
AI스피커가 내 대화 몰래 전송?…지능정보사회 명암 깊은바다 2019-06-15 171
'무엇이든 물어보세요' 현대엔지니어링, AI 챗봇 서비스 도입 깊은바다 2019-06-18 217
기사 로봇 '기자들은 편히 쉬세요' 깊은바다 2019-06-22 88
KT, 일잘하는 '전대리' '마비서' 덕에 연 70억 절감 깊은바다 2019-06-26 362
LA에 등장한 순찰로봇, 한국에도 도입될까? 깊은바다 2019-06-28 162
국내 AI스피커 시장, 거침없는 성장… 412만대 보급 깊은바다 2019-07-02 172
문 대통령 만난 손정의 회장…'첫째도 둘째도 셋째도 AI' 깊은바다 2019-07-05 172
음성비서 조사 결과 - 검색 정확도에서 구글의 압도적 승리 깊은바다 2019-07-10 238
英 50 파운드 지폐 초상인물에 천재 수학자 앨런 튜링 선정 깊은바다 2019-07-16 173
아마존의 소셜로봇 베스타(Vesta)에 대한 출시 정보 깊은바다 2019-07-17 164