레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
인식을 넘어서 이해하는 인공지능으로 깊은바다 2021-07-31 788
배달의 민족 딜리, 광교 아파트에서 배달로봇 시험운행 시작 깊은바다 2020-07-23 783
스티븐 호킹 'AI 통제 위해 세계 정부 구성해야' 깊은바다 2017-03-15 780
미국의 탐사프로그램인 60 Minutes에서 다룬 딥페이크 기술 깊은바다 2021-10-12 769
패션 모델 옷 갈아입히고, 포즈 바꾸고… AI가 한 일입니다 깊은바다 2021-11-22 768
나는 인간이 아니다. 초거대 인공지능이다 깊은바다 2021-11-17 731
삼성전자, 뇌를 닮은 차세대 뉴로모픽 반도체 비전 제시 깊은바다 2021-10-05 728
SKT의 개인비서 에이닷, 앱 통계조사에서 순위권 file 깊은바다 2022-07-28 716
구글 챗봇 AI '람다'는 정말 사람처럼 사고할까 깊은바다 2022-07-31 711
AI 오디오 전문기업 수퍼톤, 빅히트 엔터테인먼트로부터 40억 투자 유치 깊은바다 2021-03-04 707
안면인식이 안되는 사진으로 변환하는 프로그램 깊은바다 2020-08-04 691
테슬라 오토파일럿 책임자인 안드레이 카파시 퇴사 깊은바다 2022-07-17 686
존 카맥, 2030년까지 AGI가 가능하다는데 베팅 깊은바다 2022-08-17 668
서강대 대학원 인공지능학과 첫 신입생 모집 깊은바다 2021-10-21 666
18년전 세컨드라이프와 달라…요즘 메타버스는 진짜 깊은바다 2022-01-25 655