과기정통부, 과학기술 논문·R&D 보고서 활용한 기계학습 데이터 구축

입력 2020-07-24 09:18

  • 작게보기

  • 기본크기

  • 크게보기

정부가 과학기술 국내 논문과 국가 연구개발 보고서 원문을 기반으로 과학기술 분야 인공지능 개발 등에 활용할 수 있는 기계학습 데이터를 구축한다.

과학기술정보통신부는 디지털 뉴딜 사업의 일환으로 한국과학기술정보연구원이 축적한 논문을 활용해 ‘과학기술 기계학습 데이터 구축사업’을 시작한다고 24일 밝혔다.

KISTI는 만 19세에서 34세 이하 2000명을 채용해 12월까지 사업을 시행할 예정이다. 참여자는 1·2차로 나눠 모집하며, 1차 모집은 25일부터 내달 10일까지 진행된다.

KISTI는 논문 본문, 보고서의 표·그림 설명 등 데이터 5종, 최대 425만여건을 레이블링 등 작업을 통해 기계학습에 활용할 수 있는 형태의 데이터로 가공할 계획이다. 구축된 기계학습 데이터는 과학기술분야 언어이해 모델개발과 자연어 처리 문제 해결 등에 활용될 예정이다.

과기정통부는 이렇게 구축한 데이터를 과학기술 분야 지식자원 연계와 융합연구 지원, 중소기업 기술혁신을 위한 비즈니스 등에 활용할 수 있을 것으로 내다봤다. 이 사업 참여자는 재택근무를 통해 비대면으로 일하며, 초급인력(1천400명)은 205만원 수준의 월 급여(세전)와 4대 보험 가입, 고급인력(600명)은 265만원 수준의 월 급여(세전)와 4대 보험 가입 처우를 받는다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소