한국신문협회·한국신문방송편집인협회·한국기자협회·한국인터넷신문협회·한국온라인신문협회 등 언론 5개 단체가 인공지능(AI) 사업자의 학습데이터 공개 의무화를 촉구했다.
16일 국내 주요 언론 5개 단체는 국회 과학기정보방송통신위원회, 법제사법위원회, 문화체육관광부 등에 ‘인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안(과방위 대안)’에 대한 의견서를 제출했다.
언론단체들은 의견서를 통해 “이번 제정안이 AI 사업자가 지켜야 할 투명성, 안정성, 의무사항과 딥페이크 범죄 예방을 위한 AI 생성물 워터마크 의무화 등을 규정한 것은 적절하다”고 평가했다.
하지만 언론단체들은 “생성형 AI 사업자가 AI 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집 및 보관하고 공개하도록 하는 규정이 빠져있다”고 우려를 나타냈다.
이어 “학습데이터 공개를 의무화하지 않는 것은 생성형 AI 사업자의 데이터 무단 이용을 허용해 저작권자의 권리를 심각하게 침해할 소지가 있다”며 “저작권자는 자신의 저작물이 어떻게 사용됐는지 알 권리를 잃게 돼 정당한 대가 요구가 어려워질 것”이라고 지적했다.
이에 언론단체들은 생성형 AI 사업자가 최대한 학습 데이터를 투명하게 밝히고 저작권자가 열람할 수 있도록 해야 한다고 강조했다. 또한, 생성형 AI 사업자 입장에서도 본인들의 기술에 대한 신뢰도를 높이려면 학습 데이터와 방식을 공개하는 것이 바람직하다고 덧붙였다.
언론단체들은 학습데이터 공개 의무화의 근거로 미국과 유럽연합(EU)의 사례를 꼽았다. 미국은 올 4월 하원에서 발의된 ‘학습데이터 공개에 관한 법안’을 통해 하급데이터 요약본을 저작권청에 제출하도록 하고 있다. EU 역시 3월 제정한 ‘AI 법’에서 AI 기업들이 학습과 훈련 과정에서 사용한 데이터에 대한 상세 내용을 공개하도록 규정했다.
이에 따라 언론단체들은 AI 기본법안 제31조(인공지능 투명성 확보 의무)에 다음의 조항을 신설한 것을 제안했다고 밝혔다.
신설조항은 △인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관해야 하며, 이를 공개하여야 한다. 공개에 관하여 필요한 사항은 대통령령으로 정한다 △인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 대해 저작권자가 열람을 요청할 경우 관련 자료를 제공하여야 한다 등이다.