AI 엔진 ‘연료 부족’ 경고등…데이터 브레이크에 테크 기업 발목 [리코드 코리아④]

국내 AI기업 60% “데이터 확보 애로”…공공데이터 개방률 2.3% 그쳐

AI 기본법 시행 코 앞, 하위법 지연
저작권·개인정보 규제에 갇힌 韓 LLM
글로벌 AI 격차 가속화

(그래픽=신미영 기자 win8226@)

이달 시행을 앞둔 인공지능(AI) 기본법을 놓고 산업계에서 불확실성 우려가 커지고 있다. 포괄적인 틀은 마련했으나 세부적인 하위 법령 제정이 지연된 탓이다. AI 기술이 하루가 다르게 진화하고 있지만, 속도가 더딘 한국의 제도적 뒷받침은 오히려 산업 발전 발전의 ‘브레이크’로 작용하고 있다는 평가다. AI 학습의 핵심인 데이터 활용 규제가 해소되지 않으면서 국내 기업들의 글로벌 경쟁력이 크게 뒤처지게 될 위기에 처했다는 우려가 나온다.

22일 소프트웨어정책연구소의 2024 인공지능산업 실태조사에 따르면 국내 AI기업 10곳 중 6곳(59.5%)은 양질의 데이터를 확보하는 데 어려움을 겪고 있는 것으로 나타났다. 2021년 같은 연구소에서 진행한 조사 결과(60.8%)와 비교하면 큰 차이가 없었다. 4년이 지났음에도 AI 기업이 처한 상황이 나아지지 않은 것이다. 국내 AI 기업이 활용 가능한 공공데이터의 양이 적은 데에다가 금융, 의료 분야 데이터 등 민감한 데이터 수집 어렵다는 게 보고서의 지적이다.

보고서에서 지적하듯 AI 모델의 성능을 결정짓는 양질의 학습 자료인 공공데이터의 개방 수준은 처참한 수준이다. 국무조정실에 따르면 작년 한국의 공공데이터 개방률은 2.3%에 그쳤다. 게다가 데이터 개방 절차를 밟는 데만 평균 1년 가까운 시간이 소요되는 것으로 나타났다. 기술 발전 속도를 제도가 따라가지 못하는 셈이다.

정부는 작년 11월 AI 분야 규제 합리화 로드맵을 통해 67개 과제 중 약 20%를 공공데이터 개방 확대에 할애하겠다고 약속했으나 현장의 체감도는 낮다. 개인정보보호위원회의 규제와 개인정보 보호법이 공공데이터 개방과 충돌하면서 실제 데이터가 민간으로 흘러 들어가는 길목이 차단돼 있기 때문이다.

민간 데이터 활용 역시 사정은 마찬가지다. 현행 저작권법은 AI 학습을 위한 데이터 사용을 극히 제한적인 ‘공정이용’ 범위 내로만 한정하고 있다. 작년 1월 AI 훈련 시 저작물 사용 허용 범위를 대폭 확대하려는 법 개정 시도가 있었으나 문화체육관광부와 문화예술계의 강력한 반발에 부딪혀 결국 무산됐다. 작년 말 문체부가 ‘생성형 AI 저작물 학습 공정이용 안내서’를 발표했으나 산업계에서는 ‘AI 개발 위축’을 주장하며 재검토를 요구해 실효성 논란이 지속되고 있다.

이러한 규제 장벽은 이미 기업 현장에 타격을 주고 있다. 국내 대형언어모델(LLM) AI 모델 성능이 해외에 크게 뒤처졌다는 연구 결과가 맥을 같이 한다. 김종락 서강대 수학과 교수 연구팀에 따르면 국내 국가대표 AI 도전 5개 팀의 주요 LLM과 그록, 챗GPT 등 해외 5개 모델에게 수능 수학 20문제, 논술 30문제를 풀게 한 결과, 해외 모델은 76~92점을 받았지만, 한국 모델은 솔라 프로2만 58점을 받았을 뿐 나머지는 20점대 낮은 점수를 기록했다.

전문가들은 AI 산업의 골든타임이 얼마 남지 않았다고 경고한다. 데이터 활용을 막는 규제를 혁파하지 않으면 글로벌 빅테크와의 격차를 줄이는 것이 불가능하다고 입을 모은다.

김덕현 DK융합전략연구소 대표는 “한국 데이터를 확보하는 측면에서 자국 이른바 소버린 AI를 개발하는 기업이 해외 기업보다 유리해야 되지 않겠느냐”면서 “촉진해야할 산업이라면 규제가 앞서가는 것이 아니라 오히려 규제는 한 발 더 뒤에서 따라가는 게 맞다”고 강조했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소