
금융결제원이 금융권의 생성형 AI 활용도를 제고하기 위해 올해부터 금융권 공동으로 활용 가능한 '금융말뭉치'를 구축해 본격 제공한다고 4일 밝혔다.
금결원에 따르면 ‘말뭉치’란 컴퓨터가 텍스트를 가공·처리·분석할 수 있는 형태로 모은 언어자료의 집합으로, 생성형 AI 모델 학습 및 평가에 필수 요소로 꼽힌다. 금결원의 금융말뭉치는 한국어 능력과 금융 전문성에 특화돼 금융권 AI 모델 학습에 최적화된 것으로 평가받고 있다. 이는 2024년 금융위원회가 발표한 '금융권 생성형 AI 활용지원 방안'의 후속조치 성격이기도 하다.
금결원이 작년 3월부터 국내 금융회사 등 136개 기관을 대상으로 시범용 말뭉치를 무료 제공해 시범 운영에 나선 결과 금융지식 학습·금융추론 능력 향상 등에 있어 유의미한 성능 개선 효과를 보인 것으로 나타났다.
이에따라 올해부터는 시범용 대비 약 65배 확대된 80만 건 이상의 대규모 금융말뭉치를 구축했다. 유형 별로는 사전학습용(약 24만6000건 이상), 추가학습용(약 5만 건 이상), 검색증강용(약 100,000건 이상), 평가지원용(약 2000건 이상) 등을 구축해 각 기관이 AI 활용목적과 단계에 따라 선택할 수 있도록 했다.
금결원은 이와 같은 금융말뭉치를 본격적으로 제공해 금융권 생성형 AI 모델 구축에 필요한 학습 및 검증 데이터를 지원할 뿐 아니라 금융권 외 금융유관기관, 공공기관, 학계, 핀테크 등에도 금융말뭉치를 제공함으로써 다양한 분야 AI 모델의 금융지식 학습을 촉진할 계획이다.
금결원 관계자는 “금융말뭉치는 국내 금융권 생성형 AI 경쟁력을 한 단계 끌어올리는 마중물이 될 것”이라며 “앞으로도 양질의 데이터를 지속적으로 제공하여 금융권 AI 혁신을 뒷받침하겠다”고 밝혔다.









