이글루시큐리티는 레이블링과 피드백 과정의 개선을 통해 머신 러닝 알고리즘의 정확성을 높이는 2건의 AI (인공지능) 관련 특허 기술을 취득했다고 4일 밝혔다.
이번에 등록한 2건의 특허는 머신 러닝 알고리즘이 학습하는 학습 데이터의 신뢰도를 높이고 머신 러닝 피드백 과정의 효율성을 향상시키는 데 중점을 두고 있다.
머신 러닝 알고리즘의 정확성을 높이기 위해서는 보안 이벤트에 정답을 달아주는 ‘레이블링’과 머신 러닝 알고리즘이 내놓은 예측 결과를 평가하고 필요시 재 학습시키는 ‘피드백’ 과정이 필수적으로 요구된다. 레이블링 작업을 토대로 머신 러닝 알고리즘이 학습할 수 있는 학습 데이터를 생성할 수 있고, 피드백 과정을 반복하면서 학습 된 머신 러닝 알고리즘의 모델의 성능을 향상시킬 수 있기 때문이다.
그러나 레이블링이 필요한 학습 데이터와 기존 학습 시에 없었거나 일부 변화된 예측 데이터가 급증하면서, 레이블링과 피드백 업무의 효율성을 높이는 기술의 필요성이 높아지게 되었다. 여러 담당자들이 다른 기준에 따라 레이블링 정보를 입력하는 과정에서 학습 데이터의 신뢰도가 떨어지고, 담당자가 일일이 불만족스러운 머신 러닝 예측 결과에 대한 피드백을 부여해야 해 작업 시간이 길어지는 점이 문제였다.
‘머신 러닝 학습 데이터 생성 방법 및 그 시스템’에 대한 특허는 작업자의 실수로 인해 발생할 수 있는 레이블링 작업 오류를 줄이고 학습 데이터의 무결성을 유지하는 기술이다.
여러 담당자가 레이블링 정보를 변경하는 이력을 수치화하여 사용자에게 많이 선택된 이력과 가장 최근 업데이트된 이력에 가중치를 부여한다.
이후 가장 높은 점수를 받은 이력을 레이블링 데이터로 결정하고 이를 토대로 학습 데이터를 생성함으로써, 학습 데이터의 신뢰도를 높일 수 있게 된다.
‘머신 러닝의 예측 데이터 피드백 적용 방법 및 그 시스템’에 대한 특허는 능동 학습 기반의 피드백 적용을 통해 피드백 작업 시간을 최소화하면서 피드백의 정확성을 높이는 기술이다. 머신 러닝 모델이 예측한 결과를 군집화한 뒤 군집의 대표 이벤트를 결정하여 이에 대한 피드백을 입력하면, 이 피드백이 군집 내 나머지 이벤트에 적용되는 방식이다. 여러 군집 중 신뢰도 점수가 높은 군집 데이터에 먼저 피드백을 부여함으로써, 적은 수의 피드백으로도 머신 러닝 모델을 효율적으로 학습시킬 수 있다.
한편, 이글루시큐리티는 2015년 AI 연구 개발을 시작한 이래, 사이버 보안 분야에 최적화된 AI 기술 개발에 힘을 실어 왔다. 이글루시큐리티는 올해 AI·보안관제와 관련된 19건의 특허를 취득했으며, 이를 AI 보안관제 솔루션인 SPiDER TM AI Edition(스파이더 티엠 에이아이 에디션)에 적용하며 보안관제의 효율성을 높이고 있다.
이글루시큐리티 이득춘 대표는 “양질의 학습 데이터와 피드백은 머신 러닝 알고리즘의 정확성을 끌어올리기 위한 필수 요소이다. AI 보안관제 선도기업으로서 머신 러닝 알고리즘이 보다 정확한 판단을 내릴 수 있는 AI 기술 개발에 더욱 매진할 계획이다”라고 밝혔다.