‘미토스 파장’ 앤스로픽, ‘오퍼스4.7’ 출시…“사이버 특화 능력 의도적으로 낮춰”

기사 듣기
00:00 / 00:00

▲앤스로픽 오퍼스4.7 관련 이미지. (사진제공=앤스로픽)

‘클로드 미토스’로 보안 리스크 논란을 촉발한 앤스로픽이 사이버 역량을 의도적으로 낮춘 ‘오퍼스4.7’을 출시했다. 코딩·금융 분석 능력은 끌어올리고, 보안 악용 가능성은 통제한 것이 특징이다.

16일(현지시간) 앤스로픽은 소프트웨어 엔지니어링 역량을 높인 오퍼스4.7을 공개했다. 전작인 오퍼스 4.6을 선보인 지 약 2개월 만의 업그레이드다. 다만 거의 모든 지표에서 ‘미토스 프리뷰’보다 낮은 성능을 보였다.

특히 이번 모델 트레이닝 과정에서 사이버 특화 역량을 의도적으로 낮추는 실험을 병행한 것이 주목된다. 앞서 앤스로픽은 전문가 수준의 강력한 보안 취약점 탐지 능력을 갖춘 미토스를 일부 기업·기관에 제한적으로 공개한 바 있다.

앤스로픽은 오퍼스4.7을 공개하며 “금지되거나 위험도가 높은 사이버 보안 관련 요청을 자동으로 감지·차단하는 새로운 안전장치를 함께 출시한다”며 “궁극적으로 미토스급 모델의 광범위한 출시라는 목표를 향해 나아가는 데 도움이 될 것”이라고 밝혔다.

오퍼스4.7은 기존에 긴밀한 가이드가 필요했던 고난도 코딩 작업에서 높은 성능을 보였다. 고해상도 이미지 지원을 통한 비전 기능 개선, 인터페이스·슬라이드·문서 등 전문 업무에서의 완성도와 창의성 향상, 강화된 지시 이행 능력 등도 갖췄다.

구체적으로 코딩 능력을 재는 ‘SWE-벤치 프로’, ‘SWE-벤치 베리파이드’ 성능 지표(벤치마크)에서 각각 64.3%와 87.6%를 기록해 공개된 AI 모델 가운데 최고 성능을 보였다. 난이도가 더 높은 ‘SWE-벤치 프로(Pro)’에서는 오픈AI의 GPT-5.4(57.7%), 구글 제미나이 3.1 프로(54.2%)를 앞선 64.3%였다.

금융 분석 능력을 측정하는 ‘파이낸스 에이전트 v1.1’ 지표에서도 64.4%의 점수로 전작은 물론 주요 경쟁 AI 모델들보다 높은 평가를 받았다. 멀티모달 성능도 강화됐다. 오퍼스 4.7은 긴 변 기준 최대 2576픽셀(약 3.75메가픽셀) 이미지를 처리할 수 있어 이전 모델 대비 해상도가 3배 이상 향상됐다.

오퍼스4.7의 가격은 입력 토큰 100만개당 5달러, 출력 토큰 100만개당 25달러로 오퍼스 4.6과 동일하게 유지된다. ‘사이버 검증 프로그램’에 참여하는 보안 전문가들은 취약점 연구 등 합법적인 사이버 보안 목적으로 오퍼스4.7을 사용할 수 있다.

한편, 이날 오픈AI도 코딩 에이전트 코덱스를 대규모 업데이트했다고 밝혔다. 백그라운드에서 사용자의 컴퓨터를 활용해 다양한 애플리케이션을 오가며 작업을 처리할 수 있고, 중단된 작업을 다시 이어 실행하거나 며칠에 걸친 작업을 지속적으로 수행하는 것도 가능해졌다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
많이 본 뉴스
댓글
0 / 300