
기업공개(IPO)를 앞두고 있는 오픈AI가 새로운 인공지능(AI) 모델 ‘GPT-5.5'를 공개했다. 지난 3월 GPT-5.4를 내놓은 지 약 두 달 만이다. 앤스로픽도 일주일 전 ‘클로드 오퍼스 4.7’을 공개하는 등 신모델 경쟁이 IPO 국면에서 주도권 확보를 위한 속도전 양상으로 번지는 모양새다.
24일 오픈AI는 GPT-5.5를 선보이며 “코딩, 온라인 리서치, 데이터 분석, 문서 및 스프레드시트 작성, 소프트웨어 조작 등 실제 업무 전반을 지원하도록 설계된 모델”이라고 소개했다.
새로운 모델은 사용자의 의도를 더 빠르게 이해하고 여러 단계의 업무를 이어서 수행할 수 있도록 설계됐다. GPT-5.4와 유사한 토큰당 지연시간을 유지하면서 더 높은 성능을 보인다. 동일한 코덱스 작업을 더 적은 토큰으로 수행할 있다는 효율성도 강점이다.
코딩 성능도 강화됐다. 복잡한 명령줄 작업 수행 능력을 평가하는 터미널 벤치(Terminal-Bench) 2.0에서는 82.7%를 기록해 GPT-5.4의 75.1%를 웃돌았다. 시간이 오래 걸리는 코딩 과제를 평가하는 내부 지표 Expert-SWE에서도 GPT-5.4를 상회했다. 실제 소프트웨어 이슈 해결 능력을 평가하는 SWE-Bench Pro에서는 58.6%를 기록했다.
GPT-5.5는 지식업무 수행 능력을 평가하는 GDPval에서 84.9%를 받아 80.3%에 머무른 오퍼스4.7을 능가했다. 컴퓨터 조작 능력을 평가하는 OSWorld-Verified에서도 78.7%로 GPT-5.4의 75.0%보다 높았다.
앤스로픽이 최근 제한적으로 공개한 초고성능 AI 모델 미토스가 보안 우려를 키우는 가운데 새로운 모델은 보다 강력한 세이프가드와 함께 출시됐으며, 사이버 관련 고위험 요청에는 더 높은 수준의 거절 기준과 추가적인 보호 조치가 적용됐다. GPT-5.5는 사이버 보안 능력을 평가하는 '사이버짐'에서 81.8%를 기록해 오퍼스4.7의 73.1%를 뛰어넘었다.
오픈AI는 기술 발전의 혜택이 공격자보다 방어자에게 먼저, 더 넓게 돌아가야 한다는 원칙 아래 합법적이고 방어적인 보안 활용을 지원하는 접근을 이어가고 있다고 설명했다. 앤스로픽은 보안 우려를 이유로 초고성능 AI 모델 '미토스'를 '프로젝트 글라스윙' 참여사에게만 제한적으로 공개했다.
오픈AI 측은 23일(현지시간) 열린 온라인 사전 브리핑에서 앤스로픽 '미토스'와의 성능을 비교하는 질문에 "모델이 매우 정확하다"며 성능지표를 확인해보라고 답했다. 다만 매개변수(파라미터) 수가 미토스(10조 개)보다 더 많은지에 대한 질문에는 "답하기 어렵다"고 했다.
앤스로픽은 17일 오퍼스 시리즈 최신 모델 클로드 오퍼스 4.7을 공개한 바 있다. AI 업계는 양사가 새로운 모델을 경쟁적으로 내놓는 배경에 IPO가 있다고 보고 있다. 성능을 획기적으로 높이기보다는 출시 자체로 시장의 관심을 가져오는 전략이라는 것이다.
한 AI 업계 관계자는 “IPO 직전이라 단순히 모델 성능을 높이는 것보다 비용을 줄이면서 수익을 창출하는 최적화 전략이 필요한 것”이라며 “최근 앤스로픽에 관심을 빼앗기는 상황이라 새로운 모델을 공개하는 주기가 한 달 이내로 더 짧아질 수 있다”고 말했다.




