구글이 지난달 공개한 차세대 생성형 인공지능(AI) 모델 '제미나이 3'의 경량·고속 버전인 '제미나이 3 플래시'(Gemini 3 Flash)를 선보이며 제품군을 확장했다. 프런티어급 성능을 유지하면서도 응답 속도와 비용 효율을 대폭 개선한 것이 특징으로, 생성형 AI 시장에서의 경쟁을 한층 끌어올렸다.
구글은 17일(현지시간) 답변 속도를 높이고 비용을 낮춘 AI 모델 '제미나이 3 플래시'를 출시한다고 밝혔다.
'제미나이 3 플래시'는 지난달 공개한 '제미나이 3 프로'(Gemini 3 Pro)와 고급 추론 모드인 '딥 싱크'(Deep Think)의 핵심 성능을 유지하면서도, 속도·효율·비용 경쟁력을 결합한 모델이다. 구글은 "일상적인 작업의 추론 성능을 높이는 것은 물론, 에이전트 워크플로우에서 가장 인상적인 성능을 보여준다"고 강조했다.
성능 지표에서도 '제미나이 3 플래시'는 높은 평가를 받았다. 박사급 지식과 추론 능력을 평가하는 'GPQA 다이아몬드'에서 90.4%를 기록했으며, '인류의 마지막 시험'(Humanity’s Last Exam)에서는 도구 없이 33.7%를 기록했다. 멀티모달 성능을 측정하는 'MMMU 프로'(MMMU Pro)에서도 81.2%를 기록해, '제미나이 3 프로'에 준하는 수준의 성능을 달성했다.
효율성 측면도 두드러진다. '제미나이 3 플래시'는 작업 난이도에 따라 사고량을 조절하며, 일반적인 트래픽 기준으로 2.5 프로 대비 평균 토큰 사용량을 약 30% 절감하면서도 더 높은 정확도를 제공한다. 외부 분석 기준으로는 2.5 프로보다 최대 3배 빠른 응답 속도를 구현하면서도 비용은 크게 낮췄다.
API 기준 가격은 입력 토큰 100만 개당 0.50달러, 출력 토큰 100만 개당 3달러다.
개발자를 겨냥한 성능도 강조했다. 코딩 에이전트 성능을 평가하는 'SWE-벤치 검증'(SWE-bench Verified)에서 78%를 기록해, '제미나이 3 프로'를 상회하는 결과를 보였다.
구글은 "'제미나이 3 플래시'가 에이전트형 코딩, 프로덕션 환경, 반응형 인터랙티브 애플리케이션에 이상적인 균형점이며, 강력한 추론·도구 활용·멀티모달 성능을 바탕으로 영상 분석, 데이터 추출, 시각적 Q&A 등 복잡한 작업에서도 빠르고 깊이 있는 응답이 가능하다"고 설명했다.









