사람처럼 ‘반성’ 기능 탑재돼 있어
‘자기적 개선 모델’로 진화 가능성
“기출문제 학습 결과일뿐” 신중론도

국제수학올림피아드(IMO)에 이어 세계 최고 권위의 컴퓨터 프로그래밍 대회에서도 금메달급 성과를 낸 ‘천재’가 있다. 구글 딥마인드가 개발한 인공지능(AI) 모델 ‘제미나이 2.5 딥 싱크(Gemini 2.5 Deep Think)’다.
28일 관련 업계에 따르면 최근 구글 딥마인드는 “제미나이 2.5 딥 싱크 고급 버전이 2025년 국제 대학생 프로그래밍 경진대회(ICPC) 세계 결선에서 금메달 수준의 성과를 냈다”고 밝혔다. 이 모델은 수학·알고리즘·추상적 문제 해결 등 고도의 논리와 계산 작업에 특화된 연구용 AI다.
이번 대회에는 지난 4일 예선을 통과한 139개 팀이 참가해 5시간 동안 12문제를 풀었다. 상위 4개 팀만 금메달을 받았는데, 제미나이는 원격 온라인으로 참여해 10문제를 해결하며 전체 2위에 해당하는 성적을 기록했다. 특히 어떤 대학 팀도 풀지 못한 문제를 단독 해결해 주목을 받았다.
구글 딥마인드는 “사전·사후 학습, 새로운 강화학습 기법, 다단계 추론, 병렬적 사고 등 다양한 혁신이 결합한 결과”라며 “여러 에이전트가 코드를 생성·실행·검증하며 지속적으로 개선하는 방식으로 문제를 풀었다”고 설명했다.
제미나이는 지난 7월 IMO에서도 인간 참가자와 동일한 조건에서 시험을 치른 결과, 금메달 점수에 해당하는 35점을 획득한 바 있다. 그레고르 돌리나르 IMO 위원장은 “AI의 풀이 대부분이 따라가기 쉽고 전개도 명확했다”고 평가했다.
AI가 코딩을 잘한다는 건 단순한 기술력 이상의 의미를 갖는다. 필요하다면 스스로 코딩을 통해 구조와 성능을 개선할 수 있기 때문이다. 데이터 선택과 검증은 물론, 알고리즘 자체를 인간 개입 없이 바꿔 나가는 ‘자기적 개선 인공지능(Self-improving AI)’로 진화할 수 있는 가능성을 보여준다.
이에 따라 AI의 IMO·ICPC 금메달 성과를 두고 인공지능이 일반인공지능(AGI) 요건에 한발 더 다가섰다는 평가가 나온다. AGI는 인간과 유사한 수준으로 모든 지적 작업을 이해·학습할 수 있는 시스템을 뜻한다. 젠슨 황 엔비디아 CEO는 지난해 “5년 내로 인간을 능가하는 AGI가 등장할 것”이라 했고, 미래학자 레이 커즈와일은 2029년경 AGI 실현을 전망한 바 있다.
최병호 고려대 AI연구소 교수는 “기존 AI가 확률적 모델이었다면 금메달 수준의 AI는 사람처럼 ‘반성(reflection)’ 기능을 탑재한 모델”이라며 “새로운 진실을 발견하는 AI라면 AGI로 인정해야 한다는 공감대가 있다”고 말했다. 그는 “반성해야 새로운 것을 발견할 수 있듯, 반성 기능은 AGI로 가는 핵심 단계”라고 강조했다.
반면 신중론도 있다. 최재식 카이스트 김재철AI대학원 교수는 “AI가 특정 과제에 잘 맞도록 ‘파인튜닝’을 거듭한다”며 “기출문제를 모아 학습하면 관련 문제는 잘 풀 수 있지만, 일반 문제에 대한 진짜 추론 능력을 확보했는지는 의문”이라고 지적했다. 이어 그는 “겉으론 추론 능력이 좋아 보이지만 실제로는 답치기 수준일 수 있다”고 덧붙였다.











