구글 제친 오픈AI…새 버전 'GPT-이미지 1.5' 공개

▲오픈AI 로고가 보인다. (로이터연합뉴스)

오픈AI가 이미지 생성 모델의 새 버전을 내놓으며 인공지능(AI) 이미지 시장 경쟁에 다시 불을 지폈다. 일본 애니메이션 제작사 '스튜디오 지브리' 풍 이미지를 생성하는 기능으로 주목받았던 오픈AI의 'GPT-이미지' 도구가 한층 강화된 모습으로 돌아왔다.

챗GPT 개발사 오픈AI는 16일(현지시각) AI 이미지 생성·편집 도구 'GPT-이미지 1.5'를 출시했다고 밝혔다. 이는 구글이 유사한 기능을 갖춘 이미지 도구 '나노바나나 프로'를 선보인 지 불과 26일 만이다.

새 도구의 가장 큰 특징은 기존 이미지를 편집할 때 세부 사항을 유지하면서 정밀한 편집을 할 수 있다는 점이다. 사용자는 명령어(프롬프트)를 통해 이미지 전체 구도나 분위기는 그대로 둔 채 옷이나 모자 색상을 바꾸거나, 그림 속 특정 문구만 선택적으로 수정할 수 있다.

사진에 등장하는 인물을 캐릭터처럼 활용해 포스터나 홍보물 등 새로운 이미지로 확장 제작하는 기능도 지원한다. 속도 측면에서도 이전 모델보다 최대 4배 빠르게 생성한다.

(출처=오픈AI 홈페이지 캡처)

오픈AI는 새 버전에서 이미지 편집의 정밀도뿐 아니라 명령어 이해 능력도 크게 향상됐다고 설명했다. 이전 버전에서는 '가로 6칸, 세로 6줄의 표를 만들어 달라'는 요청을 제대로 구현하지 못하고 일부 요소가 빠지는 경우가 있었지만, 새 버전은 사용자의 의도를 더욱 정확히 반영해 완성도를 높였다.

특히 구글 나노바나나 프로의 강점으로 평가받던 문자 표현 능력도 강화됐다. 문자가 포함된 이미지 역시 어색함 없이 구현할 수 있어, 단순한 그림 제작을 넘어 실생활에 활용 가능한 인포그래픽 제작까지 가능하다는 설명이다.

아울러 챗GPT 화면 왼쪽에 '이미지' 탭을 새로 마련해, 그동안 생성한 이미지를 모아볼 수 있도록 사용자 환경도 개선했다. 새 버전은 챗GPT 사용자라면 즉시 이용할 수 있다.

이 같은 성능 개선은 외부 평가에서도 성과로 이어졌다. 다수의 이용자가 블라인드 테스트(정보가림 평가) 방식으로 선호 모델을 선택하는 'LM아레나 리더보드'에서 GPT-이미지 1.5는 기존 1위였던 구글의 나노바나나 프로를 제치고 정상에 올랐다.

앞서 샘 올트먼 오픈AI 최고경영자(CEO)는 지난달 구글이 AI 모델 '제미나이 3 프로'와 이미지 도구 나노바나나 프로를 공개하자 사내에 이른바 '코드 레드'(중대경보)를 발령하고, 직원들에게 GPT 새 모델과 이미지 도구 개선에 집중할 것을 지시한 바 있다.

AI 이미지 경쟁이 격화되는 가운데 경쟁사들의 움직임도 이어지고 있다. 이날 어도비는 이미지 생성 도구 '파이어플라이'에 AI 기업 토파즈랩스의 '아스트라' 모델을 적용해, AI 기반 동영상 생성과 함께 명령어를 통해 일관성을 유지하며 정밀하게 수정할 수 있는 기능을 공개했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소