2025.12.12 금요일
맑음 서울 3˚C
흐림 부산 5˚C
흐림 대구 5˚C
맑음 인천 4˚C
구름 광주 4˚C
흐림 대전 3˚C
흐림 울산 6˚C
흐림 강릉 2˚C
흐림 제주 11˚C
IT

오픈AI, GPT-5.2 전격 출시… 구글 추격에 '한 달 만의 승부수'

기자정보, 기사등록일
선재관 기자
2025-12-12 16:39:47

"구글 제미나이 잡는다"…추론·코딩 강화

'코드레드' 선언하더니…한 달 만에 새 모델

미국 오픈AI의 인공지능AI 서비스인 챗GPT의 어플리케이션앱 아이콘왼쪽 상단이 구글 제미나이 등 다른 경쟁사들의 AI 앱 아이콘들과 나란히 배치되어 있다사진EPA 연합뉴스
미국 오픈AI의 인공지능(AI) 서비스인 '챗GPT'의 어플리케이션(앱) 아이콘(왼쪽 상단)이 구글 '제미나이' 등 다른 경쟁사들의 AI 앱 아이콘들과 나란히 배치되어 있다.[사진=EPA 연합뉴스]

[이코노믹데일리] 오픈AI(CEO 샘 올트먼)가 구글의 거센 추격을 따돌리기 위해 이전 모델 출시 한 달 만에 성능을 대폭 강화한 ‘GPT-5.2’를 전격 공개하며 초거대 AI 패권 경쟁에 다시 불을 붙였다.

오픈AI는 11일(현지시간) 전문 지식 업무 수행 능력을 극대화한 GPT-5.2 시리즈를 출시한다고 밝혔다. 이번 신모델은 기존의 즉답(Instant) 및 사고(Thinking) 모드에 더해 복잡한 장기 연산에 최적화된 ‘프로(Pro)’ 모드를 추가하며 총 3가지 라인업으로 구성됐다.

오픈AI가 이례적으로 한 달 만에 새 버전을 내놓은 것은 경쟁사인 구글의 ‘제미나이3 프로’가 벤치마크 성능에서 앞서나가며 점유율을 위협했기 때문이다. 실제 샘 올트먼 CEO는 제미나이3 프로 출시 직후 사내에 최고 비상 단계인 ‘코드레드(Code Red)’를 발령하고 챗GPT 성능 개선에 총력을 기울일 것을 주문한 바 있다.

GPT-5.2는 이러한 위기감 속에 탄생한 만큼 압도적인 성능 지표를 제시했다. 전문 산업 현장의 44개 직종 업무 능력을 평가하는 GDPval 테스트에서 GPT-5.2 프로 모드는 74.1%를 기록해 인간 전문가 수준에 도달했다. 이는 전작인 GPT-5(38.8%) 대비 비약적인 성장이다.

소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록해 제미나이3 프로(76.2%)를 따돌렸고 코딩 특화 모델인 앤트로픽의 클로드 오퍼스4.5(80.9%)와 대등한 수준에 올랐다. 또한 ‘인간의 마지막 시험’으로 불리는 박사급 추론 능력 평가(HLE)에서도 검색 도구 활용 시 50%의 정답률을 보여 제미나이3 프로(45.8%)를 앞섰다.

고질적인 문제였던 환각(Hallucination) 현상도 개선됐다. 내부 테스트 결과 사고 모드의 오류율은 6.2%로 전작 대비 약 30% 감소해 신뢰도를 높였다. 오픈AI는 이 밖에도 연령 예측 모델을 적용해 미성년자 보호 기능을 강화하고 디즈니와의 라이선스 계약을 통해 소라(Sora) 앱에서 디즈니 IP를 활용한 영상 제작을 지원하는 등 콘텐츠 확장에도 나섰다.

한편 샘 올트먼 CEO는 회사 창립 10주년을 맞아 “향후 10년 안에 초지능(AGI) 구축이 거의 확실시된다”며 “2035년에는 상상하기 어려운 일을 해낼 것”이라는 비전을 제시했다.


0개의 댓글
0 / 300
댓글 더보기
하이트진로
kb캐피탈
KB국민카드
우리은행
하나증권
동아쏘시오홀딩스
메리츠증권
우리모바일
하이닉스
롯데웰푸드
HD한국조선해양
삼성화재
신한라이프
우리은행
하나금융그룹
현대해상
IBK
LG화학
동국제약
한화
KB국민은행_2
어킵
KB국민은행_1
im금융지주
신한카드
미래에셋
KB국민은행_3
신한금융
우리은행
신한투자증권
전세사기_숫자쏭
삼성전자
kb증권
다음
이전
댓글을 삭제 하시겠습니까?
닫기
로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?
닫기
기사 이미지 확대 보기
닫기