이코노믹데일리 - 정확한 뉴스와 깊이 있는 분석
금융
산업
생활경제
IT
ESG
건설
정책
피플
국제
이슈
K-Wave
전체기사
검색
패밀리 사이트
아주경제
아주로앤피
아주일보
회원서비스
로그인
회원가입
지면보기
네이버블로그
2025.11.23 일요일
흐림
서울 13˚C
맑음
부산 11˚C
맑음
대구 10˚C
흐림
인천 13˚C
흐림
광주 10˚C
흐림
대전 9˚C
흐림
울산 9˚C
흐림
강릉 10˚C
맑음
제주 14˚C
검색
검색 버튼
검색
'SWE-bench'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
1
건
"더 똑똑한 AI는 의미 없다"…오픈AI와 구글, '성능 경쟁' 끝내고 '용도 전쟁' 돌입
[이코노믹데일리] 오픈AI의 'GPT-5.1'과 구글의 '제미나이3(Gemini 3)'가 일주일 간격으로 시장에 쏟아지며 전 세계 AI 업계가 다시금 들썩이고 있다. 두 모델 모두 전작을 뛰어넘는 성능을 보여주고 있지만 과거처럼 '누가 더 똑똑한가'를 가리는 수직적 경쟁은 끝났다는 분석이 지배적이다. 대신 구글은 압도적인 '창의성과 멀티모달'을, 오픈AI는 극한의 '속도와 효율'을 택하며 각자의 생존 영역을 구축하는 '각자도생'의 길로 들어섰다. 구글이 내세운 제미나이3 시리즈의 핵심 무기는 '복합 멀티모달' 능력이다. 텍스트를 넘어 영상, 이미지, 대용량 문서(PDF)를 한 번에 처리하는 능력에서 경쟁사를 압도한다. 구글은 공식 블로그를 통해 인간 전문가 수준을 평가하는 ‘인류의 마지막 시험(Humanity's Last Exam, HLE)’ 벤치마크 결과 최상위 모델인 ‘제미나이3 프로’가 37.5%의 정답률을 기록해 26.5%에 그친 GPT-5.1을 큰 격차로 따돌렸다고 밝혔다. 여기에 100만 토큰 이상의 대규모 문맥 유지력과 안드로이드, 유튜브 등 구글 생태계와의 연동성은 제미나이3만의 강력한 해자(Moat)다. 특히 텍스트 명령만으로 3D 시뮬레이션과 게임 구조를 짜주는 '바이브 코딩(Vibe Coding)'과 4K 해상도 이미지를 생성하는 '나노바나나 프로'는 크리에이터들에게 대체 불가능한 옵션으로 자리 잡고 있다. 미국 테크 매체 톰스가이드가 진행한 비교 실험에서 제미나이3가 창의적 글쓰기, 이미지 분석 등 7개 항목에서 승리한 것도 이러한 특성을 뒷받침한다. 반면 오픈AI의 GPT-5.1은 철저히 '비즈니스 효율'에 초점을 맞췄다. '인스턴트(Instant)'와 '씽킹(Thinking)'으로 이원화된 적응형 추론 모드는 작업 난이도에 따라 리소스를 조절하며 속도와 비용을 최적화한다. 전작(GPT-5) 대비 2~3배 빨라진 속도와 절반으로 줄어든 토큰 비용은 기업 고객들에게 거부할 수 없는 매력이다. 코딩 벤치마크인 SWE-bench Verified에서 76.3%를 기록하며 제미나이3 프로(76.2%)를 근소하게 앞선 점도 실무 개발자들의 지지를 받는 요인이다. 레딧 등 개발자 커뮤니티에서는 "실시간 대화나 API 기반 서비스에선 GPT-5.1이 더 안정적"이라는 평가가 주를 이룬다. 하지만 화려한 성능표 뒤에는 두 기업이 감추고 싶은 '불편한 진실'도 존재한다. 구글 제미나이3의 경우 혁신적인 기능만큼이나 높은 '진입 장벽'이 문제다. 심층 추론 기능인 '딥싱크(DeepThink)'는 대규모 문맥 분석에 탁월하지만 초기 버전에서 간헐적인 추론 오류가 보고되고 있으며 무엇보다 API 단가가 지나치게 높다는 지적을 받는다. 아무리 성능이 좋아도 비용 효율이 떨어지면 대다수 기업이 도입하기 어렵다. '나노바나나 프로' 같은 도구 역시 고사양을 요구해 일반 사용자의 접근성은 떨어진다. 오픈AI의 GPT-5.1 역시 비판에서 자유롭지 않다. '효율'을 강조했지만 이는 역설적으로 기술적 혁신이 정체되었다는 방증이기도 하다. 복잡한 멀티모달 처리나 초장기 문맥 유지력에서 구글에 비해 보수적인 접근을 취하면서 "더 이상 오픈AI가 AI 트렌드를 선도하지 못한다"는 회의론도 고개를 들고 있다. 벤치마크 점수 0.1% 차이로 우위를 주장하는 마케팅 전쟁에 피로감을 호소하는 목소리도 높다. 결국 시장의 선택 기준은 '성능 우열'이 아닌 '목적 적합성'으로 이동하고 있다. 테크크런치는 "더 뛰어난 모델을 찾는 시대는 끝났다. 이제는 어떤 일을 누구에게 맡길지가 핵심"이라고 진단했다. 톰스가이드 역시 “창의적·복합적 사고가 필요하면 제미나이 3, 정밀성과 계산 중심 업무라면 GPT-5.1이 더 적합하다”고 평가했다. 이제 AI 전쟁의 승패는 누가 더 높은 점수를 받느냐가 아니라 누가 더 빨리 사용자의 구체적인 업무 파이프라인에 녹아드느냐에 달려있다. 2025년의 AI 시장은 '절대 강자'가 사라진 자리에 '최적의 도구'만이 살아남는 춘추전국시대로 접어들었다.
2025-11-23 15:07:31
처음
이전
1
다음
끝
많이 본 뉴스
1
미등기 임원이 꿀꺽…이마트, 114억원 규모 배임·횡령 발생
2
[데스크 칼럼] 김택진의 반성문, 그리고 '아이온2'라는 마지막 희망
3
[단독]한화에너지·한화솔루션 '집안 싸움'...법원, 강제조정 돌입
4
클라우드플레어 대규모 장애…X·챗GPT·LoL 등 전 세계 서비스 '먹통'
5
상법 개정에 롯데'표정관리'·금호석화 '지지'·LG화학 '무관심'
6
T1 '구마유시' 이민형, 7년 만에 계약 종료…월즈 MVP 직후 FA 선언
7
10년째 표류하는 GBC, 현대건설의 '침묵 리스크'가 실적을 옥죈다
8
포스코 포항제철소서 청소업체 직원 3명 쓰러져 병원 이송...화학물질 흡입
영상
Youtube 바로가기
오피니언
[편집인 칼럼] 한국 정치, 이대로는 안 된다. (4)