이코노믹데일리 - 정확한 뉴스와 깊이 있는 분석
금융
산업
생활경제
IT
ESG
건설
정책
피플
국제
이슈
K-Wave
전체기사
검색
패밀리 사이트
아주경제
아주로앤피
아주일보
회원서비스
로그인
회원가입
지면보기
네이버블로그
2025.05.02 금요일
맑음
서울 17˚C
맑음
부산 18˚C
구름
대구 19˚C
맑음
인천 15˚C
맑음
광주 18˚C
맑음
대전 18˚C
흐림
울산 20˚C
흐림
강릉 16˚C
맑음
제주 17˚C
검색
검색 버튼
검색
'100만 토큰'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
2
건
구글, 제미나이 2.5 플래시로 AI 추론 요금 인하…오픈AI에 가격 압박
[이코노믹데일리] 구글이 AI 추론용 모델 가격을 대폭 인하하며 생성형 인공지능 시장의 가격 전쟁에 불을 지폈다. 오픈AI가 신제품을 공개한 지 하루 만에 내놓은 강수다. 반격에 나선 오픈AI는 속도를 낮춘 절반 가격 요금제로 맞섰지만 클라우드 인프라 경쟁력에서 격차가 뚜렷하다는 분석이 나온다. 구글은 17일(현지 시간) 생성형 AI ‘제미나이 2.5 플래시’를 일반 및 클라우드 사용자 대상 미리보기 버전으로 출시했다. 이번 모델은 지난 구글 클라우드 넥스트 2025에서 공개된 경량화된 AI로 일반형과 추론형 두 가지로 제공된다. 추론 기능을 활성화할 경우 기존 딥시크 R1 모델을 능가하는 성능을 보인다. 가격 정책은 더욱 공격적이다. 구글은 이날 API 요금도 함께 발표했다. 100만 토큰 기준 입력 요금은 0.15달러, 출력 요금은 비추론의 경우 0.6달러, 추론 시 3.5달러다. 오픈AI가 전날 공개한 o4 미니의 입력 1.1달러, 출력 4.4달러보다 현저히 낮은 수준이다. 특히 입력 가격만 놓고 보면 딥시크 R1 대비 27%에 불과하다. 구글은 “2.5 플래시는 속도와 비용에 중점을 두면서도 추론 기능을 대폭 업그레이드해 비용 대비 성능이 매우 뛰어나다”며 “품질과 비용, 시간 지연 간 균형 최적화를 위해 ‘사고(추론)’에 대한 예산을 설정할 수 있다”고 설명했다. 오픈AI도 반격에 나섰다. 구글 발표 당일, 고객사들을 대상으로 ‘플렉스 요금제’ 시범 도입 소식을 알렸다. 이 요금제는 응답 시간이 느리고 자원 사용이 간헐적이지만 API 사용료가 절반으로 줄어든다. 이 방식을 택하면 o4 미니는 출력 기준에서 구글 제미나이 2.5 플래시보다 가격 경쟁력을 확보할 수 있다. 그러나 전문가들은 구조적 한계를 지적한다. 테크 업계에서는 자체 클라우드 인프라가 없는 오픈AI의 비용 구조가 약점으로 작용하고 있다는 분석이 지배적이다. 구글은 자사 클라우드와 연계해 수익성을 확보할 수 있는 반면 오픈AI는 마이크로소프트(MS) 등 외부 클라우드에 의존해야 해 가격 인하에 한계가 있다. 여기에 챗GPT 이미지 생성 기능이 폭발적인 인기를 끌며 연산 자원 수요가 급증한 것도 오픈AI에 부담으로 작용하고 있다. 업계 관계자는 “무턱대고 가격 인하 경쟁을 따라가기에는 비용이 부담되기에 연산 속도를 포기한 셈”이라며 “스타트업 역사상 가장 큰 투자를 받았음에도 기존 빅테크의 체력을 단기간에 따라잡기는 어렵다”고 말했다. 한편 구글은 이와 함께 제미나이의 대중화를 위한 전략도 강화하고 있다. 18일에는 K-팝 그룹 르세라핌과 협업한 글로벌 캠페인 영상을 공개했다. 르세라핌 멤버들이 안드로이드 스마트폰과 제미나이를 활용하는 모습을 보여주며 사용자 일상 속 AI 기술 접점을 넓히는 데 초점을 맞췄다. 구글은 “제미나이 라이브의 비주얼 인식 기능이나 실시간 번역 기능 등 실제 사용 사례를 전 세계 이용자에게 소개하고 있다”고 밝혔다. 생성형 AI 시장이 기술 경쟁을 넘어 가격과 소비자 접점까지 확대되면서 빅테크 간 전략 차별화가 본격화되고 있다. 한정된 연산 자원과 투자 회수라는 현실 속에서 각 기업이 어떤 선택을 할지 주목된다.
2025-04-18 11:12:14
오픈AI, 성능·비용 개선한 새 AI 모델 GPT-4.1 공개
[이코노믹데일리] 챗GPT 개발사 오픈AI가 14일(현지시간) 새로운 인공지능(AI) 모델 GPT-4.1을 발표했다. 이번 발표에는 소형 모델인 GPT-4.1 미니(mini)와 GPT-4.1 나노(nano)도 포함됐다. 오픈AI는 GPT-4.1이 지난해 출시된 GPT-4o 멀티모달 AI 모델의 후속작이며 거의 모든 면에서 성능이 뛰어나다고 밝혔다. 회사 측 설명에 따르면 새 모델은 특히 코딩 성능 면에서 GPT-4o보다 21% 향상됐으며 지시사항 이행 능력과 장문의 맥락 이해도 역시 개선되어 AI 에이전트 구동에 더욱 효과적이다. 이번 모델의 핵심 개선 사항 중 하나는 처리 가능한 문맥의 길이다. GPT-4.1은 최대 100만 토큰(단어 또는 문장의 기본 단위)의 문맥을 처리할 수 있는데 이는 12만8천 토큰을 처리하는 GPT-4o의 8배에 해당하는 규모다. 오픈AI는 "GPT-4.1은 전체 100만 토큰 길이에 걸쳐 정보를 안정적으로 인식하도록 학습됐고 GPT-4o보다 관련 정보를 더 잘 찾아내고, 불필요한 요소는 무시하는 능력이 크게 향상됐다"고 설명했다. 성능 향상과 더불어 비용 효율성도 높아졌다. GPT-4.1은 GPT-4o보다 비용이 26% 저렴해졌으며 코딩 작업 평가 벤치마크(SWE-Bench) 테스트에서는 54.6%의 성공률을 기록하며 GPT-4o의 33.2%를 크게 앞질렀다. 이러한 비용 효율성을 바탕으로 오픈AI는 기존 GPT-4.5 프리뷰 버전을 오는 7월 종료할 예정이라고 덧붙였다. 샘 올트먼 오픈AI 최고경영자(CEO)는 소셜미디어 엑스(X)를 통해 "벤치마크 결과도 좋지만 우리는 실제 사용성에 집중했고 개발자들의 반응도 매우 긍정적이다"라고 전했다. 함께 공개된 GPT-4.1 미니는 개발자들이 저렴하게 실험할 수 있도록 지원하며 GPT-4.1 나노는 현재까지 공개된 오픈AI 모델 중 가장 작고 빠르며 저렴한 모델로 소개됐다. 새로운 모델들은 우선 오픈AI의 애플리케이션 프로그래밍 인터페이스(API)를 통해 개발자들에게 제공된다. 일반 이용자를 위한 챗GPT 통합 일정은 아직 공개되지 않았다. 오픈AI는 이와 함께 조만간 추론 모델 o3 정식 버전과 o4 미니 버전을 출시할 계획이라고 밝혔다.
2025-04-15 08:26:45
처음
이전
1
다음
끝
많이 본 뉴스
1
SKT 해킹 사태, 국가 통신망 '뇌관' 건드렸다… 재발 방지 시스템 전면 개혁해야
2
SKT 유심 해킹 여파… 편의점 알뜰폰 유심 판매 불티
3
SKT '유심 해킹돼도 금융 탈취 불가...FDS·보호서비스로 차단'
4
테일러 공장 완공 눈앞…삼성전자, 수익성·관세 딜레마 직면
5
SKT, 유심 해킹 피해 100% 보상 약속… "보호 서비스 가입 우선" [대고객 발표 전문]
6
[유통가 사모펀드 쇼크] ③ 같은 전략, 엇갈린 운명…사모펀드의 빛과 그림자
7
[단독] 코웨이, 1년 넘게 동명이인 렌탈 요금 합산 인출
8
SKT 유심 무료 교체 첫날 혼란… 온라인 예약에도 '오픈런'
영상
Youtube 바로가기
오피니언
[데스크 칼럼] '흥국'에 드리운 복귀의 망령…'금융 농락' 이호진 전 회장에게 경영을 또 맡기겠다고?