2025.12.19 금요일
흐림 서울 -0˚C
흐림 부산 5˚C
흐림 대구 -1˚C
흐림 인천 1˚C
흐림 광주 7˚C
흐림 대전 6˚C
흐림 울산 10˚C
흐림 강릉 8˚C
흐림 제주 14˚C
IT

네이버, 텍스트·이미지·음성 통합 모델 '옴니모달 AI' 공개 임박

기자정보, 기사등록일
류청빛 기자
2025-12-19 08:36:36

이르면 이달 말 신규 옴니모달 AI 모델 공개 예정

옴니모달, 여러 정보 맥락·의미를 통합적으로 이해

성남시에 위치한 네이버 사옥 사진연합뉴스
성남시에 위치한 네이버 사옥 [사진=연합뉴스]

[이코노믹데일리] 네이버가 텍스트·이미지·음성을 개별적으로 처리하는 수준을 넘어 다양한 정보를 처음부터 통합적으로 이해하고 생성할 수 있는 차세대 인공지능(AI) 모델 개발을 사실상 마무리한 것으로 확인됐다.

19일 정보통신기술 업계에 따르면 네이버는 이르면 이달 말 자체 생성형 AI 플랫폼 '하이퍼클로바X'를 고도화한 신규 옴니모달(omni-modal) AI 모델을 공개할 예정이다. 텍스트 중심이던 기존 AI에서 한 단계 진화한 형태로 네이버의 독자 AI 기술 경쟁력을 보여주는 핵심 모델이 될 것으로 전망된다.

이번에 공개될 옴니모달 모델은 기존 '멀티모달(multi-modal)'을 한층 확장한 개념이다. 멀티모달이 텍스트·이미지·음성을 각각 인식한 뒤 이를 연결해 의미를 해석하는 방식이라면 옴니모달은 학습 단계부터 여러 정보 형태를 동시에 받아들여 맥락과 의미를 통합적으로 이해한다는 점에서 차별화된다.

이를 통해 AI는 단순한 정보 인식을 넘어 상황과 환경, 사용자 의도까지 종합적으로 추론할 수 있다. 서로 다른 형태의 정보가 입력되더라도 맥락을 일관되게 파악할 수 있어 현실 세계와 보다 가까운 수준의 이해가 가능해진다.

또한 옴니모달 모델은 텍스트·이미지·음성 간 입출력 전환이 자유롭다는 점도 특징이다. 사용자는 상황에 따라 원하는 방식으로 질문할 수 있으며, AI는 다양한 정보 형태를 결합해 답변을 생성한다. 정보 표현 방식이 달라져도 응답의 정확성과 일관성을 유지할 수 있는 구조다.

기술적 측면에서도 여러 개별 모델을 조합하는 방식이 아닌 단일 통합 구조를 채택해 향후 모델 확장과 성능 고도화가 용이하다는 평가다. 이는 연산 효율성과 유지·보수 측면에서도 강점으로 작용한다.

이에 네이버는 경량화 규모의 옴니모달 모델을 먼저 시장에 출시할 전망이다. 모델 확장과 성능 고도화가 용이한 특성상 경량화 모델을 우선 개발한 이후 자원을 투입해 규모를 확장시킨다는 계획으로 풀이된다.


0개의 댓글
0 / 300
댓글 더보기
댓글을 삭제 하시겠습니까?
닫기
로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?
닫기
기사 이미지 확대 보기
닫기