검색결과 총 6건
-
"영상 속 원하는 장면, AI가 찾아준다"…네이버클라우드 MAIU, 콘텐츠 제작 혁신
[이코노믹데일리] 네이버클라우드가 인공지능(AI)으로 방대한 영상 속 정보를 분석해 원하는 장면을 손쉽게 찾아주는 서비스 'MAIU'(Media AI Understanding)를 선보였다. 이 서비스는 영상 편집에 소요되는 시간을 획기적으로 줄여 콘텐츠 제작 효율성을 극대화할 것으로 기대된다. 네이버클라우드는 21일 서울 코엑스에서 개막한 'KOBA 2025'(국제 방송·미디어·음향·조명 전시회)에 참가해 MAIU 기술을 처음 공개했다. MAIU는 영상 내 인물, 행동, 배경, 음성 등 다양한 요소를 AI가 자동으로 분석해 메타데이터를 생성한다. 이를 통해 사용자는 '와인잔 나오는 장면'이나 '남주인공 달리는 장면'처럼 특정 키워드를 텍스트로 검색하기만 하면 해당 장면을 신속하게 찾아낼 수 있다. 이 서비스는 방송사, 영상 제작사뿐만 아니라 유튜브, 숏폼 콘텐츠 등 다양한 영상을 다루는 제작자들이 반복적인 편집 작업에서 벗어나 창의적인 활동에 더 집중할 수 있도록 돕는다. 예를 들어 예능 프로그램 한 편 제작을 위해 촬영된 3600분 분량의 영상 데이터를 기존 방식으로는 편집팀이 약 32시간, 즉 3~4일에 걸쳐 분석하고 가편집을 마쳤다. 하지만 MAIU를 활용하면 이 과정을 2시간 이내로 완료할 수 있어 15배 이상 시간을 단축하는 효과를 얻는다. 네이버클라우드 측은 "기존 AI 분석 서비스는 일반적으로 개별 프레임 단위의 탐지나 객체 인식에 국한되어 있어 영상 콘텐츠의 흐름이나 맥락 이해가 어려웠지만 MAIU는 영상의 의미 단위인 구간(scene)을 중심으로 분석하는 것이 가장 큰 차이점"이라고 설명했다. 이는 프레임이나 샷 단위가 아닌 이야기의 흐름이나 구성상 자연스러운 구간별 분석을 의미하며 실질적인 콘텐츠 편집 및 재가공 시 훨씬 직관적이고 현업에서 바로 활용 가능한 형태로 정보를 제공한다. MAIU는 현재 국내 방송사와 파트너사를 대상으로 비공개 베타 테스트(CBT)를 진행 중이며 다음 달 정식 출시될 예정이다. 사용 요금은 글로벌 경쟁 제품 대비 최대 3분의 1 수준으로 책정될 계획으로 가격 경쟁력도 갖췄다. 또한 MAIU 서비스 이용 시 모바일 라이브 스트리밍, VOD 영상 송출 등의 기능도 동일 플랫폼 내에서 함께 활용 가능해 제작부터 송출까지 전 과정을 효율적으로 운영할 수 있다. 성무경 네이버 클라우드 플랫폼 기획 총괄은 "급속도로 성장하고 있는 영상 산업은 클라우드 전환 및 적극적인 AI 기술 도입으로 혁신이 가장 기대되는 분야 중 하나"라며 "AI 영상 분석 서비스를 포함해 콘텐츠 제작, 편집, 유통, 관리에 이르는 전 과정을 아우르는 엔드투엔드 미디어 서비스로 고객의 다양한 니즈를 만족시키고 영상 산업의 혁신을 이끌어 낼 수 있도록 노력하겠다"고 밝혔다. 한편 네이버클라우드는 KOBA 2025 전시 기간 중 22일 'AI가 여는 콘텐츠 활용 전략' 등을 주제로 미디어 세미나를 개최하며, KOBA 2025는 오는 23일까지 진행된다.
2025-05-21 16:49:27
-
-
알리바바 클라우드, 엣지 기기용 멀티모달 AI 'Qwen2.5-Omni-7B' 공개
[이코노믹데일리] 알리바바 그룹의 디지털 기술 및 인텔리전스 핵심 부문인 알리바바 클라우드가 최신 멀티모달 인공지능(AI) 모델 'Qwen2.5-Omni-7B'를 31일 새롭게 선보였다. Qwen2.5-Omni-7B 모델은 텍스트, 이미지, 음성, 영상 등 여러 유형의 입력 데이터를 동시에 이해하고 처리할 수 있는 엔드투엔드(end-to-end) 방식으로 개발되었다. 사용자의 다양한 입력에 대해 실시간 텍스트 응답은 물론, 자연스러운 음성 답변까지 생성 가능하다. 특히 70억 개(7B)의 상대적으로 적은 파라미터로 구성된 경량 모델임에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 구현한 점이 특징이다. 이러한 컴팩트한 설계와 고성능의 조합은 지능형 음성 애플리케이션과 같이 실제 환경에서 민첩하고 비용 효율적으로 작동해야 하는 AI 에이전트 개발에 유리하다. 예를 들어 시각 장애인이 주변 환경을 실시간 음성 설명으로 인지하도록 돕거나 동영상 속 재료를 분석해 요리법을 단계별로 안내하는 등의 서비스 구현이 가능하다. 알리바바 클라우드는 Qwen2.5-Omni-7B 모델을 오픈소스 커뮤니티에 공개했다. 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 누구나 접근할 수 있으며 자체 플랫폼인 큐원 챗(Qwen Chat)과 모델스코프(ModelScope)에서도 이용 가능하다. 이번 모델의 우수한 성능은 혁신적인 아키텍처 설계에 기반한다. 텍스트 생성(Thinker)과 음성 합성(Talker) 기능을 분리하여 모달 간 간섭을 최소화한 'Thinker-Talker 아키텍처', 비디오와 오디오 입력을 효과적으로 동기화하여 일관된 콘텐츠 생성을 돕는 'TMRoPE' 위치 임베딩 기술 그리고 끊김 없는 음성 상호작용을 위해 지연 시간을 줄인 '블록와이즈 스트리밍 처리' 기술 등이 적용되었다. Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성 등 다양한 조합의 방대한 데이터셋으로 사전 학습되어 여러 종류의 작업에서 강력한 성능을 발휘한다. 특히 시각, 청각, 텍스트 정보를 복합적으로 이해하고 추론하는 능력을 평가하는 OmniBench 벤치마크 등 멀티모달 처리 능력이 중요한 평가에서도 최고 수준의 성능을 기록했다. 또한 인컨텍스트 러닝(ICL)과 강화학습(RL)을 통해 문맥에 맞는 음성 이해 및 생성 능력을 향상시키고 음성 응답 시 발음 오류나 부자연스러운 끊김 현상을 크게 줄여 안정성을 높였다. 한편 알리바바 클라우드는 지난해 9월 Qwen2.5 시리즈를 처음 선보인 이후 올해 1월에는 'Qwen2.5-Max'를 출시하여 챗봇 아레나에서 7위를 기록하는 등 우수한 성능을 입증한 바 있다. 시각 이해 모델 'Qwen2.5-VL', 장문 처리 모델 'Qwen2.5-1M' 등도 오픈소스로 공개하며 Qwen 모델 라인업을 지속적으로 확장하고 있다.
2025-03-31 15:54:50
-
호세 대표 현대차 주총서 "불확실성 속 새로운 기회 창출"
[이코노믹데일리] 호세 무뇨스 현대자동차 대표가 지정학적 불확실성 속 새로운 기회 창출을 강조했다. 현대차가 20일 서울 서초구 엘타워에서 주주총회를 진행한 가운데 재무제표 승인의 건, 이사 선임의 건, 감사위원회 위원 선임의 건 등이 논의됐다. 이날 호세 대표는 주주총회 인사말을 통해 주주들에게 현대차의 현재 상황과 향후 계획을 면밀히 설명했다. 그중 가장 먼저 강조한 부분은 권역별 최적화 전략이다. 이를 통해 시장 점유율을 확대하고 수익성을 제고하겠다고 말했다. 트럼프 2기 행정부 관세 정책의 대응 방안으로 미국에서는 조지아주 공장 가동으로 전기차(EV) 판매 확대 계획을 공개했다. 또 혼류 생산 시스템을 구축해 하이브리드(HEV) 모델도 추가 생산할 계획이라 전했다. 아울러 126억 달러를 투자해 파트너사와 신공장 및 2개의 배터리 합작 공장을 건립할 것이라 밝혔다. 유럽시장에서는 전기차 신모델을 출시할 것이며 환경 규제에도 적극 대응할 계획이라 설명했다. 호세 대표는 중국 시장을 도전적인 시장이라 언급하며 "시장 수요에 맞춰 민첩하게 대응하고 있으며 빠른 시일 내 중국을 위한 전기차를 출시할 계획"이라고 말했다. 제품과 서비스의 경쟁력도 강조했다. 호세 대표는 "고품질, 안전 중심, 친환경 차량을 개발 및 제조하고 있으며, 제품 리더십 유지를 위해 많은 자원을 투자하고 있다"며 "고객이 원하는 기술이 탑재된 뛰어난 제품, 우수한 구매경험을 지속적으로 제공하고 '손님'을 귀하게 대하는 한국의 문화를 우리의 고객 서비스에 접목시켜 차별화된 고객 경험을 제공할 계획"이라고 말했다. 새롭게 도입된 고객 서비스로는 미국 시장 내 아마존 오토스를 통한 자동차 거래를 꼽았다. 현대차는 아마존 오토스 내 완전한 엔드투엔드 (end-to-end) 거래를 제공하는 유일한 브랜드이기 때문이다. 신기술을 위한 파트너십 계획도 설명했다. 그는 "당사는 아마존, 웨이모, GM 등과 전략적 파트너십을 지속적으로 추진하고 있다"며 "GM의 경우, 차량 개발, 공동 구매를 포함한 다양한 측면에서 협력하고 있으며, 웨이모의 경우 6세대 완전자율주행 기술인 ‘웨이모 드라이버’를 아이오닉5에 적용하고 이를 자율주행서비스 ‘웨이모 원’에 투입할 계획"이라고 전했다. 마지막으로 조직 문화 최적화를 목표로 삼았다. 경쟁이 심화된 환경에서 신속한 대응과 혁신이 핵심 요소라는 점에서다.
2025-03-20 17:01:49
-
-