이코노믹데일리 - 정확한 뉴스와 깊이 있는 분석
금융
산업
생활경제
IT
ESG
건설
정책
피플
국제
이슈
K-Wave
전체기사
검색
패밀리 사이트
아주경제
아주로앤피
아주일보
회원서비스
로그인
회원가입
지면보기
네이버블로그
2025.12.20 토요일
안개
서울 7˚C
맑음
부산 6˚C
맑음
대구 2˚C
흐림
인천 9˚C
맑음
광주 9˚C
맑음
대전 6˚C
맑음
울산 10˚C
흐림
강릉 8˚C
흐림
제주 13˚C
검색
검색 버튼
검색
'카나나-2'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
2
건
카카오, 차세대 언어모델 '카나나-2' 오픈소스 공개
[이코노믹데일리] 카카오(대표 정신아)는 19일 허깅페이스를 통해 자체 개발한 차세대 언어모델 '카나나-2'를 오픈소스로 공개했다. 카카오는 지난해 자체 개발 AI 모델 '카나나' 라인업을 공개한 이후 경량 모델부터 고난도 문제 해결에 특화된 '카나나-1.5'까지 다양한 모델을 순차적으로 오픈소스로 선보여왔다. 이번에 공개한 카나나-2는 기존 모델을 고도화한 최신 언어모델로 사용자 명령의 맥락을 이해하고 능동적으로 동작하는 에이전트 AI(인공지능) 구현을 목표로 개발됐다. 카나나-2는 베이스, 인스트럭트, 추론 특화 모델 등 총 3종으로 구성됐다. 인스트럭트 모델은 사후 학습을 통해 지시 이행 능력을 강화했으며, 추론 특화 모델은 복합적인 사고 과정이 요구되는 작업 수행에 초점을 맞췄다. 개발자들이 자체 데이터를 활용해 모델을 자유롭게 파인튜닝할 수 있도록 학습 단계의 웨이트도 함께 공개됐다. 카카오에 따르면 이번 모델은 도구 호출과 사용자 지시 이행 능력이 이전 모델 대비 크게 개선됐다. 기존 '카나나-1.5-32.5b'와 비교해 다중 대화 기반 도구 호출 성능이 3배 이상 향상됐으며 단계별 요구 사항을 포함한 복합 지시를 처리하도록 설계됐다. 지원 언어는 한국어와 영어를 포함해 일본어, 중국어, 태국어, 베트남어까지 총 6개로 확대됐다. 기술 구조 측면에서는 효율성을 높이기 위해 최신 아키텍처가 적용됐다. 긴 입력을 효율적으로 처리하는 'MLA' 기법과 추론 시 필요한 파라미터만 선택적으로 활성화하는 'MoE' 구조를 도입했다. 이에 메모리 사용량을 줄이면서도 긴 문맥을 처리할 수 있으며 대규모 동시 요청 환경에서도 처리 성능을 높였다. 성능 평가에서는 인스트럭트 모델이 동일 구조의 'Qwen3-30B-A3B'와 유사한 수준을 기록했다. 해당 모델은 이달 한국정보과학회와 공동 개최한 'AI 에이전트 경진대회'에서 참가자들에게 선공개돼 실제 에이전트 개발 환경에서 활용됐다. 추론 특화 모델 역시 추론 모드를 적용한 'Qwen3-30B-A3B'와 유사한 성능을 보였다. 카카오는 향후 동일한 MoE 구조를 기반으로 모델 규모를 확장하고 에이전틱 AI 활용에 특화된 모델과 온 디바이스 환경에 최적화된 경량 모델 개발을 병행할 계획이다. 김병학 카카오 카나나 성과리더는 "혁신적인 기술과 기능을 갖춘 AI 서비스의 근간은 기반이 되는 언어모델의 성능과 효율"이라며 "높은 성능에 초점을 둔 모델을 넘어 실제 AI 서비스에 적용되어 빠르고 효과적으로 동작할 수 있는 실용성을 갖춘 AI 모델을 개발하고 꾸준히 오픈소스로 공유하며 국내외 AI 연구 생태계 활성화에 기여할 계획"이라고 말했다.
2025-12-19 10:46:18
카카오, 멀티모달 AI '카나나-오' 공개… "한국어 벤치마크서 GPT-4o 압도"
[이코노믹데일리] 카카오(대표 정신아)가 텍스트를 넘어 음성과 이미지를 동시에 이해하고, 한국어의 미묘한 뉘앙스와 문화적 맥락까지 파악하는 고도화된 멀티모달(Multi-modal) 인공지능(AI) 모델을 선보였다. 카카오는 12일 테크블로그를 통해 통합 멀티모달 언어모델 ‘카나나-오(Kanana-o)’와 멀티모달 임베딩 모델 ‘카나나-브이-임베딩(Kanana-v-embedding)’의 개발 성과를 공개했다. 이번 발표는 지난 5월 카나나 모델의 초기 성능을 공개한 이후 실제 사람과 대화하듯 자연스러운 상호작용 능력과 한국어 특화 기능을 대폭 강화한 결과물이다. ‘카나나-오’는 텍스트와 음성 및 이미지를 실시간으로 동시에 처리하는 통합 모델이다. 기존 멀티모달 모델들이 텍스트 입력에는 강하지만 음성 대화 시 반응이 단순해지거나 부자연스러웠던 한계를 극복하는 데 주력했다. 카카오는 자체 구축한 고품질 데이터셋을 활용해 카나나-오의 지시 이행 능력을 고도화했다. 이를 통해 사용자의 복잡한 요구사항이나 숨은 의도를 파악하고 단순 질의응답을 넘어 요약, 번역, 감정 해석, 오류 수정 등 다양한 과업을 수행할 수 있게 됐다. 특히 주목할 점은 향상된 감정 표현 능력이다. 직접 선호 최적화(DPO) 기술을 적용해 기쁨, 슬픔, 분노 등 상황에 맞는 생생한 감정을 목소리에 실을 수 있다. 미세한 억양이나 호흡 변화까지 학습해 마치 사람과 대화하는 듯한 느낌을 준다. 팟캐스트 형태의 대화 데이터를 학습시켜 대화가 끊김 없이 자연스럽게 이어지는 ‘멀티턴(Multi-turn)’ 대화 능력도 갖췄다. 벤치마크 테스트 결과, 카나나-오는 영어 음성 성능에서 오픈AI의 최신 모델인 ‘GPT-4o’와 유사한 수준을 기록했다. 특히 한국어 음성 인식과 합성 및 감정 인식 능력에서는 월등히 높은 점수를 기록하며 한국형 AI로서의 경쟁력을 입증했다. 함께 공개된 ‘카나나-브이-임베딩’은 이미지 검색 특화 모델이다. 텍스트와 이미지를 동시에 이해해 사용자가 원하는 이미지를 정확히 찾아준다. ‘경복궁’이나 ‘붕어빵’ 같은 한국 고유 명사는 물론 ‘하멜튼 치즈’처럼 오타가 섞인 검색어에서도 문맥을 파악해 정확한 결과를 제시한다. ‘한복 입고 찍은 단체 사진’과 같은 복합적인 조건도 정밀하게 구분해낸다. 현재 이 기술은 카카오 내부 광고 시스템에 적용되어 유사도 분석 및 심사에 활용되고 있다. 카카오는 현재 모바일 기기에서도 원활하게 구동되는 온디바이스(On-device)용 경량화 모델 연구를 진행 중이다. 아울러 전문가 혼합(MoE) 구조를 적용해 성능과 효율을 극대화한 차세대 모델 ‘카나나-2’ 개발에도 속도를 내고 있다. 김병학 카카오 카나나 성과리더는 “카나나는 단순 정보 전달을 넘어 사용자 감정을 이해하고 한국적 맥락에서 자연스럽게 소통하는 AI를 지향한다”며 “실제 서비스 환경에 이를 적용해 일상 속에서 체감할 수 있는 AI 경험을 만들어가겠다”고 말했다.
2025-12-12 14:18:59
처음
이전
1
다음
끝
많이 본 뉴스
1
엔씨소프트, '블소2'·'호연' 서비스 종료 결정… "포트폴리오 재편"
2
여의도 신안산선 공사현장서 붕괴사고…매몰자 구조 완료·1명 심정지
3
토스증권, 내년 6월까지 국내주식 거래 수수료 전면 무료
4
포스코이앤씨에 쏠린 재시공 요구... 과학적 판단과 행정적 판단의 경계
5
엔씨소프트, 유튜버 '겜창현' 고소… "아이온2 허위사실 유포·업무방해 혐의"
6
대한항공·아시아나 마일리지 통합 최종안 확정 임박…소비자 권익 강화에 '초점'
7
韓 '소버린 AI', 수능 수학 풀게 했더니… 해외 모델에 완패
8
정부, 26년 만에 '지정거래은행 제도' 폐지…토스·케이·카카오뱅크 수수료 경쟁 가속
영상
Youtube 바로가기
오피니언
[편집인 칼럼] 쿠팡 김범석의 침묵은 민주주의에 대한 조롱이다