2025.07.11 금요일
맑음 서울 31˚C
구름 부산 29˚C
구름 대구 30˚C
맑음 인천 32˚C
맑음 광주 32˚C
맑음 대전 31˚C
맑음 울산 29˚C
흐림 강릉 27˚C
제주 26˚C
IT

KAIST 최정우 교수팀,'사람처럼 듣는 AI'…세계 음향 기술 대회 정상에 서다

기자정보, 기사등록일
선재관 기자
2025-07-11 07:59:52

세계 최고 음향 AI 챌린지 1위 쾌거

소음 속에서 목소리만 쏙…'AI 귀'

왼쪽부터 권영후 석박사통합과정 김도환 석사과정 최정우 교수 이동헌 박사사진KAIST
(왼쪽부터) 권영후 석박사통합과정, 김도환 석사과정, 최정우 교수, 이동헌 박사.[사진=KAIST]

[이코노믹데일리] KAIST 연구팀이 여러 소리가 뒤섞인 복잡한 환경에서 특정 소리만 정확히 분리하고 식별해내는 인공지능(AI) 기술로 세계 최고 권위의 기술 대회 정상에 올랐다. 마치 사람이 시끄러운 공간에서도 원하는 소리에 집중해 듣는 방식을 모방한 이 기술은 향후 AR/VR 콘텐츠 제작이나 국방 감시 시스템의 혁신을 이끌 핵심 기술로 평가된다.

KAIST는 11일 전기및전자공학부 최정우 교수 연구팀이 음향 탐지 및 분석 분야의 세계 최고 대회인 ‘IEEE DCASE 챌린지 2025’에서 ‘공간 의미 기반 음향 장면 분할’ 분야 1위를 차지했다고 밝혔다. 전 세계 86개 팀이 참가한 이번 대회에서 최 교수팀은 기술 난이도가 가장 높은 분야에 처음 출전했음에도 불구하고 압도적인 성능으로 우승하는 쾌거를 이뤘다.

연구팀의 성공 비결은 ‘단계적 추론 방식’의 AI 모델에 있다. 이 모델은 먼저 혼합된 소리들을 1차로 분리한 뒤 그 결과에서 얻은 소리의 종류나 방향 같은 단서를 활용해 다시 한번 정교하게 음원을 분리하고 분류하는 과정을 거친다. 이는 인간의 청각 인지 방식을 AI로 구현한 것으로 기술의 독창성과 우수성을 높게 평가받았다.
 
혼합 음원으로부터 분리된 음원들의 시간-주파수 패턴
혼합 음원으로부터 분리된 음원들의 시간-주파수 패턴
연구진이 개발한 음향의 분리 및 분류 AI 구조
연구진이 개발한 음향의 분리 및 분류 AI 구조.

성능은 객관적인 수치로 입증됐다. AI가 소리를 얼마나 선명하게 분리했는지를 평가하는 ‘음원의 신호대 왜곡비 향상도(CA-SDRi)’ 지표에서 참가팀 중 유일하게 두 자릿수인 11데시벨(dB)을 기록했다. 이는 경쟁 모델들과 기술 격차가 상당함을 의미한다.

이번에 개발된 기술의 활용 분야는 무궁무진하다. AR/VR 콘텐츠 제작 시 공간 음향을 음원별로 자유롭게 분리해 편집하거나 드론이나 공장 설비, 국경 감시 시스템 등에서 이상 음향을 조기에 탐지하는 차세대 음향 감시 체계에 적용될 수 있다.

최정우 교수는 "연구팀은 최근 3년간 세계 최고의 음향 분리 AI 모델을 선보여 왔으며 그 결과를 공식적으로 인정받는 계기가 되어 기쁘다”면서 “난이도가 대폭 향상되고 불과 몇 주간만 개발이 가능했음에도 집중력 있는 연구를 통해 1위를 차지한 연구팀 개개인이 자랑스럽다”고 소감을 밝혔다.


0개의 댓글
0 / 300
댓글 더보기
e편한세상
LG
KB국민은행_1
kb_4
KB국민은행_2
메리츠증권
KB국민은행_4
농협
한국투자증권
kb
kb증권
KB국민은행_3
쿠팡
대신
삼성
신한라이프
CJ
삼성증권
이마트_데일리동방
셀트론
sk
SK하이닉스
kb_5
KB_1
우리은행_2
미래에셋자산운용
하나금융그룹
LG
동아쏘시오홀딩스
KB
롯데건설
빙그레
DB그룹
LG생활건강
SK
우리카드
롯데카드
우리은행_1
sk네트웍스
kb_2
NH투자증
NH농협
위메이드
kb_3
하나증권
KB손해보험
다음
이전
댓글을 삭제 하시겠습니까?
닫기
로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?
닫기
기사 이미지 확대 보기
닫기