한국전자통신연구원, AI 음향 인식 대회서 세계 1위

입력 2020-07-20 12:02

  • 작게보기

  • 기본크기

  • 크게보기

▲ETRI 연구진들이 개발한 차세대 다채널 오디오 프로세서 기술을 시연하는 모습 (한국전자통신연구원 제공)

국내 연구진이 인공지능(AI)을 이용해 소리를 듣고 어떠한 상황인지 음향 인식 기술력을 겨루는 국제대회에서 세계 1위를 달성했다. 이로써 기계가 사람과 같이 청각을 인식하는 길에 한 걸음 더 나아가고 음향 기술과 다양한 산업 분야의 융합이 가속화될 전망이다.

한국전자통신연구원(ETRI)은 세계적인 인공지능 기반 음향 이벤트 및 장면 인식 기술 경진 대회(DCASE) '음향 장면 인식 분야’에 참가해 전 세계 기업, 대학 연합팀들과 겨뤄 우수한 성적을 거뒀다고 20일 밝혔다.

올해로 6회째를 맞이한 본 대회는 세계 최대 전기·전자기술자협회(IEEE) AASP가 주관하고 구글, 인텔, 아마존, IBM, 삼성, LG 등 세계 유수 기관이 참가하는 음향 기술 관련 유일한 대회다. 대회는 6개 분야에 총 138개 팀과 473개의 제안 시스템이 제출되어 지난 3월부터 6월 중순까지 과제별 기술 경쟁이 이뤄졌다. ETRI가 참가한 분야 중 하나인 ‘복수 단말 대상 음향 장면 인식’ 과제는 여러 종류의 단말기로 녹음한 소리를 듣고 녹음 장소를 알아맞히는 분야다.

액션캠 및 바이노럴 마이크뿐 아니라 잡음이 쉽게 섞이는 일반 스마트폰에 이르기까지 장비별로 다른 신호 특성을 아울러 정확하게 판단하는 분야로 ‘일반화 성능’이 관건이다.

연구진은 해당 분야에서 시스템 순위 1, 2위를 석권하며 압도적인 기술력을 자랑했다. 팀별로 최대 4개 기술까지 제출이 가능해 총 28개 팀, 92개 시스템이 출전한 가운데 ETRI 기술들은 최고의 성적을 차지하며 팀 순위 1위를 달성할 수 있었다.

ETRI 김흥묵 미디어연구본부장은 “딥러닝 기반 음향 인식 기술은 향후 새로운 응용 서비스 기술 개발을 통해 국내 관련 산업의 경쟁력 확보와 시장 활성화에 크게 기여할 것이다”고 말했다.

이번 대회는 ETRI 미디어부호화연구실 서상원 연구원, 박수영 연구원, 정영호 책임연구원이 공동으로 참여하였으며 과학기술정보통신부 '신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발' 과제 일환으로 연구를 진행했다.

연구진은 본 기술과 관련해 지난 2017년부터 국내·외 특허 17건 출원, 기술 논문 11건을 발표했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소