네이버 음성인식의 진화… 여러명이 동시에 말해도 거뜬

입력 2019-04-05 17:46

  • 작게보기

  • 기본크기

  • 크게보기

▲김성훈 네이버 클로바 리더가 클로바 AI에 대해 설명하고 있다. (조성준 기자 tiatio@)

네이버가 음성인식을 활용한 다양한 기술 발전에 나선다. 앞으로는 음성을 통해 식당 예약과 주문이 가능해질 전망이다.

네이버는 서울 그랜드 인터컨티넨털 호텔에서 개최한 ‘네이버 AI 콜로키움 2019’에서 음성인식을 활용한 ‘듀엣’ 서비스를 개발하고 있다고 5일 밝혔다.

이날 김성훈 네이버 클로바 리더는 ‘클로바 AI 함께해요’를 주제로 음성합성, 입술읽기, 동작인식 등 새로운 음성인식 기술을 선보였다.

우선 음성 합성을 통해 새로운 기계음을 만들 수 있다. 현재 기계음은 딱딱한 톤이 대부분이지만 여러 요소 변화를 통해 사투리 등 일상어에 친숙한 음성으로 변화시킬 수 있다. 톤을 바꾸면서 지루하지 않고 다양하게 변화시키는 것이 가능하다는 뜻이다.

또 주변이 시끄러운 환경에서도 음성인식이 가능해진다. 여러명이 동시에 말을 해도 카메라는 말하는 사람의 입술모양을 분석해 정확한 텍스트 도출이 가능하다. 카메라는 입술을 정확하게 인식해 전달하고자 하는 문장을 읽어낼 수 있다. 얼굴이나 입술뿐만 아니라 전체 동작을 스캐닝 해 춤 점수 자동 계산 등 새로운 기술도 선보였다.

네이버는 이 같은 기술을 합쳐 ‘듀엣’ 서비스를 개발하고 있다. 이날 행사장에서는 ‘듀엣’을 활용해 식당을 예약하고 음식을 주문하는 시연을 펼쳤다. 다만 듀엣은 현재 컨셉형 모델로 앞으로 기술 개발에 방향에 따라 변경될 가능성도 있다.

김성훈 리더는 “음성을 듣는 것과 보는 것이 중요해지면서 음성인식은 이제 일상이 됐다”라며 “앞으로 음성을 활용한 다양한 기술개발을 통해 여러 가지를 할 수 있도록 할 것”이라고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소