어떤 텍스트를 입력해도 실시간으로 음성 합성음 출력 가능
셀바스AI가 인공지능 기술로 감정 표현이 가능한 음성합성(TTS) 기술을 새롭게 발표했다고 25일 밝혔다.
이번에 새롭게 발표된 감정표현 음성합성 기술은 지난해 출시된 인공지능 음성합성 제품인 ‘Selvy deepTTS’에 적용될 예정이다.
‘Selvy deepTTS’는 다양한 감정을 표현하는 감정합성 기술뿐 아니라 외국어 인공지능 학습을 통한 교차언어 학습 기술을 포함하고 있어 슬픔, 경쾌함, 행복, 차분함과 같은 다양한 감정 표현 및 외국어 발화도 가능해 한국어, 영어, 중국어, 일본어 등을 유창하게 표현한다.
슬픔, 행복과 같은 감정뿐 아니라, ‘조금 슬프게’, ‘많이 슬프게’ 등과 같이 감정의 강도까지 조절할 수 있어 인공지능 화자가 영화, 드라마 더빙, 인공지능 스피커, 뉴스, 교육 영상 등과 같은 다양한 콘텐츠의 각 상황에 어울리는 감정 연기를 가능하게 한다.
또한 외국어 인공지능 학습을 통한 교차언어 학습 기술을 포함하고 있어, 한국어 화자 ‘마루’, ‘유진’, ‘혜진’ 은 영어를, 영어 화자 ‘Sarah’는 한국어를 구사할 수 있도록 상대방 모국어에 대한 상호 학습이 가능하도록 개발됐다.
기존의 음성합성 기술은 모국어 구사만 가능하여, 다국어 구사가 필요할 경우 해당 언어를 별도로 녹음하거나 다국어를 구사하는 다른 목소리의 화자를 사용해야했던 것에 반해 ‘Selvy deepTTS’에 적용된 교차언어 학습 기술은 인공지능 기반 다국어 학습만으로도 1명의 인공지능 화자가 다양한 언어를 사람처럼 자연스럽고 유창하게 발화할 수 있다.
최근에는 LG유플러스와 함께 감정합성 기술을 ‘음성합성 기반 통화 연결음’에 적용하기 위한 연구 개발을 진행했다.
셀바스 AI 음성합성팀 박태훈 팀장은 “당사 음성합성 기술은 어떤 텍스트를 입력해도 실시간 음성 합성음 출력이 가능하다. 음성기술 개발에 대한 전문성과 기술적 우위를 기반으로 Selvy deepTTS는 개인화된 음성 합성음 구현, 감정 및 스타일 표현, 다국어 발화가 가능해 다양한 산업에서 맞춤형 음성 기술을 적용해 나가는 중이다.”라고 전했다.