네이버에서 만든 음성합성 서비스 NES 오픈
- 운영자
- 652
- 0
네이버, 40분 녹음으로 음성합성 가능한 'NES' 서비스 공개
네이버가 40분짜리 녹음 데이터만으로 고품질의 합성음을 제작할 수 있는 클로바의 음성 합성 신기술 ‘NES(Natural End?to-end Speech Synthesis)’을 선보인다고 14일 밝혔다.
네이버는 NES 기술이 사용된 비즈니스 서비스도 제공한다.
NES는 40분 수준의 음성 데이터(약 400문장)로 실제 사람의 음성에 가까운 자연스러운 합성음을 제작할 수 있는 기술이다.
이전까지는 40~100시간 정도의 음성이 필요했으나 이 시간을 대폭 줄인 것이다.
이 기술은 특정 분야에 대한 제약 없이 사용할 수 있다. 기본 목소리 외에 기쁨이나 슬픔 등 감정이 반영된 목소리도 제공한다.
현재 클로바 보이스 홈페이지에서 무료로 NES 기술로 제작한 음성합성을 체험해볼 수 있다.
유료서비스
https://www.ncloud.com/product/aiService/cpv
요금 안내
Clova Premium Voice 이용요금은 서비스 이용 횟수 단위로 부과되며 사용량 만큼 과금됩니다.
음성합성 이용글자에 따른 이용요금 호출 수 5원 / 건
Clova Premium Voice 는 서비스 이용 횟수(호출 수) 단위로 과금되며,
1회 호출 시 요청 가능한 최대 글자는 200글자 입니다.
요금 예시
안녕하세요? 클로바 프리미엄 보이스 서비스입니다. (27자) : 5원
0과 같은 숫자나 띄어쓰기, 문장부호도 하나의 글자로 취급됩니다. (36자) : 5원
읽을 수 없는 다른 언어의 문자나 буква 기호 등도 하나의 글자로 취급하여 과금되니 주의해 주세요. (57자) : 5원
한번 호출에는 하나의 문장만 포함되는 것이 가장 좋습니다. 그리고 하나의 문장이 200자가 넘어가는 것은 매우 쉽지 않은 일입니다. 한 문장이 80자가 넘는 것도 쉽지 않은 일이거든요. 평소에 사용하지 않는 매우 길고 긴 문장에 대해서는 음성 합성 서비스를 제공하지 않습니다. 이 텍스트는 모두 204자로 이루어져 있습니다. 각각의 문장으로 나누어서 호출해 주세요. (204자) : 호출 실패. 과금되지 않음