코리아 웹어워드
3년 연속수상

Web Total Service Group

디지털에이전시 아반소프트

음성합성서비스

Amazon Polly란?

Amazon Polly는 텍스트를 생생한 음성으로 변환하는 서비스로서 이를 사용하면 말을 하는 애플리케이션을 만들고 전혀 새로운 유형의 음성 지원 제품을 개발할 수 있습니다. Amazon Polly는 고급 딥 러닝 기술을 사용하여 실제 사람 목소리처럼 음성을 합성하는 텍스트 음성 변환 서비스입니다.

다양한 언어로 수십 개의 생생한 음성이 제공되므로 서로 다른 여러 국가에서 적합한 음성을 선택하여 음성 지원 애플리케이션을 개발할 수 있습니다.

장점

자연스러운 음성

Amazon Polly는 다양한 억양의 남성 및 여성 음성을 비롯해 수십 개의 생생한 음성을 제공하고 여러 언어를 지원합니다. 여러 언어로 유창하게 텍스트를 발음하는 Amazon Polly를 이용해 고품질 음성 출력을 제공하고 글로벌 사용자를 대상으로 애플리케이션을 제작할 수 있습니다.

용이한 통합

Amazon Polly는 손쉽게 웹사이트, 모바일 앱 또는 디바이스에 음성을 추가할 수 있게 해줍니다. 음성으로 변환할 텍스트를 작성하여 Amazon Polly API에 전송하기만 하면 Amazon Polly API가 즉시 오디오 스트림을 반환합니다. 긴 승인 프로세스가 필요한 다른 솔루션과 달리, Amazon Polly는 애플리케이션에서 Amazon Polly의 음성을 어떻게 사용할지 설명할 필요가 없고 배포 계약에 서명할 필요도 없으므로 곧바로 시작할 수 있습니다.

음성 저장 및 재배포

이전에 재생된 오디오를 재생할 때마다 로열티를 요구하거나 요금을 부과하는 다른 솔루션과 달리, Amazon Polly는 추가 요금 없이 무제한 재생을 허용합니다. 이러한 무료 재생은 오프라인 사용까지 확대됩니다. MP3 및 OGG와 같은 다양한 표준 형식으로 음성 파일을 생성하여 오프라인 재생 전용으로 휴대폰 또는 사물 인터넷(IoT) 디바이스와 같은 디바이스에 저장할 수 있습니다.

저렴한 비용

Amazon Polly의 종량 요금제, 변환 문자당 저렴한 비용, 무제한 재생은 거의 모든 애플리케이션에서 음성 합성을 구현하는 비용 효과적인 방법을 제공합니다.

빠른 응답

실제 같은 음성과 대화 사용자 경험을 제공하기 위해서는 일관되게 빠른 응답 시간이 요구됩니다. 음성 지원 애플리케이션은 지연 없이 합성 음성을 재생해야 합니다. 내비게이션용 음성 안내를 제공하는 앱, 학생에게 음성으로 교수하는 이러닝 애플리케이션, 실시간 대화를 통해 사용자와 상호 작용하는 앱을 생각해 봅시다. 이러한 앱은 대화 흐름에서 인지되는 지연 없이 응답이 시작될 수 있을 경우 가장 효과적입니다. Amazon Polly API로 긴 텍스트를 전송하더라도 Amazon Polly API가 오디오를 스트림으로 애플리케이션으로 반환하므로 즉시 음성을 재생할 수 있습니다. 이러한 동적 음성 응답은 일반적으로 사용자의 디바이스에 장착된 저장 공간에서 사용 가능한 것보다 훨씬 큰 용량의 음성 오디오에 대한 액세스를 요구합니다. Amazon Polly는 클라우드 기반이므로 매우 다양한 합성 음성에 액세스할 수 있습니다. Amazon Polly를 사용하면 애플리케이션이 실시간 데이터가 포함된 훨씬 유용한 응답을 제공할 수 있습니다.

사용사례

콘텐츠 생성

Amazon Polly는 손쉽게 비디오, 프레젠테이션 또는 온라인 교육 과정에 음성을 추가할 수 있게 해줍니다. Amazon Polly는 24개 언어로 음성을 생성할 수 있어 전 세계 사용자를 대상으로 하는 애플리케이션에 간편하게 음성을 추가할 수 있습니다. Amazon Polly를 사용하면 RSS 피드, 뉴스 또는 이메일을 읽고 합성 음성을 오디오 파일로 저장할 수 있습니다.

예: 기사를 음성으로 변환 후 MP3로 다운로드

교육/온라인 교육

Amazon Polly를 사용하면 개발자가 음성이 동기화된 얼굴 애니메이션 또는 노래방 형태의 자막 강조 표시와 같은 향상된 시각적 경험을 애플리케이션에서 제공할 수 있습니다. Amazon Polly에서는 특정 문장, 단어 또는 소리가 발음되는 시점에 대한 정보가 담긴 메타데이터의 추가 스트림을 손쉽게 요청할 수 있습니다. 합성된 음성 오디오 스트림과 함께 이러한 메타데이터 스트림을 사용하면 고객이 현재 음성 텍스트를 제공하는 앱에서 아바타를 애니메이션으로 만들고 텍스트를 강조 표시할 수 있습니다.

예: 음성 재생 및 음성 텍스트 강조 표시

고객 문의 센터

Amazon Polly를 사용하면 고객 문의 센터가 자연스러운 음성으로 응답할 수 있습니다. Amazon Polly의 음성 출력을 대화형 음성 응답(IVR) 시스템을 통해 재생할 수 있습니다. 또한, Amazon Polly API를 이용하여 서비스 상태, 계정 및 요금 문의, 주소, 연락처 정보와 같은 자동화된 실시간 정보를 제공할 수 있습니다.

예: 음성 고객 응답을 위해 Polly를 사용하는 고객 문의 센터

사물 인터넷(IoT)

Amazon Polly를 사용하면 저렴하게 사물 인터넷(IoT) 디바이스에 음성을 추가할 수 있으므로 새로운 IoT 사용 사례를 구현할 수 있습니다. IoT 디바이스는 음성을 사용하여 자연스러운 응답 및 알림을 제공할 수 있으므로 애플리케이션 접근성이 개선되고 사용자는 화면을 통해 응답하지 않고 정보를 소비할 수 있습니다. Amazon Polly에서는 음성 파일을 생성하여 오프라인 재생을 위해 디바이스에 저장할 수 있습니다.

AWS Lambda를 사용하여 AWS IoT 규칙 엔진의 이벤트를 기반으로 사전 서명된 Polly URL을 생성한 다음, 디바이스 게이트웨이를 통해 이들 URL을 IoT 디바이스로 전송하여 실제 같은 음성을 요청하도록 허용합니다.

예: 음성 온도 알림

언어 학습

Amazon Polly는 새로운 언어를 말하는 법을 교수하는 애플리케이션의 사용성을 개선하는 데 활용할 수 있습니다. 예를 들어 최종 사용자가 애플리케이션에 외국어를 입력하고 원어민의 발음으로 들을 수 있습니다. Amazon Polly는 24개 언어를 지원하므로 강사 및 학생에게 다양한 옵션을 제공합니다.

예: 언어 학습 – Duolingo

접근성

Amazon Polly를 사용하면 시각 장애인을 위해 합성 음성 형태로 액세스 가능한 정보를 생성하고 배포할 수 있습니다. 이를 통해 시력을 상실한 사람이 뉴스, 도서 또는 이메일 메시지와 같은 다양한 콘텐츠를 소비하도록 도울 수 있습니다.

<출처:AWS website>

견적문의요청방문상담요청

개인정보처리방침에 관한 동의

고객님의 개인정보를 중요시 하며.”정보통신망 이용촉진 및 정보보호”
에 관한 법류를 준수하고 있습니다.

위의 개인정보 수집에 동의 합니다.