Amazon Polly является одним из более новых дополнений в портфель облачных услуг AWS. Первоначально, запущено в 2016 году, этот инструмент Text-To-Relect (TTS) недавно получил множество новых функций.
Как следует из названия, Amazon Polly может эффективно преобразовать любые письменные тексты в человеческую речь, что позволяет пользователям создавать продукты, приложения и услуги и услуги. Amazon использует новейшие технологии глубокого обучения, чтобы расширить возможности Polly с превосходными функциональностью для синтеза человеческой речи, чтобы она тесно напоминала голос настоящего человека.
Что круто о Amazon Polly?
Функциональность нейронного текста до речи (НТЦ)
Amazon Polly поддерживает дюжину разных языков и может повторно создать широкий массив природных голосовых тембров. Amazon Polly хорошо сочленена и может помочь вам доставлять топ-ноту голоса до вашей аудитории.
Гибкая установка и настройка
Вы можете переключаться между разными голосами в зависимости от ваших потребностей. Сервис поддерживает различные метки SSML и лексики. Таким образом, вы можете эффективно контролировать разные речевые аспекты, такие как объем, артикуляция, скорость и т. Д.
Надежная API.
APIS Amazon хорошо документирован и позволит вам настроить интеграции в кратчайшие сроки.
Комплексная поддержка языка программирования
Amazon Polly поддерживает все популярные языки кодирования, включенные в SDK и AWS Mobile SDK (iOS/Android). POLLE также поддерживает API HTTP.
Доступная стоимость
Сервис имеет модель ценообразования Pay-Per использует (предлагает бесплатный уровень). Вы можете получить лучшее чувство расходов здесь Отказ
Нише используют случаи
- Создание аудио контента
- электронное обучение
- Телефония
Две новые возможности Amazon Polly стоит вашего внимания
Последние дополнения POLLY — это новичок и нейронный текст-речью (НТЦ).
- Нейронный текст-речи (НТЦ) Позволяет Amazon Polly быстро изучать разницу в стилях речи и подражать тем. По состоянию на август 2019 года Полли может говорить в 11 различных голосах: 3 британских акцентах и 8 американских английских акцентах. Всего Amazon Polly поддерживает 29 языков и позволяет использовать разные голоса в нескольких из них.
- Amazon Polly Newscaster Тесно имитирует шаблоны естественного языка, так что издатели СМИ могут транслировать новую информацию и оригинальную отчетность быстрее.
Этот сервис является популярным инструментом для новостных компаний «Big Name», а также некоторые популярные языковые приложения для изучения языка.
Например:
- » Глобус и почта «- популярный канадский новостной издатель — был в числе новинка ранних усыновлений.
- «Ганнтт СО»., — Американский СМИ, который принадлежит США сегодня, наряду с несколькими другими региональными документами, также использует Полли.
- Duolingo — популярное приложение для изучения языка — использует Amazon Polly для рендеринга текстов на разных языках.
Команда Romexsoft также использовала Amazon Polly в одном из наших недавних проектов для Trinity Audio. Мы попросили Алекса, наша команда Java приведет к объяснению, как мы включаем Amazon Polly.
Как Amazon Polly Powers Trinity Player
«Один из продуктов, на которых мы работали, — это аудиоплеер, который пользователь может интегрировать в веб-страницу, и переводить весь текст в аудио (текст-речь). Игрок использует Amazon Polly, и она невращенная сеть, в частности, для «читать» тексты вслух в приятном голосе. Или вы можете настроить настройку и сделать тонус более драматическими с помощью стиля чтения «Breake News».
Некоторые из функций прохладного игрока Trinity включают возможность переводить тексты на разные языки, отображать рекламу (большая часть нашего проекта), а также некоторые дополнительные льготы. Например, для эффективного включения рекламы мы используем речевые оценки. Это давайте оценим, когда начинается новое предложение, чтобы мы могли включить аудио рекламу, не нарушая предложение.
Поскольку мы также используем Amazon для множества задач (перевод, Polly, EC2, S3 и куча других услуг), я всегда должен обратить тщательное внимание моего кодового качества. Или иначе небрежная ошибка может съесть весь свой бюджет тестирования в одном мигании:).
Trinity Player — это прохладный продукт, но это более сложно, чем вы думаете. Я имею в виду, Ага, Это похоже на аудиоплеер с интернет-пользователем 70px, насколько это сложно?
Но вам постоянно нужно решить много сложных задач с технической точки зрения. Продукт не имеет спа, реагирования, угловой или любой другой модной структуры. Это заставляет вас думать из коробки и работать со всем под рукой: ОМ, селекторы CSS, PostMessage, Audio, Nodejs, DB (Redis, MySQL, MEMSQL, PRESTO), CICD, тестирование, докер и т. Д.
Мы также проводим много времени, тестирующие приложение (единицу, E2E).
Вы чувствуете много ответственности за продукт, ваш код и важность тестирования, потому что вы разрабатываете продукцию, люди хотят использовать! »
Алекс (Romexsoft JavaScript Team Leads)
Как Romexsoft может вам помочь?
Как партнер AWS, мы предоставляем обоим Профессиональные услуги (облачная миграция, облачные решения, консалтинг и облачное развитие приложений) и Управляемые Услуги AWS , снизить затраты, улучшить безопасность и повысить операционную эффективность
Связаться С нами сегодня назначить бесплатную консалтинговую сессию!
Первоначально опубликовано в блоге Romexsoft: https://www.romexsoft.com/blog/amazon-polly-text-to-speech/
Оригинал: «https://dev.to/serhiykozlov/amazon-polly-text-to-speech-hfb»