Облачная платформа Yandex.Cloud представила новый сервис для создания фирменных голосов Yandex SpeechKit Brand Voice. Теперь компании смогут создать свой собственный уникальный голос не только для реализации сложных диалоговых сценариев с клиентами и разработки голосовых помощников вроде «Алисы», но и для автоматизации работы колл-центров, проведения опросов, телемаркетинга и контроля качества.
Yandex SpeechKit Brand Voice разработан на базе речевых ML-моделей, которые обучаются с использованием записей голоса реального человека. В итоге с помощью искусственного интеллекта создается практически полная цифровая копия голоса. Синтезированный уникальный голос компании могут внедрить в интерактивное голосовое меню (IVR), автоответчики, чаты, применить для проведения телемаркетинговых кампаний. Использование фирменного голоса позволяет отстроиться от конкурентов и телефонных спамеров, а также повысить лояльность клиентов за счет целостности публичного бренда.
Yandex SpeechKit Brand Voice представлен в двух версиях: Adaptive и Full. Первая версия Adaptive — это доступное и быстрое решение преимущественно для исходящих звонков. Версия Full, в свою очередь, нацелена на создание умных голосовых помощников, таких как Алиса, способных помогать клиентам с любыми вопросами.
В основе версии Brand Voice Adaptive лежит синтез переменных — как утверждают в «Яндексе», не имеющая аналогов в мире разработка Yandex.Cloud. Она уникальна тем, что может синтезировать цифровую копию голоса конкретного человека по заданным заранее шаблонам всего за несколько часов, а затем персонализировать речь: добавлять нужное обращение, данные конкретного заказа, сумму и так далее. При этом синтезированный голос звучит так же естественно, как если бы фразу произносил реальный человек.
Уникальный голос в Brand Voice Adaptive создается за 1 месяц и стоит 150 тыс. руб. в месяц. Технология лучше всего показывает себя там, где заранее определены сценарии: прием входящих звонков на первой линии или исходящие звонки клиентам.
Версия Brand Voice Full — это полная цифровая копия голоса реального человека без ограничений. С помощью Brand Voice Full можно создать полноценного голосового ассистента, который сможет отвечать на любые вопросы клиентов компании. Она обучается на базе 50 часов записей реального человека, а после способна воспроизводить его голосом любой текст.
Время внедрения голоса составляет примерно 6 месяцев, а стоимость разработки модели определяется индивидуально, в зависимости от сложности задач клиента.