Заметки из Зазеркалья

08.06.2023

Генерация речи

Данная статья является анонсом новой функциональности.
Не рекомендуется использовать содержание данной статьи для освоения новой функциональности.
Полное описание новой функциональности будет приведено в документации к соответствующей версии.
Полный список изменений в новой версии приводится в файле v8Update.htm.

Планируется в версии 8.3.25

Мы продолжаем развивать сервисы работы с речью. В версии 8.3.23 появился сервис распознавания речи, а в версии 8.3.25 появится сервис генерации речи из текста.

С его помощью можно сгенерировать речь из заданного текста и воспроизвести её или сохранить в файл в формате WAV. Во встроенном языке появятся новые объекты и методы для поддержки этой функциональности.

Таким образом, добавляется новый интерфейс взаимодействия системы с пользователем, который не требует от пользователя смотреть на экран. Программа может говорить, что делать и получать обратную реакцию через альтернативные источники (голосовой ввод, переключение режимов работы оборудования и так далее).

Это позволит поддержать множество новых сценариев – например работу монтажника с наушником и микрофоном или складского рабочего. Клиент магазина сможет взаимодействовать с говорящим кассовым оборудованием. Система сможет голосом зачитывать отправителя и тему пришедшего письма и, если пользователь скажет «Прочесть», зачитать текст письма целиком. Можно будет создавать полноценные голосовые ассистенты, голосовое управление приложением, интерактивное заполнение форм (например, врачом при осмотре пациента) и т.д.

Надо отметить, что мы предоставляем потоковую генерацию - то есть реальное воспроизведение речи начинается с минимальной задержкой, без ожидания, пока текст синтезируется до конца.

Пока будет поддерживаться только работа с нашим (1С) сервисом генерации речи (т.е. для работы будет нужно подключение к интернет).

При генерации речи можно будет выбрать голос из коллекции голосов, доступных на сервере.

Речь будет воспроизводиться на устройстве по умолчанию на клиентском компьютере.

Для работы сервиса не нужно будет устанавливать дополнительное ПО ни на клиентских машинах, ни на сервере.

Генерация речи будет доступна в тонком, толстом и веб-клиенте.

Вот как это работает:

Если сервис распознавания речи в известном смысле освободил пользователю руки, то сервис генерации речи освободит ему глаза.

Теги: 8.3.25 

Рассказать друзьям: