Заметки из Зазеркалья

17.12.2024

Развитие распознавания речи

Данная статья является анонсом новой функциональности.
Не рекомендуется использовать содержание данной статьи для освоения новой функциональности.
Полное описание новой функциональности будет приведено в документации к соответствующей версии.
Полный список изменений в новой версии приводится в файле v8Update.htm.

Планируется в версии 8.3.28

Мы продолжаем развивать функциональность распознавания речи, в том числе по вашим просьбам.

Активационная фраза распознавания речи

Процесс потокового распознавания речи может достаточно ощутимо увеличить нагрузку на процессор(ы) компьютера, на котором работает механизм распознавания речи. Поэтому рекомендованный нами сценарий использования распознавания речи – on demand, четко определенное начало и конец сессии потокового распознавания. Например, в нашем внутреннем Документообороте мы добавили к форме исходящего письма кнопку для включения распознавания речи; после её нажатия текст письма можно наговорить голосом:

Но гораздо удобнее если в приведенном сценарии мы могли бы вместо нажатия кнопки сказать, например, «Диктую письмо!» - и запустится потоковое распознавание речи, позволяющее нам наговорить письмо голосом. Или из формы списка писем Документооборота сказать: «Новое письмо!»  - и будет создано новое письмо, которое мы сможем далее, опять же, надиктовать голосом.

Для реализации такого сценария в текущих версиях платформы придется держать распознавание речи постоянно запущенным, что затратно с точки зрения потребления ресурсов. Поэтому для подобных сценариев в версии 8.3.28 будет реализовано «легкое» распознавание речи, которое работает исключительно на клиенте, может быть запущено постоянно в фоновом режиме (потребляя немного ресурсов) и распознает не всю речь, а только заданные «активационные» фразы. Как только прозвучит одна из активационных фраз – будет запущен указанный обработчик, и далее приложение сможет отреагировать определенным разработчиком образом. Например, начать (или завершить) потоковое распознавание речи.

Поддержка знаков препинания и конвертации чисел

В механизме распознавания речи появится поддержка знаков препинания.
Чтобы ввести  знака препинания, нужно будет сказать:

  • «Точка» для (.)

  • «Запятая» для (,)

  • «Дефис» для (-)

Также будут распознаваться числа и переводиться в текст в цифровом представлении. 

Конвертация будет проводиться по следующим правилам:

  • Для процентов: говорим «Тринадцать процентов» получаем «13%»

  • «Склеиваются» (пишутся без пробела) один ноль и последующая цифра при значении числа до 10

    • Говорим «ноль один» получаем «01»

    • Если нолей в начале числа больше одного – они пишутся раздельно.

      • Говорим «ноль ноль семь» получаем «0 0 7»

  • Порядковые и количественные числа будут записываться числами

    • Говорим «Номер телефона восемь девятьсот три сто двадцать три десять ноль пять» получаем «Номер телефона 8 903 123 10 05»

Мы рассчитываем, что новая функциональность сделает удобнее использование распознавания речи в приложениях на платформе 1С:Предприятие.

Теги: 8.3.28 

Рассказать друзьям: