Заметки из Зазеркалья

17.06.2025

Развитие распознавания речи: улучшенное понимание числительных, новый режим файлового распознавания, поддержка дополнительных грамматик

Данная статья является анонсом новой функциональности.
Не рекомендуется использовать содержание данной статьи для освоения новой функциональности.
Полное описание новой функциональности будет приведено в документации к соответствующей версии.
Полный список изменений в новой версии приводится в файле v8Update.htm.

Планируется в версии 8.5.3

Мы продолжаем улучшать технологии распознавания речи в платформе 1С:Предприятие. В новой версии будет реализован ряд изменений, которые делают работу с речью более точной, гибкой и быстрой. Расскажем, что именно мы сделали.

В новой версии платформы 1С:Предприятие реализован ряд улучшений в области распознавания речи. Основные изменения направлены на повышение точности интерпретации числительных, оптимизацию распознавания аудиофайлов и расширение возможностей для разработчиков.

Улучшенное понимание числительных

Обновленная модель распознавания речи обеспечивает более точную интерпретацию числительных с учетом контекста:

  • Порядковые числительные:
    «Первая помощь» распознается корректно, не подменяется на «1 помощь».

  • Дробные и десятичные значения:
    «Полтора литра» → «1,5 л»
    «Две целых пять десятых» → «2,5»

  • Сокращения и единицы измерения:
    «Сто миллионов» → «100 млн»
    «Рост сто семьдесят восемь сантиметров» → «178 см»

  • Даты, телефоны, суммы, ИНН:
    «Тридцать первое декабря 2019 года» → «31.12.2019»
    «Телефон девятьсот девять...» → «+7(909)000-50-40»
    «823 рубля 55 копеек» → «823 руб. 55 коп.»

Модель учитывает контекст от бытовых выражений до деловой документации, улучшая визуальное восприятие и повышая точность автозаполнения числовых полей.

Новый режим файлового распознавания

Для сценариев, где требуется финальный результат распознавания (например, транскрибирование совещаний), реализован режим потоковой обработки аудиофайлов:

  • Улучшена пунктуация и форматирование чисел

  • Оптимизирована нагрузка на процессор

  • Время обработки сокращено более чем в 2 раза

Данный механизм позволяет эффективно распознавать продолжительные записи (совещания, лекции, вебинары, звонки).

Поддержка дополнительных грамматик

Добавлена возможность задания пользовательских грамматик при файловом распознавании речи.

Преимущества:

  • Повышение точности распознавания терминов, имён и других специфических фраз

  • Возможность ограничить распознавание только заданной грамматикой (например, извлечение только фамилий)

Новые возможности повышают точность, гибкость и производительность распознавания речи в платформе 1С:Предприятие и могут быть использованы как в повседневных сценариях, так и при создании прикладных решений.

Теги: 8.5.3  распознавания речи 

Рассказать друзьям: