Заметки из Зазеркалья

10.02.2023

Улучшение релевантности полнотекстового поиска

Данная статья является анонсом новой функциональности.
Не рекомендуется использовать содержание данной статьи для освоения новой функциональности.
Полное описание новой функциональности будет приведено в документации к соответствующей версии.
Полный список изменений в новой версии приводится в файле v8Update.htm.

Планируется в версии 8.3.24

Функциональность полнотекстового поиска появилась в платформе очень давно. Полнотекстовый поиск позволяет быстро находить нужную информацию в данных информационной базы и в справочной системе, используя при этом экспертные алгоритмы выделения корневой основы (стемминг), что позволяет добиться лучших результатов поиска, чем использование морфологических словарей.  А появление механизма глобального поиска дало конечным пользователям продуктов, созданных на платформе 1С:Предприятие, в числе прочего, возможность удобно пользоваться полнотекстовым поиском прямо «из коробки», без дополнительной настройки приложений.

img-00.png

Мы продолжаем совершенствовать механизм полнотекстового поиска.

До версии 8.3.24 поисковая выдача упорядочивалась по следующим критериям (в порядке убывания важности):

  • Вес объекта метаданных (действует для любых объектов метаданных)
    • Чем больше ссылок на объект метаданных, тем больше его вес
  • Вес, вычисляемый на основании удаленности найденного слова от начала текста
  • Для документов - дата документа

При таком порядке выдачи возможны неудобства – в первые строчки результатов поиска могла попасть не та информация, которая действительно нужна пользователю. Это особенно актуально при использовании глобального поиска, так как окно выдачи результатов в нем компактное и пользователь может просто не увидеть нужные ему результаты.

В версии 8.3.24 изменится упорядочивание выдачи – более релевантные результаты попадут в начало списка результатов поиска. Это достигнуто за счёт использования нового алгоритма сортировки. В частности, учитывается полнота вхождения поисковой фразы в представление объекта. Также учитывается «актуальность» объекта исходя из даты – там, где дату у объекта найти получилось:

  • Для документов это дата документа.

  • Для периодических регистров – период.

  • Для остальных объектов – просматриваются реквизиты с типом «Дата» и выбирается самая большая дата, меньшая или равная сегодняшней.

Для получения преимуществ новой функциональности индекс необходимо будет очистить и построить заново новой версией платформы. Новая версия платформы будет корректно взаимодействовать с индексом, построенным более ранней версией.

Мы рассчитываем, что новый алгоритм сортировки выдачи будет выдавать в первых строчках результаты, наиболее соответствующие ожиданиям пользователей.



Теги: 8.3.24 

Рассказать друзьям: