Труды КНЦ (Технические науки вып. 7/2023(14))
Труды Кольского научного центра РАН. Серия: Технические науки. 2023. Т. 14, № 7. С. 5-15. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2023. Vol. 14, No. 7. P. 5-15. Рис. 1. Поиск понятия в базе знаний Wikidata Параллельно осуществляется полнотекстовый поиск по всему графу Wikidata с использованием API Wikimedia. Запрос выполняется с параметром query. Результаты добавляются в список идентификаторов, полученных из Wikidata. Этап полнотекстового поиска обусловлен недостаточной точностью поиска тегов и синонимов, поскольку их наличие графе знаний Wikidata не гарантируется. Далее формируется общий список идентификаторов из поиска путем объединения двух списков, полученных на предыдущих шагах, с последующим удалением дубликатов. Данный список проверяется на количество элементов. Если в списке нет элементов и если поисковый запрос представлял собой лемму именованной сущности, тогда считается, что поисковый запрос определяет саму именованную сущность, и все предыдущие шаги повторяются снова. Если лемма именованной сущности определена неверно, то корректный результат может быть получен при попытке поиска по полной строке именованной сущности. В противном случае, если поисковый запрос и так был строкой именованной сущности, а ни один из этапов поиска не вернул результатов, тогда считается, что понятие в базе знаний отсутствует, и сущности присваивается нулевая ссылка. Если же список содержит только один элемент, то именованной сущности присваивается идентификатор этого элемента и формируется ссылка на Wikidata. Фильтрация результатов поиска. Если количество элементов в списке больше одного, то в зависимости от класса именованной сущности осуществляется фильтрация (рис. 2). Если именованная сущность принадлежит классу LOC («Локация»), то используются фильтры на основе того, имеет ли элемент Wikidata предикат «координаты» (P625). Если же именованная сущность принадлежит классу PER («Персоналия»), то генерируется отфильтрованный список идентификаторов сущностей Wikidata. Отфильтрованный список содержит идентификаторы только тех сущностей, значение предиката «частный случай понятия» (P31) у которых имеет хотя бы одну связь с элементом «человек» или «персонаж». © Тесля Н. Н., Шутюк В. Д., Жарков В. М., Витязев А. П., Сиповский Г. В., 2023 9
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz