Труды КНЦ (Технические науки вып. 7/2023(14))
было найдено много форм для одних и тех же сущностей, которые не были обработаны при обучении модели (например, «Вяземский», «Вяземского», «Вяземскому»), поэтому модель не могла определить ссылки на сущности, т. к. для модели «Вяземский» и «Вяземскому» рассматриваются как разные сущности. Заключение В результате работы реализован метод для поиска связей между именованными сущностями в тексте и понятиями базы знаний Wikidata. Его проверка осуществлялась для классов сущностей PER («Персоналия») и LOC («Локация»). Связь осуществляется путем присвоения именованной сущности идентификатора понятия в базе знаний и ссылки на страницу этого понятия в Wikidata. В ходе реализации метода были разработаны алгоритмы поиска именованных сущностей, фильтрации результатов поиска и связи именованных сущностей с понятиями базы знаний. Средняя точность метода на рассматриваемой выборке текстов составляет 90,4 % для типов сущностей LOC и 83,2 % для типов сущностей PER. Данная оценка превосходит модель NEL, основанную на подходах глубокого обучения. Предлагаемый подход не зависит от языка и может быть масштабирован для других моделей NER и баз знаний. Также не требуется корректировка модели и обучение для расширения списка поддерживаемых объектов. Список источников 1. Humbel M., Nyhan J., Vlachidis A., Sloan K., Ortolja-Baird A. Named-entity recognition for early modern textual documents: a review o f capabilities and challenges with strategies for the future // Journal of Documentation. Emerald Publishing Limited, 2021. Vol. 77, № 6. P. 1223-1247. 2. Al-Moslmi T., Ocana M. G., Opdahl A. L., Veres C. Named entity extraction for knowledge graphs: A literature overview // IEEE Access. IEEE, 2020. Vol. 8. P. 32862-32881. 3. Shen W., Li Y., Liu Y., Han J., Wang J., Yuan X. Entity linking meets deep learning: Techniques and solutions // IEEE Transactions on Knowledge and Data Engineering. IEEE, 2021. 4. Электронное научное издание «Пушкин» // Фундаментальная электронная библиотека «Русская литература и фольклор». 2002 [Электронный ресурс]. URL: http://feb-web.ru/feb/pushkin/ default.asp (дата обращения: 01.10.2023). 5. Nasar Z., Jaffry S.W., Malik M. K. Named entity recognition and relation extraction: State-of-the-art // ACM Computing Surveys (CSUR). ACM New York, NY, USA, 2021. Vol. 54, № 1. P. 1-39. 6. GitHub — yandex/tomita-parser [Электронный ресурс]. URL: https://github.com/yandex/tomita- parser/ (дата обращения: 18.09.2023). 7. GitHub — natasha/yargy: Rule-based facts extraction for Russian language [Электронный ресурс]. URL: https://github.com/natasha/yargy (accessed: 18.09.2023). 8. GitHub — natasha/slovnet: Deep Learning based NLP modeling for Russian language [Электронный ресурс]. URL: https://github.com/natasha/slovnet (дата обращения: 18.09.2023). 9. Burtsev M. et al. Deeppavlov: Open-source library for dialogue systems // Proceedings o f ACL 2018, System Demonstrations. 2018. P. 122-127. 10. Honnibal M., Montani I., Van Landeghem S., Boyd A. spaCy: Industrial-strength natural language processing in python. Zenodo, Honolulu, HI, USA, 2020. 11. Hachey B., Radford W., Curran J. R. Graph-based named entity linking with wikipedia // Web Information System Engineering-WISE 2011: 12th International Conference, Sydney, Australia, October 13-14, 2011. Proceedings 12. 2011. P. 213-226. 12. Čuljak M., Spitz A., West R., Arora A. Strong heuristics for named entity linking // arXiv preprint arXiv:2207.02824. 2022. 13. Tamper M., Oksanen A., Tuominen J., Hietanen A., Hyvonen E. Automatic annotation service appi: Named entity linking in legal domain // European Semantic Web Conference. 2020. P. 208-213. 14. Knowledge Base Question Answering (KBQA) — DeepPavlov 1.3.0 documentation [Электронный ресурс]. URL: https://docs.deeppavlov.ai/en/master/features/models/kbqa.html (дата обращения: 18.09.2023). Труды Кольского научного центра РАН. Серия: Технические науки. 2023. Т. 14, № 7. С. 5-15. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2023. Vol. 14, No. 7. P. 5-15. © Тесля Н. Н., Шутюк В. Д., Жарков В. М., Витязев А. П., Сиповский Г. В., 2023 13
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz