Труды КНЦ (Технические науки) 2/2022(13).

Труды Кольского научного центра РАН. Серия: Технические науки. 2022. Т. 13, № 2. С. 31-45. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2022. Vol. 13, No. 2. P. 31-45. Научная статья УДК 004.912 doi:10.37614/2949-1215.2022.13.2.003 МЕТОДЫ ИЗВЛЕЧЕНИЯ ЗНАНИЙ ИЗ ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ТЕКСТОВ Вадим Константинович Пимешков18, Максим Геннадьевич Шишаев2 1,2Институт информатики и математического моделирования имени В. А. Путилова Кольского научного центра Российской академии наук, Апатиты, Россия 1pimeshkov@iimm.ru8 , https://orcid.org/0000-0001-7010-230X 2shishaev@iimm.ru, https://orcid. org/0000-0001-7070-7878 Аннотация Рассматриваются методы извлечения знаний из естественно-языковых текстов. Дается формальное определение задачи, выделяются две основные подзадачи: извлечение концептов и извлечение отношений. Проанализирована классификация методов с точки зрения языка и языковых ресурсов, с точки зрения постановки задачи, а также с точки зрения подходов к решению задач извлечения концептов и отношений. Ключевые слова: извлечение знаний, интеллектуальный анализ текста, извлечение концептов, извлечение отношений Благодарности: исследование выполнено в рамках государственного задания Института информатики и математического моделирования имени В. А. Путилова Кольского научного центра Российской академии наук от Министерства науки и высшего образования Российской Федерации, тема научно-исследовательской работы «Методология создания информационно-аналитических систем поддержки управления региональным развитием, основанных на формирующем искусственном интеллекте и больших данных» (регистрационный номер 122022800551-0). Для цитирования: Пимешков В. К., Шишаев М. Г. Методы извлечения знаний из естественно-языковых текстов // Труды Кольского научного центра РАН. Серия: Технические науки. 2022. Т. 13, № 2. С. 31-45. doi:10.37614/2949-1215.2022.13.2.003 Original article METHODS OF KNOWLEDGE EXTRACTION FROM NATURAL LANGUAGE TEXTS Vadim K. Pimeshkov18, Maxim G. Shishaev2 12Putilov Institute for Informatics and Mathematical Modeling o f the Kola Science Centre o f the Russian Academy o f Sciences, Apatity, Russia 1pimeshkov@iimm.ru8 , https://orcid.org/0000-0001-7010-230X 2shishaev@iimm.ru, https://orcid. org/0000-0001-7070-7878 Abstract The paper considers methods for knowledge extraction from natural language texts. A formal definition of the task is given, two main subtasks are distinguished: concept extraction and relationship extraction. The classification of methods is considered from the point of view of the language and language resources, from the point of view of setting the problem, as well as from the point of view of solving problems of extracting concepts and relations. Keywords: knowledge extraction, text mining, concept extraction, relation extraction Acknowledgments: the study was carried out within the framework of the Putilov Institute for Informatics and Mathematical Modeling of the Kola Science Centre of the Russian Academy of Sciences state assignment of the Ministry of Science and Higher Education of the Russian Federation, research topic “Methodology for creating information and analytical systems to support the management of regional development based on formative artificial intelligence and big data” (registration number of the research topic 122022800551-0). For citation: Pimeshkov V. K., Shishaev M. G. Methods of knowledge extraction from natural language texts // Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2022. Vol. 13, No. 2. P. 31-45. doi:10.37614/2949-1215.2022.13.2.003 © Пимешков В. К., Шишаев М. Г., 2022 31

RkJQdWJsaXNoZXIy MTUzNzYz