Труды КНЦ (Технические науки вып. 3/2024(15))
Труды Кольского научного центра РАН. Серия: Технические науки. 2024. Т. 15, № 3. С. 5-26. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2024. Vol. 15, No. 3. P. 5-26. Abstract This paper presents the integration of a large language model (LLM) into an intelligent information and analytical system for exploratory search support within specific texts. An overview of the capabilities of modern large language models is provided. Special attention is paid to the Retrieval Augmented Generation (RAG) technology used for efficient formation and control of search contexts. The design and development of the system's business logic functions and user interface elements are detailed. Experimental results applying the developed system to texts with specific characteristics are presented. Conclusions are drawn regarding the system's applicability for automating ontology population. Conclusions are drawn regarding the system's applicability for automating the process of populating ontologies, as well as filling other knowledge repositories built using automated monitoring of open big data and intelligent data processing. Keywords: ontology, retrieval augmented generation, RAG, neural network, large language model, LLM, information and analytical system, data mining, software design, software development, web service, web application Acknowledgments: the study was carried out within the framework of the Putilov Institute for Informatics and Mathematical Modeling of the Kola Science Centre of the Russian Academy of Sciences state assignment of the Ministry of Science and Higher Education of the Russian Federation, research topic “Development of theoretical and organizational and technical foundations of information support for managing the viability of regional critical infrastructures ofthe Arctic zone of the Russian Federation” (registration number ofthe research topic 122022800547-3) and research topic “Methodology for creating information and analytical systems to support regional development management based on formative artificial intelligence and big data” (registration number of the research topic 122022800551-0). For citation: Andrey G. Oleynik, Igor O. Datyev, Alexander A. Zuenko, Andrey. M. Fedorov, Aleksey V. Shestakov, Ivan G. Vishnyakov Using RAG technology to design an intelligent information system for support exploratory search // Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2023. Vol. 15, No. 3. P. 5-26. doi:10.37614/2949.1215.2024.15.3.001. Введение Плановые исследования Института информатики и математического моделирования им. В. А. Путилова (далее - - ИИММ) включают разработку решений ряда актуальных научных задач, связанных с созданием эффективных методов формирования баз знаний и интеллектуальных информационных систем в условиях сложности, неопределенности, разнородности и динамичности предметной области, а также методов аналитической обработки данных и знаний, ориентированных на проблематику регионального развития и поддержку соответствующего ему управления. Одним из важных направлений является разработка теоретических и организационно-технических основ информационной поддержки управления жизнеспособностью региональных критических инфраструктур Арктической зоны Российской Федерации. Эффективное решение задач управления требует повышения уровня согласованности как нормативно-правовой базы, регламентирующей различные виды деятельности, так и «мультидисциплинарного» понятийного аппарата, используемого в процессах принятия решений в различных сферах и на различных уровнях управления. Поэтому в рамках тематики ИИММ предполагается развить методологию создания интеллектуальных проблемно-ориентированных информационных систем на базе концепции «формирующего искусственного интеллекта». Так, в ходе разработки основ информационной поддержки управления жизнеспособностью региональных критических инфраструктур Арктической зоны Российской Федерации требует решения задача четкой аргументированной идентификации и классификации объектов, которые могут быть «слабым звеном» включающих их или связанных с ними инфраструктур. К этим объектам прежде всего относятся критически важные объекты (КВО) и потенциально опасные объекты (ПОО) [1]. В качестве инструмента решения данной задачи могут быть использованы формальные онтологии, позволяющие сформировать согласованный понятийный базис для специалистов различных предметных областей [2]. В работе [3] была представлена технология согласования нормативно правовых документов на основе онтологического подхода, использование которой могло бы способствовать формированию целостной системы норм и правил функционирования различных акторов как на региональном уровне, так и их взаимодействия с уровнем федеральным. Подобные задачи также возникают при создании информационно-аналитических систем, нацеленных на обеспечение информационной поддержки задач управления региональным развитием. Региональная социально-экономическая система рассматривается как взаимосвязанная триада «бизнес- сообщество-власть» [4]. Элементам такой системы и ее критической инфраструктуре свойственны 6 © Олейник А. Г., Федоров А. М., Датьев И. О., Зуенко А. А., Шестаков А. А., Вишняков И. Г., 2024
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz