Труды КНЦ (Технические науки вып. 3/2024(15))
неопределенность и спонтанная динамика в виду наличия факторов риска. Анализировать и управлять объектами и процессами с подобной спецификой позволяют системы информационной поддержки на основе интеллектуализированных компонент в виде семантических моделей, онтологий и других хранилищ знаний, построенных с использованием автоматизированного мониторинга больших открытых данных (например, контента социальных сетей) [5] и интеллектуальных средств их обработки [6]. Несмотря на развитие методов, технологий и инструментальных средств онтологического проектирования, построение конкретных проблемно-ориентированных онтологий остается трудоемкой задачей. Одним из путей технической поддержки создания и наполнения/пополнения онтологий стало использование инструментов искусственного интеллекта. В первую очередь это инструменты работы с текстами на естественном языке. Одной из подзадач обучения онтологии — ее «заселение» (Ontology Population — OP), которая подразумевает расширение существующей онтологии новыми экземплярами без изменения структуры онтологии. Варианту решения этой подзадачи посвящена, в частности, работа [7]. В свою очередь, в исследовании [8], являющемся логическим продолжением работы [7], предлагается вариант решения задачи извлечения отношений из текстов предметной области для их возможного добавления в существующую онтологию. Вопросам извлечения сущностей и отношений посвящена и статья [9], представляющая технологию генеративных многошаговых вопрос-ответов (generative multi-tum question answering). В ней также кратко представлен обзор ряда существующих подходов к решению этой задачи. Отмечено, что недостатком конвейерного режима распознавания сущностей является распространение ошибок. Даются ссылки на публикации по различным стратегиям реализации методов совместного обучения с использованием взаимосвязи задач, подходам к совместному извлечению сущностей и отношений как проблеме заполнения таблиц, а также ряду других технологий. Как указанные, так и ряд других публикаций представляют технологии использования нейросетевых моделей обработки естественноязыковых текстов, предполагающие предварительное обучение, или дообучение этих моделей на объемных текстовых корпусах. Данная процедура сама по себе является довольно ресурсоемкой. Кроме того, такой подход может оказаться неэффективным в случае, когда контекст, с которым работает модель, существенно изменяется со временем. В этом случае начальная база знаний, сформированная на основе контекста, на котором проходило обучение модели, становится неактуальной и полученные ранее «знания» могут повлечь ошибочные для изменившейся ситуации ответы, формируемые моделью. Подобная ситуация может возникнуть, если «актуальный» контекст представляет собой, например, документацию развивающегося программного продукта или изменяющиеся нормативно-правовые документы. Постоянное дообучение модели с целью актуализации ее базы знаний дорого и не эффективно. Более эффективным решением в этом случае представляется использование технологии RAG (Retrieval Augmented Generation) [10]. Данная технология позволяет исключить ресурсоемкий этап дообучения языковой модели при создании проблемно-ориентированных приложений на основе хорошо обученных и уже готовых к использованию языковых моделей таких, как YandexGPT [11], GigaChat [12], OpenAI [13] и др. Настоящая статья представляет начальный этап исследований коллектива авторов по применению RAG-технологий в работе со справочными и нормативными текстами для создания как автономных интеллектуализированных информационно-справочных систем, так подсистем аналитической поддержки, интегрируемых в сторонние информационные комплексы. Используемые в работе технологии интеллектуализированной обработки данных RAG-технология является одним из новых этапов развития технологий работы с текстами на естественном языке, использующих большие языковые модели (Large Language Models, LLM) [14]. LLM представляют собой нейронные сети, основанные на архитектуре трансформер [15] и обученные на больших объемах данных обрабатывать и генерировать текст на естественном языке. Среди задач, для решения которых применяются LLM, наибольший интерес в рамках проводимого исследования представляют обработка запросов и генерация ответов на вопросы пользователя в режиме диалога, а также генерация контекстуализированного текста на основе предоставленных вводных данных. Это позволяет создавать с использованием LLM «интеллектуальные» информационные системы, Труды Кольского научного центра РАН. Серия: Технические науки. 2024. Т. 15, № 3. С. 5-26. Transactions of the Kola Science Centre of RA s . Series: Engineering Sciences. 2024. Vol. 15, No. 3. P. 5-26. © Олейник А. Г., Федоров А. М., Датьев И. О., Зуенко А. А., Шестаков А. А., Вишняков И. Г., 2024 7
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz