Труды КНЦ (Технические науки вып.3/2025(16))

результатов), что является серьезным ограничением при применении БЯМ. Для преодоления этого недостатка предлагается использовать гибридные модели с использованием RAG-технологии (Retrieval Augmented Generation) [2]. Совместное применение этих моделей потенциально способно повысить эффективность исследовательского процесса и уменьшить число рутинных задач. Методы RAG-технологии дополняют ответы БЯМ релевантными фрагментами из базы данных и поддерживают семантический поиск с учетом контекста. Целью настоящего исследования является разработка системы автоматической генерации тестов и проверки знаний с поддержкой диалога на естественном языке. Система должна осуществлять генерацию наборов вопросов на основе загруженных научных материалов, адаптивное тестирование пользователя на основе сгенерированных тестов. В процессе ответов на вопросы теста система должна обеспечивать автоматическую адаптацию сложности вопросов, анализ ответов пользователя и формирование индивидуальной траектории обучения. Обзор существующих решений Интеллектуальные системы поддержки исследовательской деятельности являются быстро развивающейся областью. Далее производится анализ существующих решений для задач семантического поиска и анализа научных текстов. Международные поисковые системы Наиболее известными интеллектуальными системами поддержки исследовательской деятельности на международном рынке являются Elicit [3], Semantic Scholar [4], IBM Watson Discovery [5]. Эти системы применяют для работы с научными текстами современные методы обработки естественного языка. Тем не менее при их применении для работы с русскоязычными научными текстами возникают существенные проблемы. Во-первых, рассматриваемые системы имеют низкую эффективность при обработке морфологии русского языка и специфической научной терминологии. Во-вторых, их алгоритмы настроены на структуру и стиль зарубежных публикаций, что приводит к существенным стилистическим ошибкам при анализе русскоязычных публикаций. Также для организаций могут возникать сложности при использовании зарубежных систем из-за требований к конфиденциальности. При этом стоит отметить, что ни одна из перечисленных систем не предлагает полноценных возможностей по автоматической генерации тестов и проведению адаптивного тестирования на основе документов пользователя. На настоящий момент наиболее перспективным подходом к созданию контекстно-ориентированных систем поиска является применение RAG-технологии. Например, в работе [6] предлагается фреймворк для поиска по научной литературе с применением методов семантической фрагментации и стратегии «abstract-first» для быстрой фильтрации статей. Авторы делают основной акцент на тонкой настройке моделей эмбеддингов (фрагментов текста в векторном представлении) под конкретную предметную область для повышения точности результатов поиска. Другой пример — система LitLLM [7] для автоматизации написания литературных обзоров. Основное преимущество предлагаемой системы заключается в интеграции с внешними API (Semantic Scholar [4], OpenAlex [8]) для поиска публикаций и использовании БЯМ для сортировки результатов и генерации текстов. Однако данная система не поддерживает возможность ведения диалога на естественном языке. Системы автоматической генерации вопросов Среди систем автоматической генерации вопросов выделяют несколько подходов. Один из подходов к генерации вопросов представлен в работе [9]. В его основе лежит оптимизированная под задачи генерации вопросов нейросетевая модель, поддерживающая механизм внимания. Для анализа контекста и повышения качества понимания семантических связей авторы работы применяют двунаправленные LSTM-сети (Long short-term memory) [10]. Для формирования вопросов доступно два режима работы: a) с учетом только текущего предложения; b) с привлечением более широкого контекста абзаца. Труды Кольского научного центра РАН. Серия: Технические науки. 2025. Т. 16, № 3. С. 56-70. Transactions of the Kola Science Centre of RA s . Series: Engineering Sciences. 2025. Vol. 16, No. 3. P. 56-70. © Шестаков А. В., Зуенко А. А., 2025 58

RkJQdWJsaXNoZXIy MTUzNzYz