Труды КНЦ (Технические науки вып.3/2025(16))

Алексея Зычкова и его 23-летнего помощника Рамиля Садыгова. Во время допроса они признались, что закрепили состав минимальным количеством башмаков и ожидали помощи, не учитывая риск, связанный с уклоном пути. По факту трагедии возбуждено уголовное дело по статье 263 УК РФ — «Нарушение правил безопасности движения и эксплуатации железнодорожного транспорта, повлекшее гибель людей». Пока единственным подозреваемым остаётся машинист грузового состава. Д о устранения последствий аварии ожидались задержки в движении трёх пассажирских поездов.» [21]. Одним из важных шагов исследования является проектирование структуры унифицированного задания по преобразованию неструктурированного текста в набор RDF-троек. На этом этапе разработана четкая, краткая формулировка задания без детализированных правил извлечения, обеспечивающая стандартизацию взаимодействия с языковой моделью. Разработанная формулировка задания выглядит следующим образом: «Проведите разбиение заданного текста на триплеты. После разбиения проведите подсчёт количества полученных триплетов. Ответ на данное задание предоставьте в следующем формате: «Триплеты: [субъект, отношение, объект], ...; Количество триплетов: ». Такой подход выбран по нескольким причинам. Во-первых, это позволило оценить способность языковой модели к самостоятельному выявлению семантических связей без внешних подсказок о том, какие именно типы отношений считаются релевантными. Во-вторых, такой подход способствовал существенному уменьшению количества используемых токенов при отправке запросов и получении ответа от языковой модели, что повысило эффективность использования ресурсов для взаимодействия с ней. Необходимо отметить тот факт, что краткость формулировки позволила более детально исследовать те виды промптов, где подразумевается личное рассуждение самой языковой модели, поскольку некоторые инструкции не навязывали готовых шаблонов анализа и оставляли пространство для проявления ее собственных аналитических возможностей. Данный подход выявил готовность языковой модели к работе в условиях неполной спецификации задачи и подтвердил ее способность восполнять недостающую информацию за счет собственных языковых знаний. Стандарт построения RDF-троек <субъект, отношение, объект> является семантически прозрачным, но при этом достаточно абстрактным, что создает необходимые условия для креативности языковой модели в интерпретации текста при сохранении базовой структурной согласованности. Требование подсчета количества RDF-троек послужило дополнительным критерием контроля выполнения заданий и позволило количественно оценить эффективность различных стратегий промптинга. Для проведения экспериментальной части исследования была выбрана большая языковая модель DeepSeek-V3.2 [22]. Выбор был обусловлен комплексом практических и методологических соображений. Ключевыми факторами стали доступность и экономическая целесообразность использования. Модель DeepSeek предоставляет доступ к чату с достаточно широкими лимитами использования, что делает ее доступной для научных исследований без необходимости привлечения дополнительного финансирования. Это особенно важно при тестировании типов промптов, для которых требуется выполнение нескольких последовательных запросов к модели, требующих повышенного количества токенов на ответ. С технической точки зрения модель основана на современной трансформерной архитектуре и демонстрирует конкурентные показатели в различных бенчмарках [23-25], что обеспечивает релевантность получаемых результатов при решении задач по извлечению структурированных данных. Предварительные тесты подтвердили, что данная большая языковая модель может эффективно справляться с задачами по структурированию данных и извлечению RDF-троек из текстов на русском языке, проявляя адекватную производительность при обработке нехудожественных разнородных текстов с включением геопространственной семантики. Важно подчеркнуть, что в современных условиях существует множество альтернативных языковых моделей, а также отечественных разработок, о которых упоминалось ранее. Такие модели потенциально также могли бы быть использованы в данном исследовании, однако принципиальный выбор конкретной реализации модели не является критически важным для достижения основной цели работы, поскольку фокус исследования направлен в сторону методологии промптинга, а не сравнительного анализа архитектурных особенностей или возможностей различных моделей. В контексте данного исследования LLM рассматривается прежде всего как инструмент-посредник для реализации различных стратегий и типов промптинга. Такой подход позволяет абстрагироваться от специфических особенностей конкретных моделей и сфокусироваться на универсальных принципах конструирования промптов. Труды Кольского научного центра РАН. Серия: Технические науки. 2025. Т. 16, № 3. С. 80-105. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2025. Vol. 16, No. 3. P. 80-105. © Горбунов Р. А., Вицентий А. В., 2025 84

RkJQdWJsaXNoZXIy MTUzNzYz