Труды КНЦ (Технические науки вып.3/2025(16))

Качественная оценка результатов выявила важную закономерность: даже при высоких количественных показателях некоторые типы промптинга демонстрировали склонность к генерации искаженных данных. В частности, типы, основанные на многошаговых рассуждениях, то есть те, что подразумевают длительную обработку информации, хотя и показывали в среднем высокие количественные результаты, часто порождали семантические галлюцинации — добавление информации, отсутствующей в исходном тексте, или искажение уже имеющейся. Напротив, подходы с элементами самокритики, такие как Cham-of-Verification (тип 42) и Reversing Chain-of-Thought (тип 44) демонстрировали значительно более высокую точность при сохранении хороших количественных показателей. На основе приведенных в ходе исследования оценок эффективности типов промптинга были сформулированы практические рекомендации по их использованию. Для достижения максимальной полноты извлечения данных следует применять Step-Back Prompting (тип 27), Zero-Shot Chain-of-Thought (тип 19). Для баланса между полнотой и точностью оптимальны Rephrase and Respond (тип 3), Generated Knowledge Prompting (тип 23) и Universal Self-Consistency Prompting (тип 40). Следует избегать по возможности типов промптинга с высокими вычислительными затратами и низкой отдачей, таких как Uncertainty-Routed Chain-of-Thought (тип 30), а также типов, требующих программной реализации, при отсутствии значительных финансовых средств. Заключение Проведенное исследование подтвердило основную гипотезу, состоящую в том, что выбор стратегий и типов промптинга оказывает значительное влияние на эффективность извлечения структурированных данных из нехудожественных разнородных текстов. На основе полученных в процессе исследования данных была предложена классификация типов промптинга, выделены 6 базовых стратегий для 59 типов промптинга. Экспериментальная оценка 59 типов промптинга позволила не только выявить закономерности в их эффективности, но и сформировать практические рекомендации по выбору оптимальных решений для задач преобразования неструктурированного текста в целостный набор RDF-троек. Особую значимость приобретают полученные результаты в контексте разработки технологии синтеза адаптивных геосемантических изображений на основе геопространственных знаний, которая является предметом наших дальнейших исследований. Практическая значимость работы состоит в том, что установленные показатели эффективности в дальнейшем послужат ориентиром в планировании оптимального подхода для автоматического построения графов знаний при помощи больших языковых моделей и для создания эффективных конвейеров обработки разнородных текстов, что позволит существенно повысить релевантность и информативность визуализаций текстовых описаний с географическими свойствами. Выявленные наиболее эффективные типы промптинга, например, такие как Step-Back Prompting и Zero-Shot Chain-of-Thought, представляют ценность для обеспечения полноты извлечения пространственных отношений, что важно для формирования многоуровневых геосемантических моделей. Повышенный интерес представляет адаптация выявленных закономерностей для обработки не только текстов о чрезвычайных ситуациях, но и разнородных географических описаний, что позволит расширить и без того комплексные семантические модели пространственно-временных ситуаций. Список источников 1. Vicentiy A. V., Dikovitsky V. V., Shishaev M. G. The semantic models of arctic zone legal acts visualization for express content analysis // Computer Science On-line Conference. Springer, Cham. 2018. Vol. 763. P. 216-228. 2. Vicentiy A. Definition and formalization of the user mental model for creating adaptive geointerfaces of decision support systems // Lecture Notes in Networks and Systems. Springer, Cham. 2024. Vol. 733. P. 1095-1105. 3. Gruber T. R. A translation approach to portable ontology specifications // Knowledge Acquisition. Academic Press. 1993. Vol. 5, № 2. P. 199-220. 4. RDF 1.2 Concepts and Abstract Data Model [Электронный ресурс]. URL: https://www.w3.org/TR/rdf12- concepts (дата обращения: 31.10.2025). 5. Gumiel Y. B. et al. Temporal relation extraction in clinical texts: a systematic review // Association for Computing Machinery Computing Surveys. 2022. Vol. 54, № 7. P. 1-36. Труды Кольского научного центра РАН. Серия: Технические науки. 2025. Т. 16, № 3. С. 80-105. Transactions of the Kola Science Centre of RA s . Series: Engineering Sciences. 2025. Vol. 16, No. 3. P. 80-105. © Горбунов Р. А., Вицентий А. В., 2025 103

RkJQdWJsaXNoZXIy MTUzNzYz