Труды КНЦ (Технические науки вып.3/2025(16))
дополнительно обработанного с помощью методов расширения контекста таким образом, чтобы лучше отражать его информационную потребность [24]. Результатом является геосемантическое изображение, выдаваемое пользователю системы информационной поддержки принятия решений, описывающее исследуемую пользователем пространственную ситуацию на основе представления пертинентных запросу множеств геообъектов, пространственных и семантических отношений, а также дополнительной семантической информации. Материалы и методы Для того, чтобы представить модель пространственной ситуации в виде геосемантического изображения, необходимо обеспечить представление информации не только об объектах и отношениях, хранящихся в базе данных ГИС, но и об объектах и отношениях, информация о которых хранится во внешних по отношению к ГИС ресурсах. В качестве таких внешних ресурсов информации могут выступать, например, различные базы знаний, онтологии [25] и графы знаний (ГЗ) [26]. В последние годы применение именно ГЗ для семантического обогащения геоизображений вызывает наибольший интерес [27-29]. Таким образом, ГЗ, ассоциированный с ГИС и используемый для семантического обогащения формируемых геоизображений (цифровых карт) можно условно представить как дополнительный семантический слой цифровой карты. Причем для конечного пользователя, как правило, не имеет значения из какого источника, ГИС или ГЗ, была получена информация для синтеза геосемантического изображения. Для конечного пользователя важно только то, насколько хорошо сформированное геоизображение соответствует его информационной потребности [30; 31]. В этом контексте под ГЗ можно понимать структурированную модель данных, которая представляет информацию в виде семантической сети взаимосвязанных сущностей (узлов графа) и их отношений (рёбер графа). ГГЗ — это вид ГЗ, позволяющий реализовать структурированное представление геопространственных данных. Узлами такого графа, как правило, являются сущности реального мира, пространственные объекты и события, а ребрами — связи между ними [32; 33]. За счет использования онтологических принципов для формального определения концептов, свойств и связей, ГГЗ обеспечивает эффективную интеграцию разнородных данных, а также ускоряет их поиск и анализ по сравнению с традиционными базами данных. Кроме того, использование геопространственных ГЗ позволяет реализовывать принципы FAIR (Findable, Accessible, Interoperable, and Reusable), что существенно облегчает анализ и управление геоданными в информационных системах [34]. В последние годы технология графов знаний находит широкое применение в решении научных [35-37] и прикладных задач в таких областях, как прогнозирование стихийных бедствий [38; 39], сельское хозяйство [40; 41], строительство сложных инженерных сооружений [42; 43], обработка геоданных [44], прогнозирование погодных явлений [45] и многих других. В нашей работе мы также используем геопространственный ГЗ для семантического обогащения моделируемой пространственной ситуации. Одной из главных проблем при создании ГЗ в настоящее время является проблема получения данных о релевантных сущностях и связях из разнородных источников, их очистка и приведение в необходимый формат для включения в граф [46]. Предлагаемая нами технология автоматизированного построения моделей пространственных ситуаций в виде геосемантических изображений предполагает использование средств больших языковых моделей (LLM — Large Language Model) для извлечения данных из текстов на естественном языке, необходимых для наполнения графа. Такой подход позволяет существенно снизить трудоемкость и повысить оперативность создания и пополнения геопространственного ГЗ [47-50]. В качестве большой языковой модели для извлечения данных мы выбрали DeepSeek-V3.2. Выбор данной LLM был основан на результатах предварительного тестирования нескольких моделей в задачах извлечения RDF-троек из текстов на естественном языке. Для предварительного тестирования были выбраны такие модели, как ChatGPT, DeepSeek, GigaChat и YandexGPT. Сопоставимые результаты показали модели ChatGPT и DeepSeek, GigaChat показал результат хуже, чем DeepSeek, но лучше, чем YandexGPT. Учитывая, что компания OpenAI, которой принадлежит ChatGPT, официально не работает в России, окончательный выбор большой языковой модели был сделан в пользу DeepSeek в последней доступной версии. Труды Кольского научного центра РАН. Серия: Технические науки. 2025. Т. 16, № 3. С. 140-153. Transactions of the Kola Science Centre of RA s . Series: Engineering Sciences. 2025. Vol. 16, No. 3. P. 140-153. © Вицентий А. В., 2025 144
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz