Труды КНЦ (Технические науки вып.3/2025(16))

Труды Кольского научного центра РАН. Серия: Технические науки. 2025. Т. 16, № 3. С. 140-153. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2025. Vol. 16, No. 3. P. 140-153. семантическую информацию о типах вагонов обоих поездов, количестве пассажиров, перевозимом грузе, количестве пострадавших, машинистах и их помощниках и другую информацию, релевантную рассматриваемой ситуации. В этом контексте важно отметить, что именно сформированный с помощью предложенной в работе технологии автоматизированного построения моделей пространственных ситуаций в виде геосемантических изображений геопространственный ГЗ оказывает решающее влияние на эффективность семантического обогащения. Разработанная технология автоматизированного построения моделей пространственных ситуаций в виде геосемантических изображений позволяет на основе заданной онтологией схемы сформировать геопространственный ГЗ, описывающий соответствующую ситуацию. Объекты, их географические и семантические свойства и отношения извлекаются из разнородных источников данных, содержащих описание моделируемой ситуации, с помощью выделения RDF-триплетов средствами больших языковых моделей. Затем полученные триплеты объединяются в RDF-граф и сохраняются в графовой СУБД, образуя единый геопространственный ГЗ. Результатом работы технологии является модель пространственной ситуации, представленная машиночитаемым геопространственным ГЗ, сохраненным в графовую СУБД, что допускает его многократное повторное использование различными пользователями и приложениями. Предложенная технология может быть использована для решения задач семантического обогащения геопространственных данных с целью повышения качества проведения пространственного анализа для информационной поддержки принятия решений. Обобщенная схема технологии представлена на рис. 4. Рис. 4. Обобщенная схема технологии автоматизированного построения моделей пространственных ситуаций в виде геосемантических изображений На первом этапе технологии осуществляется сбор разнородных данных для последующей обработки с целью формирования геопространственного ГЗ. В качестве источников используются как официальные сайты различных министерств, ведомств, органов исполнительной власти, надзорных органов, так и сообщения в сообществах виртуальных социальных сетей и в популярных мессенджерах. На этом этапе все собранные данные делятся на два основных вида — текстовые и мультимедийные. К текстовым данным относятся непосредственно тексты, а к мультимедийным — фотографии, видеоматериалы, аудиозаписи, схемы и другая релевантная информация, не являющаяся текстом. На втором этапе происходит обработка собранных текстовых материалов средствами большой языковой модели с целью извлечения из текстов основных сущностей и отношений в виде RDF-триплетов. © Вицентий А. В., 2025 147

RkJQdWJsaXNoZXIy MTUzNzYz