Труды КНЦ вып. 11 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 8/2020 (11)

DOI: 10.37614/2307-5252.2020.8.11.012 УДК 004.5, 004.9 А.В. Вицентий12, В.В. Диковицкий1, М.Г. Шишаев 12 1Апатиты, ИИММ ФИЦ КНЦ РАН 2Апатиты, Филиал ФГБОУ ВО «МАГУ» в г. Апатиты, Россия ТЕХНОЛОГИЯ ИЗВЛЕЧЕНИЯ И ВИЗУАЛИЗАЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ, ПОЛУЧЕННЫХ ПРИ АНАЛИЗЕ ТЕКСТОВ* Аннотация В работе рассмотрена проблема извлечения геоданных из текстов и их визуализации в форме, удобной для восприятия и последующего анализа. Предлагается информационная технология, позволяющая извлекать геоданные из текстов на естественном языке и строить на их основе картографический интерфейс на базе готовых геосервисов. Для извлечения топонимов из текста использовались методы синтаксического, морфологического и семантического анализа, а для геокодирования и визуализации - возможности современных веб­ геосервисов. Ключевые слова: анализ текстов на естественном языке, извлечение фактов из текстов, картографический интерфейс, геовизуализация. A.V. Vicentiy, V.V. Dikovitsky, M.G. Shishaev 1Apatity, Institute for Informatics and Mathematical Modelling, KSC RAS 2Apatity, Murmansk Arctic State University THE TECHNOLOGY OF EXTRACTION AND VISUALIZATION OF SPATIAL DATA OBTAINED BY TEXTS ANALYSIS Abstract This work considers the problem of extracting geodata from natural language texts and visualizing it in a form convenient for perception and subsequent analysis. The information technology for extracting geodata from texts in natural language and building a cartographic interface based on them on the basis of ready-made geoservices is proposed. Syntactic, morphological and semantic analysis methods were used to extract toponyms from texts. For implementation of geocoding and visualization procedures the possibilities of modern web-geoservices were used. Keywords: analysis of natural language texts, extracting facts from texts, cartographic interface, geovisualization. В работе рассмотрена информационная технология извлечения и визуализации геоданных из текстов на естественном языке для автоматизированного синтеза когнитивных картографических интерфейсов. В основе разработанной технологии лежат методы синтаксического, морфологического и семантического анализа текстов. Анализ текстов на естественном языке проводится с целью выявления упоминаемых в них топонимов и других объектов, имеющих географическую привязку. Визуализация *ИсследованиевыполненопричастичнойфинансовойподдержкеРФФИврамкахнаучногопроекта грант РФФИ№20-07-00754 115

RkJQdWJsaXNoZXIy MTUzNzYz