Труды КНЦ вып.12 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 5/2021(12))
топонимы Мурманской области. Содержащиеся в газеттире ключи ищутся в процессе анализа, что в результате повышает точность определения искомых геообъектов в тексте. Структура статей в газеттире «Томита парсера» является типовой, что позволяет использовать его в других исследованиях при условии доработки. Извлекаемые цепочки из текста интерпретируются в факты, согласно разработанным грамматикам. Например, следующее правило: «S -> Place interp(EventFact.Place)» используется для интерпретации цепочки в факт о местоположении события, о котором упоминается в тексте. Структуру фактов была задана отдельно. Используется такое поле факта: «required string EventPlace = 1;». Проведённые на ограниченном наборе данных испытания показали, что в текущем состоянии точность извлечения геообъектов в текстах на естественном языке находится в диапазоне 85-88%. Заключение В дальнейшем планируется расширить список контекстно-свободных грамматик. В частности, исследовать методы разрешения неоднозначностей, при совпадении наименований геообъектов разной природы. Также рассматривается возможность переработки структуры извлекаемых «Томита-парсером» фактов, с целью унификации списка получаемых геообъектов для упрощения дальнейшей обработки. В качестве инструмента геовизуализации может быть выбрана облачная геоинформационная система Arc GIS, а для определения пространственной привязки геообъектов могут быть использованы различные геокодеры. Поскольку структура газеттира достаточно типовая, то процесс его заполнения можно автоматизировать, если использовать скрипт. На данный момент рассматривается вариант разработки скрипт для формирования газеттира на языках программирования C и Python. Список сокращений ГИС - географическая информационная система СППР - система поддержки принятия решений Список литературы 1. Sentsov A., Bolsunovskaya Y., Melnikovich E. The Arctic zone: Possibilities and risks of development // IOP Conference Series: Earth and Environmental Science, 2016, DOI 10.1088/1755-1315/43/1/012100. 2. Bondareva N. N. Modern Approaches to Arctic Development in View of Synergy Potential in the New Risks and challenges Environment // Modernization Innovation Research. -2021.-№12(1). -P.23-33, DOI:10.18184/2079-4665.2021.12.1.23-33. 3. Vicentiy, A. V. The Geoimage Generation Method for Decision Support Systems Based on Natural Language Text Analysis // Lecture Notes in Networks and Systems. -2021. - vol. 230. - P. 609-619. 4. Watkins C. The geographical context // Disclosing Church, 2020. - P. 71-81, DOI: 10.4324/9781315142531-8. 5. Vicentiy A.V., Shishaev M.G. The Technology of Spatial Relations Visualization Based on the Analysis of Natural Language Texts // Lecture Notes in Networks and Systems. -2021. vol 232. - P. 971-980. 54
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz