Труды КНЦ вып.9 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 10/2018(9))

УДК 004.5, 004.9 DOI: 10.25702/KSC.2307-5252.2018.10.99-111 А.В. Вицентий, М.Г. Шишаев, В.В. Диковицкий Институт информатики и математического моделирования ФИЦКНЦРАН ОПЫТ ИСПОЛЬЗОВАНИЯ ВИЗУАЛИЗАЦИИ СЕМАНТИЧЕСКИХ МОДЕЛЕЙ ДОКУМЕНТОВ ДЛЯ ЭКСПРЕСС КОНТЕНТ-АНАЛИЗА (НА ПРИМЕРЕ НОРМАТИВНО-ПРАВОВЫХ АКТОВ, РЕГЛАМЕНТИРУЮЩИХ РАЗВИТИЕ ПРОСТРАНСТВЕННО-РАСПРЕДЕЛЕННЫХ СИСТЕМ)* Аннотация В настоящее время большие объемы данных доступны в текстовой форме. Однако из-за характерных особенностей текста на естественных языках, разработка полностью автоматических методов анализа семантики текстов является сложной задачей. В настоящей статье описывается состав, структура и некоторые области применения разработанных технологий семантического анализа и визуализации семантических моделей текстовых документов. Также описываются методы визуального экспресс контент-анализа документов. Эти методы являются частью технологии визуализации семантических моделей текстовых документов и реализованы в виде независимых программных инструментов. Для демонстрации основных возможностей технологии, подробно описывается опыт использования визуализации семантических моделей документов для визуального экспресс контент-анализа нормативно-правовых актов, регламентирующих развитие пространственно-распределенных систем различного уровня и анализ полученных результатов. В заключении делается вывод о перспективных областях использования разработанных технологий, а также определяются основные направления дальнейшей работы и возможности по расширению функциональности методов визуального экспресс контент- анализа текстовых документов. Ключевые слова: визуальный анализ документов, контент-анализ, человеко-компьютерный интерфейс, управление пространственно-распределенными системами, tensorflow, TF-IDF A.V. Vicentiy, M.G. Shishaev, V.V. Dikovitsky EXPERIENCE IN USING THE VISUALIZATION OF DOCUMENT SEMANTIC MODELS FOR EXPRESS CONTENT ANALYSIS (ON THE EXAMPLE OF LEGAL ACTS REGULATING THE DEVELOPMENT OF SPATIALLY DISTRIBUTED SYSTEMS) Abstract Currently, large amounts of data are available in text form. However, due to the characteristic features of the text in natural languages, the development of fully automatic methods for analyzing the semantics of texts is a difficult task. This paper describes the composition, structure and some areas of application of the developed technologies of semantic analysis and visualization of semantic models of text documents. Also, methods for visual express content analysis of documents are described. These methods are part of the technology for visualizing semantic models of text documents and implemented as independent software tools. To demonstrate the main features of the technology, the experience of using the visualization of semantic document models for visual express content analysis of legal acts regulating *Исследование выполнено при финансовойподдержке РФФИиМинистерства образованияи науки Мурманской области в рамках научных проектов № 17-47-510298 р_а и 17-45-510097 р_а. 99