Труды КНЦ вып.9 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 10/2018(9))

выявления потенциальных противоречий в документах, метод «Semantic Network» может дать лишь предварительный ответ о потенциальной возможности наличия противоречий в документах. Для получения более точного ответа, требуются дополнительные усилия со стороны пользователя, связанные с более глубоким анализом смысла концептов и типов связей между ними. Метод «Semantic Network» можно также использовать и для визуальной кластеризации документов. Для эффективного решения этой задачи важно обеспечить одинаковую ориентацию для одинаковых концептов. В свою очередь, задача визуализации концептов в пространстве относительно друг друга является нетривиальной задачей. В частности, библиотека Word 2 Vec, которая используется в технологии семантического анализа документов, использует 300-мерные вектора для описания слов и фраз. Отображение слов в трехсотмерном пространстве не имеет смысла для визуального экспресс контент-анализа документа. Поэтому, необходимо проводить редуцирование пространства визуализации семантической модели документа в зависимости от решаемой пользователем задачи. Разработку метода редуцирования пространства визуализации семантической модели документа в зависимости от решаемой пользователем задачи планируется реализовать в будущих работах. Как и для метода «Top 100 Words», для метода «Semantic Network» также остается актуальным вопрос об оптимальном количестве концептов и связей, которые следует выводить пользователю для визуального экспресс контент- анализа документа. Стоит отметить, что за счет возможностей интерактивного взаимодействия пользователя с визуальным образом семантической сети документа при использовании метода «Semantic Network» этот вопрос не является чрезвычайно важным. Прежде всего, это связано с тем, что пользователь может самостоятельно управлять настройками визуализации, такими как количество выводимых концептов, минимальный вес выводимого концепта, сворачивание и разворачивание узлов сети и т.д. Таким образом, пользователь может самостоятельно настроить оптимальное для него отображение семантической сети документа с учетом решаемой задачи и индивидуальных особенностей восприятия визуальной информации. Решение вопроса об оптимальном способе визуализации семантической сети для конечного пользователя требует проведения дополнительных исследований и будет рассмотрено нами в будущей работе. 3.3 Пример использования метода «Semantic Networks Imposition» Для визуализации различий в структуре семантических отношений между понятиями двух документов мы использовали JavaScript библиотеку визуализации D3.js . Понятия, присутствующие в обоих сравниваемых документах, расположены одинаково на обеих диаграммах. Линии представляют семантические отношения между основными понятиями в семантическом образе каждого документа. Визуализация семантических образов документов «Стратегия МО» и «Стратегия АЗРФ» представлена на рисунке 4. 108

RkJQdWJsaXNoZXIy MTUzNzYz