Труды КНЦ вып.8 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 3/2017(8))

чения и хранения множественного контекста употребленных в документах понятий, решая проблему совместимости новой информации с уже накоплен­ ными знаниями, а также выявить противоречия в семантических образах документов, в случае, если новая информация противоречит накопленной. Графематический анализ отдельные слова S Z ________________ Морфологический анализ морфологические характеристики слов Синтаксический анализ зависимости слов в предложении Семантический анализ Рис. 1. Уровни лингвистического анализа Для синтаксического анализа и определения морфологических характе­ ристик слов применяются грамматический словарь русского языка А.А. Зализняка [4], русскоязычный тезаурус WordNet3.0 [5] и основанная на TensorFlow [6] библиотека определения синтаксических связей, использующая для функционирования нейронную сеть SyntaxNet. Особенностью такого подхода является возможность производить анализ морфологии и синтаксиса без словарей. TensorFlow представляет собой библиотеку для машинного обучения и глубокого исследования нейронных сетей в рамках научно- исследовательской организации Machine Intelligence. Система масштабируема может быть использована на множестве устройств. Основу библиотеки составляют графы потоков данных, библиотека функционирует на уровне задания архитектуры нейронной сети и ее параметров. Данные в TensorFlow представлены в виде многомерных массивов данных с переменным размером - тензоров. Вычисления представляются в виде направленного графа, пути, по которым эти данные перемещаются - это ребра графа. Тензоры переходят от узла к узлу по ребрам графа [7]. Множество морфологических признаков, определяемых SyntaxNet (374), грамматических категорий (49), и типов зависи­ мостей (37) заданы в нотации Universal Dependencies [8]. Пример синтакси­ ческого разбора предложения приведен на рис. 2. Нейросетевой подход к определению лексической роли и морфоло­ гических атрибутов слов позволяет решить проблему наличия в тексте слов, отсутствующих в словарях и в СМПО, например, неологизмов. Для построения семантической модели предметной области проводится графематический, мор­ фологический, синтаксический и статистический анализ документов коллекции. 111

RkJQdWJsaXNoZXIy MTUzNzYz