Труды КНЦ вып. 11 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 8/2020 (11)

также параметры пары слов из тезауруса WordNet. Векторизация осуществлялась моделью ruwikirus-corpora_upos_skipgram_300_2_2019 [4]. Число определенных классов отношений в WordNet равно 16. Образованный таким образом обучающий набор включает в себя 3680 векторов по 627 параметров. В качестве инструмента для реализации искусственной нейронной сети использовалась библиотека Keras [5]. Приемлемые результаты были получены для сети, состоящей из четырех полносвязных слоев. Функции активации, используемые на каждом слое, были выбраны опытным путем - softmax, ReLu, сигмоид. Обучение проводилось в 20 эпох на 2069 образцах и оценивалось на 690 образцах. Для оценки качества классификатора используются метрики точности полноты. Также была оценена F-мера - среднее гармоническое точности и отзыва (F-мера достигает максимума с полнотой и точностью, равной единице, и близка к нулю, если один из аргументов близок к нулю). На контрольном наборе точность составила 79%. Графики характеристик точности, полноты, F-меры и функций ошибок представлена на рисунке 1. Поведенные эксперименты продемонстрировали в целом эффективность предложенного подхода к автоматической идентификации предметных отношений из текстов на естественном языке, основанного на комплексе синтаксических, частотных и семантических характеристик. В то же время, использование дистрибутивной семантики текста в рамках нейросетевого подхода к анализу позволило значительно повысить точность распознавания, что подтверждает перспективу объединения лингвистического и распределительного анализа в задачах автоматического понимания текста. Рис. 1. Характеристики точности, полноты, F-меры и функций ошибок Литература 1. Dikovitsky V.V., Shishaev M.G.. Automated Extraction of Deontological Statements Through a Multilevel Analysis of Legal Acts. Computational and Statistical Methods in Intelligent Systems, pp. 102-110 2. Библиотека программного обеспечения с открытым исходным кодом для Machine Intelligence TensorFlow: https://www.tensorflow.org/ 191

RkJQdWJsaXNoZXIy MTUzNzYz