Труды КНЦ вып.9 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 9/2019(10)

формату списка двуместных отношений синонимичные ряды тезауруса были разложены на множества двуместных отношений. Парадигматические отношения тезауруса над синонимичными рядами при этом были установлены между каждой парой слов из различных синонимичных рядов. Далее получено пересечение множеств слов присутствующих в тезаурусе и семантической сети, а также двуместные отношения между словами. В результате было получено 2534 бинарных отношений. В таблице представлена статистика использования двуместных синтаксических отношений в различной роли парадигматических отношений тезауруса. Таблица 1. Статистика использования двуместных синтаксических отношений в _______________ различной роли парадигматических отношений_______________ UD\ WordNet Элемент группы Антоним Мероним Гипероним Ассоциация Гипоним Атрибут conjunct 1 263 30 694 5 360 2 adverbial clause modifier 2 1 adjectival modifier 19 2 9 10 39 nominal modifier 36 14 30 268 464 4 nominal subject 6 7 9 53 80 oblique nominal 2 4 appositional modifier 5 9 10 7 determiner 2 2 clausal subject 1 clausal complement 1 object 1 2 case marking 1 open clausal complement 1 Из таблицы следует превалирование определенных групп синтаксических отношений текста википедии для некоторых парадигматических отношений тезауруса. Гипонимы в 39% выполняют синтаксическую роль «conjunct» и в 51% случаев роль «nominal modifier». Гиперонимам в 68% случаев соответствует синтаксическая роль «conjunct» и в 26% «nominal modifier». Для разделения гипонимов и гиперонимов учитывается направление двуместного отношения. Отличить парадигматические отношения в рамках одной синтаксической роли предложено также за счет учета определенной Word2Vec контекстной близости. Также различные синтаксические роли имеют различные связи с другими вершинами семантической сети, в частности применимы с различными предлогами и пунктуацией. Пример антонимов («автомобиль, а не самолет», «автомобиль и другие транспортные средства»). Учитываются и морфологические свойства слов, определенные SyntaxNet. Получены классы объектов, связанные одним и тем же парадигматическим отношением и определенные в множество по схожим морфологическим признакам. В таблице 3 представлены примеры гиперонимов и меронимов, полученных при анализе аннотаций статей Википедии. 94

RkJQdWJsaXNoZXIy MTUzNzYz