Труды КНЦ вып.8 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 3/2017(8))

root prt det dobj aux xcomp advmod nsubj ccomp dobj p Try out the API to see how ithandles imperatives Try see handle VERB PRT DET NOUN PRT VERB ADV PRON VERB NOUN PUNCT Piic. 2. Пример синтаксического разбора предложения СМПО формируется как результат интеграции семантических образов документов коллекции. Семантический образ документа —семантическая сеть, множество вершин которой составляют понятия СМПО, присутствующие в документе, множество ребер —множество двухместных отношений над понятиями. Для определения превалирующего контекста для пользователя ИС применяется модель предпочтений, построенная на основе анализа запросов. Запрос —множество понятий предметной области, представленных множеством ключевых слов. Модель предпочтений пользователя —семантическая сеть, множество вершин которой составляют понятия СМПО, которыми оперирует пользователь, множество ребер —множество взвешенных двухместных отно­ шений над понятиями, вес которых характеризует значимость семантического отношения между понятиями для пользователя, определенную на основе статистики его взаимодействия с системой. СМПО может быть представлена неоднородной n-арной семантической сетью: K B = {C ,L ,T p } . (1) L = { 1 } , 1 = < c i , c J , t p , w > , C ^ C J & C , t p <=Тр, W =<W l ,...,W t ,...,W r > (2) где С - множество концептов, L -множество отношений нац концептами, W - вектор весовых коэффициентов, Тр - множество типов отношений (синонимии, гипонимии, ассоциации, субтрактивных отношений), г - количество категорий поль­ зователей. Процесс формирования семантической модели предметной области на основе коллекции документов информационной системы и расширяемого тезауруса состоит из следующих этапов: 1. Формирование семантического образа документа. Семантический образ зацан семантической сетью, полученной статистическими и лексико-граммати­ ческими методами обработки текста: D = { C D , L d } , C d с= C , L d c= L , (3) где C D- множество концептов, выделенных в документе, / / ' - множество отношений вида (2), выделенных в документе. 112

RkJQdWJsaXNoZXIy MTUzNzYz