Вестник Кольского научного центра РАН. 2011, №3.
способ описания ресурсов и способ задания схем, по которым ресурс описывается. Первая часть (RDF) определяет простую модель для описания информационного ресурса в виде троек или триплетов, состоящих из элементов: объект, атрибут и значение. Вторая часть (RDF S te rn a ) определяет более сложную модель, позволяющую представить структуру предметной области в виде, сходном с диаграммой классов UML; • OWL (Web Ontology Language) [16] определяет модель и язык, расширяющие возможности RDF и RDFS. Язык OWL использует синтаксис XML, включает конструкции для представления таксономии классов их свойств и экземпляров. Основной целью языка OWL является описание онтологий в виде веб-ресурсов. Онтологии в этом случае используются для определения семантики метаданных, которыми в свою очередь аннотируются фрагменты данных в информационных ресурсах; • SPARQL (Protocol and RDF Query Language) [17] - язык запросов к RDF ресурсам и одновременно протокол передачи информации в виде RDF троек. Использование технологий, стандартов и языков Semantic Web в решении различных задач обработки данных позволяет применять качественно иные методы, ориентированные на учет представляющих семантику метаданных. Задача информационного поиска в этом случае будет сводиться к нахождению в онтологиях ресурсов понятия, соответствующего объекту поиска и представления сопряженного с ним фрагмента данных. Разумеется, это сокращает объем данных, обрабатываемых поисковыми машинами, за счет использования лишь онтологий ресурсов, отражающих понятийную систему. Однако это в свою очередь делает приоритетной довольно непростую задачу интеграции онтологий множества ресурсов. Интеграция онтологий на базе концепции ‘user as an expert ’ В общем интеграцию онтологий принято определять как процесс построения новой онтологии, описывающей некоторую предметную область, на основе имеющихся онтологий, описывающих схожие между собой предметные области [18]. Интеграция онтологий является довольно сложной проблемой, решение которой осуществляется, как правило, с помощью привлечения экспертов, осуществляющих сопоставления понятий. В этом случае машина может лишь предлагать определенные соответствия и проверять валидность соответствий, заданных человеком-оператором. На сегодняшний день существует несколько программных продуктов, направленных на решение задачи отображения онтологических понятий, среди которых можно выделить: • PROMPT [19] представляет собой подключаемый модуль к редактору онтологий Protege. Процесс работы системы заключается в анализе онтологий и представлении эксперту списка предложений по объединению и последующей его корректировке списка путем выбора того или иного действия. Формирование списка предложений осуществляется на основе схожести символических имен понятий, их словоформ, а также таксономических связей между ними; • Chimaera [20] является компонентом сервера Ontolingua. Выполняет задачи объединения онтологий и выявления последующих логических несогласованностей. При генерации списка своих предложений Chimaera основывается главным образом на сходстве имен понятий, учитываются также непосредственные таксономические связи; • ONION [21] в результате анализа онтологий предлагает пользователю набор правил объединения. Сам анализ включает две стадии: лингвистическую и структурную. На лингвистической - определяются сходства названий терминов, а также их определений, полученных из стороннего словаря. На структурной стадии осуществляется оценка близости понятий на основе их отношений со схожими терминами. Эксперт в итоге определяет применение тех или иных правил, предлагающих различные разрешения неоднородностей в соответствии с их эвристической оценкой. • OntoMerge [22] строит объединенную онтологию из исходных. Данный процесс включает фазу унификации представлений онтологий путем их описания на внутреннем языке, определение связывающих аксиом экспертом и последующего автоматического вывода заключения, формирующего объединенную онтологию. Авторы данного программного продукта указывают на целесообразность его применения для онтологий, содержащих большее количество аксиом Abox (Assertional box ), определяющих различные отношения принадлежности конкретных объектов (экземпляров) к классам (понятиям) онтологии, нежели Tbox (Terminological box), представляющих иерархию классов (понятий). Однако не всегда привлечение эксперта возможно и целесообразно. Примером такой ситуации является интеграция онтологий для осуществления последующего семантического поиска на основе 70
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz