Север и рынок. 2014, N 1.

Для тех групп потребителей, которые решают комплексные задачи (например, проблемы устойчивого развития), особенно важным становится доступ к междисциплинарным, мультипредметным данным. Чтобы получить такие данные для решения своих задач, чаще всего необходимо пользоваться большим количеством специфичного программного обеспечения, знать языки запросов к данным, их структуру и семантику. Однако потребители, будучи специалистами в своих предметных областях, испытывают затруднения в работе с такими сложными технологиями обращения к данным. В рамках поставленной задачи необходимо, не внося изменений в уже существующие структуры источников данных, сделать их данные доступными для потребителя так, чтобы он мог использовать для доступа к ним некоторую единую технологию. Иными словами, необходимо провести виртуализацию данных с целью сокрытия особенностей доступа к ним от конечного потребителя. В то же время необходимо предложить возможность выделения семантически связанных наборов данных и подход к их классификации. Соответственно, важной задачей является возможность семантической маркировки существующих данных, что сделает их пригодными для машинной обработки и более эффективного поиска. Для описания спецификации семантики источников данных хорошо подходят описательные (дискрипционные) логики. В качестве инструмента реализации таких обобщенных спецификаций возможно использовать онтологические спецификации. В настоящее время такие задачи реализуются средствами абстрактной модели данных в виде ориентированных графов «субъект - предикат - объект» - RDF и языка описания онтологий OWL. Для высокоуровневого описания доступных в ЕИП предметных областей предлагается создать центральную онтологию (классификатор), которая состоит из иерархии онтологических классов и не зависит непосредственно от каких-либо источников данных. Наличие такой центральной (промежуточной по отношению к потребителю и непосредственно ресурсам) онтологии является обязательным условием успешной интеграции разнородных ресурсов. При этом она может быть расширена другими онтологиями такой же структуры или парами онтология - отображение. Каждая такая пара обеспечивает подключение конкретного источника данных: онтологиия описывает структуру его классов, а отображение указывает соотношение его классов и онтологических свойств к реальной структуре источника данных, а также параметры подключения к нему. Таким образом, запрос к источнику данных может формироваться в терминах онтологий и их свойств. Несмотря на свою разнородность, интегрируемые источники данных могут иметь общие онтологические свойства, потому предлагается создать дополнительную связывающую онтологию для указания связи между такими свойствами с помощью стандартных предикатов OWL. Решение такого класса можно отнести к семейству медиаторных систем, где медиатор реализуется в виде небольшого программного компонента, реализующего выполнение запросов к источникам данных, описанным с помощью онтологий, т.е. представляет собой программный коннектор между непосредственно источником и его метаописанием, с которым и работает потребитель. На стороне потребителя происходит выбор данных, а формирование запроса к источникам данных, а также получение ответа на него выполняется коннектором с помощью обращения к онтологии. Сам программный коннектор использует построенное дерево классов из онтологических спецификаций, их связи с отображениями на реальные источники данных, а также полученные из онтологических спецификаций и опроса источников данных ограничения на допустимые диапазоны значений данных в этих источниках. Стыкование онтологий на уровне программного коннектора производится путем установления связей их классов по унифицированному идентификатору ресурса (URI), который уникален для каждого онтологического класса, кроме случая, когда имеется в виду один и тот же класс. При этом на используемую онтологию налагается требование наличия иерархизированной структуры предметной области. Требования к структуре онтологии для расширения классификатора состоят в необходимости вложения у базового онтологического класса только одного подкласса, URI которого будет совпадать с URI класса, к которому производится подсоединение, все другие классы онтологии являются подклассами этого класса. Таким же является требование, если текущая онтология будет расширять другую онтологию с целью расширения классификатора. При этом никаких дополнительных ограничений на количество расширяющих классификацию онтологий, не считая программно-аппаратных ограничений, таких, например, как объем выделяемой программному коннектору памяти, и уникальности имен классов не накладывается, что обеспечивает хорошую масштабируемость предлагаемого решения. 16

RkJQdWJsaXNoZXIy MTUzNzYz