Труды КНЦ вып.7 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып.2 4/2011(7))

7. Date — дата; 8. Type — тип; 9. Format — формат документа; 10. Identifier — идентификатор; 11. Source — источник; 12. Language — язык; 13. Relation — отношения; 14. Coverage — покрытие; 15. Rights — авторские права. Квалифицированный (компетентный) набор элементов метаданных Дублинского ядра, помимо 15 вышеперечисленных, может включать: • Audience — аудитория (зрители); • Provenance — происхождение; • RightsHolder — правообладатель. [5] Основываясь на метаданных, полученных с помощью «Дублинского ядра», далее предлагается классифицировать ресурсы по семантике и организовать тематический поиск данных. 5. Реализация поискового запроса Каждый узел после подключения к одноранговой сети производит построение списка данных, которые он содержит. Каждому ресурсу при этом поставлен в соответствие файл, содержащий описание этого конкретного ресурса в виде дублинского ядра. Такие файлы с описаниями формируются при выставлении этого ресурса в общий доступ (в клиентском приложении заполняются соответствующие поля), причем для дальнейшей организации и корректной работы семантического поиска обязательно задаются понятия, связанные с тематикой этого ресурса, или ключевые слова. Затем сформированный список всех ресурсов хоста с их описаниями в виде дублинского ядра отсылаются на мастер-хост. Концентраторы, таким образом, получают информацию обо всех данных, хранящихся на всех хостах. Используя эту информацию, мастер-хосты могут выделить в отдельные кластеры хосты, объединенные общей областью интересов, которая задается пользователем самостоятельно как его область интересов либо определяется по процентному соотношению хранимых данных по конкретной тематике к общему объему хранимых данных (т.е. если большая часть хранимых данных данного хоста имеет в поле Subject в DC заголовок «кулинария», то этот хост прикрепляется к группе хостов, имеющих большинство информации на эту же тему). Сами мастер-хосты также определяют собственные области интересов и участвуют в поиске наравне с обычными узлами. Адресный реестр узлов, находящихся в той же области интересов, что и данный хост, отправляется хосту и далее он взаимодействует с узлами из этого списка. Если затем какой-либо хост инициирует тематический поисковый запрос и не находит запрашиваемый ресурс у себя локально, он инициирует поиск внутри своей группы, а если и этот поиск не дает результатов, то обращается к мастер-хосту, который запускает процедуру поиска по копиям списков ресурсов, хранящихся у них и перенаправляет на тот хост, на котором было найдено совпадение. Стоит отметить, что группа узлов, близких по интересам, может расширяться за счет большого числа 271

RkJQdWJsaXNoZXIy MTUzNzYz