Труды КНЦ вып.9 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 9/2019(10)
так и на обеспечивающую инфраструктуру. Специальный акцент делается на пригодность данных к автоматизированной машинной обработке (то есть на способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без какого-либо или минимального вмешательства человека): • Findability («обнаруживавмость»): метаданные и данные должны быть легко доступны как для людей, так и для компьютеров. Поэтому для автоматического обнаружения наборов данных и сервисов необходимы машиночитаемые метаданные. • Accessibility (доступность): после того, как требуемые данные обнаружены, необходимо обеспечить доступ к ним с помощью открытых универсальных протоколов, обеспечивающих, в том числе авторизацию и аутентификацию. Предполагается также, что метаданные остаются доступными даже после того, как доступ к собственно данным прекращен. • Interoperability (совместимость): должна обеспечиваться возможность интеграции данных из различных источников, а также их использование приложениями для анализа, хранения и обработки. • Reusability (возможность повторного использования): это ключевой принцип в концепции FAIR; данные должны быть описаны достаточно полно и точно, чтобы обеспечить возможность формирования на их основе различных наборов, применимых для решения прикладных задач. Кроме того, должны быть определены ограничения (лицензии) на использование данных, данные должны быть ассоциированы с их источником и представлены в принятом (стандартном) для соответствующей предметной области виде. Центральный компонент технической экосистемы FAIR - цифровые объекты FAIR, которые могут представлять данные, программное обеспечение, протоколы или другие ресурсы. Каждый объект должен иметь постоянный идентификатор (PID) и снабжен достаточно богатыми метаданными, необходимыми для того, чтобы объект можно было надежно найти, использовать и процитировать. Кроме того, данные должны быть представлены в общедоступных, в идеале - открытых, форматах и должны быть тщательно документированы с использованием стандартов метаданных и словарей, принятых соответствующим исследовательским сообществом для обеспечения возможности взаимодействия и повторного использования (рис. 5). В соответствии с этим, выделяются две приоритетные проблемные области разработки экосистемы FAIR: 1 ) разработка, уточнение и принятие общих словарей, онтологий, спецификаций метаданных и стандартов, которые являются центральными для обеспечения взаимодействия и повторного использования; 2 ) широкое внедрение качественных профессиональных методов управления данными, хранилищ данных и соответствующих сервисов. 154
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz