Труды КНЦ вып.9 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 9/2019(10)

DOI: 10.25702/KSC.2307-5252.2019.9.137-145 УДК 004.832 П. А. Ломов Институт информатики иматематического моделирования ФИЦ КНЦ РАН ПРИМЕНЕНИЕ ГРАФОВЫХ СУБД В ЗАДАЧАХ АНАЛИЗА ДАННЫХ* Аннотация Данная статья посвящена вопросу применения графовых систем управления базами данных (СУДЕ) при решении задач анализа данных. Рассматриваются структуры распространенных графовых моделей данных - модель "субъект- предикат-объект" и модель графа свойств, а также графовые алгоритмы и их применение для анализа данных. Приводится описание качественных отличий между графовыми и реляционными СУБД, которые целесообразно учитывать при их выборе в качестве средства для хранения и анализа данных с различной структурой. Ключевые слова: графовая СУБД, RDF, граф свойств, графовые алгоритмы P. A. Lomov APPLICATION OF GRAPH DATA BASES FOR DATA ANALYSIS Abstract This article is devoted to the use of graph databases for solving data analytical problems. The structures of common graph data models - the “subject-predicate- object” model and the property graph model, as as well as their main differences are considered. Along with this, common graph algorithms and their application for solving some types of analytical problems are presented. The article describes the qualitative differences between graph and relational DBMSs, which should be taken into account when choosing a tool for storing and analyzing data with a different structure. Keywords: graph DBMS, RDF, property graph, graph algorithms. Введение Современная информационноя система как правило характеризуется большим объемом данных, обладающих большим количеством и сложной струтурой связей. В зависимости от выбранной модели данных представление таких связей может осуществляться по разному. Например, в реляционной модели они могут быть представлены в виде «соединений» реляционных таблиц по внешнему ключу. Это позволяет в процессе выполнения запроса объединять отдельные элементы данных (кортежи таблиц) и получать в результате более сложный фрагмент данных, содержащий ответ на заданный запрос. Наличие сложной струтуры связей в данных позволяет в ходе их анализа находить несколько альтернатив для решения некоторой прикладной задачи, учитывать некоторые дополнительные факторы, а также выявлять решения похожих задачи, имевшие место в прошлом. Связи элементов данных могут быть представлены явно путем применения для этого средств, предоставляемых моделью данных, или могут формироваться «на лету» при использовании хранилища данных. В последнем *Работа выполнена при финансовой поддержке РФФИ (проект № 17-47-510298 р_а). 137

RkJQdWJsaXNoZXIy MTUzNzYz