Труды КНЦ (Технические науки вып. 3/2024(15))
Труды Кольского научного центра РАН. Серия: Технические науки. 2024. Т. 15, № 3. С. 82-96. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2024. Vol. 15, No. 3. P. 82-96. Научная статья УДК 004.832 doi:10.37614/2949-1215.2024.15.3.007 ОБЗОР МЕТОДОВ ПОИСКА ЧАСТЫХ ПАТТЕРНОВ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ Александр Анатольевич Зуенкош , Ольга Владимировна Фридман 2 12Институт информатики и математического моделирования имени В. А. Путилова Кольского научного центра Российской академии наук, Апатиты, Россия 1zuenko@iimm.ruв , https://orcid.org/ 0000-0002-7165-6651 2ofridman@iimm.ru, https://orcid.org/0000-0003-1897-4922 Аннотация В статье рассматривается одна из задач интеллектуального анализа данных, а именно: задача поиска особого вида зависимостей в данных — частых паттернов. На основе частых паттернов могут строиться ассоциативные правила между признаками. Приводится обзор наиболее популярных методов решения данной задачи. Также рассматривается тесно связанная с ней задача генерации формальных понятий на основе формального контекста и один из методов ее решения — метод «замыкай по одному». К недостаткам рассматриваемых методов относится трудоемкость их модификации при наличии дополнительных (помимо частоты встречаемости в обучающей выборке) требований к искомому паттерну. Делается вывод о необходимости развития существующих методов извлечения паттернов, а также целесообразности разработки новых подходов для решения задач поиска «интересных паттернов», а также поиска паттернов с дополнительными требованиями к их виду. Ключевые слова: интеллектуальный анализ данных, частые паттерны, ассоциативные правила, анализ формальных понятий Благодарности: работа выполнена в рамках НИР «Разработка теоретических и организационно -технических основ информационной поддержки управления жизнеспособностью региональных критических инфраструктур Арктической зоны Российской Федерации» (регистрационный номер 122022800547-3). Для цитирования: Зуенко А. А., Фридман О. В. Обзор методов поиска частых паттернов для интеллектуального анализа данных // Труды Кольского научного центра РАН. Серия: Технические науки. 2024. Т. 15, № 3. С. 82-96. doi:10.37614/2949-1215.2024.15.3.007. Original article SURVEY OF FRIEQUENT PATTERN SEARCH METHODS FOR DATA MINING Aleksandr A. Zuenko1B, Olga V. Fridman 2 12Putilov Institute for Informatics and Mathematical Modeling of the Kola Science Centre of the Russian Academy of Sciences, Apatity, Russia zuenko@iimm.ruB, https://orcid.org/ 0000-0002-7165-6651 2ofridman@iimm.ru, https://orcid.org/0000-0003-1897-4922 Abstract The article discusses one of the promlems of data mining, namely: the problem of searching for a special type of data dependencies - frequent patterns. Associative rules between features can be built on the basis of frequent patterns. A survey of the most popular methods for solving this problem is provided. The closely related problem of generating formal concepts based on a formal context is also considered, and one of the methods for solving it — the "close-by-one" method. The disadvantages of the considered methods include the complexity of their modification in the presence of additional (in addition to the frequency of occurrence in the training sample) requirements for the desired pattern. It is concluded that it is necessary to develop existing methods of pattern discovery, as well as the expediency of developing new approaches to solve the problems of searching for "interesting patterns", as well as searching for patterns with additional requirements for their type. Keywords: data mining, frequent patterns, associative rules, formal concept analysis Acknowledgments: the study was carried out within the framework of the Putilov Institute for Informatics and Mathematical Modeling of the Kola Science Centre of the Russian Academy of Sciences state assignment of the Ministry of Science and Higher Education of the Russian Federation, research topic “ Development of theoretical and organizational and technical foundations of information support for managing the viability of regional critical infrastructures of the Arctic zone of the Russian Federation” (registration number of the research topic 122022800547-3). © Зуенко А. А., Фридман О. В., 2024 82
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz