Труды КНЦ (Технические науки вып. 3/2024(15))

В дереве отражены только те понятия, которые представляют собой частые замкнутые паттерны, поэтому некоторые узлы изначально отсутствуют (например, d и e таковыми не являются, поскольку не порождают понятий). Кроме того, некоторые понятия имеют поддержку меньше заданной минимальной поддержки, равной 2 , а узел { b , e } отображает понятие, которое входит в понятие {a, b, e} и без понятия {a} встречается только один раз. Понятие {a, b, с, e} встречается всего один раз. Эти узлы в дереве понятий помечены цветом. Таким образом, получаем решение в виде совокупности частых замкнутых паттернов: {{a}, {b}, {c}, {a, b}, {b, c}, {b, d}, {a, b, c}, {a, b, e}}. Сравнивая результаты с результатами, полученными при помощи алгоритма Априори и его модификаций, заключаем, что данное решение содержит меньшее количество паттернов, соответственно, будет получено меньшее число ассоциативных правил. Используя полученное решение, сформулируем ассоциативные правила (табл. 10): Полученные правила являются подмножеством правил, сгенерированных при помощи алгоритма Априори и его модификаций. Труды Кольского научного центра РАН. Серия: Технические науки. 2024. Т. 15, № 3. С. 82-96. Transactions of the Kola Science Centre of RA s . Series: Engineering Sciences. 2024. Vol. 15, No. 3. P. 82-96. Таблица 10 Полученные ассоциативные правила Купленные товары Рекомендованные товары Карандаши Кнопки Кнопки Скрепки Кнопки Бумага Карандаши и кнопки скрепки Карандаши и кнопки Клей Достоинства алгоритма [11]: — алгоритм CbO позволяет производить постепенную обработку новых данных путем обновления и расширения полученных результатов без выполнения всех вычислений с нуля; — выбор алгоритма построения решетки понятий должен основываться на свойствах входных данных. Для больших и плотных контекстов самыми быстрыми алгоритмами являются восходящие алгоритмы (стратегия «снизу вверх» — от минимального объема к максимальному), основанные на каноничности; — алгоритм CbO основан на критерии каноничности и является линейным по числу входных объектов, поэтому используется для плотных контекстов. Недостатком алгоритма является то, что он хорошо работает с плотными контекстами, но для небольших и разреженных контекстов, контекстов средней плотности требуются другие алгоритмы (см. работу [10]). Эта особенность алгоритма CbO побудила исследователей создавать его различные модификации [ 1 2 - 2 0 ]. Заключение Существует мнение, что с появлением алгоритма FP-GROWTH проблема эффективного поиска частых паттернов снята, поскольку найден самый эффективный алгорим решения данной задачи. Однако, как правило, поиск всех частых паттернов бессмысленен, поскольку пользователю нужны только наиболее «информативные» («интересные») зависимости на данных. Кроме того, при поиске паттернов требуется учитывать дополнительные требования, помимо частоты, например: замкнутость паттерна; ограничения на подпаттерны и супертерны; ограничения, связанные с агрегатными фунциями, возможность поддержки иерархии на множестве элементов (признаков) и т. п. Необходимость учета дополнительных требований к виду паттерна и его «информативности» обычно приводит к довольно трудоемким модификациям базовых методов поиска частых паттернов, разобранных в настоящей статье. В связи с этим возникает необходимость в разработке новых © Зуенко А. А., Фридман О. В., 2024 93

RkJQdWJsaXNoZXIy MTUzNzYz