Труды КНЦ вып.12 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 5/2021(12))

В методе поиска ассоциативных правил используются понятия поддержки, которое является мерой надежности, с которой ассоциативное правило выражает ассоциативную связь между условием и следствием, и достоверности - это показатель, характеризующий уверенность в том, появление события A влечёт за собой появление события B. При применении алгоритмов поиска ассоциативных правил находятся все правила, для которых эти показатели должны быть выше некоторых заранее заданных порогов (минимальной поддержки и минимальной достоверности). Приведем краткое описание некоторых алгоритмов поиска ассоциативных правил. Алгоритм AIS. считается первым алгоритмом поиска ассоциативных правил [24, 25]. В этом алгоритме во время сканирования базы данных генерируются множества наборов посылок и следствий, которые служат материалом для формирования ассоциативных правил. Алгоритм SETM. Отличается от алгоритма AIS тем, что при его создании использован язык SQL. Так же как и в алгоритме AIS, формируются наборы наборов посылок и следствий на основе на преобразований базы данных. Недостатком обоих алгоритмов является избыточное генерирование наборов, частота встречаемости которых оказывается низкой. Алгоритм Apriori [26] был создан, чтобы устранить этот недостаток. Алгоритм Apriori уменьшает количество наборов, (априори) отсекая наборы с низкой частотой встречаемости. Это процедура основана на предположении, что у набора с высокой частотой встречаемости все подмножества так же должны иметь высокую частоту встречаемости. Поэтому, если в наборе находится хотя бы одно подмножество, частота встречаемости которого была определена как низкая, этот набор уже не включается в рассмотрение. Разновидности алгоритма Apriori, такие как AprioriTID и AprioriHybrid, были предложены как развитие исходного алгоритма. В дальнейшем были разработаны алгоритмы, усовершенствующие алгоритм Apriori: алгоритм DHP, который называют алгоритмом хеширования [27], где сокращение обеспечивается за счет того, что каждый из наборов- кандидатов помимо шага сокращения проходит шаг хеширования; алгоритм PARTITION, где при сканировании транзакционной базы данных производится ее разделение на непересекающиеся разделы [28, 29]; алгоритм DIC (Dynamic Itemset Counting), где база данных разбивается на несколько блоков и затем циклически сканируется [30]. Алгоритмы ассоциативных правил нашли применение в различных предметных областях, например: в розничной торговле - для выявления групп покупателей и общих характеристик клиентов компании, определения товаров, которые стоит продвигать, прогнозирования спроса, анализа потребительской корзины, в маркетинге - для поиска рыночных сегментов, тенденций покупательского поведения, при проведении анализа Web-логов и т.п. Анализ формальных понятий Анализ формальных понятий (АФП) является разновидностью формального концептуального анализа (Formal Concept Analysis, FCA), это раздел теории решеток, применяемый для решения прикладных задач [31]. Его можно использовать для анализа простых таблиц объектов атрибутов (называемых 96

RkJQdWJsaXNoZXIy MTUzNzYz