Труды КНЦ вып. 11 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 8/2020 (11)

Проведена кластеризация сейсмособытий согласно алгоритму иерархической кластеризации, предложенному в теории мультимножеств и подробно описанному в [2]. Изначально каждый кластер состоит и единственного объекта, затем вычисляются расстояния между парами мультимножеств, представляющих кластеры, находится пара наиболее близких кластеров относительно используемой метрики и формируется новый кластер, который представляется суммой соответствующих мультимножеств и т.д. Процедура может быть также прервана на некотором шаге, например, когда величина индекса различия между объектами превысит некоторый пороговый уровень. Таблица 1. Варианты представления исходных данных для иерархической кластеризации (a) (b) (c) Номер ячейки Р1 Р2 ОП ОПв РТ ВП РТ/ВП В ВБ ЛБ N 1 0 0 0 0 0 1 0 0 1 0 2 2 1 0 0 0 0 1 0 0 1 0 2 3 0 0 0 0 0 1 0 0 1 0 6 1 0 0 0 0 0 2 0 0 2 0 2 2 2 0 0 0 0 2 0 0 2 0 2 3 0 0 0 0 0 6 0 0 6 0 6 1 2 0 2 0 2 0 2 0 2 0 0 2 2 0 2 0 0 2 2 0 2 2 0 2 2 0 2 0 2 0 2 0 0 2 2 0 2 0 0 2 2 0 2 3 6 0 6 0 6 0 6 0 6 0 0 6 6 0 6 0 0 6 6 0 6 Вычисляя последовательно шаг за шагом расстояния между всеми парами объектов/кластеров и выбирая на каждом шаге наиболее близкие пары (с минимальным расстоянием), получаем разбиение на итоговые кластеры. На рисунке 1 представлены результаты кластеризации для различных вариантов представления исходных данных. Сравнение различных вариантов результатов кластеризации позволяет сделать вывод, что результаты зависят от исходного представления данных - меняется как ход кластеризации, так и состав результирующих кластеров. По экспертным оценкам, кластеризацию следует остановить при получении числа кластеров большего, чем два во всех случаях, так как последнее объединение кластеров, приводящее к получению двух итоговых кластеров, производится при значительном превышении расстояния между кластерами на предыдущем шаге. Наиболее близким к экспертным оценкам является вариант "b" на рисунке 1. В дальнейших исследованиях использовалось именно это представление исходных данных. 29

RkJQdWJsaXNoZXIy MTUzNzYz