Труды КНЦ вып. 11 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 8/2020 (11)

сегодня основывается, как правило, на априорной информации о механизмах генерации данных. Однако, далеко не всегда априорная информация о механизмах генерации данных доступна. Типичным примером здесь является электроэнцефалографический (ЭЭГ) сигнал, который, по мнению большинства специалистов, относится к числу наиболее сложных для исследования физических процессов, и при этом общепринятой модели такого процесса нет [2]. Аналогична в этом смысле ситуация и в приложениях к финансовым рядам, некоторым биологическим проблемам и т.д., где также нет твердо установленных моделей наблюдаемых процессов. Это обстоятельство существенно осложняет построение пространства признаков для решения задач классификации. Развиваемая нами в последние годы теория е-сложности непрерывных конечномерных отображений позволяет дать новый подход к проблеме [3]. Эта теория полностью согласуется в идейном плане с общим подходом А.Н. Колмогорова к определению понятия «сложность объекта» [4]. Неформально говоря, слож ность индивидуального непрерывного отображения, определенного на компакте, измеряется логарифмом числа его отсчетов на равномерной решетке, которые требуются для восстановления отображения фиксированным набором методов аппроксимации с относительной погрешностью не более. Иными словами, е-сложность можно назвать кратчайшим описанием (с точностью до) отображения по его значениям на равномерной решетке при помощи заданного семейства методов аппроксимации. Результаты теории е- сложности обобщаются на случай, когда непрерывное отображение задано своими отсчетами на некоторой равномерной решетке, что характерно для подавляющего большинства приложений. Можно показать, что е-сложность «почти любого» отображения, удовлетворяющего условию Гёльдера, эффективно характеризуется парой действительных чисел. Мы называем эти числа коэффициентами е-сложности. Коэффициенты сложности никак не связаны с механизмом генерации данных, и именно это обстоятельство позволяет предложить безмодельные технологии классификации . Предлагаемый метод применялся для распознавания разных ментальных состояний мозга и разных паттернов активности мозга при совершении когнитивных актов в рамках нескольких экспериментов с участием реальных испытуемых [5]. В процессе экспериментов реальные данные ЭЭГ очищались от артефактов и приводились к единому масштабу. После этого вычислялись коэффициенты сложности для исходных кривых, а также для их разностей вплоть до четвертого порядка. Полученное таким образом признаковое пространство имело размерность от двух до десяти. Далее проводилась бинарная классификация методами SVM и Random Forest с использованием перекресной проверки по 10 блокам (10-fold cross-validation). Результаты экспериментов показали эффективность предлагаемой технологии, обеспечивающей точность классификации по метрике accuracy более 85%. 177

RkJQdWJsaXNoZXIy MTUzNzYz