Моделирование физических процессов в полярной ионосфере / Акад. наук СССР, Кол. фил. им. С. М. Кирова, Поляр. геофиз. ин-т. – Апатиты : Кольский филиал АН СССР, 1979. – 148 с.
признаков и в выборе более эффективной подсистемы из полученной системы приз наков. На этом пути не уменьшается количество измеряемых признаков. Второй путь _ это путь отбрасывания малоэффективных признаков. Отбросить часть приз наков можно только на основе измерения эффективности каждого из них в заданном множестве, вообще говоря, зависимых признаков. Целью данной работы является описание одного из возможных способов оценки качества признака в заданном на боре. Заметим, что задачу минимизации описания объектов классификации невозможно сформулировать без учета процедуры распознавания. Если известна процедура клас сификации, то самый надежный способ выбора наиболее информативной группы приз наков из данного набора состоит в проверке всех возможных сочетаний предлагаемы» признаков на принятой процедуре распознавания. Очевидно, сочетание признаков, даю щее лучшее "качество” распознавания обучающей выборки, будет искомым. Однако, во-первых, перебор всевозможных сочетаний признаков приводит к необходимости рассмотрения такого количества вариантов, что даже простые случаи не представля ется возможным реализовать на ЭВМ. Например, в варианте, выбора 20 признаков из 50 число С 2 0 - Ю 13 / V ■ В о -вторы х, процедура распознавания также требует больших 50 затр ат машинного времени. В работах / 1 - 4 / указанные трудности преодолеваются тем или иным путем . По жалуй, самый интересный способ обойти полный перебор возможных сочетаний приз наков разработан Г.С .Л бо вы м . В работе / 2 / Лбов Г .С . предлагает заданное количе ство признаков из рассматриваемой системы выделять методом случайного поиска с адаптацией. Одним из недостатков метода является о тсутстви е формальных обоснова ний выбора количества искомых признаков. Чтобы обойти процесс распознавания при оценке эффективности признаков выбирают критерий отличный от "каче ства” распоз навания, более легко вычисляемый, жестко коррелируемый с этим "качеством ". Вво димый критерий информативности признаков является не чем иным, как формальным выражением идеи о том , что в пространстве наиболее информативных признаков изу чаемые классы оказываю тся наиболее "удалены" друг от др уга. В данной работе вводится критерий для оценки эффективности признака в груп пе, вычисляемый по матрице связи между объектами обучающей выборки. Этот крите рий также формально реализует описанную выше идею о расположении классов. Пока зана связь критерия с процедурой отнесения изучаемого объекта к определенному классу. Описывается один из способов локальной оптимизации критерия, характеризую щего качество признаков. 107
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz