Вестник Кольского научного центра РАН № 1, 2025 г.

Рис. 3. Изменение точности (а) и функции потерь перекрестной энтропии (б) от эпохи во время обучения и валидации нейронной сети 100.00% с потерей бинарной перекрестной энтро пии 0.0115 была оценена для четвертой модели СНС. Разница в значении общего времени обу чения (15 эпох) между самой быстрой и самой долгой моделью СНС составила всего 16 се кунд. В результате сравнения производитель ности моделей СНС с разной структурой, была выбрана последняя модель нейронной сети, содержащая слои аугментации изображений и слой дропаута, так как она достигла максималь ной точности. Кроме того, более высокое значе ние потери этой модели по сравнению с первой моделью (она достигла второй по величине точ ности среди рассматриваемых архитектур СНС) говорит о том, что СНС усвоила меньше невер ных признаков, связанных с шумом и случай ными колебаниями в данных. Таким образом, эта модель будет потенциально лучше клас сифицировать данные, которые ранее не виде ла. Также выбранная модель СНС превзошла по точности фреймворк для обнаружения ГИТ в энергосистемах, использующий гибридный частотно-временной анализ (ОПФ и НВП) в со четании с СНС. Этот фреймворк достиг точнос ти 90.95% [Wang et al., 2020]. На рис. 3 показаны кривые обучения для выбранной модели на обучающем и проверочном (валидационном) наборе данных. Использование дропаута сов местно с искусственным увеличением размера обучающего набора данных позволяет модели избежать переобучения и достигнуть высокой производительности. Как видно из рис. 3, точ ность валидации выбранной модели выше точ ности обучения, а валидационные потери ниже, чем потери при обучении. Это объясняется тем, что регуляризация (дропаут) и аугментация дан ных применяются только во время обучения, что затрудняет классификацию на обучающем наборе данных. Поскольку слой дропаута не ак тивен во время проверки, модель использует все признаки, что делает ее более надежной, по вышая валидационную точность и снижая ве личину потери во время проверки. Аугментация данных повышает сложность примеров в обу чающем наборе данных, что приводит к умень шению точности обучения и увеличению поте ри при обучении по сравнению со значениями этих метрик во время валидации. Архитектура предложенной модели СНС для классификации скейлограмм токов в ней трали автотрансформатора представлена на рис. 4. Она состоит из четырех сверточных слоев, четырех подвыборочных слоев, слоя дропаута, слоя сглаживания, и двух полносвяз ных слоев. Каждый сверточный слой и первый полносвязный слой сопровождаются функ цией активации ReLU, которая применяется для обеспечения эффективной производитель ности обучения. Размер ядра фильтра каждого следующего сверточного слоя уменьшается, что делает возможным извлечение локальных признаков из изображений при разных масш 20