Труды КНЦ вып. 11 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 8/2020 (11)
на обычных ПК, которых в ГСПК подавляющее большинство. Тем не менее, использование специализированных ускорителей стандартной архитектуры, таких как Intel Xeon Phi, основанных на архитектуре Intel MIC (англ. many integrated core) [1], представляющей из себя расширенный вариант стандартной архитектуры Intel 64 (x86-64), имеет множество весьма существенных достоинств [3], по сравнению с GPGPU: • Возможность несложной адаптации вычислительного приложения, позволяющей задействовать ускоритель (ускорители) только в случае их обнаружении в составе узла ГСПК и использующего стандартные многопоточные вычисления на основном процессоре системы вместо (или вместе с ускорителями) в остальных случаях, при этом зависимость приложения от дополнительного специального ПО минимальна; • Наличие общих методов оптимизации вычислительного приложения при его работе на центральном процессоре (ЦП) вычислительного узла и на ускорителе со стандартной архитектурой, аналогичной архитектуре ЦП, во многих случаях возможно использование существующего программного кода с минимальной модификацией; • Полная интеграция используемых средств разработки для Intel MIC со средствами разработки для вычислительного узла, с теми же самыми возможностями для оптимизации, отладки и профилировки вычислительного приложения, при этом используется практически тот же самый компилятор, библиотеки, утилиты, что и при разработке приложения для ЦП; • При этом используемые в качестве основного средства разработки программные продукты Intel Parallel Studio XE [4] предоставляют одни из наиболее эффективных средств оптимизации приложений для всех целевых архитектур. Основным принципом оптимизации приложения при исполнении его на ЦП совместно с ускорителями Intel Xeon Phi, является эффективное распределение параллельных вычислительных потоков между небольшим количеством относительно высокопроизводительных ядер/потоков ЦП и большим количеством менее производительных ядер/потоков ускорителей. При этом желательно учитывать особенности всех используемых архитектур и максимально задействовать дополнительные возможности, предоставляемые блоками SIMD (англ. single instruction, multiple data - одиночный поток команд, множественный поток данных), особенно в случае сопроцессоров Intel Xeon Phi, поддерживающих SIMD разрядностью 512 бит (KNC SIMD) и т.п. Базовые возможности средств разработки Intel Parallel Studio XE позволяют реализовать в виде единого исполняемого файла общее универсальное вычислительное приложение, изначально оптимизированное подо все необходимые архитектуры и прозрачно для пользователя использующее все архитектурные возможности вычислительного узла. Сопроцессоры с архитектурой Intel MIC позволяют использовать различные архитектурные модели вычислительного приложения - выгрузка части исполняемого приложения на сопроцессор (англ. offload), выполнение только на сопроцессоре (англ. co-processor only), симметричное выполнение на ЦП и сопроцессоре (англ. symmetric) и т.д., с использованием различных API - OpenMP (англ. open multi-processing, открытый стандарт многопроцессорной обработки), MPI (англ. message passing interface, интерфейс 107
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz