Труды КНЦ вып.9 (ГЕЛИОГЕОФИЗИКА вып. 5/2018(9))
интенсивности излучения на каждой высоте для заданного угла рассеяния и модельного канала. Данный алгоритм позволяет хранить двумерные массивы коэффициентов метода прогонки в shared памяти, а одномерный массив значений индикатрисы рассеяния - в регистровой памяти (самой быстрой). Результатом расчетов является трехмерный массив значений интенсивности излучения, одно измерение которого - по зенитным углам, другое - по высоте и третье - по модельным каналам. Оценка быстродействия Авторами данной работы был создан комплекс программ, в котором реализованы описанные выше алгоритмы. Этот комплекс программ был реализован как на центральном процессоре с использованием технологии распараллеливания OpenMP, так и на видеокартах NVIDIA с использованием технологии CUDA. Таблица 1. Машинное время, затраченное на расчет собственного излучения атмосферы Земли в диапазоне частот от 10 до 2000 см-1в интервале высот от поверхности Земли до 76 км Название устройства Время расчетов, сек IntelCore i7 (с использованием 8-ми потоков и OpenMP) 840 NVIDIA GTX Titan 45 NVIDIA GTX 1080 20 NVIDIA GTX 1080 Ti 15 Для оценки производительности были проведены расчеты поля собственного и солнечного излучения атмосферы Земли, как на центральном процессоре, так и на графических ускорителях фирмы NVIDIA. Для проведения тестовых расчетов использовался четырех ядерный центральный процессор IntelCore i7, с возможностью запуска восьми параллельных потоков, а также видеокарты NVIDIA GTX Titan, NVIDIA GTX 1080 и NVIDIA GTX 1080 Ti. В таблице 1 представлено машинное время, затраченное на расчет собственного излучения атмосферы Земли в диапазоне частот от 10 до 2000 см-1в интервале высот от поверхности Земли до 76 км. Как можно видеть, скорость расчетов на видеокартах NVIDIA GTX 1080 и NVIDIA GTX 1080 Ti существенно выше (более чем в 40 раз) скорости расчетов на центральном процессоре IntelCore i7, использующем 8 потоков и технологии распараллеливания OpenMP. Скорость расчетов на видеокарте NVIDIA GTX Titan, примерно в 2,5 раза ниже скорости расчетов на видеокарте NVIDIA GTX 1080, что объясняется архитектурой этих видеокарт. При этом результаты расчетов на видеокартах и на центральном процессоре сравнимы с относительной погрешностью 10-4 - 10-5, что позволяет делать вывод о том, что по точности видеокарты почти не уступают центральному процессору, а по скорости существенно его опережают. Заключение Расчет поля теплового и солнечного излучения в атмосферах Земли и других планет является очень требовательной к вычислительным ресурсам задачей. Авторами данной работы были реализованы алгоритмы решения этой задачи для земной атмосферы с использованием графических ускорителей фирмы 190
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz