Интегрирование уравнения Пуассона с использованием графического процессора технологии CUDA
Евстигнеев Н.М.

Рассмотрена параллельная реализация циклического многосеточного метода, решающего краевую задачу для уравнения Пуассона в R3 на графических процессорах с применением платформы NVIDIA CUDA. Выполнено сопоставление результатов расчета задач на графическом процессоре с аналитическим решением краевой задачи Дирихле и с численным решением на ЦПУ смешанной краевой задачи. Сопоставление скорости расчета на видеокарте NVIDIA GeForce 8800 GTX со скалярной версией на процессоре AMD Athlon 64X2 4800+ показало ускорение до 200 раз для дискретной области в 1 000 000 элементов, а сопоставление с рабочей станцией на двух четырехъядерных процессорах Intel(R) Xeon(R) 2.33ГГц показало ускорение в 40 раз. Работа поддержана РФФИ (коды проектов 08–07–00074а и 06–07–89047а) и программой ОНИТ РАН (проект 1.12).

Ключевые слова: уравнение Пуассона, циклический многосеточный метод, параллельные вычисления, графические процессоры, технология CUDA

Н.М. Евстигнеев, cт. науч. сотр., e-mail: evstigneevNM@yandex.ru - Институт системного анализа РАН, просп. 60-летия Октября, 9, 117312, Москва