НАУЧНО-ИССЛЕДОВАТЕЛЬСКАЯ РАБОТА программирование графического процессора с использованием программно-аппаратной технологии CUDA

14.03.2014

НАУЧНО-ИССЛЕДОВАТЕЛЬСКАЯ РАБОТА программирование графического процессора с использованием программно-аппаратной технологии CUDA

Сегодня в период быстрого развития компьютерных технологий возрастает и количество задач, связанных с обработкой больших массивов данных. Для обработки большого количества информации на ряду со стандартными инструментами обработки данных применяются графические процессоры. Графический процессор был изначально предназначен для построения сцен из множества графических примитивов, причем построение различных объектов сцены выполнялось независимо друг от друга, что давало возможность выполнять задачи построения параллельно. Для этого в GPU (Graphics Processing Unit) используется множество так называемых потоковых процессоров, количество которых у современного графического процессора достигает нескольких сотен. Проведение вычислений, на графическом устройстве, позволяет освободить центральный процессор. Многие процессы, при распараллеливании, выполняются во много раз быстрее. Новые центральные процессоры имеют от 1 ядра до 8 и поддерживают параллельность. На видеокартах нового поколения, имеется более 300 графических ядер, поэтому распараллеливание процессов на видеокартах, гораздо выгоднее. Исходя из выше сказанного, целью работы является изучение принципов параллельного программирования, решение задач с помощью параллельных алгоритмов и сравнение эффективности параллельного и последовательного алгоритмов решения задачи. Для решения поставленных целей были сформированы задачи 1. Рассмотреть возможности центрального процессора. 2. Рассмотреть возможности видеокарты. 3. Рассмотреть пример алгоритма, который хорошо поддаётся распараллеливанию. 4. Использовать данный алгоритм на центральном процессоре без распараллеливания и на видеокарте с использованием параллельного программирования.
Результат: Рассмотренный алгоритм умножения одной матрицы на другую, показал, что использование параллельного алгоритма на видеокарте, даёт значительное преимущество во времени исполнения программы. В обоих случаях, с увеличением размерности матриц, повышается время исполнения программ, однако распараллеленная на графическом устройстве программа, значительно быстрее выполняется. В случае размерности матриц 1000*1000, скорость выполнения была примерно в 5 раз выше, чем на центральном процессоре. Отрицательной стороной при параллельном вычислении на видеоадаптере, является то, что при размерности матрицы 3000 и выше, драйвер видеокарты не выдерживает нагрузку и отключается. Решением данной проблемы, является использование специализированных видеокарт для неграфических расчётов общего назначения, таких как NVidia Tesla, NVidia Quadro и другие.

Год работы: 2013
Конкурсант: Пономаренко Елена Александровна
Страна: Республика Казахстан
Область: Костанайская область
Название УЗ (рус): Костанайский государственный университет имени А.Байтурсынова
Участник нац.финала: Да
Место Нац.Финал: 1
Участник международного финала: Да
Место международный финал: 3
Количество проголосовавших: 5
Рейтинг: 3.75
Сумма оценок: 25

Повернення до списку