Еще относительно недавно у нас в университете проходил Software Freedom Day, где в числе выступающих я рассказывал, прерываясь на демонстрации красочного видео, о существовании архитектуры CUDA от NVIDIA, позволяющей загрузить GPU неграфическими вычислениями.
И вот в эту среду прошел семинар "Неграфические вычисления на графических процессорах", в рамках которого довелось рассказать о практике программирования с применением CUDA. Удалось рассмотреть довольно интересный вопрос оптимизации доступа к памяти GPU, предварительно предоставив материал справочного характера, необходимый для восприятия практических примеров.
Приемы оптимизации рассматривались на задаче решения СЛАУ на нейронной сети. Всего было приведено 3 реализации - базовая неоптимизированная, оптимизированная с применением разделяемой памяти, и, наконец, оптимизированная с использованием как разделяемой, так и текстурной памяти.
Презентации к обеим событиям и примеры (решение с подробными комментариями) доступны по приведенным выше ссылкам.
Комментариев нет:
Отправить комментарий