15
CUDA ® АЛЬМАНАХ ИЮНЬ 2016

CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA® АЛЬМАНАХИЮНЬ 2016

Page 2: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 2

СОДЕРЖАНИЕ

НОВОСТИ NVIDIA CUDA

Платформа для разработчиков NVIDIA Jetson TX1 доступна для заказа в компании ЭЛТЕХ

Спустя 70 лет после завершения «Проекта Манхэттен» супервычисления помогаютв очистке радиоактивных отходов

Стэнфордский робот «Jackrabbot» изучает особенности поведения пешеходов

Конкурс по распознаванию категории объявления Avito-2016

ВЕБИНАРЫ НА АНГЛИЙСКОМ ЯЗЫКЕ

НАУЧНЫЕ РАБОТЫ С ИСПОЛЬЗОВАНИЕМ ВЫЧИСЛЕНИЙ НА CUDA

Программное обеспечение микротомографа считает модель на CUDA

Быстрый кодек JPEG на CUDA

ПОЛЕЗНЫЕ РЕСУРСЫ ПО CUDA

КОНТАКТЫ

3

4

6

7

8

9

9

12

14

15

Page 3: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 3

ПЛАТФОРМА ДЛЯ РАЗРАБОТЧИКОВ NVIDIA JETSON TX1 ДОСТУПНА ДЛЯ ЗАКАЗА В КОМПАНИИ ЭЛТЕХКомпания ЭЛТЕХ начала прием заказов на платформу разработчика NVIDIA Jetson TX1.

Платформа для разработок Jetson TX1 - это полнофункциональная платформа визуальных вычислений для разработки приложений. Она создана для работы в Linux-окружении, поддерживает стандартные API и совместима со всеми пакетами инструментов NVIDIA. Плата оснащена разнообразными интерфейсами, что позволяет ей быть гибкой, расширяемой платформой. Это делает платформу идеальным решением с низким энергопотреблением для разработки приложений, требующих большой вычислительной мощности.

NVIDIA® Jetson™ TX1 - модульный суперкомпьютер размером с кредитную карту. Он построен на базе новой архитектуры NVIDIA Maxwell™, имеет 256 ядер NVIDIA CUDA®, 64-битный CPU и непревзойденную энергоэффективность. Платформа поддерживает передовые технологии глубокого обучения (Deep Learning), машинного зрения и вычислений на GPU, что делает ее идеальным решением для разработки широкого ряда приложений для встраиваемых систем.

Рис.1. Платформа разработчика NVIDIA Jetson TX1

Платформа разработчика NVIDIA Jetson TX1 включает:

o Основную плату Jetson TX1o Процессорный модуль Tegra TX1o NVIDIA Maxwell GPU с 256 ядрами CUDAo 4-х ядерный процессор ARM® Cortex-A57o 4 Гб памяти LPDDR4o 16 Гб eMMC 5.1 флеш-памятиo Подключение к сети Wi-Fi 802.11ac и устройствам с поддержкой Bluetootho Порты 10/100/1000BASE-T Etherneto Сетевой адаптер и сетевой шнур питанияo Набор кабелей USB o Антенны для подключения к устройствам с поддержкой Wi-Fi

Артикул платформы разработчика NVIDIA Jetson TX1 в интернет-магазине компании Элтех 945-82371-0018-000.

Артикул процессорного модуля NVIDIA Jetson TX1 в интернет-магазине компании Элтех 900-82180-0001-000.

Платформа разработчика NVIDIA Jetson TK1 остается доступной в интернет-магазине компании Элтех под номером 940-7R375-0001-000

НОВОСТИ NVIDIA CUDA

Page 4: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 4

СПУСТЯ 70 ЛЕТ ПОСЛЕ ЗАВЕРШЕНИЯ «ПРОЕКТА МАНХЭТТЕН» СУПЕРВЫЧИСЛЕНИЯ ПОМОГАЮТ В ОЧИСТКЕ РАДИОАКТИВНЫХ ОТХОДОВ

Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы, оставшиеся после «Проекта Манхэттен», до сих пор ожидают очистки.

В самом крупном хранилище США - Хэнфордский комплекс (на юго-востоке Вашингтона), процесс очистки отходов протекает очень медленно. Он является очень дорогостоящим и сопровождается многочисленными проблемами.

Очистка радиоактивных отходов - это невероятно сложный процесс. Он напоминает сортировку песчинок на пляже. Но отделить радиоактивные элементы от остальных отходов не достаточно. Одни элементы сохраняют радиоактивность тысячи лет, другие - сто лет. Ученым необходимо отделить их друг от друга, чтобы обеспечить безопасное хранение.

Эта работа настолько сложна, что некоторые методы очистки отходов еще предстоит изобрести.

В настоящий момент команда ученых использует суперкомпьютер с ускорением на GPU, чтобы лучше понять, какие радиоактивные материалы находятся в резервуарах хранилища, и найти безопасные и недорогие способы их извлечения и хранения.

«Когда разрабатывали атомное оружие, никто не знал, насколько эти материалы опасны», - рассказал Дэвид Диксон (David Dixon), профессор химии из Университета Алабамы, ведущий исследователь проекта.

Супервычисления ускоряют проведение экспериментов

Конструкция резервуаров для хранения РАО с двойными стенками, которые заменят более подверженные повреждениям резервуары с одинарными стенками, в Хэнфордском хранилище.

Ученые используют один из самых мощных в мире суперкомпьютеров, Titan, установленный в национальной лаборатории Оук-Ридж, для изучения химических свойств радиоактивных элементов под названием актиноиды. К ним относятся уран, плутоний и другие металлы, которые выделяют огромное количество

Page 5: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 5

Актиноиды - это высокорадиоактивные материалы, из-за чего работа с ними в лаборатории затруднена. Однако их необходимо отделить от других отходов, прежде чем их можно будет дезактивировать.

С помощью Titan ученые могут проводить симуляции химических реакций актиноидов на различные методы их извлечения из общей массы отходов. Эта работа призвана помочь исследователям разработать новые способы дезактивации радиоактивных отходов.

Сложности очистки радиоактивных отходов

Сегодня на территории комплекса в старых контейнерах хранится более 56 миллионов галлонов высокорадиоактивных, химически опасных отходов. Треть из этих контейнеров протекает. Одни отходы закопаны в землю, другие - выброшены на свалку и просачиваются в окружающую среду. Другие хранилища радиоактивных отходов расположены в Лос-Аламосе, Нью-Мексико и Сент-Луис.

По словам Диксона, проблема заключается в том, что ученые не знают точно, что находится внутри резервуаров или в почве. Им не хватает знаний о химических свойствах актиноидов. Некоторые из отходов, найденные в Хэнфордском хранилище, уникальны по своим свойствам, и ученым приходится создавать новые методы их очистки, прежде чем приступать к работе.

Национальная лаборатория Оук-Ридж переходит на суперкомпьютер нового поколения, и Диксон заявляет, что его команда будет оптимизировать свое программное обеспечение, чтобы максимально использовать возможности GPU.

«Мы хотим получить надежные прогнозы относительно сложных феноменов, а это требует большого объема вычислений», - сказал Диксон. Реализация большей части своего кода на GPU позволит ученым моделировать более крупные и сложные системы.

энергии при расщеплении атомов. Оснащенный графическими ускорителями NVIDIA Tesla, суперкомпьютер Titan обеспечивает скорость, необходимую для проведения множества экспериментов в сжатые сроки.

Page 6: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 6

СТЭНФОРДСКИЙ РОБОТ «JACKRABBOT» ИЗУЧАЕТ ОСОБЕННОСТИ ПОВЕДЕНИЯ ПЕШЕХОДОВУченые из Лаборатории компьютерного зрения в Стэнфордском университете разработали робота, который вскоре сможет автономно перемещаться в толпе, следуя человеческим правилам этикета, например, уступая дорогу другим пешеходам.

Используя графический ускоритель Tesla K40 и CUDA для тренировки моделей машинного обучения, робот способен понимать, что происходит вокруг, и перемещаться по улицам и коридорам среди людей. Со временем он учится неписаным правилам поведения в общественных местах.

«Изучая социальные условности, робот может стать частью экосистемы, где человек и робот сосуществуют», - сказал Сильвио Саварезе (Silvio Savarese), доцент компьютерных наук и директор Лаборатории компьютерного зрения в Стэнфорде.

По оценкам исследователей, уже через пять-шесть лет подобные роботы будут доступны на рынке по цене всего лишь $500.

«Эти роботы могут быть использованы для доставки товаров в студенческом городке или для оказания помощи людям,потерявшимся в незнакомом общественном месте, например, на железнодорожном вокзале или в аэропорту», - рассказал Саварезе.

Читать более подробно >

Page 7: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 7

Узнать подробнее.

КОНКУРС AVITO-2016: РАСПОЗНАВАНИЕ КАТЕГОРИИ ОБЪЯВЛЕНИЯКонкурс по распознаванию категории объявления Avito-2016 — это конкурс по решению прикладной задачи из области анализа изображений и текстов, проводимый при информационной поддержке 11-й Международной конференции «Интеллектуализация обработки информации».

Описание задачи

По правилам Avito при создании объявления пользователь должен указать категорию объявления. При этом, любой человек с весьма хорошей точностью сможет определить категорию по изображению товара, заголовку, текстовому описанию и цене объявления.

Цель конкурса – создание эффективного алгоритма определения категории объявления.

Конкурс состоит из трех последовательных этапов. На каждом этапе участникам предстоит решать задачу определения категории объявления, при этом набор признаков объявлений будет постепенно расширяться. На каждом последующем этапе зарегистрированным участникам будут доступны как дополнительные данные так и методы победителей предыдущего этапа. Для помощи в решении первого этапа всем зарегистрированным участникам будет предоставлена методика победителя предыдущего конкурса, в котором требовалось построить алгоритм распознавания марки и модели автомобиля по его изображению.

Ниже приведены примеры фотографий, заголовков, описаний и цен продаваемых товаров.

Page 8: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 8

ВЕБИНАРЫ НА АНГЛИЙСКОМ ЯЗЫКЕ Приглашаем вас на вебинар: Building Better Autonomous Machines with Jetson and Jetson’s Ecosystem 14 июля. Регистрация.

Последние записи на английском языке:

Catch Up On CUDA by Acceleware

Real time, Low Latency Feature Tracking with ArrayFire

More Science, Less Programming with OpenACC

Deep Learning Courses

Page 9: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 9

НАУЧНЫЕ РАБОТЫ С ИСПОЛЬЗОВАНИЕМ ВЫЧИСЛЕНИЙ НА CUDAПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ МИКРОТОМОГРАФА СЧИТАЕТ МОДЕЛЬ НА CUDA

Подробнее

Сотрудники Томского государственного университета разработали цифровой рентгеновский микротомограф, позволяющий рассмотреть внутреннее строение веществ и предметов с точностью до микрона. ПО для прибора создали сотрудники Центра разработки программного обеспечения EDISON.

Масса микротомографа — 450 кг, ширина — 99 см, глубина — 50 см, высота — 1,5 м.

В статье описаны основные алгоритмы и технологии, использованные при разработке и отладке программного обеспечения.

Рис. 1 Внешний вид

Разработка

Обратное преобразование Радона было адаптировано к задаче, ведь в теории на объект светит пучок рентгеновских лучей, а на практике источник света точечный. Поэтому координаты были переведены из конической системы в прямоугольную.

На этом этапе вычислений была произведена нормализация проекций. Цель — приглушить шумы на проекциях и сделать плотности более явными.

Page 10: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 10

Для разработки ПО были использованы алгоритмы полигонизации 3D-модели, создана специальная библиотека для объемно-воксельного рендеринга и сохранены объемные данные в формате октодеревьев. На стадии отладки был создан собственный 12-битный формат для хранения изображений с оттенками серого.

Для просмотра результатов сканирования в 3D-редакторах применялся алгоритм «Марширующие кубы», который проходит скалярное поле, при каждой итерации просматривает восемь вершин куба, параллельного осям координат. Далее алгоритм определяет полигоны, образующие заданную изоповерхность, которая проходит через данный куб. Полигоны выводятся на экран.

Матричный фильтр Гаусса обрабатывает изображения, используя матрицу свертки. Последняя также носит название матрицы конволюции и является фильтром, через который проходит изображение. Для использования фильтра следует точка за точкой пройти изображение. Пиксели являются центральными элементами матриц и рассматриваются вместе с ними. Затем необходимо перемножить соответствующие значения двух матриц, найти их сумму и присвоить полученное значение рассматриваемой точке. Фильтр сглаживает проекции срезов. Таким образом, улучшается качество создаваемых 3D-моделей.

Трехмерный пиксель носит название «воксель». Объемно-воксельный рендеринг применялся для просмотра моделей. Области просмотра масштабируются, и секущая плоскость располагается под разными углами. С помощью секущей плоскости можно получить изображение среза с разрешением 1 микрометр.

Октодерево — структура данных, где каждый внутренний узел имеет восемь «потомков». Октодерево позволяет отображать данные в режиме предварительного просмотра в случае, если нет необходимости в данных, которые не видны пользователю.

Отладка

Оптимизация иногда занимает времени больше, чем разработка. Задача этапа — сократить время построения трехмерной модели до 2 часов. В микротомографе используется камера PIXIS-XF:2048B. Для каждого объекта томограф делает 360 снимков, разрешение одного снимка — до 8000х8000. Отладка производилась на полученных с томографа проекционных снимках.

Сгенерированная модель должна иметь размеры 8000x8000x20000. Ширина и глубина 8000 означают, что камере доступна лишь часть изображения, однако реконструируется большая область. В итоге по краям реконструкции качество снижено. Во избежание этого столик перемещается по высоте, производя новые реконструкции, результаты которых склеиваются.

В первой версии ПО входные данные содержали изображения в формате TIFF с 16-битным кодированием оттенков серого. Указанная глубина цвета оказалась избыточной и замедляла расчеты. Однако 8-битная глубина давала размытое изображение. Поэтому мы выбрали глубину цвета в 12 бит.

Page 11: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 11

В первой версии ПО входные данные содержали изображения в формате TIFF с 16-битным кодированием оттенков серого. Указанная глубина цвета оказалась избыточной и замедляла расчеты. Однако 8-битная глубина давала размытое изображение. Поэтому мы выбрали глубину цвета в 12 бит.

Задача реконструкции 3D-модели делится на небольшие задания, распределяемые центральным модулем программы по сети серверов в кластере. На серверах используется программно-аппаратная архитектура параллельных вычислений CUDA, которая реконструирует объёмные данные из проекций и ускоряет вычисления с помощью графических процессоров NVIDIA.

Решение аналогичной задачи на CPU заняло бы меньше времени при разработке, но продукт работал бы гораздо медленнее. В итоге, с помощью CUDA необходимое для расчета одной модели время уменьшается пропорционально числу серверов в кластере, поскольку вычислительные задачи отлично распараллеливаются, и все серверы полностью загружены. Программное обеспечение для микротомографа поддерживает научную карту NVIDIA Tesla K80 24GB и игровую EVGA GeForсe GTX TITAN на 12GB.

Для кроссплатформенности единый исходный код написан на C++/Qt, и программное обеспечение собрано под разные операционные системы: Microsoft Windows XP/Vista/7, Linux.

Page 12: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 12

БЫСТРЫЙ КОДЕК JPEG НА CUDA

Подробнее

В 2011 компанией Фаствидео был создан первый в мире кодер JPEG на CUDA, в котором все стадии алгоритма JPEG выполнялись исключительно на видеокарте. Такой подход дал возможность получить производительность кодирования, недоступную для многопоточных и хорошо оптимизированных кодеков JPEG на CPU. С тех пор прошло уже 5 лет и в течение этого времени кодек JPEG от Фаствидео был и остаётся самым быстрым в мире.

Алгоритм JPEG всегда считался последовательным и долгое время многие полагали, что его нельзя распараллелить, поэтому большинство попыток его частичного распараллеливания предпринимались для ускорения стадии дискретного косинусного преобразования (DCT), а энтропийный кодек всегда делали на CPU. Нужно признать, что JPEG - это действительно последовательный алгоритм. Тем не менее, способ его параллельной реализации есть, причём не только для стадии DCT. Для кодирования по алгоритму JPEG картинка разбивается на блоки 8х8 или 16х16 в зависимости от схемы прореживания, а в этом и состоит основная идея: параллельным образом обрабатывать нужно независимые блоки небольшого размера, а внутри каждого блока по-прежнему придётся последовательно пройти все стадии стандартного алгоритма JPEG. Естественно, распараллеливание каждой стадии по отдельности тоже имеет смысл. Для больших изображений количество блоков является достаточным для максимальной загрузки видеокарты, а для маленьких картинок имеет место уменьшение производительности по причине недостаточного количества входных данных.

При обсуждении времени работы алгоритма сжатия будут приведены результаты для измерений времени работы на видеокарте без учёта загрузки и выгрузки данных. Этот подход имеет смысл при организации сложных вычислительных систем, когда все расчёты делаются на видеокарте и для большинства компонент начальные и конечные данные уже находятся в памяти видеокарты. Также существуют методы копирования данных в видеокарту и обратно одновременно с вычислениями, поэтому обсуждение производительности в терминах времени работы алгоритма именно на видеокарте вполне оправдано. Все измерения сделаны с помощью NVIDIA Visual Profiler. Алгоритм JPEG подразумевает базовый вариант, т. е. 8 бит на канал, стандартные таблицы квантования и Хаффмана, без арифметического кодирования и без прогрессивного режима.

Page 13: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 13

Скорость кодирования в JPEG на CUDA за последнее время выросла значительно и теперь примерно за 0,78 мс на видеокарте NVIDIA GeForce GTX 1080 можно сжать в 10 раз (качество 90%) 24-битную картинку формата 4К с дискретизацией 4:2:0, что соответствует производительности кодирования порядка 30 ГБайт/с. Для изображений формата 8К скорость сжатия при аналогичных параметрах может достигать 45-50 ГБайт/с. Поэтому при правильной организации потоковой обработки данных можно очень быстро сжимать и серии картинок небольшого размера.

С одной стороны, это заслуга NVIDIA, которая выпускает все более быстрые видеокарты. С другой, это результат глубокой оптимизации алгоритма JPEG на CUDA. Были оптимизированы все стадии алгоритма по отдельности, и теперь по-максимуму применяются разделяемая память и регистры. Используемая кодеком память, которая требуется для его нормальной работы, теперь не превышает десятикратного размера исходного несжатого изображения. Кроме того, время пересылки несжатого изображения формата 4К из оперативной памяти через PCI-Express x16 (Gen3) в эту видеокарту равно 2,17 мс. Получаем интересный результат: сжатие в JPEG теперь можно сделать в два с половиной раза быстрее по сравнению со скоростью копирования несжатых данных через PCI-Express x16. Скорость декодирования в этом кодеке пока сильно отстаёт от скорости кодирования, а аналогичную 4К картинку можно декодировать за 2,7 мс, но это тоже очень быстро.

Такая высокая производительность кодека JPEG нужна в тех случаях, когда есть большие массивы изображений или потоки кадров. Для сохранения в JPEG одиночных изображений в графическом редакторе такая скорость не нужна, хотя режим пачки вполне востребован. Быстрым кодированием и декодированием в основном интересуются разработчики приложений для визуализации 3D и VR, потому что удобно хранить исходные данные в виде джипегов, копировать их в видеокарту, а уже там делать быстрое декодирование и вывод на монитор или на очки через OpenGL. Таким образом, можно добиться высокой частоты кадров при большом разрешении, например 100-120 к/с для 12-мегапиксельных изображений. Важным условием быстрого декодирования является наличие внутри джипегов необходимого количества рестарт-маркеров, которые позволяют достигать высокой степени распараллеливания при декодировании. Без этих рестарт-маркеров скорость декодирования JPEG падает на порядок или даже больше. Кодек CUDA JPEG ставит эти маркеры по умолчанию, но их также можно добавлять в оффлайне с помощью утилит типа jpegtran, после чего станет возможной быстрое декодирование джипегов на видеокарте.

Для работы с современными видеокамерами был реализован на CUDA и 12-битный кодер JPEG, который тоже имеет очень высокую производительность. Он сжимает 12-битную картинку 4К с качеством 90% и дискретизацией 4:2:0 на видеокарте GeForce GTX 1080 за 1,2 мс. Для большинства промышленных и скоростных камер диапазон в 12 бит покрывает основные потребности, а высокая производительность сжатия позволяет решать массу задач в реальном времени даже при очень высокой частоте кадров.

Кодек JPEG на CUDA является составной частью Fastvideo SDK, куда также входят демозаик, ресайз, шумодав, луты и пр. Фактически, это набор быстрых алгоритмов для обработки RAW данных на видеокарте. Эти решения работают на всех видеокартах NVIDIA, в том числе и на мобильных Tegra K1 и Tegra X1. В ближайшее время ожидается релиз программы Fast CinemaDNG Processor для реалтайм обработки RAW данных на CUDA, а также кодек JPEG2000 и новый высококачественный демозаик.

Page 14: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 14

ПОЛЕЗНЫЕ РЕСУРСЫ ПО CUDA

Группа вконтакте: www.vk.com/nvidiacuda

Новый каталог с более 400 приложениями, ускоряемыми на GPU можно скачать по ссылке.

Материалы GPU Technology Conference 2015 доступны по ссылке

Форум Разработчиков NVIDIAприсоединяйтесь к Форуму CUDA-разработчиков, делитесь своим опытом и узнавайтемного нового. http://devtalk.nvidia.com/

Документация по CUDAСо списком документации по CUDA можно ознакомиться здесь.

Обучение онлайнUdacity | Coursera | Курс на русском языке

Библиотеки с поддержкой GPU ускоренияСписок библиотек с поддержкой GPU ускорения от NVIDIA и партнеров.

GPU Тест-Драйв Хотите бесплатно протестировать Tesla? Зарегистрируйтесь здесь.

Ускоряйте научные приложения с OpenACCПротестируйте компилятор PGI OpenACC бесплатно в течение месяца. Подробнее.

Книги, посвященные CUDA и вычислениям на GPUСо списком книг, посвященных CUDA и вычислениям на GPU, можно ознакомиться здесь.

СкачайтеCUDA http://developer.nvidia.com/cuda-downloads Nsight http://www.nvidia.com/object/nsight.html

Page 15: CUDA АЛЬМАНАХ ИЮНЬ 2016 · Спустя более 70 лет после окончания Второй мировой войны радиоактивные отходы,

CUDA АЛЬМАНАХ / ИЮНЬ 2016 15

КОНТАКТЫ

Если вы хотите, чтобы ваша статья

появилась в следующем выпуске

CUDA Альманах пишите нам на:

Лидия Андреева

[email protected]

По вопросам приобретения NVIDIA GPU и

по прочим техническим

вопросам пишите нам на:

Антон Джораев

[email protected]