20
CUDA © альманах Февраль 2014

CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

CUDA© альманахФевраль 2014

Page 2: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

2CUDA АльмАнАх / ФеврАль 2014

Содержание

Что такое CUDA альманах? 3

новоСти NVIDIA CUDA 4Школа-тренинг по технологиям программирования графических процессоров 11-14 марта 2014 в г. Новосибирск 4

Моделирование тепловых процессов в грунтах: NVIDIA Tesla K20 против Intel Core i7 5

CUDA 6 RC + Maxwell — теперь в открытом доступе 6

PGI 2014 обеспечивает новый уровень производительности и простоты программирования в ВПВ 7

Графические технологии в поисках настоящей любви 8

Предложения от NVIDIA 9Вебинары на английском языке 9

Ускоряйте ваши научные приложения с OpenACC 10

Проведите тест-драйв ускорителя Tesla K20/K40 GPU 11

науЧные работы С иСПользованием выЧиСлений на CUDA 12

Three-dimensional LBE simulations of a decay of liquid dielectrics with a solute gas into the system of gas–vapor channels under the action of strong electric fields // A.L. Kupershtokh 12

Моделирование процессов розлива нефтепродуктов по водной поверхности с использованием суперкомпьютеров с графическими ускорителями // И.А. Малый, О.В. Потемкина, С.Г. Сидоров, А.С Мочалов, В.В. Неткачев, И.Ф. Ясинский, Ф.Н. Ясинский 13

Смещенное решение интегрального уравнения освещенности на GPU в рендер- системе Hydra // В.А. Фролов, В.В. Санжаров, А.С. Груздев, В.А. Галактионов 14

Численное моделирование процессов распространения упругих волн в блочных средах с тонкими прослойками на многопроцессорных вычислительных системах // М. П. Варыгина 15

Real time object tracking algorithm // B. A. Zalesky, E. N. Seredin 16

ваканСии CUDA 17

контакты и Полезные ССылки 20

Page 3: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

3CUDA АльмАнАх / ФеврАль 2014

Что такое CUDA альманах?

CUDA АЛЬМАНАХ — это периодическое издание от NVIDIA, содержащее научные работы, в которых используется архитектура паралельных вычислений CUDA.

CUDA используется в различных областях, включая обработку видео и изображений, вычислительную биологию и химию, моделирование динамики жидкостей, восстановление изображений, полученных путем компьютерной томографии, сейсмический анализ, трассировку лучей и многое другое.

Приложения, базирующиеся на архитектуре CUDA, можно разрабатывать на различных языках и aPi, включая C, C++, Fortran, OpenCL и directCompute. Архитектура CUDA подразумевает сотни ядер, способных исполнять тысячи параллельных потоков, а модель программирования CUDA позволяет программистам сосредоточиться на распараллеливании своих алгоритмов.

Архитектура CUDA текущего поколения под названием Kepler — это самая передовая архитектура вычислений на GPU. Построенные на свыше семи миллиардов транзисторах, GPU Kepler делают универсальными вычисления на GPU и CPU для широкого спектра вычислительных приложений. Поддержка C++ упрощает разработку ПО для параллельных вычислений и повышает производительность широчайшего спектра приложений.

Всего за несколько лет вокруг архитектуры CUDA возникла целая экосистема программного обеспечения — от различных языковых решений до широкого спектра библиотек, компиляторов и связующего ПО, которые помогают пользователям оптимизировать приложения для GPU. Разнообразие оптимизированных программных средств ускоряет научные открытия и расчет моделей во многих областях, включая математику, бионауки и производство.

Подробнее

Архитектура параллельных вычислений CUDA с комбинацией ПО и аппаратной части.

библиотеки и промежуточное По

архитектура Параллельных выЧиСлений CUDA на NVIDIA GPU

Приложения иСПользуЮЩие GPU

C

C++

FortrAN

Direct

Compute

Java andPhythonInterface

openCL

языковые решения API на уровне устройств

Page 4: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

4CUDA АльмАнАх / ФеврАль 2014

новости NVIDIA CUDA

Школа-тренинг По технологиям Программирования граФиЧеСких ПроцеССоров 11-14 марта 2014

11-14 марта в Новосибирском Академгородке пройдет конференция о текущем состоянии и перспективах развития GPU-технологий для высокопроизводительных вычислений, а также школа по углубленному изучению технологий программирования GPU.

Организаторы: ИВМиМГ СО РАН, NVIDIA, Учебный центр по технологии CUDA НГУ.

место проведения школы:г. Новосибирск, Академгородок, проспект ак. Лаврентьева, 6, ИВМиМГ СО РАН.

В первый день школы, 10 марта, пройдет Конференция с участием приглашенных специалистов NVIDIA, HP, Softline, Cadfem, которые прочитают серию научно-популярных и обучающих лекций о текущем состоянии и перспективах развития GPU-технологий для высокопроизводительных вычислений.

Программа конференции и школы опубликована на странице.

Участие в школе и конференции бесплатное, регистрация обязательна.

На школе будут рассмотрены вопросы профилирования, отладки, оптимизации кода на CUDA, применения технологии OpenACC. Практическая часть занятий школы пройдёт на гибридном расширении кластера НКС-30Т с GPU NVIDIA TESLA M2090.

Участникам школы будет предоставлен доступ к NVIDIA Kepler K40. От участников школы требуется знакомство с C/C++ и Linux. Школа ориентирована в первую очередь на пользователей ССКЦ.

Лектор — к.т.н. А.А. Романенко, НГУ, Учебный центр по технологии CUDA (CUDA Teaching Center).

Page 5: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

5CUDA АльмАнАх / ФеврАль 2014

В настоящее время моделирование тепловых процессов в грунтах необходимо при строительстве шахт, тоннелей, в том числе тоннелей метро, котлованов для возведения плотин, и строительстве других сооружений на слабых и водоносных грунтах, где применяют технологию искусственной заморозки грунта. Особенно актуально выполнение теплотехнических расчетов при проектировании зданий и различных сооружений, трубопроводов, автомобильных и железных дорог, возводимых на территории распространения многолетнемерзлых грунтов. Для решения этих задач компанией Simmakers был разработан программный комплекс Frost 3D, предназначенный для трехмерного моделирования тепловых процессов в грунтах с учетом фильтрации и теплового воздействия различных сооружений и охлаждающих устройств, термостабилизирующих грунт.

Решение таких тепловых задач осуществляется на многомиллионных сетках, поскольку масштаб области моделирования — сотни метров, где размерность некоторых элементов, таких, как теплоизоляционных материалов, труб охлаждающих устройств, — сантиметры, а прогноз необходимо выполнять на несколько лет. На практике такие расчеты можно выполнить только с использованием параллельных вычислений.

В настоящее время все большую популярность в области параллельных вычислений завоевывает технология GPGPU — использование графических ускорителей для вычислений общего назначения. В связи с этим компания Simmakers совместно с NVIDIA и Forsite провели исследование увеличения производительности вычислительных алгоритмов программы Frost3D при переносе распараллеленного расчетного механизма с CPU на GPU.

С целью исследования скорости вычислений на различных аппаратных средствах было создано несколько тестовых задач с различным размером расчетной сетки. Ниже на гистограмме представлено ускорение вычислений относительно Core i7, получаемое на различных графических процессорах для тестовых моделей с разными размерами расчетной сетки.

Подробнее

моделирование теПловых ПроцеССов в грунтах: NVIDIA tesLA K20 Против INteL Core I7

Page 6: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

6CUDA АльмАнАх / ФеврАль 2014

CUDA 6 rC + MAxweLL — теПерь в открытом доСтуПе

CUDA 6 Release Candidate выложена в открытый доступ для зарегистрированных разработчиков.

оСновные нововведения CUDA 6:

• Unified Memory: simplifies programming by enabling applications to access the CPU and GPU memory without the need to manually copy data.

• Drop-in Libraries: automatically accelerate the linear algebra and FFTs in your applications by replacing CPU-only libraries with GPU-accelerated libraries.

• Multi-GPU scaling: the re-designed BLAS GPU library automatically scales performance across up to 8 GPUs in a single node.

Статья о новой архитектуре Maxwell.

Для зарегистрированных разработчиков опубликованы следующие документы по новой архитектуре:

• Maxwell Tuning Guide • Maxwell Compatibility Guide

Page 7: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

7CUDA АльмАнАх / ФеврАль 2014

PGI 2014 обеСПеЧивает новый уровень ПроизводительноСти и ПроСтоты Программирования в вПв

В новой версии добавлена поддержка возможностей OpenACC 2.0 для графических ускорителей NVIDIA и AMD. Также она обеспечивает прирост производительности для систем на базе многоядерных x64 процессоров.

Доступный уже сегодня набор PGI® 2014 Compilers and Tools включает новые возможности для программирования недавно представленных графических ускорителей NVIDIA®  Tesla®  K40 с помощью версии 2.0 спецификаций параллельного программирования на базе директив OpenACC. Кроме того, он впервые получил поддержку OpenACC для GPU и APU AMD Radeon.

Ключевые особенности PGI 2014 Compilers and Tools:

• openACC 2.0 Features — Нативные компиляторы PGI Accelerator для Fortran 2003, C99 и C++ теперь поддерживают основные возможности OpenACC 2.0, включая стандартные директивы (процедурные обращения к ускорителям) и другие.

• новые расширения NVIDIA® CUDA® Fortran — Добавлена поддержка версии 5.5 платформы параллельного программирования NVIDIA CUDA, атомарные функции CUDA и отладка на устройстве с помощью Allinea DTT и TotalView из Rogue Wave.

• бесплатный PGI для os x — Компиляторы Fortran 2003 и C99 со всеми PGI оптимизациями для многоядерных x64 процессоров, отладка в командной строке и упрощенная онлайн-документация (доступность — февраль).

• Компиляторы PGI 2014 обеспечивают на 75% выше производительность в новейшем тестовом пакете SPEC® OMP2012 по сравнению с GCC на новейших многоядерных x64 процессорах Intel и AMD с поддержкой AVX. Набор компиляторов и инструментов PGI 2014 также включает полную поддержку Fortran 2003, дополнительные возможности Fortran 2008, обновленные библиотеки, поддержку новейших операционных систем и полноценный набор новых и обновленных примеров кодов и учебных материалов.

• Полный список возможностей PGI 2014 Compilers and Tools смотрите здесь.

Мы впечатлены возможностями PGI извлекать производительность из дискретных GPU и APU AMD с помощью OpenACC. Это поможет нам устранить оставшиеся преграды на пути к масштабному использованию ускорителей и отделить выбор модели программирования ускорителя от выбора самого ускорителя.”

Суреш Гопалакришнан, вице-президент и директор

по серверным решениям в AMD

Page 8: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

8CUDA АльмАнАх / ФеврАль 2014

граФиЧеСкие технологии в ПоиСках наСтояЩей лЮбви

История о том, как Крис МакКинли добыл доступ к женским анкетам на сайте знакомств OkCupid, в результате чего познакомился со своей нынешней невестой Кристиной Тиен Уэнг, некоторое время назад принесла нашему герою всемирную математическую славу.

Однако только недавно стало известно, что Крис использовал CUDA и GPU Tesla, чтобы произвести все необходимые расчеты для обретения настоящей любви. «Возможно, это выглядит уже как слишком… но я был перед компьютером один и устоять было просто невозможно», – рассказывает Крис.

Секретные козыри криСа

После окончания колледжа Крис присоединился к профессиональной команде по блэкджэку Массачусетского Технологического института, зарабатывая на жизнь благодаря своим отличным математическим способностям.

В данный момент, обучаясь в аспирантуре, он исследует кишечные микробиомы – разновидность живущих в нашем организме бактерий. Эта перспективная область, связанная с разработкой лекарств от многих болезней – от ожирения до рака.

Как выяснилось, если перенести полученные Крисом знания на область знакомств, то можно перещеголять даже самых искусных соблазнителей.

«При суперактивном подходе за вечер можно познакомиться с несколькими десятками девушек, – говорит Крис. – Но если войти в топ списка совместимости на сайте знакомств, ваш профиль окажется перед глазами у 20 – 25 тысяч женщин, причем именно тех женщин, которые ответили на вопросы анкеты схожим образом».

больШая моЩь открывает больШие ПерСПективы знакомСтв

Кэвин Пулсон из Wired первым рассказал историю о том, как с помощью пары серверов Mac Mini Крис обрабатывал анкеты женщин на сайте OkCupid, чтобы понять принцип подбора сервисом потенциально подходящих кандидатов.

Подробнее

Page 9: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

9CUDA АльмАнАх / ФеврАль 2014

Предложения от NVIDIA

март 11: CUDA 6 – Performance Overview, Jonathan Cohen, NVIDIA.

март 13: CUDA 6 – Drop-In Libraries, M. Ebersole, NVIDIA.

март 18: CUDA 6 – Unified Memory M. Ebersole, NVIDIA.

вебинары на английСком языке

Page 10: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

10CUDA АльмАнАх / ФеврАль 2014

беСПлатная лицензия от PGI на 30 дней

Получив доступ к бесплатной 30-дневной версии компилятора PGI, вы сможете воспользоваться вычислительными мощностями GPU и стандартом программирования OpenACC.

OpenACC — это:

• легкость: простота добавления директив в исходный код своей программы.

• открытость:  используйте единый исходный код как для CPU так и для GPU.

• мощность:  получите быстрый доступ к вычислительной мощности GPU.

ВеРСИЯ 2014 Уже ДОСТУПНА!

уСкоряйте ваШи науЧные Приложения С oPeNACC

Page 11: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

11CUDA АльмАнАх / ФеврАль 2014

Воспользуйтесь нашим предложением провести простой и бесплатный тест-драйв ускорителей Tesla K20/K40 GPU.

Самые быстрые в мире ускорители  Tesla K20/K40 GPU  созданы на основе архитектуры Kepler  и обеспечивают высокую производительность и энергоэффективность ваших приложений.

Проведите теСт-драйв уСкорителя tesLA K20/K40 GPU

Page 12: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

12CUDA АльмАнАх / ФеврАль 2014

науЧные работы с исПользованием выЧислений на CUDA

Проведено трехмерное моделирование процесса анизотропного распада бинарной смеси жидкого диэлектрика с растворенным газом в сильных электрических полях. Для компьютерного моделирования таких систем с возникающими новыми границами раздела между жидкостью и газом использовался метод решеточных уравнений Больцмана (Lattice Boltzmann equation, LBE). При моделировании фазовых переходов метод LBE представляет собой метод сквозного счета границ раздела фаз. Параллельная реализация LBE алгоритма выполнена на большом количестве ядер графических процессоров (Graphics Processing Unit, GPU) фирмы NVIDIA. Трехмерные расчеты спинодальной декомпозиции на сетках свыше 250 миллионов узлов были выполнены на гибридном GPU-кластере Новосибирского государственного университета (12 узлов кластера, оснащенных картами TESLA-2090).

Выполнено моделирование анизотропного распада бинарных смесей жидкого диэлектрика и растворенного газа. Важно то, что новые области фазы низкой плотности возникают в виде квазицилиндрических парогазовых каналов, ориентированных вдоль электрического поля. Парогазовые каналы расширяются как за счет диффузии растворенного газа из жидкости и испарения жидкого вещества внутрь каналов, так и за счет коалесценции каналов друг с другом. Показано, что критические значения напряженности электрического поля, необходимые для такого распада бинарной смеси, значительно меньше, чем для чистой диэлектрической жидкости. Это указывает на то, что в наносекундном диапазоне электрического пробоя реальных жидких диэлектриков такой механизм, возможно, является ключевым при возникновении газовой фазы, зарождении проводящих стримерных структур, их быстрого роста в виде тонких нитеобразных каналов, а также при ветвлении этих каналов по мере их распространения.

Computers and Mathematics with Applications 67 (2014) 340–349

three-DIMeNsIoNAL LBe sIMULAtIoNs oF A DeCAy oF LIqUID DIeLeCtrICs wIth A soLUte GAs INto the systeM oF GAs–VAPor ChANNeLs UNDer the ACtIoN oF stroNG eLeCtrIC FIeLDs A.L. Kupershtokh

Page 13: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

13CUDA АльмАнАх / ФеврАль 2014

Аварии с розливом нефти по водной поверхности, сопровождающиеся тяжелыми экологическими последствиями, происходят с досадной частотой. Существующие методы математического моделирования распространения нефтяного пятна требуют больших затрат машинного времени и отличаются невысокой точностью. Частично это можно объяснить высокой сложностью компьютерного моделирования нелинейных турбулентных процессов в трех измерениях.

Для решения соответствующих гидродинамических уравнений применяются численные методы расщепления, распараллеливания, неявные и полуявные схемы, скалярные прогонки. Для ускорения вычислений используется технология программирования графических процессоров CUDA. При реализации указанные численные методы модифицируются в соответствии с требованиями программной системы CUDA.

Предложены алгоритмы и программы, позволяющие с существенным опережением и более высокой точностью предсказать движение и расширение нефтяного пятна, чем существующие программы, и высвободить время для проведения мероприятий, минимизирующих экологические последствия таких катастроф.

Разработанная программа является частью системы, которая в настоящее время используется в МЧС в качестве тренажера и в перспективе будет внедряться в практику.

«Вестник ИГЭУ» Вып. 6. 2013 г.

Моделирование розлива нефти по водной поверхности в ГИС

моделирование ПроцеССов розлива неФтеПродуктов По водной ПоверхноСти С иСПользованием СуПеркомПьЮтеров С граФиЧеСкими уСкорителями и.а. малый, о.в. Потемкина, С.г. Сидоров, а.С мочалов, в.в. неткачев, и.Ф. ясинский, Ф.н. ясинский

Page 14: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

14CUDA АльмАнАх / ФеврАль 2014

Hydra — это уникальная система расчёта освещения на GPU, созданная на основе технологии CUDA, использующая алгоритмы с несмещенной и смещенной оценками (biased + unbiased). Несмещенная оценка означает точность алгоритма в пределе, при очень большом числе итераций. Однако, именно это свойство в конечном итоге приводит ко многим часам ожидания качественного изображения. Алгоритмы, дающие смещенную оценку, как правило, в десятки раз быстрее их несмещенных аналогов, однако их реализация значительно сложнее на графических процессорах в силу усложненной природы взаимодействия потоков и разделения данных в таких алгоритмах. Hydra реализует такие алгоритмы как одно-направленную трассировку путей, кэш освещенности, стохастические прогрессивные фотонные карты, многомерную фильтрацию, ускоряющую расчет вторичного освещения полностью на GPU.

В настоящее время Hydra доступна как отдельное приложение и плагин к Autodesk 3ds Max 2012, 2013 и 2014.

При поддержке ИПМ РАН и лаборатории компьютерной графики ВМиК МГУ

Изображения, полученные рендер-системой Hydra

СмеЩенное реШение интегрального уравнения оСвеЩенноСти на GPU в рендер-СиСтеме hyDrA в.а. Фролов, в.в. Санжаров, а.С. груздев, в.а. галактионов

Page 15: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

15CUDA АльмАнАх / ФеврАль 2014

Некоторые природные материалы, в частности горные породы, имеют ярко выраженное структурно-неоднородное блочно-иерархическое строение. Блочная структура проявляется на разных масштабных уровнях, от размеров кристаллических зерен до блоков горного массива. Блоки связаны друг с другом прослойками породы с существенно более слабыми механическими свойствами .

В задачах о распространении волн в блочных средах возникает необходимость проведения расчетов на мелких сетках, размер которых согласован с характерным размером блоков. Для таких расчетов целесообразно применение высокопроизводительных вычислительных систем. Для численного моделирования динамического взаимодействия упругих блоков через тонкие упругие прослойки в структурно-неоднородных средах разрабатываются параллельные вычислительные алгоритмы для суперкомпьютеров с графическими ускорителями по технологии CUDA. Эти алгоритмы основаны на методе двуциклического расщепления по пространственным переменным в сочетании с монотонными сеточно-характеристическими схемами со сбалансированным числом шагов по времени в блоках и прослойках.

Суперкомпьютерные технологии математического моделирования (28-30 ноября 2011 г.), 2011.-С.С. 50-52

Линии уровня нормального напряжения σ11 за фронтом падающей волны, вызванной в блочной среде воздействием распределенной импульсной нагрузки.

Размеры области: а – 8×4 блока; б – 32×16 блоков

ЧиСленное моделирование ПроцеССов раСПроСтранения уПругих волн в блоЧных Средах С тонкими ПроСлойками на многоПроцеССорных выЧиСлительных СиСтемах м. П. варыгина

Page 16: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

16CUDA АльмАнАх / ФеврАль 2014

In recent years, object tracking algorithms and technologies have been widespread to solve various problems in society, such as protection of the environment, change detection, cartography, navigation etc.

The problem of object tracking is understood as follows. The object is selected on the current frame of video sequence made from the board of the aircraft by the non-stabilized camcorder. The task is to find automatically this object in subsequent frames in real or qu-asi real time. The formulated task is now among most popular problems of image processing. A huge number of articles on the subject contain variety different methods and algorithms designed to solve it. Many of them are successfully applied in practice. Different techniques have been exploited to solve the problem. Among them are histogram, key point, optical flow, correlation, active contours and other methods. Overall difficulty for all current approaches is the small available run-time, which is limited by mil-liseconds needed for one shot. Usually it is in the range between 25 and 40 milliseconds. Some known reliable and accurate algorithms cannot be executed in such a short time.

Until recently, it can be said about correlation algorithms, which are ones of the most reliable and accurate but rather time consuming. A direct calculation of position of the tracked object in one video-frame of the standard size (without taking into account any prior information about its location) requires a few minutes of a modern PC processor. Even use of special fast computations such as the Fast Fourier Transform and SSE instructions has not made possible real time execution of correlation algorithms.

However, situation changed after appearance of the parallel computing platform CUDA and a new generation of video cards providing opportunities of working with 3D textures.

Examples of results of object tracking for videos made by the HDV video camera Sony HVR-HD1000E: a – manual object detection;

b – d – object found by implemented algorithm

reAL tIMe oBJeCt trACKING ALGorIthM B. A. Zalesky, e. N. seredin

Page 17: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

17CUDA АльмАнАх / ФеврАль 2014

вакансии CUDA

В данном разделе представлены вакансии, в которых знание CUDA является большим преимуществом.

Вакансия: Программист

Компания: VisionLabs

Город: москва

оПиСание

должностные обязанности:

• Реализация алгоритмов распознавания образов на C++. • Разработка клиент-серверных приложений. • Рефакторинг и оптимизация существующего кода.

Профессиональные требования к кандидату:

• Опыт разработки коммерческого ПО от 3х лет; • Уверенное знание C++, SQL, Qt, принципов ООП; • Опыт использования систем контроля версий (git, svn); • Умение развивать чужой код; • желательно знание GPGPU (CUDA, OpenCL), CMake, UML.

личные качества кандидата:

• Умение ставить перед собой задачи и добиваться их выполнения в сжатые сроки; • Ответственность за сроки и результаты своей работы; • Умение работать в команде; • Готовность к усвоению большого объема новой информации; • Аккуратность и пунктуальность.

Подробнее

Page 18: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

18CUDA АльмАнАх / ФеврАль 2014

Вакансия: инженер по разработке алгоритмов обработки трёхмерных данных

Компания: samsung research Center

Город: москва

оПиСание

Предметная область:

• 3D реконструкция в реальном времени; • Обработка трёхмерных данных; • Компьютерное зрение в части выделения особых точек изображения и извлечения

отличительных признаков; • Эффективная реализация алгоритмов на PC и\или мобильном устройстве (Android) с

помощью технологий параллельного программирования.

обязанности:

• Проведение прикладных исследований и разработки технологий в области обработки изображений, компьютерного зрения и трёхмерных данных;

• Работа в тесном сотрудничестве с другими членами исследовательской группы; • Написание патентов, охватывающих разработанные технологии; • Презентация и демонстрация результатов исследований на внутренних (внешних)

мероприятиях.

требования:

• Отличные аналитические способности; • Отличная математическая подготовка; • Опыт разработки на С/С++; • Опыт разработки алгоритмов обработки изображений, компьютерного зрения (OpenCV); • желателен опыт разработки алгоритмов обработки 3D данных и моделей, приветствуется

знание Point Cloud Library (PCL); • Опыт парраллельного программирования – использование GPGPU (CUDA, OpenCL) и

разработки многопоточных приложений (OpenMP) является существенным плюсом; • Хорошие навыки командной работы и коммуникации, энтузиазм, творческие способности,

продуктивность и обучаемость.

Подробнее

Page 19: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

19CUDA АльмАнАх / ФеврАль 2014

Вакансия: tegra developer technology engineer

Компания: NVIDIA Ltd. russian Branch

Город: москва

оПиСание

requirements:

• Strong knowledge of C/C++ and programming techniques; • Strong mathematical fundamentals; • Excellent communication skills required; • Travel for on-site visits with developers and to conferences may be required; • Ideal candidates will have experience with game development, OpenGL and Linux; • B.S. or higher degree in Computer Science/Engineering or mathematical field; • Experience with Java or Android a plus; • Experience with CUDA, DirectX, or OpenGL ES is a plus; • Experience in benchmarking a plus; • A strong team player that is self motivated is a requirement.

Подробнее

Page 20: CUDA альманах°льманах-Feb-2014.pdfВебинары на английском языке 9 ... Для решения этих задач компанией Simmakers

контакты и Полезные ссылки

если вы хотите, чтобы ваша статья появилась в следующем выпуске CUDA Альманах пишите нам на: [email protected]

По вопросам обучения CUDA обращайтесь в наш тренинговый центр: www.parallel-compute.ru

По вопросам приобретения NVIDIA GPU и по прочим техническим вопросам пишите нам на: [email protected]

Протестируйте PGI OpenACC compiler бесплатно в течение месяца: www.nvidia.ru/openacc

Узнайте подробнее про CUDA: www.nvidia.ru/cuda

Полный каталог приложений, ускоряемых на CUDA: http://www.nvidia.ru/gpuapps

Copyright © 2014 NVIDIA логотип NVIDIA, являются торговыми знаками или зарегистрированными торговыми знаками компании NVIDIA в США и других странах. Все другие названия компаний и/или продуктов могут являться товарными знаками и/или зарегистрированными товарными знаками соответствующих владельцев. Все права защищены.

NVIDIA Corporation, 2701 San Tomas Expressway, Santa Clara, CA 9505