Upload
alice
View
53
Download
0
Embed Size (px)
DESCRIPTION
Прогнозные оценки развития высокопроизводительной вычислительной техники. Эйсымонт Л.К. ОАО «НИЦЭВТ» (Концерн радиостроения “ Вега ” ). Четыре сегмента рынка суперкомпьютеров. Таблица 1. Зафиксированные в 2002 году объемы четырех сегментов рынка суперкомпьютеров. - PowerPoint PPT Presentation
Citation preview
Прогнозные оценки развития высокопроизводительной
вычислительной техники.
Эйсымонт Л.К.
ОАО «НИЦЭВТ» (Концерн радиостроения “Вега”)
Четыре сегмента рынка суперкомпьютеров
Таблица 1. Зафиксированные в 2002 году объемы четырех сегментов рынка суперкомпьютеров.
Таблица 2. Предсказанные в 2002 году объемы сегментов рынка суперкомпьютеров.
На самом деле оказалось, что общий объем рынка составил:
2008 ~ $9.000
Дальнейший рост ожидается:
2010 ~ $15.000
2012 ~ $17.000
Это 30% рынка серверных платформ
Нас интересует TechnicalCapability – суперкомпьютеры для
решения задач, требующих предельных возможностей (стратегические задачи)
Разные сегменты суперкомпьютерного рынка – разные технологии, разные прогнозы (видение IBM).
Наиболее чувствительный к новым технологиям сегмент - CКСН
Специфика формирования прогнозных оценок
-- Прогнозные оценки даются с точки зрения архитектора заказных суперкомпьютеров высшего диапазона производительности, предназначенных для решения уникальных стратегически важных для государства задач, далее - суперкомпьютеров стратегического назначения (СКСН)
-- Выделяются два связанных друг с другом процесса будущего развития (на примере США, Япония и Китай – по такому же образцу): - революционное развитие, определяемое необходимостью решения стратегических задач государства: 1) работы по программе DARPA HPCS создания заказных СКСН с перспективной архитектурой и глобально адресуемой памятью, далее – перспективных СКСН; 2) работы по Федеральному плану США разработок и исследований в области СКСН, которые являются усилением и обобщением программы DARPA HPCS. - эволюционное развитие, определяемое рынком и появлением массовой и коммерчески доступной элементной базы “новой волны”, основа которой - многоядерно-мультитредовые микропроцессоры и многосокетные платы на их основе, являющиеся мощными SMP-узлами с разделяемой между сокетами платы общей памятью.
Проекты создания суперкомпьютеров стратегического назначения (СКСН)
с перспективной архитектурой
США – программа DARPA HPCS (2002) - проект Cascade (Cray) - системы Baker, Granite, Marble. 250 млн $ на 2008-2010. федеральный проект - проект PERCS (IBM) - 250 млн $ на 2008-2010, федеральный проект
Япония – программа Next Generation Supercomputer Министерства Образования, Культуры, Спорта, Науки и Технологий (2006) - проект 3K (Институт физических и химических исследований (RIKEN) и Fujitsu),1.2 млрд.$, федеральный проект.
Китай – программа 863 Министерства науки и технологий (2006) - проект HPP (Институт вычислительных технологий (ICT), фирма Dawning, Национальный университет оборонных технологий (NUDT)), федеральный проект
Россия – в рамках ФЦП Минпромторговли РФ, Минобрнауки РФ (2005) - проект Ангара (ОАО”НИЦЭВТ”)
Главная решаемая проблема в проектах создания перспективных СКСН
– “стена памяти”
Что это за проблема ?
Интегральные оценки реальной производительности – пакет HPC Challenge и метод “APEX-поверхности”
Cхема организацииAPEX-теста
Пример профиля работы с памятью задачи CF-класса
(DGEMM)
Пример профиля работы с памятью для задачи DIS-класса(SpMV)
Рис. Профиль обращений к памяти для теста SpMV (A*p=q)
Пример профиля работы с памятью для задачи DIS-класса
(FFT-одномерное быстрое преобразование Фурье)
Пример профиля работы с памятью для задачи DIS-класса(BFS)
Пример профиля работы с памятью для задачи DIS-класса
(RandomAccess)
Коммуникационные профили разных задач.Большой объем передаваемой информации,
нерегулярный и коллективный характер взаимодействий приводят к деградации реальной производительности и
плохой масштабируемости.
Требования к перспективным CКСН программы DARPA HPCS.
Общий взгляд на задачи для СКСН и влияние базовых характеристик СКСН на эффективность решения этих задач.
1.Контроль боеготовности ядерных арсеналов и разработка новых боезапасов. 2. Радиоэлектронная разведка и другие задачи разведывательных сообществ. 3. Решение задач военного характера.4.Предсказание климата.5.Физика плазмы – решение задач создания термоядерных реакторов.6.Решение инженерных задач в области машиностроения.7. Биоинформатика и вычислительная биология, задачи влияния окружающей среды.8.Предсказание землетрясений.9.Геофизические расчеты.10.Астрофизика (+ поиск новых источников энергии).11.Материаловедение и нанотехнологии.12. Исследования социальных систем – макроэкономика и социальная динамика.
Подробный комментарий к задачам, для которых в первую очередь создаются
перспективные СКСН программы DARPA HPCS (или в решении каких задач мы рискуем отстать)
Мирные приложения – значимость перспективных СКСН для развития общества
V технологический уклад- Компьютеры - Малотоннажная химия - Телекоммуникации - Электроника - Интернет
VI технологический уклад- Биотехнологии - Нанотехнологии - Проектирование живого - Вложения в человека - Новое природопользование - Роботехника - Новая медицина - Высокие гуманитарные технологии - Проектирование будущего и управление им - Технологии сборки и уничтожения социальных субъектов
Организация работ в области перспективных СКСН в США,
контроль качества разработок с использованием новых подходов
объективного оценочного тестирования реальной производительности
Одновременно ведется программа DARPA PCA разработки перспективных встроенных суперкомпьютеров (ВСК) , во многом похожая по решаемым принципиальным проблемам на DARPA HPCS и контролируемая той же организацией – Линкольновской лабораторией Массачусетского технологического института.
В данном докладе это не рассматривается, требует отдельного детального рассмотрения.
Об организации работ в области суперкомпьютерных технологий в США
DARPA
Cray – проект CASCADEIBM - проект PERCS
MIT – проект RAWStanford Unv. – проект Smart MemoryUnv.of South.Calif. (+Raytheon) – проект MONARCHUnv.of Texas at Austin (+IBM) – проект TRIPS
Cистема тестов оценки производительностиCКСН программы DARPA HPCS
Сравнение NEC SX-9 с другими системами(современный подход - kiviat-диаграмма,
на лучах – наименования тестов пакета HPC Challenge)
Примеры планов и основных решений проектов создания перспективных СКСН США, Японии и Китая
Базовые стратегии решения проблемы “стены памяти”
- обеспечение толерантности процессора к задержкам за счет работы со скоростью, определяемой темпом выполнения операций, а не задержками их выполнения (мультитредовые и векторные архитектуры);- обеспечение управляемой локализации как данных при вычислениях, так и вычислений при данных (кэши, удаленные вызовы процедур, DAE-архитектуры и модели вычислений);- применение статических и динамических потоковых моделей вычислений с управлением вычислениями потоком данных (streambased-архитектуры, dataflow-архитектуры, одновременно решает проблему ограниченного ILP, т.е. ограниченного параллелизма выполнения машинных команд)
Планы создания новых суперкомпьютеров фирмы Cray (+ унификация !)
Планы создания новых суперкомпьютеров фирмы IBM (+ унификация!)
Новая политика Японии в области стратегических вычислений
Фирма Сray, проект Cascade программы DARPA HPCS – базовая концепция проекта
Cтруктура CКСН Сray Cascade Baker и Granite
• Глобально адресуемая память с унифицированной для всех типов узлов архитектурой
• Конфигурируемые сеть, память, процессоры и ввод-вывод• Гетерогенная обработка на множестве узлов разного типа и внутри тредово-векторных (MVP) узлов
• Возможность адаптации при конфигурировании, компиляции в процессе выполнения
Многоядерно-мультитредовый микропроцессор Power7 – базовый микропроцессор CКСН IBM PERCS
- 8 ядер, в каждом ядре 4 треда, SMT-мультитредовость, запуск в одном ядре 6 команд за такт; - в одном мультитредовом ядре 12 функциональных устройств: FXU -2, FPU – 4, LSU -2, VSX – 1, BRU – 1, СRU-1, DFU -1;- объем кэш-памяти L3 – 32 Мбайт, 2 контроллера внешней DRAM - памяти;- 32 сокета на плате, т.е. 1024 треда над общей памятью- кристалл – 567 мм2 , 1.2 млрд.транзисторов, 4 Ггц.
Кристалл Power 7 Одно многоядерное ядро (Core)
Модифицированная сеть Клоса – коммуникационная сеть СКСН IBM PERCS
Обычная свернутая сеть Клоса, при передачах проходят несколько линков, но это лучше, чем для сетей N-тор
Сеть IBM PERCS, при большинстве передач проходят только один линк, лучше, чем для сети Клоса
Многоядерный мультитредово-потоковый микропроцессор СКСН “Ангара” (вариант J10)
Какие характеристики можно ожидать от перспективных СКСН ?
Результаты оценочных тестовых экспериментов на имитационной архитектурной
модели российской перспективной СКСН “Ангара”
(данные по зарубежным перспективным СКСН пока недоступны, ожидаются в 2010 году)
APEX-поверхности для микропроцессоров разного типа и узла
СКСН “Ангара”
APEX-поверхности для мультипроцессорных систем разного типа (256 узлов) и СКСН
“Ангара”
Эффективность СКСН “Ангара” на тесте умножения разреженной матрицы на вектор
J7-2
J10-4
Эффективность СКСН “Ангара” на тесте BFS работы с графами
Какие изменения происходят в области коммерчески доступной элементной базы
“новой волны”и вычислительных средств?
“Вынужденные” решения проблемы стены памяти из-за появления многоядерных
микропроцессоров.
Требуемого стратегическими приложениями решения проблемы стены памяти
пока нет, хотя стало полегче…
Ослабление закона Мура, многоядерные микропроцессоры
Прогнозируемые общие изменения микроархитектуры процессоров
• применение малой и существенной мультитредовости• применение гомогенных и гетерогенных реконфигурируемых полей ядер• увеличение пропускной способности интерфейса с памятью и сетью• обеспечение эффективной работы с глобально адресуемой памятью
Многосокетная плата нового поколения с микропроцессорами AMD (HyperTransport-!)
Многосокетные платы нового поколения с микропроцессорами Intel (QuickPath - !)
Реальная производительность одной многосокетной платы на задаче UA расчета
на структурированной динамически изменяемой сетке.
Динамика изменений среднего времени обращения к памяти для разной пространственно-временной
локализации и разной мультитредовости.
Динамика изменений среднего времени обращения к памяти для лучшей и худшей точки APEX-поверхности
Сравнение современных многоядерных микропроцессоров и многосокетных плат с массово-мультитредовыми
микропроцессорами перспективных СКСН. Задача CG, класс C.
Что будет после достижения целей DARPA HPCS и похожих других программ создания
стратегических СКСН?
Прогнозы и планы дальнейшего развития в соответствии с Федеральным планом США2004 года по возрождению работ в области
стратегических информационных технологий
Экзафлопсная перспектива 2020 года( усиление тредового и потокового параллелизма)
Додекатрон
Оценки предельных возможностей использования кремниевой элементной базы при построении
высокопроизводительных систем (ноябрь 2004, Sandia Lab).
Peta – 1015 , Exa – 1018 , Zetta – 1021 , Yotta – 1023
1 – обычная кремеиевая технология, программируемые микропроцессоры2 – бычная кремниемая технология, но прямая аппаратная реализация решателей задач3 – новая технология с транзисторами на квантовых точках и реверсивной логике, программируемые средства - зеленая линия, прямая аппаратная реализация - красная
Развитие аппаратных средств-1.
Развитие аппаратных средств-2.
Развитие аппаратных средств-3.
Развитие программного обеспечения-1.
Развитие программного обеспечения-3.
Развитие СКСН - 1.
Развитие СКСН - 2.
Развитие СКСН - 3.
ОАО «Научно-исследовательский центр электронной вычислительной
техники»