20
Нижегородский государственный университет им Н И Лобачевского им. Н.И.Лобачевского Факультет Вычислительной математики и кибернетики Параллелизм Параллелизм как как основа основа архитектуры архитектуры ВС ВС Раздел 18 В б Взгляд в будущее Кудин А.В., к.т .н.

Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Нижегородский государственный университет им Н И Лобачевскогоим. Н.И.Лобачевского

Факультет Вычислительной математики и кибернетики

ПараллелизмПараллелизмкаккак основаоснова архитектурыархитектуры ВСВС

Раздел 18В бВзгляд в будущее

Кудин А.В., к.т.н.

Page 2: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Содержание

Эволюция процессоростроенияНовые тенденции развития процессоровНовый закон МураНовый закон МураСпецифика грядущих архитектурР бРоль энергопотребленияНовое понятие вычислительной эффективностиMulticore и ManycoreПроблемы многоядерных системПроблемы многоядерных системПроблемы сопряжения hardware и software

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 2 из 20

Page 3: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Революционный 2007 год

2007

Multicore EraMicroprocessor Era

2007

Microprocessor Era

MegaFLOP GigaFLOP TeraFLOP PetaFLOP ExaFLOP

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 3 из 20

Page 4: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Коррекция тенденций развития

Причины:Экспоненциальный рост

числа транзисторов сохраняетсясохраняется

15 лет экспоненциального роста тактовой частоты закончилисьЭнергопотребление

удалось стабилизироватьудалось стабилизироватьILP достиг предела

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 4 из 20

Page 5: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Коррекция тенденций развития

Традиционные источники повышения производительности р д ц р д(тактовая частота, IPC) стабилизировались

Новый закон Мура:число ядер удваивается каждые 18 месяцевр у ц(вместо удвоения частоты)

“The processor is the new transistor!” Chris Rowen

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 5 из 20

The processor is the new transistor! Chris Rowen

Page 6: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Энергопотребление мультипроцессоров

CV2F

е

VIleakage

ребление

ергопотр

эне

Вывод: если мультипроцессор слишком горяч сократитеслишком горяч, сократите напряжение и частоту, а не процессоры

производительность

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 6 из 20

производительность

Page 7: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Проблемы передовых процессоров

Жёсткие ограничения по энергопотреблениюр р р

Темпы роста производительности падают драматично

К й б бКрайне сложное тестирование работоспособности

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 7 из 20

Page 8: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Проблемы передовых процессоров

Жёсткие ограничения по энергопотреблениюр р р

Темпы роста производительности падают драматично

К й б бКрайне сложное тестирование работоспособности

Решение: малые ядраРешение: малые ядра

Малые ядра не на много медленнее больших

Малые ядра имеют меньшее энергопотребление

Малые ядра легче проверятьМалые ядра легче проверять

Малых ядер на чипе может быть существенно больше

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 8 из 20

Page 9: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Сравнивая ядра

Power5 (Server)– 389 mm2

– 120 W @ 1900 MHzIntel Core2 (Laptop)

130 mm2– 130 mm2

– 15 W @ 1000 MHzARM Cortex A8 (BMW Auto)( )

– 5 mm2

– 0.8 W @ 800 MHzTensilica DP (Cell phones)Tensilica DP (Cell phones)

– 0.8 mm2

– 0.09 W @ 600 MHzTensilica Xtensa (CISCO router)

– 0.32 mm2 for 3!– 0 05 W @ 600 MHz

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 9 из 20

– 0.05 W @ 600 MHz

Page 10: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Сравнивая ядра (Intel)

Передовые системы потребляютпотребляют мегаватты энергии

Стоимость энергии ббольше стоимости оборудования

Энергопотребление р рограничивает будущий рост систем

новое понятие вычислительной эффективности:эффективности: performance/watt

(вместо пиковой

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 10 из 20

(производительности)

Page 11: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Сравнивая ядра

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 11 из 20

Page 12: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

От Multicore к Manycore

MulticoreИспользование передовых ядер (архитектур)р д д р ( р ур)Удвоение числа ядер каждые 18 месяцевОриентация на типичную вычислительную нагрузку (workload)

Пример: Intel Core2 Duo (2 cores)Пример: Intel Core2 Duo (2 cores)

ManycoreУпрощенные ядра (короткие конвейеры, небольшие частоты, in-order

обработка)Начиная со ста ядер на чипеУдвоение числа ядер каждые 18 месяцевд д р д цПреимущества: наилучшая вычислительная эффективность на ватт,

простое тестирование, низкая вероятность дефектов производства, малая стоимость разработкистоимость разработкиПример: Nvidia G80 (128 cores), Intel Polaris (80 cores), Cisco/Tensilica Metro (188 cores)

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 12 из 20

Page 13: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Пример: Tensilica Xtensa

188+4 Xtensa general gpurpose processor cores

используется в Ciscoиспользуется в Cisco CRS-1 Terabit Router

кластер из 12 ядер(всего 16×12=192)

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 13 из 20

Page 14: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Эра Multicore

Ближайший рубеж: 1M ядер в системе

OP1

5ро

в в

TOоц

ессор

исло

пр

Чи

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 14 из 20

Page 15: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Препятствия на пути Multicore систем

Баланс системытрадиционная проблема SMP – доступ к RAM(полоса пропускания RAM – ключевой ограничивающий фактор)

Надёжность системыбольше ядер больше вероятность отказовбольше ядер – больше вероятность отказов(надёжность пропорциональна числу чипов в системе)

Программная поддержкаsoftware отстал от hardware(например, нет решений для 1M+ ядер)

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 15 из 20

Page 16: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Требования к ОС для Multicore систем

Не временное, а пространственное мультиплексирование

Симметричный доступ не только к памяти но и кСимметричный доступ не только к памяти, но и к устройствам ввода/вывода

Новый многоядерный механизм прерываний

Создание механизма обеспеченияСоздание механизма обеспечения отказоустойчивости по ядрам

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 16 из 20

Page 17: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Назад в будущее

Последовательные программы теперь стали медленными д р р р дпрограммами…Ни SMP, ни OpenMP модели программирования, p д р р рне поддерживают потенциал сцеплённых ядер…

Программирование необходимоб !изобрести заново!

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 17 из 20

Page 18: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Вопросы для обсуждения

Какой из нижеперечисленных трендов сейчас не актуален и подлежит замене на Новый закон Мура?

– удвоение плотности элементов процессорных СБИС каждые два года– удвоение частоты процессорных СБИС каждые два года– удвоение количества элементов запоминающих СБИС каждые полтора года

двукратное уменьшение времени доступа запоминающих СБИС каждые десять лет– двукратное уменьшение времени доступа запоминающих СБИС каждые десять лет– удвоение ёмкости внешней памяти каждый год– двукратное уменьшение времени доступа во внешней памяти каждые десять лет– удвоение скорости передачи данных в глобальных сетях каждый году р р

Какой из вышеперечисленных трендов обусловил переход в эру Multicore?Сравните основные технологии распараллеливания операцийСравните основные технологии распараллеливания операций высокого уровня: CMP, SMT и VLIW. Оцените масштабируемость.Почему именно энергопотребление стало ключевым сдерживающим фактором традиционного развития вычислительных систем?Почему передовые ядра с высоким ILP стали уступать простым малым ядрам?

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 18 из 20

ядрам?

Page 19: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Литература

Shalf J.The Landscape of Computer ArchitectureISC2007, Dresden, 2007

Sterling T.HPC Achievement and ImpactHPC Achievement and ImpactISC2007, Dresden, 2007

Burton S.Reinventing ComputingISC2007 Dresden 2007ISC2007, Dresden, 2007

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 19 из 20

Page 20: Параллелизм ...Препятствия на пути Multicore систем 9Баланс системы традиционная проблема SMP – доступ к

Следующая тема

The END ☺

Н.Новгород, 2007 г. Архитектура ВС: Взгляд в будущее© Кудин А.В. 20 из 20