66
Что такое ГРИД? Олешко С.Б. Петербургский институт ядерной физики г.Гатчина

Что такое ГРИД ?

Embed Size (px)

DESCRIPTION

Что такое ГРИД ?. Олешко С.Б. Петербургский институт ядерной физики г.Гатчина. Немного истории. 1964 год – фирма IBM создаёт семейство машин IBM360 (System 360). Это первые компьютеры третьего поколения (на интегральных микросхемах) - PowerPoint PPT Presentation

Citation preview

Page 1: Что такое ГРИД ?

Что такое ГРИД?

Олешко С.Б.Петербургский институт ядерной физики

г.Гатчина

Page 2: Что такое ГРИД ?

2

Немного истории

• 1964 год – фирма IBM создаёт семейство машин IBM360 (System 360). Это первые компьютеры третьего поколения (на интегральных микросхемах)

• В СССР IBM/360 была клонирована под названием ЕС ЭВМ. Они были программно совместимы со своими американскими прообразами

• Считается, что семейство System 360 является первым мейнфреймом. Мейнфрейм - это главный компьютер вычислительного центра с большим объемом внутренней и внешней памяти

• До 80-х годов развитие мейнфреймов определяло общее развитие вычислительной техники

Page 3: Что такое ГРИД ?

3

IBM360 (System 360).

Page 4: Что такое ГРИД ?

4

Суперкомпьютеры

• В общем случае, суперкомпьютер — это компьютер значительно более мощный, чем доступные для большинства пользователей машины

• Появление термина “суперкомпьютер” принято связывать с компьютерными системами Сеймура Крея (CDC 6600, CDC 7600, Cray-1, Cray-2)

• Переход от скалярных процессоров к векторным процессорам, затем к параллельной работе нескольких векторных процессоров

Page 5: Что такое ГРИД ?

5

Cray-2

Page 6: Что такое ГРИД ?

6

Микропроцессоры и ПК

• В конце 70-х - начале 80-х годов прогресс в развитии микропроцессоров привёл к появлению персональных компьютеров.

• Это же привело к смене магистрального направления развития суперкомпьютеров от векторно-конвейерной обработки к большому и сверхбольшому числу параллельно соединённых скалярных процессоров.

• Сейчас массивно-параллельные системы могут объединять в себе сотни и даже тысячи отдельных процессорных элементов

Page 7: Что такое ГРИД ?

7

Мировой рейтинг Top500

• Первое место - суперкомпьютер IBM Roadrunner, установленный в американской Национальной лаборатории в Лос-Аламосе, насчитывающий 129600 ядер. Его мощность составила 1105 терафлоп (флоп - число операций с плавающей запятой в секунду). Программа работ полностью засекречена.

Page 8: Что такое ГРИД ?

8

IBM Roadrunner

Page 9: Что такое ГРИД ?

9

Мировой рейтинг Top500

• Второй - суперкомпьютер Cray XT5 (Jaguar), установленный в Окридже (США), 150152 ядер. Мощность - 1059 терафлоп в секунду

Page 10: Что такое ГРИД ?

10

Cray XT5 (Jaguar)

Page 11: Что такое ГРИД ?

11

Кластеры

• Кластер – это система, в которых серийные процессорные модули объединены высокоскоростными коммутационно-связными средствами локальных сетей

• Преимущества:– меньшая стоимость– надёжность– можно наращивать вычислительную мощность – стандартизация программного обеспечения

Page 12: Что такое ГРИД ?

12

Суперкомпьютеры в России

• СК "МВС-100K" - HP Cluster Platform на базе 4-ядерных процессоров Xeon 5400 (7920 процессорных ядер ). Расположен в Межведомственном суперкомпьютерном центре в Москве. Мощность – 71,28 терафлоп.

Page 13: Что такое ГРИД ?

13

Суперкомпьютеры в России

Кластер T-Platforms T60, расположенный в МГУ им Ломоносова (5000 ядер). Мощность – 47 терафлоп.

Page 14: Что такое ГРИД ?

14

Кластер Беовульф (Beowulf)

• Беовульф – это мультикомпьютерная архитектура, которая может использоваться для параллельных вычислений.

• Это система, обычно состоящая из одного серверного узла и одного или более клиентских узлов, соединенных при помощи некоторой сети.

• Это система, построенная из готовых промышленных компонент, например ПК, на которых может работать ОС Linux

• Она не содержит специфических аппаратных компонентов и легко воспроизводима

• Серверный узел управляет всем кластером и является файл-сервером для клиентских узлов. Он также является консолью кластера и шлюзом во внешнюю сеть.

Page 15: Что такое ГРИД ?

15

Кластер ПИЯФ

Page 16: Что такое ГРИД ?

16

Кластер ПИЯФ

Page 17: Что такое ГРИД ?

17

Кластер ПИЯФ

Page 18: Что такое ГРИД ?

18

Сетевые технологии

• Развитие технологий локальных сетей

• Появление глобальных компьютерных сетей, прежде всего – Интернет– технологии (программы и аппаратура)– инфраструктура (каналы передачи данных)– распределённые ресурсы– стандарты– пользователи

Page 19: Что такое ГРИД ?

19

Грид и распределённые вычисления

Распределённые вычислительные инфраструктуры существовали и до Грид, но ….

–обычно они представляют собой локальные или специализированные системы

созданные для одной определённой цели или для отдельной группы пользователей

обычно количество пользователей ограничено не допускается совместное использование ресурсов других

организаций

Page 20: Что такое ГРИД ?

20

Грид и распределённые вычисления

Грид идёт дальше и предполагает:

–Различные типы ресурсов не всегда одинаковые аппаратная часть, данные, приложения

и политика администрирования

–Различные способы взаимодействия различные группы приложений хотят взаимодействовать с

Грид различными способами

–Доступ к ресурсам через границы административных доменов для неограниченного количества не локальных пользователей

–Динамическая природа ресурсов Ресурсы часто добавляются/удаляются/изменяются

–Масштабируемость до всемирных размеров

Page 21: Что такое ГРИД ?

21

Для чего это нужно?

Физика высоких энергий симуляция, реконструкция, анализ, …

Медицина / Здравоохранение отображение, диагностика и лечение

Биоинформатика геном человека, поиск новых лекарств, …

Нанотехнологии разработка новых материалов на молекулярном

уровнeИнженерия

авиационная безопасность, проектирование…Природные ресурсы и Окружающая среда

прогноз погоды, прогнозирование наводнений, …Термоядерный синтез

проект ITERМатериаловедение

Page 22: Что такое ГРИД ?

22

Предпосылки Грид

• Наличие во многих организациях высокопроизводительных вычислительных ресурсов (часто кластеров)

– вычислительные скорости удваиваются каждые 18 месяцев

1986 – 2000 : x 500

2001 – 2010 : x 60

• Развитие традиционных Интернет- технологий

• Необходимость решения сложных научных, инженерных и бизнес-задач

Про

изво

дит

ельн

ост

ь на

за

трач

енны

й д

олл

ар

Волоконно-оптическая

связь (бит/сек)

Кристаллы процессоров

(число транзисторов)

Кристаллы памяти (бит/кв. дюйм)

Количество лет0 1 2 3 4 5

9 12 18

•Стремительное развитие сетевой транспортной среды и технологий высокоскоростной передачи данных.

– скорости сетей удваиваются каждые 9 месяцев 1986 – 2000 : x 340 000

2001 – 2010 : x 4000

Page 23: Что такое ГРИД ?

23

Что такое Грид

Термин ГРИД был выбран по аналогии с энергетическими сетями (electric power grid)

подобно тому, как при использовании энергосистем мы не интересуемся – какой конкретный электрогенератор выработал ток, который мы потребляем,

при использовании компьютерного грида мы можем не заботиться о том - какой конкретно компьютер (или устройство хранения/передачи данных) в грид-системе выполнил нашу задачу

Page 24: Что такое ГРИД ?

24

Что такое Грид

Грид – это множество компьютеров

• (суперкомпьютеры, кластеры, персональные компьютеры, …), средств хранения данных, специальных устройств, служб, которые могут динамически входить и покидать Грид-систему.

• Они гетерогенны во всех аспектах

• Они могут быть географически распределены и соединены скоростными сетями передачи данных

• Они могут быть доступны по запросу для некоторого множества пользователей

Интернет

Page 25: Что такое ГРИД ?

25

Что такое Грид

Грид призван обеспечить возможность делать

компьютерные вычисления«по требованию»

просто подключившиськ «решетке»

вычислительных ресурсов.

Page 26: Что такое ГРИД ?

26

Что такое Грид

Опять аналогия

В энергосетях определяющую роль играют:

технологии передачи и (пере)распределения электроэнергии на большие большие расстояния;

инфраструктура - аппаратные средства (повышающие/понижающие подстанции, линии электропередач, другое электрооборудование, позволяющее электростанциям предоставлять энергию потребителям) и соответствующие службы (ремонта, контроля и т.д.);

стандарты – параметры электрического тока (напряжение в сети, частота), типы и размеры вилок/розеток, позволяющие без проблем подключать любой электроприбор к единой сети.

Page 27: Что такое ГРИД ?

27

Что такое Грид

Также как и электрические сети, грид это соединение

технологии, инфраструктуры стандартов.

Page 28: Что такое ГРИД ?

28

Что такое Грид

Технология

это специальное программное обеспечение, которое позволяет организациям или частным лицам предоставлять ресурсы (компьютеры, хранилища данных, сети и другие) в общее пользование, а потребителям – использовать их, когда необходимо.

Page 29: Что такое ГРИД ?

29

Что такое Грид

Инфраструктура

состоит из аппаратных средств и служб

(на основе людских и программных ресурсов), которые должны быть организованы, и постоянно поддерживаться для того, чтобы ресурсы могли совместно использоваться.

Page 30: Что такое ГРИД ?

30

Что такое Грид

Стандарты

должны определять

формат и протоколы обмена

сообщениями,

как между службами, так и между службами и пользователями, а также правила работы грида.

Page 31: Что такое ГРИД ?

31

История

1985–1995 Программа Национального Научного Фонда США «National Science Foundation (NSF) Supercomputer Centers».

Октябрь 1997 NSF инициировал новую программу развития информационных технологий – Partnerships for Advanced Computational Infrastructure (PACI).

1998 Создан (и успешно развивается) инструментальный пакет Globus Toolkit.

1999 Сформировалось (и активно действует) международное научное Грид-сообщество – Global Grid Forum (GGF)

2002 GGF и IBM была представлена новая системная разработка – Open Grid Service Architecture (OGSA).

2003 Создано объединение Enterprise Grid Alliance (EGA)

2006 GGF и EGA объявили о слиянии и образовании Open Grid Forum (OGF)

Page 32: Что такое ГРИД ?

32

Что такое Грид

Отдельный компьютер (РС)

Прикладное ПО

Ресурсы РСДиски, процессор, память …

Операционная система РС

Page 33: Что такое ГРИД ?

33

Что такое Грид

Локальная сеть

Прикладное ПО

Операционная система каждого узла

Ресурсы узла

Промежуточное ПО для соединения с другими узлами (компьютеры, серверы, …)

Ресурсы РС

Отдельный компьютер

Прикладное ПО

Операционная система

Page 34: Что такое ГРИД ?

34

Что такое Грид

Промежуточное ПО для соединения с другими узлами (компьютеры, серверы, …)

Промежуточное ПО для соединения с другими локальными сетями…

Операционная система каждого узла

Ресурсы узла

Следующий шаг - Грид

Локальная сетьПрикладное ПО

Операционная система каждого узла

Ресурсы узла

Промежуточное ПО для соединения с другими узлами

Ресурсы РС

Отдельный компьютер

Прикладное ПО

Операционная система

Прикладное ПО

Page 35: Что такое ГРИД ?

35

WWW и Грид

World Wide Web обеспечивает доступ к информации, которая находится в миллионах различных серверов, географически распределённых по всему миру

В отличии от WWW: ГРИД – это новая вычислительная инфраструктура, которая обеспечивает бесперебойный доступ к вычислительным мощностям и ресурсам хранения данных, распределённых по всему миру

Page 36: Что такое ГРИД ?

36

ППО Грид (middleware)

”Прозрачное” взаимодействие между гетерогенными ресурсами (принадлежащих различным, географически распределённым организациям), приложениями и пользователями возможно только при помощи…– использования специализированного программного обеспечения,

называемого middleware

Middleware “скрывает” технические детали Грид-инфраструктуры и обеспечивает безопасную интеграцию/распределение ресурсов

интернет-протоколы не обеспечивают безопасный механизм

доступа к разделяемым ресурсам

Page 37: Что такое ГРИД ?

37

ППО Грид (middleware)

GRID

MIDDLEWARE

Визуализация

Рабочие станции

Мобильный доступ

Суперкомпьютера, PC-кластеры

Хранилища данных, эксперименты, …

Internet, сети

Page 38: Что такое ГРИД ?

38

Использование Грид

• Организация эффективного использования ресурсов для небольших задач, с утилизаций временно простаивающих компьютерных ресурсов

• Распределенные супервычисления, решение очень крупных задач, требующих огромных процессорных ресурсов, памяти и т.д.

• Вычисления с привлечением больших объемов географически распределенных данных, например, в метеорологии, астрономии, физике высоких энергий

• Коллективные вычисления, в которых одновременно принимают участие пользователи из различных организаций

Page 39: Что такое ГРИД ?

39

Проект SETI@home

• Поиск следов внеземных цивилизаций

• Обработка данных, полученных радиотелескопом Аресибо

• Около 5 млн. участников• 1200 CPU лет в день• Постоянная вычислительная

мощность ~34 TF (примерно такая, какая достигнута в Симуляторе Земли в Японии)

• Высокая степень гетерогенности ресурсов - >77 различных типов процессоров

Page 40: Что такое ГРИД ?

40

Проект GIMPS

• http://www.mersenne.org/

• Поиск простых чисел Мерсенна. Числа Мерсенна имеют вид Mp = 2p – 1, где p-простое

• Самое большое известное на данный момент простое число M43112609 = 243112609 − 1 было найдено в рамках проекта GIMPS в

августе 2008 года. Оно состоит из 12,978,189 цифр!! • Ресурсы (на 10.06.2009):

– команд – 216

– участников – 20888

– CPUs – 115601

– мощность - 38.497 терафлоп

Page 41: Что такое ГРИД ?

41

Проект WISDOM

• Приложение Drug Discovery, позволяющее вычислять вероятность прямого контакта между потенциальным лекарством и белком-мишенью

• Первый в истории биомедицины сеанс массовой обработки данных (малярия)

Исследовано 46 миллионов посадочных лиганд

Получено более 1 Тб данныхИспользованы ~1000 компьютеров из 15 стран, что составляет ~ 80 машино/лет

Средний фактор ускорения – 600

• Второй сеанс (птичий грипп)Использованы ~5000 компьютеров из 27 стран, что составляет ~ 420 машино/лет

Получено более 2 Тб данныхСредний фактор ускорения – 2000

Domain distribution of Flexx run jobs

es; 5122

fr; 7580

gr; 2004 il; 263 it; 3687

nl; 3356

tw; 827

uk; 8106

bg; 597 com; 1072

de; 715 cy; 383

pl; 1877

ru; 218

ro; 337

Page 42: Что такое ГРИД ?

42

О ЦЕРНе (CERN)

• Расположен на границе Щвейцарии-Франции. Крупнейший в мире исследовательский центр по ФВЭ

• Работают представители ~500 университетов и институтов (штат~2500чел., 6500 визитеров из ~40 стран)

• Сделано много открытий и разработано много новых технологии, включая WWW.

• Большинство Нобелевских лауреатов по физике последних лет так или иначе связаны с ЦЕРН.

Page 43: Что такое ГРИД ?

43

Большой адронный коллайдер (LHC)

Длина окружности ускорителя – 27 км.

Запуск перенесён на 2009 год

Page 44: Что такое ГРИД ?

44

Что такое БАК?

• Энергия столкновения пучков протонов – 14 TeV

• Используя новейшие сверхпроводящие технологии он будет работать при температуре –271°C, т.е. немного выше абсолютного нуля

• С общей длиной в 27 км ускоритель будет самой большой сверхпроводящей установкой в мире

Page 45: Что такое ГРИД ?

45

Эксперименты на БАК

Page 46: Что такое ГРИД ?

46

Место для детектора ATLAS

Page 47: Что такое ГРИД ?

47

Детектор ATLAS

Page 48: Что такое ГРИД ?

48

Детектор ATLAS

Page 49: Что такое ГРИД ?

49

Как будет работать БАК

Page 50: Что такое ГРИД ?

50

Результаты

Начиная с такого набора событий:

Необходимо найти такое:

Селективность (степень отбора) ~ 1 из 1013, что примерно соответствует поиску иголки в 20 миллионах стогах сена!!!

Page 51: Что такое ГРИД ?

51

Данные БАК

• 40 000 000 столкновений в секунду

• После фильтрации, остаётся только 100 событий в секунду

• Объём оцифрованных данных для одного события ~ 1Мб

• За год необходимо записать 1010 событий = 10 Петабайт данных в год

1 Мегабайт (1MB) Цифровая фотография

1 Гигабайт (1GB) = 1000MB DVD фильм

1 Терабайт (1TB) = 1000GB Объём всех книг, изданных за год в мире

1 Петабайт (1PB) = 1000TB Производит за год один эксперимент БАК

1 Экзобайт (1EB) = 1000 PB Объём информации, которую производит за год всё человечество

CMS LHCb ATLAS ALICE

Page 52: Что такое ГРИД ?

52

Необходимость ГРИД для БАК

• Объём получаемых данных БАК соответствует 20 миллионам записанных CD дисков в год. Где их хранить?

• Анализ данных LHC потребует вычислительных мощностей, эквивалентных мощности 100000 самых современных процессоров. Где их взять?

• Ресурсы ЦЕРН уже сейчас составляют более 4000 процессоров (ядер) и 8 Пб памяти на дисках и на лентах. Но этого мало!!!

Выход – объединение вычислительных ресурсов физиков всего мира

Конкорд(15 Км)

Воздушный шар(30 Км)

Стопка CD дисков с данными БАК за 1 год (~ 20 Км)

Монблан(4.8 Км)

Page 53: Что такое ГРИД ?

53

Всемирный компьютинг для БАК

• Проекты EGEE и OSG являются основой для проекта Worldwide LHC Computing Grid ( WLCG)

Page 54: Что такое ГРИД ?

54

Хранение данных в БАК

Page 55: Что такое ГРИД ?

55

Название проекта

EGEE- Enabling Grids for E-sciencE

Развертывание инфраструктуры

Грид для науки

Page 56: Что такое ГРИД ?

56

Сроки выполнения проекта

Page 57: Что такое ГРИД ?

57

Ресурсы EGEE-III сейчас• 267 центров в 54 странах

• ~ 114 000 CPU

• ~ 20 PB дисковой памяти, + ленточные MSS

• распределённое управление

• >200 ВО из различных областей науки

>150тыс. заданий/день

>16000 пользователей

Page 58: Что такое ГРИД ?

58

Партнёры EGEE

Page 59: Что такое ГРИД ?

59

Управление ГРИД EGEE

Операционный центр управления (OMС)

- ЦЕРН - общая координацияЦентры базовой инфраструктуры (CIC) - 5 центров (Великобритания, Франция, ЦЕРН, Италия, Россия)

- обеспечение постоянной (24x7) работы базовых грид-служб, мониторинг системы;

- реализация и контроль за выполнением правил, выработанных OMS

- обеспечение поддержки узлов 2-го уровня

Региональные операционные центры (ROC) ~ 11 центров

- поддержка пользователей и администраторов ресурсов

- координация региональных ресурсов

Page 60: Что такое ГРИД ?

60

Мониторинг узлов EGEE

Page 61: Что такое ГРИД ?

61

Участие России в проекте EGEE

В целях обеспечения полномасштабного участия России в этом проекте был образован консорциум РДИГ (Российский ГРИД для интенсивных операций с данными – Russian Data Intensive GRID, RDIG) для эффективного выполнения работ по проекту и развитию в России инфраструктуры EGEE, с вовлечением на следующих этапах проекта других организаций из различных областей науки, образования и промышленности.

Консорциум РДИГ, согласно принятой в проекте EGEE структуре, входит в проект в качестве региональной федерации “Россия” (“Russia).

Сейчас в РДИГ (http://www.egee-rdig.ru) входят 15 институтов (в 2004 году - 8)

Page 62: Что такое ГРИД ?

62

Распределение время/регион

Page 63: Что такое ГРИД ?

63

Распределение задания/регион

Page 64: Что такое ГРИД ?

64

Распределение по России

Page 65: Что такое ГРИД ?

65

Полезные ссылки

• http://www.eu-egee.org - проект EGEE-III• http://www.egee-rdig.ru/ - RDIG консорциум• http://egee.pnpi.nw.ru/ - ПИЯФ РАН• http://rocmon.jinr.ru:8080/accounting/ - мониторинг RDIG• http://www.gridclub.ru/ - GRIDCLUB.RU :: Интернет-портал по

грид-технологиям• http://egee.sinp.msu.ru - НИИЯФ МГУ

Page 66: Что такое ГРИД ?

66

Спасибо за внимание