44
Организация ЭВМ и систем Тема: RISC – процессоры Переход от CISC к чертам RISC архитектуры в семействе IA-32 Основные черты RISC – процессоров Характеристика современных RISC – процессоров, основные направления развития

Лекция №7 Организация ЭВМ и систем

Embed Size (px)

Citation preview

Page 1: Лекция №7 Организация ЭВМ и систем

Организация ЭВМ и систем

Тема: RISC – процессоры

• Переход от CISC к чертам RISC архитектуры в семействе IA-32

• Основные черты RISC – процессоров• Характеристика современных RISC – процессоров, основные направления развития

Page 2: Лекция №7 Организация ЭВМ и систем

Экскурс в историюЭкскурс в историю

В 70-е годы 19 века ученые выдвинули революционную В 70-е годы 19 века ученые выдвинули революционную по тем временам идею создания микропроцессора, по тем временам идею создания микропроцессора, "понимающего" только минимально возможное количество "понимающего" только минимально возможное количество команд. команд.

Замысел Замысел RISC RISC - процессора (Reduced Instruction Set - процессора (Reduced Instruction Set Computer, Computer, компьютер с сокращенным набором командкомпьютер с сокращенным набором команд) ) родился в результате практических исследований частоты родился в результате практических исследований частоты использования команд программистами, проведенных в использования команд программистами, проведенных в 70-х годах в США и Англии. Их непосредственный итог - 70-х годах в США и Англии. Их непосредственный итог - известное известное ""правило 80/20правило 80/20": в 80% кода типичной ": в 80% кода типичной прикладной программы используется лишь 20% прикладной программы используется лишь 20% простейших машинных команд из всего доступного простейших машинных команд из всего доступного

набора.набора.

Page 3: Лекция №7 Организация ЭВМ и систем

Определение RISC-процессора

В действительности, В действительности, исходно аббревиатура RISC исходно аббревиатура RISC расшифровываласьрасшифровывалась несколько иначе, а именно как несколько иначе, а именно как Rational Instruction Set Computer (RISC, компьютер с Rational Instruction Set Computer (RISC, компьютер с рациональной системой командрациональной системой команд). ).

RISC-процессоры, таким образом противопоставлялись RISC-процессоры, таким образом противопоставлялись процессорам с необязательно сложной (CISC - Complex процессорам с необязательно сложной (CISC - Complex Instruction Set Computer, компьютер со сложной системой Instruction Set Computer, компьютер со сложной системой команд), но "иррациональной", исторически сложившейся команд), но "иррациональной", исторически сложившейся архитектурой, в которой, в силу требований бинарной и архитектурой, в которой, в силу требований бинарной и ассемблерной совместимости с предыдущими ассемблерной совместимости с предыдущими поколениями, накоплено множество команд, поколениями, накоплено множество команд, специализированных регистров и концепций, в общем-то и специализированных регистров и концепций, в общем-то и не нужных, но вдруг отменишь команду двоично-не нужных, но вдруг отменишь команду двоично-десятичной коррекции, а какое-то распространенное десятичной коррекции, а какое-то распространенное приложение "сломается"? приложение "сломается"?

Page 4: Лекция №7 Организация ЭВМ и систем

Первый "настоящий" Первый "настоящий" RISC-процессор с 31 командойRISC-процессор с 31 командой был создан под руководством Дэвида Паттерсона из был создан под руководством Дэвида Паттерсона из Университета Беркли, затем последовал Университета Беркли, затем последовал процессор процессор с с набором набором изиз 39 команд39 команд. Они включали в себя 20 - 50 тыс. . Они включали в себя 20 - 50 тыс. транзисторов. Плодами трудов Паттерсона транзисторов. Плодами трудов Паттерсона воспользовалась компания Sun Microsystems, воспользовалась компания Sun Microsystems, разработавшая архитектуру SPARC с 75 командами в разработавшая архитектуру SPARC с 75 командами в конце 70-х годов. конце 70-х годов. В 1981 г. в Станфордском В 1981 г. в Станфордском университете стартовал проект MIPS по выпуску RISC-университете стартовал проект MIPS по выпуску RISC-процессора с 39 командами.процессора с 39 командами. В итоге была основана В итоге была основана корпорация Mips Computer в середине 80-х годов и корпорация Mips Computer в середине 80-х годов и сконструирован следующий процессор уже с 74 сконструирован следующий процессор уже с 74 командами. командами.

Примерно в то же время Intel разработала серию Примерно в то же время Intel разработала серию 8038680386, последних "истинных" CISC-процессоров в , последних "истинных" CISC-процессоров в семействе х86. семействе х86. В последний раз повышение В последний раз повышение производительности было достигнуто только за счет производительности было достигнуто только за счет усложнения архитектуры процессораусложнения архитектуры процессора: из 16-разрядной : из 16-разрядной она превратилась в 32-разрядную, дополнительные она превратилась в 32-разрядную, дополнительные аппаратные компоненты поддерживали виртуальную аппаратные компоненты поддерживали виртуальную память и добавился целый ряд новых команд.память и добавился целый ряд новых команд.

Page 5: Лекция №7 Организация ЭВМ и систем

Основные особенности RISC - Основные особенности RISC - процессоровпроцессоров

1.1.Сокращенный набор командСокращенный набор команд (от 80 -150 команд). (от 80 -150 команд).

2.2.Большинство команд выполняется за 1 такт.Большинство команд выполняется за 1 такт.

3.3.Большое количество регистров общего Большое количество регистров общего

назначения.назначения.

4.4.Наличие жестких многоступенчатых конвейеров.Наличие жестких многоступенчатых конвейеров.

5.5.Все команды имеют простой формат и Все команды имеют простой формат и

используются немногие способы адресации.используются немногие способы адресации.

6.6.Наличие вместительной раздельной кэш памяти.Наличие вместительной раздельной кэш памяти.

7.7.ПрименениеПрименение оптимизирующих компиляторовоптимизирующих компиляторов, ,

которые анализируют исходный код и частично меняют которые анализируют исходный код и частично меняют

порядок следования команд.порядок следования команд.

Page 6: Лекция №7 Организация ЭВМ и систем

RISC – процессоры 3-го поколенияRISC – процессоры 3-го поколения

1.1.Ultra SPARC (ф. Sun Microsystem).Ultra SPARC (ф. Sun Microsystem).

2.2.PowerPC 620 (ф. IBM/Motorola).PowerPC 620 (ф. IBM/Motorola).

3.3.Alpha 21164 (ф. DEC).Alpha 21164 (ф. DEC).

4.4.R 10000 (ф. Mips Technology).R 10000 (ф. Mips Technology).

5.5.PA-8000 (ф. Hewlett Packard).PA-8000 (ф. Hewlett Packard).

Самыми крупными разработчиками RISC Самыми крупными разработчиками RISC процессоров считаются процессоров считаются Sun MicrosystemsSun Microsystems (архитектура (архитектура SPARC), SPARC), IBMIBM (многокристальные процессоры Power, (многокристальные процессоры Power, однокристальные PowerPC), Digital Equipment (Alpha), однокристальные PowerPC), Digital Equipment (Alpha), Mips TechnologiesMips Technologies (семейство Rxx00), а также (семейство Rxx00), а также Hewlett-Hewlett-PackardPackard (архитектура PA-RISC). (архитектура PA-RISC).

По данным независимой компании IDC за 1992 год По данным независимой компании IDC за 1992 год архитектура SPARC занимала 56 % рынка, далее архитектура SPARC занимала 56 % рынка, далее следовали MIPS – 15 % и PA-RISC – 12.2 %.следовали MIPS – 15 % и PA-RISC – 12.2 %.

Page 7: Лекция №7 Организация ЭВМ и систем

Основные черты RISC – Основные черты RISC – процессоров 3-го поколенияпроцессоров 3-го поколения

•Все Все ЦП являются 64-х разрядными и ЦП являются 64-х разрядными и суперскалярнымисуперскалярными (запускаются не менее 4-х команд за (запускаются не менее 4-х команд за такт).такт).

•Встроенные конвейерные блоки арифметики с Встроенные конвейерные блоки арифметики с плавающей точкой.плавающей точкой.

•Многоуровневая кэш память. Многоуровневая кэш память. Большинство RISC Большинство RISC процессоров кэшируют предварительно процессоров кэшируют предварительно дешифрованные команды.дешифрованные команды.

•Применяется Применяется алгоритм динамического прогнози-алгоритм динамического прогнози-рования ветвленийрования ветвлений и и метод переназначения регистровметод переназначения регистров (позволяет реализовать внеочередное выполнение (позволяет реализовать внеочередное выполнение команд).команд).

•Изготавливаются по КМОП технологии с 4-мя слоями Изготавливаются по КМОП технологии с 4-мя слоями металлизации. металлизации.

Page 8: Лекция №7 Организация ЭВМ и систем

Повышение производительности RISC-Повышение производительности RISC-процессоров достигается:процессоров достигается:

1)1) за счет повышения тактовый частотыза счет повышения тактовый частоты,,2)2) усложнения схемы кристаллаусложнения схемы кристалла. . Представителями первого направления являются Представителями первого направления являются

процессоры Alpha фирмы DEC процессоры Alpha фирмы DEC (в 1995 году (в 1995 году переименована в Digital UNIX, после покупки DEC переименована в Digital UNIX, после покупки DEC компанией Compaq), наиболее сложными являются компанией Compaq), наиболее сложными являются процессоры компании Hewlett-Packard. процессоры компании Hewlett-Packard.

Page 9: Лекция №7 Организация ЭВМ и систем

RISC-процессоры фирмы DEC. RISC-процессоры фирмы DEC. Структура процессора Alpha 21064 Структура процессора Alpha 21064 (1992 г.)(1992 г.)

BIU

E-box

IRF

A-box

Write Buffer

D-cache

I-box

F-box

FRF

I-cache

Page 10: Лекция №7 Организация ЭВМ и систем

I-cache – кэш команд.I-cache – кэш команд.IRF – регистровый файл целочисленной арифметики.IRF – регистровый файл целочисленной арифметики.F-box – устройство арифметики с плавающей точкой.F-box – устройство арифметики с плавающей точкой.E-box – устройство целочисленной арифметики (7 E-box – устройство целочисленной арифметики (7

ступеней конвейера).ступеней конвейера).I-box – командное устройство (управляет кэш команд, I-box – командное устройство (управляет кэш команд,

выборка и дешифрация команд).выборка и дешифрация команд).A-box – устройство управления загрузкой/ A-box – устройство управления загрузкой/

сохранением данных. Управляет процессом обмена сохранением данных. Управляет процессом обмена данными между IRF, FRF, кэш данных и внешней данными между IRF, FRF, кэш данных и внешней памятью.памятью.

Write Buffer – буфер обратной записи.Write Buffer – буфер обратной записи.D-cache – кэш данных. D-cache – кэш данных. BIU – интерфейсный блок, с помощью которого BIU – интерфейсный блок, с помощью которого

подключаются внешняя кэш-память, размером 128 Кб - 8 подключаются внешняя кэш-память, размером 128 Кб - 8 Мб.Мб.

Page 11: Лекция №7 Организация ЭВМ и систем

Процессор Alpha 21264 Процессор Alpha 21264 (1998 г.)(1998 г.)

Процессор Alpha 21264 отличается значительной Процессор Alpha 21264 отличается значительной новизной по сравнению с предшественником 21164. Он новизной по сравнению с предшественником 21164. Он обладает кэш-памятью первого уровня большего объема, обладает кэш-памятью первого уровня большего объема, дополнительными функциональными блоками, более дополнительными функциональными блоками, более эффективными средствами предсказания ветвлений, эффективными средствами предсказания ветвлений, новыми инструкциями обработки видеоданных и широкой новыми инструкциями обработки видеоданных и широкой шиной. шиной.

Alpha 21264 читает до четырех инструкций за один Alpha 21264 читает до четырех инструкций за один такттакт и может и может одновременно исполнять до шести одновременно исполнять до шести инструкцийинструкций. Самое большое его отличие от модели 21164 . Самое большое его отличие от модели 21164 - - это способность выполнять команды это способность выполнять команды (впервые для (впервые для Alpha)Alpha) с изменением их очередности с изменением их очередности (Out-of-Order). (Out-of-Order).

Page 12: Лекция №7 Организация ЭВМ и систем

Как и большинство RISC-процессоров, Alpha Как и большинство RISC-процессоров, Alpha содержит содержит набор из 32 целочисленных и 32 регистров с набор из 32 целочисленных и 32 регистров с плавающей запятойплавающей запятой, все они имеют , все они имеют разрядность 64 разрядность 64 битабита. Для повышения эффективности внеочередного . Для повышения эффективности внеочередного выполнения команд процессор 21264 выполнения команд процессор 21264 дополнительнодополнительно к к обычному набору регистров снабжен обычному набору регистров снабжен еще 48 еще 48 целочисленными регистрами и 40 регистрами с целочисленными регистрами и 40 регистрами с плавающей запятойплавающей запятой..

Каждый регистр может временно хранить значения Каждый регистр может временно хранить значения текущих команд. Если обрабатывается какая-либо текущих команд. Если обрабатывается какая-либо инструкция, нет необходимости перегружать результат в инструкция, нет необходимости перегружать результат в целевой регистр - вместо этого ЦП просто целевой регистр - вместо этого ЦП просто переименовывает временный регистр (Register Renaming).переименовывает временный регистр (Register Renaming).

Page 13: Лекция №7 Организация ЭВМ и систем

В В 2126421264 реализована уникальная хитрость - он реализована уникальная хитрость - он имеет имеет задублированный набор целочисленных регистровзадублированный набор целочисленных регистров, , каждый из 80 целочисленных регистров дублируется еще каждый из 80 целочисленных регистров дублируется еще раз. Таким образом, на чипе в целом - раз. Таким образом, на чипе в целом - 160 160 целочисленных регистровцелочисленных регистров. Это одна из причин, почему, . Это одна из причин, почему, несмотря на сложность выполнения Out-of-Order, несмотря на сложность выполнения Out-of-Order, допустима высокая частота процессора 21264.допустима высокая частота процессора 21264.

В процессора 21264 в отличие от его пред-В процессора 21264 в отличие от его пред-шественников практически полностью реорганизована шественников практически полностью реорганизована иерархия кэш-памяти. Он снабжен одним 64-Кбайт кэшем иерархия кэш-памяти. Он снабжен одним 64-Кбайт кэшем первого уровня (L1) для инструкций и еще одним 64-Кбайт первого уровня (L1) для инструкций и еще одним 64-Кбайт кэшем первого уровня для данных; оба являются кэшем первого уровня для данных; оба являются двукратно-ассоциативными. Кэш-память второго уровня двукратно-ассоциативными. Кэш-память второго уровня (L2) была вынесена за пределы чипа - к ней можно (L2) была вынесена за пределы чипа - к ней можно обращаться через 128-бит backside-шину. обращаться через 128-бит backside-шину.

[По материалам В.Михайлов,СomputerWeekly, 41_98 c.25][По материалам В.Михайлов,СomputerWeekly, 41_98 c.25]

Page 14: Лекция №7 Организация ЭВМ и систем

Сравнительные характеристики Сравнительные характеристики Alpha 21164 и 21264Alpha 21164 и 21264

CPUCPU 2116421164 2126421264

Тактовая частота, МГцТактовая частота, МГц 600600 600600

Кэш L1Кэш L1 Емкость:8(I)+8(D)Емкость:8(I)+8(D) Емкость: 64(I)+64(D)Емкость: 64(I)+64(D)

Блокируется при числе Блокируется при числе непопаданий равномнепопаданий равном

22 88

Число ФИУЧисло ФИУ 44 66

Емкость файлаЕмкость файла 32(I)32(I) 80(I), 2 копии80(I), 2 копии

РегистровРегистров 32(FP)32(FP) 72(FP)72(FP)

Переименование регистровПереименование регистров нетнет дада

Внеочередное выполнение Внеочередное выполнение командкоманд

нетнет дада

Динамическое Динамическое предсказание переходовпредсказание переходов

дада усовершенствованноеусовершенствованное

Шина верхнего кэшаШина верхнего кэша системнаясистемная выделеннаявыделенная

Поддержка мультимедиаПоддержка мультимедиа нетнет дада

Число транзисторовЧисло транзисторов 9,3 млн9,3 млн 15,2 млн15,2 млн

Площадь, ммПлощадь, мм22 298298 302302

Page 15: Лекция №7 Организация ЭВМ и систем

Первая версия, Первая версия, 2106421064 или или EV4EV4, был первым КМОП , был первым КМОП микропроцессором, рабочая частота которого сделала его микропроцессором, рабочая частота которого сделала его конкурентом миникомпьютерам и мейнфреймам, конкурентом миникомпьютерам и мейнфреймам, использовавшим гораздо более энергоёмкую элементную использовавшим гораздо более энергоёмкую элементную базу ЭСЛ. Второе поколение, базу ЭСЛ. Второе поколение, 2116421164 или или EV5EV5, был первым , был первым микропроцессором, имевшим накристальный L2-кэш микропроцессором, имевшим накристальный L2-кэш большого объёма. Процессор большого объёма. Процессор 2126421264 ( (EV6EV6), был первым ), был первым микропроцессором, совместившим в себе как высокую микропроцессором, совместившим в себе как высокую рабочую частоту, так и сложную рабочую частоту, так и сложную out-of-order executionout-of-order execution микроархитектуру.микроархитектуру.

Выпуск процессоров архитектуры DEC Alpha был Выпуск процессоров архитектуры DEC Alpha был прекращён 27 октября 2007 года.прекращён 27 октября 2007 года.

Процессор Alpha и заложенные в нём концепции прямо Процессор Alpha и заложенные в нём концепции прямо или косвенно оказали влияние на конструкцию других или косвенно оказали влияние на конструкцию других процессоров и на развитие отрасли в целом.процессоров и на развитие отрасли в целом.

Page 16: Лекция №7 Организация ЭВМ и систем

В оригинальном процессоре AMD Athlon В оригинальном процессоре AMD Athlon использовалась шина, первоначально разработанная для использовалась шина, первоначально разработанная для Alpha. В процессоре AMD Opteron применяется Alpha. В процессоре AMD Opteron применяется высокоскоростная межпроцессорная магистраль высокоскоростная межпроцессорная магистраль HyperTransport и встроенный контроллер памяти — HyperTransport и встроенный контроллер памяти — технологии, аналогичные тем, которые первыми технологии, аналогичные тем, которые первыми предложили разработчики Alpha. Дирк Мейер, главный предложили разработчики Alpha. Дирк Мейер, главный инженер процессоров AMD, раньше работал над Alpha.инженер процессоров AMD, раньше работал над Alpha.

Применяемая в серверных и настольных процессорах Применяемая в серверных и настольных процессорах Intel технология HyperThreading, позволяющая процессору Intel технология HyperThreading, позволяющая процессору решать несколько задач одновременно, навеяна решать несколько задач одновременно, навеяна исследованиями в области многопоточности, исследованиями в области многопоточности, проведёнными командой Alpha в DEC в 1990-е годы. проведёнными командой Alpha в DEC в 1990-е годы.

Page 17: Лекция №7 Организация ЭВМ и систем

Процессоры PA-RISCПроцессоры PA-RISC компании Hewlett-Packard компании Hewlett-Packard

PA-RISC — микропроцессорная архитектура, PA-RISC — микропроцессорная архитектура, разработанная компанией Hewlett-Packard. разработанная компанией Hewlett-Packard.

Первый RISC-процессор серии PA (Precise Первый RISC-процессор серии PA (Precise Architecture), работавший на частоте 8 МГц, компания НР Architecture), работавший на частоте 8 МГц, компания НР выпустила еще в 1985 году. выпустила еще в 1985 году.

Процессор PA-8000 (1996 г.) вобрал в себя все Процессор PA-8000 (1996 г.) вобрал в себя все известные методы ускорения выполнения команд. В его известные методы ускорения выполнения команд. В его основе лежит основе лежит концепция "интеллектуального концепция "интеллектуального выполнения",выполнения", которая которая базируется на принципе базируется на принципе внеочередного выполнения командвнеочередного выполнения команд. .

Page 18: Лекция №7 Организация ЭВМ и систем

Процессоры PA-RISCПроцессоры PA-RISC компании Hewlett-Packard компании Hewlett-Packard

Эти средства хорошо дополняют другие архитектурные Эти средства хорошо дополняют другие архитектурные компоненты, заложенные в структуру кристалла:компоненты, заложенные в структуру кристалла:

большое число исполнительных большое число исполнительных функциональных устройств;функциональных устройств;

средства прогнозирования направления средства прогнозирования направления переходов;переходов;

выполнения команд по предположению;выполнения команд по предположению; оптимизированная организация кэш-памяти;оптимизированная организация кэш-памяти; высокопроизводительный шинный интерфейсвысокопроизводительный шинный интерфейс. .

Page 19: Лекция №7 Организация ЭВМ и систем

Высокая производительность PA-8000 во многом Высокая производительность PA-8000 во многом определяется наличием большого набора определяется наличием большого набора функциональных устройств, который включает в себя функциональных устройств, который включает в себя 10 10 исполнительных устройствисполнительных устройств: два арифметико-логических : два арифметико-логических устройства (АЛУ) для выполнения целочисленных устройства (АЛУ) для выполнения целочисленных операций, два устройства для выполнения операций операций, два устройства для выполнения операций сдвига/слияния данных, два устройства для выполнения сдвига/слияния данных, два устройства для выполнения умножения/сложения чисел с плавающей точкой, два умножения/сложения чисел с плавающей точкой, два устройства деления/вычисления квадратного корня и два устройства деления/вычисления квадратного корня и два устройства выполнения операций загрузки/записи.устройства выполнения операций загрузки/записи.

Средства внеочередного выполнения команд Средства внеочередного выполнения команд процессора PA-8000 обеспечивают аппаратное процессора PA-8000 обеспечивают аппаратное планирование загрузки конвейеров и лучшее планирование загрузки конвейеров и лучшее использование функциональных устройств. использование функциональных устройств. В каждом В каждом такте на выполнение могут выдаваться до четырех такте на выполнение могут выдаваться до четырех командкоманд, которые поступают в 56-строчный буфер , которые поступают в 56-строчный буфер переупорядочивания. переупорядочивания.

Page 20: Лекция №7 Организация ЭВМ и систем

Кристалл может анализировать все 56 командных Кристалл может анализировать все 56 командных строк одновременно и выдавать в каждом такте по 4 строк одновременно и выдавать в каждом такте по 4 готовых для выполнения команды в функциональные готовых для выполнения команды в функциональные устройства. Это позволяет процессору устройства. Это позволяет процессору автоматически автоматически выявлять параллелизм уровня выполнения командвыявлять параллелизм уровня выполнения команд. .

Суперскалярный процессор PA-8000Суперскалярный процессор PA-8000 обеспечивает обеспечивает полный набор средств выполнения 64-битовых полный набор средств выполнения 64-битовых операций, включая адресную арифметику, а также операций, включая адресную арифметику, а также арифметику с фиксированной и плавающей точкой. При арифметику с фиксированной и плавающей точкой. При этом кристалл полностью сохраняет совместимость с 32-этом кристалл полностью сохраняет совместимость с 32-битовыми приложениями и с предыдущими и будущими битовыми приложениями и с предыдущими и будущими реализациями PA-RISC. Это реализациями PA-RISC. Это первый процессор, в первый процессор, в котором реализована 64-битовая архитектура PA-котором реализована 64-битовая архитектура PA-RISCRISC. .

Page 21: Лекция №7 Организация ЭВМ и систем

PA-8200 (1997 г.) представляет собой суперскалярный PA-8200 (1997 г.) представляет собой суперскалярный 64-битный RISC-процессор и реализует архитектуру 64-битный RISC-процессор и реализует архитектуру PA-PA-RISC 2.0RISC 2.0. Существуют две версии этого процессора, . Существуют две версии этого процессора, работающие на частотах 200 и 240 MHz. При тактовой работающие на частотах 200 и 240 MHz. При тактовой частоте в частоте в 240 MHz240 MHz процессор обеспечивает пиковую процессор обеспечивает пиковую производительность в производительность в 960 MFLOPS960 MFLOPS, за счет , за счет одновременного исполнения 4 инструкцийодновременного исполнения 4 инструкций с плавающей с плавающей точкой.точкой.

Процессор PA-8200 включает следующие архитектурные Процессор PA-8200 включает следующие архитектурные особенности:особенности:

Раздельные первичные Раздельные первичные кэшикэши кода и данных, каждый по кода и данных, каждый по 2 2 MBMB. Особенностью архитектуры PA-RISC является . Особенностью архитектуры PA-RISC является внекристальнаявнекристальная реализация кэша, что позволяет реализация кэша, что позволяет увеличивать его объем при необходимости. Кэш-память увеличивать его объем при необходимости. Кэш-память второго уровня не используется. второго уровня не используется.

Page 22: Лекция №7 Организация ЭВМ и систем

10 независимых 10 независимых функциональных устройствфункциональных устройств: : Два 64-разрядных целочисленных АЛУ Два 64-разрядных целочисленных АЛУ Два целочисленных устройства сдвига Два целочисленных устройства сдвига Два устройства умножения и сложения для чисел с Два устройства умножения и сложения для чисел с

плавающей точкой плавающей точкой Два устройства деления и извлечения корня для Два устройства деления и извлечения корня для

чисел с плавающей точкой чисел с плавающей точкой Два устройства чтения/записи данных Два устройства чтения/записи данных

Буфер Буфер переупорядочения инструкцийпереупорядочения инструкций на 56 позиций; на 56 позиций; переупорядоченное выполнение инструкций позволяет переупорядоченное выполнение инструкций позволяет постоянно поддерживать суперскалярный режим работы постоянно поддерживать суперскалярный режим работы процессора. Устройство считывания инструкций процессора. Устройство считывания инструкций доставляет в буфер доставляет в буфер 4 инструкции4 инструкции за такт. за такт.

Управляемая Управляемая предвыборкапредвыборка данных из основной памяти данных из основной памяти в кэш. в кэш.

Page 23: Лекция №7 Организация ЭВМ и систем

Статическое и динамическое предсказание ветвлений Статическое и динамическое предсказание ветвлений 64-битная64-битная адресация памяти адресация памяти Встроенная программируемая аппаратура Встроенная программируемая аппаратура мониторингамониторинга

производительности; позволяет отслеживать такие производительности; позволяет отслеживать такие события как кэш-попадания (промахи), ошибки в события как кэш-попадания (промахи), ошибки в предсказании ветвлений, и т.д. предсказании ветвлений, и т.д.

Page 24: Лекция №7 Организация ЭВМ и систем

18 сентября 2001 года на рынок вышел процессор PA-18 сентября 2001 года на рынок вышел процессор PA-8700. Данный чип стал первым решением НР, 8700. Данный чип стал первым решением НР, использующим медные соединения и SOI-транзисторы. использующим медные соединения и SOI-транзисторы. Построенный с применением технологии 0,18 мк, он Построенный с применением технологии 0,18 мк, он позволил достичь частоты 875 МГц. позволил достичь частоты 875 МГц.

HP прекратила продажи машин HP 9000, основанных HP прекратила продажи машин HP 9000, основанных на PA-RISC, в конце 2008 года. Поддержка серверов на на PA-RISC, в конце 2008 года. Поддержка серверов на процессорах PA-RISC была продолжена до 2013 года. процессорах PA-RISC была продолжена до 2013 года.

Из HP в Intel перешли более 300 инженеров Из HP в Intel перешли более 300 инженеров работавших над Alpha, большинство из них работало над работавших над Alpha, большинство из них работало над процессором Itanium 2.процессором Itanium 2.

Предполагалось, что новые машины, основанные Предполагалось, что новые машины, основанные на Itanium, смогут заменить PA-RISC.на Itanium, смогут заменить PA-RISC.

Itanium представляет собой совместный проект с Itanium представляет собой совместный проект с Intel. При этом НР по праву считает Itanium Intel. При этом НР по праву считает Itanium наследником PA-RISC. наследником PA-RISC.

Page 25: Лекция №7 Организация ЭВМ и систем

Пиковая производительность RISC Пиковая производительность RISC – процессоров на конец XX века– процессоров на конец XX века

МикропроцессорМикропроцессор Частота, МГцЧастота, МГц Производительность,Производительность,

MFLOPSMFLOPS

DEC Alpha 21164DEC Alpha 21164 700700 14001400

DEC Alpha 21264DEC Alpha 21264 800800 16001600

HP PA-8000HP PA-8000 180180 720720

HP PA-8200HP PA-8200 236236 944944

HP PA-8500HP PA-8500 400400 16001600

SGI/MIPS R10000SGI/MIPS R10000 250250 500500

SGI/MIPS R12000SGI/MIPS R12000 300300 600600

Sun UltraSPARC IISun UltraSPARC II 300300 600600

Sun UltraSPARC IIISun UltraSPARC III 600600 12001200

Page 26: Лекция №7 Организация ЭВМ и систем

Особенности процессоров с Особенности процессоров с архитектурой SPARC компании архитектурой SPARC компании

Sun MicrosystemsSun Microsystems SPARC (Scalable Processor ARChitecture — SPARC (Scalable Processor ARChitecture —

масштабируемая архитектура процессора) — архитектура масштабируемая архитектура процессора) — архитектура RISC-микропроцессоров, первоначально разработанная в RISC-микропроцессоров, первоначально разработанная в 1985 году компанией Sun Microsystems.1985 году компанией Sun Microsystems.

Архитектура SPARC является открытой, что означает:Архитектура SPARC является открытой, что означает:Архитектура системы команд SPARC опубликована Архитектура системы команд SPARC опубликована

как стандарт IEEE 1754—1994;как стандарт IEEE 1754—1994;Спецификации SPARC доступны для лицензирования Спецификации SPARC доступны для лицензирования

любой компанией или частным лицом и дают возможность любой компанией или частным лицом и дают возможность разрабатывать свои собственные решения;разрабатывать свои собственные решения;

Развитием архитектуры SPARC занимается Развитием архитектуры SPARC занимается независимая некоммерческая организация SPARC независимая некоммерческая организация SPARC International, Inc., основанная в 1989 году. Членство в International, Inc., основанная в 1989 году. Членство в SPARC International открыто для всех желающих.SPARC International открыто для всех желающих.

Page 27: Лекция №7 Организация ЭВМ и систем

Для производства процессоров с архитектурой SPARC Для производства процессоров с архитектурой SPARC достаточно закупить у SPARC International, Inc. лицензию достаточно закупить у SPARC International, Inc. лицензию на архитектуру системы команд ($99) и разработать свою на архитектуру системы команд ($99) и разработать свою реализацию архитектуры, либо закупить готовую реализацию архитектуры, либо закупить готовую реализацию (что несколько дороже).реализацию (что несколько дороже).

Существовало 3 основные ревизии архитектуры Существовало 3 основные ревизии архитектуры SPARC: версии 7, 8 и 9. Иногда UltraSPARC серии T SPARC: версии 7, 8 и 9. Иногда UltraSPARC серии T выделяются как отдельные архитектуры UltraSPARC выделяются как отдельные архитектуры UltraSPARC Architecture 2005 и 2007.Architecture 2005 и 2007.

Версия 8 архитектуры SPARC описывает 32-разрядный Версия 8 архитектуры SPARC описывает 32-разрядный микропроцессор, тогда как версия 9 — 64-разрядный.микропроцессор, тогда как версия 9 — 64-разрядный.

Процессоры с архитектурой SPARC лицензированы и Процессоры с архитектурой SPARC лицензированы и изготавливаются по спецификациям Sun несколькими изготавливаются по спецификациям Sun несколькими производителями, среди которых следует отметить производителями, среди которых следует отметить компании Texas Instruments, Fujitsu, LSI Logic, Bipolar компании Texas Instruments, Fujitsu, LSI Logic, Bipolar International Technology, Philips и Cypress Semiconductor. International Technology, Philips и Cypress Semiconductor.

В 1990 году Sun передала все права на архитектуру В 1990 году Sun передала все права на архитектуру SPARC организации SPARC International, SPARC организации SPARC International, которая в которая в настоящее время включаетнастоящее время включает более 250 членов. более 250 членов.

Page 28: Лекция №7 Организация ЭВМ и систем

SuperSPARC (1992 г.)SuperSPARC (1992 г.)

Дальнейшее Дальнейшее увеличение производительностиувеличение производительности процессоров с архитектурой SPARC было процессоров с архитектурой SPARC было достигнуто за счет достигнуто за счет реализации в кристаллах принципов суперскалярной реализации в кристаллах принципов суперскалярной обработки обработки компаниямикомпаниями Texas Instruments и Cypress. Texas Instruments и Cypress. Процессор SuperSPARC стал основой серии рабочих станций и Процессор SuperSPARC стал основой серии рабочих станций и серверов SPARCstation/SPARCserver 10 и серверов SPARCstation/SPARCserver 10 и SPARCstation/SPARCserver 20. Имеется несколько версий этого SPARCstation/SPARCserver 20. Имеется несколько версий этого процессора, позволяющего в зависимости от смеси команд процессора, позволяющего в зависимости от смеси команд обрабатывать обрабатывать до трех команд за один машинный тактдо трех команд за один машинный такт, , отличающихся тактовой частотой. Процессор имеет отличающихся тактовой частотой. Процессор имеет сбалансированную производительность на операциях с сбалансированную производительность на операциях с фиксированной и плавающей точкой, фиксированной и плавающей точкой, внутренний кэш внутренний кэш емкостью 36 Кб (20 Кб - кэш команд и 16 Кб - кэш данныхемкостью 36 Кб (20 Кб - кэш команд и 16 Кб - кэш данных), ), раздельные конвейеры целочисленной и вещественной раздельные конвейеры целочисленной и вещественной арифметики и при тактовой частоте 75 МГц обеспечивает арифметики и при тактовой частоте 75 МГц обеспечивает производительность около 205 MIPS.производительность около 205 MIPS.

Процессор SuperSPARC применяется также в серверах Процессор SuperSPARC применяется также в серверах SPARCserver 1000 и SPARCcenter 2000 компании Sun. SPARCserver 1000 и SPARCcenter 2000 компании Sun.

Page 29: Лекция №7 Организация ЭВМ и систем

hyperSPARC (1993 г.)hyperSPARC (1993 г.)

Процессорный набор hyperSPARC с тактовой частотой Процессорный набор hyperSPARC с тактовой частотой 100 МГц построен на основе технологического процесса 100 МГц построен на основе технологического процесса КМОП с тремя уровнями металлизации и проектными КМОП с тремя уровнями металлизации и проектными нормами 0.5 микрон. Внутренняя логика работает с нормами 0.5 микрон. Внутренняя логика работает с напряжением питания 3.3 В. напряжением питания 3.3 В.

Процессор hyperSPARC реализован в виде Процессор hyperSPARC реализован в виде многокристальной микросборкимногокристальной микросборки, в состав которой входит , в состав которой входит суперскалярная конвейерная часть и тесно связанная с ней суперскалярная конвейерная часть и тесно связанная с ней кэш-память второго уровня. В набор кристаллов входят кэш-память второго уровня. В набор кристаллов входят RT620 (CPU) - центральный процессор, RT625 (CMTU) - RT620 (CPU) - центральный процессор, RT625 (CMTU) - контроллер кэш-памяти, устройство управления памятью и контроллер кэш-памяти, устройство управления памятью и устройство тегов, четыре RT627 (CDU) - кэш-память устройство тегов, четыре RT627 (CDU) - кэш-память данных для реализации кэш-памяти второго уровня данных для реализации кэш-памяти второго уровня емкостью 256 Кбайт. RT625 обеспечивает также интерфейс емкостью 256 Кбайт. RT625 обеспечивает также интерфейс с MBus. с MBus.

Page 30: Лекция №7 Организация ЭВМ и систем
Page 31: Лекция №7 Организация ЭВМ и систем

MicroSPARC-II (1994 г.)MicroSPARC-II (1994 г.)

MicroSPARC-II представляет собой MicroSPARC-II представляет собой высокоинтегрированную микросхему, содержащую высокоинтегрированную микросхему, содержащую целочисленное устройство, устройство управления целочисленное устройство, устройство управления памятью, устройство плавающей точки, раздельную кэш-памятью, устройство плавающей точки, раздельную кэш-память команд и данных, контроллер управления память команд и данных, контроллер управления микросхемами динамической памяти и контроллер шины микросхемами динамической памяти и контроллер шины SBus. SBus.

Основными свойствами целочисленного устройства Основными свойствами целочисленного устройства microSPARC-II являются: microSPARC-II являются:

пятиступенчатый конвейер команд; пятиступенчатый конвейер команд; предварительная обработка команд переходов; предварительная обработка команд переходов; поддержка потокового режима работы кэш-памяти поддержка потокового режима работы кэш-памяти

команд и данных; команд и данных; регистровый файл емкостью 136 регистров регистровый файл емкостью 136 регистров (8 (8

регистровых окон); регистровых окон); интерфейс с устройством плавающей точки; интерфейс с устройством плавающей точки; предварительная выборка команд с очередью на предварительная выборка команд с очередью на

четыре команды. четыре команды.

Page 32: Лекция №7 Организация ЭВМ и систем
Page 33: Лекция №7 Организация ЭВМ и систем

В 2009 году компания Oracle купила компанию Sun.В 2009 году компания Oracle купила компанию Sun.Новые серверы линеек SPARC T5 и M5 работают под Новые серверы линеек SPARC T5 и M5 работают под

управлением ОС Oracle Solaris. Они относятся к среднему управлением ОС Oracle Solaris. Они относятся к среднему и верхнему сегменту производительности и предназначены и верхнему сегменту производительности и предназначены для корпоративных приложений, интенсивно работающих с для корпоративных приложений, интенсивно работающих с базами данных, а также критически важных бизнес-базами данных, а также критически важных бизнес-приложений. приложений.

Основой серверов SPARC T5 стал одноименный Основой серверов SPARC T5 стал одноименный процессор, который Oracle называет самым быстрым в процессор, который Oracle называет самым быстрым в мире микропроцессором. мире микропроцессором. Микропроцессор с 16 ядрами Микропроцессор с 16 ядрами работает на частоте 3,6 ГГц, работает на частоте 3,6 ГГц, одновременно выполняя до одновременно выполняя до 128 потоков команд. В конфигурацию процессора входит 8 128 потоков команд. В конфигурацию процессора входит 8 МБ совместно используемой кэш-памяти третьего уровня и МБ совместно используемой кэш-памяти третьего уровня и по 128 КБ кэш-памяти второго уровня в расчете на каждое по 128 КБ кэш-памяти второго уровня в расчете на каждое ядро. ядро.

Oracle SPARC T5-8 — самый быстрый одиночный Oracle SPARC T5-8 — самый быстрый одиночный сервер для Oracle Database и для Oracle Middleware. По сервер для Oracle Database и для Oracle Middleware. По соотношению цены и производительности он в 12 раз соотношению цены и производительности он в 12 раз превосходит сервер IBM Power 780. превосходит сервер IBM Power 780.

Page 34: Лекция №7 Организация ЭВМ и систем

Помимо SPARC T5-8, список новинок включает серверный модуль SPARC T5-1B, серверы SPARC T5-2, SPARC T5-4 и SPARC M5-32 (в ней используются шестиядерные процессоры T5).

Page 35: Лекция №7 Организация ЭВМ и систем

«Computerworld Россия», № 21, 2013«Computerworld Россия», № 21, 2013

Процессор SPARC M6 имеет 12 ядер — в два раза Процессор SPARC M6 имеет 12 ядер — в два раза больше, чем у его предшественника SPARC M5. Каждое больше, чем у его предшественника SPARC M5. Каждое ядро M6 способно одновременно выполнять 8 потоков. ядро M6 способно одновременно выполнять 8 потоков. Общее число потоков, одновременно обрабатываемых Общее число потоков, одновременно обрабатываемых чипом, может достигать 96.чипом, может достигать 96.

Новые чипы могут устанавливаться в двух-, четырех- и Новые чипы могут устанавливаться в двух-, четырех- и восьмипроцессорные серверы, однако использование восьмипроцессорные серверы, однако использование специальных устройств Bixby позволит строить 32-, 48- и специальных устройств Bixby позволит строить 32-, 48- и даже 96-процессорные серверы с разделением памяти и даже 96-процессорные серверы с разделением памяти и других ресурсов. M6 призван сбалансировать других ресурсов. M6 призван сбалансировать производительность серверов, уменьшить задержки и производительность серверов, уменьшить задержки и обеспечить быструю обработку транзакций. Функции обеспечить быструю обработку транзакций. Функции связности для больших систем разрабатывались с нуля и связности для больших систем разрабатывались с нуля и могут применяться к небольшим серверным пулам.могут применяться к небольшим серверным пулам.

Page 36: Лекция №7 Организация ЭВМ и систем

«Computerworld Россия», № 21, 2013«Computerworld Россия», № 21, 2013

Компания Fujitsu анонсировала новейший 16-ядерный Компания Fujitsu анонсировала новейший 16-ядерный чип SPARC X+ для мэйнфреймов. Процессор работает на чип SPARC X+ для мэйнфреймов. Процессор работает на частоте 3,5 ГГц и выше и может использоваться в частоте 3,5 ГГц и выше и может использоваться в мэйнфреймах с 64-процессорной конфигурацией. Каждое мэйнфреймах с 64-процессорной конфигурацией. Каждое ядро одновременно обрабатывает два потока, в общей же ядро одновременно обрабатывает два потока, в общей же сложности мэйнфрейм способен параллельно выполнять сложности мэйнфрейм способен параллельно выполнять 2048 потоков.2048 потоков.

Page 37: Лекция №7 Организация ЭВМ и систем

В ноябре 2002 года микропроцессоры SPARC В ноябре 2002 года микропроцессоры SPARC использовались в 88 из 500 (17,60 %) самых мощных использовались в 88 из 500 (17,60 %) самых мощных компьютеров, однако с тех пор потеряли популярность, компьютеров, однако с тех пор потеряли популярность, будучи заменены на процессоры от IBM, Intel и AMD.будучи заменены на процессоры от IBM, Intel и AMD.

По состоянию на июль 2009 только один По состоянию на июль 2009 только один суперкомпьютер на процессорах SPARC включён в список суперкомпьютер на процессорах SPARC включён в список самых быстрых компьютеров TOP500. Находящийся на 28 самых быстрых компьютеров TOP500. Находящийся на 28 месте суперкомпьютер Fujitsu FX1 использует месте суперкомпьютер Fujitsu FX1 использует четырёхядерные микропроцессоры SPARC64 VII 2,52 ГГц и четырёхядерные микропроцессоры SPARC64 VII 2,52 ГГц и имеет производительность 121 282 GFLOPS. Он имеет производительность 121 282 GFLOPS. Он установлен в Японском агентстве аэрокосмических установлен в Японском агентстве аэрокосмических исследований. исследований.

В 2011 году самым быстрым суперкомпьютером в В 2011 году самым быстрым суперкомпьютером в рейтинге TOP500 признан «K computer» компании Fujitsu рейтинге TOP500 признан «K computer» компании Fujitsu он собран из 68 544 восьмиядерных процессоров он собран из 68 544 восьмиядерных процессоров SPARC64 VIIIfx и его мощность составляет 8,16 Пфлопс, SPARC64 VIIIfx и его мощность составляет 8,16 Пфлопс, пиковая 8,77 Пфлопс. пиковая 8,77 Пфлопс.

Page 38: Лекция №7 Организация ЭВМ и систем

Микропроцессоры архитектуры Микропроцессоры архитектуры SPARCSPARC лицензированы лицензированы и изготавливаются по спецификациям и изготавливаются по спецификациям SunSun несколькими несколькими производителями, в том числе ЗАО «МЦСТ».производителями, в том числе ЗАО «МЦСТ».

МЦСТ (закрытое акционерное общество (ЗАО) «МЦСТ») — МЦСТ (закрытое акционерное общество (ЗАО) «МЦСТ») — российская компания, специализирующаяся на разработке российская компания, специализирующаяся на разработке универсальных микропроцессоров, микроконтроллеров и универсальных микропроцессоров, микроконтроллеров и управляющих вычислительных комплексов. Имеет опыт разработки управляющих вычислительных комплексов. Имеет опыт разработки супер-ЭВМ «Эльбрус». Также в компании ведутся разработки супер-ЭВМ «Эльбрус». Также в компании ведутся разработки оптимизирующих и двоичных компиляторов, операционных систем. оптимизирующих и двоичных компиляторов, операционных систем. ЗАО «МЦСТ» является базовой организацией кафедры информатики и ЗАО «МЦСТ» является базовой организацией кафедры информатики и вычислительной техники Московского физико-технического института вычислительной техники Московского физико-технического института (государственного университета).(государственного университета).

Процессоры архитектуры Процессоры архитектуры SPARC V8SPARC V8 (МЦСТ R150 и (МЦСТ R150 и МЦСТ R500) – первые продукты ЗАО «МЦСТ». ) – первые продукты ЗАО «МЦСТ».

Page 39: Лекция №7 Организация ЭВМ и систем

Структура ядра микропроцессора МЦСТ

R500Кэш команд первого уровня (I$) –составляет 16 Кбайт. 2 регистровых файла: - регистровый файл целочисленных данных содержит 136 регистров по 32 бита (8 окон по 16 регистров и 1 окно из 8 глобальных регистров).- регистровый файл вещественных данных содержит 32 регистра 32-разрядных данных. При этом модуль может трактоваться в программах как набор из 32 регистров одинарного формата (разрядность 32 бита), либо как 16 регистров двойного формата (разрядность 64 бита), либо как смешанный набор регистров первого и второго вида.

Page 40: Лекция №7 Организация ЭВМ и систем

Процессоры ARMПроцессоры ARM

ARM-процессоры – 32-битные чипы на базе ARM-процессоры – 32-битные чипы на базе архитектуры RISC (Reduced Instruction Set Computer), то архитектуры RISC (Reduced Instruction Set Computer), то есть с сокращённым набором команд. В основу этой есть с сокращённым набором команд. В основу этой архитектуры положена идея повышения быстродействия архитектуры положена идея повышения быстродействия за счёт максимального упрощения инструкций и за счёт максимального упрощения инструкций и ограничения их длины.ограничения их длины.

Современные ARM-процессоры – это суперскалярные Современные ARM-процессоры – это суперскалярные суперконвейерные микросхемы, построенные на основе суперконвейерные микросхемы, построенные на основе RISC-архитектуры.RISC-архитектуры.

Page 41: Лекция №7 Организация ЭВМ и систем

На основе Cortex-A8 На основе Cortex-A8 построен модный построен модный планшет Apple iPad.планшет Apple iPad.

Первые чипы на базе Первые чипы на базе Cortex-A9 – NVIDIA Cortex-A9 – NVIDIA Tegra 2 – это Tegra 2 – это двухъядерные двухъядерные микросхемы с микросхемы с графическим ядром, графическим ядром, поддерживающим поддерживающим видео формата Full видео формата Full HD 1080p и HD 1080p и трёхмерную графику трёхмерную графику с программным с программным интерфейсом OpenGL интерфейсом OpenGL ES 2.0. ES 2.0.

Page 42: Лекция №7 Организация ЭВМ и систем

Представлен процессор Представлен процессор ARM Cortex-A17ARM Cortex-A1711.02.2014г.11.02.2014г.

По оценке разработчика, процессор ARM Cortex-A17 по производительности превосходит процессор ARM Cortex-A9 на 60%. Кроме того, он имеет лучшие показатели энергетической эффективности и использования площади кристалла.

Источник: http://www.ixbt.com/news/hard/index.shtml?17/65/10

Page 43: Лекция №7 Организация ЭВМ и систем

Области применения Области применения RISC - процессоровRISC - процессоров

1.1. Рабочие станции высшего ценового класса (12-15 Рабочие станции высшего ценового класса (12-15 тыс.$). Работают под ОС VMS, Unix.тыс.$). Работают под ОС VMS, Unix.

2.2. Персональные рабочие станции (3-7 тыс. $). ОС: Персональные рабочие станции (3-7 тыс. $). ОС: Windows NT, Solaris.Windows NT, Solaris.

3.3. Серверы.Серверы.

4.4. RISC ПК.RISC ПК.

Page 44: Лекция №7 Организация ЭВМ и систем

Вопросы для самоконтроляВопросы для самоконтроля

1.1. С чем связано появление RISC-процессоров?С чем связано появление RISC-процессоров?

2.2. Основные особенности RISC-процессоров.Основные особенности RISC-процессоров.

3.3. Назовите фирмы-разработчики RISC процессоров. Назовите фирмы-разработчики RISC процессоров.

4.4. Архитектурные особенности процессоров Alpha.Архитектурные особенности процессоров Alpha.

5.5. Архитектурные особенности процессора PA-8000.Архитектурные особенности процессора PA-8000.

6.6. Области применения RISC-процессоров.Области применения RISC-процессоров.