14
Vysoká škola Banská – Technická Univerzita Ostrava Pokročilé architektury počítačů Přehled historie a vývoje architektur procesorů Intel Core i5, i7 a i9 systém Michal Krupa kru218 17.10.2009

Pokročilé architektury počítačůwh.cs.vsb.cz/mil051/images/a/a9/PAP_Přehled... · rôznych konfiguráciách, Core i5-7xx, Core i7-8xx alebo Xeon X34xx. Predstavuje nové riešenie

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Vysoká škola Banská – Technická Univerzita Ostrava

Pokročilé architektury počítačů Přehled historie a vývoje architektur procesorů

Intel Core i5, i7 a i9 systém

Michal Krupa kru218 17.10.2009

Obsah 1.Úvod .................................................................................................................................. 3

2. Intel Nehalem ................................................................................................................ 4

2.1. Bloomfield ................................................................................................................. 4

Pätica ............................................................................................................................ 4

Zbernica QuickPath Interconnect ................................................................................... 5

Hyperthreading .............................................................................................................. 5

Režim Turbo a Deep Power Down ................................................................................ 6

Rozloženie cache ........................................................................................................... 6

Škálovateľnosť .............................................................................................................. 7

2.2. Lynnfield .................................................................................................................... 8

PCI Express ................................................................................................................... 9

Turbo Boost ................................................................................................................ 10

3. Intel Westmere ............................................................................................................ 11

Grafické jadro ............................................................................................................. 11

3.1. Clarkdale, Arrandale ................................................................................................ 12

3.2. Gulftown .................................................................................................................. 12

4. Záver ........................................................................................................................... 13

5. Zoznam použitej literatúry ........................................................................................... 14

Obrázky

Obrázok 1: Strategia Tick-Tock ............................................................................................ 3

Obrázok 2: Procesory z rodiny Nehalem ............................................................................... 4

Obrázok 3: Jadro procesoru Core i7...................................................................................... 5

Obrázok 4: Power Control Unit (PCU) .................................................................................. 6

Obrázok 5: Architektúra procesora Bloomfield ..................................................................... 7

Obrázok 6: Architektúra procesora Lynnfield ........................................................................ 8

Obrázok 7: Jadro procesoru Lynnfield ................................................................................... 9

Obrázok 8: Turbo Boost u Lynnfield ................................................................................... 10

Obrázok 9: Rozdiel medzi jadrami ...................................................................................... 11

1. Úvod Intel uvádza svoje výrobky podľa niekoľko rokov fungujúceho kľúča. Tento model sa volá Tick-Tock a predstavuje vždy dva kroky súčasnej architektúry. Prvým krokom je Tock, ktorý prináša na trh úplne novú architektúru na bežnom výrobnom procese svojej doby. Príkladom budiž nástup architektúry Nehalem na 45 nm výrobnom postupe. Druhá fáza sa volá Tick a vylepšuje pôvodné riešenie o pokročilejší výrobný proces, z praxe je to prechod procesorov zo 45nm na Westmere 32nm procesori.

Obrázok 1: Strategia Tick-Tock

2. Intel Nehalem

V chystaných procesoroch Intelu z rodiny Nehalem sa asi orientuje len málokto. Všetky v poslednej dobe uvedené a v dohľadnej dobe plánované procesory, o ktorých je reč, sú vyrábané 45nm procesom, prechod na 32nm proces je naplánovaný niekedy na prelome roka 2009/2010 a ako prvý by sa mal objaviť u chystaných dvojjadrových procesorov z nižšej triedy.

Obrázok 2: Procesory z rodiny Nehalem

2.1. Bloomfield

Bloomfield je kódové označenie pre procesory Intel high-end počítačov predávaných ako Core i7-9xx s inštrukčnou sadou x86-64, v takmer identickej konfigurácii, ktorý nahrádza staršie procesory Yorkfield (Core 2). Bloomfield má veľa nových funkcií, ktoré predstavujú významné zmeny od Yorkfield:

Pätica Takmer 600 nových pinov pre nové funkcie. Nové procesory Core i7 nie je možné zasadiť do patice 775, pretože majú na rozdiel od CPU Core2 Duo 1 366 pinov. Zavedenie novej pätice bolo potrebné predovšetkým z toho dôvodu, aby bolo možné pripojiť k základnej doske viacero nových častí procesorov Core i7. Z toho je aj zrejme, že ak chcete prejsť na nový procesor, budete si musieť kúpiť aj novú dosku.

Zbernica QuickPath Interconnect Najpodstatnejšia inovácia architektúry Nehalem je nahradenie zbernice Front Side Bus (FSB), ktorá doteraz zabezpečovala komunikáciu medzi procesorom a čipovou sadou. Jej nástupcom sa stala zbernica QuickPath Interconnect (QPI). Starý systém komunikácie cez zbernicu FSB bolo potrebné prerobiť, pretože jeho priepustnosť už nestačila novým nárokom. Zbernica QPI disponuje 20bitovým obojsmerným prepojením, ktoré je schopné prenášať dáta maximálnou rýchlosťou 25,6 GB/s, teda presne dvakrát rýchlejšie, než to dokázala zbernica FSB, pracujúca na frekvencii 1 600 MHz. U najnovších procesorov Core i7 Intel úspešne aplikoval integráciu pamäťového radiču priamo do procesora štandardu DDR3 SDRAM. Špecialitou v súčasnosti najvyšších modelov Core i7 je integrované trojnásobné prepojenie pamäťových kanálov. Na dosiahnutie maximálneho výkonu je teda potrebné použiť tri pamäťové moduly v rozložení 3,6 alebo 12 GB, čo zatiaľ nebolo v oblasti osobných počítačov bežné. Lacné varianty procesorov Core i7, však budú opäť podporovať dvojkanálové pamäťové prepojenie.

Obrázok 3: Jadro procesoru Core i7

Hyperthreading //Dve virtuálne CPU v každom fyzickom jadre Od zakončenie predaja procesorov Pentium 4 upadla technológia HyperThreading takmer do zabudnutia, ale teraz sa vracia. Intel označuje technológiu simultánneho spracovania dvoch programových vlákien v jednom fyzickom jadre ako " Simultaneous multithreading" (SMT). Výsledkom je impozantný nárast počtu procesorových jadier na osem (štyri fyzické + štyri virtuálne), takže v Správcovi zariadení Windows je procesor Core i7 uvedený hneď osemkrát pod sebou. SMT zabezpečuje oveľa lepšie využitie pracovného vyťaženia jednotlivých fyzických jadier v procesore a výsledkom je výkonnostný nárast v poriadku 30 percent.

Režim Turbo a Deep Power Down Procesory Core i7 môžu nastaviť jednotlivým jadrám rôzne funkčné režimy, teda rozdielne pracovné frekvencie. Zvlášť zaujímavý je režim Turbo, ktorý umožňuje automatické pretaktovanie plne vyťažených jadier, ktoré spracúvajú určité programové vlákna, zatiaľ čo zvyšok jadra CPU nie sú plne využité. Výsledkom pretaktovania je až 10 percentný výkonnostný nárast. V prípade, že je procesor využitý málo, automaticky sa vie prepnúť do tzv. stavu C6 (režim Deep Power Down), v ktorom je nevyužité jadro úplne odpojené od napájania. Túto reguláciu umožňuje mikrokontrolér PCU (Power Control Unit) sledujúci teplotu a spotrebu jednotlivých jadier.

Obrázok 4: Power Control Unit (PCU)

Rozloženie cache Jednou zo slabín predchádzajúceho dizajnu cache pamäte bol fakt, že obe jadrá pristupovala do veľkej (6 MB) spoločnej vyrovnávacej pamäte L2. Tento princíp síce dobre fungoval pre rýchlu výmenu dát medzi dvoma jadrami procesora, ale kvôli prepojenie cez FSB zbernicu bol príliš pomalý pre výmenu dát medzi štyrmi jadrami. U procesorov Core i7 je L2 cache vyhradená pre každé jednotlivé fyzické jadro a je o poznanie menšia (len 256 kB pre každé jadro), zato ale o 50% rýchlejšia. Výmenu dát medzi jednotlivými jadrami zabezpečuje vyrovnávacia pamäť L3, ktorá má u dvojjadrových procesorov veľkosť 4 MB, pri quadcore procesorov potom 8 MB. Vyrovnávacia pamäť L3 cache získava dáta z L1 a L2 cache, čo výrazne zrýchľuje vyhľadávanie dát. Vyhľadávanie dát teda nie je vykonané v samostatných vyrovnávacích pamätiach a ty tak môžu byť v prípade nekonania jednotlivých jadier odpojené od napájania, a to bez rizika straty dát.

Škálovateľnosť Škálovateľnosť architektúry Core i7 je jednoducho unikátna a možno vďaka nej použiť rovnakú architektúru procesora pre stolné počítače, servery aj notebooky. Vďaka novému rozdelenie CACHE pamätí a zavedení zbernice QPI možno teraz do jedného procesorového púzdra umiestniť dve, štyri alebo i osem fyzických jadier. Vysoká rýchlosť QPI naviac umožňuje použitie viacerých procesorových pätíc typu 1366 na jednej základnej doske, pričom komunikácia medzi jednotlivými procesormi prebieha po samostatných QPI kanáloch. Core i7 sa môže teda použiť aj vo dvojprocesorových pracovných staniciach, ktoré sa tak budú po uvedení modelov Core i7 s ôsmimi fyzickými jadrami môcť pochváliť až 32 virtuálnymi procesormi.

Obrázok 5: Architektúra procesora Bloomfield

2.2. Lynnfield

Lynnfield je kódové označenie pre procesor Intel vydaná v septembri 2009. To sa predáva v rôznych konfiguráciách, Core i5-7xx, Core i7-8xx alebo Xeon X34xx. Predstavuje nové riešenie pre CPU s jadrom Lynnfield a päticou LGA 1156. Procesor je vybavený štyrmi fyzickými jadrami a integrovaným radičom pamätí. Ten je na rozdiel od vyšších modelov Core i7 900 iba dvoj kanálový (Dual channel).

Obrázok 6: Architektúra procesora Lynnfield

PCI Express Novinkou je aj integrácia akéhosi "severného mostíka" s PCI Express (16 liniek) rozhrania priamo do procesora, teda nám úplne odpadá nutnosť severného mostíka na doske v podobe samostatného čipu. Procesor je so zvyškom systému - PCH čipom (Ibexpeak) spojený skrz DMI zbernicu. Ak si myslíte, že v nových procesoroch nie je zbernica QPI, tak sa mýlite. V tomto prípade ušetria aj výrobcovia dosiek, kde je za potreby len jeden čip a taktiež je lacnejšia a jednoduchšia výroba.

Obrázok 7: Jadro procesoru Lynnfield

Turbo Boost Turbo Boost je funkcia, ktorá umožňuje zvýšenie násobiča (a spolu s tým aj frekvenciu) procesora v prípade, že na ňom bežia aplikácie náročné na výkon, ktoré nie sú optimalizované pre viacjadrové procesory a časť procesora nie je preplnená. S Turbo Boost by na tom mali byť chystané procesory dokonca lepšie, než výkonnejšie Core i7.

Obrázok 8: Turbo Boost u Lynnfield

3. Intel Westmere Začiatok budúceho roka, keď Intel uvedie novú generáciu procesorov s kódovým označením Westmere. Tá vychádza z dnešného Nehalemu a bude vyrábaná už modernejšou 32 nm technológiou. Prvé procesory s jadrom Westmere budú dvojjadrové s podporou Hyper-Threading technológie, takže pre operačný systém sa bude vlastne jednať o čtvorjadro. Vychádza z architektúry Nehalem a preto majú aj všetky jeho výhody. Okrem výborne integrovaných úsporných režimov je to hlavne Turbo Boost, ktorý podobne ako u Lynnfieldu zdvihne frekvenciu o solídne množstvo megahertzov. Navyše je Turbo Boost integrovaný aj do grafického jadra a tak dokáže procesor naozaj dynamicky reagovať na výpočtové požiadavky a pridávať Biny (základná BCLOCK jednotka, s ktorou sa zvyšuje frekvencia u Turbo Boost technológie), kde je potreba.

Obrázok 9: Rozdiel medzi jadrami

Grafické jadro Grafické jadro nie je integrované úplne do CPU, ale ako samostatný čip vyrábaný 45 nm technológiou a umiestnený pod rovnaké IHS. Ide vlastne o akýsi zlepenec, ktorý bude mať jeden spoločný chladič. Integrované grafické jadro je pochopiteľné novšie ako dnes ponúkané modely a podľa všetkého bude taktiež o niečo výkonnejšie.

3.1. Clarkdale, Arrandale

Na trh prídu tieto procesory s jadrom Westmere vyrábané 32nm technológiou hneď v dvoch prevedeniach a obe budú mať integrované grafické jadro vyrábané 45nm technológiou. Pre desktopy to bude procesor s kódovým označením Clarkdale. Ten sa bude podľa všetkého predávať ako Core i3. Svojou cenou zapadne do najnižšieho segmentu. Druhá varianta určená pre notebooky sa označuje ako Arrandale a v podstate sa jedná o rovnaký procesor s identickými vlastnosťami, len upravený pre mobilné prevedenie a teda s menšou spotrebou, nižšou frekvenciou a tak ďalej. Procesory sú určene pre päticu LGA 1156, ktorú používajú aj Core i5 a podporuje HyperThreading. Disponuje 512 kB (2 × 256 kB) L2 cache a 4 MB L3 cache.

3.2. Gulftown

Šesťjadrový procesor Gulftown bude nový hi-end na desktopu označovať ako Core i9. Šesťjadrový Gulftown je založený na vylepšenej architektúre Westmere, ktorá vychádza z Nehalemu a je určená pre pokročilejšiu 32nm technológiu výroby. Nový procesor, ktorý je zatiaľ predbežne naplánovaný na prvý štvrťrok budúceho roku, znáša s veľkou pravdepodobnosťou oficiálny názov Core i9 (Core i7 + 2 jadrá) a stane sa tak najvýkonnejším procesorom Intel, ktorý je určený pre desktop. Kompatibilita je zaručená so súčasným socketem LGA 1366 a čipsetom X58 (podľa revízie základnej dosky a biosu), pričom oproti Core i7 ponúkne o polovicu väčšiu L3 cache na 12MB a samozrejme ďalšie dve jadrá. Vďaka podpore HyperThreading tak zvládne naraz spracovať až 12 vlákien.

4. Záver

Spoločnosť Intel v súčasnosti najväčšia spoločnosť na svete, ktorá vyrába 75% všetkých procesorov, nespí a myslí na budúcnosť. Ešte dnes sa môžeme stretnúť s procesormi vyrábanými 65nm technológiou a procesory vyrábané 45nm a 32nm technológiou sa iba udomácňujú na trhu, a už spoločnosť Intel informovala o vyrobení vôbec prvých funkčných 22 nm čipov. Prvé 22 nm čipy obsahujú ako zvyčajne u prvých čipov vyrobených novým výrobným procesom SRAM pamäť a logické obvody, ktoré budú použité aj v 22 nm procesoroch. Na jednom testovacom čipe sa nachádza 2.9 miliardy tranzistorov. Podľa informácií Intelu je hustota tranzistorov na 22 nm čipoch približne až dvojnásobná oproti 32 nm čipom. Prvé 22 nm procesory by podľa plánov Intelu mali byť uvedené na trh o dva roky.

5. Zoznam použitej literatúry

[1] http://pctuning.tyden.cz/hardware/procesory-pameti/ [2] http://www.zive.cz/ [3] http://www.zive.sk [4] http://www.chip.cz [5] http://en.wikipedia.org