Upload
athanase-lepretre
View
108
Download
0
Embed Size (px)
Citation preview
Performances 1
Objectifs :
• Comment mesurer, décrire et résumer les performances et décrire les principaux facteurs qui déterminent les performances d’un ordinateur.
Performances 2
Microprocesseur
Performances 3
Vue symbolique
Métal : BleuOxyde : RougeSemi conducteur : Vert
Performances 4
Fonctionnement du transistor
Source Drain
Performances 5
Fonctionnement du transistor
Source Drain
Performances 6
Fonctionnement du transistor
Source DrainV. Grille < V. Seuil
-- - --- -
-- - --- -
Performances 7
Fonctionnement du transistor
Source Drain
Performances 8
Fonctionnement du transistor
Source Drain
Transistor passant
V. Grille > V. Seuil
Performances 9
remarques
• J. Bardeen, W. Shockley, W. Brattain– Reçoivent en 1947, 10 $ pour la découverte du T bipolaire.– En 1956 le prix Nobel.
• W. Shockley – rédige la théorie en 1951.
Performances 10
Questions à résoudre
Machine A500 MHZ
Machine B350 MHZ
Performances 11
Articles de Vendeurs
Voir page 9 de l’article
Performances 12
L’informatique : une grande cuisine
L’informatique : une grande cuisine
Performances 13
La famille intel
Pentium 4 à 1,7Ghz/ Pentium III à 1Ghz
Performances 14
Compilateur A50000 instructions
Compilateur B2000 instructions
Performances 15
But du cours : Éviter les pièges
Performances 16
Le rôle des performances
• En comprenant comment : – Le programme utilise les instructions– les instructions sont mises en oeuvre– Les systèmes de gestions de la mémoire se comportent
On est capable d'améliorer les performances d’un système informatique en concevant au mieux la machine.
• Problèmes très difficiles.
Performances 17
PLAN
• Introduction
• Définitions
• La mesure des performances
• Relier les métriques entre elles
• Quelques métriques très répandues
• Quels programmes pour évaluer les performances
• Illusions et pièges
• Pour conclure
Performances 18
Introduction : Difficulté de la définition de performances
• Que voulons nous dire lorsque nous disons qu’un avion à de meilleurs performances qu’un autre ?
Avion Capacité en passagers
Rayon d’action
Vitesse de croisière
Boeing 737
101 1014 960
Boeing 747
470 6677 980
BAC Concorde
132 6436 2100
Douglas DC
146 14000 875
Performances 19
Définitions
• Temps de réponse : Durée (mesurée en seconde) entre le début et la fin d’une tâche
• Le débit de sortie : La quantité de travail effectuée en un temps donné.
Ti
debut
Fin
t1
titn
tkdurée
En augmentant le débit on peut augmenter le temps de réponse.
Performances 20
Définitions
• Dans notre cours, nous nous intéresserons au temps de réponse. Pour maximiser les performances, il nous faut minimiser le temps de réponse ou temps d'exécution d’une tâche
• L’ordinateur X est n fois plus rapide que l’ordinateur Y
Performances = 1Temps d'exécution
n = Performances X Temps d'exécution Y
Performances Y Temps d'exécution X=
Performances 21
Mesure des performances
• La décomposition du temps écoulé dans UNIX (time)
90.7 u 12.9 s 2:39 65%
90.7 u Temps UC utilisateur : temps pour exécuter le programme
12.9 s Temps UC passe par le système d'exploitation à effectuer les tâches requises par ce programme
2:39 Temps écoulé
65% Pourcentage de temps UC dans le temps écoulé
Performances 22
Autres métriques pour les performances
• Les concepteurs d’ordinateurs considère une machine à travers une mesure liée à la vitesse d'exécution des fonctions de base par le matériel.
• Le cycle d’horloge détermine à quels moments les événements se produisent dans la machine.
cycle d’horloge = 1
Fréquence d’horloge
10 ns = (100 Mhz)-1
Performances 23
Relier les métriques entre elles
Tps d'exécution UCpour un programme
Nb de cycle UCPour un programme
* Tps de cycle =
• Le concepteur de matériel à un rôle à jouer dans l'amélioration des performances en réduisant la durée de cycle d’horloge.
Nb de cycle UC pour un programme
Fréquence d’horloge=
UC = Unité centrale
Performances 24
Rôle du contrôleur
Instructions
exécution
Contrôleur
nb cycles=4
nb cycles=5
nb cycles=5
Inst 1
Inst 2
Inst 3
14*tps cycle
Performances 25
But du cours
T* T*
T+T+
tps de cycle
Il existe un compromis entre le nombre de cycles d’horloge pour un programme et la durée de chaque cycle.
Un nombre de techniques qui diminuent le nombre de cycles d’horloge augmentent parallèlement le temps de cycle d'horloge. C’est ce compromis qui est difficile à évaluer.
Performances 26
Nombre de cycle UC
• le terme nombre de cycles d’horloge par instruction correspond au nombre moyen de cycles d’horloge qu’il faut à chaque instruction pour s'exécuter.
• Le CPI permet de comparer deux mises en oeuvre pour une même architecture de jeu d’instruction puisque le nombre d’instructions sera constant.
Nb de cycle UCpour le programme
Nb d’instructionsPour un programme
Nb de cycle d’Hpar instruction
= *
CPI : Nb de cycle d’Horloge par instructionNI : Nb d’instruction pour le programme
Performances 27
Temps UC
Tps UC = NI * CPI * Tps de cycleTps UC = NI * CPI * Tps de cycle
Performances 28
Temps UC
Changer de jeu d’instructions pour réduire le nombre d’instructions, dans le but de réduire le temps, peut augmenter le temps de cycle.
Le CPI dépendant de la répartition des instructions, le code qui exécute le moins d’instructions n’est pas forcement le plus rapide
Performances 29
Une métrique de performances très répandues : MIPS
• Le MIPS : Million d’instructions par seconde. Il constitue une alternative à l’emploi du temps.
MIPS = Nombre d’instructions
Tps d'exécution * 106
Performances 30
Piéges
Le nombre de MIPS indique la fréquence d'exécution des instructions mais ne dépend pas du jeu d’instructions.
Ne pas comparer des machines disposant de jeu d’instructions différents puisque NI sera différent.
MIPS varie en fonction des programmes sur une même machine.
MIPS peut varier en sens inverse des performances
Performances 31
Quels programmes pour évaluer les performances
• SPEC utilise des programmes réels• Si connected Pentium 4 'Northwood' 0.13 Micron - HardWare.fr
Performances 32
Illusions et pièges
• Espérer que l'amélioration d’un seul aspect d’une machine pourra accroître les performances d’un montant proportionnel à la taille de l'amélioration
La Loi d’Amdahl :
Tps d'exécution après amélioration =
Tps d'exécution touché par l'améliorationFacteur amélioration
+ Tps d'exécution non touche.
Performances 33
Conclusions
• Seul le produit est une mesure fiable
• Il faut comprendre comment les différents aspects de la conception d’une machine affectent chacun de ces paramètres.
• Les conceptions des machines seront toujours mesurées en termes de coût et de performances. Tout l’art de la conception informatique réside dans la découverte du meilleurs équilibre.
Tps UC = NI * CPI * Tps de cycleTps UC = NI * CPI * Tps de cycle
Performances 34
Performances 35
Performances 36
Objectifs : Étude du système dans son ensemble
Tps UC = tps d’exécution +tps d’accès aux données
Tps UC = tps d’exécution +tps d’accès aux données
Performances 37
Système embarqué : Sony playstation 2
Performances 38
Domaine en constante progression
Performances 39
Évolution : Le coût de la fréquence
Performances 40
Évolution : Le coût de la mémoire en baisse
Performances 41
Les nouveaux défis
• Coût/performance
• Coût/consommation
• Coût/performance/consommation
Le coût et la consommation sont souvent les facteurs les plus importants pour une application enfouis. Bien que on puisse évaluer le coût d’après le prix du processeur, le contrôleur mémoire et le contrôle des E/S soient ou non intégrés dans le circuit influe sur les deux facteurs.
Performances 42
Caractéristiques de processeurs
5 processeurs utilisés dans des application très différentes.
• Elan d’AMD et PowerPC : commutateur de réseau ; portable haut de gamme
• NEC VR 5432-VR 5400 : imprimantes laser couleur
• NEC VR 4122 : PDA à faible consommation
Performances 43
Les processeurs
processeur Jeu d’instruction
Mhz
Cache instruction/Donnée
s interne Cache secondaire
Organisation Inst/Cycle
mW Prix $*
AMD Elan SC520
*86 133 16K/16K 1 1600 38
AMD K6-2E+
*86 500 32K/32K128K 3 9600 78
IBM PowerPC
750CX
PowerPC 500 32K/32K128K 4 6000 94
NEC VR 5432
MIPS64 167 32K/32K 2 2088 25
NEC VR 4122
MIPS64 180 32K/16K 1 700 33
* Ne comprend pas les circuits d’interface et les circuits annexes
Performances 44
Le benchmark EEMBC*.org
www.eembc.org - telecom benchmark scores.html
Benchmark type Nb de noyau Exemple
Automobile 16 Microbenchmark 5 filtres
Consommateur 5 Multimédia
réseau 3 Plus court chemin,
bureau 4 Graphique
télécom 6 Filtre DSP(autocorrection,
FFT, décoder)
*The Embedded Microprocessor Benchmark Consortium
Performances 45
Les performances relatives/ Elan SC520
Moyenne géométrique des résultats individuels de chaque benchmark
Les différences de fréquence d’horloge expliquent entre 33% et 75% des différences de performance.
Performances 46
Problèmes multicritères
Coût processeur
La grande gamme de prix atténue les différences de performance, rendant les processeurs les plus lents économiquement – intéressantsSi le prix incluait le support système : VR 5432 + int et NEC VR4122 le -
Performances 47
Nouveaux défis
Le NEC VR 4122 est conçu pour les systèmes avec batterie au dépend des performances