14
Microprocesadores para Comunicaciones 2010 UNA NUEVA GENERACIÓN: HÍBRIDOS CPU/GPU Paloma Monzón Rodríguez 42217126M

IÓN: PU aciones 2010 - Instituto Universitario de ...nunez/clases-micros-para-com/mpc1011-trabajos... · Una nueva generación: Híbridos CPU/GPU 7 Cada SM cuenta con: Ocho procesadores

  • Upload
    votuyen

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Mic

rop

roce

sad

ore

s p

ara

Com

un

icaci

on

es

2010

UN

A N

UE

VA

GE

NE

RA

CIÓ

N:

HÍB

RID

OS

CP

U/G

PU

Paloma Monzón Rodríguez 42217126M

Una nueva generación: Híbridos CPU/GPU 2

Índice

1. Introducción ....................................................................................................................... 3

2. Unidad Central de Procesamiento (CPU) .................................................................... 4

Arquitectura básica .............................................................................................................. 4

3. Unidad de Procesamiento Gráfico (GPU) .................................................................... 6

Arquitectura básica .............................................................................................................. 6

4. Híbridos CPU/GPU ........................................................................................................... 7

Unidad de Procesado Acelerado (APU) ............................................................................ 8

5. Xbox 360 “Slim” ............................................................................................................... 11

6. Referencias ....................................................................................................................... 13

Una nueva generación: Híbridos CPU/GPU 3

1. Introducción

Desde el comienzo del desarrollo tecnológico la tendencia ha sido la

integración de los diferentes componentes de un circuito, un computador, etc. Así

por ejemplo, apareció el circuito integrado o desapareció la FPU (Float Point Unit),

encargada del procesado matemático en un PC, y cuya función pasó a ser parte de

la CPU (Central Processing Unit).

La unidad central de procesamiento de un ordenador es aquella que se

ocupa del control y el proceso de datos. Está conectada a través de una serie de

conexiones a los dispositivos de almacenamiento, de entrada y de salida, siendo

éstos últimos por ejemplo, la pantalla.

Al principio la CPU se encargaba del procesamiento gráfico, pues no era más

que texto. Sin embargo, se desarrollaron entornos más visuales, que requerían de

mayor disposición de la CPU, restándole un considerable tiempo de ejecución al

resto de las aplicaciones no gráficas. Además, ésta no estaba enfocada al

procesamiento de gráficos y como consecuencia era poco eficiente en este aspecto.

Así nace la GPU (Graphics Processing Unit), un dispositivo diseñado

exclusivamente para esta función.

Los tiempos cambian y la tendencia continúa hacia la máxima integración

posible. La unión de diferentes componentes en un todo. Pero, ¿Por qué quedarse

ahí? Es el momento de avanzar, dar un paso más y mirar hacia la fusión.

Aparece así una nueva generación: Híbridos CPU/GPU.

En el mercado actual es AMD la gran compañía que está apostando por esta

nueva filosofía. Su rival, Intel, pretende seguir sus pasos e intenta adentrarse en

este nuevo mundo.

Una nueva generación: Híbridos CPU/GPU 4

2. Unidad Central de Procesamiento (CPU)

Es aquel elemento del PC que se encarga de realizar las operaciones

aritmético-lógicas, de control y de comunicación con el resto de dispositivos.

Además de ejecutar los programas de usuario y sistema. Es un sistema de propósito

general, diseñado para cubrir un amplio rango de aplicaciones y de usuarios.

Se trata de un circuito integrado, un único fragmento de silicio que contiene

millones de componentes electrónicos. Esto hace que también sea conocida como

procesador o microprocesador.

Es de lógica secuencial, por lo que su naturaleza es síncrona y opera en

función de una señal de reloj, cuadrada periódica.

La frecuencia de reloj indica la velocidad a la que un PC trata las

instrucciones. Mide la cantidad de operaciones por ciclo (IPC) que puede realizar y

los ciclos por segundo que desarrolla o MIPS.

No es el único factor determinante del rendimiento de la CPU. Este está

condicionado por la memoria caché, número de núcleos (físicos o lógicos), conjunto

de instrucciones que soporta (ISA), arquitectura, etc. Cabe destacar que la

frecuencia de reloj efectiva no es el producto de la frecuencia de cada núcleo físico

por su número de núcleos, es decir, un procesador de 3 GHz con 6 núcleos físicos

nunca tendrá 18 GHz, sino 3 GHz, independientemente de su número de núcleos.

La frecuencia de reloj va estrechamente relacionada con la intensidad que circula

por el semiconductor.

Arquitectura básica

Registros: Almacenan información temporalmente.

Algunos están dedicados para funciones específicas.

Unidad de control: Interpreta y ejecuta las

instrucciones. Para cada instrucción se realizan

cuatro operaciones básicas:

1. Fetch: Se obtiene una instrucción de un

programa o datos de la memoria.

2. Decode: Se traduce la instrucción en

comandos que la computadora pueda

ejecutar.

3. Execute: Se procesan los comandos.

4. Store: Se escribe el resultado a la memoria.

Una nueva generación: Híbridos CPU/GPU 5

La CPU debe esperar hasta que una instrucción complete las cuatro

operaciones antes de comenzar a trabajar en la próxima instrucción. Para evitar

esta espera se utiliza el pipelining, así se comienza a ejecutar la segunda

instrucción antes de completar la primera. De esta manera se procesa con mayor

rapidez.

Unidad aritmético-lógica: Al sólo ejecutar instrucciones programadas a muy

bajo nivel, realiza operaciones simples, aritméticas y lógicas (cálculos,

comparaciones y toma de decisiones lógicas).

Unidad de coma flotante (Coprocesador matemático o FPU): Permite

operaciones con números decimales, elevando notablemente la eficiencia que

proporciona solo la ALU.

Memoria Caché: Se emplea para tener acceso rápido a ciertos datos que

predeciblemente serán utilizados en las siguientes operaciones sin tener que acudir

a la memoria RAM reduciendo el tiempo de espera. Poseen la llamada cache

interna de primer nivel o L1, es decir, la que está más cerca. Las CPU más

modernas incluyen otro nivel de caché más grande aunque algo menos rápida, la

caché de segundo nivel o L2.

Buses: Conjunto de conexiones que utiliza la CPU para aceptar órdenes del

usuario, acceder a los datos y presentar los resultados.

Figura 1. Diagrama de bloques.

Una nueva generación: Híbridos CPU/GPU 6

3. Unidad de Procesamiento Gráfico (GPU)

Se trata de un segundo procesador que se añade al ordenador para poder

manejar los gráficos y así liberar la carga computacional de la CPU. A diferencia

de ésta, es un dispositivo de propósito específico, dedicado a la obtención de

imágenes 2D a partir de escenas sintéticas 3D para PC, Workstation o consolas de

videojuegos.

La función principal del pipeline gráfico es la generación de una imagen 2D

a partir de un sistema compuesto por una cámara virtual, representaciones en tres

dimensiones de objetos, fuentes de luz, etc. Algunas de sus operaciones son efectos

de iluminación, transformaciones de un objeto y el movimiento 3D.

Está especializada en la computación intensiva y masivamente paralela, que

es exactamente de lo que se trata el renderizado de gráficos. Además, están

diseñadas de forma que la mayor parte de los transistores que la componen están

destinados al procesado de datos en lugar de al almacenamiento de ellos o control

de flujo.

Arquitectura básica

Está compuesta por un número escalable de multiprocesadores paralelos

(SM), que se agrupan en Cluster de Procesado de Hilos (TPC).

Una nueva generación: Híbridos CPU/GPU 7

Cada SM cuenta con:

Ocho procesadores escalares, que comparten la búsqueda y lanzamiento de

las instrucciones, de manera que se ejecute la misma instrucción al mismo

tiempo en ellos.

Dos Unidades Especiales de Función (SFUs), son las que realizan las

operaciones en punto flotante.

Una unidad de multiplicación y suma (MAD)

Una unidad de multiplicación (MUL)

La comunicación entre la CPU y la GPU se realiza a través del bus PCI-

Express.

4. Híbridos CPU/GPU

Como se comentó en la Introducción, la tendencia es la integración y así es

como aparece esta nueva tecnología de circuitos integrados. Se ha creado una

nueva microarquitectura para que la CPU y la GPU funcionen coordinadamente,

compartiendo varios componentes de ambas.

Una de las ventajas que proporciona esta nueva generación es el menor

consumo global. Esto se debe a que cuanto más se integren menos electricidad

Una nueva generación: Híbridos CPU/GPU 8

consumirán, con ello hará falta un menor número

de resistencias que disipen calor y, por tanto, que

el dispositivo se caliente menos.

Unidad de Procesado Acelerado (APU)

Fusion es la tecnología por la que está

apostando AMD, consiste en la combinación de un

procesador x86, una unidad de procesamiento

gráfico, un procesador de vídeo y otros co-

procesadores en un solo dado de silicio. Este dispositivo se denomina Acelerate

Processing Unit, APU.

Los elementos importantes del sistema (núcleos x86, motores de vector

(SIMD) y el decodificador de vídeo unificado (UVD)) se conectan directamente al

mismo bus de alta velocidad, evitando así conectarse a los buses típicos (PCI-

Express). Este concepto de diseño elimina una de las limitaciones fundamentales

del rendimiento: la latencia, y por consiguiente, el consumo de energía. Además, la

Una nueva generación: Híbridos CPU/GPU 9

GPU usará unas partes de la memoria central y la CPU otras, de manera que las

transferencias entre ambas son muy rápidas.

APU no solo ofrece

un nuevo horizonte en el

diseño hardware, sino que

también le permitirá a los

desarrolladores poder crear

algoritmos de vectores de

alto nivel, que antes

estaban limitados por la

reducida capacidad de

cómputo.

Debido a que los

sistemas operativos y las

aplicaciones más básicas

tienen requisitos muy bajos

comparados con las

especificaciones técnicas de

una máquina, permitirá a

los fabricantes de hardware mantener un cierto rendimiento y a la vez reducir el

tamaño de cada componente. AMD Fusion busca un menor consumo energético

manteniendo un potencial suficiente para prácticamente cualquier usuario.

Como esta nueva tecnología actualmente se ha centrado en las tareas

básicas de un usuario, está orientada a ordenadores de bajo coste, bajo consumo

energético y potencia limitada, así como para netbooks. Por ahora para aquellos

que juegan a la máxima configuración posible o trabajan con aplicaciones

profesionales, esta no será la tecnología más adecuada.

Una nueva generación: Híbridos CPU/GPU 10

Como arquitecturas novedosas se emplearán Bulldozer, dedicada a

sobremesas (domésticos y servidores); y Bobcat, para portátiles. Ambas

implementarán un juego de instrucciones para SIMD, SSE5 y tendrán unos

consumos muy bajos dependiendo del modelo escogido, entre 1 y 100W.

Lanzamientos en los próximos años

Nombre en

código

Año Tecnología Arquitectura

Ontario 2011 40 nm Bobcat

Zacate 2011 40 nm Bobcat

Llano 2011 32 nm Stars/K10

Krishna 2012 28 nm Bobcat

Wichita 2012 28 nm Bobcat

Trinity 2012 32 nm Bulldozer

Por su parte, Intel presentará el Sandy Bridge con la intención de

adentrarse en este nuevo mundo.

No será una renovación completa respecto de los actuales Nehalem, sino una

pequeña evolución en ciertos aspectos:

- Implementación de la

CPU y la GPU bajo el

mismo chip, aunque a

diferencia de las APU

no sobre el mismo dado.

- Gráfica integrada

tendrá un nuevo juego

de extensiones del

procesador (AVX).

- Nueva arquitectura

denominada de tipo

anillo, la cual permitirá compartir cachés y memoria entre GPU y CPU.

Lo más interesante está en las placas base, ya que utilizarán un nuevo

socket (LGA 1155), un desarrollo que permite los 22 y 32 nm, una GPU integrada y

una potencia que ofrecerá un rendimiento de un 20% superior a los modelos

actuales (según los primeros tests)

Una nueva generación: Híbridos CPU/GPU 11

Otra de las

novedades serán los

chipsets: Intel P67, H67

y H61, cuyas

características aún son

desconocidas.

Se incluirá en

procesadores de gama

baja, media y alta. Las

tres utilizarán el mismo

socket, las mismas

placas y los mismos

chipsets, con lo que se

podrá utilizar el Intel

Core i3, i 5 e i7 con LGA 1155 independientemente del modelo.

Las características siguen un camino similar al de los modelos de

sobremesa, pero con menor potencia y más cometidos. Sandy Bridge también

estará para portátiles.

Su lanzamiento se prepara para Enero de 2011 y seguirán la misma

nomenclatura que los microprocesadores actuales (Intel Core i3, i5 e i7). Algunos de

los modelos serán:

Intel Core i3-2100T Intel Core i5-2500T

Intel Core i3-2100 Intel Core i5-2500S

Intel Core i3-2120 Intel Core i5-2500

Intel Core i5-2390T Intel Core i5-2500K

Intel Core i5-2300 Intel Core i7-2600S

Intel Core i5-2400S Intel Core i7-2600

Intel Core i5-2400 Intel Core i7-2600K

5. Xbox 360 “Slim”

Mientras AMD e Intel se abren camino en esta nueva generación, cuyos

lanzamientos serán en los próximos años, Microsoft e IBM revelan que la Xbox 360

250 GB System (Slim) combina una CPU y una GPU.

IBM fabrica el procesador de la Xbox 360, Xenon, de tres núcleos y con una

velocidad de reloj de 3,2 GHz. Por otro lado, ATI (ahora AMD/ATI) desarrolló un

Una nueva generación: Híbridos CPU/GPU 12

chip de gráficos con una velocidad de 500 MHz, Xenos. Ambos chips comenzaron

con la tecnología de 90 nm y fueron bajando hasta alcanzar los 45 nm. Esto

permitió su unión bajo un mismo chip Vejle.

Una nueva generación: Híbridos CPU/GPU 13

Los principales componentes internos de Vejle son un procesador de tres

núcleos con caché L1 dedicado y 1 MB de caché L2 compartido, un núcleo de

procesamiento gráfico y un

controlador de memoria de

doble canal.

Además, incluye un

componente llamado FSBR

(Front-side bus replacement),

cuya función es reducir el

rendimiento del chip para que

en ningún momento supere el

alcanzado por los chips de las

consolas antiguas. Es decir,

estas consolas técnicamente son

más rápidas pero Microsoft se

ha encargado de frenar la

velocidad de proceso.

El número de

transistores llega a tan solo 372 millones, lo que indica una simplificación en el

diseño del chip, menor generación de calor y una significativa reducción en el

consumo de potencia.

En conclusión, los beneficios que aporta Vejle son costo, energía y tamaño,

ya que la nueva consola es más pequeña, consume menos energía y es más barata

de hacer. Es un chip extremadamente estable, con una refrigeración mucho más

sencilla.

6. Referencias

[1]-Wikipedia “Unidad de coma flotante” [En línea] Disponible en

http://es.wikipedia.org/wiki/FPU. Consultado en Diciembre 2010.

[2]-Wikipedia “Microprocesador” [En línea] Disponible en

http://es.wikipedia.org/wiki/Microprocesador. Consultado en Diciembre 2010.

[3]-“Tema 1: Introducción a los Sistemas Informáticos” [En línea] Disponible en

http://exa.exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MonogSO/I

NTSI02.htm. Consultado en Diciembre 2010.

Una nueva generación: Híbridos CPU/GPU 14

[4]-“Central Processing Unit (CPU)” [En línea] Disponible en

http://mmalicea.tripod.com/hrdwsftw/cpu.htm. Consultado en Diciembre 2010.

[5]-Wikipedia “Unidad central de procesamiento” [En línea] Disponible en

http://es.wikipedia.org/wiki/Unidad_central_de_procesamiento. Consultado en

Diciembre 2010.

[6]-Prieto, A. “Capítulo 5. Esquema de funcionamiento de un computador”, Octubre

2001.

[7]-Juega Reimúndez, Carlos. “Estudio de rendimiento en GPU”, Universidad

Complutense de Madrid, Curso académico 2009-2010.

[8]-Benes, Bedrich. “GPU and computer architecture”, Universidad Purdue.

[9]-Brookwood, Nathan. “AMD Fusion Family of APUs: Enabling a Superior,

Immersive PC Experience”, Marzo 2010.

[10]-Xataka “AMD ya tiene preparados sus chips AMD Fusion, las APU ya están

aquí” [En línea] Disponible en http://www.xataka.com/componentes-de-pc/amd-ya-

tiene-preparados-sus-chips-amd-fusion-las-apu-ya-estan-aqui. Consultado en

Diciembre 2010.

[11]-Xataka ”Lanzamientos de AMD para 2010 y 2011 confirmados” [En línea]

Disponible en http://www.xataka.com/ordenadores/lanzamientos-de-amd-para-

2010-y-2011-confirmados. Consultado en Diciembre 2010.

[12]-Xataka “Intel también renovará el socket de los i3 e i5 con el LGA 1155, otro

más para 2011” [En línea] Disponible en http://www.xataka.com/ordenadores/intel-

tambien-renovara-el-socket-de-los-i3-e-i5-con-el-lga1155-otro-mas-para-2011.

Consultado en Diciembre 2010.

[13]-Xataka “Intel „Sandy Bridge‟ se confirma para 2011 como una pequeña

evolución de los Nehalem” [En línea] Disponible en

http://www.xataka.com/otros/intel-sandy-bridge-se-confirma-para-2011-como-una-

pequena-evolucion-de-los-nehalem. Consultado en Diciembre 2010.

[14]-Xataka “Intel Sandy Bridge preparan su desembarco en enero” [En línea]

Disponible en http://www.xataka.com/componentes-de-pc/intel-sandy-bridge-

preparan-su-desembarco-en-enero. Consultado en Diciembre 2010.

[15]-“Microsoft revela el secreto del APU (GPU + CPU + MC) de la Xbox 360s

“Slim””. [En línea] Disponible en http://www.elfen-

lied.es/foro/index.php?topic=2431.0. Consultado en Diciembre 2010.

[16]-“Vejle: El nuevo chip de la Xbox 360 S” [En línea] Disponible en

http://www.neoteo.com/vejle-el-nuevo-chip-de-la-xbox-360-s.neo. Consultado en

Diciembre 2010.