presentation GRID

  • View
    2.304

  • Download
    0

Embed Size (px)

DESCRIPTION

explanation GRID

Text of presentation GRID

  • 1. RICARDO VALENCIA SEBASTIAN VALENCIA

2. 3. QUE ES??

  • Llamamos GRID al sistema de computacin distribuido que permite compartir recursos no centrados geogrficamente para resolver problemas de gran escala
  • Los recursos compartidos pueden ser Ordenadores (PCs, estaciones de trabajo, supercomputadoras, PDA, porttiles, mviles, etc), software, datos e informacin, instrumentos especiales (radio, telescopios, etc), personas/colaboradores
  • paradigma de computacin distribuida altamente verstil, escalable y que permite combinar la potencia de muchos equipos para lograr una capacidad global prcticamente ilimitada.
  • Se basa fundamentalmente en el acceso remoto a recursos computacionales, y su tecnologa estndar es el Globus Toolkit.
  • El trminogridse refiere a una infraestructura que permite la integracin y el uso colectivo de ordenadores de alto rendimiento, redes y bases de datos que son propiedad y estn administrados por diferentes instituciones.

4. INICIOS

  • Una primera experiencia fue GriPhyN, para unir nodos en el proceso de Fsicas de Altas Energas en EE.UU.
  • En Europa con el apoyo de proyectos de CERN (Centro Europeo Investigacin Nuclear) y el programa marco europeo se cre el software y red EDG Grid de Datos Europea.
  • Ian Foster y Carl Kesselman a mediados de los 90.
  • Los inicios del desarrollo de la tecnologa grid se enfocaron, bsicamente, en asuntos tcnicos, como mantener unido el flujo de datos dentro de una estructura federada, formada por un gran nmero de ordenadores de centros de investigacin interconectados.

5. EJEMPLO

  • El LHC (Large Hadron Collider) es unacelerador/colisionador de partculas de27km de circunferencia construido en el CERN. El objetivo: encontrar el misteriosobosn de Higgs .

6.

  • Hay que buscar esta signatura caracterstica:

7.

  • 40 millones de colisiones por segundo.
  • Tras un filtrado inicial, slo 100 colisiones de inters por segundo.
  • Cada colisin genera 1 Megabyte de datos.
  • 100 Megabytes de datos por segundo que deben ser procesados (de manera no-trivial) y almacenados para su posterior estudio.
  • El LHC producir1010 colisiones cada ao.
  • 10 Petabytes de informacin cada ao.

8.

  • Relacionar:
  • 1 MB = una foto digital
  • 1 GB = 1024 MB
  • 1 TB = 1024 GB = la produccin anual total de libros en todo el mundo
  • 1 PB = 1024 TB = la informacin que produce uno de los
  • experimentos del LHC.
  • 1 EB = 1024 PB = la produccin anual de informacin en todo el mundo.

9.

  • En la computacin Grid siempre intervienenvarias organizaciones,cada una con sus propios recursos computacionales.

10. 11. OBJETIVO

  • Compartir una serie de recursos en la red de manera uniforme, segura, transparente, eficiente y fiable.
  • Ofreciendo un nico punto de acceso a un conjunto de recursos distribuidos geogrficamente en diferentes dominios de administracin
  • Permitir gestionar y distribuir la potencia de clculo disponible, de tal forma que los usuarios se beneficien de la potencia de ordenadores infrautilizados que se encuentran dispersos geogrficamente
  • Acceder a un supercomputador virtual con la potencia suficiente para realizar de forma sencilla los clculos avanzados. Es decir, si el usuario necesita ms memoria RAM y ms disco duro para almacenar un trabajo no hace falta que lo haga en el de su propio equipo, sino que puede utilizar el de los otros ordenadores de la red Grid.

12. 13. VENTAJAS

  • La potencia que ofrecen multitud de computadores conectados en red usando Grid es prcticamente ilimitada
  • ofrece una perfecta integracin de sistemas y dispositivos heterogneos,
  • Se trata de una solucin altamente escalable, potente y flexible, ya que evitarn problemas de falta de recursos (cuellos de botella) y nunca queda obsoleta
  • Destacamos el papel de IBM invirtiendo en GRID como plataforma para ofrecer a sus clientes las ventajas como ahorro de tiempo y recursos econmicos.
  • Grid reduce la necesidad de abordar nuevas compras al poder ser desplegado sobre la infraestructura ya instalada, permitiendo conseguir ahorros de hasta el 93% en adquisicin de hardware de servidor
  • Grid puede ser implementada en muy pocos das, mientras que poner en marcha sistemas de clusters puede llevar de dos a tres meses, con potenciales interrupciones y cadas.

14. DESVENTAJAS

  • Recursos heterogneos: Descubrimiento, seleccin, reserva, asignacin, gestin y monitorizacin de recursos son procesos que deben controlarse externamente y que influyen en el funcionamiento del Grid.
  • Desarrollo de aplicaciones para manejar el Grid
  • Desarrollo de modelos eficientes de uso
  • Comunicacin lenta y no uniforme
  • Organizativos: dominios de administracin, modelo de explotacin y costes, poltica de seguridad
  • Econmicos: precio de los recursos, oferta/demanda

15. ARQUITECTURA

  • Capacidad de balanceo de sistemas: no habra necesidad de calcular la capacidad de los sistemas en funcin de los picos de trabajo, ya que la capacidad se puede reasignar desde la granja de recursos a donde se necesite.
  • Alta disponibilidad: Con la nueva funcionalidad, si un servidor falla, se reasignan los servicios en los servidores restantes.
  • Reduccin de costes: Con esta arquitectura los servicios son gestionados por "granjas de recursos". Ya no es necesario disponer de "grandes servidores" y podremos hacer uso de componentes de bajo coste. Cada sistema puede ser configurado siguiendo el mismo patrn.
  • Las capas ms altas son las ms cercanas al usuario y las inferiores las ms prximas a las redes de computacin (capa de aplicacin, capa de middleware, capa de recursos y capa de red).

16. 17. 18. TOLERANCIA A FALLOS

  • Las tcnicas de checkpoint : Tolerancia a fallos para aplicaciones paralelas intracluster fuertemente acopladas, que se ejecutan localmente en nodos multiprocesador del Grid , En caso de fallo, el objetivo es relanzar localmente la aplicacin completa en otro nodo del Grid desde el punto del fallo, independientemente de la arquitectura del mismo,
  • Replicacin de datos (FT-RD): cada proceso se ejecuta de forma paralela en los nodos geogrficamente distribuidos del Grid. En caso de fallo el objetivo es relanzar el proceso que ha fallado. a travs de la replicacin dinmica de datos en los nodos del Grid con el fin de detectar fallos y recuperar la consistencia del sistema, garantizando la conclusin de la aplicacin.
  • Chekpoint y log: Tolerancia a Fallos soportada por el sistema, transparente al usuario, ealizado mediante un esquema de control distribuido entre los todos los nodos, que permite detectar y aislar nodos que fallan y relanzar los procesos en otro nodo del Grid.

19. ESCALABILIDAD

  • Permite una gran escalabilidad
  • El trfico entre nodos est limitado a metadatos
  • Mientras que el trfico de imgenes se realiza directamente contra las mquinas que poseen la informacin haciendo una red GRID de almacenamientos y de datos
  • El empleo de sistemas UNIX como base de servidor permite realizar el escalado del sistema de servidores desde PC's convencionales hasta servidores de alta envergadura.

20. TIPOS

  • Grid de recursos. Se utiliza para describir todos los recursos relacionados con las TI. Trminos comunes en esta categora son utility computing, empresa adaptativa y on-demand.
  • Grid de datos. Se centra en tecnologas tales como gestin del ciclo de vida de la informacin, sistemas de ficheros distribuidos y servicios Web.
  • Grid computacional. Es el ms comn. Se centra en PC y servidores, y es el ms ampliamente utilizado en proyectos acadmicos y de investigacin. Tambin ha empezado a entrar en el mundo de la empresa, especialmente en los servicios financieros y en seguros.

21. Comparacin 22.

  • Grid se diferencia de los sistemas cliente-servidor y otras tecnologas actuales (CORBA, EJB o .NET), en que est orientada a los recursos computacionales y no a la informacin, la seguridad no est en un segundo plano y la comunicacin es asncrona.
  • El World Wide Web proporciona un acceso transparente a informacin que est almacenada en millones de ordenadores repartidos por todo el mundo. Frente a ello, el GRID es una infraestructura nueva que proporciona acceso transparente a potencia de clculo y capacidad de almacenamiento distribuida por una organizacin o por todo el mundo.

23. REQUISITOS

  • Los datos deben compartirse entre miles de usuarios con intereses distintos.
  • Se deben enlazar los centros principales de supercomputacin, no slo los PCs.
  • Se debe asegurar que los datos sean accesibles en cualquier lugar y en cualquier momento.
  • Debe armonizar las distintas polticas de gestin de muchos centros diferentes
  • Debe proporcionar seguridad.

24. BENEFICIOS

  • Proporciona un mecanismo de colaboracin transparente entre grupos dispersos, tanto cientficos como comerciales.