Download docx - Cluster

INSTITUTO TECNOLOGICO

De Tuxtepec

“CLUSTERS ”

CARRERA:INGENIERÍA EN INFORMÁTICA

MATERIA:SISTEMAS OPERATIVOS 2

PRESENTA:

CATEDRATICO:

San Juan Bautista Tuxtepec, Oaxaca a 31 de Agosto del 2015

ISC - 2010/01 AGOSTO 2015

Introducción

Un clúster es una tipo de arquitectura paralela distribuida que consiste de un

conjunto de computadores independientes (y bajo coste en principio)

interconectados operando de forma conjunta como un único recurso

computacional Sin embargo, cada computador puede utilizarse de forma

independiente o separada

La tecnología de clústeres ha evolucionado en apoyo de actividades que van

desde aplicaciones de supercómputo y software para aplicaciones críticas,

servidores web y comercio electrónico, hasta bases de datos de alto rendimiento,

entre otros usos.

El cómputo con clústeres surge como resultado de la convergencia de varias

tendencias actuales que incluyen la disponibilidad de microprocesadores

económicos de alto rendimiento y redes de alta velocidad, el desarrollo de

herramientas de software para cómputo distribuido de alto rendimiento, así como

la creciente necesidad de potencia computacional para aplicaciones que la

requieran.

Simplemente, un clúster es un grupo de múltiples ordenadores unidos mediante

una red de alta velocidad, de tal forma que el conjunto es visto como un único

ordenador, más potente que los comunes de escritorio.

https://es.wikipedia.org/wiki/Red_de_ordenadores

https://es.wikipedia.org/wiki/Ordenador

CLÚSTER

El origen del término y del uso de este tipo de tecnología es desconocido pero se

puede considerar que comenzó a finales de los años cincuenta y principios de los

sesenta.

La base formal de la ingeniería informática cree que la metodología de proveer un

medio de hacer trabajos paralelos de cualquier tipo fue inventado posiblemente

por Gene Amdahl de IBM, que en 1967 publicó lo que ha llegado a ser

considerado como el "white paper" inicial de procesamiento paralelo: la Ley de

Amdahl que describe matemáticamente el aceleramiento que se puede esperar

paralelizando cualquier otra serie de tareas realizadas en una arquitectura

paralela.

Este artículo define la base para la ingeniería de la computación

tanto multiprocesador y computación clúster, en donde el principal papel

diferenciador es si las comunicaciones interprocesador cuentan con el apoyo

«dentro» de la computadora (por ejemplo, en una configuración personalizada

para el bus o la red de las comunicaciones internas) o «fuera» del ordenador en

una red «commodity».

En consecuencia, la historia de los primeros grupos de computadoras está más o

menos directamente ligado a la historia de principios de las redes, como una de

las principales motivaciones para el desarrollo de una red para enlazar los

recursos de computación, de hecho la creación de un clúster de computadoras.

Las redes de conmutación de paquetes fueron conceptualmente inventados por la

corporación RAND en 1962.

Utilizando el concepto de una red de conmutación de paquetes, el

proyecto ARPANET logró crear en 1969 lo que fue posiblemente la primera red de

computadoras básica basadas en el clúster de computadoras en cuatro centros

informáticos (cada una de las cuales fue algo similar a un «clúster» pero no un

«commodity clúster» como hoy en día lo entendemos).

https://es.wikipedia.org/wiki/ARPANET

https://es.wikipedia.org/wiki/Conmutaci%C3%B3n_de_paquetes

https://es.wikipedia.org/wiki/Multiprocesador

https://es.wikipedia.org/wiki/Ley_de_Amdahl

https://es.wikipedia.org/wiki/Ley_de_Amdahl

https://es.wikipedia.org/wiki/IBM

https://es.wikipedia.org/wiki/Gene_Amdahl

https://es.wikipedia.org/wiki/Ingenier%C3%ADa_inform%C3%A1tica

El proyecto ARPANET creció y se convirtió en lo que es ahora Internet. Se puede

considerar como «la madre de todos los clústeres» (como la unión de casi todos

los recursos de cómputo, incluidos los clústeres, que pasarían a ser conectados).

También estableció el paradigma de uso de computadoras clústeres en el mundo

de hoy: el uso de las redes de conmutación de paquetes para realizar las

comunicaciones entre procesadores localizados en los marcos de otro modo

desconectados.

El desarrollo de la construcción de PC por los clientes y grupos de investigación

procedió a la par con la de las redes y el sistema operativo Unix desde principios

de la década de los años setenta, como TCP/IP y el proyecto de

la Xerox PARC proyecto y formalizado para protocolos basados en la red de

comunicaciones.

El núcleo del sistema operativo fue construido por un grupo de DEC PDP-11

minicomputadoras llamado C.mmp en C-MU en 1971.

Sin embargo, no fue hasta alrededor de 1983 que los protocolos y herramientas

para el trabajo remoto facilitasen la distribución y el uso compartido de archivos

fueran definidos (en gran medida dentro del contexto de BSD Unix, e

implementados por Sun Microsystems) y, por tanto llegar a disponerse

comercialmente, junto con una compartición del sistema de ficheros.

El primer producto comercial de tipo clúster fue ARCnet, desarrollada en 1977 por

Datapoint pero no obtuvo un éxito comercial y los clústeres no consiguieron tener

éxito hasta que en 1984 VAXcluster produjeran el sistema operativo VAX/VMS.

El ARCnet y VAXcluster no solo son productos que apoyan la computación

paralela, sino que también comparten los sistemas de archivos y dispositivos

periféricos.

La idea era proporcionar las ventajas del procesamiento paralelo, al tiempo que se

mantiene la fiabilidad de los datos y el carácter singular. VAXcluster, VMScluster

están todavía disponibles en los sistemas de HP OpenVMS corriendo en sistemas

Itanium y Alpha.

https://es.wikipedia.org/wiki/ARCnet

https://es.wikipedia.org/wiki/Sun_Microsystems

https://es.wikipedia.org/wiki/Xerox_PARC

https://es.wikipedia.org/wiki/Xerox

https://es.wikipedia.org/wiki/TCP/IP

https://es.wikipedia.org/wiki/Internet

Otros dos principios comerciales de clústeres notables fueron el Tandem Himalaya

(alrededor 1994 de con productos de alta disponibilidad) y el IBM S/390 Parallel

Sysplex (también alrededor de 1994, principalmente para el uso de la empresa).

La historia de los clústeres de computadoras estaría incompleta sin señalar el

papel fundamental desempeñado por el desarrollo del software de PVM (parallel

virtual machine: ‘máquina virtual paralela’).

Este software de código fuente libre, basado en comunicaciones TCP/IP permitió

la creación de un superordenador virtual ―un clúster HPC― realizada desde

cualquiera de los sistemas conectados TCP/IP.

De forma libre los clústeres heterogéneos han constituido la cima de este modelo,

logrando aumentar rápidamente en FLOPS y superando con creces la

disponibilidad incluso de los supercomputadores más caros.

PVM y el empleo de PC y redes de bajo costo llevó, en 1993, a un proyecto de la

NASA para construir supercomputadoras basados en clústeres.

En 1995, la invención de la Beowulf ―un estilo de clúster― una granja de

computación diseñada según un producto básico de la red con el objetivo

específico de «ser un superordenador» capaz de realizar firmemente cálculos

paralelos HPC.

Esto estimuló el desarrollo independiente de la computación Grid como una

entidad, a pesar de que el estilo Grid giraba en torno al del sistema operativo Unix

y el Arpanet

CARACTERISTICAS DEL CLÚSTER

Permite combinar múltiples sistemas para que trabajen en paralelo y se comporten

como un recurso informático unificado para: servir a un grupo de tareas,

proporcionar tolerancia a fallos y tener disponibilidad continua. Por ejemplo, en el

caso de usuarios de Internet, el clustering proporciona bases de datos, correo

electrónico, ficheros u otros servicios de sistema sin interrupciones. Si se

https://es.wikipedia.org/wiki/Grid

https://es.wikipedia.org/wiki/FLOPS

https://es.wikipedia.org/wiki/Computaci%C3%B3n_de_alto_rendimiento

https://es.wikipedia.org/wiki/PVM

presentara una falla dentro de una red de servidores de un clúster, ésta se

corregiría inmediatamente sin que los usuarios lo notaran. Dentro de esta técnica

existen una serie de conceptos fundamentales que se describen a continuación.

Comencemos por explicar el concepto de paralelismo, que consiste en el

procesamiento de una serie de instrucciones de un programa, que son ejecutadas

por múltiples procesadores que trabajan de manera independiente. El paralelismo

puede manejarse en dos niveles: paralelismo del hardware y el software. El

primero depende básicamente de la tecnología de cómputo disponible, mientras el

segundo se refiere a la habilidad del usuario para encontrar áreas bien definidas

del problema por resolver, de tal forma que éste pueda ser dividido en partes

autónomas que serán distribuidas entre los nodos del clúster, obteniendo un

sistema de alto rendimiento computacional.

Por otro lado está el concepto de multiprocesamiento, una

característica del sistema operativo que controla el hardware. El

software asegura la interacción entre los procesadores a nivel de

carga y descarga de datos, además de realizar el despacho de

trabajos en forma múltiple, independiente y simultánea. Otro

concepto fundamental es la programación de hebras (programming threads).

Una hebra (thread) es una secuencia de instrucciones ejecutables que pueden

correr independientemente, compartiendo recursos computacionales con otras

hebras. En un programa hay la posibilidad de ejecutar varias hebras

simultáneamente. Cuando esto ocurre todas las hebras activas pueden competir y

compartir los recursos del sistema. Por lo tanto, el usuario ha recurrido a

la programación multi-hebras (multithread) que trae como consecuencia la

concurrencia entre procesos y tiene una gran importancia en el cómputo paralelo

(para obtener una descripción más detallada, ver E. Cuadros 2001).

COMO FUNCIONA UN CLÚSTER

En general, un clúster necesita de varios componentes de software y hardware

para poder funcionar:

Nodos

Sistemas Operativos

Conexiones de Red

Middleware (capa de abstracción entre el usuario y los sistemas operativos)

Ambientes de Programación Paralela.

Aplicaciones (pueden ser paralelas o no)

Nodos

Pueden ser simples ordenadores, sistemas multiprocesador o estaciones de

trabajo (Workstation). En informática, de forma muy general, un nodo es un punto

de intersección o unión de varios elementos que confluyen en el mismo lugar.

Ahora bien, dentro de la informática la palabra nodo puede referirse a conceptos

diferentes según el ámbito en el que nos movamos:

En redes de computadoras cada una de las máquinas es un nodo, y si la red

es Internet, cada servidor constituye también un nodo.

En estructuras de datos dinámicas un nodo es un registro que contiene un dato

de interés y al menos un puntero para referenciar (apuntar) a otro nodo. Si la

estructura tiene solo un puntero, la única estructura que se puede construir con

él es una lista, si el nodo tiene más de un puntero ya se pueden construir

estructuras más complejas como árboles o grafos.

El clúster puede estar conformado por nodos dedicados o por nodos no

dedicados.

En un clúster con nodos dedicados, los nodos no disponen de teclado, ratón ni

monitor y su uso está exclusivamente dedicado a realizar tareas relacionadas con

el clúster. Mientras que, en un clúster con nodos no dedicados, los nodos

disponen de teclado, ratón y monitor y su uso no está exclusivamente dedicado a

realizar tareas relacionadas con el clúster, el clúster hace uso de los ciclos de reloj

que el usuario del computador no está utilizando para realizar sus tareas.

Cabe aclarar que a la hora de diseñar un clúster, los nodos deben tener

características similares, es decir, deben guardar cierta similitud de arquitectura y

sistemas operativos, ya que si se conforma un clúster con nodos totalmente

heterogéneos (existe una diferencia grande entre capacidad de procesadores,

memoria, disco duro) será ineficiente debido a que el middleware delegará o

asignará todos los procesos al nodo de mayor capacidad de cómputo y solo

distribuirá cuando este se encuentre saturado de procesos; por eso es

recomendable construir un grupo de ordenadores lo más similares posible.

Sistemas operativos

Un sistema operativo debe ser multiproceso y multiusuario. Otras características

deseables son la facilidad de uso y acceso. Un sistema operativo es un programa

o conjunto de programas de computadora destinado a permitir una gestión eficaz y

segura de sus recursos. Comienza a trabajar cuando el gestor de arranque carga

en memoria su núcleo y gestiona el hardware de la máquina desde los niveles

más básicos, permitiendo también la interacción con el usuario. Se puede

encontrar normalmente en la mayoría de los aparatos electrónicos que utilicen

microprocesadores para funcionar, ya que gracias a estos podemos entender la

máquina y que ésta cumpla con sus funciones (teléfonos móviles, reproductores

de DVD, radios, computadoras, etc.).

Conexiones de red

Los nodos de un clúster pueden conectarse mediante una simple red Ethernet con

placas comunes (adaptadores de red o NICs), o utilizarse tecnologías especiales

de alta velocidad como Fast Ethernet, Gigabit Ethernet, Myrinet, InfiniBand, SCI,

etc.

Ethernet

Son las redes más utilizadas en la actualidad, debido a su relativo bajo

coste. No obstante, su tecnología limita el tamaño de paquete, realizan

excesivas comprobaciones de error y sus protocolos no son eficientes, y

sus velocidades de transmisión pueden limitar el rendimiento de los

clústeres. Para aplicaciones con paralelismo de grano grueso puede

suponer una solución acertada.

La opción más utilizada en la actualidad es Gigabit Ethernet (1 Gbit/s),

siendo emergente la solución 10 Gigabit Ethernet (10 Gbit/s). La latencia

de estas tecnologías está en torno a los 30 a 100 μs, dependiendo del

protocolo de comunicación empleado.

En todo caso, es la red de administración por excelencia, así que aunque

no sea la solución de red de altas prestaciones para las comunicaciones,

es la red dedicada a las tareas administrativas.

Middleware

El middleware es un software que generalmente actúa entre el sistema operativo

y las aplicaciones con la finalidad de proveer a un clúster lo siguiente:

Una interfaz única de acceso al sistema, denominada SSI (Single System

Image), la cual genera la sensación al usuario de que utiliza un único

ordenador muy potente;

Herramientas para la optimización y mantenimiento del sistema: migración de

procesos, checkpoint-restart (congelar uno o varios procesos, mudarlos de

servidor y continuar su funcionamiento en el nuevo host), balanceo de carga,

tolerancia a fallos, etc.;

Escalabilidad: debe poder detectar automáticamente nuevos servidores

conectados al clúster para proceder a su utilización.

Existen diversos tipos de middleware, como por

ejemplo: MOSIX, OpenMOSIX, Cóndor, OpenSSI, etc.

El middleware recibe los trabajos entrantes al clúster y los redistribuye de manera

que el proceso se ejecute más rápido y el sistema no sufra sobrecargas en un

servidor. Esto se realiza mediante políticas definidas en el sistema

(automáticamente o por un administrador) que le indican dónde y cómo debe

distribuir los procesos, por un sistema de monitorización, el cual controla la carga

de cada CPU y la cantidad de procesos en él.

El middleware también debe poder migrar procesos entre servidores con distintas

finalidades:

balancear la carga: si un servidor está muy cargado de procesos y otro está

ocioso, pueden transferirse procesos a este último para liberar de carga al

primero y optimizar el funcionamiento;

Mantenimiento de servidores: si hay procesos corriendo en un servidor que

necesita mantenimiento o una actualización, es posible migrar los procesos a

otro servidor y proceder a desconectar del clúster al primero;

Priorización de trabajos: en caso de tener varios procesos corriendo en el

clúster, pero uno de ellos de mayor importancia que los demás, puede

migrarse este proceso a los servidores que posean más o mejores recursos

para acelerar su procesamiento.

Ambiente de programación paralela

Los ambientes de programación paralela permiten implementar algoritmos que

hagan uso de recursos compartidos: CPU (central Processing unit: ‘unidad central

de proceso’), memoria, datos y servicios.

CLÚSTER EN APLICACIONES CIENTIFICAS

Se suelen caracterizar por ser aplicaciones computacionalmente intensivas

Sus necesidades de recursos son muy importantes en almacenamiento y

especialmente memoria.

Requieren nodos y sistemas dedicados, en entornos HPC y HTC.

Suelen estar controlados los recursos por planificadores tipo Maui y gestores

de recursos tipo PBS.

Son en muchas ocasiones códigos legacy, difíciles de mantener, ya que los

dominios de aplicación suelen ser difícilmente paralelizables.

Ejemplos: Simulaciones (earth simulator), genómica computacional, predicción

meteorológica (MM5), simulación de corrientes y vertidos en el mar, aplicaciones

en química computacional

CLÚSTER EN APLICACIONES EMPRESARIALES

Suelen ser aplicaciones no especialmente intensivas computacionalmente,

pero que demandan alta disponibilidad y respuesta inmediata, con lo que los

servicios se están ejecutando continuamente y no controlados por un sistema

de colas

Es usual que un sistema provea varios servicios. Una primera aproximación

para realizar una distribución del trabajo es separar los servicios:

Un servidor web con la BD en un nodo, el contenedor EJB en otro y el

servidor de páginas web en otro constituye un claro ejemplo de

distribución en el ámbito empresarial.

Otra aproximación es instalar una aplicación web en un clúster squid

como proxy-caché, apache/tomcat como servidor: web/de aplicaciones

web, memcached como caché de consultas a la base de datos y mysql

como base de datos. Estos: servicios pueden estar replicados en varios

nodos del clúster.

Ejemplos: Flickr, Wikipedia y Google.

PLANEAR Y PREPARAR LA INSTALACIÓN DE CLÚSTERES

Se aplica a: Windows Server 2003, Windows Server 2003 R2, Windows Server

2003 with SP1, Windows Server 2003 with SP2.

Planear y preparar la instalación de clústeres

Antes de llevar a cabo la instalación de un clúster, debe planear los detalles de

hardware y de red.

Precaución

si utiliza un dispositivo de almacenamiento compartido, antes de crear un

clúster, al encender el equipo e iniciar el sistema operativo, es muy

importante que sólo un nodo tenga acceso al disco de clúster. De lo

contrario, los discos de clúster resultarán dañados. Para proteger los discos

de clúster antes de crear el clúster y evitar que se dañen, cierre todos los

nodos de clúster menos uno o utilice otras técnicas (por ejemplo, máscaras

LUN, presentación selectiva o división en zonas). Cuando el Servicio de

Cluster Server se esté ejecutando correctamente en un nodo, los demás

nodos se pueden instalar y configurar simultáneamente. Todos los nodos

del clúster deben ejecutar Windows Server 2003, Enterprise Edition o

Windows Server 2003, Datacenter Edition.

Al elaborar el plan, revise los elementos siguientes:

Hardware y controladores del clúster

Microsoft sólo admite sistemas completos de clústeres de servidor que sean

compatibles con la familia de Windows Server 2003. Compruebe si toda su

solución de clúster es compatible con los productos de la familia de Windows

ServerRecursos de soporteRecursos de soporte.

Para los discos de clúster debe utilizar el sistema de archivos NTFS y

configurarlos como discos básicos. No es posible configurar los discos de clúster

como dinámicos ni utilizar características de este tipo de discos, como los

volúmenes distribuidos (conjuntos de volúmenes).

Repase detenidamente las instrucciones del fabricante antes de comenzar a

instalar el hardware del clúster. De lo contrario, el almacenamiento del clúster

puede resultar dañado. Si el hardware del clúster incluye un bus SCSI, asegúrese

de revisar cuidadosamente las instrucciones referentes a la terminación del bus

SCSI y a la configuración de los Id. de SCSI.

Para simplificar la configuración y eliminar posibles problemas de compatibilidad,

trate de utilizar hardware idéntico para todos los nodos.

Adaptadores de red en los nodos de clúster

Mientras realiza los planes, decida qué tipo de comunicación se efectuará en cada

adaptador de red. En la lista siguiente se ofrecen detalles acerca de los tipos de

comunicación que se pueden llevar a cabo en un adaptador:

https://msdn.microsoft.com/es-es/library/cc772638(v=ws.10).aspx

Sólo comunicación de nodo a nodo (red privada). Esto implica que el

servidor tiene uno o varios adaptadores adicionales para efectuar otro tipo

de comunicación.

Para la comunicación de nodo a nodo, el adaptador de red se conecta a

una red privada que se utiliza exclusivamente dentro del clúster. Tenga en

cuenta que si la red privada utiliza un único concentrador o conmutador de

red, dicho dispositivo constituye un posible punto concentración de errores

en el clúster.

Los nodos de un clúster deben estar en la misma subred, pero puede

utilizar conmutadores de red LAN virtual (VLAN) en las interconexiones

entre dos nodos. Si utiliza una red VLAN, la latencia punto a punto de

recorrido completo debe ser inferior a 1/2 segundo y el vínculo entre dos

nodos debe aparecer como una conexión punto a punto única desde la

perspectiva del sistema operativo Windows que se ejecute en los nodos.

Para evitar que haya puntos de concentración de errores, utilice hardware

VLAN independiente para las diferentes rutas entre los nodos.

Si los nodos utilizan varias redes privadas (nodo a nodo), se recomienda

usar para sus adaptadores direcciones IP estáticas en lugar de DHCP.

Sólo comunicación del cliente al clúster (red pública). Esto implica que

el servidor tiene uno o varios adaptadores adicionales para efectuar otro

tipo de comunicación.

Comunicación de nodo a nodo y del cliente al clúster (red mixta). Si

hay varios adaptadores de red por nodo, un adaptador que efectúe ambos

tipos de comunicación puede servir como respaldo de los otros adaptadores

de red.

Comunicación no relacionada con el clúster. Si un nodo que forma parte

de un clúster proporciona también servicios no relacionados con el clúster y

tiene suficientes adaptadores, puede que desee utilizar un adaptador para

efectuar la comunicación no relacionada con el clúster.

Los nodos de un clúster tienen que estar conectados mediante dos o más redes

de área local (LAN); se necesitan al menos dos redes para evitar que haya un

único punto de error. La configuración de un clúster de servidores con sus nodos

conectados a través de una sola red no está permitida. Los adaptadores, cables,

concentradores y conmutadores de cada red se deben configurar de manera que,

cuando presenten un error, no afecten al resto. Normalmente, eso implica que los

componentes de cualquier par de redes deben ser físicamente independientes.

Deben configurarse al menos dos redes para controlar Todas las comunicaciones (red mixta) o Sólo para comunicaciones de clúster internas (red privada).La configuración recomendada para dos adaptadores consiste en utilizar un

adaptador para la comunicación privada (sólo de nodo a nodo) y el otro para la

comunicación mixta (comunicación de nodo a nodo y del cliente al clúster).

Intente elegir un nombre para cada conexión en el que se indique su propósito. El

nombre facilita la identificación de la conexión cuando sea necesario configurar el

servidor.

Notas

Si utiliza adaptadores de red con tolerancia a errores, cree varias redes

privadas en lugar de una sola red tolerante a errores.

No utilice adaptadores de red de colaboración en la red privada.

No configure una puerta de enlace predeterminada o un servidor DNS o

WINS en los adaptadores de red privada. No configure los adaptadores de

la red privada de modo que utilicen servidores de resolución de nombres en

la red pública; de lo contrario, un servidor de resolución de nombres en la

red pública podría asignar un nombre a una dirección IP en la red privada.

Si un cliente recibiera esa dirección IP del servidor de resolución de

nombres, podría no tener acceso a la dirección porque no existe ninguna

ruta desde el cliente a la dirección de la red privada.

Configure servidores WINS o DNS en los adaptadores de la red pública. Si

se utilizan recursos de nombre de red en las redes públicas, configure los

servidores DNS de modo que admitan actualizaciones dinámicas; de lo

contrario, puede que la operación de conmutación por error no se efectúe

correctamente en dichos recursos. Configure también una puerta de enlace

predeterminada en los adaptadores de la red pública. Si hay varias redes

públicas en el clúster, configure una puerta de enlace predeterminada sólo

en una de ellas.

Los adaptadores de un nodo determinado deben conectarse a redes en

subredes diferentes.

Si se utiliza el Asistente para el nuevo clúster de servidor o el Asistente

para agregar nodos con el fin de instalar clústeres en un nodo que contiene

dos adaptadores de red, de forma predeterminada, el asistente configura

ambos adaptadores para comunicaciones de red mixta. Se recomienda que

cambie la configuración de un adaptador para usarse únicamente en las

comunicaciones de la red privada. Configure manualmente las opciones de

comunicación, como Velocidad, Modo dúplex, Control de flujo y Tipo de

medio, de cada adaptador de red del clúster. No utilice la detección

automática. Todos los adaptadores de red del clúster deben utilizar la

misma configuración de comunicaciones.

Compruebe si toda su solución de clúster es compatible con los productos

de la familia de Windows Server Recursos de soporte.

Dirección IP del clúster

Obtenga una dirección IP estática para el clúster. No puede utilizar DHCP para

esta dirección.

Asignación de direcciones IP para los nodos del clúster

Determine cómo administrar el direccionamiento IP para los nodos individuales del

clúster. Cada adaptador de red de cada nodo requiere la asignación de

direcciones IP. Se recomienda asignar una dirección IP estática a cada adaptador

de red. Como alternativa, puede asignar las direcciones IP mediante DHCP. Si

utiliza direcciones IP estáticas, configure las correspondientes a cada pareja

vinculada de adaptadores de red (vinculados de nodo a nodo) de modo que estén

en la misma subred.

Tenga en cuenta que si utiliza DHCP para los nodos individuales del clúster,

puede resultar un punto de concentración de errores. Es decir, si configura los

nodos del clúster de forma que dependan de un servidor DHCP para obtener sus

direcciones IP, un error temporal del servidor DHCP puede hacer que los nodos

del clúster dejen de estar disponibles durante ese tiempo. Al decidir si se va a

utilizar DHCP, evalúe el modo de garantizar la disponibilidad de los servicios

DHCP y considere la posibilidad de utilizar concesiones duraderas para los nodos

del clúster. De esta forma ayuda a garantizar que siempre tengan una dirección IP

válida.

Nombre del clúster

Determine u obtenga un nombre apropiado para el clúster. Se trata del nombre

que los administradores utilizarán para las conexiones con el clúster. Las

aplicaciones que se ejecutan en el clúster suelen tener nombres de red diferentes.

El nombre del clúster debe ser distinto del nombre de dominio, de todos los

nombres de equipo del dominio y de otros nombres de clústeres del dominio.

Cuentas de equipo y asignación de dominios para los nodos del clúster

Asegúrese de que todos los nodos del clúster tienen cuentas de equipo en el

mismo dominio. Los nodos del clúster no pueden estar en un grupo de trabajo.

Cuenta de usuario de operador para la instalación y configuración del Servicio de

Cluster Server

Para instalar y configurar el Servicio de Cluster Server, debe utilizar una cuenta

que pertenezca al grupo Administradores local en cada nodo. Al instalar y

configurar los nodos, si no utiliza una cuenta del grupo local Administradores, se le

pedirá que proporcione las credenciales de inicio de sesión de dicha cuenta.

Cuenta de usuario del Servicio de Cluster Server

Cree u obtenga la cuenta de usuario del Servicio de Cluster Server. Se trata del

nombre y la contraseña con los que se ejecutará dicho servicio. Debe suministrar

esta información durante la instalación del clúster.

Es conveniente que la cuenta de usuario del Servicio de Cluster Server no se

utilice para ningún otro fin. Si tiene varios clústeres, configure una cuenta de

usuario del Servicio de Cluster Server exclusiva para cada uno. La cuenta debe

ser de dominio, no puede ser local. Sin embargo, no debe configurar esta cuenta

como de administrador de dominio porque no necesita derechos de usuario de

administrador de dominio.

Como parte del proceso de configuración del clúster, la cuenta de usuario del

Servicio de Cluster Server se agrega al grupo Administradores local de cada nodo.

Además de ser miembro del grupo local de administradores, la cuenta de usuario

del Servicio de Cluster Server requiere un conjunto adicional de derechos de

usuario:

Actuar como parte del sistema operativo

Realizar copia de seguridad de archivos y directorios

Ajustar cuotas de memoria para un proceso

Aumentar la prioridad de programación

Iniciar sesión como servicio

Restaurar archivos y directorios

Además, de forma predeterminada, la cuenta del Servicio de Cluster Server

hereda los derechos de usuario siguientes por ser miembro del grupo local

Administradores:

Administrar registro de auditoría y de seguridad

Depurar programas

Suplantar a un cliente después de la autenticación

Si su organización ha quitado estos derechos de usuario del conjunto

predeterminado de privilegios asignados al grupo local Administradores, tiene que

asignar específicamente estos derechos de usuario a la cuenta del Servicio de

Cluster Server.

Los derechos de usuario anteriores se conceden a la cuenta de usuario del

Servicio de Cluster Server como parte del proceso de configuración del clúster.

Observe que la cuenta de usuario del Servicio de Cluster Server continuará

teniendo estos derechos de usuario incluso después de que todos los nodos se

hayan retirado del clúster. El riesgo que supone esta circunstancia se ve atenuado

por el hecho de que estos derechos de usuario no se conceden en todo el

dominio, sino sólo de forma local en cada nodo existente anteriormente. Sin

embargo, debe quitar la cuenta de cada nodo retirado si ya no se necesita.

Asegúrese de evitar que la contraseña caduque en la cuenta de usuario del

Servicio de Cluster Server (siga las directivas de su organización para la

renovación de contraseñas). Para obtener más información, consulte Contraseñas.

Volumen para información importante de configuración del clúster (archivos de

punto de comprobación y registro)

Piense en disponer de un volumen independiente en el almacenamiento del

clúster para contener información importante de configuración del mismo. Esta

información conforma el recurso de quórum del clúster, que es necesario cuando

un nodo del clúster deja de funcionar. El recurso de quórum proporciona un lugar

de almacenamiento independiente del nodo destinado a datos esenciales para el

clúster.

El tamaño mínimo recomendado del volumen es de 500 MB. Se recomienda que

no almacene datos de usuario en ningún volumen de recurso de quórum. No use

instantáneas de carpetas compartidas para el recurso de quórum. Si planea

colocar el recurso de quórum en un disco con múltiples particiones NTFS,


asegúrese de que todas las particiones del disco están asignadas a letras de

unidad.

Nota

al planear y realizar la configuración de los discos de clúster, configúrelos

como discos básicos con todas las particiones formateadas como NTFS

(pueden estar comprimidos o no). Cree particiones y formatee todos los

discos del dispositivo de almacenamiento del clúster antes de agregar el

primer nodo al clúster. No los configure como discos dinámicos ni utilice

volúmenes distribuidos (conjuntos de volúmenes) ni Almacenamiento

remoto en los discos del clúster. Las particiones de los discos de clúster en

un dispositivo de almacenamiento en clúster deben crearse como discos de

registro de inicio maestro (MBR) en lugar de discos de tabla de particiones

GUID (GPT).

En la siguiente sección se describe la instalación física del almacenamiento del

clúster.

Comenzar la instalación del hardware del clúster

Los pasos que se llevan a cabo al conectar físicamente e instalar el hardware del

clúster por primera vez son cruciales. Asegúrese de seguir las instrucciones del

fabricante del hardware con relación a dichos pasos iniciales.

Importante

Revise con atención los cables de red después de conectarlos. Asegúrese

de que no hay ningún cable cruzado por error (por ejemplo, una red privada

conectada a una pública).

Pasos iniciales que se deben llevar a cabo en el BIOS o EFI si se utiliza un

dispositivo de almacenamiento compartido de SCSI

Si utiliza un dispositivo de almacenamiento compartido, al adjuntar el hardware de

clúster por primera vez (el bus compartido y el almacenamiento de clúster),

asegúrese de que trabaja sólo desde las pantallas de configuración de firmware en

los nodos del clúster (un nodo es un servidor en un clúster). En un equipo de 32

bits, utilice las pantallas de configuración del BIOS. En un equipo basado en la

arquitectura Itanium, utilice las pantallas de configuración de la Interfaz de

firmware extensible (EFI). Las instrucciones del fabricante explicarán si estas

pantallas de configuración se muestran automáticamente o si, tras encender el

equipo, debe presionar teclas específicas para obtener acceso a ellas. Siga las

instrucciones del fabricante para completar el proceso de configuración del BIOS o

la EFI. Durante esta fase inicial de la instalación, permanezca en las pantallas de

configuración del BIOS o EFI, y no deje que se inicie el sistema operativo. Realice

los pasos siguientes mientras los nodos del clúster siguen presentando pantallas

de configuración del BIOS o EFI, antes de iniciar el sistema operativo en el primer

nodo de clúster.

Importante

Asegúrese de que comprende y sigue las instrucciones del fabricante para

terminar el bus SCSI.

Asegúrese de que todos los dispositivos del bus compartido (tanto los

controladores SCSI como los discos duros) tienen un Id. SCSI único. Si

todos los controladores SCSI tienen el mismo Id. predeterminado

(normalmente es el Id. SCSI 7), cambie el Id. de un controlador por, por

ejemplo Id. SCSI 6. Si en el bus SCSI compartido va a haber más de un

disco, cada uno de ellos debe tener también un Id. SCSI único. Asegúrese

también de que el bus no está configurado para restablecer los Id. SCSI

automáticamente al encender el equipo (de lo contrario, cambiará los Id.

que usted ha especificado).

Asegúrese de que puede examinar el bus y ver las unidades desde los

nodos del clúster (mientras esté viendo las pantallas de configuración del

BIOS o EFI).

Pasos iniciales que se deben llevar a cabo en el BIOS o EFI si se utiliza un

dispositivo de almacenamiento compartido de Fibre Channel o no se utiliza ningún

dispositivo de almacenamiento compartido

Encienda un solo nodo. Deje los demás nodos apagados.

Durante esta fase inicial de la instalación, permanezca en el proceso de

configuración del BIOS o la Interfaz de firmware extensible (EFI, Extensible

Firmware Interface) y no deje que se inicie el sistema operativo. Cuando

esté viendo las pantallas de configuración del BIOS o la EFI, asegúrese de

que puede examinar el bus y ver las unidades desde el nodo de clúster

activo. En un equipo de 32 bits, utilice las pantallas de configuración del

BIOS. En un equipo basado en la arquitectura Itanium, utilice las pantallas

de configuración de la EFI. Consulte las instrucciones del fabricante para

determinar si las pantallas de configuración se muestran automáticamente o

si, tras encender el equipo, debe presionar teclas específicas para tener

acceso a ellas. Siga las instrucciones del fabricante para completar el

proceso de configuración del BIOS o la EFI.

Pasos finales para completar la instalación

Si todavía no ha instalado Windows Server 2003, Enterprise Edition o

Windows Server 2003, Datacenter Edition en el primer nodo del clúster, instálelo

antes de continuar. Después de completar la configuración del BIOS o EFI, inicie

el sistema operativo en un solo nodo del clúster y complete la configuración del

Servicio de Cluster Server mediante el Administrador de clústeres.

Con el Asistente para el nuevo clúster de servidor del Administrador de clústeres,

puede elegir entre las opciones de configuración Típica (completa) y Avanzada

(mínima). La configuración típica es adecuada para la mayoría de las instalaciones

y su resultado es un clúster totalmente configurado. Utilice la opción de

configuración Avanzada sólo para los clústeres que tengan configuraciones de

almacenamiento complejas que el Asistente para el nuevo clúster de servidor no

pueda comprobar o para configuraciones en las que no desea que el clúster

administre todo el almacenamiento. En los ejemplos siguientes se describe cada

caso:

En algunas soluciones de almacenamiento complejas, por ejemplo, un

tejido conmutado de canales de fibra que contiene varios conmutadores, es

posible que una unidad de almacenamiento determinada tenga una

identidad diferente en cada equipo del clúster. Aunque es una configuración

de almacenamiento válida, no cumple la heurística de validación del

almacenamiento del Asistente para el nuevo clúster de servidor. Si tiene

este tipo de solución de almacenamiento, es posible que ocurra un error al

intentar crear un clúster mediante la opción de configuración Típica. Si el

almacenamiento está correctamente configurado, puede deshabilitar la

heurística de validación del almacenamiento y evitar este error; para ello,

reinicie el Asistente para el nuevo clúster de servidor y seleccione la opción

de configuración Avanzada.

Es posible que desee tener, en algunos nodos de un clúster, algunos discos

que se van a organizar en clústeres y algunos que se van a mantener

privados. La opción de configuración Típica configura todos los discos como

discos organizados en clústeres y crea los recursos de clúster para todos

ellos. No obstante, con la opción de configuración Avanzada, puede

mantener algunos discos privados porque esta configuración crea un clúster

que sólo administra el disco de quórum (si eligió utilizar un disco físico

como recurso de quórum). Una vez creado el clúster, debe utilizar el

Administrador de clústeres para agregar otros discos que desea que el

clúster administre.

Importante

Si utiliza un dispositivo de almacenamiento compartido: antes de crear un

clúster, al encender el equipo e iniciar el sistema operativo, es muy

importante que sólo un nodo tenga acceso al disco de clúster. De lo

contrario, los discos de clúster resultarán dañados. Para proteger los discos

de clúster antes de crear el clúster y evitar que se dañen, cierre todos los

nodos de clúster menos uno o utilice otras técnicas (por ejemplo, máscaras

LUN, presentación selectiva o división en zonas). Asimismo, antes de iniciar

la instalación del segundo y posteriores nodos, asegúrese de que todos los

discos que va a administrar el clúster tienen recursos de discos asociados.

Si estos discos no tienen recursos de disco asociados en ese momento, los

datos del disco se dañarán porque los discos no están protegidos y varios

nodos intentarán conectarse a ellos al mismo tiempo.

No utilice el Asistente para administrar su servidor o el Asistente para

configurar su servidor con el fin de configurar los nodos de un clúster.

MÁQUINA VIRTUAL

En informática una máquina virtual es un software que simula a una computadora

y puede ejecutar programas como si fuese una computadora real. Este software

en un principio fue definido como "un duplicado eficiente y aislado de una máquina

física". La acepción del término actualmente incluye a máquinas virtuales que no

tienen ninguna equivalencia directa con ningún hardware real.

Una característica esencial de las máquinas virtuales es que los procesos que

ejecutan están limitados por los recursos y abstracciones proporcionados por

ellas. Estos procesos no pueden escaparse de esta "computadora virtual".

Uno de los usos domésticos más extendidos de las máquinas virtuales es ejecutar

sistemas operativos para "probarlos". De esta forma podemos ejecutar un sistema

operativo que queramos probar (GNU/Linux, por ejemplo) desde nuestro sistema

operativo habitual (Mac OS X por ejemplo) sin necesidad de instalarlo

directamente en nuestra computadora y sin miedo a que se desconfigure el

sistema operativo primario.

Clasificación de las máquinas virtuales

Las máquinas virtuales se pueden clasificar en dos grandes categorías según su

funcionalidad y su grado de equivalencia a una verdadera máquina.

Máquinas virtuales de sistema (en inglés System Virtual Machine) y Máquinas

virtuales de proceso (en inglés Process Virtual Machine)

Máquinas virtuales de sistema

Las máquinas virtuales de sistema, también llamadas máquinas virtuales de

hardware, permiten a la máquina física subyacente multiplicarse entre varias

máquinas virtuales, cada una ejecutando su propio sistema operativo. A la capa de

software que permite la virtualización se la llama monitor de máquina

virtual o hypervisor. Un monitor de máquina virtual puede ejecutarse o bien

directamente sobre el hardware o bien sobre un sistema operativo ("host operating

System").

Máquinas virtuales de proceso

Una máquina virtual de proceso, a veces llamada "máquina virtual de aplicación",

se ejecuta como un proceso normal dentro de un sistema operativo y soporta un

solo proceso. La máquina se inicia automáticamente cuando se lanza el proceso

que se desea ejecutar y se detiene para cuando éste finaliza. Su objetivo es el de

proporcionar un entorno de ejecución independiente de la plataforma de hardware

y del sistema operativo, que oculte los detalles de la plataforma subyacente y

permita que un programa se ejecute siempre de la misma forma sobre cualquier

plataforma.

El ejemplo más conocido actualmente de este tipo de máquina virtual es

la máquina virtual de Java. Otra máquina virtual muy conocida es la del

entorno .Net de Microsoft que se llama "Common Language Runtime".

Algunos conceptos:

La Máquina Virtual Paralela (conocida como PVM por sus siglas en inglés

de Parallel Virtual Machine) es una biblioteca para el cómputo paralelo en un

sistema distribuido de computadoras. Está diseñado para permitir que una red de

computadoras heterogénea comparta sus recursos de cómputo (como el

procesador y la memoria RAM) con el fin de aprovechar esto para disminuir el

tiempo de ejecución de un programa al distribuir la carga de trabajo en varias

computadoras.

La biblioteca PVM fue desarrollada por la Universidad de Tennessee, el

Laboratorio Nacional Oak Ridge y la Universidad Emory. La primera versión fue

escrita en ORNL en1989, y después de ser modificado por la Universidad de

Tennessee, fue lanzada la versión 2 en marzo de 1991. La versión 3 fue lanzada

en marzo de 1993 con mejoras en la tolerancia a fallas y portabilidad.

Dispone de un Debugger gráfico que se llama XPVM, aunque hay otros

desarrollos similares.

MPICH es un programa de biblioteca de desarrollo de libre

disposición implementación portable de MPI, una norma estándar de paso de

mensaje para aplicaciones de memoria distribuida que utilizan computación

paralela. MPICH es software gratuito y disponible para la mayoría de Unix

(incluyendo Linux y Mac OS X) y Microsoft Windows.

La implementación original de MPICH se llama MPICH1 y esta implementa el

estándar MPI-1.1. A partir del 2006 implementación más reciente se llama

MPICH2, pero todavía no admite traducciones de datos entre las diferentes

arquitecturas hardware.

MPICH es una implementación de MPI optimizada para entornos homogéneos

y myrinet, lo que proporciona un mayor rendimiento en el paso de mensajes entre

nodos.

LAM / MPI es uno de los predecesores del Abierto de MPI proyecto. Abrir MPI

representa una aplicación de próxima generación impulsado por la comunidad de

https://en.wikipedia.org/wiki/Open_MPI

https://es.wikipedia.org/wiki/Myrinet

https://es.wikipedia.org/w/index.php?title=MPICH1&action=edit&redlink=1

https://es.wikipedia.org/w/index.php?title=Implementar&action=edit&redlink=1

https://es.wikipedia.org/wiki/Programa_inform%C3%A1tico

https://es.wikipedia.org/wiki/1993



https://es.wikipedia.org/wiki/Memoria_RAM

https://es.wikipedia.org/wiki/Biblioteca_(programaci%C3%B3n)

un interfaz de paso de mensajes (MPI), diseñado fundamentalmente en una

arquitectura de componentes para hacer una plataforma muy potente para

la computación de alto rendimiento.

LAM (Local Área multicomputador) es un sistema de entorno de programación y

desarrollo MPI para ordenadores heterogéneos en una red. Con LAM / MPI, un

dedicado grupo de equipo o una infraestructura de computación de red existente

puede actuar como una sola computación paralela de recursos. LAM / MPI se

considera que es "clúster amigable", ya que ofrece a base de daemon proceso de

inicio / control, así como los protocolos que pasan rápido de mensajes de cliente a

cliente. LAM / MPI puede utilizar TCP / IP, memoria compartida, Myrinet (GM),

o Infiniband (mVAPI) para el paso de mensajes.

LAM ofrece una implementación completa de MPI-1 y gran parte de MPI-

2. Aplicaciones compatibles son código fuente portable entre LAM / MPI y

cualquier otra implementación de MPI. Además de proporcionar una

implementación de alta calidad de la norma MPI, LAM / MPI ofrece capacidades

de monitoreo extensivos para apoyar la depuración. Monitoreo ocurre en dos

niveles. En primer lugar, LAM / MPI tiene los ganchos para permitir una

instantánea del proceso y estado de los mensajes que deben tomarse en cualquier

momento durante la ejecución de la aplicación. Esta instantánea incluye todos los

aspectos de sincronización además de tipo de datos de mapas / firmas,

pertenencia a un grupo comunicador y contenido del mensaje (ver la aplicación

XMPI en el sitio web principal de la LAM). En el segundo nivel, la biblioteca MPI

está equipado para producir un registro acumulativo de la comunicación, que

puede visualizarse ya sea en tiempo de ejecución o post-mortem.

https://en.wikipedia.org/wiki/Message_passing

https://en.wikipedia.org/wiki/Infiniband

https://en.wikipedia.org/wiki/Myrinet

https://en.wikipedia.org/wiki/Shared_memory

https://en.wikipedia.org/wiki/TCP/IP

https://en.wikipedia.org/wiki/Parallel_computing

https://en.wikipedia.org/wiki/Computer_cluster

https://en.wikipedia.org/wiki/Multicomputer

https://en.wikipedia.org/wiki/High-performance_computing

https://en.wikipedia.org/wiki/Message_Passing_Interface

CONCLUSIÓN

Nuestra conclusión acerca sobre los clúster es que son un tipo de arquitectura que

consiste en varios computadores interconectados entre sí.

Ahora sabemos que la tecnología de clústeres ha evolucionado en apoyo de

algunas actividades que van desde aplicaciones de supercómputo, software para

aplicaciones críticas, servidores web y comercio electrónico, hasta bases de datos

de alto rendimiento, entre otros usos que son muy importantes dentro de la

informática.

Los clústeres son importantes porque permiten combinar múltiples sistemas para

que trabajen en paralelo y se comporten como un recurso informático unificado

para servir a un grupo de tareas, proporcionar tolerancia a fallos y tener

disponibilidad continua.

La instalación de un clúster se puede hacer virtualmente y físicamente en una

computadora, pero hacerlo físicamente es algo complicado ya que requiere de

muchas operaciones y de cierto requisitos y si no se hacen o cumplen de manera

correcta el clúster no se ejecutara de manera correcta; pero, hacerlo de forma

virtual es un poco más fácil ya que si surge algún problema se puede realizar de

nuevo la instalación.

Referencias

http://www.revista.unam.mx/vol.4/num2/art3/cluster.htm

https://es.wikipedia.org/wiki/Cl%C3%BAster_(inform

%C3%A1tica)#Clasificaci.C3.B3n_de_los_cl.C3.BAsteres

https://es.wikipedia.org/wiki/M%C3%A1quina_virtual

https://en.wikipedia.org/wiki/LAM/MPI


https://es.wikipedia.org/wiki/MPICH