INSTITUTO TECNOLOGICO
De Tuxtepec
“CLUSTERS ”
CARRERA:INGENIERÍA EN INFORMÁTICA
MATERIA:SISTEMAS OPERATIVOS 2
PRESENTA:
CATEDRATICO:
San Juan Bautista Tuxtepec, Oaxaca a 31 de Agosto del 2015
ISC - 2010/01 AGOSTO 2015
Introducción
Un clúster es una tipo de arquitectura paralela distribuida que consiste de un
conjunto de computadores independientes (y bajo coste en principio)
interconectados operando de forma conjunta como un único recurso
computacional Sin embargo, cada computador puede utilizarse de forma
independiente o separada
La tecnología de clústeres ha evolucionado en apoyo de actividades que van
desde aplicaciones de supercómputo y software para aplicaciones críticas,
servidores web y comercio electrónico, hasta bases de datos de alto rendimiento,
entre otros usos.
El cómputo con clústeres surge como resultado de la convergencia de varias
tendencias actuales que incluyen la disponibilidad de microprocesadores
económicos de alto rendimiento y redes de alta velocidad, el desarrollo de
herramientas de software para cómputo distribuido de alto rendimiento, así como
la creciente necesidad de potencia computacional para aplicaciones que la
requieran.
Simplemente, un clúster es un grupo de múltiples ordenadores unidos mediante
una red de alta velocidad, de tal forma que el conjunto es visto como un único
ordenador, más potente que los comunes de escritorio.
CLÚSTER
El origen del término y del uso de este tipo de tecnología es desconocido pero se
puede considerar que comenzó a finales de los años cincuenta y principios de los
sesenta.
La base formal de la ingeniería informática cree que la metodología de proveer un
medio de hacer trabajos paralelos de cualquier tipo fue inventado posiblemente
por Gene Amdahl de IBM, que en 1967 publicó lo que ha llegado a ser
considerado como el "white paper" inicial de procesamiento paralelo: la Ley de
Amdahl que describe matemáticamente el aceleramiento que se puede esperar
paralelizando cualquier otra serie de tareas realizadas en una arquitectura
paralela.
Este artículo define la base para la ingeniería de la computación
tanto multiprocesador y computación clúster, en donde el principal papel
diferenciador es si las comunicaciones interprocesador cuentan con el apoyo
«dentro» de la computadora (por ejemplo, en una configuración personalizada
para el bus o la red de las comunicaciones internas) o «fuera» del ordenador en
una red «commodity».
En consecuencia, la historia de los primeros grupos de computadoras está más o
menos directamente ligado a la historia de principios de las redes, como una de
las principales motivaciones para el desarrollo de una red para enlazar los
recursos de computación, de hecho la creación de un clúster de computadoras.
Las redes de conmutación de paquetes fueron conceptualmente inventados por la
corporación RAND en 1962.
Utilizando el concepto de una red de conmutación de paquetes, el
proyecto ARPANET logró crear en 1969 lo que fue posiblemente la primera red de
computadoras básica basadas en el clúster de computadoras en cuatro centros
informáticos (cada una de las cuales fue algo similar a un «clúster» pero no un
«commodity clúster» como hoy en día lo entendemos).
El proyecto ARPANET creció y se convirtió en lo que es ahora Internet. Se puede
considerar como «la madre de todos los clústeres» (como la unión de casi todos
los recursos de cómputo, incluidos los clústeres, que pasarían a ser conectados).
También estableció el paradigma de uso de computadoras clústeres en el mundo
de hoy: el uso de las redes de conmutación de paquetes para realizar las
comunicaciones entre procesadores localizados en los marcos de otro modo
desconectados.
El desarrollo de la construcción de PC por los clientes y grupos de investigación
procedió a la par con la de las redes y el sistema operativo Unix desde principios
de la década de los años setenta, como TCP/IP y el proyecto de
la Xerox PARC proyecto y formalizado para protocolos basados en la red de
comunicaciones.
El núcleo del sistema operativo fue construido por un grupo de DEC PDP-11
minicomputadoras llamado C.mmp en C-MU en 1971.
Sin embargo, no fue hasta alrededor de 1983 que los protocolos y herramientas
para el trabajo remoto facilitasen la distribución y el uso compartido de archivos
fueran definidos (en gran medida dentro del contexto de BSD Unix, e
implementados por Sun Microsystems) y, por tanto llegar a disponerse
comercialmente, junto con una compartición del sistema de ficheros.
El primer producto comercial de tipo clúster fue ARCnet, desarrollada en 1977 por
Datapoint pero no obtuvo un éxito comercial y los clústeres no consiguieron tener
éxito hasta que en 1984 VAXcluster produjeran el sistema operativo VAX/VMS.
El ARCnet y VAXcluster no solo son productos que apoyan la computación
paralela, sino que también comparten los sistemas de archivos y dispositivos
periféricos.
La idea era proporcionar las ventajas del procesamiento paralelo, al tiempo que se
mantiene la fiabilidad de los datos y el carácter singular. VAXcluster, VMScluster
están todavía disponibles en los sistemas de HP OpenVMS corriendo en sistemas
Itanium y Alpha.
Otros dos principios comerciales de clústeres notables fueron el Tandem Himalaya
(alrededor 1994 de con productos de alta disponibilidad) y el IBM S/390 Parallel
Sysplex (también alrededor de 1994, principalmente para el uso de la empresa).
La historia de los clústeres de computadoras estaría incompleta sin señalar el
papel fundamental desempeñado por el desarrollo del software de PVM (parallel
virtual machine: ‘máquina virtual paralela’).
Este software de código fuente libre, basado en comunicaciones TCP/IP permitió
la creación de un superordenador virtual ―un clúster HPC― realizada desde
cualquiera de los sistemas conectados TCP/IP.
De forma libre los clústeres heterogéneos han constituido la cima de este modelo,
logrando aumentar rápidamente en FLOPS y superando con creces la
disponibilidad incluso de los supercomputadores más caros.
PVM y el empleo de PC y redes de bajo costo llevó, en 1993, a un proyecto de la
NASA para construir supercomputadoras basados en clústeres.
En 1995, la invención de la Beowulf ―un estilo de clúster― una granja de
computación diseñada según un producto básico de la red con el objetivo
específico de «ser un superordenador» capaz de realizar firmemente cálculos
paralelos HPC.
Esto estimuló el desarrollo independiente de la computación Grid como una
entidad, a pesar de que el estilo Grid giraba en torno al del sistema operativo Unix
y el Arpanet
CARACTERISTICAS DEL CLÚSTER
Permite combinar múltiples sistemas para que trabajen en paralelo y se comporten
como un recurso informático unificado para: servir a un grupo de tareas,
proporcionar tolerancia a fallos y tener disponibilidad continua. Por ejemplo, en el
caso de usuarios de Internet, el clustering proporciona bases de datos, correo
electrónico, ficheros u otros servicios de sistema sin interrupciones. Si se
presentara una falla dentro de una red de servidores de un clúster, ésta se
corregiría inmediatamente sin que los usuarios lo notaran. Dentro de esta técnica
existen una serie de conceptos fundamentales que se describen a continuación.
Comencemos por explicar el concepto de paralelismo, que consiste en el
procesamiento de una serie de instrucciones de un programa, que son ejecutadas
por múltiples procesadores que trabajan de manera independiente. El paralelismo
puede manejarse en dos niveles: paralelismo del hardware y el software. El
primero depende básicamente de la tecnología de cómputo disponible, mientras el
segundo se refiere a la habilidad del usuario para encontrar áreas bien definidas
del problema por resolver, de tal forma que éste pueda ser dividido en partes
autónomas que serán distribuidas entre los nodos del clúster, obteniendo un
sistema de alto rendimiento computacional.
Por otro lado está el concepto de multiprocesamiento, una
característica del sistema operativo que controla el hardware. El
software asegura la interacción entre los procesadores a nivel de
carga y descarga de datos, además de realizar el despacho de
trabajos en forma múltiple, independiente y simultánea. Otro
concepto fundamental es la programación de hebras (programming threads).
Una hebra (thread) es una secuencia de instrucciones ejecutables que pueden
correr independientemente, compartiendo recursos computacionales con otras
hebras. En un programa hay la posibilidad de ejecutar varias hebras
simultáneamente. Cuando esto ocurre todas las hebras activas pueden competir y
compartir los recursos del sistema. Por lo tanto, el usuario ha recurrido a
la programación multi-hebras (multithread) que trae como consecuencia la
concurrencia entre procesos y tiene una gran importancia en el cómputo paralelo
(para obtener una descripción más detallada, ver E. Cuadros 2001).
COMO FUNCIONA UN CLÚSTER
En general, un clúster necesita de varios componentes de software y hardware
para poder funcionar:
Nodos
Sistemas Operativos
Conexiones de Red
Middleware (capa de abstracción entre el usuario y los sistemas operativos)
Ambientes de Programación Paralela.
Aplicaciones (pueden ser paralelas o no)
Nodos
Pueden ser simples ordenadores, sistemas multiprocesador o estaciones de
trabajo (Workstation). En informática, de forma muy general, un nodo es un punto
de intersección o unión de varios elementos que confluyen en el mismo lugar.
Ahora bien, dentro de la informática la palabra nodo puede referirse a conceptos
diferentes según el ámbito en el que nos movamos:
En redes de computadoras cada una de las máquinas es un nodo, y si la red
es Internet, cada servidor constituye también un nodo.
En estructuras de datos dinámicas un nodo es un registro que contiene un dato
de interés y al menos un puntero para referenciar (apuntar) a otro nodo. Si la
estructura tiene solo un puntero, la única estructura que se puede construir con
él es una lista, si el nodo tiene más de un puntero ya se pueden construir
estructuras más complejas como árboles o grafos.
El clúster puede estar conformado por nodos dedicados o por nodos no
dedicados.
En un clúster con nodos dedicados, los nodos no disponen de teclado, ratón ni
monitor y su uso está exclusivamente dedicado a realizar tareas relacionadas con
el clúster. Mientras que, en un clúster con nodos no dedicados, los nodos
disponen de teclado, ratón y monitor y su uso no está exclusivamente dedicado a
realizar tareas relacionadas con el clúster, el clúster hace uso de los ciclos de reloj
que el usuario del computador no está utilizando para realizar sus tareas.
Cabe aclarar que a la hora de diseñar un clúster, los nodos deben tener
características similares, es decir, deben guardar cierta similitud de arquitectura y
sistemas operativos, ya que si se conforma un clúster con nodos totalmente
heterogéneos (existe una diferencia grande entre capacidad de procesadores,
memoria, disco duro) será ineficiente debido a que el middleware delegará o
asignará todos los procesos al nodo de mayor capacidad de cómputo y solo
distribuirá cuando este se encuentre saturado de procesos; por eso es
recomendable construir un grupo de ordenadores lo más similares posible.
Sistemas operativos
Un sistema operativo debe ser multiproceso y multiusuario. Otras características
deseables son la facilidad de uso y acceso. Un sistema operativo es un programa
o conjunto de programas de computadora destinado a permitir una gestión eficaz y
segura de sus recursos. Comienza a trabajar cuando el gestor de arranque carga
en memoria su núcleo y gestiona el hardware de la máquina desde los niveles
más básicos, permitiendo también la interacción con el usuario. Se puede
encontrar normalmente en la mayoría de los aparatos electrónicos que utilicen
microprocesadores para funcionar, ya que gracias a estos podemos entender la
máquina y que ésta cumpla con sus funciones (teléfonos móviles, reproductores
de DVD, radios, computadoras, etc.).
Conexiones de red
Los nodos de un clúster pueden conectarse mediante una simple red Ethernet con
placas comunes (adaptadores de red o NICs), o utilizarse tecnologías especiales
de alta velocidad como Fast Ethernet, Gigabit Ethernet, Myrinet, InfiniBand, SCI,
etc.
Ethernet
Son las redes más utilizadas en la actualidad, debido a su relativo bajo
coste. No obstante, su tecnología limita el tamaño de paquete, realizan
excesivas comprobaciones de error y sus protocolos no son eficientes, y
sus velocidades de transmisión pueden limitar el rendimiento de los
clústeres. Para aplicaciones con paralelismo de grano grueso puede
suponer una solución acertada.
La opción más utilizada en la actualidad es Gigabit Ethernet (1 Gbit/s),
siendo emergente la solución 10 Gigabit Ethernet (10 Gbit/s). La latencia
de estas tecnologías está en torno a los 30 a 100 μs, dependiendo del
protocolo de comunicación empleado.
En todo caso, es la red de administración por excelencia, así que aunque
no sea la solución de red de altas prestaciones para las comunicaciones,
es la red dedicada a las tareas administrativas.
Middleware
El middleware es un software que generalmente actúa entre el sistema operativo
y las aplicaciones con la finalidad de proveer a un clúster lo siguiente:
Una interfaz única de acceso al sistema, denominada SSI (Single System
Image), la cual genera la sensación al usuario de que utiliza un único
ordenador muy potente;
Herramientas para la optimización y mantenimiento del sistema: migración de
procesos, checkpoint-restart (congelar uno o varios procesos, mudarlos de
servidor y continuar su funcionamiento en el nuevo host), balanceo de carga,
tolerancia a fallos, etc.;
Escalabilidad: debe poder detectar automáticamente nuevos servidores
conectados al clúster para proceder a su utilización.
Existen diversos tipos de middleware, como por
ejemplo: MOSIX, OpenMOSIX, Cóndor, OpenSSI, etc.
El middleware recibe los trabajos entrantes al clúster y los redistribuye de manera
que el proceso se ejecute más rápido y el sistema no sufra sobrecargas en un
servidor. Esto se realiza mediante políticas definidas en el sistema
(automáticamente o por un administrador) que le indican dónde y cómo debe
distribuir los procesos, por un sistema de monitorización, el cual controla la carga
de cada CPU y la cantidad de procesos en él.
El middleware también debe poder migrar procesos entre servidores con distintas
finalidades:
balancear la carga: si un servidor está muy cargado de procesos y otro está
ocioso, pueden transferirse procesos a este último para liberar de carga al
primero y optimizar el funcionamiento;
Mantenimiento de servidores: si hay procesos corriendo en un servidor que
necesita mantenimiento o una actualización, es posible migrar los procesos a
otro servidor y proceder a desconectar del clúster al primero;
Priorización de trabajos: en caso de tener varios procesos corriendo en el
clúster, pero uno de ellos de mayor importancia que los demás, puede
migrarse este proceso a los servidores que posean más o mejores recursos
para acelerar su procesamiento.
Ambiente de programación paralela
Los ambientes de programación paralela permiten implementar algoritmos que
hagan uso de recursos compartidos: CPU (central Processing unit: ‘unidad central
de proceso’), memoria, datos y servicios.
CLÚSTER EN APLICACIONES CIENTIFICAS
Se suelen caracterizar por ser aplicaciones computacionalmente intensivas
Sus necesidades de recursos son muy importantes en almacenamiento y
especialmente memoria.
Requieren nodos y sistemas dedicados, en entornos HPC y HTC.
Suelen estar controlados los recursos por planificadores tipo Maui y gestores
de recursos tipo PBS.
Son en muchas ocasiones códigos legacy, difíciles de mantener, ya que los
dominios de aplicación suelen ser difícilmente paralelizables.
Ejemplos: Simulaciones (earth simulator), genómica computacional, predicción
meteorológica (MM5), simulación de corrientes y vertidos en el mar, aplicaciones
en química computacional
CLÚSTER EN APLICACIONES EMPRESARIALES
Suelen ser aplicaciones no especialmente intensivas computacionalmente,
pero que demandan alta disponibilidad y respuesta inmediata, con lo que los
servicios se están ejecutando continuamente y no controlados por un sistema
de colas
Es usual que un sistema provea varios servicios. Una primera aproximación
para realizar una distribución del trabajo es separar los servicios:
Un servidor web con la BD en un nodo, el contenedor EJB en otro y el
servidor de páginas web en otro constituye un claro ejemplo de
distribución en el ámbito empresarial.
Otra aproximación es instalar una aplicación web en un clúster squid
como proxy-caché, apache/tomcat como servidor: web/de aplicaciones
web, memcached como caché de consultas a la base de datos y mysql
como base de datos. Estos: servicios pueden estar replicados en varios
nodos del clúster.
Ejemplos: Flickr, Wikipedia y Google.
PLANEAR Y PREPARAR LA INSTALACIÓN DE CLÚSTERES
Se aplica a: Windows Server 2003, Windows Server 2003 R2, Windows Server
2003 with SP1, Windows Server 2003 with SP2.
Planear y preparar la instalación de clústeres
Antes de llevar a cabo la instalación de un clúster, debe planear los detalles de
hardware y de red.
Precaución
si utiliza un dispositivo de almacenamiento compartido, antes de crear un
clúster, al encender el equipo e iniciar el sistema operativo, es muy
importante que sólo un nodo tenga acceso al disco de clúster. De lo
contrario, los discos de clúster resultarán dañados. Para proteger los discos
de clúster antes de crear el clúster y evitar que se dañen, cierre todos los
nodos de clúster menos uno o utilice otras técnicas (por ejemplo, máscaras
LUN, presentación selectiva o división en zonas). Cuando el Servicio de
Cluster Server se esté ejecutando correctamente en un nodo, los demás
nodos se pueden instalar y configurar simultáneamente. Todos los nodos
del clúster deben ejecutar Windows Server 2003, Enterprise Edition o
Windows Server 2003, Datacenter Edition.
Al elaborar el plan, revise los elementos siguientes:
Hardware y controladores del clúster
Microsoft sólo admite sistemas completos de clústeres de servidor que sean
compatibles con la familia de Windows Server 2003. Compruebe si toda su
solución de clúster es compatible con los productos de la familia de Windows
ServerRecursos de soporteRecursos de soporte.
Para los discos de clúster debe utilizar el sistema de archivos NTFS y
configurarlos como discos básicos. No es posible configurar los discos de clúster
como dinámicos ni utilizar características de este tipo de discos, como los
volúmenes distribuidos (conjuntos de volúmenes).
Repase detenidamente las instrucciones del fabricante antes de comenzar a
instalar el hardware del clúster. De lo contrario, el almacenamiento del clúster
puede resultar dañado. Si el hardware del clúster incluye un bus SCSI, asegúrese
de revisar cuidadosamente las instrucciones referentes a la terminación del bus
SCSI y a la configuración de los Id. de SCSI.
Para simplificar la configuración y eliminar posibles problemas de compatibilidad,
trate de utilizar hardware idéntico para todos los nodos.
Adaptadores de red en los nodos de clúster
Mientras realiza los planes, decida qué tipo de comunicación se efectuará en cada
adaptador de red. En la lista siguiente se ofrecen detalles acerca de los tipos de
comunicación que se pueden llevar a cabo en un adaptador:
Sólo comunicación de nodo a nodo (red privada). Esto implica que el
servidor tiene uno o varios adaptadores adicionales para efectuar otro tipo
de comunicación.
Para la comunicación de nodo a nodo, el adaptador de red se conecta a
una red privada que se utiliza exclusivamente dentro del clúster. Tenga en
cuenta que si la red privada utiliza un único concentrador o conmutador de
red, dicho dispositivo constituye un posible punto concentración de errores
en el clúster.
Los nodos de un clúster deben estar en la misma subred, pero puede
utilizar conmutadores de red LAN virtual (VLAN) en las interconexiones
entre dos nodos. Si utiliza una red VLAN, la latencia punto a punto de
recorrido completo debe ser inferior a 1/2 segundo y el vínculo entre dos
nodos debe aparecer como una conexión punto a punto única desde la
perspectiva del sistema operativo Windows que se ejecute en los nodos.
Para evitar que haya puntos de concentración de errores, utilice hardware
VLAN independiente para las diferentes rutas entre los nodos.
Si los nodos utilizan varias redes privadas (nodo a nodo), se recomienda
usar para sus adaptadores direcciones IP estáticas en lugar de DHCP.
Sólo comunicación del cliente al clúster (red pública). Esto implica que
el servidor tiene uno o varios adaptadores adicionales para efectuar otro
tipo de comunicación.
Comunicación de nodo a nodo y del cliente al clúster (red mixta). Si
hay varios adaptadores de red por nodo, un adaptador que efectúe ambos
tipos de comunicación puede servir como respaldo de los otros adaptadores
de red.
Comunicación no relacionada con el clúster. Si un nodo que forma parte
de un clúster proporciona también servicios no relacionados con el clúster y
tiene suficientes adaptadores, puede que desee utilizar un adaptador para
efectuar la comunicación no relacionada con el clúster.
Los nodos de un clúster tienen que estar conectados mediante dos o más redes
de área local (LAN); se necesitan al menos dos redes para evitar que haya un
único punto de error. La configuración de un clúster de servidores con sus nodos
conectados a través de una sola red no está permitida. Los adaptadores, cables,
concentradores y conmutadores de cada red se deben configurar de manera que,
cuando presenten un error, no afecten al resto. Normalmente, eso implica que los
componentes de cualquier par de redes deben ser físicamente independientes.
Deben configurarse al menos dos redes para controlar Todas las comunicaciones (red mixta) o Sólo para comunicaciones de clúster internas (red privada).La configuración recomendada para dos adaptadores consiste en utilizar un
adaptador para la comunicación privada (sólo de nodo a nodo) y el otro para la
comunicación mixta (comunicación de nodo a nodo y del cliente al clúster).
Intente elegir un nombre para cada conexión en el que se indique su propósito. El
nombre facilita la identificación de la conexión cuando sea necesario configurar el
servidor.
Notas
Si utiliza adaptadores de red con tolerancia a errores, cree varias redes
privadas en lugar de una sola red tolerante a errores.
No utilice adaptadores de red de colaboración en la red privada.
No configure una puerta de enlace predeterminada o un servidor DNS o
WINS en los adaptadores de red privada. No configure los adaptadores de
la red privada de modo que utilicen servidores de resolución de nombres en
la red pública; de lo contrario, un servidor de resolución de nombres en la
red pública podría asignar un nombre a una dirección IP en la red privada.
Si un cliente recibiera esa dirección IP del servidor de resolución de
nombres, podría no tener acceso a la dirección porque no existe ninguna
ruta desde el cliente a la dirección de la red privada.
Configure servidores WINS o DNS en los adaptadores de la red pública. Si
se utilizan recursos de nombre de red en las redes públicas, configure los
servidores DNS de modo que admitan actualizaciones dinámicas; de lo
contrario, puede que la operación de conmutación por error no se efectúe
correctamente en dichos recursos. Configure también una puerta de enlace
predeterminada en los adaptadores de la red pública. Si hay varias redes
públicas en el clúster, configure una puerta de enlace predeterminada sólo
en una de ellas.
Los adaptadores de un nodo determinado deben conectarse a redes en
subredes diferentes.
Si se utiliza el Asistente para el nuevo clúster de servidor o el Asistente
para agregar nodos con el fin de instalar clústeres en un nodo que contiene
dos adaptadores de red, de forma predeterminada, el asistente configura
ambos adaptadores para comunicaciones de red mixta. Se recomienda que
cambie la configuración de un adaptador para usarse únicamente en las
comunicaciones de la red privada. Configure manualmente las opciones de
comunicación, como Velocidad, Modo dúplex, Control de flujo y Tipo de
medio, de cada adaptador de red del clúster. No utilice la detección
automática. Todos los adaptadores de red del clúster deben utilizar la
misma configuración de comunicaciones.
Compruebe si toda su solución de clúster es compatible con los productos
de la familia de Windows Server Recursos de soporte.
Dirección IP del clúster
Obtenga una dirección IP estática para el clúster. No puede utilizar DHCP para
esta dirección.
Asignación de direcciones IP para los nodos del clúster
Determine cómo administrar el direccionamiento IP para los nodos individuales del
clúster. Cada adaptador de red de cada nodo requiere la asignación de
direcciones IP. Se recomienda asignar una dirección IP estática a cada adaptador
de red. Como alternativa, puede asignar las direcciones IP mediante DHCP. Si
utiliza direcciones IP estáticas, configure las correspondientes a cada pareja
vinculada de adaptadores de red (vinculados de nodo a nodo) de modo que estén
en la misma subred.
Tenga en cuenta que si utiliza DHCP para los nodos individuales del clúster,
puede resultar un punto de concentración de errores. Es decir, si configura los
nodos del clúster de forma que dependan de un servidor DHCP para obtener sus
direcciones IP, un error temporal del servidor DHCP puede hacer que los nodos
del clúster dejen de estar disponibles durante ese tiempo. Al decidir si se va a
utilizar DHCP, evalúe el modo de garantizar la disponibilidad de los servicios
DHCP y considere la posibilidad de utilizar concesiones duraderas para los nodos
del clúster. De esta forma ayuda a garantizar que siempre tengan una dirección IP
válida.
Nombre del clúster
Determine u obtenga un nombre apropiado para el clúster. Se trata del nombre
que los administradores utilizarán para las conexiones con el clúster. Las
aplicaciones que se ejecutan en el clúster suelen tener nombres de red diferentes.
El nombre del clúster debe ser distinto del nombre de dominio, de todos los
nombres de equipo del dominio y de otros nombres de clústeres del dominio.
Cuentas de equipo y asignación de dominios para los nodos del clúster
Asegúrese de que todos los nodos del clúster tienen cuentas de equipo en el
mismo dominio. Los nodos del clúster no pueden estar en un grupo de trabajo.
Cuenta de usuario de operador para la instalación y configuración del Servicio de
Cluster Server
Para instalar y configurar el Servicio de Cluster Server, debe utilizar una cuenta
que pertenezca al grupo Administradores local en cada nodo. Al instalar y
configurar los nodos, si no utiliza una cuenta del grupo local Administradores, se le
pedirá que proporcione las credenciales de inicio de sesión de dicha cuenta.
Cuenta de usuario del Servicio de Cluster Server
Cree u obtenga la cuenta de usuario del Servicio de Cluster Server. Se trata del
nombre y la contraseña con los que se ejecutará dicho servicio. Debe suministrar
esta información durante la instalación del clúster.
Es conveniente que la cuenta de usuario del Servicio de Cluster Server no se
utilice para ningún otro fin. Si tiene varios clústeres, configure una cuenta de
usuario del Servicio de Cluster Server exclusiva para cada uno. La cuenta debe
ser de dominio, no puede ser local. Sin embargo, no debe configurar esta cuenta
como de administrador de dominio porque no necesita derechos de usuario de
administrador de dominio.
Como parte del proceso de configuración del clúster, la cuenta de usuario del
Servicio de Cluster Server se agrega al grupo Administradores local de cada nodo.
Además de ser miembro del grupo local de administradores, la cuenta de usuario
del Servicio de Cluster Server requiere un conjunto adicional de derechos de
usuario:
Actuar como parte del sistema operativo
Realizar copia de seguridad de archivos y directorios
Ajustar cuotas de memoria para un proceso
Aumentar la prioridad de programación
Iniciar sesión como servicio
Restaurar archivos y directorios
Además, de forma predeterminada, la cuenta del Servicio de Cluster Server
hereda los derechos de usuario siguientes por ser miembro del grupo local
Administradores:
Administrar registro de auditoría y de seguridad
Depurar programas
Suplantar a un cliente después de la autenticación
Si su organización ha quitado estos derechos de usuario del conjunto
predeterminado de privilegios asignados al grupo local Administradores, tiene que
asignar específicamente estos derechos de usuario a la cuenta del Servicio de
Cluster Server.
Los derechos de usuario anteriores se conceden a la cuenta de usuario del
Servicio de Cluster Server como parte del proceso de configuración del clúster.
Observe que la cuenta de usuario del Servicio de Cluster Server continuará
teniendo estos derechos de usuario incluso después de que todos los nodos se
hayan retirado del clúster. El riesgo que supone esta circunstancia se ve atenuado
por el hecho de que estos derechos de usuario no se conceden en todo el
dominio, sino sólo de forma local en cada nodo existente anteriormente. Sin
embargo, debe quitar la cuenta de cada nodo retirado si ya no se necesita.
Asegúrese de evitar que la contraseña caduque en la cuenta de usuario del
Servicio de Cluster Server (siga las directivas de su organización para la
renovación de contraseñas). Para obtener más información, consulte Contraseñas.
Volumen para información importante de configuración del clúster (archivos de
punto de comprobación y registro)
Piense en disponer de un volumen independiente en el almacenamiento del
clúster para contener información importante de configuración del mismo. Esta
información conforma el recurso de quórum del clúster, que es necesario cuando
un nodo del clúster deja de funcionar. El recurso de quórum proporciona un lugar
de almacenamiento independiente del nodo destinado a datos esenciales para el
clúster.
El tamaño mínimo recomendado del volumen es de 500 MB. Se recomienda que
no almacene datos de usuario en ningún volumen de recurso de quórum. No use
instantáneas de carpetas compartidas para el recurso de quórum. Si planea
colocar el recurso de quórum en un disco con múltiples particiones NTFS,
asegúrese de que todas las particiones del disco están asignadas a letras de
unidad.
Nota
al planear y realizar la configuración de los discos de clúster, configúrelos
como discos básicos con todas las particiones formateadas como NTFS
(pueden estar comprimidos o no). Cree particiones y formatee todos los
discos del dispositivo de almacenamiento del clúster antes de agregar el
primer nodo al clúster. No los configure como discos dinámicos ni utilice
volúmenes distribuidos (conjuntos de volúmenes) ni Almacenamiento
remoto en los discos del clúster. Las particiones de los discos de clúster en
un dispositivo de almacenamiento en clúster deben crearse como discos de
registro de inicio maestro (MBR) en lugar de discos de tabla de particiones
GUID (GPT).
En la siguiente sección se describe la instalación física del almacenamiento del
clúster.
Comenzar la instalación del hardware del clúster
Los pasos que se llevan a cabo al conectar físicamente e instalar el hardware del
clúster por primera vez son cruciales. Asegúrese de seguir las instrucciones del
fabricante del hardware con relación a dichos pasos iniciales.
Importante
Revise con atención los cables de red después de conectarlos. Asegúrese
de que no hay ningún cable cruzado por error (por ejemplo, una red privada
conectada a una pública).
Pasos iniciales que se deben llevar a cabo en el BIOS o EFI si se utiliza un
dispositivo de almacenamiento compartido de SCSI
Si utiliza un dispositivo de almacenamiento compartido, al adjuntar el hardware de
clúster por primera vez (el bus compartido y el almacenamiento de clúster),
asegúrese de que trabaja sólo desde las pantallas de configuración de firmware en
los nodos del clúster (un nodo es un servidor en un clúster). En un equipo de 32
bits, utilice las pantallas de configuración del BIOS. En un equipo basado en la
arquitectura Itanium, utilice las pantallas de configuración de la Interfaz de
firmware extensible (EFI). Las instrucciones del fabricante explicarán si estas
pantallas de configuración se muestran automáticamente o si, tras encender el
equipo, debe presionar teclas específicas para obtener acceso a ellas. Siga las
instrucciones del fabricante para completar el proceso de configuración del BIOS o
la EFI. Durante esta fase inicial de la instalación, permanezca en las pantallas de
configuración del BIOS o EFI, y no deje que se inicie el sistema operativo. Realice
los pasos siguientes mientras los nodos del clúster siguen presentando pantallas
de configuración del BIOS o EFI, antes de iniciar el sistema operativo en el primer
nodo de clúster.
Importante
Asegúrese de que comprende y sigue las instrucciones del fabricante para
terminar el bus SCSI.
Asegúrese de que todos los dispositivos del bus compartido (tanto los
controladores SCSI como los discos duros) tienen un Id. SCSI único. Si
todos los controladores SCSI tienen el mismo Id. predeterminado
(normalmente es el Id. SCSI 7), cambie el Id. de un controlador por, por
ejemplo Id. SCSI 6. Si en el bus SCSI compartido va a haber más de un
disco, cada uno de ellos debe tener también un Id. SCSI único. Asegúrese
también de que el bus no está configurado para restablecer los Id. SCSI
automáticamente al encender el equipo (de lo contrario, cambiará los Id.
que usted ha especificado).
Asegúrese de que puede examinar el bus y ver las unidades desde los
nodos del clúster (mientras esté viendo las pantallas de configuración del
BIOS o EFI).
Pasos iniciales que se deben llevar a cabo en el BIOS o EFI si se utiliza un
dispositivo de almacenamiento compartido de Fibre Channel o no se utiliza ningún
dispositivo de almacenamiento compartido
Encienda un solo nodo. Deje los demás nodos apagados.
Durante esta fase inicial de la instalación, permanezca en el proceso de
configuración del BIOS o la Interfaz de firmware extensible (EFI, Extensible
Firmware Interface) y no deje que se inicie el sistema operativo. Cuando
esté viendo las pantallas de configuración del BIOS o la EFI, asegúrese de
que puede examinar el bus y ver las unidades desde el nodo de clúster
activo. En un equipo de 32 bits, utilice las pantallas de configuración del
BIOS. En un equipo basado en la arquitectura Itanium, utilice las pantallas
de configuración de la EFI. Consulte las instrucciones del fabricante para
determinar si las pantallas de configuración se muestran automáticamente o
si, tras encender el equipo, debe presionar teclas específicas para tener
acceso a ellas. Siga las instrucciones del fabricante para completar el
proceso de configuración del BIOS o la EFI.
Pasos finales para completar la instalación
Si todavía no ha instalado Windows Server 2003, Enterprise Edition o
Windows Server 2003, Datacenter Edition en el primer nodo del clúster, instálelo
antes de continuar. Después de completar la configuración del BIOS o EFI, inicie
el sistema operativo en un solo nodo del clúster y complete la configuración del
Servicio de Cluster Server mediante el Administrador de clústeres.
Con el Asistente para el nuevo clúster de servidor del Administrador de clústeres,
puede elegir entre las opciones de configuración Típica (completa) y Avanzada
(mínima). La configuración típica es adecuada para la mayoría de las instalaciones
y su resultado es un clúster totalmente configurado. Utilice la opción de
configuración Avanzada sólo para los clústeres que tengan configuraciones de
almacenamiento complejas que el Asistente para el nuevo clúster de servidor no
pueda comprobar o para configuraciones en las que no desea que el clúster
administre todo el almacenamiento. En los ejemplos siguientes se describe cada
caso:
En algunas soluciones de almacenamiento complejas, por ejemplo, un
tejido conmutado de canales de fibra que contiene varios conmutadores, es
posible que una unidad de almacenamiento determinada tenga una
identidad diferente en cada equipo del clúster. Aunque es una configuración
de almacenamiento válida, no cumple la heurística de validación del
almacenamiento del Asistente para el nuevo clúster de servidor. Si tiene
este tipo de solución de almacenamiento, es posible que ocurra un error al
intentar crear un clúster mediante la opción de configuración Típica. Si el
almacenamiento está correctamente configurado, puede deshabilitar la
heurística de validación del almacenamiento y evitar este error; para ello,
reinicie el Asistente para el nuevo clúster de servidor y seleccione la opción
de configuración Avanzada.
Es posible que desee tener, en algunos nodos de un clúster, algunos discos
que se van a organizar en clústeres y algunos que se van a mantener
privados. La opción de configuración Típica configura todos los discos como
discos organizados en clústeres y crea los recursos de clúster para todos
ellos. No obstante, con la opción de configuración Avanzada, puede
mantener algunos discos privados porque esta configuración crea un clúster
que sólo administra el disco de quórum (si eligió utilizar un disco físico
como recurso de quórum). Una vez creado el clúster, debe utilizar el
Administrador de clústeres para agregar otros discos que desea que el
clúster administre.
Importante
Si utiliza un dispositivo de almacenamiento compartido: antes de crear un
clúster, al encender el equipo e iniciar el sistema operativo, es muy
importante que sólo un nodo tenga acceso al disco de clúster. De lo
contrario, los discos de clúster resultarán dañados. Para proteger los discos
de clúster antes de crear el clúster y evitar que se dañen, cierre todos los
nodos de clúster menos uno o utilice otras técnicas (por ejemplo, máscaras
LUN, presentación selectiva o división en zonas). Asimismo, antes de iniciar
la instalación del segundo y posteriores nodos, asegúrese de que todos los
discos que va a administrar el clúster tienen recursos de discos asociados.
Si estos discos no tienen recursos de disco asociados en ese momento, los
datos del disco se dañarán porque los discos no están protegidos y varios
nodos intentarán conectarse a ellos al mismo tiempo.
No utilice el Asistente para administrar su servidor o el Asistente para
configurar su servidor con el fin de configurar los nodos de un clúster.
MÁQUINA VIRTUAL
En informática una máquina virtual es un software que simula a una computadora
y puede ejecutar programas como si fuese una computadora real. Este software
en un principio fue definido como "un duplicado eficiente y aislado de una máquina
física". La acepción del término actualmente incluye a máquinas virtuales que no
tienen ninguna equivalencia directa con ningún hardware real.
Una característica esencial de las máquinas virtuales es que los procesos que
ejecutan están limitados por los recursos y abstracciones proporcionados por
ellas. Estos procesos no pueden escaparse de esta "computadora virtual".
Uno de los usos domésticos más extendidos de las máquinas virtuales es ejecutar
sistemas operativos para "probarlos". De esta forma podemos ejecutar un sistema
operativo que queramos probar (GNU/Linux, por ejemplo) desde nuestro sistema
operativo habitual (Mac OS X por ejemplo) sin necesidad de instalarlo
directamente en nuestra computadora y sin miedo a que se desconfigure el
sistema operativo primario.
Clasificación de las máquinas virtuales
Las máquinas virtuales se pueden clasificar en dos grandes categorías según su
funcionalidad y su grado de equivalencia a una verdadera máquina.
Máquinas virtuales de sistema (en inglés System Virtual Machine) y Máquinas
virtuales de proceso (en inglés Process Virtual Machine)
Máquinas virtuales de sistema
Las máquinas virtuales de sistema, también llamadas máquinas virtuales de
hardware, permiten a la máquina física subyacente multiplicarse entre varias
máquinas virtuales, cada una ejecutando su propio sistema operativo. A la capa de
software que permite la virtualización se la llama monitor de máquina
virtual o hypervisor. Un monitor de máquina virtual puede ejecutarse o bien
directamente sobre el hardware o bien sobre un sistema operativo ("host operating
System").
Máquinas virtuales de proceso
Una máquina virtual de proceso, a veces llamada "máquina virtual de aplicación",
se ejecuta como un proceso normal dentro de un sistema operativo y soporta un
solo proceso. La máquina se inicia automáticamente cuando se lanza el proceso
que se desea ejecutar y se detiene para cuando éste finaliza. Su objetivo es el de
proporcionar un entorno de ejecución independiente de la plataforma de hardware
y del sistema operativo, que oculte los detalles de la plataforma subyacente y
permita que un programa se ejecute siempre de la misma forma sobre cualquier
plataforma.
El ejemplo más conocido actualmente de este tipo de máquina virtual es
la máquina virtual de Java. Otra máquina virtual muy conocida es la del
entorno .Net de Microsoft que se llama "Common Language Runtime".
Algunos conceptos:
La Máquina Virtual Paralela (conocida como PVM por sus siglas en inglés
de Parallel Virtual Machine) es una biblioteca para el cómputo paralelo en un
sistema distribuido de computadoras. Está diseñado para permitir que una red de
computadoras heterogénea comparta sus recursos de cómputo (como el
procesador y la memoria RAM) con el fin de aprovechar esto para disminuir el
tiempo de ejecución de un programa al distribuir la carga de trabajo en varias
computadoras.
La biblioteca PVM fue desarrollada por la Universidad de Tennessee, el
Laboratorio Nacional Oak Ridge y la Universidad Emory. La primera versión fue
escrita en ORNL en1989, y después de ser modificado por la Universidad de
Tennessee, fue lanzada la versión 2 en marzo de 1991. La versión 3 fue lanzada
en marzo de 1993 con mejoras en la tolerancia a fallas y portabilidad.
Dispone de un Debugger gráfico que se llama XPVM, aunque hay otros
desarrollos similares.
MPICH es un programa de biblioteca de desarrollo de libre
disposición implementación portable de MPI, una norma estándar de paso de
mensaje para aplicaciones de memoria distribuida que utilizan computación
paralela. MPICH es software gratuito y disponible para la mayoría de Unix
(incluyendo Linux y Mac OS X) y Microsoft Windows.
La implementación original de MPICH se llama MPICH1 y esta implementa el
estándar MPI-1.1. A partir del 2006 implementación más reciente se llama
MPICH2, pero todavía no admite traducciones de datos entre las diferentes
arquitecturas hardware.
MPICH es una implementación de MPI optimizada para entornos homogéneos
y myrinet, lo que proporciona un mayor rendimiento en el paso de mensajes entre
nodos.
LAM / MPI es uno de los predecesores del Abierto de MPI proyecto. Abrir MPI
representa una aplicación de próxima generación impulsado por la comunidad de
un interfaz de paso de mensajes (MPI), diseñado fundamentalmente en una
arquitectura de componentes para hacer una plataforma muy potente para
la computación de alto rendimiento.
LAM (Local Área multicomputador) es un sistema de entorno de programación y
desarrollo MPI para ordenadores heterogéneos en una red. Con LAM / MPI, un
dedicado grupo de equipo o una infraestructura de computación de red existente
puede actuar como una sola computación paralela de recursos. LAM / MPI se
considera que es "clúster amigable", ya que ofrece a base de daemon proceso de
inicio / control, así como los protocolos que pasan rápido de mensajes de cliente a
cliente. LAM / MPI puede utilizar TCP / IP, memoria compartida, Myrinet (GM),
o Infiniband (mVAPI) para el paso de mensajes.
LAM ofrece una implementación completa de MPI-1 y gran parte de MPI-
2. Aplicaciones compatibles son código fuente portable entre LAM / MPI y
cualquier otra implementación de MPI. Además de proporcionar una
implementación de alta calidad de la norma MPI, LAM / MPI ofrece capacidades
de monitoreo extensivos para apoyar la depuración. Monitoreo ocurre en dos
niveles. En primer lugar, LAM / MPI tiene los ganchos para permitir una
instantánea del proceso y estado de los mensajes que deben tomarse en cualquier
momento durante la ejecución de la aplicación. Esta instantánea incluye todos los
aspectos de sincronización además de tipo de datos de mapas / firmas,
pertenencia a un grupo comunicador y contenido del mensaje (ver la aplicación
XMPI en el sitio web principal de la LAM). En el segundo nivel, la biblioteca MPI
está equipado para producir un registro acumulativo de la comunicación, que
puede visualizarse ya sea en tiempo de ejecución o post-mortem.
CONCLUSIÓN
Nuestra conclusión acerca sobre los clúster es que son un tipo de arquitectura que
consiste en varios computadores interconectados entre sí.
Ahora sabemos que la tecnología de clústeres ha evolucionado en apoyo de
algunas actividades que van desde aplicaciones de supercómputo, software para
aplicaciones críticas, servidores web y comercio electrónico, hasta bases de datos
de alto rendimiento, entre otros usos que son muy importantes dentro de la
informática.
Los clústeres son importantes porque permiten combinar múltiples sistemas para
que trabajen en paralelo y se comporten como un recurso informático unificado
para servir a un grupo de tareas, proporcionar tolerancia a fallos y tener
disponibilidad continua.
La instalación de un clúster se puede hacer virtualmente y físicamente en una
computadora, pero hacerlo físicamente es algo complicado ya que requiere de
muchas operaciones y de cierto requisitos y si no se hacen o cumplen de manera
correcta el clúster no se ejecutara de manera correcta; pero, hacerlo de forma
virtual es un poco más fácil ya que si surge algún problema se puede realizar de
nuevo la instalación.
Referencias
http://www.revista.unam.mx/vol.4/num2/art3/cluster.htm
https://es.wikipedia.org/wiki/Cl%C3%BAster_(inform
%C3%A1tica)#Clasificaci.C3.B3n_de_los_cl.C3.BAsteres
https://es.wikipedia.org/wiki/M%C3%A1quina_virtual
https://en.wikipedia.org/wiki/LAM/MPI
https://msdn.microsoft.com/es-es/library/cc785078(v=ws.10).aspx
https://es.wikipedia.org/wiki/MPICH