Análisis de agrupamiento (Cluster nMDS) Agregación (Cluster) · Análisis de agrupamiento...

Preview:

Citation preview

Análisis de agrupamiento (Cluster – nMDS)

Agregación (Cluster)

Conjunto de técnicas que intentan organizar la información de las unidades de muestreo (UM) en clases o grupos discretos

Crea agrupaciones sobre la base de una sola variable

Basa el proceso en la similitud (parecido) o disimilitud (diferencia) entre las UM.

Propósito: generar grupos mutuamente excluyentes (cada miembro de un grupo este lo más cerca de otro miembro del mismo grupo y los grupos diferentes lo más alejados entre sí.

Cluster

Estrategias de agrupación (Ligamento)

- Ligamento simple: (vecino más cercano) define las distancias entre entidades y agrupamientos como la distancia entre las entidades más cercanas.

- Ligamento Completo: (vecino más lejano) define las distancias entre entidades y agrupamientos como la distancia entre las entidades más lejanas

- Ligamento Centroide: minimiza la disimilitud entre los centroides delos agrupamientos. Es valido solamente con datos métricos (longitudes).

Cluster

Ligamento promedio: designa los valores de distancia entre entidades como la distancia promedio de disimilitud entre los agrupamientos.

Ligamento de Ward: minimiza la distancia cuadrada entre los grupos con base en el tamaño del cluster

Recomendación para generar matrices

- Datos Biológicos: abundancias Bray Curtis- Datos Abióticos: registros Distancia Euclidiana

Propósito: representar gráficamente las relaciones entre objetos en un espacio multidimensional.

Los objetos diferentes se ubican alejados en el espacio de ordenación y los similares se ubican cerca, sin que se mantengan las distancias originales

Construye un mapa de ordenación de las muestras en un número determinado de dimensiones (2 o 3) que intenta satisfacer las condiciones impuestas por los rangos definidos a partir de la matriz original (similitud o disimilitud).

nMDS

Solo conserva los rangos de similitud, por lo que los ejes no tienen unidades (no métrico)

Punto de partida una matriz de similitud o disimilitud

Algoritmo evalúa el grado de Stress: distorsión entre los rangos de similitud y los rangos de distancia correspondientes en la gráfica de ordenación.

Meta: escoger la configuración de puntos que minimice el grado de Stress (por re-muestreo)

Valor crítico del stress: 0.2 o 20%.

nMDS

Poderosa herramienta de análisis multivariado ecológico

Tipo de datos: muestreo de riqueza de especies en diferentes estaciones

de dos o mas localidades + muestreo de datos abióticos:

Software Premier

Dos localidades

9 estaciones por localidad

Listado de especies en cada

estación con registro de

abundancia estandarizada

Registro de condiciones

abióticas en cada estación

2 matrices de datos: bióticos y

abióticos

¿Son diferentes los ensambles?

¿Hay relación entre las matrices?

Lista de pasos

1. Revisar la matriz de datos bióticos y abióticos:- Todas las especies deben estar registradas por

lo menos en una estación.- En todas las estaciones debe haber registro de

las variables abióticas

2. Asignar factores a las estaciones:- Relacionar estaciones con grupos para el

análisis.

3. Construir las matrices de similitud- Transformar las matrices de datos para

garantizar supuestos, reducir efecto de 0.- Datos biológicos: log (x+1)- Datos abióticos: Raiz cuarta si es necesario.

Lista de pasos

4. Seleccionar algoritmo para construir la matriz de similitud:- Bray Curtis: biológicos- Euclidiana: abióticos- Presencia-ausencia (tipo de muestreo)

5. Con base en la matriz de similitud construir el Cluster:- Promedio por grupo (Group Average)

6. Confirme conformación de grupos con nMDS

Premier: Cluster & nMDS

Matriz de datos biológicos:

Premier: Cluster & nMDS

Asignación de factores: agrupación de cada estación

Premier: Cluster & nMDS

Transformación y algoritmo de similitud:

Premier: Cluster & nMDS

Matriz de similitud: se debe tener abierta para Cluster

Premier: Cluster & nMDS

Seleccionar características para el Cluster

Premier: Cluster & nMDS

Construir Cluster

Premier: Cluster & nMDS

Regresar matriz de similitud y realizar nMDS

Premier: Cluster & nMDS

Construir gráfico de ordenación

Análisis derivados del Cluster & nMDS

Quienes son los responsables de la similitud dentro de los grupos y la disimilitud entre los grupos?

Análisis de porcentaje de similitud: SIMPER

Se fundamenta en un análisis de similitud (ANOSIM)

Anosim: análisis no paramétrico que evalúa la

significancia en las diferencias entre dos grupos a

partir de las medidas de distancia (ordenación).

Compara las distancias entre grupos con las

distancias dentro de los grupos.

SIMPER

Se realiza con la matriz de datos abierta

SIMPER

SIMPER

Análisis derivados del Cluster & nMDS

Se relaciona el ensamble con las condiciones abióticas?

Análisis de correlación no paramétrica entre matrices: BIOENV

Se fundamenta en un análisis de correlación no

paramétrica de Spearman

Se realiza entre la matriz de similitud biológica y

la matriz de similitud abiótica

BIOENV

Se debe tener abierta la matriz de similitud biológica

BioEnv

Se debe establecer condiciones matriz similitud abiótica

BioEnv

Resultado: se definen características del análisis

BioEnv

Se evalúa el valor de Correlación

Trabajo Independiente

Cuál es el propósito de un análisis discriminante?