Upload
vuhuong
View
237
Download
1
Embed Size (px)
Citation preview
Análisis de agrupamiento (Cluster – nMDS)
Agregación (Cluster)
Conjunto de técnicas que intentan organizar la información de las unidades de muestreo (UM) en clases o grupos discretos
Crea agrupaciones sobre la base de una sola variable
Basa el proceso en la similitud (parecido) o disimilitud (diferencia) entre las UM.
Propósito: generar grupos mutuamente excluyentes (cada miembro de un grupo este lo más cerca de otro miembro del mismo grupo y los grupos diferentes lo más alejados entre sí.
Cluster
Estrategias de agrupación (Ligamento)
- Ligamento simple: (vecino más cercano) define las distancias entre entidades y agrupamientos como la distancia entre las entidades más cercanas.
- Ligamento Completo: (vecino más lejano) define las distancias entre entidades y agrupamientos como la distancia entre las entidades más lejanas
- Ligamento Centroide: minimiza la disimilitud entre los centroides delos agrupamientos. Es valido solamente con datos métricos (longitudes).
Cluster
Ligamento promedio: designa los valores de distancia entre entidades como la distancia promedio de disimilitud entre los agrupamientos.
Ligamento de Ward: minimiza la distancia cuadrada entre los grupos con base en el tamaño del cluster
Recomendación para generar matrices
- Datos Biológicos: abundancias Bray Curtis- Datos Abióticos: registros Distancia Euclidiana
Propósito: representar gráficamente las relaciones entre objetos en un espacio multidimensional.
Los objetos diferentes se ubican alejados en el espacio de ordenación y los similares se ubican cerca, sin que se mantengan las distancias originales
Construye un mapa de ordenación de las muestras en un número determinado de dimensiones (2 o 3) que intenta satisfacer las condiciones impuestas por los rangos definidos a partir de la matriz original (similitud o disimilitud).
nMDS
Solo conserva los rangos de similitud, por lo que los ejes no tienen unidades (no métrico)
Punto de partida una matriz de similitud o disimilitud
Algoritmo evalúa el grado de Stress: distorsión entre los rangos de similitud y los rangos de distancia correspondientes en la gráfica de ordenación.
Meta: escoger la configuración de puntos que minimice el grado de Stress (por re-muestreo)
Valor crítico del stress: 0.2 o 20%.
nMDS
Poderosa herramienta de análisis multivariado ecológico
Tipo de datos: muestreo de riqueza de especies en diferentes estaciones
de dos o mas localidades + muestreo de datos abióticos:
Software Premier
Dos localidades
9 estaciones por localidad
Listado de especies en cada
estación con registro de
abundancia estandarizada
Registro de condiciones
abióticas en cada estación
2 matrices de datos: bióticos y
abióticos
¿Son diferentes los ensambles?
¿Hay relación entre las matrices?
Lista de pasos
1. Revisar la matriz de datos bióticos y abióticos:- Todas las especies deben estar registradas por
lo menos en una estación.- En todas las estaciones debe haber registro de
las variables abióticas
2. Asignar factores a las estaciones:- Relacionar estaciones con grupos para el
análisis.
3. Construir las matrices de similitud- Transformar las matrices de datos para
garantizar supuestos, reducir efecto de 0.- Datos biológicos: log (x+1)- Datos abióticos: Raiz cuarta si es necesario.
Lista de pasos
4. Seleccionar algoritmo para construir la matriz de similitud:- Bray Curtis: biológicos- Euclidiana: abióticos- Presencia-ausencia (tipo de muestreo)
5. Con base en la matriz de similitud construir el Cluster:- Promedio por grupo (Group Average)
6. Confirme conformación de grupos con nMDS
Premier: Cluster & nMDS
Matriz de datos biológicos:
Premier: Cluster & nMDS
Asignación de factores: agrupación de cada estación
Premier: Cluster & nMDS
Transformación y algoritmo de similitud:
Premier: Cluster & nMDS
Matriz de similitud: se debe tener abierta para Cluster
Premier: Cluster & nMDS
Seleccionar características para el Cluster
Premier: Cluster & nMDS
Construir Cluster
Premier: Cluster & nMDS
Regresar matriz de similitud y realizar nMDS
Premier: Cluster & nMDS
Construir gráfico de ordenación
Análisis derivados del Cluster & nMDS
Quienes son los responsables de la similitud dentro de los grupos y la disimilitud entre los grupos?
Análisis de porcentaje de similitud: SIMPER
Se fundamenta en un análisis de similitud (ANOSIM)
Anosim: análisis no paramétrico que evalúa la
significancia en las diferencias entre dos grupos a
partir de las medidas de distancia (ordenación).
Compara las distancias entre grupos con las
distancias dentro de los grupos.
SIMPER
Se realiza con la matriz de datos abierta
SIMPER
SIMPER
Análisis derivados del Cluster & nMDS
Se relaciona el ensamble con las condiciones abióticas?
Análisis de correlación no paramétrica entre matrices: BIOENV
Se fundamenta en un análisis de correlación no
paramétrica de Spearman
Se realiza entre la matriz de similitud biológica y
la matriz de similitud abiótica
BIOENV
Se debe tener abierta la matriz de similitud biológica
BioEnv
Se debe establecer condiciones matriz similitud abiótica
BioEnv
Resultado: se definen características del análisis
BioEnv
Se evalúa el valor de Correlación
Trabajo Independiente
Cuál es el propósito de un análisis discriminante?