29
Taxonomía Numérica Taxonomía Numérica Análisis de Agrupamientos Análisis de Agrupamientos y Componentes Principales y Componentes Principales

Taxonomía Numérica

  • Upload
    meara

  • View
    171

  • Download
    1

Embed Size (px)

DESCRIPTION

Taxonomía Numérica. Análisis de Agrupamientos y Componentes Principales. Taxonomía Numérica. - PowerPoint PPT Presentation

Citation preview

Page 1: Taxonomía Numérica

Taxonomía NuméricaTaxonomía Numérica

Análisis de Agrupamientos y Análisis de Agrupamientos y Componentes PrincipalesComponentes Principales

Page 2: Taxonomía Numérica

Taxonomía NuméricaTaxonomía Numérica En En biología sistemáticabiología sistemática la la fenéticafenética, también conocida , también conocida

como como taxonomía numéricataxonomía numérica, es una técnica cuya , es una técnica cuya finalidad es la clasificación de los finalidad es la clasificación de los organismosorganismos basándose en su similitud, generalmente en su basándose en su similitud, generalmente en su morfologíamorfología, o en cualidades observables, sin tomar en , o en cualidades observables, sin tomar en cuenta su cuenta su filogeniafilogenia o relación evolutiva. o relación evolutiva.

La fenética ha sido ampliamente sustituida por la La fenética ha sido ampliamente sustituida por la cladísticacladística. Sin embargo, algunos biólogos continúan . Sin embargo, algunos biólogos continúan utilizando métodos fenéticos, como una aproximación utilizando métodos fenéticos, como una aproximación razonable de la filogenia cuando los métodos cladísticos razonable de la filogenia cuando los métodos cladísticos son computacionalmente demasiado complejos.son computacionalmente demasiado complejos.

Page 3: Taxonomía Numérica

La taxonomía numérica es una escuela de La taxonomía numérica es una escuela de clasificación surgida como reacción a la clasificación surgida como reacción a la sistemática evolutivasistemática evolutiva. Según sus fundadores, . Según sus fundadores, especialmente Sokal y Sneath, la sistemática especialmente Sokal y Sneath, la sistemática debe estar exenta de toda teoría, a parte de la debe estar exenta de toda teoría, a parte de la teoría de la evoluciónteoría de la evolución. Para los fenéticos, la . Para los fenéticos, la filogeniafilogenia, en tanto que curso histórico , en tanto que curso histórico verdadero, es incognoscible. Por tanto, ya que verdadero, es incognoscible. Por tanto, ya que una reconstrucción filogenética es un artefacto una reconstrucción filogenética es un artefacto meramente hipotético, no puede estar en la meramente hipotético, no puede estar en la base de un sistema que quiere ser objetivo. Se base de un sistema que quiere ser objetivo. Se deben tratar los objetos, no los conceptos.deben tratar los objetos, no los conceptos.

Page 4: Taxonomía Numérica

Todo lo que conocemos y podemos esperar Todo lo que conocemos y podemos esperar conocer es la similitud morfológica. conocer es la similitud morfológica. Consecuentemente, los Consecuentemente, los organismosorganismos son son agrupados sobre la base de su similitud global agrupados sobre la base de su similitud global ((overall similarityoverall similarity); se clasifican en el mismo ); se clasifican en el mismo grupo los organismos que tengan la mayor grupo los organismos que tengan la mayor cantidad de cantidad de caracterescaracteres en común, los que son en común, los que son más parecidos. La fenética tiene en cuenta, en más parecidos. La fenética tiene en cuenta, en teoría, la mayor cantidad de caracteres teoría, la mayor cantidad de caracteres disponibles, cualquiera que sea su naturaleza, y disponibles, cualquiera que sea su naturaleza, y considera que todos los caracteres tienen el considera que todos los caracteres tienen el mismo valor. mismo valor.

Page 5: Taxonomía Numérica

Dado que el número de especies y de Dado que el número de especies y de caracteres a estudiar puede ser muy caracteres a estudiar puede ser muy elevado, es imprescindible la ayuda de elevado, es imprescindible la ayuda de programas informáticos específicos. El programas informáticos específicos. El resultado es un dendrograma no resultado es un dendrograma no enraizado denominado fenograma, en que enraizado denominado fenograma, en que se establecen las relaciones de se establecen las relaciones de parentesco fenético de los organismos parentesco fenético de los organismos estudiados.estudiados.

Page 6: Taxonomía Numérica

Los objetos de estudio (los taxones Los objetos de estudio (los taxones terminales) pueden ser especies, géneros terminales) pueden ser especies, géneros o cualquier otra categoría taxonómica y o cualquier otra categoría taxonómica y reciben el nombre de reciben el nombre de UTOUTO (unidades (unidades taxonómicas operacionales) (en inglés, taxonómicas operacionales) (en inglés, OTU, operational taxonomic unitsOTU, operational taxonomic units).).

Page 7: Taxonomía Numérica

La taxonomía numérica ha sido criticada desde muchos La taxonomía numérica ha sido criticada desde muchos puntos de vista. Ignora deliberadamente las puntos de vista. Ignora deliberadamente las adquisiciones evolutivas; no diferencia entre homología adquisiciones evolutivas; no diferencia entre homología y homoplasia. La estabilidad de las clasificaciones y homoplasia. La estabilidad de las clasificaciones tampoco se consigue mediante los métodos fenéticos ya tampoco se consigue mediante los métodos fenéticos ya que la búsqueda de "el máximo número de caracteres" que la búsqueda de "el máximo número de caracteres" es una operación subjetiva; si nuevos caracteres son es una operación subjetiva; si nuevos caracteres son hallados, las distancias cambiarán y paralelamente hallados, las distancias cambiarán y paralelamente cambiará la clasificación previa.cambiará la clasificación previa.

Este método de clasificación es poco utilizado en la Este método de clasificación es poco utilizado en la actualidad. Puede ser, no obstante, útil en el estudio de actualidad. Puede ser, no obstante, útil en el estudio de organismos como bacterias o virus para los cuales no se organismos como bacterias o virus para los cuales no se dispone de suficientes caracteres polarizados para dispone de suficientes caracteres polarizados para aplicar los métodos cladísticos.aplicar los métodos cladísticos.

Page 8: Taxonomía Numérica
Page 9: Taxonomía Numérica

Análisis de AgrupamientoAnálisis de Agrupamiento

Conglomerados jerárquicosConglomerados jerárquicosEs un procedimiento que permite agrupar Es un procedimiento que permite agrupar

las OTUs a través de una variedad de las OTUs a través de una variedad de métodos de agrupamiento y medidas de métodos de agrupamiento y medidas de distancia.distancia.

El análisis de conglomerados jerárquicos se El análisis de conglomerados jerárquicos se comienza con el cálculo de la matriz de comienza con el cálculo de la matriz de distancias existentes entre cada elemento distancias existentes entre cada elemento y todos los restantes de la muestray todos los restantes de la muestra

Page 10: Taxonomía Numérica

A continuación se busca los elementos A continuación se busca los elementos más próximos (es decir, los dos más más próximos (es decir, los dos más similares en términos de distancia) y se similares en términos de distancia) y se agrupan en un conglomerado. De esta agrupan en un conglomerado. De esta manera se van agrupando los elementos manera se van agrupando los elementos en conglomerados cada vez más grandes en conglomerados cada vez más grandes y más heterogéneos hasta llegar a un y más heterogéneos hasta llegar a un conglomerado global conglomerado global

Page 11: Taxonomía Numérica

Medidas de DistanciaMedidas de Distancia

Uno de los aspectos clave para el análisis Uno de los aspectos clave para el análisis de conglomerados es la elección de la de conglomerados es la elección de la medida que se desea utilizar para medida que se desea utilizar para cuantificar la distancia entre los elementoscuantificar la distancia entre los elementos

El análisis de agrupamiento permite elegir El análisis de agrupamiento permite elegir entre un gran número de medidas de entre un gran número de medidas de distancia que se diferencian para el tipo distancia que se diferencian para el tipo de datos que han sido diseñadas: de datos que han sido diseñadas: cuantitativos, categóricos y dicotómicos cuantitativos, categóricos y dicotómicos

Page 12: Taxonomía Numérica

Estas medidas también se diferencian por Estas medidas también se diferencian por el tipo de distancia evaluada: similaridad o el tipo de distancia evaluada: similaridad o disimilaridad. disimilaridad.

Las medidas de similaridad evalúan el Las medidas de similaridad evalúan el grado de parecido o proximidad existente grado de parecido o proximidad existente entre dos elementos. Los valores más entre dos elementos. Los valores más altos indican mayor parecido o altos indican mayor parecido o proximidad.proximidad.

Page 13: Taxonomía Numérica

Las medidas de disimilaridad evalúan el Las medidas de disimilaridad evalúan el grado de diferencia o lejanía existente grado de diferencia o lejanía existente entre dos elementos. Los valores más entre dos elementos. Los valores más altos indican mayor diferencia o lejanía. altos indican mayor diferencia o lejanía. Cuando dos elementos se encuentran Cuando dos elementos se encuentran juntos, la distancia es nula. juntos, la distancia es nula.

Page 14: Taxonomía Numérica

Medidas para Datos binarios: Las medidas Medidas para Datos binarios: Las medidas para datos binarios se utilizan con para datos binarios se utilizan con variables dicotómicas, es decir con variables dicotómicas, es decir con variables cuyas variables reflejan la variables cuyas variables reflejan la presencia o ausencia de la característica presencia o ausencia de la característica medida. La presencia se codifica con 1 y medida. La presencia se codifica con 1 y la ausencia con 0.la ausencia con 0.

Page 15: Taxonomía Numérica
Page 16: Taxonomía Numérica

aa se refiere al número de casos que se refiere al número de casos que comparten la presencia de ambas comparten la presencia de ambas características, características, dd se refiere al número de se refiere al número de casos que comparten la ausencia de casos que comparten la ausencia de ambas características (concordancias), ambas características (concordancias), bb y y cc se refieren al número de casos que se refieren al número de casos que presentan una característica y no la otra presentan una característica y no la otra (discordancias). (discordancias).

Page 17: Taxonomía Numérica

Distancia euclídea al cuadrado para Distancia euclídea al cuadrado para datos binariosdatos binarios. Es una medida de . Es una medida de disimilaridad. Su valor mínimo es cero disimilaridad. Su valor mínimo es cero pero no tiene máximo:pero no tiene máximo:

BEUCLID (X,Y)BEUCLID (X,Y) = = b + cb + c

Page 18: Taxonomía Numérica
Page 19: Taxonomía Numérica

Métodos de AgrupamientoMétodos de Agrupamiento

Método de Vinculación por el Vecino Método de Vinculación por el Vecino más Próximomás Próximo

Este método también llamado de enlace Este método también llamado de enlace simple o vinculación simple comienza simple o vinculación simple comienza seleccionando y uniendo los dos seleccionando y uniendo los dos elementos de la matriz de distancias que elementos de la matriz de distancias que se encuentran más próximos. se encuentran más próximos.

Page 20: Taxonomía Numérica

La distancia de este nuevo conglomerado La distancia de este nuevo conglomerado respecto de los restantesrespecto de los restantes elementos de la elementos de la matriz se calcula como la menor de las matriz se calcula como la menor de las distancias entre cada elemento del distancias entre cada elemento del conglomerado y el resto de elementos de conglomerado y el resto de elementos de la matriz. En los pasos sucesivos, la la matriz. En los pasos sucesivos, la distancia entre dos conglomerados se distancia entre dos conglomerados se calcula como la distancia entre sus dos calcula como la distancia entre sus dos elementos más próximos. elementos más próximos.

Page 21: Taxonomía Numérica

Así, la distancia dAsí, la distancia dAB AB entre los entre los conglomerados A y B se calcula mediante:conglomerados A y B se calcula mediante:

ddAB = min d(AB = min d(ijij) )

Donde d(Donde d(ijij) es la distancia entre los elementos i y j, ) es la distancia entre los elementos i y j, el primero perteneciente al conglomerado A y el el primero perteneciente al conglomerado A y el segundo al de B. segundo al de B.

Page 22: Taxonomía Numérica

COMPONENTES PRINCIPALESCOMPONENTES PRINCIPALES

Este análisis reduce un conjunto Este análisis reduce un conjunto numeroso de caracteres mediante un numeroso de caracteres mediante un número reducido de variables llamados número reducido de variables llamados componentes principales. Estos componentes principales. Estos componentes no están correlacionados componentes no están correlacionados entre sí y el número de los componentes entre sí y el número de los componentes depende del número de caracteres.depende del número de caracteres.

Page 23: Taxonomía Numérica

Cada componente contiene una parte de Cada componente contiene una parte de la variabilidad total de los caracteres. El la variabilidad total de los caracteres. El primer componente es el que contiene primer componente es el que contiene mayor variabilidad. De la variabilidad mayor variabilidad. De la variabilidad restante, el segundo componente es el restante, el segundo componente es el que incluye mayor información.que incluye mayor información.

Page 24: Taxonomía Numérica

Cada componente tiene la información de Cada componente tiene la información de todos los caracteres pero en diferentes todos los caracteres pero en diferentes proporciones.proporciones.

La contribución individual de un carácter La contribución individual de un carácter para un componente representa la para un componente representa la varianza de ese carácter para el citado varianza de ese carácter para el citado componente. La sumatoria de las componente. La sumatoria de las varianzas de todos los caracteres para un varianzas de todos los caracteres para un determinado componente principal recibe determinado componente principal recibe el nombre de autovalor.el nombre de autovalor.

Page 25: Taxonomía Numérica

Los autovalores son diferentes para cada Los autovalores son diferentes para cada componente. El componente con mayor componente. El componente con mayor autovalor será el primer componente autovalor será el primer componente principal, el que le sigue será el segundo y principal, el que le sigue será el segundo y así sucesivamente.así sucesivamente.

La suma de los autovalores representa la La suma de los autovalores representa la varianza total de las OTU para los varianza total de las OTU para los caracteres utilizados; por consiguiente caracteres utilizados; por consiguiente puede establecerse el porcentaje de puede establecerse el porcentaje de variación contenido en cada componente variación contenido en cada componente principal según su aporte a la misma.principal según su aporte a la misma.

Page 26: Taxonomía Numérica

Varianza total explicada

14.908 48.089 48.089

5.599 18.060 66.149

2.869 9.255 75.404

1.857 5.989 81.393

1.461 4.712 86.105

1.051 3.391 89.496

.942 3.037 92.533

.725 2.339 94.872

.598 1.928 96.800

.570 1.839 98.639

.243 .784 99.423

.133 .430 99.854

.036 .116 99.970

.009 .030 100.000

4.929E-16 1.590E-15 100.000

Componente1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Total% de lavarianza % acumulado

Autovalores iniciales

Page 27: Taxonomía Numérica

La contribución de cada carácter se La contribución de cada carácter se expresa con un valor. Cuanto más alto es expresa con un valor. Cuanto más alto es el valor de esa contribución (sin importar el valor de esa contribución (sin importar el signo), mayor es el aporte del carácter el signo), mayor es el aporte del carácter al componente.al componente.

Page 28: Taxonomía Numérica

Matriz de componentesa

.866 .446

.724 .522

.952 -.287

.161 .827

-.230 .056

.952 -.287

.866 .446

.952 -.287

.952 -.287

.952 -.287

.952 -.287

.518 -.273

.952 -.287

.686 -.038

.866 .446

.234 .897

.866 .446

.087 .184

.360 .368

.952 -.287

.952 -.287

-.075 .605

.440 .136

-.109 -.072

-.119 -.146

.866 .446

-.388 .403

-.152 .537

.952 -.287

.329 .323

.234 .897

VAR00002

VAR00003

VAR00004

VAR00005

VAR00006

VAR00007

VAR00008

VAR00009

VAR00010

VAR00011

VAR00012

VAR00013

VAR00014

VAR00015

VAR00016

VAR00017

VAR00018

VAR00019

VAR00020

VAR00021

VAR00022

VAR00023

VAR00024

VAR00025

VAR00026

VAR00027

VAR00028

VAR00029

VAR00030

VAR00031

VAR00032

1 2

Componente

Método de extracción: Análisis de componentes principales.

2 componentes extraídosa.

Page 29: Taxonomía Numérica