Upload
trinhquynh
View
215
Download
0
Embed Size (px)
Citation preview
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
“Cluster analysis”
Análisis de conglomerados
Análisis tipológico
Análisis de grupos
Jerárquicos
Particionamiento
Piramidales
Arboles
aditivos
No disjuntos
Difusos
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Método de nubes dinámicas
Forgy (1965)
Mc Queen (1967) “k - means”
Diday (1969) → MND
• Da una partición inicial al azar: P.
• calcula los centros
• Asigna los individuos al centro más cercano:
formakcc ,...,
1nueva
• Recalcula los centroskgg ,...,
1
Hasta alcanzar una estabilización.
ciclos
Clasificación Automática
CIMPA-UCR
Forgy (1965) : esquema básico
Diday (1969) : esquema general
• Una clase se representa por un núcleo o prototipo
Cl Nl
• A partir de una representación inicial en núcleos, se iteran:
- se hacen clasificaciones por asignación de los objetos al
al núcleo más cercano
- se representan las clases mediante el cálculo de los
núcleos
Método de nubes dinámicas
Clasificación Automática
CIMPA-UCR
Ejemplos de núcleos
• Caso euclídeo: centro de gravedad
(punto u objeto promedio)*
• Caso no euclideano: una muestra
(objetos más representativos)
• Caso explicativo: rectas de regresión
Clasificación Automática
CIMPA-UCR
• Reconocimiento de formas: métricas o distancias adaptativas
Una sola métrica
**
Una métrica por clase:
*
*
*
Ejemplos de núcleos
Clasificación Automática
CIMPA-UCR
Etapas en el MND
Asignación
li Cx → si
( ) ( )hili NxdNxd ,, ≤ para kh ,...,1∈
ie: ( ) ( )hih
li NxdNxd ,mín, ≤
En caso de igualdad, se asigna xi a la clase de índice menor
Representación
Nl es núcleo de cl si el criterio W es mínimo con Nl
Caso euclídeo: Nl = gl , el centro de gravedad
Teorema de Huygens ( ) ( ) 2agCICI llglla −+= µ
( ) 2
∑∈
−=li Cx
iila axpCI
Clasificación Automática
CIMPA-UCR
MND: núcleos son centros de gravedad
d : distancia Euclídea clásica (cuadrática)
x j : cuantitativas
( ) ∑∑= ∈
−=k
l Cx
lii
li
NxpLPW1
2,
∑ ∑= ∈
−+−=k
l Cx
llllii
li
NgCgxp1
22
Núcleo que minimiza: centro de gravedad gl
( ) :,1
2
∑∑= ∈
−==k
l Cx
lii
li
gxpWLPW Inercia intra-clases
Forgy 1965, Diday 1967, Mac Queen 1967
Clasificación Automática
CIMPA-UCR
Forgy 1965, Diday 1967, Mac Queen 1967
Algoritmo:
1. Escoger k individuos: (al azar o con experticia)
2. Para i = 1 hasta n: asignar xi al centro tal que:
)0()0(
2
)0(
1,...,, kggg
)(t
lg
)(
...1
)(Mín
t
likl
t
li gxgx −=−=
(caso de igualdad: menor índice)
Se forman clases )()(
2
)(
1,...,,
t
k
ttCCC
3. Calcular núcleos: para l = 1 hasta k
4. Hasta que ningún individuo cambia de clase
( )
( )∑
−∈
− =1
1
tli Cx
i
t
l pµ( )( )∑
−∈−
=1
1
)( 1
tli Cx
iit
l
t
l xpgµ
con ( )1+= tt
MND: núcleos son centros de gravedad
Clasificación Automática
CIMPA-UCR
W decrece en cada iteración del MND
ASIG: i) Sean ( ),,...,1 kCCP = ( ),,...,
1 kggL = ( ):Lf partición alrededor
de los gl
( ) ∑∑= ∈
−=k
l Cx
lii
li
gxpPLW1
2
,
( )( ) ,,1
2
∑ ∑= ∈
−=k
l Dx
lii
li
gxpLfLW con ( ) ( )kDDLf ,...,1
=
Sea z ∈ Ω: z ∈ Cj z ∈Dh
por definición de Dh: jh gzgz −<−
22
jzhz gzpgzp −≤−⇒
Razonando ∀ z ∈ Ω: ( )( ) ( )PLWLfLW ,, ≤
MND: convergencia
Clasificación Automática
CIMPA-UCR
DESCRIPCIÓN DE UNA PARTICIÓN (1) M: daigonal
Indice global:I
BR =
si ⇒≈1R Buena Clasificación
si ⇒≈ 0R Mala Clasificación
Contribución de las variables:
( ) ( )( )j
j
j
x
xjcorx
var
var=→ con :j
xmedidas de en cada
clase
jx
Descripción de las clases:
( ) ( ):
var
B
xlB
j
l= posición de Cl respecto a g B( l ) ↑ ⇒ Cl es
excéntrico
( ) ( ) :1
2
∑ ∑= ∈
−=p
j Cx
j
l
j
ii
li
gxplW concentración de la clase W( l ) ↓⇒ Cl está concentrado
Clasificación Automática
CIMPA-UCR
DESCRIPCIÓN DE UNA PARTICIÓN (2)
Descripción de las clases por variable:
( ) ( )( )j
jj
lll
j
x
xxljcorCx
var,:
2
−=≈
µ
( ) jxljcor :, ↑ es homogénea sobre Cl
Ej: R = 94%
cor (1) = 96.7% → discrimina
cor (2) = 89.8%
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR
Clasificación Automática
CIMPA-UCR