6
* *

Agrupamento de Sinais de Eletroencefalogra a por Mistura ... · 2 Métodos O experimento consistiu na exibição de diferentes imagens para uma pessoa (estímulo visual) e simultânea

  • Upload
    ledieu

  • View
    221

  • Download
    0

Embed Size (px)

Citation preview

Agrupamento de Sinais de Eletroencefalograa

por Mistura de Distribuições Normais

Thiago Costa Araújo∗ George F. von Borries† Ricardo F. von Borries‡

29 de abril de 2010

DRAFT - SINAPE 2010

Neste trabalho utilizamos a técnica de agrupamento por mistura de distribuições normais para identicaros padrões existentes entre os sinais cerebrais referentes a diferentes estímulos visuais. Para a estimaçãodos parâmetros foi utilizado o algoritmo EM. O vetor que associa cada observação com o estímulo visualfoi tratado como desconhecido. O estudo apresentou resultados positivos, gerando grupos com alta taxa deacerto para 3 estímulos estudados. O pacote estatístico utilizado foi o MCLUST, implementado no softwarelivre R.

Palavras-chave: Eletroencefalograa; Análise de Cluster; Mistura de Normais; Algoritmo EM; MCLUST.

1 Introdução

Ao longo de um dia uma pessoa realiza tarefas dos tipos mais variados possíveis e para cada uma destas tarefaso cérebro esta em constante atividade, emitindo e recebendo sinais. O conhecimento destes sinais sugere odesenvolvimento de aplicações que sejam capazes de interpreta-los e reproduzir seus comandos através deequipamentos articiais. Assim, seria possível, por exemplo, a implantação de um membro mecânico (perna,braço) que fosse controlado pelos sinais cerebrais enviados pelo indivíduo portador de necessidades especiais.

Nesta pesquisa, trabalhamos com dados coletados pelo Biopotencials Image Laboratory da Universidadedo Texas em El Paso, referentes aos dados de Eletroencefalograa (EEG) obtidos de um indivíduo submetidoa diferentes estimulos visuais. A procura de um padrão nos sinais coletados é feita através da análise deagrupamentos, que consiste na criação de grupos para as observações baseando-se na similaridade existenteentre elas em relação as variáveis em estudo.

A eletroencefalograa é uma técnica não invasiva que requer apenas o posicionamento de eletrodos nasuperfície da cabeça para obter o registro do potencial elétrico produzido pelo cérebro em um dado momento.Para o agrupamento dos sinais coletados é utilizada a mistura de distribuições normais e a estimação dosparâmetros foi realizada via algoritmo EM que lida com a não observação do vetor que identica cadaobservação com o grupo ao qual pertence.

∗Departamento de Estatística, IE, Universidade de Brasília, Brasília, DF, 70910-900, Brazil, E-mail: [email protected]†Departamento de Estatística, IE, Universidade de Brasília, Brasília, DF, 70910-900, Brazil, E-mail: [email protected]‡Department of Electrical and Computer Engineering,University of Texas at El Paso, El Paso, Texas, 79968-0523, USA,

E-mail: [email protected]

1

2 Métodos

O experimento consistiu na exibição de diferentes imagens para uma pessoa (estímulo visual) e simultâneagravação dos sinais emitidos pelo cérebro através de 128 eletrodos posicionados no couro cabeludo (Figura 1).Após a gravação, cada sinal foi dividido em 32 bandas, de tal forma que cada banda contém uma diferentecaracterística do sinal original.

Figura 1: Visualização simplicada do experimento.

Iniciamente foram apresentados 10 estímulos visuais, mas neste estudo foram utilizados somente os 3estímulos apresentados na Figura 2.

Figura 2: Estímulos visuais estudados.

2.1 Agrupamento por Mistura de Distribuições

O interesse no uso de técnicas de agrupamento é obter grupos de tal forma que as observações contidasdentro de um mesmo grupo apresentem grau de similaridade superior a observações em grupos diferentes. Atécnica de agupamento utilizada foi a mistura de distribuições normais, assumindo assim que cada grupo estaassociado a uma distribuição normal com diferentes parâmetros. Assim a função densidade de probabilidadeque modela os dados é obtida por,

f(x) =n∑

i=1

πifi(x) (1)

Onde os fi(x) são funções de probabilidade e designadas dentro do contexto de mistura de componentesde densidades.

Utilizando decomposição espectral é possível percorrer diferentes estruturas para as possíveis matrizes decovariância. A decomposição espectral de uma matriz é obtida por

Σk = λkDkAkD′

k k = 1, . . . , g

onde, λk = det Σk1d , Dk é a matriz de autovetores de Σk, e Ak é uma matriz diagonal tal que detAk = 1,

com os autovetores normalizados de Σk na diagonal em ordem decrescente.Através desta decomposição λk, Dk e Ak determinarão o volume, a orientação e o formato do k-ésimo

cluster respectivamente. Alguns exemplos de decomposições e respectivas interpretações são apresentados naTabela 1.

2

Tabela 1: Exemplos de Estruturas para a matriz de Variância e Covariância

Nome Σk Distribuição Volume Formato OrientaçãoEII λI Esférica Igual Igual NA

EEI λDD′

Diagonal Igual Igual NA

EEE λDAD′

Elipsoidal Igual Igual Igual

EEV λDAkD′

Elipsoidal Igual Igual Variável

VEV λDkAD′

k Elipsoidal Variável Igual Variável

Antes da seleção do modelo, foi utilizada a análise de componentes principais para a redução da dimensãodos dados, mantendo-se um número de componentes equivalentes a 70% da explicação da variância total.

2.2 Seleção do Modelo

Para estudar a qualidade do agrupamento obtido com os diferentes modelos, duas medidas são utilizadas. Aprimeira é o BIC (Bayesian Information Criterion) e é calculada por:

BIC = 2 ln(L)− k ln(n)

onde, L é o valor maximizado da função de verossimilhança, k é o número de parâmetros do modelo emestudo e n é o número de elementos a agrupar.

A segunda medida é o índice ajustado de Rand, ou aRI( Adjusted Rand Index), que utiliza da informaçãoexterna que se possui sobre o grupo ao qual cada observação pertence de fato. Este índice atribui valorpositivo a variáveis que estejam alocadas no mesmo grupo tanto na estrutura original quanto no resultadodo agrupamento, e valor negativo para variáveis alocadas em grupos diferentes do grupo a que pertenciamoriginalmente. O valor esperado do aRI é 0, no caso de alocação aleatória das variáveis, e seu valor máximoé 1 quando todas as unidades são alocadas corretamente.

2.3 Algoritmo EM

O algoritmo EM trabalha iterativamente em duas etapas, Esperança (E) e Maximização (M). A etapa E éresponsável por lidar com os dados não observados através da esperança condicional do log da verossimilhançados dados completos, a etapa M é responsável por maximizar a esperança obtida sobre o espaço paramétricoΩ e obtendo as atualizações para as estimativas dos parâmetros.

3 Resultados

O maior BIC obtido foi para o modelo VEV com 8 grupos, apresentando um BIC de −402426, 5. Apesar destemodelo fornecer o melhor BIC, não foi possível agrupar corretamente todas as observações. Neste modelo,foram agrupadas erroneamente 360 das 1923 observações, i.e., aproximadamente 19% do total observado.Quando um grupo contem observações de mais de uma gura, foram consideraremos como observaçõesagrupadas erradas, aquelas que constituem o menor número de observações dentro deste grupo.

Para cada modelo estudado, obteve-se o agrupamento para um número de grupos variando de 2 a 30grupos. Em seguida, as observações foram reagrupadas atribuindo cada grupo a gura que teve mais obser-vações em cada grupo obtido. O resultando nal constitui de apenas 3 grupos, para os quais é calculado oaRI. A Figura 3 apresenta o aRI obtido para os diferentes números de grupos estudados.

As linhas tracejadas foram construídas para tentar auxiliar na análise e são dadas pelamedia ±tn−1;0,975∗desvio padrao. Para até 8 grupos, os melhores resultados são fornecidos por modelos mais complexos. Acimade 8 grupos, os modelos mais simples começam a mostrar resultados bem melhores do que os modelos maiscomplexos. O primeiro modelo a obter aRI igual a 1 foi o modelo VII. Para o modelo EEV com 3 grupos,obteve-se um aRI de 0, 8757. A Tabela 2 apresenta os resultados para este modelo.

3

Figura 3: aRI para todos modelos com um número de grupos variando de 2 a 30 utilizando 32 Bandas poreletrodo.

Tabela 2: Comparação entre agrupamento original e obtido por mistura de distribuições para o modelo comAri 0, 8757.

AgrupamentoGrupo Original 1 2 3

1 641 25 02 0 616 593 0 0 582

A Figuras 3 e 4 fornecem os grácos de classicação e erro referentes ao resultado do modelo EEV com 3grupos através das primeiras componentes principais. Nestas guras o estímulo 1 é representado em azul, oestímulo 2 em vermelho e o estímulo 3 em verde.

4

Figura 4: Classicação para o modelo EEV com 3 grupos e 32 bandas

Figura 5: Observações agrupadas erradas para o modelo EEV com 3 grupos e 32 bandas

4 Conclusão

• A análise apenas via BIC se mostrou insuciente quando comparada aos resultados do aRI observado.

• Na inexistência da informação externa seria necessário utilizar de várias medidas internas para avaliaros diferentes agrupamentos.

• O aumento do número de grupos não leva necessariamente ao melhoramento do agrupamento.

• O uso de modelos mais complexos é recomendado em trabalhos com 32 bandas e com um númeropequeno de grupos.

• A técnica de agrupamento por mistura de distribuições normais apresentou resultados muito bons edeve ser explorada com mais detalhes em problemas de análise de sinais de EEG.

5

Referências

[1] RENCHER A.C. Methods of Multivariate Analysis. Wiley Interscience, 2002.

[2] IZENMAN A.J. Modern Multivariate Statistical Techniques (Regression, Classication, and ManifoldLearning). Springer, 2008.

[3] FRALEY C. and RAFTERY A. E. Mclust version 3 for r: Normal mixture modeling and model-basedclustering. Technical report, University of Washington, 2006.

[4] FUNG G. A comprehensive overview of basic clustering algorithms. 2001.

[5] MCLACHLAN G. and PEEL D. Finite Mixture Models. Wiley Interscience, 2000.

6