Identificação de Voz

Preview:

DESCRIPTION

Identificação de Voz. Marcelo Lucena André Palhares. Roteiro. Problema Hidden Markov Models (HMMs) Sistema de identificação de voz Resultados Conclusão. Problema. Controlar o acesso a um determinado sistema a partir do teste biométrico de voz. Controlar o acesso a lugares restritos. - PowerPoint PPT Presentation

Citation preview

Identificação de Voz

Marcelo Lucena

André Palhares

Roteiro

• Problema

• Hidden Markov Models (HMMs)

• Sistema de identificação de voz

• Resultados

• Conclusão

Problema

• Controlar o acesso a um determinado sistema a partir do teste biométrico de voz.

• Controlar o acesso a lugares restritos.

• Identificar pessoas em um ambiente.

Problema

• Não confundir identificação com reconhecimento de voz– Reconhecimento: apenas verificar se o sinal

de entrada do sistema pertence a uma pessoa (no caso, já se sabe a qual pessoa da base de dados comparar)

– Identificação: descobrir qual das pessoas da base de dados foi responsável por emitir o sinal de entrada do sistema

Problema

• Identificação dependente de texto– Para se dar acesso a pessoa, ela tem que

dizer a frase correta• No caso, o seu próprio nome

• Assim, deve ser rejeitada qualquer pessoa que disser algo diferente do seu próprio nome (se for usuária do sistema)

Hidden Markov Models

• Modelos probabilísticos de sinais• Geralmente utilizados na modelagem de

sinais que variam durante o tempo– Voz, escrita, gestos, etc.

• Quando se usa HMM para aprendizagem, o principal trabalho é estimar seus parâmetros– probabilidades de transição, distribuições de

observações, etc.

Hidden Markov Models

• Consistem de N estados e probabilidades de transição de um estado para o outro

• Cada estado possui uma distribuição de probabilidade das M observações de saída do sistema (HMM discreta)

• Além disto, temos a distribuição de probabilidade inicial para a HMM

Hidden Markov Models

• Problema das moedas– Não se sabe quantas moedas foram

lançadas, apenas o resultado dos lançamentos

• Pode ser modelado com HMMs supondo apenas 1 moeda, 2 moedas, 3 moedas, etc.

Hidden Markov Models

Hidden Markov Models

• Tipos de HMMs– Ergódico

• Todos os estados são ligados a qualquer outro estado

– Esquerda-direita• Utilizados em problemas cujos sinais são variáveis

temporais (voz, por exemplo)

– Misto• Mais versátil

Hidden Markov Models

Sistema de identificação de voz

• Arquitetura

Sistema de identificação de voz

• Conjunto de treinamento– Amostras coletadas

• Análise Espectral

Sistema de identificação de voz

• Vector quantization– Como são utilizadas HMMs discretas, devemos

discretizar os vetores de características– Um vetor pertencerá a classe que lhe é mais próxima,

baseado na distância euclidiana

• HMMs– Foi utilizado o modelo esquerda-direita com variação

de 5 a 15 estados– O número de iterações do algoritmo Baum-Welch

variou entre 10 e 30.

Sistema de identificação de voz

• Seletor– Responsável por definir o limiar de aquele

sinal ter sido emitido ou não pela mesma pessoa da HMM que está sendo comparado

– O limiar é diferente para cada HMM, definido através log da probabilidade do conjunto de treinamento somado ao dobro do desvio padrão

Resultados

• Cenário 1– 2 pessoas cadastradas no sistema (2 HMMs)– 21 amostras de entrada – 5 amostras de pessoas cadastradas– 16 amostras aleatórias

• Cenário 2– 3 pessoas cadastradas no sistema (3HMMs)– 30 amostras de entrada– 8 amostras de pessoas cadastradas– 22 amostras aleatórias

Cenário 1

0

5

10

15

20

25

Acertos Erros

Modelo 1 /Cenario 1

0

5

10

15

20

Acertos Erros

Modelo 2 /Cenario 1

0

5

10

15

20

Acertos Erros

Modelo 2 /Cenario 1

Cenário 2

0

5

10

15

20

25

Acertos Erros

Modelo 1 /Cenario 2

0

5

10

15

20

25

30

Acertos Erros

Modelo 2 /Cenario 2

0

5

10

15

20

25

Acertos Erros

Modelo 3 /Cenario 2

Conclusão e Trabalhos Futuros

• HMM dá bons resultados também para identificação de voz.

• Um estudo sobre qual a melhor característica espectral para as observações pode melhorar o desempenho.

• Melhorar a quantização dos vetores.

Perguntas

?

Recommended