7
n N m M j j-1 j-2 0 n,j c j =|| j -x n || t jj =-lg(Pii) t (j-1)j = - lg(p j-1,j ) t (j-2)j = - lg(p j-1,j ) j j-1 t j-2 t t t j+ 1 t t Metodo dei gettoni per il riconoscimento del parlato continuo con DTW

0 n-1 n N

Embed Size (px)

DESCRIPTION

j+1. t 1. t 1. j. t 0. t 1. j-1. t 0. t 1. j-2. Metodo dei gettoni per il riconoscimento del parlato continuo con DTW. m M j j-1 j-2 0. D c j =|| m j - x n || t jj =-lg(Pii) t (j-1)j = - lg(p j-1,j ) t (j-2)j = - lg(p j-1,j ). n,j. - PowerPoint PPT Presentation

Citation preview

Page 1: 0             n-1       n                                                    N

0 n-1 n N

m

M

j

j-1

j-2

0

n,jcj=||j-xn||

tjj =-lg(Pii)

t(j-1)j= - lg(pj-1,j)

t(j-2)j= - lg(pj-1,j)

j

j-1

t

j-2t

t

t

j+1

t

t

Metodo dei gettoni per il riconoscimento del parlato continuo con DTW

Page 2: 0             n-1       n                                                    N

cj-2,n-1

j-2

t0=1

t1=0

cj,n

jcj,n-1

j

cj-1,n-1

j-1s(j-1)(n-1)

y

sj(n-1)

w

s(j-2)(n-1)

z

sjo

i

Metodo dei gettoni. Gettoni emessi dallo stato (j-k, n-1) k=0 2

[s(j-k)j = sj-k+tkj ; j-k] ;

Gettone ottimo entrante in (j,n) e stato ottimo precedente (i,n-1)

i=argmink [s(j-k)j, k=0 2]; Costo accumulato in (j,n): sj= sij +cj,n

Record di stato: [sj;(i,n-1)]

L’algoritmo si itera a partire da (j,n)

t2=1

sjj

j

sju

j-1

s(j-1)j

j-1

s(j-2)j

j-2

s(j-1)(j-1)

j-1

n-1

n

Page 3: 0             n-1       n                                                    N

SCP: Stato di Connessione delle Parole

Wa

WbSCP

sWa

w0

id0

sWa

id0na

wa

id1

SCP

0w0

id0

Costo della parola terminataParola precedenteIndirizzo WLR precedente

Gettone d’uscita

WLR: World Link Record

Costo accumulatoId. colleg. parola precedente Istante di riconoscimento Codice parola riconosciuta Id WLR

sWab

wa

id1

Costo cumulato sWab= sWa+tab

Parola precedenteIndirizzo WLR precedente

Gettone d’ingresso

Page 4: 0             n-1       n                                                    N

SCP

Wa

Wc

Wb

SCPsWa

id0na

wa

id1

sWb

id1nb

wb

id2

GETWac

GETWab

GETWac

Page 5: 0             n-1       n                                                    N

W1

W2

W3

0w0

id0

W1

W2

W3

c3

id0n1

w3

id1

c2

id1n1

w2

id2

SCP SCP SCP

c3

L0

c3

L1

c2

L1

Id d’inizio

WLR Costo accumulatoId. colleg. parola precedente Istante di riconoscimento Codice parola riconosciuta

Id WLR

Grafo degli stati complessivo più WLR per ogni SCP

Page 6: 0             n-1       n                                                    N

STP

W1

W2

W3

c3

id0

c3

id1n3

w2

id2

c1

idon1

w3

id1

c5

id2n5

w2

id5

c4

id2n4

w3

id4

c1

id1n2

w2

id3

0w0

id0

c3

id0

c3

id0

c3

id0

Realizzazione dell’algoritmo per il riconoscimento del parlato continuo con DTW

Page 7: 0             n-1       n                                                    N

Riferimenti:1) S.J. Joung, et al.: Token Passing: a Simple Conceptual Model for Connected Speech Recognition Systems (1989) http://www.citeseer.ist.psu.edu/young89toren.html2) H. Ney, S. Ortmann: Dynamic Programming Search for Continous Speech Recognition, IEEE Signal Processing Magazine (settembre 1999)3) Per l’utilizzo del modello passaggio del gettone (Token Passing) è utile il Capitolo 1 di HTK Book dal sito http://htk.eng.cam.ac.uk/ o acquistare alla Copisteria Copia