Upload
kristen-wong
View
30
Download
0
Embed Size (px)
DESCRIPTION
j+1. t 1. t 1. j. t 0. t 1. j-1. t 0. t 1. j-2. Metodo dei gettoni per il riconoscimento del parlato continuo con DTW. m M j j-1 j-2 0. D c j =|| m j - x n || t jj =-lg(Pii) t (j-1)j = - lg(p j-1,j ) t (j-2)j = - lg(p j-1,j ). n,j. - PowerPoint PPT Presentation
Citation preview
0 n-1 n N
m
M
j
j-1
j-2
0
n,jcj=||j-xn||
tjj =-lg(Pii)
t(j-1)j= - lg(pj-1,j)
t(j-2)j= - lg(pj-1,j)
j
j-1
t
j-2t
t
t
j+1
t
t
Metodo dei gettoni per il riconoscimento del parlato continuo con DTW
cj-2,n-1
j-2
t0=1
t1=0
cj,n
jcj,n-1
j
cj-1,n-1
j-1s(j-1)(n-1)
y
sj(n-1)
w
s(j-2)(n-1)
z
sjo
i
Metodo dei gettoni. Gettoni emessi dallo stato (j-k, n-1) k=0 2
[s(j-k)j = sj-k+tkj ; j-k] ;
Gettone ottimo entrante in (j,n) e stato ottimo precedente (i,n-1)
i=argmink [s(j-k)j, k=0 2]; Costo accumulato in (j,n): sj= sij +cj,n
Record di stato: [sj;(i,n-1)]
L’algoritmo si itera a partire da (j,n)
t2=1
sjj
j
sju
j-1
s(j-1)j
j-1
s(j-2)j
j-2
s(j-1)(j-1)
j-1
n-1
n
SCP: Stato di Connessione delle Parole
Wa
WbSCP
sWa
w0
id0
sWa
id0na
wa
id1
SCP
0w0
id0
Costo della parola terminataParola precedenteIndirizzo WLR precedente
Gettone d’uscita
WLR: World Link Record
Costo accumulatoId. colleg. parola precedente Istante di riconoscimento Codice parola riconosciuta Id WLR
sWab
wa
id1
Costo cumulato sWab= sWa+tab
Parola precedenteIndirizzo WLR precedente
Gettone d’ingresso
SCP
Wa
Wc
Wb
SCPsWa
id0na
wa
id1
sWb
id1nb
wb
id2
GETWac
GETWab
GETWac
W1
W2
W3
0w0
id0
W1
W2
W3
c3
id0n1
w3
id1
c2
id1n1
w2
id2
SCP SCP SCP
c3
L0
c3
L1
c2
L1
Id d’inizio
WLR Costo accumulatoId. colleg. parola precedente Istante di riconoscimento Codice parola riconosciuta
Id WLR
Grafo degli stati complessivo più WLR per ogni SCP
STP
W1
W2
W3
c3
id0
c3
id1n3
w2
id2
c1
idon1
w3
id1
c5
id2n5
w2
id5
c4
id2n4
w3
id4
c1
id1n2
w2
id3
0w0
id0
c3
id0
c3
id0
c3
id0
Realizzazione dell’algoritmo per il riconoscimento del parlato continuo con DTW
Riferimenti:1) S.J. Joung, et al.: Token Passing: a Simple Conceptual Model for Connected Speech Recognition Systems (1989) http://www.citeseer.ist.psu.edu/young89toren.html2) H. Ney, S. Ortmann: Dynamic Programming Search for Continous Speech Recognition, IEEE Signal Processing Magazine (settembre 1999)3) Per l’utilizzo del modello passaggio del gettone (Token Passing) è utile il Capitolo 1 di HTK Book dal sito http://htk.eng.cam.ac.uk/ o acquistare alla Copisteria Copia