Bài giảng Xu Li Tieng Noi Thay Loan

Preview:

DESCRIPTION

bài giảng xử lý tiếng nói đại học bách khoa hà nội

Citation preview

1

xö lý tiÕng nãixö lý tiÕng nãixö lý tiÕng nãixö lý tiÕng nãi

TrÞnh V¨n LoanTrÞnh V¨n LoanFIT-HUTFIT-HUT

2

Xö lý tiÕng nãi

Tµi liÖu tham kh¶oTµi liÖu tham kh¶o1.1. La parole et son traitement La parole et son traitement automatiqueautomatique

Calliope, Masson, 1989Calliope, Masson, 1989 22. . Traitement de la paroleTraitement de la parole

Rene Boite et Murat Kunt, Presse Rene Boite et Murat Kunt, Presse Polytechniques Romandes, 1987Polytechniques Romandes, 1987

33.. Fundamentals of Speech Signal Fundamentals of Speech Signal ProcessingProcessing

Saito S., Nakata K. , Academic Press, Saito S., Nakata K. , Academic Press, 19851985

Tµi liÖu tham kh¶oTµi liÖu tham kh¶o1.1. La parole et son traitement La parole et son traitement automatiqueautomatique

Calliope, Masson, 1989Calliope, Masson, 1989 22. . Traitement de la paroleTraitement de la parole

Rene Boite et Murat Kunt, Presse Rene Boite et Murat Kunt, Presse Polytechniques Romandes, 1987Polytechniques Romandes, 1987

33.. Fundamentals of Speech Signal Fundamentals of Speech Signal ProcessingProcessing

Saito S., Nakata K. , Academic Press, Saito S., Nakata K. , Academic Press, 19851985

3

Xö lý tiÕng nãi

Néi dungNéi dung

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

2. 2. Xö lý tin hiÖu tiÕng nãiXö lý tin hiÖu tiÕng nãi

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

4.4. Tæng hîp tiÕng nãi Tæng hîp tiÕng nãi

5.5. NhËn d¹ng tiÕng nãi NhËn d¹ng tiÕng nãi

Néi dungNéi dung

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

2. 2. Xö lý tin hiÖu tiÕng nãiXö lý tin hiÖu tiÕng nãi

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

4.4. Tæng hîp tiÕng nãi Tæng hîp tiÕng nãi

5.5. NhËn d¹ng tiÕng nãi NhËn d¹ng tiÕng nãi

4

Xö lý tiÕng nãi ?Xö lý tiÕng nãi ?

Xö lý th«ng tin chøa trong Xö lý th«ng tin chøa trong tÝn hiÖu tiÕng nãi nh»m tÝn hiÖu tiÕng nãi nh»m truyÒn, l u tr÷truyÒn, l u tr÷ tÝn hiÖu nµy tÝn hiÖu nµy hoÆc hoÆc tæng hîp, nhËn d¹ngtæng hîp, nhËn d¹ng tiÕng nãi.tiÕng nãi.

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

C¸c nghiªn cøu ® îc tiÕn C¸c nghiªn cøu ® îc tiÕn hµnh ®Ó xö lý tiÕng nãi yªu hµnh ®Ó xö lý tiÕng nãi yªu cÇu nh÷ng hiÓu biÕt trªn cÇu nh÷ng hiÓu biÕt trªn nhiÒu lÜnh vùc ngµy cµng ®a nhiÒu lÜnh vùc ngµy cµng ®a d¹ng: tõ d¹ng: tõ ng÷ ©mng÷ ©m vµ vµ ng«n ng÷ ng«n ng÷ hächäc cho ®Õn cho ®Õn xö lý tÝn hiÖu...xö lý tÝn hiÖu...

5

Môc ®ÝchMôc ®Ých • M· ho¸M· ho¸ mét c¸ch cã hiÖu qu¶ mét c¸ch cã hiÖu qu¶ tÝn hiÖu tiÕng nãi ®Ó truyÒn vµ l tÝn hiÖu tiÕng nãi ®Ó truyÒn vµ l u tr÷ tiÕng nãi.u tr÷ tiÕng nãi.

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

•Tæng hîpTæng hîp vµ vµ nhËn d¹ngnhËn d¹ng tiÕng nãi tiÕng nãi tiÕn tíi giao tiÕp ng êi-m¸y b»ng tiÕn tíi giao tiÕp ng êi-m¸y b»ng tiÕng nãi.tiÕng nãi.TÊt c¶ c¸c øng dông cña xö lý TÊt c¶ c¸c øng dông cña xö lý tiÕng nãi ®Òu cÇn ph¶i dùa trªn tiÕng nãi ®Òu cÇn ph¶i dùa trªn c¸c kÕt qu¶ cña c¸c kÕt qu¶ cña ph©n tÝchph©n tÝch tiÕng tiÕng nãinãi

6

11. . Mét sè kh¸i niÖm c¬ b¶nMét sè kh¸i niÖm c¬ b¶n

Ph©n biÖt tiÕng nãi vµ Ph©n biÖt tiÕng nãi vµ ©m ©m thanh:thanh:

c¸c ®Æc tÝnh ©m häc cã c¸c ®Æc tÝnh ©m häc cã nguån gèc tõ c¬ chÕ t¹o tiÕng nguån gèc tõ c¬ chÕ t¹o tiÕng nãi.nãi.

Cã 2 lo¹i nguån ©mCã 2 lo¹i nguån ©m tuÇn hoµn (d©y thanh tuÇn hoµn (d©y thanh rung)rung) t¹p ©m (d©y thanh kh«ng t¹p ©m (d©y thanh kh«ng rung)rung)

7

Bé m¸y ph¸t ©mBé m¸y ph¸t ©m1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Họng

Thực quản

Nắp thanh quản

Khí quản

Dây thanh

Vòm miệng cứng

Vòm miệng mềm

Khoang mũi

Lưỡi

8

S¬ ®å khèi bé m¸y ph¸t ©mS¬ ®å khèi bé m¸y ph¸t ©m

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

9

Thanh m«n (1)Thanh m«n (1)11.. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Thanh môn

Dây thanh

10

Thanh m«n (2Thanh m«n (2))ë c¸c vÞ trÝ hÝt, thë, ph¸t ©m, ë c¸c vÞ trÝ hÝt, thë, ph¸t ©m, nãi th× thµonãi th× thµo

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

11

D©y thanh trong mét chu kú dao D©y thanh trong mét chu kú dao ®éng®éng

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

12

BiÓu diÔn tÝn hiÖu tiÕng BiÓu diÔn tÝn hiÖu tiÕng nãinãi

D¹ng sãng theo thêi gianD¹ng sãng theo thêi gian

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

13

BiÓu diÔn tÝn hiÖu tiÕng nãiBiÓu diÔn tÝn hiÖu tiÕng nãi

Phæ tÝn hiÖu tiÕng nãiPhæ tÝn hiÖu tiÕng nãi

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

14

BiÓu diÔn tÝn hiÖu tiÕng nãiBiÓu diÔn tÝn hiÖu tiÕng nãi

Spectrogram (Sonagram)Spectrogram (Sonagram)

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

15

T¹o ©m h÷u thanh . Formant vµ T¹o ©m h÷u thanh . Formant vµ antiformantantiformant

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

16

T¹o ©m v« thanhT¹o ©m v« thanh

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

17

Mét sè ®Æc ®iÓm ng÷ ©m Mét sè ®Æc ®iÓm ng÷ ©m tiÕng ViÖttiÕng ViÖt

§¬n ©m tiÕt§¬n ©m tiÕt

Cã thanh ®iÖu (6), biÕn ®æi Cã thanh ®iÖu (6), biÕn ®æi

thanh ®iÖu kÌm theo biÕn ®æi thanh ®iÖu kÌm theo biÕn ®æi

nghÜanghÜa Kh«ng biÕn ®æi h×nh th¸iKh«ng biÕn ®æi h×nh th¸i

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

18

M« h×nh t¹o tiÕng nãi (Fant-M« h×nh t¹o tiÕng nãi (Fant-1960)1960)

)z1)(z1(A

)z(G 11 )z1)(z1(

A)z(G 11

K

1k

2k2

1k1 )zbzb1(

B)z(V

K

1k

2k2

1k1 )zbzb1(

B)z(V

)z1(C)z(R 1 )z1(C)z(R 1

P

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Läc th«ng Läc th«ng

thÊp G(z)thÊp G(z)

Läc th«ng Läc th«ng

thÊp G(z)thÊp G(z)TuyÕn TuyÕn ©m ©m

V(z)V(z)

TuyÕn TuyÕn ©m ©m

V(z)V(z)

T¶i bøc x¹T¶i bøc x¹

R(z)R(z)

T¶i bøc x¹T¶i bøc x¹

R(z)R(z)

19

A(z): Hµm truyÒn ®¹t cña bé läc A(z): Hµm truyÒn ®¹t cña bé läc ®¶o®¶o

M« h×nh toµn ®iÓm cùc M« h×nh toµn ®iÓm cùc (AR(AR))

)z(A)z(R)z(V)z(G)z(T

)z(A)z(R)z(V)z(G)z(T

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

1K2

1i

iiza1)z(A

1K2

1i

iiza1)z(A

)n(u)in(xa)n(xp

1ii

)n(u)in(xa)n(xp

1ii

)z(A)z(T

)z(A)z(T

20

NÕu tÝnh ®Õn khoang mòi NÕu tÝnh ®Õn khoang mòi xuÊt hiÖn c¸c ®iÓm xuÊt hiÖn c¸c ®iÓm kh«ng(ARMA)kh«ng(ARMA)

)z(A)z(C

)z(A)z(A)z(T

2

2

1

1 )z(A)z(C

)z(A)z(A)z(T

2

2

1

1 1zc)z(C -iq

0ii

0c 1zc)z(C -i

q

0ii

0c

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

)in(uc)in(xa)n(xq

0ii

p

1ii

)in(uc)in(xa)n(xq

0ii

p

1ii

21

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

2

k k kk 21 2

k k k

1 2 z cos zH (z)

1 2 z cos z z z

Bài 1.Hàm truyền đạt của một bộ lọc số ở tần số formant Fk được cho bởi:

 trong đó , , T: chu kỳ lấy mẫu, : dải thông. 1.       Vẽ các điểm cực của Hk(z) trong mặt phẳng Z

2.        Viết phương trình sai phân mô tả quan hệ giữa tín hiệu ra yk(n) và tín hiệu vào xk(n)

3.        Vẽ sơ đồ khối của bộ lọc số này với 3 bộ nhân.4.        Bằng cách sắp xếp lại các số hạng của phương trình sai phân, vẽ sơ đồ khối của bộ lọc số chỉ có 2 bộ nhân

kTkz e

k k2 F T k2

22

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Bài 1.Hàm truyền đạt của một bộ lọc số ở tần số formant Fk được cho bởi:

 trong đó , , T: chu kỳ lấy mẫu, : dải thông. 

2

k k kk 21 2

k k k

1 2 z cos zH (z)

1 2 z cos z z z

kT

kz e k k2 F T k2

k

' 2 2 2 2 2k k k k k

1,2 k k k k

jk

| z | cos |z | |z | sin

p |z |cos j|z |sin

|z |e

  H(z) có 2 điểm cực là nghiệm của mẫu số:   

23

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

f

K

Dải thông

Fk

Bk

24

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

k

k Re(z)

Im(z)

|zk|

|zk|

p1

p2

25

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

a) Xác định biến đổi z của g(n): Tra bảng

26

Ph©n tÝch phæ tÝn hiÖu tiÕng Ph©n tÝch phæ tÝn hiÖu tiÕng nãinãi

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

2. 2. XöXö lý tÝn hiÖu tiÕng nãilý tÝn hiÖu tiÕng nãi

Bé läc Bé läc hiÖu hiÖu

chØnhchØnh

Bé läc Bé läc hiÖu hiÖu

chØnhchØnh

Cöa Cöa sæsæ

Cöa Cöa sæsæ

FFTFFTFFTFFT

LogLog1010|.|.||

LogLog1010|.|.||H(z)=1-az-1

a = 0,95..0,98

Hamming

27

x’(n)= x(n).w(n)

X’(f) = X(f) * W(f)

28

s(n) = h(n) * e(n) S() = H().E()

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Xö lý ®ång h×nh Xö lý ®ång h×nh (homomorphisme) (homomorphisme)

log[S()]= log[H()]+ log[E()]

FFT-1{log[S()]}=FFT-1{log[H()]}+ FFT-1{log[E()]}FFT-1{log[S()]}: cepstrum:

FFT-1{log[H()]}: thông tin vê`h(n): FFT-1{log[E()]}: thông tin vê`nguô`n:

s(n)

h(n)

e(n)

29

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

S¬ ®å khèi xö lý ®ång h×nh

Bé läc hiÖu

chØnh

Bé läc hiÖu

chØnh

Cöa sæ

Cöa sæ

FFTFFT

Log10|.|

Log10|.|

FFT-1FFT-1

c(n)

FFT

?

30

T0

h(n)

ˆˆ ˆs(n) h(n) e(n)

31

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Tiªn ®o¸n tuyÕn tÝnh (Linear

Prediction Coding)

Tiªn ®o¸n

p

1ii )in(xa)n(x

p

1ii )in(xa)n(x

Sai sè tiªn ®o¸n

)n(x)n(x)n(e )n(x)n(x)n(e

Sai sè b×nh ph ¬ng toµn phÇn

n

2 )n(eE n

2 )n(eE

Tèi thiÓu ho¸ sai sè

p,...,2,1i,0aE

i

p,...,2,1i,0aE

i

M« h×nh toµn ®iÓm cùc

)n(u)in(xa)n(xp

1ii

)n(u)in(xa)n(xp

1ii

32

22.. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

X¸c ®Þnh tÇn sè c¬ b¶n Fo

Giäng nam: 80 .. 250 Hz. Giäng n÷: 150..500 Hz

X¸c ®Þnh

Fo

X¸c ®Þnh

Fo

§¸nh gi¸

kÕt qu¶

§¸nh gi¸

kÕt qu¶

TiÒn

xö lý

TiÒn

xö lý

Mét sè ph ¬ng ph¸p x¸c ®Þnh Fo Dùa vµo hµm tù t ¬ng quan

Dùa vµo hµm vi sai biªn ®é trung b×nh

Dïng bé läc ®¶o vµ hµm tù t ¬ng quan

Xö lý ®ång h×nh

33

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm tù t ¬ng quan

1

1

( ) ( ) ( ) 0,1,..., N k

n

r k x n x n k k K

Fs = 10 kHz, N = 300, K = Fs = 10 kHz, N = 300, K =

150150

T×m cùc ®¹i trong kho¶ng T×m cùc ®¹i trong kho¶ng (0, K)(0, K)

34

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm tù t ¬ng quan

H¹n chÕ, lo¹i bá |x|<CH¹n chÕ, lo¹i bá |x|<CLL

35

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm vi sai biªn ®é trung b×nh (Average Magnitude Difference Function) (1)

( ) 0, 0,1,... D iP i 1/ 21 1

2

0 0

1 1( ) ( )

N N

n n

u n u nN N

2

1/ 2

1( ) [ ( ) ( )]

2[ (0) ( )] 0,1,...,1

1/2N-1

n=0

D k x n x n kNr r k k K

ví i

KkknxnxkDkN

n

,...,1,0 )()()(1

1

36

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm vi sai biªn ®é trung b×nh (Average Magnitude Difference Function) (2)

1000 1050 1100 1150 1200 1250

-0.25

-0.2

-0.15

-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25

x(n)

n50 100 150 200

0

10

20

30

40

50

D(k

)

k

1000 1050 1100 1150 1200 1250

-0.25

-0.2

-0.15

-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25

x(n)

n50 100 150 200

0

10

20

30

40

50

D(k

)

k

37

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Dïng bé läc ®¶o (Simplified Inverse Filter Tracking)(Simplified Inverse Filter Tracking)

Th«ng Th«ng thÊpthÊp

Th«ng Th«ng thÊpthÊp

Th«ng thÊp

Th«ng thÊp

1-z-11-z-1W(n)W(n)

LPC(p=4)

LPC(p=4)

A(z)A(z) Hµm tù t ¬ng quan

Hµm tù t ¬ng quan

T×m cùc ®¹iT×m cùc ®¹iNéi suyNéi suy§¸nh gi¸ kÕt qu¶§¸nh gi¸ kÕt qu¶

FoFo

HT/HT/VTVT

10kH10kHzz

47004700HzHz

900H900Hzz

38

39

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Xö lý ®ång h×nh

40

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Xö lý ®ång h×nh

X¸c ®Þnh formant (1)

Bé läc hiÖu

chØnh

Bé läc hiÖu

chØnh

Cöa sæ

Cöa sæ

FFTFFT

Log10|.|

Log10|.|

FFT-1FFT-1 FFTFFT

Wc(n)

41

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Xö lý ®ång h×nh

X¸c ®Þnh formant (1)

42

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Tiªn ®o¸n tuyÕn tÝnh (LPC)

FFkk,B,Bkk

s(ns(n))

Bé läc

hiÖu chØnh

Bé läc

hiÖu chØnh

Cöa sæ

Cöa sæ

TÝnh h.s.

ai

TÝnh h.s.

ai

TÝnh1/ |A(ej)|

b»ng FFT

TÝnh1/ |A(ej)|

b»ng FFT

T×m

cùc ®¹i

T×m

cùc ®¹i

TÝnh nghiÖm

cña A(z)

TÝnh nghiÖm

cña A(z)

QuyÕt ®Þnh

QuyÕt ®Þnh

X¸c ®Þnh formant (2)

43

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

3. 3. M· ho¸ tiÕng nãiM· ho¸ tiÕng nãi

D·y thao t¸c m· ho¸ vµ gi¶i m·D·y thao t¸c m· ho¸ vµ gi¶i m·

M· ho¸M· ho¸F1F1 ADAD

Gi¶i m·

Gi¶i m·

DADA F2F2

NhiÔu, suy gi¶m,sai sè

NhiÔu, suy gi¶m,sai sè

44

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Mét sè tÝnh chÊt thèng kª cña Mét sè tÝnh chÊt thèng kª cña tÝn hiÖu tiÕng nãitÝn hiÖu tiÕng nãi MËt ®é x¸c suÊt N : sè l îng mÉu x(n)

cã biªn ®é trong kho¶ng [-/2, +/2] n[-N,...,N] x egodic vµ dõng

0

( ) lim[ /(2 1)]xN

p N N

45

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Gi¸ trÞ trung b×nh vµ ph ¬ng sai• Gi¸ trÞ trung b×nh cña tÝn hiÖu

dõng

víi tÝn hiÖu tiÕng nãi, gi¶ thiÕt x = 0

• Ph ¬ng sai

1( )d lim ( )

2 1

N

x xN

n N

p x nN

2 2 21( )d lim ( )

2 1

N

x xN

n N

p x nN

46

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö tøc thêi (kh«ng nhí)L îng tö tøc thêi (kh«ng nhí)• LuËt l îng tö y = Q(x) ® îc ®Þnh nghÜa:

(L+1) møc tÝn hiÖu x(0), x(1), ..., x(L)

L møc l îng tö ho¸

• Mçi møc l îng tö ho¸ biÓu diÔn b»ng tõ b bit L = 2b.

• Sai sè l îng tö (t¹p ©m l îng tö) e = Q(x) - x• B íc l îng tö : hiÖu 2 møc tÝn hiÖu kÒ nhau

(i) = x(i)-x(i-1)• Th«ng l îng I = bFs (bit/s). Fs : tÇn sè lÊy

mÉu

47

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Thông lượng (1)• Tín hiệu lượng tử 8 bit (256 mức), Fs = 8

kHz Thông lượng = 64 kbit/s

• Tín hiệu lượng tử 16 bit (65536 mức), Fs = 16 kHz Thông lượng = 256 kbit/s ,

1 giờ tiếng nói 100 Mbyte

• Cần phải mã hoá tín hiệu tiếng nói (MPEG,

GSM, G723, ...) để truyền tiếng nói trên mạng hoặc lưu trữ

48

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Thông lượng (2)

Tần số lấy mẫu (kHz)

Số bit cho 1 mẫu

Thông luợng kbit/s

Dung lượng / phút

(kbyte)Lĩnh vực

48 16 768 11520 Ghi âm chuyên nghiệp

44,1 16 705,6 10584 CD Audio

32 16 512 7680 Radio FM

22 8 264 3960 Radio AM

8 8 64 960 Điện thoại

49

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®Òu• Tæng qu¸t, b íc l îng tö lµ hµm cña biªn ®é

tÝn hiÖu x (l îng tö kh«ng ®Òu) ®¬n gi¶n nhÊt lµ l îng tö ®Òu.

• Møc l îng tö ® îc chän gi÷a 2 møc tÝn hiÖuy(i) = (1/2)[x(i-1)+x(i)]

• LuËt l îng tö ®Òu vµ ®èi xøng ®Æc tr ng bëi:- c¸c møc b·o hoµ xs

- møc l îng tö L hoÆc (L+1) = 2b.

• B íc l îng tö = 2xs/L

50

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®ÒuL = 9

51

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®ÒuL = ?

0 2 4 6 8 10 12 14-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

0 2 4 6 8 10 12 14-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

52

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®ÒuL = 16

0 2 4 6 8 10 12 14-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

0 2 4 6 8 10 12 14-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

53

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®Òu

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-0.2

0

0.2Quantification Error

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-0.2

0

0.2Quantification Error

54

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

C¸c tÝnh chÊt l îng tö ®ÒuC¸c tÝnh chÊt l îng tö ®Òu• MËt ®é x¸c suÊt sai sè l îng tö

ph©n bè ®Òu gi÷a -/2 vµ + -/2

• Trung b×nh t¹p ©m l îng tö = 0• Ph ¬ng sai

( ) ( ), ( 1) / 2 e xi

p p i L

/ 22 2 2

/ 2

/ d /12e

( ) ( ), ( 1) / 2 e xi

p p i L

( ) 1/ , / 20, / 2

ep

55

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

C¸c tÝnh chÊt l îng tö ®ÒuC¸c tÝnh chÊt l îng tö ®Òu• Tû sè tÝn hiÖu trªn nhiÔu

2

210lg (d B) 6,02 4,77 20lgx s

xe

xSN b

max4 (d B) 6 7,3NÕu sx SN b

Víi b 6, t¨ng 6 dB mçi khi t¨ng 1 bit l îng tö

§Ó cã chÊt l îng thÝch hîp cÇn cã b 11

56

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Tỷ số tín hiệu trên nhiễu

s

n

dB 10

WNSN

N W

SN 10log SN

¨ng l î ng tÝn hiÖu¨ng l î ng nhiÔu

dB 10

BiSN 20log

Bi

ªn ®é tÝn hiÖuªn ®é nhiÔu

Hoặc

57

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Tỷ số tín hiệu trên nhiễuNăng lượng SN (dB)

Tín hiệu = Nhiễu 0

Tín hiệu = 2 Nhiễu 2

Tín hiệu = 10 Nhiễu 10

Tín hiệu = 100 Nhiễu 20

Tín hiệu = 1000 Nhiễu 30

Tín hiệu = 10N Nhiễu N x 10

58

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö logaritL îng tö logarit• Sau khi lÊy logarit biªn ®é tÝn hiÖu sÏ m·

ho¸ tuyÕn tÝnh

log[]log[] Q[]Q[] M· ho¸M· ho¸

signe[]signe[]

x(n) c(n)

y(n)

y'(n)

exp[]exp[]Gi¶i m·

Gi¶i m·

signe[x(n)]

c’(n)

x'(n)x'(n)

59

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö logaritL îng tö logarit• Hai gi¶i ph¸p dïng cho ®iÖn tho¹iHai gi¶i ph¸p dïng cho ®iÖn tho¹iLuËt LuËt (dïng ë Mü) (dïng ë Mü)

log(1 )

log(1 )

xy

LuËt LuËt AA (dïng ë (dïng ë ch©u ¢u)ch©u ¢u)1 log

1 log

A xy

A

255 87,56 A

8 bit logarit ~ 12 bit l îng tö 8 bit logarit ~ 12 bit l îng tö ®Òu®Òu

60

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö thÝch nghiL îng tö thÝch nghi• B íc l îng tö tuú thuéc vµo biªn ®é tÝn hiÖu B íc l îng tö tuú thuéc vµo biªn ®é tÝn hiÖu

ThÝch nghi tr ícThÝch nghi tr ícy(n)y(n)

Q[]Q[] M· ho¸M· ho¸x(n)x(n)

c(n)c(n)ThÝch nghi

®é k.®¹i

ThÝch nghi

®é k.®¹iG(nG(n))

G(nG(n))

y(n)

y'(n)

Gi¶i m·

Gi¶i m·

c’(nc’(n))

::ˆ

ˆ y'(n)x'(n)=

G'(n)G’(n)G’(n)

61

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö thÝch nghiL îng tö thÝch nghi ThÝch nghi sauThÝch nghi sau

Q[]Q[] M· ho¸M· ho¸x(n)x(n)

c(n)c(n)

y(n)y(n)

ThÝch nghi

®é k.®¹i

ThÝch nghi

®é k.®¹i

G(nG(n))

y(n)

y'(n)

Gi¶i m·

Gi¶i m·

c’(nc’(n))

::ˆ

ˆ y'(n)x'(n)=

G'(n)

G’(n)G’(n) ThÝch nghi

®é k.®¹i

ThÝch nghi

®é k.®¹i

62

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

M· ho¸ vi sai (DPCM) M· ho¸ vi sai (DPCM) L îng tö ho¸ L îng tö ho¸

63

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Một số chuẩn mã hoá âm thanh/tiếng nói• G.721 : ADPCM, 32 kbps, 4bits, 8kHz• G.722 : ~ADPCM, 48 đến 64 kbps,• G.723 : ~ADPCM, 24 kbps, 3 bits, 8kHz• G.728 : 16 Kbps• GSM : điện thoại di động, 13 kbps• Linear Predictive Encoding (Xerox), 5 kbps• Code Excited Linear Prediction (CELP)• Digital Video Interactive : ~ADPCM, 4 đến 8 bits• VoIP: G723.1 (6.4kbits/s), G728, G729 (8kbits/s)

Recommended