30
UVOD U KODOVANJE GOVORA Prof. dr Vlado Delić novembar 2013.

UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

  • Upload
    others

  • View
    9

  • Download
    1

Embed Size (px)

Citation preview

Page 1: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

UVOD U KODOVANJE GOVORA

Prof. dr Vlado Delić novembar 2013.

Page 2: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Sistemi prenosa signala

Page 3: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Regeneracija vs. pojačanje

Појачавач

Регенератор

R

Cilj: Iskoristiti prednosti digitalnog prenosa i

efikasno iskoristiti raspoloživi propusni opseg.

Page 4: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Digitalizacija telefonije

1890-

1970-

1980-

1990-

1990-

1990-

300 – 3400 Hz

64 kbit/s

13 kbit/s

Kako preneti što više razgovora?

Page 5: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Kodovanje (kompresija) govora

Digitalizovani govorni signal

reprezentujemo sa što manje bita

◦ uz održanje nekog nivoa kvaliteta govora

Od koliko bit/s se polazi?

◦ Koliki je frekvencijski opseg govora?

◦ Koja je fs i br. bita za kvantizaciju govora?

Kolika se kompresija može postići?

◦ Koliko se fonema izgovori u sekundi?

◦ Koliko bita treba za kodovanje azbuke?

64 ili 128 kbit/s.

50-100 bit/s.

Page 6: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Informacioni sadržaj govora

Redundantnost u govornom signalu.

Page 7: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Motivi za razvoj kodovanja govora

Digitalizaciju telefonije pratila pojava

◦ mobilne telefonije – GSM

◦ telefonije preko Interneta – VoIP

Napredak nauke i tehnologije

◦ psihoakustika (šta i kako uho čuje)

◦ digitalna obrada signala i mikroprocesori

◦ računari i ICT

Page 8: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Topologija VoIP sistema

- Internet Telephony Service Provider - Internet Service Provider - Organizacija

Page 9: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Kašnjenje u telefoniji

Kašnjenje diktira mreža

Mnogo uzroka ◦ gleda se zbirno kašnjenje

Do 150ms idealno

Do 400ms se toleriše

Preko 400ms neprihvatljiv kvalitet govora ◦ polu-duplex komunikacija

◦ izražen eho

ITU’s G.114 preporuka

◦ kašnjenje u jednom smeru ispod 150 ms

Page 10: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Tolerancija na kašnjenje

Kašnjenje u

ms

%

slušalaca

za koje je

kvalitet

zvuka

prihvatljiv

100 200

100%

OK Marginal Neprihvatljivo

Page 11: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Kašnjenje VoIP paketa

Kodek vrši A/D i D/A konverziju govora

Kodek obuhvata i kompresiju govora

IP mreža unosi dvostruko kašnjenje:

◦ propagaciono (na većim udaljenostima)

◦ usled čekanja u redu (ruteri, Gateway)

Kašnjenje usled eliminacije džitera

Upotreba modema povećava kašnjenje

Spora obrada PC procesorom

Page 12: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Uzroci kašnjenja VoIP paketa

Kašnjenje kodovanja

Propagaciono

kašnjenje

Kašnjenje zbog cekanja u

redu

Kašnjenje

dekodovanja

Dedziter kašnjenje

Internet

Page 13: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Mrežni džiter

Paketi putuju različitim putanjama

◦ sačekuju se i ređaju u prijemni bafer

Baferom se džiter konvertuje u

◦ fiksno kašnjenje ili izgubljeni paket

Kašnjenje (dužina bafera) diktira odnos

prispelih i izgubljenih paketa

Kašnjenje dedžiter bafera

◦ tipično: 50-200ms

◦ moguća adaptivna promena kašnjenja

Page 14: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Vrednosti kašnjenja paketa

Izvor kašnjenja Prosečna vrednost za Phone-Phone (ms)

Snimanje na predajnoj strani 10-40

Codec (Kodovanje) 5-10

Kompresija 5-10

Predajni modem 0

Inernet 70-120

Prijemni modem 0

Jitter Buffer 50-200

Dekompresija 5-10

Codec (Dekodovanje) 5-10

Reprodukcija 0

Ukupno 150-400

Izvor: Hitachi semiconductors America Inc.

Page 15: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Poništavanje eha

Eho postoji u telefonskim mrežama

◦ malo kašnjenje (50ms) ne smeta

◦ kašnjenje u VoIP sistemu 150-400ms

eho je veoma izražen i ometa razgovor

neophodno poništavanje eha

Хи

бр

ид

Канал

Говорник A Хи

бр

ид

Канал

Говорник Б

+

Ад

апти

вни

фи

лта

р

+

Ад

апти

вни

фи

лта

р

kx

ky

ky ke

Page 16: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Poništavanje eha

Posebna kola postavljena na Gateway

◦ digitalni filtar (ITU-T G.165)

Lokalna telefonska

centrala

Lokalna telefonska

centrala

Kola za poništavanje eha

PSTN

IP Gateway IP Gateway

Internet

Page 17: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Prenosna karakteristika telefonskog

kanala Dozvoljeno amplitudsko izobličenje

◦ ITU-T preporuka

-2

0

5

300020001000

Slabljenje

[dB]

f [Hz]

Page 18: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Uticaj BER na prenos govora

BER – bit error rate

◦ prosečan broj pogrešno primljenih bita

◦ zavisi od šuma, i.s.i. i dr. izobličenja

◦ izražava kvalitet digitalnog prenosa signala

Pri prenosu govora PCM 64 kbit/s:

◦ BER < 10-6 - nečujno

◦ BER < 10-5 - zanemarljivo

◦ BER < 10-4 - izobličenja koja ponekad iritiraju

◦ BER < 10-3 - značajna izobličenja

Page 19: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Greške u prenosu

Prihvatljiv kvalitet govora za karakterističnu verovatnoću

greške (BER) današnjih mreža

Delovi mreže slabijeg kvaliteta (sa većim BER) mogu

značajno degradirati performanse govora

Zaštitno kodovanje

◦ Intra-paket

unošenje redudanse u okviru jednog IP paketa

◦ Extra-paket

unošenje redudanse između susednih IP paketa

◦ Do sada se retko koristilo u VoIP aplikacijama

može se premostiti gubitak paketa 10-20%

propusni opseg širi za 30%

Page 20: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Tehnički zahtevi IP telefonije

Detekcija DTMF signala ◦ standard u računarskoj telefoniji

◦ kompresija i paketizacija oštećuju DTMF sig.

◦ Gateway prepoznaje DTMF cifru i šalje je posebnim kanalom, RFC 2833 (H.323 v.4)

Potiskivanje pauze ◦ u full-duplex komunikaciji, 36-40% predstavlja

koristan signal, a ostatak je pauza

◦ potiskivanje pauze (sillence suppression)

◦ kada nastupi pauza, ne generišu se IP paketi

◦ na prijemu se reprodukuje tišina

Page 21: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

OSOBINE I PODELA KODERA GOVORA

Page 22: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Kako se vrši kodovanje govora

Algoritam: niz koraka i operacija

◦ skup instrukcija za izvršenje zadatka

◦ definisana računska procedura

transformiše ulazne u izlazne vrednosti

Implementacija

◦ softverska ili

◦ hardverska

Page 23: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Ciljevi kodovanja govora

Maksimizacija percipiranog kvaliteta

◦ za odabranu bitsku brzinu ili

Minimizacija bitske brzine

◦ za određeni percipirani kvalitet govora

Prikladna bitska brzina zavisi od

◦ zahtevanog kvaliteta govora

◦ cene prenosa ili memorije

◦ cene i kompleksnosti govornog kodera

bitne kako za prenos tako i za snimanje

Page 24: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Poželjne osobine kodera govora...

Mala bitska brzina

◦ manji propusni opseg za prenos

◦ manje mesta na medijumu za čuvanje

u koliziji sa drugim dobrim osobinama kodera

Visok kvalitet govora

◦ dekodovani govor prihvatljivog kvaliteta

za ciljnu primenu

◦ ocene percipiranog kvaliteta:

razumljivost, prirodnost, prijatnost govora, prepoznatljivost govornika

Teži se kompromisu i uravnoteženosti između konfrontiranih zahteva.

Page 25: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

...Poželjne osobine kodera...

Robusnost u odnosu na različite govornike/jezike

◦ poželjan dovoljno uopšten algoritam

da adekvatno modeluje različite govornike (muški, ženski i dečiji glas) i različite jezike

teško jer svaki govorni signal ima jedinstvene karakteristike

Robusnost u prisustvu kanalnih grešaka

◦ važna za sisteme prenosa gde kanalne greške imaju primetan uticaj na kvalitet govora

Dobre performanse sa negovornim signalima

◦ tonsko biranje, muzički signali (prisutni u govornom kanalu) bar da ne generiše iritirajuće artefakte

Page 26: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

...Poželjne osobine kodera

Mala zauzetost memorije i mala računska kompleksnost

◦ cena implementacije mora biti niska (da bi koder bio praktičan)

količina memorije potrebne za njegov rad

računska zahtevnost

Malo kašnjenje pri kodovanju

◦ od ulaska govornog signala u koder do izlaska sintetizovanog govora iz dekodera

◦ presudno za razgovor u realnom vremenu

druga kašnjenja: propagacija, redovi čekanja na ruterima, dedžiter bafer na prijemu

Page 27: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Klasifikacija kodera govora

Klasifikacija po bitskoj brzini Klasifikacija po tehnici kodovanja

Kategorija Bitske brzine

velika > 15 kbit/s

srednja 5-15 kbit/s

mala 2-5 kbit/s

veoma mala < 2 kbit/s

Koderi koji koriste talasni oblik signala (PCM, ADPCM)

◦ pokušava da sačuva originalni talasni oblik signala (32 kbit/s)

isti za bilo koju vrstu signala

Parametarski koderi (LPC)

◦ modelovan govorni signal

◦ estimira parametre (2-5 kbit/s)

nisu za negovorne signale

Hibridni koderi (CELP)

◦ dodatni parametri modela približavaju ga talasnom obliku

mera je signal greške

Smanjenjem brzine ispod

određenog praga kvalitet dekodovanog govora

drastično će se smanjiti.

Page 28: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

G. 711 64 kbps

Primeri

kodovanja

govora

i muzike

ADPCM 32 kbps

G. 728 16 kbps

G. 729 8 kbps

CELP 4.8 kbps

LPC 2.4 kbps

Govor

Muzika

Bit Errors

0.1%

Bit Errors

1%

GSM 13 kbps

Algoritam MOSPropusni

opsegMIPS

Kašnjenje

(msec)

PCM4,11 64 kbit/s n/a 0,25

ADPCM

(G.726)3,85 32 kbit/s 10 0,25

CS-ACELP

(G.729)3,92 8 kbit/s 30 25

LD-CELP

(G.728)3,61 16 kbit/s 40 1,25

MP-MLQ

(G.723.1)n/a 5,3/6,3 kbit/s 30 67,5

Page 29: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

Pitanja – kodovanje govora

Zašto je bolji digitalni od analognog prenosa signala?

Sa koliko bita se standardno koduje govorni signal? ◦ Na koliko bita se kodovanjem/

kompresijom može svesti potreban broj bita u sekundi? Objasniti.

Kolika je količina informacije na pojedinim nivoima govorne komunikacije?

Koliko kašnjenje se može tolerisati u telefoniji? ◦ Koji su sve uzroci kašnjenja

govornog signala u telefoniji?

Koji su osnovni ciljevi kodovanja govora?

Nabrojati poželjne osobine kodera govora i o svakoj napisati po nešto.

Podela kodera govora po kodnoj brzini (primeri).

Podela kodera govora po tehnici kodovanja (primeri).

Koja vrsta kodera govora najviše degradira prenos muzičkih signala?

Page 30: UVOD U KODOVANJE GOVORA - vtsns.edu.rsvtsns.edu.rs/wp-content/uploads/2013/12/MM2-4-Kodovanje-govornog-signala.pdf · Kodovanje (kompresija) govora Digitalizovani govorni signal reprezentujemo

UVOD U KODOVANJE GOVORA

Prof. dr Vlado Delić novembar 2013.