Upload
others
View
9
Download
1
Embed Size (px)
Citation preview
UVOD U KODOVANJE GOVORA
Prof. dr Vlado Delić novembar 2013.
Sistemi prenosa signala
Regeneracija vs. pojačanje
Појачавач
Регенератор
R
Cilj: Iskoristiti prednosti digitalnog prenosa i
efikasno iskoristiti raspoloživi propusni opseg.
Digitalizacija telefonije
1890-
1970-
1980-
1990-
1990-
1990-
300 – 3400 Hz
64 kbit/s
13 kbit/s
Kako preneti što više razgovora?
Kodovanje (kompresija) govora
Digitalizovani govorni signal
reprezentujemo sa što manje bita
◦ uz održanje nekog nivoa kvaliteta govora
Od koliko bit/s se polazi?
◦ Koliki je frekvencijski opseg govora?
◦ Koja je fs i br. bita za kvantizaciju govora?
Kolika se kompresija može postići?
◦ Koliko se fonema izgovori u sekundi?
◦ Koliko bita treba za kodovanje azbuke?
64 ili 128 kbit/s.
50-100 bit/s.
Informacioni sadržaj govora
Redundantnost u govornom signalu.
Motivi za razvoj kodovanja govora
Digitalizaciju telefonije pratila pojava
◦ mobilne telefonije – GSM
◦ telefonije preko Interneta – VoIP
Napredak nauke i tehnologije
◦ psihoakustika (šta i kako uho čuje)
◦ digitalna obrada signala i mikroprocesori
◦ računari i ICT
Topologija VoIP sistema
- Internet Telephony Service Provider - Internet Service Provider - Organizacija
Kašnjenje u telefoniji
Kašnjenje diktira mreža
Mnogo uzroka ◦ gleda se zbirno kašnjenje
Do 150ms idealno
Do 400ms se toleriše
Preko 400ms neprihvatljiv kvalitet govora ◦ polu-duplex komunikacija
◦ izražen eho
ITU’s G.114 preporuka
◦ kašnjenje u jednom smeru ispod 150 ms
Tolerancija na kašnjenje
Kašnjenje u
ms
%
slušalaca
za koje je
kvalitet
zvuka
prihvatljiv
100 200
100%
OK Marginal Neprihvatljivo
Kašnjenje VoIP paketa
Kodek vrši A/D i D/A konverziju govora
Kodek obuhvata i kompresiju govora
IP mreža unosi dvostruko kašnjenje:
◦ propagaciono (na većim udaljenostima)
◦ usled čekanja u redu (ruteri, Gateway)
Kašnjenje usled eliminacije džitera
Upotreba modema povećava kašnjenje
Spora obrada PC procesorom
Uzroci kašnjenja VoIP paketa
Kašnjenje kodovanja
Propagaciono
kašnjenje
Kašnjenje zbog cekanja u
redu
Kašnjenje
dekodovanja
Dedziter kašnjenje
Internet
Mrežni džiter
Paketi putuju različitim putanjama
◦ sačekuju se i ređaju u prijemni bafer
Baferom se džiter konvertuje u
◦ fiksno kašnjenje ili izgubljeni paket
Kašnjenje (dužina bafera) diktira odnos
prispelih i izgubljenih paketa
Kašnjenje dedžiter bafera
◦ tipično: 50-200ms
◦ moguća adaptivna promena kašnjenja
Vrednosti kašnjenja paketa
Izvor kašnjenja Prosečna vrednost za Phone-Phone (ms)
Snimanje na predajnoj strani 10-40
Codec (Kodovanje) 5-10
Kompresija 5-10
Predajni modem 0
Inernet 70-120
Prijemni modem 0
Jitter Buffer 50-200
Dekompresija 5-10
Codec (Dekodovanje) 5-10
Reprodukcija 0
Ukupno 150-400
Izvor: Hitachi semiconductors America Inc.
Poništavanje eha
Eho postoji u telefonskim mrežama
◦ malo kašnjenje (50ms) ne smeta
◦ kašnjenje u VoIP sistemu 150-400ms
eho je veoma izražen i ometa razgovor
neophodno poništavanje eha
Хи
бр
ид
Канал
Говорник A Хи
бр
ид
Канал
Говорник Б
+
Ад
апти
вни
фи
лта
р
+
Ад
апти
вни
фи
лта
р
kx
ky
ky ke
Poništavanje eha
Posebna kola postavljena na Gateway
◦ digitalni filtar (ITU-T G.165)
Lokalna telefonska
centrala
Lokalna telefonska
centrala
Kola za poništavanje eha
PSTN
IP Gateway IP Gateway
Internet
Prenosna karakteristika telefonskog
kanala Dozvoljeno amplitudsko izobličenje
◦ ITU-T preporuka
-2
0
5
300020001000
Slabljenje
[dB]
f [Hz]
Uticaj BER na prenos govora
BER – bit error rate
◦ prosečan broj pogrešno primljenih bita
◦ zavisi od šuma, i.s.i. i dr. izobličenja
◦ izražava kvalitet digitalnog prenosa signala
Pri prenosu govora PCM 64 kbit/s:
◦ BER < 10-6 - nečujno
◦ BER < 10-5 - zanemarljivo
◦ BER < 10-4 - izobličenja koja ponekad iritiraju
◦ BER < 10-3 - značajna izobličenja
Greške u prenosu
Prihvatljiv kvalitet govora za karakterističnu verovatnoću
greške (BER) današnjih mreža
Delovi mreže slabijeg kvaliteta (sa većim BER) mogu
značajno degradirati performanse govora
Zaštitno kodovanje
◦ Intra-paket
unošenje redudanse u okviru jednog IP paketa
◦ Extra-paket
unošenje redudanse između susednih IP paketa
◦ Do sada se retko koristilo u VoIP aplikacijama
može se premostiti gubitak paketa 10-20%
propusni opseg širi za 30%
Tehnički zahtevi IP telefonije
Detekcija DTMF signala ◦ standard u računarskoj telefoniji
◦ kompresija i paketizacija oštećuju DTMF sig.
◦ Gateway prepoznaje DTMF cifru i šalje je posebnim kanalom, RFC 2833 (H.323 v.4)
Potiskivanje pauze ◦ u full-duplex komunikaciji, 36-40% predstavlja
koristan signal, a ostatak je pauza
◦ potiskivanje pauze (sillence suppression)
◦ kada nastupi pauza, ne generišu se IP paketi
◦ na prijemu se reprodukuje tišina
OSOBINE I PODELA KODERA GOVORA
Kako se vrši kodovanje govora
Algoritam: niz koraka i operacija
◦ skup instrukcija za izvršenje zadatka
◦ definisana računska procedura
transformiše ulazne u izlazne vrednosti
Implementacija
◦ softverska ili
◦ hardverska
Ciljevi kodovanja govora
Maksimizacija percipiranog kvaliteta
◦ za odabranu bitsku brzinu ili
Minimizacija bitske brzine
◦ za određeni percipirani kvalitet govora
Prikladna bitska brzina zavisi od
◦ zahtevanog kvaliteta govora
◦ cene prenosa ili memorije
◦ cene i kompleksnosti govornog kodera
bitne kako za prenos tako i za snimanje
Poželjne osobine kodera govora...
Mala bitska brzina
◦ manji propusni opseg za prenos
◦ manje mesta na medijumu za čuvanje
u koliziji sa drugim dobrim osobinama kodera
Visok kvalitet govora
◦ dekodovani govor prihvatljivog kvaliteta
za ciljnu primenu
◦ ocene percipiranog kvaliteta:
razumljivost, prirodnost, prijatnost govora, prepoznatljivost govornika
Teži se kompromisu i uravnoteženosti između konfrontiranih zahteva.
...Poželjne osobine kodera...
Robusnost u odnosu na različite govornike/jezike
◦ poželjan dovoljno uopšten algoritam
da adekvatno modeluje različite govornike (muški, ženski i dečiji glas) i različite jezike
teško jer svaki govorni signal ima jedinstvene karakteristike
Robusnost u prisustvu kanalnih grešaka
◦ važna za sisteme prenosa gde kanalne greške imaju primetan uticaj na kvalitet govora
Dobre performanse sa negovornim signalima
◦ tonsko biranje, muzički signali (prisutni u govornom kanalu) bar da ne generiše iritirajuće artefakte
...Poželjne osobine kodera
Mala zauzetost memorije i mala računska kompleksnost
◦ cena implementacije mora biti niska (da bi koder bio praktičan)
količina memorije potrebne za njegov rad
računska zahtevnost
Malo kašnjenje pri kodovanju
◦ od ulaska govornog signala u koder do izlaska sintetizovanog govora iz dekodera
◦ presudno za razgovor u realnom vremenu
druga kašnjenja: propagacija, redovi čekanja na ruterima, dedžiter bafer na prijemu
Klasifikacija kodera govora
Klasifikacija po bitskoj brzini Klasifikacija po tehnici kodovanja
Kategorija Bitske brzine
velika > 15 kbit/s
srednja 5-15 kbit/s
mala 2-5 kbit/s
veoma mala < 2 kbit/s
Koderi koji koriste talasni oblik signala (PCM, ADPCM)
◦ pokušava da sačuva originalni talasni oblik signala (32 kbit/s)
isti za bilo koju vrstu signala
Parametarski koderi (LPC)
◦ modelovan govorni signal
◦ estimira parametre (2-5 kbit/s)
nisu za negovorne signale
Hibridni koderi (CELP)
◦ dodatni parametri modela približavaju ga talasnom obliku
mera je signal greške
Smanjenjem brzine ispod
određenog praga kvalitet dekodovanog govora
drastično će se smanjiti.
G. 711 64 kbps
Primeri
kodovanja
govora
i muzike
ADPCM 32 kbps
G. 728 16 kbps
G. 729 8 kbps
CELP 4.8 kbps
LPC 2.4 kbps
Govor
Muzika
Bit Errors
0.1%
Bit Errors
1%
GSM 13 kbps
Algoritam MOSPropusni
opsegMIPS
Kašnjenje
(msec)
PCM4,11 64 kbit/s n/a 0,25
ADPCM
(G.726)3,85 32 kbit/s 10 0,25
CS-ACELP
(G.729)3,92 8 kbit/s 30 25
LD-CELP
(G.728)3,61 16 kbit/s 40 1,25
MP-MLQ
(G.723.1)n/a 5,3/6,3 kbit/s 30 67,5
Pitanja – kodovanje govora
Zašto je bolji digitalni od analognog prenosa signala?
Sa koliko bita se standardno koduje govorni signal? ◦ Na koliko bita se kodovanjem/
kompresijom može svesti potreban broj bita u sekundi? Objasniti.
Kolika je količina informacije na pojedinim nivoima govorne komunikacije?
Koliko kašnjenje se može tolerisati u telefoniji? ◦ Koji su sve uzroci kašnjenja
govornog signala u telefoniji?
Koji su osnovni ciljevi kodovanja govora?
Nabrojati poželjne osobine kodera govora i o svakoj napisati po nešto.
Podela kodera govora po kodnoj brzini (primeri).
Podela kodera govora po tehnici kodovanja (primeri).
Koja vrsta kodera govora najviše degradira prenos muzičkih signala?
UVOD U KODOVANJE GOVORA
Prof. dr Vlado Delić novembar 2013.