Reprezentacija Reprezentacija ii
obradaobrada zvukazvuka
Profesor:Profesor:
Milorad K.BanjaninMilorad K.Banjanin Student:Student: Milica RadmilovicMilica Radmilovic
Karakteristike zvuka
• priroda zvuka – mehaničko kretanje vazduha u prostoru tj. promena vazdušnog pritiska
Karakteristike zvuka• Konverzija fizičkih signala – Promena vazdušnog pritiska →električni signal
Izvor zvuka (mehaničke vibracije)
Talasanje vazduha (promene vazdušnog pritiska)
Senzor promene pritiska (mikrofon)
Električni signal (promenljivi napon)
Karakteristike zvuka• Konverzija fizičkih signala – električni signal →promena vazdušnog pritiska
Skladištenje zvuka• analogno – zvučni signal →električni signal →magnetni medijum / gramofonska ploča
• digitalno – zvučni signal →električni signal →digitalizacija →podaci →fajl
Digitalizacija zvuka• Digitalizacija predstavlja konverziju analognog signala...
• ...u digitalnu reprezentaciju 124 85 161 160 135 76 138 113 147 165 103 136 184 155
Digitalizacija zvuka
• Dve vrste aproksimacije– kontinualno vreme →diskretno vreme
– kontinualne vrednosti →diskretne vrednosti
Digitalizacija
Merenje vrednosti signala u tačno određenimvremenskim trenucima
Aproksimacija izmerenih vrednosti najbližim vrednostima iz konačnog skupa
Digitalizacija• Rezultat digitalizacije – niz kvantizovanih veličina izmerenih u pojedinim vremenskim trenucima124 85 161 160 135 76 138 113 147 165 103 136 184 155
• Rekonstrukcija polaznog signala na osnovu digitalne reprezentacije – rezultat se razlikuje od originala
Digitalizacija• PCM modulacija (pulse code modulation) 1. uzorkovanje 2. kvantizacija 3. kodovanje: reprezentacija pojedinih kvantizacionih nivoa binarnim brojevima
001010101110110110101100100100100101110111
Digitalizacija• DPCM modulacija (differential PCM) – kodira vrednost kao razliku u odnosu na prethodnu
Digitalizacija • Kada je rekonstruisani signal dovoljno dobar?
–Nyquist-Shannon teorema odabiranja: • frekvencija uzorkovanja mora biti najmanje dva puta veća od najviše frekvencije koju je potrebno očuvati
–primer 1: telefonska linija • namenjena za prenos ljudskog glasa • ljudski glas: 300 –3400 Hz • minimalna frekvencija bi bila: 6800 Hz • u praksi se koristi: 8000 Hz
–primer 2: CD audio • namenjen za skladištenje muzike • opseg koji ljudsko uho čuje: 20 –20000 Hz • minimalna frekvencija bi bila: 40000 Hz
• u praksi se koristi: 44100 Hz
Digitalizacija• Kada je rekonstruisani signal dovoljno dobar?
– gustina kvantizacionih nivoa • maksimalna greška kvantizacije za nivo kvantizacije širine a iznosi a/2
Digitalizacija
• Kada je rekonstruisani signal dovoljno dobar? – gustina kvantizacionih nivoa
• u praksi se ukupan broj kvantizacionih nivoa najčešće predstavlja kao stepen dvojke, tipično 28 ili 216
• 28= 256 nivoa –za skladištenje jednog uzorka potrebno je 8 bita
•216= 65536 nivoa –za skladištenje jednog uzorka potrebno je 16 bita
– primer 1: telefonska linija • frekvencija uzorkovanja: 8 kHz • 256 kvantizacionih nivoa →8 bita po uzorku • za kodiranje jedne sekunde signala potrebno je: 8000 (Hz) x 8 bita • brzina prenosa: 64 kbit/s
Digitalizacija
– primer 2: CD audio • frekvencija uzorkovanja: 44.1 kHz • 65536 kvantizacionih nivoa →16 bita po uzorku • za kodiranje jedne sekunde signala potrebno je: 44100 x 16 bita
• brzina prenosa: 705.6 kbit/s (CD audio je stereo –ima dva kanala, dakle sve ovo x2)
Obrada signala
• Izvođenje operacija nad signalom u cilju poboljšanja njegovih karakteristika
– npr. editovanje zvučnih zapisa, uklanjanje šuma
• Obrada signala u vremenskom domenu – koristi se “sirovim” PCM podacima
• Obrada signala u frekventnom domenu – koristi se reprezentacijom signala u frekventnom domenu
Obrada signala u vremenskom domenu • zvučni zapis se posmatra kao niz brojeva – svaki broj u nizu predstavlja kvantizovanu vrednost x[i] = 124 85 161 160 135 76 138 113 147 165 103 126 122 136 184 155
• sabiranje signala (miksovanje) z[i] = x[i] + y[i]
• množenje signala konstantom (utišavanje / pojačavanje) y[i] = A· x[i]
• množenje signala signalom –modulacija (izdvajanje fragmenata) z[i] = x[i] · y[i]
• pomeranje signala u vremenu (montaža) y[i] = x[i-N]
Obrada signala u vremenskom domenu
• Kombinacije osnovnih operacija – crossfade – echo – replicate – fade in/out
Obrada signala u vremenskom domenu
Frekventni domen
• Furijeova transformacija – za dati signal u vremenskom domenu izračunava njegovu reprezentaciju u frekventnom domenu
Frekventni domen• Inverzna Furijeova transformacija – za datu reprezentaciju u frekventnom domenu izračunava odgovarajući signal u vremenskom domenu
Frekventni domen • Furijeova transformacija
– značenje parametara: • t –vreme • s –frekvencija
signal f(t) se može predstaviti kao zbir sinusnih signala čije su amplitudedate sa F(s)
Frekventni domen
Frekventni domen• Furijeova transformacija
– rezultat Furijeove transformacije za dati signal može biti i beskonačno mnogo sinusnih komponenti
– ako zanemarimo neke sabirke, rezultat IFT će se razlikovati od originala
Frekventni domen• boja zvuka –karakteristika muzičkih instrumenata – određena oblikom funkcije u frekventnom domenu
Obrada signala u frekventnom domenu • Filteri
– pojačavanje / utišavanje pojedinih frekvencija (equalizer) • množenje signala u frekventnom domenu sa funkcijom koja definiše pojačavanje
Kompresija
• Lossless kompresija –bez gubitaka – iste metode kompresije kao i za rasterske slike
• Lossy kompresija –sa gubicima – mp3 – Ogg Vorbis
Kompresija• mp3
– mogućnosti za uvođenje “nečujnih” gubitaka: karakteristike ljudskog čula sluha
• zvukovi koje čovek ne čuje • zvukovi koje čovek čuje bolje nego druge • ako se dva zvuka čuju istovremeno, glasniji se čuje a tiši se nečuje
– delovi zvučnog zapisa se mogu eliminisati bez čujnih razlika
– faktor kompresije ~ 12
MIDI • Musical Instrument Digital Interface
– protokol za digitalnu komunikaciju muzičkih uređaja
• putem MIDI protokola ne prenosi se snimljeni zvuk, nego note koje će instrument odsvirati • instrumenti imaju karakteristične boje zvuka • izuzetno mali fajlovi ~ 50 KB za 5 minuta muzike
HVALA NA PAZNJI!!