19
Frekvencijska svojstva ljudskog uha Nina Marević & Branimir Dropuljić

Frekvencijska svojstva ljudskog uha

  • Upload
    leanna

  • View
    89

  • Download
    3

Embed Size (px)

DESCRIPTION

Frekvencijska svojstva ljudskog uha. Nina Marević & Branimir Dropulj ić. Kako čujemo?. - PowerPoint PPT Presentation

Citation preview

Page 1: Frekvencijska svojstva ljudskog uha

Frekvencijska svojstva ljudskog uha

Nina Marević & Branimir Dropuljić

Page 2: Frekvencijska svojstva ljudskog uha

Kako čujemo?

Nakon što su podražene osjetne slušne stanice dolazi do pretvaranja mehaničke energije zvuka u električni impuls koji se provodi putem slušnog živca i slušnog puta do moždane kore gdje nastaje svjesna percepcija zvuka.

Page 3: Frekvencijska svojstva ljudskog uha

Kako napraviti aproksimaciju ljudskog sluha na računalu?

Zvuk kojeg ljudsko uho čuje se kreće od 20-tak Hz do 20kHz.

Frekvencije ispod 20 ili iznad 20 kHz ne primjećujemo u prirodi i nije ih potrebno propuštati u programskom modelu.

Karakteristično je za ljudsko uho da ne čuje sve frekvencije jednako.

Selektivnost na najnižim je frekvencijama oko 100

Hz, ali na onim višim iznosi i više od 4 kHz

Page 4: Frekvencijska svojstva ljudskog uha

Kako napraviti aproksimaciju ljudskog sluha na računalu?

IDEJA: raspon frekvencija koje čovjek čuje razdijeliti u 30-ak pojaseva preko 30-ak filtara

Samo tu frekvencijsku skalu nećemo podijeliti linearno - nego prema mel-skali, jer ona više odgovara prirodnim karakteristikama ljudskog uha.

Veza mel skale s

frekvencijskom se definira kao:

Mel= 1127.01048 loge(1+f/700)

Page 5: Frekvencijska svojstva ljudskog uha

Kako smo osmislili sklop?

Algoritam:

projektiranje filtara logatiram anvelope energija svakog kanala primjena brzog kepstra na svaki uzorak zasebno decimiranje signala

Page 6: Frekvencijska svojstva ljudskog uha

Kako smo pisali kod?

prvi korak je projektiranje filtara u mel skali svi su filtri jednaki u frekvencijskoj skali vidimo da su selektiviniji

za niže frekvencije, a manje selektivni za više baš takva je i karakteristika ljudskog uha

Page 7: Frekvencijska svojstva ljudskog uha

Filtri

Svaki pojedini filtar konvoluiramo s istim Blackmannovim otvorom - da bi dobili glađi impulsni odziv jednake duljine za svaki filtar

Također ćemo y-os prikazati i u logaritamskom mjerilu

Page 8: Frekvencijska svojstva ljudskog uha

Filtri

U idealnom slučaju kad zbrojimo sve filtre po y-osi bi trebali dobiti svepropusni filtar iznosa jednakog koeficijentu preklapanja filtara.

Ali prvi i zadnji filtar imaju centre na samim rubovima, oni i nekoliko njima najbližih trokutastih filtara s kojima se preklapaju, nemaju potpun obllik trokuta, nego su “prekinuti”

Zato se javljaju propadi na početku i na kraju prikaza odstupanja.

Page 9: Frekvencijska svojstva ljudskog uha

Impulsni odzivi

Svi impulsni odzivi flitara zbrojeni bi trebali davati jedinični impulsni odziv, odnosno dirach u nuli.

Desna slika prikazuje koliko smo pogriješili, tj.

razliku Diracha i onoga što smo mi dobili.

Page 10: Frekvencijska svojstva ljudskog uha

Impulsni odzivi

Prvi filtar ima najširi i najniži impulsni odziv, te kao takav propušta niže frekvencije.

Zadnji filtar ima najuži i najviši impulsni odziv, te kao takav propušta više frekvencije.

Page 11: Frekvencijska svojstva ljudskog uha

Signal kojeg smo obrađivali

izgovor 6 samoglasnika "a", "e", "i", "o", "u", "з“

Frekvencija otipkavanja je 44 kHz

Page 12: Frekvencijska svojstva ljudskog uha

Izlaz pojedinih

filtara

Page 13: Frekvencijska svojstva ljudskog uha

Izlaz sklopa

kada pozbrojimo izlaze svih kanala - dobijemo opet izgovor gotovo identičan ulaznom signalu

ulazni signal zamisliti kao ono što nam neko kaže,a sumu, tj.izlazni signal -kao ono što naše uho čuje

preslušavajući sumu izlaza kanala primjećujemo da je razumljivost zadovoljavajuća

Page 14: Frekvencijska svojstva ljudskog uha

Izlaz sklopa

Za prikaz najpogodnija anvelopa od logaritma energije.

Signal se prvo kvadrira i kroz filtar (impulsni odziv veličine 1000 uzoraka, gladak)

Nakon konvolucije, signal se logaritmira, i množi s 10

Cilj je dodatno naglasiti niže frekvencijske komponente

Page 15: Frekvencijska svojstva ljudskog uha

Prikaz rezultata

Spektrogram - prikaz promjene frekvencijskih karakteristika signala u vremenu.

Visina (boja) je treća dimenzija spektrograma-koja prikazuje kolko je jako izražena pojedina frekvencija za pojedini uzorak.

smetnja gradske mreže niže frekvencije bolje

pokrivene

Page 16: Frekvencijska svojstva ljudskog uha

Dotjerivanje rezultata

promatramo jedan uzorak kakvim ga vide svaki od 31-og kanala

krivulja je izlomljena to nam ne odgovara –

uzrokuje grube prelaze u spektrogramu u smjeru y- osi.

glađenje primjenom kepstara

Page 17: Frekvencijska svojstva ljudskog uha

razlika log-en-spektara prije i nakon zaglađivanja – možemo uočiti da tamo gdje su bile najveće promjene, skokovi, na razlici slika su maksimumi

to znači da je zaglađivanje bilo uspješno

Page 18: Frekvencijska svojstva ljudskog uha

Nulti kepstar predstavlja DC-komponentu spektra, odnosno srednju vrijednost (energiju uzorka signala)

energije u trenutcima izgovora su znatno veće od energija u trenutcima tišine, stoga nam nulti kepstar može dobro poslužiti za detekciju govora

vrši se decimacija izlaznih signala po vremenu, (faktor decimacije takav da na kraju nemamo više od 10000 uzoraka)

Page 19: Frekvencijska svojstva ljudskog uha

Hvala na pažnji !!!