47
Különböző Különböző médiaelemek médiaelemek feldolgozása feldolgozása Összeállította Összeállította : : Kosztyán Zsolt Tibor Kosztyán Zsolt Tibor e-mail e-mail : [email protected], : [email protected], [email protected], [email protected], [email protected], [email protected], honlap honlap : http://vision.vein.hu/~kzst : http://vision.vein.hu/~kzst

Különböző médiaelemek feldolgozása

  • Upload
    loe

  • View
    31

  • Download
    0

Embed Size (px)

DESCRIPTION

Különböző médiaelemek feldolgozása. Összeállította : Kosztyán Zsolt Tibor e-mail : [email protected], [email protected], [email protected], honlap : http://vision.vein.hu/~kzst. Hangok – a hang fizikai jellemzői. Hang: Mechanikai rezgés, ami valamely anyagi közegben terjed. - PowerPoint PPT Presentation

Citation preview

Page 1: Különböző médiaelemek feldolgozása

Különböző Különböző médiaelemek médiaelemek feldolgozásafeldolgozása

Különböző Különböző médiaelemek médiaelemek feldolgozásafeldolgozása

ÖsszeállítottaÖsszeállította: : Kosztyán Zsolt TiborKosztyán Zsolt Tibore-maile-mail: [email protected],: [email protected],

[email protected],[email protected],[email protected],[email protected],

honlaphonlap: http://vision.vein.hu/~kzst: http://vision.vein.hu/~kzst

Page 2: Különböző médiaelemek feldolgozása

Hangok – a hang fizikai jellemzői

• Hang: Mechanikai rezgés, ami valamely anyagi közegben terjed.

• Hangsebesség: A hangrezgéseknek a vivőközegben való terjedési sebessége.

Page 3: Különböző médiaelemek feldolgozása

Hangok – a hang érzékelése

• A hallható hang: 16Hz – 20 kHz (életkor függő)

• 16Hz alatt infrahang• 20kHz felett ultrahang

Page 4: Különböző médiaelemek feldolgozása

Akusztikai alapfogalmak

• Akusztika: az emberi hallás jellemzőivel foglalkozik

• Hangerő (hangintenzitás): A hangrezgés amplitúdója – 1m2 –re eső, wattban mért hangteljesítmény. A hangerő mértékegysége az akusztikus decibel

Page 5: Különböző médiaelemek feldolgozása

Akusztikai alapfogalmak

• Akusztikus decibel: értéke alkalmazkodik az emberi hangérzékeléshez, a hangerő nagyság tízes alapú logaritmusának húszszorosával egyenes arányban lévő szám. A hallásküszöbnek a 0 decibel (dB) érték felel meg, míg a fájdalomküszöb értéke 120 dB.

Page 6: Különböző médiaelemek feldolgozása

A decibel skála akusztikai alapjai

• A hang tehát egy rugalmas közeg által közvetített mechanikai rezgés, hullám jelenség, térben terjedő rezgésállapot, energiatovábbítás. Közvetítő közegre szükség van, amely a periodikus összehúzódással és ritkulással ezt az energiát nyomásként közvetíti, miközben a közeg részecskéi a helyükön maradnak. A közegtől függően lég-, folyadék- és testhangokat különböztetünk meg.

• A rezgések, hullámjelenségek jellemzői között a hullámhosszúságot (, m), a közegtől függő terjedési sebességet (c, m/s) és a rezgési frekvenciát (f, 1/s) különböztetjük meg.

Page 7: Különböző médiaelemek feldolgozása

A decibel skála akusztikai alapjai• A leggyengébb hang, amelyet még az egészséges emberi

fül érzékelni tud 20 Pa nyomásingernek felel meg. Ez olyan kicsi, hogy hatására a dobhártya egy átlagos atom-átérőnek megfelelően mozdul ki (nm nagyságrend). Még meglepőbb, hogy ennek az értéknek a 106-szorosát is képesek vagyunk elviselni. Az első érték a hallhatósági, az utóbbi pedig az ún. fájdalomküszöb. Ilyen hatások között a lineáris Pa-skála meglehetősen kényelmetlen lenne, ezért a hangosság mértékéül az adott hangnak a hallhatósági küszöbhöz való viszonyát logaritmusos léptékben használjuk. Ez a decibel skála. Eszerint — figyelembe véve a 20 Pa küszöbértéket — a viszonylagos hangosság a hangnyomással kifejezve:

Lp=20 lg(P/P0), (dB)ahol: P — az aktuális hangnyomás, Pa,

P0 — pedig az 1000 Hz-hez tartozó küszöb hangnyomás értéke (20 Pa).

Page 8: Különböző médiaelemek feldolgozása

A decibel skála akusztikai alapjai

A zajszinteket sokszor azzal a hangteljesítménnyel is megadjuk, amely a hang terjedési irányában a teljes felületen időegység alatt áthaladó .hangintenzitást, energia sűrűséget jelenti (jele: W, mértékegysége: watt). Általános zajszint kifejezésre a hangintenzitást használjuk, amely a hangterjedés irányára merőleges, egységnyi felületen időegység alatt áthalad (jele: I, mértékegysége: W/m2). Ugyanúgy működik, mint a hangnyomás, de az egyenletben a nyomások négyzete szerepel, mert ez arányos az energiával vagy az intenzitással. A legkisebb és legnagyobb hangintenzitás érték az emberi fül átlagos érzékenységétől függ. 1000 Hz frekvencia esetén a legszélesebb ez a tartomány (szubjektív akusztika), itt a hallásküszöb 10-12 W/m2-nél, a fájdalomküszöb pedig l W/m2-nél található. A kisebb intenzitású hangokat küszöb alatti hangoknak, a nagyobbakat pedig szuperhangoknak nevezzük.

LI=10 lg(I/I0), (dB)ahol: I — az aktuális intenzitás, W/m2,

I0 — pedig a hallásküszöbhöz tartozó intenzitás értéke (10-12 W/m2).

Page 9: Különböző médiaelemek feldolgozása

Akusztikai alapfogalmak

• Hangmagasság: a hang frekvenciájától függő mennyiség

• Hangszín: az adott hangjel frekvenciatartományi viselkedése

Page 10: Különböző médiaelemek feldolgozása
Page 11: Különböző médiaelemek feldolgozása

A szubjektív akusztika és az A-

hangintenzitásszint • A hangosságérzet az ember szubjektív tulajdonsága.

Az emberi hallás erősen frekvenciafüggő és a frekvencia függvényében mért hangérzet különböző lehet. Átlagosan az 1 kHz frekvenciánál a legszélesebb az érzékelhető hangintenzitás-tartomány.

• A különböző szűrők a zajmérő műszereket képessé teszik arra, hogy az objektív érték helyett a szubjektív hangérzethez közeli értéket mutasson. Mivel az A-típusú szűrő közelíti legjobban az emberi hallás szubjektivitását, ezért a hangintenzitásokat ezzel mérjük és a kapott zajszinteket LA-val jelöljük és az értékét dBA-ban adjuk meg.

Page 12: Különböző médiaelemek feldolgozása

A hangok rögzítése• Analóg rögzítés• Digitális rögzítés

Page 13: Különböző médiaelemek feldolgozása

Analóg rögzítés és lejátszás

• Rögzítés:– A hangjel átalakítása rögzíthető, elektromos

jelformára, melyben a jel frekvenciái és intenzitásai megfelelnek az eredeti hangjelnek

– Az elektromos jel rögzítése

• Példa:– Elektromechanikus hangrögzítés– Mágneses hangrögzítés

Page 14: Különböző médiaelemek feldolgozása

Analóg rögzítés és lejátszás

• Lejátszás:– A rögzített jelek érzékelése, elektromos

jellé történő átalakítása– Az elektromos jel felerősítése és

visszaadása az eredeti hangjelhez hasonló alakban

Page 15: Különböző médiaelemek feldolgozása

Hangok digitális rögzítése és lejátszása

• Mintavételezés– A mintavételezési frekvencia értéke

legyen legalább kétszerese az eredeti analóg jelben előforduló legnagyobb frekvenciának (Shannon tétele).

• Kvantálás

Page 16: Különböző médiaelemek feldolgozása

MintavételezésMintavételezési

frekvenciaHasznált terület

8 kHz A telefontechnika használja

11,025 kHz1/4 CD-DA mintavételezési

frekvencia

22,1 kHz1/2 CD-DA mintavételezési

frekvencia

32 kHzMPEG Audio által használt mintavételezési frekvencia

44,1 kHz CD-DA mintavételezési frekvencia

48 kHzDigital Audio Tape, MPEG Audio, Dolby Digital mintavételezési frekvencia

Page 17: Különböző médiaelemek feldolgozása

Kvantálás• 8 bit = 256 jelszint, kb. 48 dB

hangerő tartomány• 16 bit = 65536 jelszint, kb. 96 dB

hangerő tartomány• 24 bit = 16777216 jelszint, kb.

144 dB hangerő tartomány

Page 18: Különböző médiaelemek feldolgozása

Mintavételezés és kvantálás

Page 19: Különböző médiaelemek feldolgozása

A digitalizált hangállományok

minőségének meghatározása

• Milyen hibával lehet a digitalizált hangállományból visszaállítani az eredeti analóg hanganyagot

Page 20: Különböző médiaelemek feldolgozása

A digitalizált hangállomány mérete

• A hangállomány méretét befolyásolja:

1. Mintavételezési frekvencia értéke2. A kvantálási hossz3. A rögzített csatornák száma

Page 21: Különböző médiaelemek feldolgozása

A digitalizált hangállomány mérete

  Mintavételezési frekvencia

Kvantálási hossz

11,025 kHz 22,05 kHz 44,1 kHz 48 kHz

8 bit 0,631 MB 1,262 MB 2,524 MB 2,747 MB

16 bit 1,262 MB 2,524 MB 5,048 MB 5,496 MB

24 bit 1,893 MB 3,786 MB 7,572 MB 8,241 MB

Pl 44 100 x 16 x 1 x 60 = 42 336 000 bit = 5 292 000

B= = 5,048 MB

1 perc hosszú, mono hangállomány hossza mintavételezési frekvencia és kvantálási hossz függvényében

Page 22: Különböző médiaelemek feldolgozása

A digitalizálás minősége

  Mintavételezési frekvencia

Kvantálási hossz

11,025 kHz 22,05 kHz 44,1 kHz

8 bitNagyon gyenge

(beszéd)

Közepes minőség (beszéd)

Jó minőség (beszéd zene)

16 bitElfogad-

ható (beszéd)

Jó (beszéd,

zene)

Hi-Fi minőség (beszéd, zene)

Page 23: Különböző médiaelemek feldolgozása

Fontosabb hangkártya szabványok

• AdLib szabvány: Bevezette az FM szintézist a PC hang előállításához. Ez lett a mono üzemmódban működő MIDI rendszer szabványa.

• SoundBlaster szabvány: Bevezette a digitális technika használatát a hangrögzítésben, megteremtette a hullámtáblázat használatának feltételeit. Sztereo üzemmódot ismerő szabvány.

Page 24: Különböző médiaelemek feldolgozása

Fontosabb hangkártya szabványok

• Roland MT-32 szabvány: Bevezette a 256 mintavételezett alaphangot tároló ROM-ot a hangkártyán.

Page 25: Különböző médiaelemek feldolgozása

MIDI – Musical Instrument Digital Interface

• Számítógép és az elektronikus hangszerek közti kommunikációt rögzíti– General MIDI szabvány:

• Hangszerek kiválasztása• Szólamok száma

Page 26: Különböző médiaelemek feldolgozása

Hangtömörítés• Pszichoakusztikus redundancia:

– Az ember nem hallja a nagy hangerejű hangfrekvenciákhoz közeli zajfrekvenciát. (Ez azonban csak egy szűk frekvenciasávra érvényes.)

– Az ember hallását zavarják azok a zajok, melyeknek frekvenciája közelében nincs hangfrekvencia.

• A pszichoakusztikus tömörítő eljárások részsávokra bontják a hallható hangfrekvencia sávot, és elemzik az egyes részsávok tartalmát.

Page 27: Különböző médiaelemek feldolgozása

Hangtömörítési eljárások

•Alapjuk a pszichoakusztikus redundancia csökkentése– MPEG Audio (Layer 1, Layer 2, Layer 3)– MPEG 2 AAC– MPEG 4– Dolby eljárások

• Dolby Stereo Digital• Dolby Surround Pro Logic

Page 28: Különböző médiaelemek feldolgozása

MPEG Audio• Mintavételezési frekvencia: 32;

44,1; 48 kHz– Mono– Joint stereo– Stereo

• Csatornánként a bitfolyam sebessége: 32 kb/s - 224 kb/s

Page 29: Különböző médiaelemek feldolgozása

MPEG Audio• Layer 1: Legegyszerűbb eljárás.

128 kb/s fölötti sebesség esetén használható (csatornánként)

• Layer 2: Közepes bonyolultságú eljárás. 128 kb/s körül használható– CD-ROM-on szinkronizált video és

hangrögzítés– Video CD-n videoállomány hangjának

rögzítése

Page 30: Különböző médiaelemek feldolgozása

MPEG Audio• Layer 3: a legbonyolultabb eljárás

Hangminőség Sávszélesség Üzemmód BitsebességTömörítési

arány

Telefon minőség

2,5 kHz Mono 8 kb/s 96:1

Rövidhullámú rádióadásnál

jobb4,5 kHz Mono 16 kb/s 48:1

Középhullámú rádióadásnál

jobb7,5 kHz Mono 32 kb/s 24:1

FM rádióadás minőség

11 kHz Sztereó 56 … 64 kb/s 26 … 24:1

Közel CD minőség

15 kHz Sztereó 96 kb/s 16:1

CD minőség > 15 kHz Sztereó112 … 128

kb/s14 … 12:1

Page 31: Különböző médiaelemek feldolgozása

MP3 Pro2001 júniusában a német Frauenhofer Gesellschaft, a francia Thomson és az amerikai RCA/Coding Technologies bejelentettek egy módszert, melynél 64 kbps kódolással elérik azt, amit a CD-kódolásnál csak 128 kbps-es kódolással érhető el. A Coding Technologies az új "Spectral Band Replication" (SBR) módszere, a magas hangok kódolásáért felelős, míg az alacsonyabb frekvenciák a hagyományos mp3 szerint kerülnek kódolásra. A kettő együtt adja az mp3PRO kódolás tulajdonságait. Miután az SBR rész csak néhány kbps-t igényel, hagyományos mp3 felvételek lejátszhatók az mp3PRO lejátszókon. Ezek az SBR részt figyelmen kívül hagyják. Fordítva természetesen nem, azaz hagyományos mp3 lejátszókon nem hallhatók az új kódolás tulajdonságai.

Page 32: Különböző médiaelemek feldolgozása

MPEG 2 AAC• Környezeti hangtér legalább 5

hangszóró– Mintavételezés: 8 kHz … 96 kHz– Kódolt részsávok száma: 1 … 48– Veszteséges (pszichoakusztikus) +

veszteségmentes (entrópiakódolás)• Alkalmazás:

– Filmipar

Page 33: Különböző médiaelemek feldolgozása

AC-3 (Audio Coding number 3) és a Dolby

• Az AC-3 (Audio Coding number 3) érzékelésen alapuló digitális audió kódolási (zajcsökkentési és tömörítési) technika. A zajcsökkentés azon alapszik, hogy csökkentik a kimenő szintet, ha nincs jel. Viszont engedik, hogy a nagy hangerő elfedje a jelben lévő zajt. Mivel így csak a jelhez közeli frekvencián keletkező zaj nyomható el, ezért a Dolby a hallható hangokat minden csatornán keskeny frekvenciasávokra tagolja a hallás frekvenciaérzékenységének megfelelően. Ha a sávban nincs jel, a Dolby csökkenti, esetleg megszünteti a kódolást, ami valójában zaj lenne. Ha a sávban van jel, a jel elnyomja a zajt. A tömörítés igen nagyfokú. Míg a tömörítetlen csatorna adatátviteli sebessége 700 kbit/sec, a Dolby Digital teljes sávszélességű csatornájának átviteli sebessége 75 kbit/sec.

Page 34: Különböző médiaelemek feldolgozása

MPEG 4• Bitsebesség, és

objektumorientáltság• Szerzői jogvédelem (vízjel)• Hibatűrés• MPEG 2 AAC továbbfejlesztése• 3D Audio

Page 35: Különböző médiaelemek feldolgozása

A házimozi rendszerek első kódolási formátuma a DOLBY SURROUND, amely 4 csatornás (jobb, bal, közép, háttér), passzív mátrix rendszerrel dolgozik. Ez annyit jelentett, hogy bár dekódolta a center és a háttérsugárzó jeleit, de azokat nem tudta egymástól megfelelően szeparálni, így a középsugárzó jele hallatszott a surround (háttér) hangszórókban, a háttérsugárzók jele pedig hallatszott a középsugárzóban. Ez azt eredményezte, hogy időnként mintha az ember fejében szólalt volna meg a hang. A négy csatorna hangerejének kiegyenlítése sem volt egyszerű. A jobb és bal csatorna 20 Hz- 20 kHz., a centersugárzó 100 Hz-20000 Hz, a háttérsugárzó 100 Hz - 7 kHz frekvencia tartományban dolgozott. Nagy előnye volt olcsósága.

Page 36: Különböző médiaelemek feldolgozása

A házimozi rendszerek Dolby kódolásának második generációja. Csatornakiosztása megegyezik a Dolby Surrounddal. Aktív mátrix rendszerrel rendelkezik, vagyis nem csak létrehozza az új hangcsatornákat, de azok jelét szinte maradék nélkül szedi az eredeti két hangsávból, így csatorna szeparációja lényegesen jobb. Beépített funkcióként tartalmazza a csatornák hangerejének beállítását szolgáló jelgenerátort. Többfajta középsugárzó üzemmód közül választhatunk. "Normál" üzemmódban a középsugárzó frekvenciamenete 100 Hz-20kHz, ezt az üzemmódot akkor célszerű választani, ha hangsugárzónk relatív kis méretű. Ilyenkor a 100 Hz alatti hangokat csak a jobb és a bal hangsugárzók közvetítik. Wide üzemmódban a centersugárzó is megkapja a teljes 20 Hz-20 kHz frekvenciatartományt, ezt akkor érdemes választanunk, ha a középsugárzó is alkalmas a mélyfrekvenciák lesugárzására. Lehetőség van ezen felül fantom üzemmódra is, ahol hasonlóan a hagyományos sztereóhoz nem használunk középsugárzót. A háttérsugárzó jelét 30-100 ms-mal késlelteik, ezáltal a lakószobák lényegesen kisebb légterének akusztikáját próbálja meg közelíteni a mozi termekéhez.

Page 37: Különböző médiaelemek feldolgozása

Az első digitális háromdimenziós mozi hang. Hat csatornás (jobb, bal, közép, jobb hátsó, bal hátsó, subwoofer (5.1)). Minden csatorna teljes frekvencia tartománnyal rendelkezik (20 Hz-20kHz), kivéve a szubbasszust, amely a 3 Hz - 120 Hz -es tartomány lesugárzására szolgál. A dinamika tartomány mind az 5 csatornának megegyező értékű, a csatorna szeparáltsága annyira magas, hogy pl. amennyiben kikapcsoljuk a centersugárzót, a jobb és a bal hangszórókban nem lehet hallani a centerben történő jeleket. 35 és 70 mm-es filmre is rögzíthető optikai úton. Mivel a filmszalagon már nem volt máshol szabad hely, ezért erre a célra a perforációk közötti területet használják fel. E mellett természetesen a lefelé való kompatibilitás miatt a Dolby Sorround hangot is felveszik. Házi mozi verzióját AC-3-nak (Audio Coding) is becézik, de valójában ez annak az adattömörítési eljárásnak a neve, amellyel a hatcsatornányi digitális hanginformációt rögzíthető sávszélességűre sűrítik.

Page 38: Különböző médiaelemek feldolgozása

A Lucasfilm továbbfejlesztette a Dolby Surround Pro Logic rendszert, és ezt a kifinomultabb, precízebb rendszert új néven, a THX mozaikszóval mint védjeggyel megkülönböztetve tette közzé. Az ilyen házi mozi rendszer abban különbözik elődjétől, a Pro Logic-tól, hogy a hátsó surround hangsugárzók már másként szólnak, más-más jelet dekódol számukra a hangprocesszor. Mindezek mellett maga a műszaki szabvány is sokkal szigorúbb, így precízebb a kódolás és dekódolás is.

Page 39: Különböző médiaelemek feldolgozása

DTSA DTS egy más megközelítést alkalmaz a térhangzás megvalósítására. Az AC3-hoz képest ez a rendszer 384 kb/s adatátviteli sebességgel, 24 bites felbontással, 192 kHz mintavételi frekvenciával állít elő 8 csatornás. CD minőségű hangot. Mindezt rendkívül kifinomult és bonyolult digitális hangspektrum-kódolással, szűréssel és kiegyenlítéssel oldják meg. Jellemzően moziban találkozunk ezzel a hangrendszerrel.

Page 40: Különböző médiaelemek feldolgozása

Hangfeldolgozó alkalmazások

(SoundForge)

Page 41: Különböző médiaelemek feldolgozása

Hangfeldolgozó alkalmazások -

hangerő szabályzás

Page 42: Különböző médiaelemek feldolgozása

Hangfeldolgozó alkalmazások -normalizálás

Page 43: Különböző médiaelemek feldolgozása

Hangfeldolgozó alkalmazások -zaj csökkentése

Page 44: Különböző médiaelemek feldolgozása

Hangfeldolgozó alkalmazások -zaj csökkentése

Page 45: Különböző médiaelemek feldolgozása

Irodalom1. CSÁNKY LAJOS: Multimédia PC-s

környezetben, LSI Oktatóközpont, Budapest, 1996.

2. RALF STEINMETZ: Multimédia Springer Hungarica Kiadó Kft., Budapest

Page 46: Különböző médiaelemek feldolgozása

Irodalom - Internet1. http://www.adobe.com2. http://www.matrox.com/mga3. http://www.sysopt.com/reviews/matrox-g4504. http://www.fontolo.hu/magazin/digivideo/digivideo.html5. http://www.mpeg.org/MPEG/audio.html6. http://www.fraunhoffer.iis7. http://www.intermedia.c3.hu/oktanyag/video/

videotechgyak8. http://www.movie-collage.de9. http://www.dolby.com/new/10. http://www.dvdfutar.hu/dvd/html/dvd_hangds2.html

Page 47: Különböző médiaelemek feldolgozása

Köszönöm a Köszönöm a figyelmet!figyelmet!

Köszönöm a Köszönöm a figyelmet!figyelmet!