89
SZÉCHENYI ISTVÁN EGYETEM MŰSZAKI TUDOMÁNYI KAR INFORMATIKAI ÉS VILLAMOSMÉRNÖKI INTÉZET TÁVKÖZLÉSI TANSZÉK Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata VILLAMOSMÉRNÖKI SZAK Rádióhírközlés szakirány 2005

Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

SZÉCHENYI ISTVÁN EGYETEM MŰSZAKI TUDOMÁNYI KAR

INFORMATIKAI ÉS VILLAMOSMÉRNÖKI INTÉZET

TÁVKÖZLÉSI TANSZÉK

Kétcsatornás tömörített és tömörítetlen digitális

hangjelek minőségi vizsgálata

VILLAMOSMÉRNÖKI SZAK

Rádióhírközlés szakirány 2005

Page 2: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

- 5 -

Tartalomjegyzék

Bevezetés ...............................................................................................................................7

1. A digitális hangtechnika alapjai .....................................................................................8

1.1. Digitális hangjelek ..........................................................................................................8 1.2. Az analóg és a digitális hangjel feldolgozás ...................................................................9

1.2.1. Az analóg jelfeldolgozás ......................................................................................10 1.2.2. Az átviteli csatorna jellemzői ...............................................................................11

1.2.2.1. Jel-zaj viszony..............................................................................................11 1.2.2.2. Dinamika......................................................................................................11 1.2.2.3. Sávszélesség.................................................................................................11 1.2.2.4. Linearitás .....................................................................................................12 1.2.2.5. Harmónikus torzítás .....................................................................................12

1.2.3. Az analóg átvitel jellemzői ...................................................................................12 1.2.4. A digitális átvitel és jelfeldolgozás jellemzői.......................................................13 1.2.5. Digitális hangjel feldolgozás előnyei az analóggal szemben ...............................14

1.3. A digitalizálás folyamata...............................................................................................15 1.3.1. Bevezetés ..............................................................................................................15 1.3.2. Bemeneti aluláteresztő szűrő ................................................................................18 1.3.3. Mintavevő- és tartó áramkör ................................................................................19 1.3.4. A/D átalakítás (kvantálás) ....................................................................................21 1.3.5. Kódolás.................................................................................................................24 1.3.6. Hibafelismerés, hibajavítás...................................................................................25 1.3.7. Hibaelfedés ...........................................................................................................26 1.3.8. Csatornakódolás, csatornamoduláció ...................................................................27 1.3.9. A PCM jel visszaalakítása analóg hangfrekvenciás jellé .....................................30

2. Pszihoakusztikai áttekintés ...........................................................................................32

2.1. Fletcher-Munson görbék ...............................................................................................32 2.2. Maszkolási effektus.......................................................................................................34 2.3. Kritikus sávok ...............................................................................................................35

3. Tömörítési, kódolási eljárások ......................................................................................36

3.1. Bevezetés.......................................................................................................................36 3.2. A hangjelek tömörítésének alapjai ................................................................................36 3.3. Veszteségmentes tömörítés ...........................................................................................37

3.3.1. Lineáris PCM........................................................................................................37 3.3.1.1. CD................................................................................................................38 3.3.1.2. DVD-Audio..................................................................................................38

3.4. Veszteséges tömörítés ...................................................................................................39 3.4.1. AC-3 (Audio Compression 3)...............................................................................40 3.4.2. ATRAC ( Adaptive Transform Acoustic Coding ) ..............................................40 3.4.3. ATRAC kódolás és dekódolás..............................................................................41 3.4.4. MPEG/audio tömörítés .........................................................................................43

3.4.4.1. Az MPEG/audio tömörítési eljárás alapjai ..................................................43

Page 3: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

- 6 -

3.4.4.2. MPEG/audio kódolás és dekódolás .............................................................44 3.4.4.3. Layer I ..........................................................................................................45 3.4.4.4. Layer II.........................................................................................................46 3.4.4.5. Layer III .......................................................................................................46

3.4.5. Sztereo többletkódolás (Stereo Redundancy Coding)..........................................48

4. A szakirodalomból levont tapasztalatok ......................................................................49

5. A hangminták előállításának folyamata.......................................................................50

5.1. AC3 ...............................................................................................................................50 5.2. CD .................................................................................................................................50 5.3. MP3 ...............................................................................................................................51 5.4. ATRAC .........................................................................................................................51

6. Hangminták spektrumának összehasonlítása a Sound Forge 8.0 program segítségével..............................................................................................................................................53

6.1. CD .................................................................................................................................54 6.2. AC3 ...............................................................................................................................55 6.3. ATRAC LP2..................................................................................................................56 6.4. MP3 256kbit..................................................................................................................57 6.5. MP3 128kbit..................................................................................................................58

7. Kódolási eljárások összevetése egy mintacsoport ún. A/B tesztjei alapján (szubjektív vizsgálat)..............................................................................................................................59

7.1. Hangfelvételek esztétikai megítélése ............................................................................59 7.2. A hangminták hallgatási sorrendjének meghatározása .................................................61 7.3. A vizsgálat menete ........................................................................................................63 7.4. Eredmények...................................................................................................................64

7.4.1. Hangszínezet.........................................................................................................67 7.4.2. Térérzet.................................................................................................................68 7.4.3. Hangtisztaság........................................................................................................69 7.4.4. Sztereóhatás ..........................................................................................................70 7.4.5. Egyensúly .............................................................................................................71 7.4.6. Zajmentesség ........................................................................................................72 7.4.7. Dinamika ..............................................................................................................73 7.4.8. Összbenyomás ......................................................................................................74

7.5. A vizsgálat hitelességének alátámasztása .....................................................................75

8. Összefoglalás ...................................................................................................................77

9. Irodalomjegyzék .............................................................................................................81

10. Mellékletek....................................................................................................................82

10.1. Az ATRAC által használt kritikus frekvenciasávok ...................................................82 10.2. Az MPEG algoritmus által használt kritikus sávok ....................................................83 10.3. Hangfelvételek esztétikai megítélése (értékelő lap)....................................................84 10.4. A vizsgált hangminták értékelése (adattábla) .............................................................85

Page 4: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

- 7 -

Bevezetés

Világunkban a digitális technika fejlődése soha nem látott méreteket öltött az elmúlt néhány évtized során. Ennek köszönhetően folyamatosan jelennek meg az élet minden területén a különböző analóg készülékek, berendezések leváltására alkalmas, egyre modernebb digitális változataik. Ez alól a szórakoztató elektronika sem kivétel, hiszen szinte nap, mint nap hallhatunk valami újdonságról ezen a területen is.

A különböző tömörítési eljárásoknak megfelelően egyre csökken az az adatmennyiség, amellyel „az eredetihez hasonló hangélmény” visszaadható. Természetesen az adatmennyiség csökkenésért cserébe be kell érnünk egy lecsökkent, vagy megváltozott hangzásvilággal. A változás mértéke és minősége minden esetben függ az alkalmazott digitalizálási és kódolási eljárástól. A számunkra legoptimálisabb megoldás kiválasztásához tisztában kell lennünk azzal, hogy melyik eljárás milyen hatással van egy-egy hanganyag jellemző paramétereire.

Szakdolgozatom céljául azt tűztem ki, hogy egy előre kiválasztott hangfelvétel részletet különböző kódolási, illetve tömörítési eljárások alkalmazása után, objektív és szubjektív szempontok alapján összehasonlítom.

A feladat megoldásához segítséget kértem a Liszt Ferenc Zeneművészeti Egyetem első évfolyamos hangszeres hallgatóitól, akik természetszerűleg rengeteg élő hangzásbeli tapasztalattal rendelkeznek, és könnyedén elemeznek hanganyagot több szempont alapján.

Page 5: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 8 -

1. A digitális hangtechnika alapjai

1.1. Digitális hangjelek A híradástechnikában az átviendő, vagy rögzítendő információ megjelenési formája a jel.

Ezek elektromágneses jelek, mert csak ezeket lehet elektronikus úton átvinni, illetve feldolgozni.

Matematikai osztályozás alapján léteznek analóg, lépcsős (amplitúdóban diszkrét), mintavételezett (időtartományban diszkrét) és digitális jelek.

Jel Értelmezési tartomány

Értékkészlet

analóg folytonos folytonos

lépcsős folytonos diszkrét

mintavételezett diszkrét folytonos

digitális diszkrét diszkrét

1.1. táblázat

Page 6: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 9 -

1.2. Az analóg és a digitális hangjel feldolgozás

A digitális hangjelek eredeti forrása mindig analóg jel, melyet a digitalizálás folyamata során alakítunk digitális jellé. Az analóg berendezések bemenetére kerülő jelet a berendezésen belül általában valamilyen elektromos, vagy mágneses mennyiség képviseli. Ez a mennyiség erősítőkben feszültség vagy áram. A magnetofon felvevőjének résében mágneses térerősség, a szalagon pedig mágnesezettség lehet.

Az adott mennyiség pillanatértéke tetszőleges értéket vehet fel. Természetesen a rendszer szabta határokon belül, például a tápfeszültség, vagy a magnetofonszalag telítődési szintje is határérték. Tehát mivel az analóg rendszer jeleihez minden időpillanatban tartozik valamilyen véges nagyságú amplitúdó, az analóg jeleket időben és amplitúdóban folytonosnak mondjuk (1.1. táblázat).

A digitális jel az analóg jelből meghatározott időközönként vett mintákból áll, melyeket kettes számrendszerbeli - bináris - számsorozatokká alakítva továbbítjuk. Ettől kezdve az egymást követő számokból képzett számsorozatok képviselik a hanginformációt. A készülékek ezeket rögzítik, továbbítják, illetve matematikai műveleteket végeznek rajtuk

Az 1.1. ábrán, egy analóg hanghullám számsorozattal történő helyettesítésére,. a minták értékének kettes számrendszerbe történő konvertálására, és az egymást követő minták adatfolyammá rendezésére láthatunk példát.[1]

1.1.ábra

Page 7: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 10 -

1.2.1. Az analóg jelfeldolgozás Az analóg technikában a hangrezgést a mikrofon váltakozó feszültséggé alakítja. A mikrofon kimeneti feszültsége minden időpillanatban követi a hangnyomás változását. Ha nő a pilla-natnyi hangnyomás, nő a kimeneti feszültség, és fordítva ugyanez érvényes. Sőt, ha változik a hangrezgés frekvenciája, a kimeneti feszültség frekvenciája is változik.

1.2.ábra

Az erősítő a bemenetére csatlakoztatott mikrofon jelét felerősíti, és a kimenetére

csatlakoztatott hangszóróra továbbítja. A vázolt példában a mikrofon a jel forrása, az erősítő az átviteli csatorna, a hangszóró pedig a fogyasztó. Mindegy, hogy mennyire bonyolult úton jut el a jel a forrástól a fogyasztóig, ez a felbontás mindig elvégezhető. Ebből a szempontból lényegtelen, hogy analóg, vagy digitális jelfeldolgozásról van szó. Viszont fontos tudni, hogy az átviteli csatornának vannak olyan tulajdonságai, amelyek befolyásolják az átvitt jelet. Ezeken kívül felléphetnek még különböző külső zavarójelek is.

Page 8: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 11 -

1.2.2. Az átviteli csatorna jellemzői

1.2.2.1. Jel-zaj viszony

Az átvitel során a csatornán mindig fellép valamilyen zavaró hatás is, ami például hangszóróból áradó zavaró jelként (zajként) érzékelhető. A jel-zaj viszony a hasznos és a zavaró jel aránya dB-ben (1.3. ábra). A jel-zaj viszonyt lineáris frekvenciamenet és lezárt be- és kimenet mellett mérik. A zajt az átviteli csatornát felépítő aktív és passzív alkatrészek hozzák létre.

1.2.2.2. Dinamika

A kifogástalanul reprodukálható kimenő jel maximális értékének és a még zajmentesnek érzékelt kimenő jel minimális értékének aránya dB-ben. A dinamikát felülről a kivezérelhetőség, alulról a zaj korlátozza. Ha a bemenő jel pillanatnyi értéke meghaladja a megengedett legnagyobb értéket, a torzítás ugrásszerűen megnő, mivel a jel a rendszer bitszámának megfelelő kódokkal már nem írható le. Ezt nevezzük túlvezérlési torzításnak. Ezek a torzítások általában igen rövid (mintavételnyi) idejűek, amit fülünk tehetetlensége miatt nem érzékelünk.

1.2.2.3. Sávszélesség

Az átviteli csatorna sávszélességét tekintve sávszűrő jellegű. A frekvencia növekedésével a hasznos jel amplitúdója csökken, ezen kívül egyenfeszültségű, illetve kisfrekvenciás összetevők átvitelére általában nincs lehetőség. A sávszélesség az a frekvenciatartomány, amelyen belül a kimenő jel értéke a vonatkoztatási frekvencián mért értékhez képest maximum 3 dB-lel tér el (1.4. ábra). 1.4.ábra

Page 9: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 12 -

1.2.2.4. Linearitás

Ideális átviteli csatorna esetén a bemeneti jel a kimeneti jellel lineáris viszonyban van. De egy megvalósított csatorna nem sikerül teljesen lineárisra, egy adott környezetben működik, mely környezet hatással van rá. Mindez azt eredményezi, hogy a csatornán továbbított jel torzulni fog. Ezen torzulások közös jellemzője az, hogy a csatorna kimenetén megjelenő jel spektrumában olyan összetevők is megjelennek, melyek a bemenő jel spektrumában nem szerepeltek. Ezt a jelenséget nemlineáris torzításnak nevezzük (1.5. ábra). A nemlineáris torzításokat általában az aktív elemek görbült jelleggörbéi okozzák.

1.2.2.5. Harmónikus torzítás

Az átviteli csatorna kimenetén általában a bemeneti jel bizonyos frekvencia összetevőinek felharmónikusai is megjelennek. A torzítás mértékét a Klirr-faktor fejezi ki, amely a felharmónikusok effektív értékének és a felharmónikusokkal terhelt kimeneti jel értékének hányadosa %-ban kifejezve.

1.5. ábra

1.2.3. Az analóg átvitel jellemzői

A jel tartalmát (a jelentést) nem veszi figyelembe.

Az átvitel során a jel csillapodik, ezért erősítőket kell alkalmazni.

Az erősítők nem képesek a hasznos jel és a zaj szétválasztására, így a zajt is erősítik, ami a J/Z viszony folyamatos romlását idézi elő.

Minél több erősítő fokozaton halad keresztül a jel, annál torzultabb lesz. Analóg rendszerben azonban a torzulás nem biztos, hogy információ veszteséget okoz.

Page 10: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 13 -

1.2.4. A digitális átvitel és jelfeldolgozás jellemzői A zavarójelek a digitális jel durva H/L struktúráját nem tudják olyan könnyen megzavarni.

A zavarófeszültséggel terhelt digitális jelből egyszerű határolással visszaállítható az eredeti négyszögjel (1.6. ábra). Így a csatornából származó zaj kiszűrhető, emiatt pedig a J/Z viszony a 90 dB-t is meghaladhatja. A fentiek következménye, hogy másolatok készítése esetén a másolat minősége az eredetiével megegyező.

1.6. ábra

Hátrányok:

A digitális jel érzékeny az adatvesztésre és a hibák javítása nem egyszerű feladat a fogyasztói oldalon.

A digitális jelfeldolgozó áramkörök bonyolultak.

Az áramkörök túlvezérlése a digitális jel teljes összeomlásához vezet.

Fontos, hogy a 90 dB-es érték a rendszerdinamika. Nem tévesztendő össze a hangfrekvenciás jel dinamika értékével, vagyis a leghangosabb és leghalkabb hangok közötti különbséggel.

Page 11: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 14 -

1.2.5. Digitális hangjel feldolgozás előnyei az analóggal szemben

A fentiekben összefoglaltam az analóg és a digitális hangtechnika fontosabb jellemzőit. Az előnyök és hátrányok tükrében egyértelműen leszögezhetjük, hogy a digitális hangtechnika korlátai az analóg eszközök korlátainál lényegesen távolabb vannak. A meggyőződést fokozandó a hangminőség és a hang manipulálhatósága szempontjából tömören három pontban foglalhatók össze a digitális rendszerek előnyei:

A reprodukált hang minősége kizárólag az analóg-digitális, digitális-analóg átalakítás minőségétől függ

Az analóg hang digitálisba konvertálása olyan lehetőségeket is megnyit, melyek az analóg berendezésekkel aligha valósíthatók meg.(pl. hangmagasság változtatása, sebességtől függetlenül)

A felvételek minőségromlás nélkül sokszorosíthatók

Gyártástechnológiai szempontból is előnyösebb, hiszen a digitális áramkörök jól integrálható, egyszerű elektronikus kapcsolóáramkörökből épülnek fel, így a tömeggyártás és a miniatürizálás lényegesen egyszerűbb. Ennek köszönhetően a kommersz készülékek ára viszonylag alacsony lehet.

Továbbá az üzemeltetés szempontjából is kedvezőbb, hiszen mivel az integrált áramkörök öregedése nem befolyásolja a készülék működését, csökkennek a karbantartási költségek. Ráadásul jó tervezés esetén nagyfokú zavarvédettség és nagy jel-zaj viszony jellemzi. Ismeretes, hogy egy több tagból álló átviteli láncon áthaladó jelhez az analóg rendszer minden tagja hozzáteszi saját torzítását, zaját. Mivel mind a hasznos jel, mind a zavar időben és amplitúdóban folytonos analóg jel, szétválasztásuk csak nehezen és drágán valósítható meg. A digitális rendszerekben a hasznos jelet, vagyis az információt kódolt formában tároljuk, továbbítjuk, miáltal a zavarjelek többségétől könnyedén meg lehet különböztetni.

Page 12: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 15 -

1.3. A digitalizálás folyamata

1.3.1. Bevezetés

Az időben és értékben folytonos analóg jelek diszkrét minták sorozatává történő átalakításának elméleti alapjai már régóta ismeretesek. Több tudós, így H. Nyquist és C. E. Shannon is foglalkozott ezzel a problémával.

C. E. Shannon matematikus 1948-as munkájában kifejti, hogy a mintavétellel nyert diszkrét mintákból álló impulzussorozat információtartalma megegyezik az eredeti, időben folytonos analóg jel információtartalmával. Ez a megállapítás viszont csak bizonyos feltételek érvényesülése esetén igaz. Eme feltételeket a Shannon-féle mintavételi tétel tartalmazza: a mintavételezett jelből akkor állítható vissza információ veszteség nélkül az eredeti analóg jel, ha a mintavételi frekvencia (fm) legalább kétszerese az analóg jelben előforduló legmagasabb frekvenciának (fmax).

A mintavételi frekvencia a digitális hangtechnika legfontosabb paramétere. Eme frekvencia értéke határozza meg az átvinni kívánt hangfrekvenciás jel frekvenciatartományát és az átviteli csatorna sávszélességét.

A digitális hangfeldolgozó rendszerben egységes mintavételi frekvenciára van szükség, a digitális interfészek pedig ezen túlmenően még szabványos értékűt igényelnek. A mintavételi frekvencia értékének tehát állandónak kell lennie. Képletbe foglalva a fentebb összefoglaltakat:

fm > 2fmax

Az analóg jelben előforduló legmagasabb (fmax) frekvenciát Nyquist - frekvenciának is nevezik.

Page 13: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 16 -

A 1.7. ábrán látható a mintavevő és - tartó áramkör kimenetén megjelenő kimeneti feszültség idő- és frekvenciatartománybeli képe.

1.7.ábra

Látható, hogy az eredeti alapsávi spektrum mellett a mintavevő frekvencia és annak felharmónikusai környezetében járulékos oldalsávok is megjelennek.

Ha a mintavételi tételt nem tartjuk be, akkor az alapsáv és az fm mellett megjelenő alsó oldalsáv között átlapolódás jön létre (1.8. ábra). Az ebbe a tartományba eső rész eltorzul és többé nem rekonstruálható.

1.8. ábra

Page 14: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 17 -

A hangfrekvenciás jelek digitális feldolgozása a PCM technikán alapul (Pulse Code Modulation). Az analóg jeltől a PCM kódolású digitális jelig a 1.9. ábrán látható úton jutunk, tehát a digitalizálás folyamata a következő:

1.9. ábra

Page 15: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 18 -

1.3.2. Bemeneti aluláteresztő szűrő

Feladata a bemenő analóg jel felső frekvenciahatárolása, hogy megfeleljen a mintavételi tételben megfogalmazott követelményeknek. Anti-aliasing szűrőnek is nevezik. Az anti-aliasing szűrővel szemben támasztott követelmények:

Vízszintes átviteli karakterisztika egészen a felső határfrekvenciáig

Meredek átmenet az áteresztő tartományból a záró tartományba

Az fmax frekvencia fölött min. 80 dB-es csillapítás

Kis harmónikus torzítás

Kis tranziens idő

Kis fázistorzítás

Kis csoportfutási idő

Az egész digitális rendszernél kisebb saját zaj

Míg a bemeneti aluláteresztő szűrők alkalmazása miatt a hangjel felülről sávhatárolt, addig alacsony frekvenciákon digitális oldalról semmi sem korlátozza a jel spektrumát. Ha a rendszer analóg fokozatai lehetővé teszik, akár az egyenfeszültség is átvihető, de hangjelek esetében erre nincs szükség, sőt kimondottan káros lenne. Viszont az alacsony frekvenciájú spektrum-összetevők átvitele kimondottan növeli a hangfelvétel hűségét.

Page 16: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 19 -

1.3.3. Mintavevő- és tartó áramkör A sávhatárolt bemenő jel mintavételezését végzi. Elvi kapcsolási rajza a 1.10. ábrán

látható. Az analóg kapcsolót a mintavevő jel vezérli. A kapcsoló zárt állapotában a kondenzátor a bemeneti feszültség pillanatnyi értékére töltődik fel, majd a kapcsoló nyit és a kondenzátorban a kapcsoló következő zárásáig tárolódik a feszültség minta.

1.10.ábra

Azt az időt amikor a kapcsoló zárt állapotban van nevezik mintavételi időnek, amikor pedig nyitva van az a tartási idő. A tartási idő alatt a kondenzátorban tárolt feszültség értéket a kvantáló áramkörnek fel kell dolgoznia. Ezalatt a kondenzátorban tárolt feszültség nem változhat meg. Természetesen vannak veszteségek. A kondenzátor nem képes egyik pillanatról a másikra feltöltődni a kondenzátor feltöltődési idejét nevezik beállási időnek. Miután a kapcsoló nyit a kondenzátor az áramkör szórt ellenállásain keresztül igen lassan kisül. A töltőellenállás - ami a vezetékek és a kapcsoló szórt ellenállásából tevődik össze - és a tároló kondenzátor aluláteresztő szűrőt alkot, ami befolyásolja a frekvenciamenetet. A mintavevő és -tartó áramkör minőségét a beállási idő és a kisülés határozzák meg (1.11. ábra)

.

1.11. ábra

Page 17: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 20 -

Mintavételi frekvencia konverzió

Berendezéseinket csak akkor tudjuk közvetlenül összekapcsolni, ha azonos mintavételi frekvencián működnek. Azonban a mintavételi frekvencia nem minden készüléknél választható meg szabadon. A CD-R író és a Mini Disc például kizárólag 44,1 kHz-cel tud rögzíteni, de probléma adódik akkor is, ha különböző mintavételi frekvenciával dolgozó forrásokból származó jeleket szeretnénk digitálisan keverni. A probléma megoldását mindkét esetben a készülékek közé csatlakoztatott mintavételi frekvencia konverter jelenti.

Kezdetben csak nagyméretű, drága, szinkron mintavételi frekvencia konverterek léteztek. Ezek egymásután végrehajtott interpoláció és decimálás segítségével módosították a jelfolyam mintavételi frekvenciáját. A napjainkban használt aszinkron konverterek már egyetlen integrált áramkörben elférnek, és az áruk is megfizethetővé vált. Sőt, digitális keverőasztaloknál sok esetben az összes bemeneti csatornába beépítenek egy-egy konvertert.

1.12. ábra

Az aszinkron konverter a bemenetére érkező hangminta sorozatból rekonstruálja, hogy a kimeneti hangminták időpillanataiban mekkora lenne az analóg jel amplitúdója, és ennek megfelelő értékű hangmintákat küld a kimenetére.

Ez a megoldás lényegesen kevesebb műveletvégzést igényel, mint a szinkron konverterek egymást követő interpolációja és decimálása.

Page 18: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 21 -

1.3.4. A/D átalakítás (kvantálás)

A mintavevő és -tartó áramkörrel előállított, időben diszkrét amplitúdóminták még végtelen sok értéket vehetnek fel, tehát végeredményben még analóg jelek.

A kvantáló feladata a jel értékkészletének diszkrétté tétele. Azaz a végtelen sok értéket véges sok érték segítségével kell ábrázolnia, ugyanis csak meghatározott számú bináris adatszó áll rendelkezésre attól függően, hogy hány bitre kvantálunk. Általában 16 bites kvantálást alkalmaznak, ami 65536 amplitúdóérték megkülönböztetését jelenti. A kvantálót is a mintavevő jel vezérli.

Az A/D átalakító bemenetére vezetett amplitúdóminták bináris adatszavakká átalakítva jelennek meg a kimenetén.

A kvantálás lehet lineáris és nemlineáris. Az előbbi esetben a kvantálási lépcsők azonos nagyságúak. A jelben azonban sokkal gyakoribbak a kis amplitúdójú minták és így a kisebb helyértékű bitek sokkal jobban kihasználtak. Emiatt a kvantálási bitek számát csökkentik és a bemeneti jelet egy dinamika kompresszorra vezetik, ami a jel dinamikáját lecsökkenti, így alkalmassá válik a kevesebb bittel történő ábrázolásra.

Visszaalakítás során a jelet egy dekompresszoron vezetik keresztül, melynek karakterisztikája pontosan ellentétes a kompresszoréval, így az eredeti dinamika visszaállítható

Kialakításukat tekintve megkülönböztethetők integráló rendszerű és szukcesszív approximációs elven működő A/D átalakítók.

Page 19: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 22 -

Az A/D átalakítók hibái:

Kvantálási zaj: mivel a kvantáló csak véges számú értéket különböztet meg, a végtelen sok értéket felvehető minta értéke esetleg két kvantálási szint közé esik. Ebben az esetben a kvantáló dönti el, hogy a minta melyik szinthez tartozik, azaz +/-1/2 lépésköznyi hibát visz be a jelbe. Ezt a hibát nevezik kvantálási zajnak.

1.13. ábra

Granulációs zaj: ha a kvantálásra kerülő jel amplitúdója olyan kicsi, hogy jellemzéséhez az LSB (Least Significant Bit = legkisebb súlyú bit) is elegendő, akkor a szinuszjel négyszögjellé torzul. A négyszögjel azonban minden frekvencia összetevőt tartalmaz, így tartalmazhat olyan összetevőket is, amelyek miatt aliasing jön létre. Ez a torzítás sokkal erősebben érzékelhető, mint a nemlineáris torzítás. A granulációs torzítás értéke az amplitúdó csökkentésével növekszik.

Page 20: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 23 -

Linearitási hiba: ideális esetben az A/D átalakítók karakterisztikája lineáris, azaz lineárisan növekvő bemeneti feszültség esetén az A/D átalakítóhoz csatlakoztatott D/A átalakító kimenetén egyenletes lépcsőzésű jel jelenik meg. Az egyenletes lépcsőzéstől való eltérés az abszolút nemlinearitás, az ideális karakterisztikától való két mintavételi érték közötti eltérés pedig a differenciális nemlinearitás. Mindkettőt az LSB sokszorosaként, vagy töredékeként adják meg (1.14.ábra).

1.14. ábra 1.15. ábra

Monotonitáshiba: a lineárisan növekvő bemenő jel ellenére a D/A átalakító kimenetén a lépcsős jel folytonossága megszakad (1.15. ábra). Nagy torzítást okoz.

Ofszethiba: az egyenfeszültségi szint eltolódása. Hatására az A/D átalakító kimenetén is eltolódnak a bináris értékek, illetve lecsökken a kivezérelhetőségi tartomány. Az alkalmazott műveleti erősítők pontos beállításával kiküszöbölhető.

Túlvezérlési hiba: az A/D átalakító túlvezérlése esetén a kimenetén vagy a maximális érték jelenik meg, vagy annak komplemense. Ebben az esetben az A/D átalakító teljesen meghamisítja a bemeneti jelet.

Page 21: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 24 -

1.3.5. Kódolás

A kódolásra azért van szükség, mert az A/D átalakító kimenetén megjelenő bináris kódszavak csak a minta értékét adják meg, az előjeléről nem tartalmaznak információt.

Általában kettes komplemens kódot alkalmaznak: a pozitív számokat normál bináris kóddal ábrázolják (LSB a jobb oldalon áll), a negatív számokat pedig az adott számérték kettes komplemensével. Egy szám kettes komplemense a szám bitenkénti invertálásával és +1 hozzáadásával képezhető.

A következő példában 8 különböző amplitúdó értéket különböztetünk meg. Ehhez kettes komplemens kódban négy bitet alkalmaznak, mert az előjelet plusz egy biten - az MSB-n (Most Significant Bit = legnagyobb súlyú bit) ábrázolják.

Nézzük példaképpen a 3 és a -3 kettes komplemens kódját:

3(10) = 0011(2)

-3(10) = inv0011(2) + 1 = 1100(2) + 1 = 1101(2)

Az előjelbit (MSB) pozitív számok esetén 0, negatív számok esetén pedig 1.

A kettes komplemens kódolású jel már a PCM jelnek felel meg. Ezt a jelet nevezik forráskódnak, magát a folyamatot pedig forráskódolásnak.

A PCM jel az A/D átalakító kimenetén párhuzamos, vagy soros formában jelenik meg. Az egyes bitek között a jelszint a bitek értékétől függően a 0, vagy az 1 szinten marad. Ez az NRZ kódolás (Non Return to Zero).

Page 22: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 25 -

1.3.6. Hibafelismerés, hibajavítás

A hibák detektálásának illetve javításának nagy szerepe van a megbízható digitális átvitel kialakításában. A digitális jel az átviteli csatornán ugyanúgy ki van téve a csatornát érő zavaró hatásoknak, mint az analóg jel. A különbség az, hogy amennyiben a digitális jel eltorzul (olyan mértékben, hogy a határolással nem állítható helyre az eredeti négyszögjel), akkor megváltozik az információtartalma.

A hiba tulajdonképp egy vagy több bit invertálódását jelenti. A csatornát érő zavarimpulzusok - hosszuktól függően - több kódszót is tönkretehetnek. Ez az ún. burst error.

Ahhoz, hogy a hiba javítható legyen először is fel kell ismerni a hiba tényét, helyét és jellegét. Ezután az alkalmazott hibajavítási eljárástól függően újrakérik a hibás részt, vagy ha a hibafelismerő/-javító eljárás olyan, hogy önmagában is elegendő információt szolgáltat a hiba javításához, akkor a rendszer egyszerűen kijavítja a hibát.

Az elterjedt hibafelismerő és -javító eljárások:

Paritásbit

Hosszirányú redundancia ellenőrzés (LRC = Longitudinal Redundancy Check), az egyszerű paritásbites eljárás továbbfejlesztése

Ciklikus redundancia ellenőrzés (CRC = Cyclic RC).

Page 23: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 26 -

1.3.7. Hibaelfedés

Egyetlen hibajavító eljárás sem képes minden hiba kijavítására. A hibaelfedés pszihoakusztikai jellemzőkre épül. A hibák miatti hiányzó adatokat a hibás kódszava(ka)t megelőző és követő kódszavak magasabb rendű interpolálásával nyerik. Az így kapott kódszóval a hibás részt elfedik (maszkolás). Ha egymás után több kódszó is megsérül, akkor a hibaelfedés nem működik helyesen. A hatékonyság a kódszavak tér- és időbeli összekeverésével növelhető (interleaving). Így a kódszavak nem a keletkezésük sorrendjében továbbítódnak. A helyes sorrendet a dekódolás során vissza kell állítani. Az eljárás következtében nagyobb lesz a valószínűsége, hogy egy hibás kódszót hibátlan kódszavak fognak közre. Az interleaving eljárás egyik speciális formája a cross interleaving (1.16. ábra).

1.16. ábra

Page 24: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 27 -

1.3.8. Csatornakódolás, csatornamoduláció A forráskódolású jelet az átviteli csatorna jellemzőihez a csatornakódolás során illesztik.

A csatornakódolásra két okból van szükség: egyrészt a csatornán felléphetnek zavarok, ami miatt meghibásodik az átvitt digitális jel. A csatornakódolás segítségével elősegíthető a hibák egyszerűbb javítása. A második ok a bitek megfelelő időben történő kiolvasása. Ha nem szinkron átvitelről van szó, akkor a csatornakódolású jelből elő kell tudni állítani az eredeti órajelet is, illetve az átvitt jel nem tartalmazhat egyenfeszültségű, vagy kisfrekvenciás összetevőket. Ezek a követelmények a forráskódolású jelbe való járulékos élátmenetek bejuttatásával elégíthetők ki.

A csatornakódok jellemzői:

Futási hossz (T): két szintváltozás közötti távolság bitekben. Az előre definiált futási hosszal rendelkező kódok az ún. RLL kódok (Run Length Limited). Az RLL kódok a két élváltozás közötti minimális (Tmin) és maximális (Tmax) futási hosszal jellemezhetők (1.17. ábra).

1.17. ábra

Page 25: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 28 -

Jitter margin (fázishiba - Tw): egy intervallumot (időablakot) jelöl ki. Soros adatjel kiértékelésénél van jelentősége. A jitteres jelet az órajelnek megfelelő ütemben olvassák ki. Ha a jitter egy bizonyos szint fölé emelkedik, akkor a biteket hibásan detektálják (1.18. ábra). Az a tartomány, amin belül a detektálás még biztosan helyesen történik a jitter margin. Egy bit kifogástalan kiértékeléséhez a Tmin-től függő idő áll rendelkezésre:

Tw = +/-1/2Tmin

1.18. ábra

DSV (Digital Sum Value): a csatornakód egyenfeszültségű komponensére jellemző összeg. A H szintű biteket +1-el, az L szintűeket -1-el helyettesítve minden bitet összeadnak - ez a DSV. Amennyiben ez 0, akkor a jel nem tartalmaz DC összetevőt.

1.19. ábra

Page 26: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 29 -

1.20. ábra

Szemábra: a szintingadozások, jitterhibák és egyéb zavarok, zajok miatt a csatornakódolt jel eltorzítva jelenik meg az átviteli csatorna kimenetén (1.19. ábra). Ha ezt a jelet egy oszcilloszkóp függőleges bemenetére vezetjük, és a vízszintes bemenetet az órajellel hajtjuk meg, akkor kapjuk a szemábrát (1.20. ábra). A szemábrán Tw-nek két jelszintátmenet közötti távolság felel meg.

A maximális szemnyílás jelenti a maximális amplitúdót. Vízszintes irányban a növekvő fázishiba korlátozza a szemnyílást.

Page 27: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 30 -

1.3.9. A PCM jel visszaalakítása analóg hangfrekvenciás jellé

A PCM jelet időben és értékben újra folytonossá kell tenni. Ezt a következő úton valósítják meg: először D/A átalakító segítségével PAM (Pulse Amplitude Modulation) jelet hoznak létre. Ezután a PAM impulzusok szélességét mintavevő és -tartó segítségével megnövelik, végül egy aluláteresztő szűrő segítségével integrálással nyerik az eredeti analóg jelet.

Az aluláteresztő szűrőnek az integrálás mellett még egy fontos szerepe van: a PCM jel PAM jellé alakítása a D/A átalakítóval egy újabb mintavételi folyamatot jelent és így az alapsávi spektrum mellett ismét megjelenik a zavaróspektrum, amit ki kell szűrni.

A bináris számsorokból álló PCM jel egyes kódszavaihoz a D/A átalakító az egyes kódszavak információtartalmával arányos feszültség értéket rendeli hozzá. A legkisebb feszültség értékét az átalakító áramköri felépítése határozza meg. A maximális kimeneti feszültség:

Ukimax = ULSB * 2n

A D/A átalakítók felépítésük alapján lehetnek:

Létrahálózatot alkalmazó passzív áramosztósak

Aktív áramosztósak

Integráló rendszerűek

A D/A átalakítók esetében is felléphetnek a fent ismertetett hibák. Ezen kívül még a beállási idő jellemzi a D/A átalakítókat, ami azt adja meg, hogy mennyi idő kell ahhoz, hogy a D/A átalakító bemenetére adott jel átalakításakor a kimeneti feszültség +/-1/2 LSB pontossággal beálljon annak értékére.

Page 28: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 31 -

A D/A átalakítóban áramgenerátor és a PCM jel által vezérelt félvezető kapcsolók segítségével történik a kódszavak feszültséggé alakítása. A kapcsolók nem egyidejű átkapcsolásának következménye az ún. glitche. Ez a beállási szakaszon látható zavarójel (1.19.ábra). Ezért a D/A átalakító kimeneti jelét glitchementesítő áramkörre vezetik, amelynek működése szintén az 1.21. ábrán látható. A glitchementesítő impulzus szélessége általában a mintavételi intervallum felével egyenlő.

A D/A átalakítók pontossága még az alkalmazott referenciafeszültség pontosságától is függ.

1.21. ábra

Page 29: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 32 -

2. Pszihoakusztikai áttekintés

2.1. Fletcher-Munson görbék Az emberi fül által hallható hang tulajdonképp nem más, mint nyomásváltozás a közvetítő

közegben. Erőssége kifejezhető a nyomásváltozás nagyságával. Általában ezt egy referenciaértékhez viszonyítva, dB-ben adják meg. Ez a fizikai jellemző a hangnyomás szint:

,ahol p a hangnyomás időbeli változása, p0az 1 kHz frekvenciájú, emberi fül által még éppen hallható hangnyomás (p0= 20 mPa). Az a hangnyomás szint, amit 1 kHz-en épp meghallunk nem biztos, hogy meghallható más frekvencián. Általában két egyforma teljesítményű, de különböző frekvenciájú hangot nem azonos hangerejűnek hallunk. Ezen kívül alkalmazzák még az intenzitás szintet, amelyet szintén dB-ben adnak meg:

, ahol I0 = 1 pw/m2, szintén 1 kHz-es hangra vonatkozik.

A fizikai jellemzők azonban közvetlenül nem hordoznak információt az emberi hallás szubjektív jellemzőiről. A pszihofizikai jellemzők a fizikai jellemzők áttételei az érzeti síkra. Ezek a jellemzők a hangerősség és a hangosság. A hangerősség (Ln) mértékegysége a phon. Egy hang hangerőssége annyi phon, ahány dB a vele azonos hangosságérzetet keltő 1 kHz-es szinuszos hang hangnyomásszintje. Így az éppen hallható hangerősség 0 phon. A hangerősség hátránya, hogy több hang együttes megszólalása esetén nem alkalmazható.

A hangosság az egyszerre megszólaló hangokra vonatkozik, jele: N; mértékegysége a son:

Ha a megszólaló hangok hangerőssége mind nagyobb, mint 40 phon, akkor egyszerű összegezéssel számítható a hangosság.

Page 30: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 33 -

A fül érzékenysége a frekvencia függvénye. Az ember számára érzékelhető hanghullámok 20 Hz-től 20 kHz-ig lévő frekvenciatartományba esnek. A 20 Hz alatti hangok az infrahangok. 16 kHz - 100 MHz ultrahang. Az emberi fül az 1000 Hz körüli hangokra a legérzékenyebb.

Hallásküszöb:A fülhöz érkező fizikai hang bizonyos erősségtől kezdve hallhatóvá válik. Azt a legkisebb hangerősséget, amelynél a vizsgált hang hangérzetet kelt, hallásküszöbnek nevezzük. Az emberi hallás is frekvenciafüggő. Ennek következménye, hogy a különböző rezgésszámú hangok hallásküszöbértéke is különböző. A kisebb rezgésszámok, tehát mélyebb hangok küszöbértéke nagyobb, mint a magasabb hangoké.

Fájdalomküszöb: Ha a hang intenzitása növekszik, a hangérzet erőssége is nő, végül már fájdalmat okoz. Ez a fájdalomküszöb (130 dB). A fájdalomküszöb kevésbé függ a frekvenciától, gyakorlatilag az egész frekvenciatartományban azonos.

Hangmagasság: A hangmagasság a hangok rezgésszámától függ. A dupla rezgésszámú hang az oktáv. Ha egy rögzített hangot dupla sebességgel fogunk lejátszani, akkor egy oktávval magasabban fog szólni és fele annyi ideig fog tartani. A hang magassága függ a beszélő hangerejétől is. Minél hangosabban beszél valaki, annál magasabb lesz a hangmagassága.

Hangdinamika: A hangdinamika a hangos és halk hangok aránya. A hangrögzítésben a legerősebb hangjel (mely még torzítás nélkül rögzíthető) és a készülékben keletkező alapzaj aránya.

A 2.1. ábrán láthatók a Fletcher-Munson görbék különböző hangerő értékekre. A "0 phon" feliratú görbe ábrázolja a minimális értékeket, amit a fül érzékelni képes különböző frekvenciákon. A görbék azt ábrázolják, hogy a fül bizonyos frekvenciákon érzékenyebb, mint másokon.

2.1. ábra

Page 31: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 34 -

2.2. Maszkolási effektus

Maszkolásról akkor beszélünk, ha egy hangot egy másik hang hallhatatlanná tesz. Egyidejű maszkolás akkor lép fel, amikor két hang egyszerre szól, mint pl. amikor egy beszélgetést (a maszkolt jel) elnyom egy vonat dübörgése (a maszkoló). Visszafelé irányuló maszkolásról akkor beszélünk, ha a maszkolt jel előbb befejeződik, mint ahogy a maszkoló elkezdődik; előre irányuló a maszkolás, ha a maszkolt jel azután kezdődik, hogy a maszkoló véget ért.

A maszkolás annál erősebb, minél közelebb áll egymáshoz - idő- és frekvencia tartományban egyaránt - a két jel. Pl. az egyidejű maszkolás erősebb a visszafelé- és az előre irányuló maszkolásnál is, mert a hangok egy időben szólalnak meg. A maszkolási kísérletekben általában maszkolóként keskeny sávszélességű fehér zajt használnak és tiszta szinuszos hang hallásküszöbét vizsgálják különböző időben és frekvenciákon. Az egyidejű- és az időleges maszkolásokra a 2.2. és a 2.3. ábrán láthatunk példát.

2.2. ábra 2.3. ábra

Az ábrákból fontos következtetéseket vonhatunk le. Először is, az egyidejű maszkolás akkor a leghatásosabb, ha a maszkolt jel frekvenciája megegyezik, vagy nagyobb, mint a maszkolóé. Másodszor, míg az előre irányuló maszkolás jelentős ideig hatásos az után, hogy a maszkoló elhallgatott, a visszairányuló kevesebb, mint 2-3 ms -ig él a maszkoló megszólalása előtt.

Page 32: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 35 -

2.3. Kritikus sávok

A kritikus sávok ötlete a fül azon tulajdonságából adódott, hogy a hallható frekvencia tartományt alsávokra osztva analizálja. Az egy kritikus sávon belüli frekvenciák hasonlóak a fül érzékelési tulajdonságaihoz, és más kritikus sávoktól elkülönítve dolgozzák fel őket. A kritikus sávokat hallási kísérletekkel határozták meg, és levezethetők a belső fülben található érzékelő cellák elhelyezkedése alapján is. A kritikus sávok felfoghatók úgy, mint a fül által használt frekvencia sávok. Alacsonyabb frekvenciák esetén sokkal keskenyebbek, tulajdonképp a kritikus sávok 3/4 része 5 kHz alatt található. Ez azt jelenti, hogy az alacsonyabb frekvenciákból több információt kap a fül, mint a magasakból.

A digitális hangtömörítő algoritmusok a tömörítéshez jelentős mértékben hasznosítják a pszihofizikai jellemzőket az idő-frekvencia tartomány átalakítás és a bit kiosztás során.

Page 33: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 36 -

3. Tömörítési, kódolási eljárások

3.1. Bevezetés

Az adattömörítés célja, hogy hangfelvételeinket minél kevesebb tárolókapacitás lefoglalásával rögzíthessük, minél kisebb csatornakapacitás felhasználásával továbbíthassuk.

Az elmúlt évek során két irányzat alakult ki a digitális hangtechnikai fejlesztések terén, amelyek céljukat tekintve ellentétesek. Míg az egyik oldalon a minél tökéletesebb hangzás érdekében mindent megtesznek a paraméterek javításáért - gondoljunk csak a nagyobb felbontású, nagyobb mintavételi frekvenciával, dolgozó rendszerekkel való kísérletezésre -, addig a másik oldalon egyre gyakrabban használnak adatcsökkentő eljárásokat, főleg anyagi megfontolásokra hivatkozva.

A különféle, egymással általában nem kompatibilis adatredukciós eljárások legtöbbje valamiféle minőségi kompromisszum árán próbálja gazdaságosabbá tenni a digitalizált hangot tartalmazó adatállományok tárolását, továbbítását.

3.2. A hangjelek tömörítésének alapjai

A hangjelek tömörítésének alapja a redundancia és irrelevancia csökkentése. A hangfelvételekkel kapcsolatban redundáns információról beszélünk, ha az adott kódolási eljáráshoz képest a rögzített hang kevesebb adat felhasználásával is kódolható lenne oly módon, hogy az később tökéletesen visszaalakítható eredeti formájába.

A hangminták kódolására legelterjedtebben alkalmazott lineáris PCM kódolás például a digitális jelfeldolgozás szempontjából kimondottan előnyös, az adattárolás és adattovábbítás szempontjából viszont meglehetősen pazarló eljárás.

A hangesemények továbbá felbonthatók releváns (lényeges) és irreleváns (lényegtelen) összetevőkre. Relevánsnak számít minden hanginformáció, ami hallhatóan befolyásolja a hangzás révén keletkező érzetet, benyomásokat. Irreleváns ezzel szemben azon része, mely nem tartalmaz ilyen információt, és ezért elhagyható anélkül, hogy hangérzetünk megváltozna.

Page 34: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 37 -

3.3. Veszteségmentes tömörítés

Az entrópia kódolásnak is nevezett, veszteségmentes tömörítő eljárások az adatok redundanciáját csökkentik. A beavatkozás reverzíbilis, a kódolás és dekódolás során információ nem vész el.

Veszteségmentes tömörítésnél a tömörítés mértéke nagymértékben függ a forrásállomány tartalmától. A hangállományok statisztikai kódeloszlása viszonylag egyenletes, méretük entrópia kódolással mindössze 10-15 % - kal csökkenthető. Érthető, hogy a hangtechnikában csak kivételes esetekben alkalmazzák. Ilyen kivételnek számítanak az igen redundáns, nagyfelbontású formátumok, mint például a DVD-Audio-nál bevezetett 96 kHz/24 bites mód, vagy a Super Audio CD DSD-je. Ezeknél a formátumhoz optimalizált összetett entrópia-kódoló algoritmussal valamivel nagyobb, mint 1:2 tömörítés valósítható meg.

3.3.1. Lineáris PCM

A lineáris PCM tömörítetlen (veszteségmentes) digitális hangot jelent. Ezt a formátumot használják a CD-ken és a legtöbb stúdió masteren. 48 vagy 96 kHz-es lehet, 16, 20 vagy 24 bites mintavételezést használhat. (A hang CD 44,1 kHz-re, 16 bitre van korlátozva.)

1-től 8 csatornát tartalmazhat. A maximális bitráta 6,144 Mb/s, ami korlátozza a mintavételezést és a minták felbontását, ha 5 vagy annál több csatornát használnak. Általánosságban elmondható, hogy a 120 dB-es dinamika (20 bites felbontásnál), és a a 48 kHz-es mintavételezésből adódó kb. 22 kHz-es frekvencia-átvitel elegendő a nagy felbontású hangvisszaadáshoz. Azonban további biteket és magasabb mintavételezést is használhatnak audiofil alkalmazásokhoz, stúdiómunkához, zajszűréshez, fejlett digitális feldolgozáshoz, és háromdimenziós hangtér előállításához.

A DVD lejátszóknak támogatniuk kell az LPCM minden változatát, de elég sok készülék lekeveri a 96 kHz-es hangot 48 kHz-re, és néhány nem használja mind a 20 vagy 24 bitet. A digitális kimeneten megjelenő jelet (a külső digitális-analóg átalakítókhoz) korlátozhatják 96 kHz-nél kisebb mintavételezésre, és 24 bitnél kisebb felbontásra.

Page 35: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 38 -

3.3.1.1. CD

A CD (a Compact Disc rövidítése) egy nagy kapacitású optikai tároló, amely leginkább jó minőségű hang, valamint adat tárolására használatos. Méreteit tekintve általában 120 mm átmérőjű, de léteznek a Mini–CD lemezek, 80 mm-es átmérővel.

Fontosabb paraméterei:

Műsoridő: legfeljebb 74 perc 33 másodperc

Csatornaszám: 2 csatorna (4 csatornás felvétel is lehetséges)

Kvantálás: lineáris 16 bites

Mintavételi frekvencia: 44,1 kHz

Hibavédő rendszer: Cross Interleave Reed-Salamon Code

Modulációs rendszer: EFM (Eight- to –Fourteen Modulation )

3.3.1.2. DVD-Audio

Kiváló minőségű hanganyag, mely kötelezően tartalmaz legalább 1 db LPCM hangsávot. Legfeljebb hatcsatornás, 48/96/192 kHz-es mintavételezésű (44,1/88,2/176,4 kHz is engedélyezett), a minták felbontása 16/20/24 bit lehet. Így az elméleti frekvencia átvitel akár 96 kHz is lehet, a dinamika pedig elérheti a 144 dB-t. A többcsatornás PCM hangot lekeverheti a lejátszó, de 192 és 176,4 kHz-en csak két csatorna engedélyezett. A mintavételezés és a minták nagysága csatornánként eltérhet, de ezeket előre definiált csoportokból kell kiválasztani. A maximális adatátvitel 9,6 Mb/s.

A CD lemezekénél összehasonlíthatatlanul jobb, 192kHZ-es vagy 96kHz/24-bites lineáris PCM hangzás tisztább hangzást és a hangszerek hangjainak valóságosabb visszaadását eredményezi. Ezen a lemezformátumon kényelmesen nagy tartalékok állnak a magas hangtartományok rendelkezésére, valamint a közép és mély tartományok is árnyaltabban és valósághűbben tudnak megszólalni.

A gyors, nagyfrekvenciájú hangcsatornák eredményeként az egyes hangjegyek jobban elválnak egymástól, a sztereo hangképzés pedig a precízebb, mélyebb és egységesebb hangzástérről gondoskodik. Érdekesség, hogy a DVD Audio nevével ellentétben sávonként akár 99 képet is tárolhat, valamint lejátszás közben a dalszöveg kiírására is lehetőség nyílik.

Page 36: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 39 -

3.4. Veszteséges tömörítés

A hangtechnikai alkalmazásoknál a veszteségmentes tömörítéssel elérhetőnél általában lényegesen nagyobb mértékű adatcsökkentés kívánatos, amit csak veszteséges tömörítéssel lehet megvalósítani. A veszteséges tömörítés a felvétel irrelevanciájának csökkentésén alapszik. Ezek az eljárások zajt adnak a hasznos jelhez, de ez a zaj hallásfiziológiai módszerek alkalmazásával elrejthető.

A hangjelek tömörítésére kifejlesztett rendszerekben az alábbiakban felsorolt elemekkel találkozhatunk:

Huffman-kódolás

Prediktív kódolás

Futamhossz kódolás

Alsáv kódolás

Nemlineáris kódolás

Lebegőpontos kódolás

Transzform kódolás

Érzeti kódolás

Spektrális sávismétlés

Frekvencia- és időtartománybeli elfedés

A továbbiakban ismertetett tömörítési eljárások túlnyomó részben az érzeti kódolás alapelveire, a pszihoakusztikai jellemzők kihasználására épülnek.

Page 37: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 40 -

3.4.1. AC-3 (Audio Compression 3)

A Dolby Digital kódolási formátuma. 1965-ben, Londonban Ray M. Dolby amerikai fizikus alapította meg a Dolby Laboratories-t, amely az 1990-es évek elejére fejlesztette ki ezt a többcsatornás kódolási eljárást, az eredeti veszteségmentes PCM hangot a AC3 kódolással, 48 kHz-es mintavételezéssel 16-24 bites felbontással tömöríti. A sávszélesség 64 és 448 kbit/s között lehet. Dolby Digital 5.1 esetén ez többnyire 384 és 448 kbit/s között mozog, míg a hagyományos sztereónál elegendő a 192 is.

Fontos kritérium, hogy a Dolby Digital nem egyértelműen jelenti az 5.1-es hangzást, mivel a szabvány tartalmazza a monó (1.0), duál monó (1+1), sztereó (2.0), surround (3.0) és a prologic (4.0) hangsávok alkalmazását is.

3.4.2. ATRAC ( Adaptive Transform Acoustic Coding )

Az Adaptive Transform Acoustic Coder-t a Sony a Minidisc-hez fejlesztette ki. Működési elvét tekintve hibrid érzeti tömörítő. A lecsökkent tárolókapacitás ellenére szükséges volt, hogy a MD jó hangminőséget adjon és 74 perces játékidővel rendelkezzen. Ezért az ATRAC-ot úgy tervezték, hogy megfeleljen a következő követelményeknek: a 16 bites, 44,1 kHz -es sztereo audio jelet kevesebb, mint 1/5 -ére tömörítse össze a hangminőség minimális romlása mellett. Hordozható készülékekben is alkalmazható egyszerű és olcsó hardverrel is megoldható legyen a kódolás és a dekódolás.

A digitális audio jel tömörítésekor bizonyos mennyiségű zaj adódik a jelhez. A legtöbb audio kódolási eljárásnak az az alapelve, hogy az ilyen zaj-, idő- és frekvencia tartománybeli eloszlását úgy kezeljék, hogy az hallhatatlan legyen az emberi fül számára. Ha ez sikeres, akkor az ilyen módon előállított jel megkülönböztethetetlen lesz az eredetitől.

Page 38: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 41 -

3.4.3. ATRAC kódolás és dekódolás

Az audio kódoló rendszerek általában úgy működnek, hogy felosztják a jelet különböző idő- és frekvenciatartománybeli egységekre. Ezt a felosztást használva a jelet a pszihoakusztikai törvényszerűségeknek megfelelően elemzik. Az elemzés során kimutatható, hogy mely egységek a kritikusak és ezért nagy pontossággal kódolandók, és mely egységek kevésbé jelentősek és így elviselnek némi kvantálási zajt a kívánt hangminőség romlása nélkül. Erre az információra alapozva rendelik az elérhető biteket az egyes egységekhez. A spektrális összetevőket ezután kvantálják ezeknek a biteknek a felhasználásával. A dekóderben a kvantált spektrumot visszaalakítják a bit kiosztásnak megfelelően és ezután audio jellé szintetizálják.

Az ATRAC rendszer is a fentieknek megfelelően - csak számos kiegészítéssel - működik. A pszihoakusztikus jellemzőket ugyanis nem csak a bit kiosztás során használja, hanem az idő- és a frekvencia tartomány felosztásakor is. A bemeneti jelet nem azonos frekvenciaosztásokban analizálják, és így kiemelik a fontos, alacsony frekvenciás összetevőket. Ezen kívül változó hosszúságú blokkokat használnak, ami a bemeneti jelhez igazodik. Így a statikus részek is hatékonyan kódolhatók és az átmeneti, gyorsan változó részekre nem pazarolják az időbeli felbontást.

3.1. ábra

A 3.1. ábrán látható a kódoló blokkdiagramja. A kódoló három részből áll. Az analízis rész spektrális összetevőire bontja a jelet, amelyeket csoportokba (BFU = Block Floating Unit) rendeznek. A bit allokáció rész elosztja a rendelkezésre álló biteket az egyes BFU -k között, kevesebb bitet osztva a kisebb jelentőségű csoportoknak. A kvantálás rész kvantálja az egyes spektrális összetevőket a meghatározott szóhosszúságra.

Page 39: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 42 -

Először a jelet felosztják három alsávra: 0-5,5 kHz, 5,5-11 kHz és 11-22 kHz. A kritikus frekvenciasávok listáját munkámhoz mellékletként (1. számú melléklet) csatoltam. Ezután minden egyes alsávot áttranszformálnak a frekvencia tartományba, így létrehozva a spektrális összetevőket. Végül ezeket a spektrális össztevőket nem azonos méretű csoportokba - a BFU -kba - fogják. Az alsávokra történő felosztást nagymeredekségű (100dB/oktáv) QMF (Quadrature Mirror Filter) szűrők használatával oldják meg. A bemenő jelet felső- és alsó sávra osztja az első QMF szűrő, majd a másodikat ismét két részre osztja a második szűrő. A QMF -ek használata biztosítja, hogy az alsávokra osztás miatt keletkezett időtartománybeli aliasing megszűnjön a rekonstruálás során.

3.2. ábra

A dekóder először a spektrális összetevőket állítja elő a kvantált értékekből a szó hosszt és a skála felbontási paramétert használva. Ezekből állítja elő az eredeti audio jelet. Az összetevőket először visszatranszformálják az idő tartományba az inverz MDCT segítségével, hosszú- és rövid módot használva a paramétereknek megfelelően. Végül a három, időtartománybeli jelből szintetizálják a kimeneti jelet QMF szintézisszűrőkkel.

Page 40: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 43 -

3.4.4. MPEG/audio tömörítés

3.4.4.1. Az MPEG/audio tömörítési eljárás alapjai

Az MPEG/audio tömörítési algoritmus egy ISO, Hi-Fi minőségű audio tömörítési szabvány. Ez része, egy három részből álló tömörítési szabványcsoportnak. A másik két résszel együtt a szinkronizált, digitális video és audio jel tömörítéséhez szükséges kompozit szabványt adja. Az így kialakuló adatsebesség durván 1,5 Mb/s.

Bár az MPEG algoritmus transzparens, azaz érzékelhető minőségromlás nélküli tömörítést valósíthat meg, azért mégiscsak veszteséges.

A tömörítési algoritmus jó hatásfoka a maszkolási effektus kihasználásán alapszik. A fülnek van még egy, ide kapcsolódó hiányossága: korlátolt frekvencia szelektivitással rendelkezik, amely 100 Hz -től (a legmélyebb hallható hangokra) 4 kHz -ig (a legmagasabb hangokra) terjed. Emiatt lehetséges a hallható frekvenciatartomány felosztása kritikus sávokra, amelyek a fül frekvencia függő hangkezelését tükrözik. Az algoritmus által használt kritikus sávok listáját mellékletként csatoltam (2.számú melléklet).

A fül fenti tulajdonsága miatt a zaj maszkolás kizárólag egy frekvencia sávon belüli jelaktivitás függvénye. Ez a tulajdonság a tömörítési eljárás esetén úgy hasznosítható, hogy az audio jelet a frekvencia tartományba transzformálják, az így kapott spektrumot felosztják a kritikus sávoknak megfelelő alsávokra, és végül az egyes alsávokat a kvantálási zaj hallhatóságának függvényében kvantálják. Optimális tömörítés esetén minden egyes sávhoz éppen akkora kvantálási szintet kell biztosítani, amely feltétlenül szükséges ahhoz, hogy a kvantálási zaj hallhatatlan legyen. A továbbiakban részletesen foglalkozom az MPEG/audio algoritmussal.

Page 41: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 44 -

3.4.4.2. MPEG/audio kódolás és dekódolás

3.3. ábra

A 3.3. ábrán látható az MPEG kóder és dekóder blokkdiagramja. A bemeneti jel egy szűrőcsoporton halad keresztül, amely alsávokra osztja fel azt. A jel egyidejűleg áthalad egy pszihoakusztikai modellen is, amely meghatározza a jel-maszk viszonyt (signal-to-mask ratio = SMR) az egyes alsávokra. A bit- vagy zaj allokációs blokk használja az SMR-t a kvantáláshoz rendelkezésre álló összes bit alsávok közötti kiosztásakor, a kvantálási zaj minimalizálását célként kitűzve. A legutolsó blokk fogja a kvantált mintákat egy dekódolható bit folyammá alakítani. A dekóder ezt az átalakítást egyszerűen megfordítja, felépíti a kvantált alsávok értékeit és végül visszatranszformálja ezeket egy időtartománybeli jellé. Az MPEG elvárásainak megfelelõen az audio jelhez tartozó kísérő információkra nincs szükség, de alkalmazható a kódolt bitfolyamban.

Az MPEG/audio szabványnak három, elkülönített rétege van. A Layer I tartalmazza az alap algoritmust, a Layer II és III pedig továbbfejlesztések, amelyek használják az I -es bizonyos részeit. Minden egyes plusz réteg javítja a kódolás hatékonyságát, de növeli a kóder és dekóder bonyolultságát is.

Page 42: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 45 -

3.4.4.3. Layer I

Az alap szűrőcsoportot használja, amit minden réteg tartalmaz. Ez a szűrőcsoport a jelet 32 állandó szélességű frekvencia sávra osztja. A szűrők viszonylag egyszerűek és a fül képességeihez mérten jó idő- és frekvencia tartománybeli felbontást biztosítanak. Ez egy kompromisszumos megoldás három fontos engedménnyel. Először, a 32 állandó szélességű frekvencia sáv nem tükrözi a fül kritikus sávjait (3.4. ábra). A sávszélesség túl nagy az alacsony frekvenciák esetén, így a kvantálási bitek számát nem lehet speciálisan egy-egy kritikus sávra meghatározni. Ehelyett a sávba eső legnagyobb zajérzékenységű kritikus sáv határozza meg a kvantáló bitek számát. Másodszor, a szűrőcsoport és inverze nem veszteségmentes átalakítások. Még a kvantálást elhagyva sem kapnánk vissza tökéletesen az eredeti bemeneti jelet. Szerencsére a szűrők által bevitt hiba kicsi és nem hallható. Harmadszor, a szomszédos szűrők jelentős frekvenciaátlapolással rendelkeznek. Egy adott frekvenciájú jel így két szomszédos szűrőt befolyásolhat.

3.4. ábra

A Layer I -es kóder 32 db 12 mintát tartalmazó csoportot foglal egy keretbe (32 * 12 = 384 minta). Minden egyes csoport megkapja a bit allokációt és ha ez nem nulla, akkor a felbontási tényezőt is. Sztereo többletkódolás esetén ez másképp működik. A bit allokáció határozza meg, hogy egy mintára hány bit jut. A felbontási tényezõ egy szorzó, ami úgy méretezi a mintákat, hogy maximális legyen a kvantáló felbontása. Az audio adat mellet minden keret tartalmaz egy fejrészt, egy opcionális CRC szekvenciát és esetleg egyéb többlet információkat.

Page 43: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 46 -

3.4.4.4. Layer II

A Layer I egyszerű továbbfejlesztése. Úgy éri el a jobb hatásfokot, hogy az adatokat nagyobb csoportokban kódolja. A kereteket 3 * 12 * 32 mintából készíti egy audio csatornára ( csinál egy csoportot 3 * 12 mintából, majd az így kapott csoportból 32-t egybefog és ez lesz a keret, ami 1152 mintát jelent). A Layer I 12 mintát fog csoportba alsávonként, míg a Layer II 3 * 12 mintát. A kóder csak akkor használ egyéni felbontási tényezőt a 12 mintát tartalmazó csoportok mindegyikére, ha ez szükséges a hallható torzítás elkerülése miatt. A kóder még két esetben osztja meg a felbontási tényező értékeit két vagy három csoport között:

amikor a felbontási tényezők értékei elég közel esnek egymáshoz

amikor előre látható, hogy a fül időleges maszkolása elfedi a következményként fellépő torzítást

A Layer II algoritmus azért is jobb hatásfokú a Layer I -nél, mert a bit allokációt, a felbontási tényező értékeit és a kvantált mintákat egy sokkal hatékonyabb kóddal rögzíti.

3.4.4.5. Layer III

Ez már egy sokkal kifinomultabb megoldás. Bár ez is a Layer I és II -ben alkalmazott szűrőcsoportra alapszik, annak néhány hiányosságát kompenzálja a szűrő kimenetének MDCT feldolgozásával (3.5. ábra).

3.5. ábra

Page 44: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 47 -

Az MDCT -k tovább osztják a szűrők kimeneteit a frekvencia tartományban, hogy jobb spektrális felbontást biztosítsanak. Az elkerülhetetlen idő- és frekvencia tartománybeli felbontási különbség miatt a Layer III két különböző hosszúságú MDCT blokkot definiál: hosszú blokk, amely 36 mintából áll és rövid blokk amely 12 -ből. A rövid blokk javítja az idő tartománybeli felbontást és így megbirkózik a tranziensekkel. Egy rövid blokk hossza pont harmad része egy hosszú blokknak; így alkalmazásakor három rövid blokk helyettesít egyetlen hosszút. A hosszú- és rövid blokkok közti átváltás nem azonnali. A Layer III -nak háromféle blokkolási módja van: két mód, amikor a szűrők kimenetei egyforma blokkhosszúsággal haladhatnak át az MDCT -n, és egy kevert mód, amikor a 2 alsó frekvenciasáv hosszú blokkot, a többi 30 pedig rövidet használ.

További jelentős fejlődések a Layer I -hez és II -höz képest:

Alias csökkentés: a Layer III definiál egy eljárást az MDCT értékeire, amivel kiszűri a fölösleges részeket a jelből, amiket a szűrő egymást átlapoló sávjai okoznak.

Nemlineáris kvantálás: a Layer III kvantáló bemeneti teljesítményét a teljes 3/4 részére növeli kvantálás előtt, hogy állandóbb J/Z viszonyt biztosítson a kvantálás teljes tartományán. A dekóderben lévő rekvantáló kimeneti teljesítményét 4/3 részre növeli, hogy helyreállítsa a linearitást.

Az értékek entrópia kódolása: a Layer III Huffmann kódolást használ a kvantált minták kódolására a jobb adat tömörítés érdekében.

Bit tároló használata: a Layer III bit folyamának kialakítása jobban alkalmazkodik a tömörített adat változó hosszúságához. Mint a Layer II a Layer III is 1152 mintából álló keretekbe foglalva dolgozza fel az adatokat. A Layer II -től eltérően azonban itt a mintákat reprezentáló kódolt adatnak nem szükséges egy fix hosszúságú keretbe illeszkednie a kódolt bit folyamban. A kóder adhat biteket a bittárolóba, vagy elvehet onnan, amikor szükség van rá.

Zaj allokáció bit allokáció helyett: a Layer I és II által használt bit allokációs eljárás csak a kvantálás által, egy adott számú bitre bevitt zajt becsli fel. A Layer III zaj allokáció iterációs hurkot használ. Ebben a hurokban a kvantálók szabályos sorrendben váltakoznak és az így adódó kvantálási zaj értékét specifikusan osztják szét az egyes alsávok között.

Page 45: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 48 -

3.4.5. Sztereo többletkódolás (Stereo Redundancy Coding)

Az MPEG/audio algoritmus két típusát támogatja a sztereo többlet kódolásnak: az intenzitás sztereo kódolást és a közép/oldal (Middle/Side = MS) sztereo kódolást. Mindkét többletkódolás a fül egy újabb érzékelési gyengéjét használja ki. A pszihoakusztikai eredményekből kitűnik, hogy a kb. 2 kHz -nél magasabb frekvenciákat lefedő kritikus sávokon belül a fül a sztereo hangtér leképezését már inkább a hangjel burkológörbéje, és nem a finom szerkezete alapján végzi.

Mindhárom réteg támogatja az intenzitás sztereo kódolást, de csak a III támogatja az MS-t.

Intenzitás sztereo kódolás esetén a kóder néhány magasabb frekvenciájú szűrő kimenetet egyetlen, összegzett jellel kódol. A spektrális alakja a jobb és bal csatornának ugyanolyan egy intenzitás kódolt szűrőcsoport jelén belül, de az abszolút értékek különböznek.

MS sztereo módban a kódoló a jel jobb és bal csatornáját egy közép- (a bal és jobb összege) és egy oldal csatornában (a bal és jobb különbsége) kódolja. Ezen kívül a kódoló speciálisan beállított technikákat alkalmaz az oldal csatorna további tömörítésére.

Page 46: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 49 -

4. A szakirodalomból levont tapasztalatok

Szakdolgozatom irodalomfeldolgozás részében áttekintettem az analóg és digitális hangfeldolgozás alapjait, értelmeztem és magyaráztam azokat a hangtani fogalmakat, melyek segítségével jellemezhetünk egy hangmintát. Összehasonlítást végeztem a digitális és az analóg jelfeldolgozás között. Ismertettem a digitalizálás folyamatát, eszközeit és magát a digitalizálási lehetőségeket. Kitértem az ember hallás-érzékelésének jellemzőire és azokra a kritikus szempontokra, melyeket a tömörítési és kódolási folyamatoknál figyelembe kell venni. Számos eljárást ismertettem, melyekkel a hétköznapi ember nap, mint nap találkozik.

Természetesen az adatmennyiség csökkenésével lecsökkenhet, vagy megváltozhat a zenemű hangzásvilága. A változás mértéke és minősége minden esetben függ az alkalmazott digitalizálási és kódolási eljárástól. A számunkra legoptimálisabb megoldás kiválasztásához tisztában kell lennünk azzal, hogy melyik eljárás milyen hatással van egy-egy hanganyag jellemző paramétereire.

Azonban egyetlen irodalomban sem találtam olyan összehasonlítást mely ezen eljárások végeredményét objektív és szubjektív értékítéletek alapján egyaránt összehasonlítaná. Ahogy a dolgozatom célkitűzéséből is kiderül, ugyanazon hangminta különböző kódolási változatainak összehasonlítását fogom elvégezni objektív és szubjektív szempontok alapján egyaránt.

Az összehasonlítás rendkívül bonyolult, hiszen az emberi fül érzékelésében kétségtelenül szerepet játszanak emocionális, más érzékszervek által közvetített ingerek is, melyet számítógépes analízissel lehetetlen kimutatni, elemezni. Ezért nagyobb hangsúlyt fektetek a szubjektív szempontokra, végül is az összes kódolási eljárásnak a lényege az, hogy a művészi alkotásokat befogadó emocionális lény, az ember számára tegye racionálisan elérhetővé a zene hallgatását.

Page 47: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 50 -

5. A hangminták előállításának folyamata A kiválasztott felvétel - Antonin Dvořak: VIII., G-dúr szimfóniája - CD-n és DVD-n állt

rendelkezésemre, mely 2004. karácsonyárára készült a Matáv Rt VIP ajándékaként. A felvétel a budapesti Zeneakadémia Nagytermében készült 2004. szeptemberében. Több szempontra is ügyelnem kellett a választás során, a szélsőségek előfordulására mind a dinamika, mind a hangmagasság, mind pedig a hangszerek egyidejű megszólalása szempontjából. A kiválasztott 70 másodperc. hosszúságú hanganyag részletből állítottam elő a 5.1. táblázatban ismertetett mintákat.

Minta Típus Szóhossz

[bit]

Mintavételi frekvencia

[kHz]

Bitebesség

[kb/s]

1 CD 16 44.1 1411

2 AC3 16 44.1 1536

3 ATRAC LP2 16 44.1 1411

4 ATRAC LP4 16 44.1 1411

5 MP3 16 44.1 48

6 MP3 16 44.1 128

7 MP3 16 44.1 256

5.1. táblázat

5.1. AC3

A forrás DVD-ről származó vob kiterjesztésű file eleve AC3 kódolású, ezért nem volt szükséges az átalakítás.

5.2. CD A CD minőségű mintát a Liszt Ferenc Zeneművészeti Egyetem Audiovizuális Stúdiója

(Aviso) tette számomra hozzáférhetővé, így ennek az előállításával sem kellett foglalkoznom.

Page 48: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 51 -

5.3. MP3 Az MP3-as tömörítésekhez a DVD-n rendelkezésemre álló vob kiterjesztésű fájlt

alakítottam wav-vá a GraphEdit program segítségével a 5.1. és 5.2 ábrán szemléltetett módon.

5.1. ábra

5.2. ábra

A kapott file-t ezután Audio Conversion Wizard programmal a kiválasztott MP3 formátumokra konvertáltam, melyeket az 5.1. táblázatban rendre felsoroltam.

5.4. ATRAC

Az ATRAC minták előállításához a CD lemez anyagát vettem alapul. Digitális kimenettel rendelkező CD lemezjátszót összekötöttem optikai bemenettel ellátott asztali Mini Disk

Page 49: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 52 -

lejátszóval. A lejátszó digitális bemenetről felvenni képes, és az igényeknek megfelelően lp2 és lp4 üzemmód tetszés szerint beállítható. Lp4-es tömörítés esetén négyszer annyi zenét másolhatunk a lemezre, mintha CD minőségben szeretnénk rögzíteni. Mindkét módban készítettem egy-egy mintát, majd azokat lejátszva, asztali CD íróval a mintákat CD lemezre rögzítettem.

Page 50: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 53 -

6. Hangminták spektrumának összehasonlítása a Sound Forge 8.0 program segítségével

A különböző kódolási eljárásokkal tömörített hangminták spektrális összehasonlítását elvégezhetjük spektrumanalizátor segítségével. Így képet kapunk arról, hogy különböző frekvenciájú komponensek milyen intenzitással kerültek rögzítésre. A kódolási eljárás függvényében a spektrumon is láthatjuk a változást az alkalmazott tömörítési eljárásnak megfelelően. Ezt azért tehetjük meg, mert minden esetben azonos zenerészletet vizsgálunk.

A zenei részlet kiválasztásakor olyan részt igyekeztem kiválasztani, ahol egyaránt szerepelnek halk és hangos részek.

A halk részletben mindössze egy szóló hangszer hallható, ami remek lehetőséget ad a jel-zaj viszony vizsgálatára. Ezzel ellentétben a minta közepén sok hangszer egyidejű játéka lehetővé teszi, hogy megtudjuk milyen spektrális felbontással rendelkeznek az egyes minták.

Az összehasonlítás alapjául két nevezetes pontot jelöltem ki a mintákban és azok spektrális összetevőit vizsgáltam.

Nem tartom indokoltnak az összes minta spektrumát ábrázolni csupán a legelterjedtebb kódolási eljárásokkal tömörítetteket hasonlítom össze.

Első vizsgálati pont: a minta első részében helyezkedik el, ahol csak szóló hangszer hallható

Második vizsgálati pont: a minta közepén helyezkedik el, a hangszerelés széles tartományon teszi lehetővé a spektrális vizsgálatot (basszus és magas alaphang-tartományú hangszerek egyidejű játéka)

Page 51: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 54 -

6.1. CD Első vizsgálati pont:

Második vizsgálati pont:

A spektrumábrákon látható, hogy a spektrum teljes tartományában vannak komponensek. Logaritmikus léptékben ábrázoltam, így jól megfigyelhető az egyes hangszerek spekrtális eloszlása. A mintavételi frekvenciának megfelelően állítottam be az ábrázolandó tartomány felső értékét. A CD esetében látható, hogy ez 22 kHz.

Page 52: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 55 -

6.2. AC3 Első vizsgálati pont:

Második vizsgálati pont:

Az első szakasz esetén kitűnik, hogy 18 kHz-nél magasabb frekvenciák nem kerülnek tárolás-ra ezzel a kódolási eljárással. A 12 kHz alatti frekvenciatartományon a CD-hez képest érdemi változás nem történik. A második szakasz vizsgálata során, azt tapasztaltam, hogy a 14 kHz feletti tartomány ebben az esetben sem került rögzítésre, míg az alacsonyabb frekvenciák a CD-vel közel azonos amplitúdóval látható

Page 53: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 56 -

6.3. ATRAC LP2 Első vizsgálati pont:

Második vizsgálati pont:

LP2-es tömörítés esetén 16-17 kHz körül van az a határ, ami fölötti komponensek nem kerülnek rögzítésre. Ennek hatása a hangélményben mindenképpen jelentkezik.

Page 54: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 57 -

6.4. MP3 256kbit Első vizsgálati pont:

Második vizsgálati pont:

Ahogy az ábrán is látható a mintákban 17 kHz-nél nagyobb frekvenciájú komponens nem kerül rögzítésre.

Page 55: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 58 -

6.5. MP3 128kbit Első vizsgálati pont:

Második vizsgálati pont:

A tömörítés hatékonyságának és a fájlméret csökkenésének az ára, hogy ebben az esetben a rögzítésre kerülő frekvenciák alacsonyabbak mint 14 kHz.

Page 56: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 59 -

7. Kódolási eljárások összevetése egy mintacsoport ún. A/B tesztjei alapján (szubjektív vizsgálat)

7.1. Hangfelvételek esztétikai megítélése

Az egységes hangfelvétel-értékelés megteremtésének érdekében a 60-as években az akkori „kelet európai” rádiószervezet (OIRT) keretein belül nemzetközi összefogással és erőteljes német irányítással egy külön tanulmányi csoport szerveződött azzal a feladattal, hogy kidolgozza a szubjektív értékelés paramétereit, továbbá, hogy ezeket a szempontokat értelmezze, és a gyakorlatban kipróbálja.

Az évenként rendezett konferenciákon nemzetközi hanganyagok segítségével „próbaértékeléseket” is végeztek, amelyek során a résztvevők hallása, ítélőképessége mellett maguk a paraméterek értelmezése is fokozatosan finomodott.

A tevékenység magas színvonalára jellemző, hogy a berlini fal leomlása után immáron az európai rádiószervezeteket tömörítő EBU e munka eredményeit lényegében változtatások nélkül vette át és alkalmazza.[2]

Ugyanezen irányelven haladtam munkám során, és ugyanezen módszert alkalmazván a Liszt Ferenc Zeneművészeti Egyetem által is használt értékelőlapokat (3. számú melléklet) tölttettem ki a hallgatókkal.

Az EBU által szervezett meghallgatásokon a korábbi öt számjegyes rendszer helyett a hat számjegyes osztályzást alkalmazzák. A hat számjegy ugyanis arra sarkall, hogy a hallgató személy eldöntse, hogy a paraméterre a közepesnél jobb, vagy rosszabb osztályzatot adjon. Míg az ötös skálán hajlamos a résztvevő több, nem egyértelmű esetben közepes megítéléssel megkerülni a döntést.

Page 57: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 60 -

A hangfelvételek esztétikai megítélésére kialakított értékelőlap a következő paramétereket tartalmazza:

Hangszínezet

Térérzet

Hangtisztaság

Sztereóhatás

Egyensúly

Zaj

Dinamika

Összbenyomás

Valamennyi paraméternél a 6-os a legjobb, az 1-es pedig a legrosszabb osztályzat.

Fontosnak tartom megemlíteni, hogy az általam lefolytatott vizsgálat résztvevői mind tisztában voltak e paraméterek jelentésével, illetve a módszer lényegével, ugyanis tananyagként szerepel tanrendjükben.

Page 58: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 61 -

7.2. A hangminták hallgatási sorrendjének meghatározása

Hangfelvételek esztétikai megítélésénél óriási szerepe van a hallgató alany korábbi tapasztalatainak, esetleg beidegződéseinek. Tapasztalat alatt érthetünk sok éves zenei múltat, de nem hagyhatjuk figyelmen kívül a legutoljára hallott hanganyagot, melynek legélénkebben él az emléke. Ezt akaratlanul is valamiféle összehasonlítási alapként, etalonként kezeli az agy. Ezért is döntő fontosságú hogy egy-egy hangminta előtt a hallgató csoport milyen zenei előzményekkel rendelkezik, illetve több hanganyag esetén mi a sorrend.

Az első számú minta kiválasztásánál azt az általános véleményt vettem alapul, miszerint a CD minőségű (44,1 kHz / 16 bit / 1411 kb/s) hanganyag az első igazán nagy áttörés a „ digitális hangzásbeli valósághűség” irányába.

A második és harmadik hangminta megválasztásakor az volt a célom, hogy behatároljam a minőséget, vagyis a veszteséges tömörítést alkalmazó hangminták közül a két szélsőség bemutatásával folytattam. Másodikként a DVD-ről (48 kHz / 16 bit / 1536 kb/s) nyert AC3 kódolással tömörített hangminta, harmadikként pedig MP3 (44,1 kHz / 16 bit) kódolású, 48 kb/s bitsűrűségű hanganyagra esett a választásom. Tisztában voltam vele, hogy egy vájt fülű hallgató csoport számára ez felér egy merénylettel, de kíváncsi voltam, mennyire befolyásolja a szélsőségesen gyenge minőség a következő minta értékelésében. Természetesen a minőség alatt itt is az emberi fül szempontjából, szubjektív megítélés által meghatározott minőséget értem.

Negyedikként megint a CD hanganyagot hallgattattam meg. Innentől kezdve a minták sorrendjének úgy alakítottam ki, hogy az a lehető legkisebb mértékben befolyásolja a vizsgálat eredményét. Sorrendben az ATRAC lp2 (44,1 kHz / 16 bit / 1411 kb/s), az MP3 (44,1 kHz / 16 bit / 256 kb/s), ATRAC lp4 (44,1 kHz / 16 bit / 1411 kb/s) és végül az MP3 128 kb/s formátum (44,1 kHz / 16 bit) következett, amit szokásos CD közeli minőségként megjelölni. Sőt, többek szerint a hallgatók nagy része nem érzékeli a különbséget a 128 kb/s-os és a 256 kb/s-os MP3 formátum között. Meg kell jegyezzem, hogy környezetemben nem találkoztam senkivel, akit ebbe a csoportba sorolnék, tehát meggyőződésem, hogy a technika mai állása szerint, és a rohamos fejlődés szempontjából a jövőbe tekintve nincs szükség megalkuvásra. Nyugodtan választhatunk jobb minőséget, hiszen ha csak a „sétáló” MP3 lejátszókat nézzük, már itt is GB nagyságrendű tárhelyekkel rendelkezünk.

Page 59: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 62 -

A végleges sorrendet a 5.2. táblázat szemlélteti.

Sorrend Típus Szóhossz

[bit]

Mintavételi frekvencia

[kHz]

Bitsebesség

[kb/s]

1 CD 16 44.1 1411

2 AC3 16 48 1536

3 MP3 16 44.1 48

4 CD 16 44.1 1411

5 ATRAC LP2 16 44.1 1411

6 MP3 16 44.1 256

7 ATRAC LP4 16 44.1 1411

8 MP3 16 44.1 128

5.2. táblázat

Mi értelme volt egy hangmintát kétszer– másodszor mintegy placebóként – értékeltetni? Meglátásom szerint rengeteg - eddig feltételezés formájában felmerülő - tanulságot vonhatunk le a két értékelésből. A legmeghatározóbb ezek közül mindenképpen a fentiekben boncolgatott - sorrend, előzmény, tapasztalat - kérdéssel kapcsolatos. A két eredmény kiértékelésével a 7.4. fejezetben részletesen foglalkozom.

Page 60: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 63 -

7.3. A vizsgálat menete A vizsgálat a Liszt Ferenc Zeneművészeti Egyetem Audiovizuális Stúdió (továbbiakban

AVISO) stúdióhelyiségében, normál lehallgatási hangerőn, KRK gyártmányú, V88 típusú referencia stúdiómonitor hangsugárzókon zajlott, a Liszt Ferenc Zeneművészeti Egyetem 28 első évfolyamos hangszeres hallgatójának közreműködésével.

A minták meghallgatása négy részletben zajlott, vagyis egyszerre 7-en vettek részt a projektben, a maradék két értékelőlap egyikét konzulensem, a másikat pedig én magam töltöttem ki a vizsgálat kezdete előtt, azzal a céllal, hogy a „próbaértékeléssel” az esetlegesen felmerülő hibákat kiszűrjük, és hogy megtaláljuk a hanganyagok lejátszásának a stúdió akusztikájához optimális hangerősségét.

A tanulmányaim során elsajátított elvek gyakorlati kivitelezésekor a következő paramétereket érvényesítettem: A hangszórók bázistávolsága optimális volt (3 méter), hiszen az ajánlott távolság 2-4 méter közötti érték. Ebből adódóan a paraméterek:

b=3 m

h=0,9*b=2,7 m

hallási szög 60˚

A vizsgálat közben a hallgatók elhelyezkedését, és a paramétereket a 7.1 ábra szemlélteti.

7.1. ábra

Page 61: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 64 -

7.4. Eredmények A vizsgálat lefolyása után a kapott eredményeket táblázatba foglaltam, amit nyolc oldalas

terjedelme miatt szakdolgozatomhoz mellékletként (4.számú melléklet)csatoltam.

Az értékelő lapok között nincsenek feltűnően szélsőséges osztályzatok, sőt a paraméterenkénti átlageredménytől alig eltérően, pozitív és negatív irányban szinte egyenlő arányban oszlanak el. Így tehát megalapozottan átlagolhattam. a 30 értékelő lapot. Tehát a továbbiakban a kiátlagolt eredményekből vontam le következtetéseimet. A 7.1. táblázatban az összesített eredményeket szemléltetem.

Érdemes megfigyelnünk, hogy a legmagasabb átlageredmény 5,4 ami jelen esetben a CD2 összbenyomását jellemzi. Ez nyilvánvalóan abból adódik, hogy eme hangmintát az MP3 48 kb/s–os kódolású hangrészlet után közvetlenül értékelte a csoport. És az sem kerülheti el figyelmünket, hogy 5 feletti érték csupán néhány alkalommal fordul elő a táblázatban, és mindannyiszor a CD minőségű hangminta bizonyos paramétereinek értékelését tükrözi.

CD 1 AC3 MP3 CD 2 ATRAC lp2

MP3 ATRAC lp4

MP3 Kódolt hangminták

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s

]

1411 [kb/s]

128 [kb/s]

Hangszínezet 4,73 4,33 2,30 4,80 4,13 4,10 4,00 3,77 Térérzet 4,73 4,67 2,17 4,70 4,10 3,93 3,57 3,83

Hangtisztaság 4,87 4,43 2,50 4,93 4,03 4,13 3,87 3,70 Sztereo hatás 4,93 4,30 2,43 5,03 3,87 3,93 3,87 3,97

Egyensúly 5,27 4,73 2,30 5,33 4,53 4,40 4,20 4,10 Zaj 4,50 3,77 1,30 4,70 3,80 3,37 3,43 3,23

Dinamika 5,13 4,80 2,30 5,17 4,50 4,20 3,87 4,03 Összbenyo-

más4,97 4,50 1,67 5,40 4,30 4,10 3,90 3,73

7.1. táblázat

Page 62: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 65 -

A 7.1. diagram szemlélteti az összes paraméter minőségi jellemzőit a vizsgált minták sorrendjében, majd a 7.2.ábra ugyanezen paramétereket minőség alapján csökkenő sorrendben.

0,00

0,50

1,00

1,50

2,00

2,50

3,00

3,50

4,00

4,50

5,00

5,50

6,00

CD1 1411 [kb/s]

AC3 1536 [kb/s]

MP3 48 [kb/s]

CD2 1411 [kb/s]

ATRAC lp21411[kb/s]

MP3 256 [kb/s]

ATRAC lp41411[kb/s]

MP3 128 [kb/s]

Hangszínezet Térérzet Hangtisztaság Sztereo hatás Egyensúly Zaj Dinamika Összbenyomás

7.1. diagram

0,00

0,50

1,00

1,50

2,00

2,50

3,00

3,50

4,00

4,50

5,00

5,50

6,00

CD2 1411 [kb/s]

CD1 1411 [kb/s]

AC3 1536 [kb/s]

ATRAC lp21411[kb/s]

MP3 256 [kb/s]

ATRAC lp41411[kb/s]

MP3 128 [kb/s]

MP3 48 [kb/s]

Hangszínezet Térérzet Hangtisztaság Sztereo hatás Egyensúly Zaj Dinamika Összbenyomás

7.2. diagram

Page 63: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 66 -

A 7.1. és 7.2. diagramok alapján megállapíthatjuk, hogy az egyetlen tömörítetlen hangminta, a CD beváltotta az objektív vizsgálatra alapozott reményeinket. Csupán néhány tizeddel lemaradva az AC3, majd alig megelőzvén a 256 kb/s-os bitsebességű MP3-at, az ATRAC lp2 kódolású minta következik. Az alig néhány tizedes eltérések nagyon bíztatóak, ugyanis feltételezhető, hogy egy átlagos hallással rendelkező egyén alig, vagy egyáltalán nem érzékeli a minőségkülönbséget, miközben a tömörítés által nyert tárhelyünk sokszorosára nő.

A következők, szintén nagyon szoros eredménnyel az ATRAC lp4 és a 128 kb/s-os, a legvégén pedig jól látható lemaradással a 48 kb/s–os bitsűrűségű MP3 hangminta szerepel.

A 7.2. diagramon szemléltetett sorrendet az összbenyomás paraméter szerint állítottam fel, majd ellenőrzésképpen a paraméterek értékeinek átlagolásával is megtettem ugyanezt. Az eredmény azonos lett, pedig ez nem törvényszerű és azt a 7.3.8. fejezetben fejtem ki bővebben.

A további fejezetekben minden egyes paraméterre részletesen kitérek, és mindegyik alapján felállítom az aktuális sorrendet, így átfogó képet kaphatunk a vizsgálat eredményéről.

Az összesített eredmény szemléltetése során még mid a 8 hangminta értékelését feltüntettem, a későbbiek során viszont a két egyforma hangminta közül már csak az egyikkel dolgozom. Hogy melyiket választottam a célból, hogy a továbbiakban a CD minőséget képviselje, az számomra egyértelmű volt. A 7.4. fejezet tükrében kijelenthetjük, hogy a két értékelés között minimális különbségek voltak, és a végső sorrend szempontjából is teljesen érdektelen a választás. Mégis az elsőként meghallgatott mintát ítéltem hitelesebbnek, a 5.2. fejezetben már kifejtett okok miatt, miszerint az előzmények befolyással lehetnek az értékelés kimenetére. Ebből a szemszögből nézve hitelesebb értékelést kapunk, ha a viszonyítási alap az élő hangzás, mint hogyha egy gyenge minőségnek számító hangminta, esetünkben a 48 kb/s-os bitsebességű MP3.

Page 64: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 67 -

7.4.1. Hangszínezet

E paraméter megítélésekor a hangforrások eredeti és a felvételen hallható spektruma kerül összehasonlításra. Ilyenkor az eredeti hangszín csupán az „emlékezetben él”, az összehasonlításkor a korábbi élmények, beidegződések fontos szerepet játszhatnak. Ez azonban azt is eredményezheti, hogy egy éles felvétel után az egyébként hangszín szempontjából megfelelő felvétel már mattnak tűnik.

Hangszínezet

3,77

4,734,33

2,30

4,80

4,13 4,10 4,00

0,0

0,51,0

1,5

2,0

2,53,0

3,5

4,0

4,55,0

5,5

6,0

CD1 1411 [kb/s]

AC3 1536 [kb/s]

MP3 48 [kb/s]

CD2 1411 [kb/s]

ATRAC lp21411[kb/s]

MP3 256 [kb/s]

ATRAC lp41411[kb/s]

MP3 128 [kb/s]

Kódolt hangminták

Minős

ítés

7.3. diagram

Tehát e paraméter esetében az ítéletet a meghallgatásra kerülő hanganyagok lejátszási

sorrendje is befolyásolhatja. Éppen ezért fontosnak tartottam hogy 7.3. diagramon a lejátszási sorrendben tüntessem fel a vizsgált mintákat.

Megfigyelhetjük, hogy a CD2 óriási sikerét valószínűleg az előtte meghallgatott gyenge minőségű MP3 48 kb/s-os mintának köszönheti. A sorrendben a további hangminták viszonyítási alapja megint a kiváló CD minőség, így nem mutatnak befolyásolásra utaló eredményeket.

Page 65: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 68 -

7.4.2. Térérzet

Az élő zenei előadások alkalmával is az egyik legfeltűnőbb akusztikai jellemző az utózengés színezete, mértéke. Hasonló a helyzet a felvételek esetében is, hiszen a lejátszás elindításakor már az első hangosabb hangok után érezhetők (vagy éppen hiányolhatók) a hangtér válaszai.[2]

Térérzet

4,73 4,674,10 3,93 3,83

3,57

2,17

0,00,51,0

1,52,02,53,0

3,54,04,55,0

5,56,0

CD 1411 [kb/s]

AC3 1536 [kb/s]

ATRAC lp21411 [kb/s]

MP3 256 [kb/s]

MP3 128 [kb/s]

ATRAC lp41411 [kb/s]

MP3 48 [kb/s]

Kódolt hangminták

Minős

ítés

7.4. diagram

Itt az elsődleges szempont, hogy a kódolások ne vágják le a hangtér válaszait, és lehetőleg a hangszínét se változtassa meg nagymértékben. A 48 kb/s bitsebességű MP3 kódolású hangmintát több esetben érte kritika, de eredményeit tekintve az egyik leggyengébb paramétere a teremérzet. Amint a megjegyzésekből is kiderült, többek szerint üveghangzású, illetve tompa burokhangzás jellemzi, ami a 6 kHz-es levágással magyarázható, ami a minta spektrumának ábrázolásából tisztán látszik.

A 7.4. diagram által szemléltetett sorrend nagy meglepettségre nem ad okot. Érdemes megfigyelni a CD és az AC3szoros eredményeit, továbbá a középmezőnyben fellépő, alig tizednyi eltéréseket, amelyek az összes paraméteren végigvezethetők.

Page 66: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 69 -

7.4.3. Hangtisztaság

E paraméternél nem a zenei tisztaság, hanem a szólamok érthetősége osztályozandó. A felvétel hangtisztasága akkor jó, ha a szólamok jól megkülönböztethetők egymástól. Természetesen csak azokról a szólamokról van szó, melyeknek a szerző és az előadó szándékai szerint jól követhetően meg is kell jelenniük, s nem pedig azokról melyeknek bele kell olvadniuk az együttes hangzásba.

Hangtisztaság

3,87

2,50

3,704,034,134,43

4,87

0,00,51,01,52,02,53,03,54,04,55,05,56,0

CD 1411 [kb/s]

AC3 1536 [kb/s]

MP3 256 [kb/s]

ATRAC lp21411 [kb/s]

ATRAC lp41411 [kb/s]

MP3 128 [kb/s]

MP3 48 [kb/s]

Kódolt hangminták

Minős

ítés

7.5. diagram

A hangtisztaság megítélésekor különös szerepet játszanak a tranziensek. Például az ütők egy szimfonikus felvételen általában jól hallhatóak ugyan, de hangtisztasági szempontból ez is csak akkor megfelelő, ha az ütések konkrét belépései is jól érzékelhetőek.

A tömörítetlen kategória egyetlen képviselője, a CD alig kimagaslóan ugyan, de a legjobbnak bizonyult, viszont nem hagyhatjuk figyelmen kívül az azt szorosan követő csoportot.

Page 67: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 70 -

7.4.4. Sztereóhatás

A hangfelvételek elemzésekor különbséget kell tennünk a „térhatás” és „sztereóhatás” között, jóllehet mindkét fogalomnak az irányhalláshoz van köze, de a sztereóhatásnál inkább az irányok konkrét megjelenése és érzékelhetősége a döntő. Nem véletlen, hogy a paraméterek között talán ennek megítélése függ legjobban a lehallgató rendszer elrendezésétől, s a hallgatók hangszórókhoz viszonyított elhelyezkedésétől. A 7.1. fejezetben, a vizsgálat menetének részletezése során kifejtett beállítások leghangsúlyosabban a sztereóhatás szempontjából játszanak szerepet. A 60˚-os bázisszög viszont egyenesen elengedhetetlen feltétel.

Sztereóhatás

4,93

4,303,97 3,93 3,87 3,87

2,43

0,00,51,01,52,02,53,03,54,04,55,05,56,0

CD 1411 [kb/s]

AC3 1536 [kb/s]

MP3 128 [kb/s]

MP3 256 [kb/s]

ATRAC lp21411 [kb/s]

ATRAC lp41411 [kb/s]

MP3 48 [kb/s]

Kódolt hangminták

Minős

ítés

7.6 diagram

Az „élő” hallgatáskor a hang a pódium felől végtelen sok hangirányból éri a fület, pontosabban a tudatot, hiszen a fül csupán közvetíti az információkat, melyek alapján a tényleges kiértékelést az agy végzi. A megközelítően ideális sztereóátvitel ezért csak végtelen számú csatornával lenne lehetséges. A köztes irányokat a két hangszóró alakítja ki, elsősorban intenzitás-különbségek alapján.

Page 68: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 71 -

7.4.5. Egyensúly

Ennél a paraméternél az egyes hangforrások kölcsönös, illetve az együttes egészéhez viszonyított hangossága vizsgálandó. Az „optimális”, vagy akár csak a „megfelelő” arányok meghatározása igen összetett feladat, hiszen a zenei arányok megítélése az évszázadok során is változott.

Egyensúly5,27

4,734,53 4,40 4,20

2,30

4,10

0,00,51,01,52,02,53,03,54,04,55,05,56,0

CD 1411 [kb/s]

AC3 1536 [kb/s]

ATRAC lp21411 [kb/s]

MP3 256 [kb/s]

ATRAC lp41411 [kb/s]

MP3 128 [kb/s]

MP3 48 [kb/s]

Kódolt hangminták

Minős

ítés

7.7. diagram Az általam választott hanganyag esetében a szinte végtelen sok lehetőség közül kiemelve

a legfontosabbakat, a hangfelvétel egyensúly szempontjából történő megítélésekor többek között a következő arányok kerültek értékelésre:

vonóskar/fúvóskar szóló/kíséret illetve egyetlen hangszer belső aránya

Az értékelés eredménye a 7.7. diagramon látható.

Page 69: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 72 -

7.4.6. Zajmentesség

A hangfelvételeken hallható zajok eredetük alapján az alábbi csoportokra oszthatók: Hangtechnikai eredetű zajok, torzítások Az előadók, illetve a közönség zaja Elektromos, elektromágneses környezeti zavarok.

Zajmentesség

4,50

3,80 3,773,43 3,37 3,23

1,30

0,00,51,01,52,02,53,03,54,04,55,05,56,0

CD 1411 [kb/s]

ATRAC lp21411 [kb/s]

AC3 1536 [kb/s]

ATRAC lp41411 [kb/s]

MP3 256 [kb/s]

MP3 128 [kb/s]

MP3 48 [kb/s]

Kódolt hangminták

Minős

ítés

7.8. diagram A közönség és az előadók zaja a hangminta kódolási, tömörítési zaja szempontjából a

zenemű részének tekinthető. Tehát a 7.8. diagram elemzésekor az eredmények viszonya a mérvadó.

Érdekes viszont, hogy a hallgatók közül a CD hangmintánál többen megjegyezték, hogy a kottalapozás (ami ugyebár szintén zajnak számít) kevésbé hallatszik. Ennek ellenére az eredmények feldolgozása közben nem találkoztam véleménnyel, mely azt állította volna, hogy a felvétel elmosódott, esetleg tompa hangzású lenne, ami megmagyarázhatná a többi hangmintában tisztán kivehető háttér zajok beolvadását a CD-nél.

Page 70: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 73 -

7.4.7. Dinamika

A dinamika a mű során előforduló leghalkabb és legerősebb részek közötti különbség. Az objektív dinamika esetén ez az említett részekhez tartozó hangfrekvenciás feszültségszintek (akusztikai mérésnél hangnyomásszintek) közötti dB különbséggel jellemezhető. Ebből következik, hogy a „nagy dinamika” nem a nagy hangosságot, hanem a dinamikai szélsőségeket jelenti.

Dinamika

4,80

3,87

2,30

4,034,204,505,13

0,00,51,01,52,02,53,03,54,04,55,05,56,0

CD 1411 [kb/s]

AC3 1536 [kb/s]

ATRAC lp21411 [kb/s]

MP3 256 [kb/s]

MP3 128 [kb/s]

ATRAC lp41411 [kb/s]

MP3 48 [kb/s]

Kódolt hangminták

Minős

ítés

7.9. diagram

Az objektív dinamika a fent említett mérések eredményeként adódik, tehát ha egy felvétel legalacsonyabb és legmagasabb szintje között 50 dB a különbség, ennyi a felvétel dinamikája.

A szubjektív dinamika nem határozható meg ilyen mérőszámmal, hiszen érzete a hallgatás során a hallgató alanyban alakul ki.

Page 71: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 74 -

7.4.8. Összbenyomás

A felsorolt paraméterekre adott osztályzatok átlagát képezve egyetlen számadattal is megadható a hangzásról alkotott összképünk.

Összbenyomás

1,67

3,733,904,104,304,504,97

0,00,51,01,52,02,53,03,54,04,55,05,56,0

CD 1411 [kb/s]

AC3 1536[kb/s]

ATRAC lp21411 [kb/s]

MP3 256 [kb/s]

ATRAC lp41411 [kb/s]

MP3 128[kb/s]

MP3 48[kb/s]

Kódolt hangminták

Minős

ítés

7.10. diagram

A tapasztalatok, és a mellékelten csatolt eredmények azonban azt mutatják, hogy a paraméterek matematikai átlaga és az összbenyomás ellentmondhat egymásnak. Nem teljes értékű részparaméterek esetén is kialakulhat lenyűgöző összhatás, míg, 100٪-os rész-osztályzatok esetén is lehet az összkép gyenge. A 7.2. táblázat a hangminták összbenyomása és a paramétereik átlagának eltérését hivatott bemutatni.

7.2. táblázat

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3 Kódolt hangminták 1411

[kb/s] 1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Paraméterek átlaga

4,88 4,43 2,19 4,95 4,14 4,01 3,82 3,80

Összbenyomás 4,97 4,50 1,67 5,40 4,30 4,10 3,90 3,73

Page 72: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 75 -

7.5. A vizsgálat hitelességének alátámasztása Azt, hogy a mintákat minősítő csoportot, vagyis a Liszt Ferenc Zeneművészeti Egyetem

hallgatóit, joggal nevezhetjük kitűnő alanynak, többek közt a 7.11. diagram is alátámasztja.

A vizsgálat során meghallgattatott minták közül az egyiket kétszer játszottam le. Választásom a 16 bites, 44,1 kHz–es CD formátumú hangmintára esett, mert véleményem szerint a legjobb hangminőségű formátumok közül még mindig a CD a legelterjedtebb.

A két azonos hangminta összehasonlítása

4,73 4,50

5,134,73 4,93

5,274,974,874,80 4,70 4,93 5,03

5,33

4,705,17

5,40

0,000,501,001,502,002,503,003,504,004,505,005,506,00

Hangsz

ínezet

Térérze

t

Hangti

sztasá

g

Sztereo

hatás

Egyen

súly

Zaj

Dinamika

Összbe

nyom

ás

Minősítési szempontok

Minős

ítés

CD 1 CD 2

7.11. diagram

Két kérdésre vártam választ az eredményektől, hogy milyen mértékben fog eltérni a

hangminta két alkalommal való minősítése, illetve, hogy megállapítható-e egyértelműen, hogy az egyik hangmintát jobbnak ítélték és ha igen, akkor melyik az. A 7.11. diagram megadja a választ.

Page 73: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 76 -

A másodikként meghallgatott minta átlaga nyolc szempontból hétben néhány tizednyi eltéréssel jobbnak bizonyult. Egyensúly, dinamika és térérzet szempontjából a megítélés átlaga szinte pontosan megegyezik, viszont az első mintát a hallgatók zajosabbnak ítélték. Ebben szerepet játszhatott többek között, hogy a hallgató csoport számára az etalont az élő hangzás jelenti, mellyel nap mint nap találkozván nagyobb elvárásokat támasztottak az elsőként lejátszott minta iránt. Ezzel szemben a negyedikként lejátszott azonos minőségű minta előtt a hanganyagok közt legzajosabbnak ítélt MP3 (48 kb/s) is, és ez nyilvánvaló kihatással volt a megítélésre.

Mindent összevetve, az eredmények szoros volta elégedettségre ad okot, és a hallgató csoport kompetenciájáról tanúskodik.

Page 74: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 77 -

8. Összefoglalás

Szakdolgozatom célja, hogy áttekintést nyújtson a napjainkban leggyakrabban használt kódolási és hangtömörítési eljárásokról, azok paramétereiről illetve a segítségükkel létrehozott hanganyagok objektív és szubjektív minőségének megítéléséről.

Munkám első szakaszában áttekintettem az analóg és digitális hangfeldolgozás alapjait, értelmeztem és magyaráztam azokat a hangtani fogalmakat, melyek segítségével jellemezhetünk egy hangmintát. Összehasonlítást végeztem a digitális és az analóg hangfeldolgozás között. Ismertettem a digitalizálás folyamatát, eszközeit a kódolás és a tömörítés lényegét. Kitértem a pszihoakusztikai jellemzőkre és azokra a kritikus szempontokra melyeket a tömörítési és kódolási folyamatoknál figyelembe kell venni. Számos módszert ismertettem, melyekkel a hétköznapi ember nap, mint nap találkozik. Levontam következtetéseim, miszerint bőséges információ áll rendelkezésünkre, ha egy-egy eljárást szeretnénk behatóbban tanulmányozni, viszont nem találkoztam olyan összehasonlítással mely ezen eljárások végeredményét versenyeztetné. A számunkra legoptimálisabb megoldás kiválasztásához viszont tisztában kell lennünk azzal, hogy melyik eljárás milyen hatással van egy-egy hanganyag jellemző paramétereire.

Szakdolgozatom konkrét céljául azt tűztem ki, hogy egy előre kiválasztott hangfelvétel részletet különböző kódolási illetve tömörítési eljárások alkalmazása után, objektív és szubjektív szempontok alapján összehasonlítom.

Az összehasonlítás rendkívül bonyolult, hiszen az emberi fül érzékelésében kétségtelenül szerepet játszanak emocionális, más érzékszervek által közvetített ingerek is, amelyet számítógépes analízissel lehetetlen kimutatni. Ezért nagyobb hangsúlyt fektetek a szubjektív szempontokra, végül is az összes kódolási eljárásnak az elérni kívánt céljai közül a leglényegesebb, hogy az emberi fül számára élvezetes legyen (maradjon) a zene hangzása.

A különféle, egymással általában nem kompatibilis adatredukciós eljárások legtöbbje valamiféle minőségi kompromisszum árán próbálja gazdaságosabbá tenni a digitalizált hangot tartalmazó adatállományok tárolását, továbbítását. Törekvéseim éppen e minőségi kompromisszumok feltérképezésére és elemzésére irányultak.

Page 75: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 78 -

Az eredeti hanganyag - Antonin Dvořak: VIII., G-dúr szimfóniája - CD-re és DVD lemezre egyaránt rögzítésre került. A megfelelő részlet kiválasztásakor ügyeltem a szélsőségek előfordulására mind a dinamika, mind a hangmagasság, mind pedig a hangszerek egyidejű megszólalása szempontjából.

A kiválasztott 70 másodperc hosszúságú hanganyagrészletből állítottam elő a szabványos, tömörített, adott bitsebességű, és adott minőségű mintákat, melyeket a 8.1. táblázatban rendre felsoroltam.

Sorrend Típus Szóhossz

[bit]

Mintavételi frekvencia

[kHz]

Bitsebesség

[kb/s]

1 CD 16 44.1 1411

2 AC3 16 48 1536

3 MP3 16 44.1 48

4 CD 16 44.1 1411

5 ATRAC LP2 16 44.1 1411

6 MP3 16 44.1 256

7 ATRAC LP4 16 44.1 1411

8 MP3 16 44.1 128

8.1. táblázat

Ezután a minták spektrumát vizsgáltam a Sound Forge 8.0 program segítségével. Két részletet is ábrázoltam egy mintán belül. Az első részletben csak szóló hangszer hallható halkan, míg a második részben erőteljes basszus és intenzív magas alaphang tartományú hangszerek egyidejű játéka szolgál alapul a spektrális vizsgálathoz. Az eredményeket ábrázoltam és levontam a következtetéseket.

Page 76: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 79 -

Ezt követően a különböző kódolási eljárások szubjektív összehasonlítását valósítottam meg, a 60-as években az akkori „kelet európai” rádiószervezet (OIRT) által kidolgozott, és az európai rádiószervezeteket tömörítő EBU által napjainkban is használt vizsgálati módszer alapján.

A vizsgálat a Liszt Ferenc Zeneművészeti Egyetem Audiovizuális Stúdió stúdióhelyiségében, normál lehallgatási hangerőn, KRK gyártmányú, V88 típusú referencia stúdiómonitor hangsugárzókon zajlott, a Liszt Ferenc Zeneművészeti Egyetem első évfolyamos hangszeres hallgatóinak közreműködésével, akik természetszerűleg rengeteg élő hangzásbeli tapasztalattal rendelkeznek, és könnyedén elemeznek hanganyagot több szempont alapján.

A 8.1. táblázat a minták paraméterein felül a szubjektív vizsgálatnál meghatározó jelentőségű meghallgatási sorrendet is szemlélteti. Továbbá az is kitűnik, hogy az egyik hangminta kétszer szerepel. A végeredmény hitelességét alátámasztandó a CD minőségű hangmintát két alkalommal hallgattattam meg, és a sorrend által megpróbáltam befolyásolni a hallgatóságot, mintegy „csapdát” állítván nekik, ugyanis a második CD minta előtt közvetlenül egy közismerten gyenge minőségű (MP3 48 kb/s) mintát hallgattattam meg. Arra számítottam, hogy a gyenge minőség után az első mintát túlságosan felértékelik majd, de az eredmény kellemes meglepetést okozott. A két értékelés között minimális különbség látható.

CD 1 AC3 MP3 CD 2 ATRAC lp2

MP3 ATRAC lp4

MP3 Kódolt hangminták

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 4,73 4,33 2,30 4,80 4,13 4,10 4,00 3,77 Térérzet 4,73 4,67 2,17 4,70 4,10 3,93 3,57 3,83

Hangtisztaság 4,87 4,43 2,50 4,93 4,03 4,13 3,87 3,70 Sztereo hatás 4,93 4,30 2,43 5,03 3,87 3,93 3,87 3,97

Egyensúly 5,27 4,73 2,30 5,33 4,53 4,40 4,20 4,10 Zaj 4,50 3,77 1,30 4,70 3,80 3,37 3,43 3,23

Dinamika 5,13 4,80 2,30 5,17 4,50 4,20 3,87 4,03 Összbenyomás 4,97 4,50 1,67 5,40 4,30 4,10 3,90 3,73

8.2. táblázat

Page 77: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 80 -

A vizsgálat lefolyása után a 30 értékelőlap alapján kapott eredményeket átlagoltam, táblázatba foglaltam, kiértékeltem, a végeredményt és a paraméterenkénti részeredményeket diagramok segítségével ábrázoltam.

0,00

0,50

1,00

1,50

2,00

2,50

3,00

3,50

4,00

4,50

5,00

5,50

6,00

CD 1411 [kb/s]

AC3 1536 [kb/s]

ATRAC lp2 1411[kb/s]

MP3 256 [kb/s]

ATRAC lp41411[kb/s]

MP3 128 [kb/s]

MP3 48 [kb/s]

Hangszínezet Térérzet Hangtisztaság Sztereo hatás Egyensúly Zaj Dinamika Összbenyomás

8.1. diagram

Azt gondolom nem meglepő, hogy a rangsor élén a tömörítetlen, lineáris PCM formátumú CD áll, hiszen a többi hangminta mind veszteségesen tömörített. A további sorrend sem meglepő, viszont érdemes figyelni a részletekre, és arra hogy milyen minimális különbségek látszanak a végeredményt szemléltetni hivatott 8.1. diagramon.

Az eredmények tükrében kijelenthetjük, hogy egyik kódolási vagy tömörítési eljárás sem nevezhető minden szempontból optimálisnak, de ez nem mond ellent eddigi ismereteinknek, és nem is ez volt a célom. Csak akkor tudjuk kiválasztani a számunkra legmegfelelőbbet, ha megfogalmaztuk a végeredménnyel szemben támasztott elvárásainkat, és ehhez hasznos, ha egy összehasonlító összefoglalás van a kezünkben.

Úgy gondolom sikerült átfogó képet felvázolnom a legelterjedtebb kódolási és tömörítési eljárások ugyanazon hangmintára vonatkoztatott paramétereiről, részletes eredményekkel alátámasztván a minták spektrumának objektív vizsgálatát, ezáltal szakdolgozatom elején kitűzött célomat elértem.

Page 78: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 81 -

9. Irodalomjegyzék [1] Jákó Péter : Digitális Hangtechnika, Budapest [2] Újházy László: A hangfelvétel művészete, Műegyetemi Kiadó, 2004 [3] Dr. Takács F.: Zenei hangjelek érzeti kódolása, Híradástechnika XLV.évf. 1994. febr. [4] 2000J. Herre, E.Eberlein, H. Schott: Advanced Audio Measurement System using

Pychoacoustic Properties, AES preprint 3321 [5] J. Watkinson: The Art of Digital Audio, Second edition, Focal Press 1994 [6] http://www.itu.int/ITU-D/tech/digital-broadcasting/kiev/References/mpeg-4.html [7] http://indy.poliod.hu/program/audio [8] http://mpeg.sourceforge.org/ [9] http://www.doc.ic.ac.uk/~nd/surprise_97/journal/vol2/wefs/#mini [10] http://www.cs.tut.fi/~ypsilon/80545/CodingOfAS.html [11] http://nickyguides.digital-digest.com/audio-extract.htm [12] http://www.powerweb.de/mpeg/audiowww.html [13] http://www.scit.wlv.ac.uk/~c9818573/MM/web%20page/

Page 79: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 82 -

10. Mellékletek

10.1. Az ATRAC által használt kritikus frekvenciasávok

Az ATRAC által használt kritikus frekvenciasávok

Frekvencia (Hz) Frekvencia (Hz) Kritikus sáv

Alsó Felső Szélesség

Kritikus sáv

Alsó Felső Szélesség

0 0 100 100 13 2000 2320 320

1 100 200 100 14 2320 2700 380

2 200 300 100 15 2700 3150 450

3 300 400 100 16 3150 3700 550

4 400 510 110 17 3700 4400 700

5 510 630 120 18 4400 5300 900

6 630 770 140 19 5300 6400 1100

7 770 920 150 20 6400 7700 1300

8 920 1080 160 21 7700 9500 1800

9 1080 1270 190 22 9500 12000 2500

10 1270 1480 210 23 12000 15500 3500

11 1480 1720 240 24 15500 22050 6550

12 1720 2000 280

Page 80: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 83 -

10.2. Az MPEG algoritmus által használt kritikus sávok

Az MPEG algoritmus által használt kritikus sávok

A sáv száma Frekvencia

(Hz)*

A sáv száma

Frekvencia

(Hz)*

0 50 14 1,97

1 95 15 2,34

2 140 16 2,72

3 235 17 3,28

4 330 18 3,84

5 420 19 4,69

6 560 20 5,44

7 660 21 6,38

8 800 22 7,69

9 940 23 9,38

10 1,13 24 11,63

11 1,27 25 15,38

12 1,5 26 20,25

13 1,74

Page 81: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 84 -

10.3. Hangfelvételek esztétikai megítélése (értékelő lap) Liszt Ferenc Zeneművészeti Egyetem

AVISO Audiovizuális Stúdió

HANGFELVÉTELEK ESZTÉTIKAI MEGÍTÉLÉSE

értékelő lap

A felvétel sorszáma:…………………….

hangszínezet

1 2 3 4 5 6

térérzet

1 2 3 4 5 6

hangtisztaság

1 2 3 4 5 6

sztereó hatás

1 2 3 4 5 6

egyensúly

1 2 3 4 5 6

zaj

1 2 3 4 5 6

dinamika

1 2 3 4 5 6

összbenyomás

1 2 3 4 5 6

megjegyzés:

……………………………… ……………………………… ……………………………… ……………………………… ……………………………… ………………………………

A felvétel sorszáma:…………………….

hangszínezet

1 2 3 4 5 6

térérzet

1 2 3 4 5 6

hangtisztaság

1 2 3 4 5 6

sztereó hatás

1 2 3 4 5 6

egyensúly

1 2 3 4 5 6

zaj

1 2 3 4 5 6

dinamika

1 2 3 4 5 6

összbenyomás

1 2 3 4 5 6

megjegyzés:

……………………………… ……………………………… ……………………………… ……………………………… ……………………………… ………………………………

Page 82: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 85 -

10.4. A vizsgált hangminták értékelése (adattábla)

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 5 3 1 5 4 2 2 3Térérzet 5 4 1 5 5 3 2 4Hangtisztaság 5 4 2 6 3 2 3 3Sztereo hatás 5 4 2 5 4 2 2 4Egyensúly 6 4 2 6 5 3 3 3Zaj 5 3 1 4 4 2 2 3Dinamika 5 4 3 5 4 3 2 3Összbenyomás 5 4 1 6 4 3 2 3Hangszínezet 5 3 2 5 3 4 5 4Térérzet 5 4 2 6 4 5 4 5Hangtisztaság 6 4 2 5 3 4 4 5Sztereo hatás 5 4 2 5 3 5 5 4Egyensúly 5 4 2 6 4 5 5 4Zaj 6 3 2 4 5 5 4 3Dinamika 5 4 2 6 4 4 4 3Összbenyomás 5 4 2 6 4 5 5 4Hangszínezet 5 4 1 5 3 3 2 3Térérzet 5 4 1 6 4 3 2 4Hangtisztaság 5 4 2 5 3 2 2 3Sztereo hatás 6 3 2 5 3 3 3 3Egyensúly 5 4 2 5 3 2 2 3Zaj 5 3 1 4 4 3 2 3Dinamika 5 4 3 6 4 3 3 3Összbenyomás 5 4 1 6 4 3 2 3Hangszínezet 3 4 4 6 5 5 5 4Térérzet 3 5 4 6 5 5 4 4Hangtisztaság 3 4 4 4 6 3 4 4Sztereo hatás 4 5 2 5 5 4 4 4Egyensúly 3 4 2 6 5 4 4 3Zaj 5 4 2 4 5 6 6 5Dinamika 4 5 3 6 5 5 5 4Összbenyomás 4 4 2 5 5 5 5 4

23

4

A vizsgált hangminták értékelése

Kódolt hangminták

Rés

ztve

vők

sors

zám

a1

Page 83: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 86 -

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 5 5 1 5 3 4 4 4Térérzet 4 5 2 6 3 3 3 4Hangtisztaság 5 5 2 5 4 3 3 5Sztereo hatás 5 6 2 5 4 3 3 5Egyensúly 6 4 2 6 3 3 4 3Zaj 5 6 1 5 4 4 3 5Dinamika 6 5 2 5 3 4 3 4Összbenyomás 4 5 2 6 3 4 3 5Hangszínezet 5 5 2 5 3 4 3 4Térérzet 5 5 2 5 3 4 3 4Hangtisztaság 6 5 2 5 3 4 4 3Sztereo hatás 6 4 2 4 3 4 4 4Egyensúly 5 5 2 6 4 4 4 4Zaj 4 4 1 5 3 3 3 4Dinamika 6 6 3 5 4 5 3 4Összbenyomás 5 5 2 5 3 4 4 4Hangszínezet 5 5 2 5 4 5 4 4Térérzet 5 5 1 5 3 4 4 5Hangtisztaság 5 6 2 5 3 4 4 5Sztereo hatás 6 5 2 4 2 5 5 4Egyensúly 6 5 2 5 3 4 5 5Zaj 5 4 2 4 3 5 4 4Dinamika 6 5 3 5 4 5 4 5Összbenyomás 5 5 2 5 3 5 4 4Hangszínezet 4 4 2 4 4 6 6 3Térérzet 5 3 1 5 4 5 5 4Hangtisztaság 4 4 3 4 3 6 5 4Sztereo hatás 3 3 2 5 3 4 5 5Egyensúly 4 4 2 5 5 5 6 4Zaj 4 4 1 5 3 4 5 3Dinamika 4 4 3 5 4 6 5 4Összbenyomás 4 4 1 5 4 5 5 4

56

78

A vizsgált hangminták értékelése

Rés

ztve

vők

sors

zám

a

Kódolt hangminták

Page 84: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 87 -

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 5 4 2 5 4 5 6 3Térérzet 4 4 1 4 3 5 5 3Hangtisztaság 5 3 3 5 4 6 5 4Sztereo hatás 5 4 1 5 3 5 5 4Egyensúly 5 4 2 4 4 5 6 4Zaj 4 4 1 5 4 4 5 4Dinamika 4 4 3 5 4 6 6 3Összbenyomás 5 4 1 5 4 5 5 4Hangszínezet 4 4 2 4 4 2 3 4Térérzet 4 4 1 5 5 3 2 4Hangtisztaság 5 4 3 5 4 3 3 3Sztereo hatás 4 4 2 6 4 3 2 4Egyensúly 5 5 2 5 5 2 2 4Zaj 4 3 1 5 4 2 2 3Dinamika 5 4 3 5 5 3 2 3Összbenyomás 4 4 1 5 4 3 3 3Hangszínezet 5 4 2 5 4 6 6 4Térérzet 5 4 1 5 5 4 4 4Hangtisztaság 5 4 3 6 4 5 5 3Sztereo hatás 4 4 2 6 4 4 5 4Egyensúly 6 5 2 5 6 5 5 4Zaj 5 3 2 6 5 4 4 3Dinamika 5 4 3 6 5 3 6 3Összbenyomás 5 4 2 5 5 5 5 3Hangszínezet 4 4 2 5 5 3 2 3Térérzet 5 3 2 5 4 2 2 4Hangtisztaság 5 4 3 5 4 3 3 4Sztereo hatás 4 3 3 6 3 3 2 3Egyensúly 5 4 1 6 4 2 2 4Zaj 4 4 2 6 4 2 3 4Dinamika 5 4 3 6 5 4 3 4Összbenyomás 5 4 1 5 4 3 4 4

1112

A vizsgált hangminták értékelése

Rés

ztve

vők

sors

zám

a

Kódolt hangminták

910

Page 85: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 88 -

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 4 4 2 4 5 6 6 4Térérzet 5 4 3 5 3 5 4 3Hangtisztaság 4 4 3 6 4 5 5 4Sztereo hatás 5 4 3 6 3 6 5 3Egyensúly 5 4 2 4 4 6 6 4Zaj 5 4 1 5 4 4 5 3Dinamika 5 4 3 4 5 6 6 4Összbenyomás 5 4 2 6 5 5 5 4Hangszínezet 5 4 1 5 4 2 2 4Térérzet 4 3 2 4 4 3 3 3Hangtisztaság 5 4 3 5 3 3 2 4Sztereo hatás 5 4 3 5 4 2 2 4Egyensúly 4 4 2 5 5 3 3 3Zaj 5 4 1 4 4 3 2 3Dinamika 5 4 2 5 4 3 3 3Összbenyomás 5 4 2 5 4 3 4 3Hangszínezet 4 3 1 4 4 5 6 3Térérzet 5 4 2 4 3 4 5 4Hangtisztaság 5 4 3 5 4 6 5 3Sztereo hatás 6 4 3 4 5 5 5 4Egyensúly 5 5 2 5 4 6 6 4Zaj 4 4 1 4 4 5 4 3Dinamika 5 4 3 5 5 6 6 3Összbenyomás 5 4 1 5 5 5 5 4Hangszínezet 5 3 1 5 4 2 2 3Térérzet 5 4 1 5 5 3 2 4Hangtisztaság 5 4 3 5 3 2 3 3Sztereo hatás 5 4 2 6 4 2 2 4Egyensúly 6 4 3 5 5 4 3 4Zaj 4 3 2 5 4 2 2 3Dinamika 5 4 2 5 4 4 3 3Összbenyomás 5 4 1 5 4 3 3 3

Rés

ztve

vők

sors

zám

a

Kódolt hangminták

1314

1516

A vizsgált hangminták értékelése

Page 86: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 89 -

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 6 4 1 4 3 3 2 3Térérzet 5 5 2 3 3 3 3 4Hangtisztaság 5 4 3 5 5 5 2 3Sztereo hatás 6 4 2 6 4 3 3 3Egyensúly 6 5 3 6 5 5 2 4Zaj 4 4 1 4 4 3 3 3Dinamika 5 4 3 5 5 5 3 4Összbenyomás 5 4 1 6 5 4 3 3Hangszínezet 5 4 2 5 4 6 6 4Térérzet 5 4 1 3 3 5 5 4Hangtisztaság 5 4 2 4 5 6 6 3Sztereo hatás 6 5 3 5 4 5 6 5Egyensúly 6 5 3 5 5 6 5 4Zaj 5 4 1 4 4 5 5 3Dinamika 5 5 1 6 4 6 6 4Összbenyomás 5 5 1 5 4 6 6 4Hangszínezet 5 3 2 6 4 6 6 3Térérzet 4 4 2 6 5 5 5 4Hangtisztaság 5 4 3 5 5 5 6 3Sztereo hatás 4 4 2 5 4 6 5 4Egyensúly 4 4 2 6 5 6 6 4Zaj 5 3 1 4 4 4 4 3Dinamika 5 4 1 6 4 5 6 3Összbenyomás 5 4 1 6 4 6 6 3Hangszínezet 3 5 2 5 5 3 3 2Térérzet 2 5 3 5 5 3 3 2Hangtisztaság 4 6 2 5 5 4 3 3Sztereo hatás 2 5 3 5 5 2 3 2Egyensúly 4 5 3 6 6 3 2 3Zaj 5 4 2 5 4 2 3 3Dinamika 5 6 1 4 5 3 4 2Összbenyomás 3 4 1 5 5 3 3 3

1819

2017

A vizsgált hangminták értékelése

Rés

ztve

vők

sors

zám

a

Kódolt hangminták

Page 87: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 90 -

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 5 4 1 5 3 3 3 3Térérzet 5 4 1 5 4 3 2 4Hangtisztaság 5 5 3 5 4 4 3 3Sztereo hatás 6 5 3 5 4 3 3 3Egyensúly 5 5 1 6 3 2 3 4Zaj 5 3 1 4 4 3 3 3Dinamika 5 4 1 5 4 3 2 4Összbenyomás 5 6 3 6 4 3 3 4Hangszínezet 4 6 4 6 4 5 4 5Térérzet 3 5 3 5 5 5 4 3Hangtisztaság 5 4 2 5 4 4 3 4Sztereo hatás 6 5 3 6 4 5 5 5Egyensúly 6 6 2 6 5 4 4 4Zaj 4 3 1 4 3 3 4 3Dinamika 5 5 3 5 4 3 3 5Összbenyomás 6 5 2 5 5 4 4 5Hangszínezet 5 5 4 5 4 4 4 4Térérzet 3 6 3 5 3 5 4 3Hangtisztaság 4 5 2 5 5 4 4 3Sztereo hatás 5 4 3 6 4 3 3 3Egyensúly 5 5 3 6 4 6 5 5Zaj 4 4 2 5 3 3 3 3Dinamika 6 6 4 5 5 4 3 6Összbenyomás 5 5 3 5 4 4 3 4Hangszínezet 6 5 3 5 4 4 4 4Térérzet 6 6 3 4 4 3 4 5Hangtisztaság 5 5 2 5 5 5 5 5Sztereo hatás 5 5 3 4 5 6 4 5Egyensúly 6 6 2 6 6 5 5 4Zaj 4 4 1 5 4 3 3 3Dinamika 6 6 1 5 5 5 2 5Összbenyomás 6 5 2 5 4 4 3 4

Kódolt hangminták

2223

2421

Rés

ztve

vők

sors

zám

a

A vizsgált hangminták értékelése

Page 88: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 91 -

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 5 5 4 3 5 3 4 4Térérzet 5 6 4 2 4 6 4 5Hangtisztaság 5 5 3 4 4 4 4 4Sztereo hatás 5 4 3 2 5 5 5 4Egyensúly 6 6 4 4 6 5 5 5Zaj 4 4 1 5 4 2 3 2Dinamika 4 6 3 5 4 4 3 6Összbenyomás 5 5 3 6 5 4 3 4Hangszínezet 5 5 3 5 5 5 4 5Térérzet 6 6 3 5 5 4 3 3Hangtisztaság 6 5 1 5 4 4 4 4Sztereo hatás 5 4 3 5 4 4 5 4Egyensúly 6 5 2 6 3 5 4 5Zaj 4 4 1 5 3 3 3 3Dinamika 5 6 2 5 5 4 4 5Összbenyomás 6 5 2 5 5 4 4 5Hangszínezet 5 5 3 5 6 4 4 5Térérzet 6 6 1 5 5 5 5 4Hangtisztaság 5 5 2 6 4 4 4 4Sztereo hatás 5 5 1 5 5 4 4 5Egyensúly 6 5 3 5 5 4 5 6Zaj 4 4 1 6 4 4 4 4Dinamika 6 6 1 5 5 4 4 6Összbenyomás 6 5 1 5 5 4 4 4Hangszínezet 5 5 4 5 5 4 4 5Térérzet 6 6 5 5 4 3 4 4Hangtisztaság 5 4 1 5 4 5 5 3Sztereo hatás 5 5 2 6 5 4 4 4Egyensúly 5 5 3 5 5 6 6 5Zaj 4 4 2 5 4 4 4 3Dinamika 6 6 1 5 6 4 4 5Összbenyomás 5 5 2 5 5 4 4 4

A vizsgált hangminták értékelése

Rés

ztve

vők

sors

zám

a25

2627

28

Kódolt hangminták

Page 89: Kétcsatornás tömörített és tömörítetlen digitális ...vip.tilb.sze.hu/~wersenyi/PAND.pdf · - 7 - Bevezetés Világunkban a digitális technika fejlődése soha nem látott

Pető Andrea

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

- 92 -

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 5 6 3 3 4 4 4 5Térérzet 6 6 3 3 5 3 3 3Hangtisztaság 4 5 3 3 4 4 4 4Sztereo hatás 5 5 4 4 3 3 3 5Egyensúly 6 6 3 3 4 6 3 6Zaj 4 4 1 5 2 2 2 3Dinamika 6 5 2 4 5 4 3 5Összbenyomás 5 5 2 8 4 3 3 5Hangszínezet 5 5 5 5 5 5 4 4Térérzet 6 6 4 4 5 4 4 4Hangtisztaság 5 5 3 5 5 5 3 5Sztereo hatás 5 4 3 5 3 5 4 4Egyensúly 6 5 3 6 5 6 5 4Zaj 5 4 1 5 3 2 3 2Dinamika 5 6 1 6 5 2 5 5Összbenyomás 6 5 2 5 5 4 4 1

CD 1 AC3 MP3 CD 2 ATRAC lp2 MP3 ATRAC lp4 MP3

1411 [kb/s]

1536 [kb/s]

48 [kb/s]

1411 [kb/s]

1411 [kb/s]

256 [kb/s]

1411 [kb/s]

128 [kb/s]

Hangszínezet 4,73 4,33 2,30 4,80 4,13 4,10 4,00 3,77Térérzet 4,73 4,67 2,17 4,70 4,10 3,93 3,57 3,83Hangtisztaság 4,87 4,43 2,50 4,93 4,03 4,13 3,87 3,70Sztereo hatás 4,93 4,30 2,43 5,03 3,87 3,93 3,87 3,97Egyensúly 5,27 4,73 2,30 5,33 4,53 4,40 4,20 4,10Zaj 4,50 3,77 1,30 4,70 3,80 3,37 3,43 3,23Dinamika 5,13 4,80 2,30 5,17 4,50 4,20 3,87 4,03Összbenyomás 4,97 4,50 1,67 5,40 4,30 4,10 3,90 3,73

2930

Átla

g

A vizsgált hangminták átlagolása

Rés

ztve

vők

sors

zám

a

Kódolt hangminták

A vizsgált hangminták értékelése

Rés

ztve

vők

sors

zám

a

Kódolt hangminták