Upload
lazaro
View
22
Download
0
Embed Size (px)
DESCRIPTION
Daróczy Bálint ELTE IK PhD MTA SZTAKI [email protected]. Analóg és digitális televíziós technológiák 2008 október 10 , november 14, december 5. Irodalom. Jakó Péter: Digitális hangtechnika, Budapest, 2005, Kossuth - PowerPoint PPT Presentation
Citation preview
Analóg és digitális Analóg és digitális televíziós technológiáktelevíziós technológiák
2008 október 10 , november 14, december 52008 október 10 , november 14, december 5
Daróczy BálintDaróczy BálintELTE IK PhDELTE IK PhD
MTA SZTAKIMTA SZTAKI
[email protected]@informatika.ilab.sztaki.hu
IrodalomIrodalom
Jakó Péter: Digitális hangtechnika, Budapest, 2005, Kossuth
Hazay János(szerk.): A digitális televízió szolgáltatásai: bevezetési modellek, külföldi tapasztalatok, Budapest, 2005, Typotex
Walter, Fischer: A digitális műsorszórás alapjai, Budapest, 2005, Typotex
Kovács Imre : Digitális stúdiótechnika, BME jegyzet, 2005
Média/médiumMédia/médium
- közvetítő közegek összessége - (kommunikációs) technológia és azon társadalmi gyakorlatok összessége, amelyek e technológia
előállításához és elsajátitásához szükségesek
Média/médiumMédia/médium
A tömegkommunikáció az a folyamat, melyben - professzionális kommunikátorok üzeneteket készítenek, melyeket - technológiai eszközök - azaz a tömegmédiumok - segítségével széles körben terjesztenek, - térben és idõben szétszórt, nagyszámú fogyasztó - a nézõk, hallgatók, olvasók heterogén csoportja, a befogadók - számára.
Technikai és fiziológiai Technikai és fiziológiai alapokalapok
George Carey:
- A továbbítandó képet bontsuk fel sorokra, a sorokat pedig elemi képpontokra- Az átvitel során minden egyes képpontot egyszerre továbbítsunk - sok képpont, megvalósíthatatlan- a szinkronizáció miatt ma is komoly kihívás lenne
Maurice LeBlanc
- felveti a szekvenciális képátvitel elméletét
- a képpontokat nem egyszerre, hanem egymás után sorban továbbítjuk, így egy jelátvitel szükséges
- amennyiben elég gyors az átvitel, az emberi szem nem érzékeli a szekvenciális átvitelt, egy állandó képnek tekinti
Technikai és fiziológiai Technikai és fiziológiai alapokalapok
Televíziós képátvitelTelevíziós képátvitel1. Keretezés:
Az átviteli jelenet meghatározása. Történhet a felvétel készítése előtt (amit az optika továbbít) vagy utánna (a felvétel egy részletét alakítjuk át elektromos jellé)2. Képpontokra bontás:
Az előbb meghatározott kereten belüli információk felbontása pixelekké. A végfelhasználói magatartástól függően skálázva a felbontást (képpontok számát). 3. Vevő oldalon visszaalakítása:
A szekvenciális elektromos jelből fényhullámok gerjesztése.Megjegyzés: - Elengedhetetlen az 2. és a 3. lépés szinkronizálása!
Egy kis Egy kis történelemtörténelem
A XIX. század
- az információközlés forradalma - a korábbi, lassú technológiák az új és
gyors módszerekkel felváltva vesznek részt az exponenciálisan megnövekedett igények kielégítése során
- klasszikus posta és telegráf - nagy távolságokba gyors átvitel
XIX.századXIX.század
Elektromos átvitel meghódítja Amerikát és Európát.
- telefon- távíró
Lehetőség képek készítésére - felismerhető alakok - fekete-fehér- pillanatok megörökítése- a fényképet készítő tudta nélkül is tartalmaz információkat szemben a
festményekkel
XIX. századXIX. század
A század második felére mind az állókép mind a közvetlen hangátvitel széles körben ismert és használt technológia.
Felmerül a kérdés: - hogyan lehet mozgásokat,
„történéseket” megörökíteni?- mindezt gyorsan, közvetlenül
továbbítani?- a távoli jövőben együttesen
alkalmazni a hang továbbítási lehetőségekkel?
XIX. századXIX. század
Mindezen kérdések több, egymástól független elképzelést is pedesztrinált.
Maga a mozgóképek átvitele, mint a telefon egy kiegészítő funkciója vagy esetleg egy kevésbé interaktív felhasználás?
Majd 150 év kell, hogy a két irány a gyakorlatban is összekapcsolódjon.
Mozi születéseMozi születése
- 1861 Henri DuMont elmélete mozgások reprodukálásáról
- 1872 Eadweard Muybridge Zoopraxiscope képes mozgások felvételére
- 1880 Muybridge az elkészült képeket gyors váltásokkal vetíti
- 1878 George Eastman papír filmje
Az első kameraAz első kamera
A legkorábbi megmaradt
film: - Louis Le Prince - 1888 október 14 - Roundhay Garden
Scene - 12 kép/másodperc - 2 1/8 inches Kodak
Eastman szalag
CinCinéématographematographe
Az igazi áttörés több mint hét évvel később:
- Lumière testvérek
(Auguste és Louis)
- 1895 december 28-án Párizsban
mutatják be a nyílvánosság számára rendszerüket
- Sortie des Usines Lumière à Lyon
( Workers Leaving the Lumière Factory)
Sokan egyidőbenSokan egyidőben- Thomas Edison, 1893 Kinetograph, William Kennedy Laurie Dickson segítségével kifejleszti a Kinetoscope-t
- Léon Bouly, 1893 Cinématographe, Chronophotography ötletéből kiindulva
később Lumière testvérek használják első filmjükhöz
- Max és Emil Skladanowsky, 1895 Berlin
bemutatják mozgókép felvevő és vetít rendszerüket
Mozi fejlődéseMozi fejlődése
-1900 Hangos film bemutató- 1900 Párizs hangos film bemutató, rossz szinkronizáció - 1907 Eugene Lauste közvetlenül a celluloid szalagra rögzít a kép mellett hangot- bukása mégsem ennek köszönhető:
- Halk és rossz minőségű hangfelvételek
- Még nincs színes film!- 1923 „talking picture” New York az első pontosan szinkronizált előadás- 1927 az első egész estés hangos film
The Jazz Singer
Színes filmSzínes film
- 1902,A Trip to the Moon képkockánként
színezett film- 1910 Pathé 400 nőt foglalkoztat filmek színezéséhez- színelmélet fejlődése - 1935 Kodachrome többrétegű filmszalag
Analóg filmAnalóg film
- Analóg film:8, 16, 35 mmIMAX 2x70 mm
- az NTSC szabványhoz képest nagyobb színtér - többrétegű film - 5+ csatornás hang- 3D film sztereóképekkel- akár 120+ képkocka per
másodperc
Rádió hajnala I.Rádió hajnala I.
- 1820 Hans Chrisitan Örsted már gyanítja a mágnesesség és az elektromosság azonosságát, kapcsolatukat bizonyítja
- 1831 Michael Faraday matematikailag is igazolja Örsted elméletet (elektromágneses indukció)
- 1865 James Clerk Maxwell elektromágneses hullámok
- 1884 Temistocle Calzecchi-Onesti képes rádió jeleket fogadni
Rádió hajnala II.Rádió hajnala II.
- 1887 Heinrich Hertz kísérletekkel bizonyítja Maxwell állításait (David E. Hughes már 1879-ben felhasználja, képes elektromágneses jeleket küldeni és fogadni (többnyire zajt) )
- 1894 Oliver Lodge, Alexander Popov, Jagdish Chandra Bose
- 1895 Guglielmo Marconi vezeték nélkül továbbít információt (rádiós távíró), 1901 első transz-atlanti átvitel
1893 Nikola Tesla képes vezetéknélkül hangot továbbítani
Rádió hajnala III.Rádió hajnala III.
- 1906 az első rádióadás, Reginald Fessenden
AM (amplitudó modulált), lehetőség több párhuzamos adás egyidejű sugárzására
- 1909 az első rádióállomás, Charles David Harrold
„San Jose Calling” , ma KCBS
- 1904 John Ambrose Fleming Oszcillátor- cső (elektroncső)
mint a vevőkészülékek alapja
Rádió hajnala IV.
- 1906 Lee De Forest trióda
- 1910 Rádióadó az Eiffel-torony tetején
- 1913 USA frekvencia-törvény
- Mindezek ellenére csak az 1920-as években terjed el (viszont 1920-ban már 100 ezer vevőkészülék, autórádió)
- 1928 Lakihegy Telefunken rádióadó
- 1952 az első tranzisztoros vevőkészülék a Sony-tól
mára szinte leváltotta az
elektrocsöves készülékeket
KépátvitelKépátvitel
Mechanikus vagy elektromos?Képek átalakítása?
Filmszalag: - analóg információ- „végtelen” képpont- viszont diszkrét
képkockaszám - már maga a másolás is
nehézségekkel küszködik
FogalmakFogalmak
- interlace: váltott-soros letapogatás a kép csak minden második sorát
tapogatja le az elektronágyú - progressive: folyamatos letapogatás a kép minden sorát letapogatjuk- field: egy félkép - frame: egy teljes kép
- flicker: speciális esetben a villódzás nem szűnik meg, mivel az átvitt jel gyakorlatilag 25 Hz-es marad (pl. sűrű vonalas képek )
FogalmakFogalmak
- sorfelbontás: egy teljes kép sorainak száma
- félképfrekvencia:egy másodperc alatt átvitt félképek
(field) száma
- képfrekvencia:egy másodperc alatt átvitt teljes képek
(frame) vagy félkép-párok (fields) száma
- sorfrekvencia: egy másodperc alatt átvitt sorok száma
Nipkow tárcsaNipkow tárcsa
- Alexander Bain 1843 első fax
- Szekvenciális képletapogatás!
- Paul Gottlieb Nipkow 1883
- elektromos átvitel (fotódióda, szeléncella)
Braun-csőBraun-cső- majd katódsugárcső (Cathode Ray Tube)
meleg katód, Johnsson 1922- Karl Ferdinand Braun 1879- eredetileg hideg katód (pl. neon)- az 1854-es Geissler-cső majd Crookes-cső módosítása- a katód melegítése során elektronok emittálódnak a foszfor felület felé (a katód és anód közti potenciálkülönbség gyorsít), mely a becsapódó elektronok hatására fontonokat bocsát ki
- a pozicionálásért egy elektromágneses mező felel
Alan ArchibaldAlan Archibald Campbell-Swinton Campbell-Swinton
- 1908-ban már a Braun-cső felhasználását javasolja az akkoriban elterjedt nézettel ellentétben - szerinte a jövő a tisztán elektromos televízióé- Braun-cső mint képfelvevő(bontó) egység - Braun-cső mint képvisszadó - 1911-ben a Nature című lapban már egy teljesen elektromos rendszert is felvázol
1920-as évek1920-as évek
- Nincs egyértelmű győztes- Vita a tisztán elektromos és a mechanikus televízióról- az átvitel mindkét esetben rádiójelek útján történik- 1926 John Logie Baird mechanikus televízió rendszert mutat be- már az 1800-as években kísérleteznek, de a képátalakítás és képelőállítás lassúsága miatt nem elegendő sem a felbontást sem a másodpercenkénti képkockaszám
(Shelford Bidwell 1881)
1920-as évek eleje1920-as évek eleje
- 1925-ben Charles Francis Jenkinsnek sikerül rádióhullámok segítségével sziluettképeket továbbítania- Jenkins már 1920-ban megvalósítja Nipkow 1883-as képátviteli ötletét
a képminőség miatt széles körű felhasználásra alkalmatlan- 1928 Philo Taylor Farnsworth
dissector tube (képbontó cső)- Kenjiro Takayanagi
John Logie BairdJohn Logie BairdNoctovisionNoctovision rendszererendszere
- 1926 január 26-án Londonban egy 30 soros Nipkow-tárcsás rendszer segítségével elektromosan képet továbbít 12.5 képkocka/sec
- 30 sor épphogy elegendő egy emberi alak felismeréséhez
- Rendszerét továbbfejlesztve már 1928-ban színes televíziót készít!
John Logie BairdJohn Logie Baird
- 1928 már London-ból Hartsdale-be - 1931 élő adást közvetít az Epsom Derbyről- 1935-re a 30 soros átvitelt felváltja Baird új 240 soros rendszere - A BBC 1929-től 1935-ig 30-soros Baird- 1930-ban bemutat egy módszert mellyel a moziszínházakban képes televíziós jeleket vetíteni
- Közben kifejleszt egy 30-soros videófelvevőt
John Logie BairdJohn Logie Baird
- Miután a BBC mellőzi rendszerét, elektromos televízió fejlesztésébe kezd
- 1939-ben elkészíti egy speciális (nem tisztán elektromos) színes televízió rendszert, melyet a CBS és a RCA is használ évekig
- 1944-ben már egy teljesen elektromos színes televíziót szabadalmaztat
- 600 sor- Váltott-soros, viszont három menetben - A második világháború után 1000 (!)
soros színes (kiváló képminőségű) átvitel
Mihály DénesMihály Dénes
- 1929-ben már felismerhető (30x30 képpont) képeket továbbít - szeléncella helyett fotocella (gyorsabb reagálás)- izzólámpás megvilágítás
helyett ködfénylámpa- Nipkow-tárcsa helyett tükrök forgatásával „pásztáz” (Telehor)
Tihanyi KálmánTihanyi Kálmán
- 1926 Tihanyi Kálmán szabadalmaztatja a töltéstárolás elvét (storage prinicple)- 1927-ben módosítja, majd 1928-ra kidolgoz egy televíziós rendszert is (Radioskóp)- 1928-tól megpróbálja eladni találmányáit elsősorban németországi gyáraknak (Siemens, Löwe stb.)- Katonai felhasználásra is gondol
Tihanyi-ZworykinTihanyi-Zworykin- 1930-tól kapcsolatban áll az
amerikai RCA-val- 1930-ban az RCA elindít egy kísérletsorozatot Zworykin vezetésével- 1925 Zworykin sikertelen elektromos képbontója (a fotocellák fényérzékenysége)- 1930-ig csak mechanikus megoldásokon dolgozik- 1931-ben Tihanyi szabadalmaira építve egy Iconoscope prototípust mutat be - 1936, Berlini olimpiai közvetítés Tihanyi
rendszerére alapozva
IkonoszkópIkonoszkóp
- A töltéstárolás elvére épít. Egy fotócella mozaikon a fénnyel arányos elektron emittálódik, majd az elektronágyú segítségével kisül, majd a kilépő elektronok feltöltik a kondenzátort - sajnos mai szemmel nézve ennek is kicsi a fényérzékenysége- hajlamos foltosodásra- továbbfejlesztett változata a
szuperikonoszkóp (a fotókatód és
a töltésjellemez szétválasztása, megnövekedett fényérzékenység, a foltosodás a szekunder elektronok miatt megmaradt)
Low Definition Low Definition rendszerek bukásarendszerek bukása
- Low Definition: mechanikus elemeket is tartalmazó korai televíziórendszerek - 1935-re nyílvánvalóvá vált, hogy az elektromechanikus képátvitelt alkalmazó televíziós rendszerek képtelenek tömeges érdeklődés kiváltására- pedig a fejlődés töretlen:
30 sorból előbb 180 majd 1935-ben pedig 240(!) lesz- 1935-re az előállítási költségek sem jelentenek akadályt (pl. Mihály Dénes rendszerét túl drágának találták)
Low DefinitionLow Definition
- 1928-ban már 22 kísérleti televízió rendszer kapott sugárzási engedélyt- BBC 1929 után Baird 30 soros 12,5 képkocka/sec-es rendszerével sugároz- drága készülékek, rossz képminőség-„csoda a kirakatban” - 1935-re nemcsak a sorfelbontás hanem a képfrissités is megemelkedett
12,5-ről 25-re
High DefinitionHigh Definition- Zworykin megkülönböztetésül használja a High Definition-t - 1936 az EMI Isaac Schoenberg vezetésével kidolgoz egy általuk High Definition Television-nek nevezett rendzsert- sorfelbontása az eddig elérhető 240-hez képest óriási : 405- 25 teljes kép/sec helyett 50 félkép/sec- az 1936-os berlini olimpián több rendszerrel is közvetítenek, Tihanyi High Definition képfelvevő és képvisszaadó rendszerét találják a legjobbnak
Emberi korlátainkEmberi korlátaink - Azt a legkisebb látószöget, amelynél a szem még éppen meg tud különböztetni két egymás mellett lévő pontot, a szem felbontóképességének nevezzük- ennek reciproka a látásélesség- televíziós rendszer tervezésénél nem érdemes nagyobb sorfelbontást alkalmazni, mint amennyit az emberi szem a szokásos (vagy a rendszer tervezésekor meghatározott) látószögből láthat- a korai rendszereknél a néző távolságát a vevőkészüléktől a képernyő magasságának hatszorosában határozták meg
Emberi korlátainkEmberi korlátaink
D=6*V
Emberi korlátainkEmberi korlátaink
- ezen nézési körülmények között még éppen megkülönböztethető függőleges képpontok (sorok) számát a következő képlettel határozhatjuk meg:
- ha D=6*V, és egy ívperccel számolunk:573-at kapunk (a mai napig használt PAL rendszer látható sorfelbontása 576)
Képpont (pixel)Képpont (pixel)- Álló vagy mozgóképek továbbítása elektromos jelek segítségével csak képpontok útján történhet- A emberi szem tulajdonságai alapvetően behatárolják a felismeréshez minimálisan szükséges képpontok számát- Kísérletek bizonyítják, hogy érzékenyebbek vagyunk a sorok számára mint az egy soron belül látható képpontok sürüségére
KépfelbontásKépfelbontás
- 30 sor és ennek arányaiban megfelelő képpontszám (900 min.)
- pl. SDTV: 720x576 , HDTV 1920x1080 (!)
KépfelbontásKépfelbontás
- függ a nézőtávolságtól- fekete-fehér illetve színes TV!- álló vagy mozgókép?- megjelenítési technika?- általában négyzet alakú pixelek
KéparányKéparány
- az első rendszerek a sorfelbontást mint tekintették mérvadónak- a korai mozifilmek képaránya zsebkendő méretben- eredetileg 1:1 majd 4:3 (3:4) majd 16:9
Frissítési frekvenciaFrissítési frekvencia
- az emberi szem 60 Hz felett nem érzékeli finomabban a mozgásokat- már 10 Hz is elegendő, hogy mozgásnak higgyünk egy felvételt- a folyamatos mozgáshoz, mely már nem hat idegennek 24 képkocka szükséges (pl. mozifilm)- a gyakorlatban viszont más a képvisszaadó technikától függő aspektusok is közrejátszanak
Fúziós FrekvenciaFúziós Frekvencia- a High Definition rendszerek egyik sarokköve az átvitelhez szükséges információ- a korábban említett mozgások rekonstruálásához elegendő 10 Hz vagy a filmszínházakban alkalmazott 24 képkocka/sec CRT képernyőn nézhetetlen- a villódzás megszünése csak a fúziós frekvencia átlépése után lehetséges- az emberi szem fúziós frekvenciája 45-50 Hz
Fényerősségre érzékeny. Pl. Sötétben egy világos képernyőn már nem elegendő 50 Hz, 65-70Hz szükséges- filmszínházakban épp ezért egy képkockát háromszor (72 Hz) villantanak fel- televíziós átvitelnél (megfelelő memória hiányában) ugyanezen értékhez 72 Hz-el kell továbbítani (!)
SávszélességSávszélesség
- Minden sáv kincs!- Frekvenciaengedélyhez kötött sugárzás
- Míg a Low Definition rendszerek legfeljebb 240 sornyi pixel intenzitását
továbbították alig pár adóállomásról, a megnövekedett képpontszám és az exponenciálisan növekvő piac (több adó) miatt a High Definition rendszerek tervezése során figyelembe vették az igényelt információ sávszélességét is
Sávszélesség Sávszélesség probléma megoldásaprobléma megoldása
- a fúziós frekvencia átlépéséhez nem elegendő a 24-25 Hz-es felvétel továbbítása- nagykapacitású tároló csak később (frame buffer)- megoldás: váltott-soros átvitel!- minden második sort továbbítja
felváltva 50 Hz-el- a képfelvevők képesek voltak 50Hz-en működni
Váltott-soros Váltott-soros
- gyakorlatban fele sávszélesség - képminőségben gyakorlatilag
észrevehetetlen- további szinkornizációs problémák lépnek fel- az első képtömörítési eljárás- mai napig használják (HDTV 1080i)
Váltott-sorosVáltott-soros
Váltott-sorosVáltott-soros
- folyamatos eltérítés- az elektroncső folyamatosan mozog
lefelé miközben egy sort pásztáz- Egy megfelelően szinkronizált rendszer információveszteség nélkül képes egy mozifilm 24 képkocka/sec-os felvételét
továbbítani, hiszen a két félkép egyazon képkocka letapogatása során keletkezett
- finomabb mozgásátvitel (nagyobb frekvencia)
- fésű effektus progresszív kijelzőkön
Váltott-sorosVáltott-soros
- az elektronágyú útja, a félképátalakítás miatt pontosabb pozivionálást és szinkronizációt igényel, mint a progresszív letapogatás- az egyébként is szükséges sorvisszafutás (a következő sort is balról jobbra tapogatja) mellett egy teljes képen belül kétszer kell visszapozicionálni a jobb alsó sarokból a bal felsőbe (félképvisszafutás)- a fejletlen frekvencia osztók miatt a sorok számát csak primszámosztók segítségével lehetett megvalósítani (pl. 441 = 3x3x7x7)
Fekete-fehér Fekete-fehér High Definition TVHigh Definition TV
- egy fekete-fehér televíziós rendszerben egyetlen fényinformáció, a fényesség (Y csatorna) továbbítása szükséges szemben a színes televízióval, ahol minimálisan három (YUV vagy RGB)- mivel önmagában az Y csatorna semmi információt sem tartalmaz az épp befogott jel képen belüli poziciójáról vagy akár az aktuális képkockáról, szinkornizáció szükséges- elképzelhető egy külön, de minden esetben költségesebb és a kor színvonalán kevésbé megbízható, szinkronizációs csatorna
Fekete-fehérFekete-fehérHigh Definition TVHigh Definition TV
- a kor színvonalán már szinte tökéletesen lehetett (a hálózati frekvenciára alapozva egyenletesen) pozicionálni az elektronágyút- amennyiben minden sorvisszafutást és félképvisszafutást jelzünk az elektronágyú követni fogja a felvevő elektronágyúját- viszont a szinkronizációs jelek nem tartozhatnak a fényességinformációk közé- így csökken a megjeleníthető fényesség dinamikája
Fekete-fehérFekete-fehérHigh Definition TVHigh Definition TV
- ma már kisebb arányok mellett is lehetséges szinkronjel kialakítása
- a korai rendszerekben az átvihető jel maximális amplitudójának alsó 30 %-át a szinkronjelek , a fennmaradó 70 %-ot pedig a fényességinformáció továbbítására használták
Fekete-fehérFekete-fehérHigh Definition TVHigh Definition TV
- ma már nagyon soknak tűnik az így „elvesző” 30 %, de mint látni fogjuk sajnos ma is érvényben van- a sorvisszafutás és a félképvisszafutás jelzése természetesen különböző és időben meghaladja egy egyszerű képpont érvényességi idejét- 4,7 µs (valójában 12 µs) a sorvisszafutásra „hagyott” idő, mely során az elektronágyú „sorkiolt”- a félképvisszafutás ennél lényegesen nagyobb 160 µs
Látható sorfelbontásLátható sorfelbontás
Fekete-fehér Fekete-fehér High Definition TVHigh Definition TV
BBC 1936BBC 1936Isaac SchoenbergIsaac Schoenberg
- 405 sor - 3 MHz sávszélesség - System-A- 50 Hz- egy ideig sugároznak
a Baird féle 240 soros rendszeren is
- 1939-re mér csak az EMI féle 405-soros
- Az első televíziós rendszermelyet az ITU már elfogadott
Európai rendszerekEurópai rendszerekNémetországNémetország
- 1928-ban kísérleti 96 soros adó- 1932 elektromechanikus 30 soros adó - 1932 Kőnigswusterhausenben 39
soros mechanikus adó- 1932 Doberitz szintén mechanikus de már
48 soros adó- 1932 Berlin mechanikus 60 soros adó- 1935-re már 180 soros adók- az olimpiát három rendszeren adják
(pl. Tihanyi)- 1939-ben bevezetik a 441 soros High
Definition rendszert (25 fps, 4:3, 11025 Hz sorfrekvencia)
Európai rendszerekEurópai rendszerekFranciaországFranciaország
- ahogy a későbbiekben, Franciaország már itt is külön utakon jár- 1932 mechanikus 60 soros rendszer, 3:7 képaránnyal, 35x60 képpont, 12,5 fps- 1935 már 375 soros adások - 1936-ban bevezetik a 441 soros rendszerüket (Európában elsőként)- 1937 455 soros rendszer 1940-ig- 1939 405 soros adó 1940-ig- a 441 soros rendszer marad fennt mint
közös európai „szabvány”
Érdekes próbálkozásokÉrdekes próbálkozások
Svájc:- 1932, 30 soros, 4:3, de 16,6 képkocka/sec
Olaszország:- 1932, 60 soros mechanikus, 20 fps (!)- 1939-ben ugyan bevezetik a 441
soros felbontást, de csak 21 fps-el közvetítenek
Belgium:- 1932, 30 soros, 12,5 és 16,6 fps
párhuzamosan
Észak-AmerikaÉszak-Amerika- már a kezdetektől saját rendszerek
(technikai okok, más hálózati frekvencia)- 1933, 240 soros mechanikus - 1936, 343 soros elektromos, 60 Hz- 1938-tól RCA 441 soros rendszere- 1938, 605 soros 60 Hz- 1941-től szabvány 525 soros System-M- az első valóban szabványosított televízió rendszer (FCC standard)
System-MSystem-M
- 525 sor (ebből 480 látható)- képfrekvencia: 29,975 Hz- félképfrekvencia: 59,95 Hz- sorfrekvencia: 15734,26 Hz
Európai fekete-fehérEurópai fekete-fehérszabványszabvány
- 625 sor - 50 Hz- váltott-soros- marad a 70-30% fényesség-szinkronjel arány- a 60-as évekig használjuk- 15625 Hz sorfrekvencia- 576 aktív sor
Függőleges felbontásFüggőleges felbontás
- a képernyő magasságában megkülönböztethető váltakozó sorok száma- nem azonos az aktív sorok számával- függ a képfelvevőtől és a képmegjelenítő eszköztől- ideális elektronágyú, megfelelő szinkronizáció és homogén foszforfelület esetében közelít az aktív sorok számához- általában az aktív sorok Krell-faktor (0.7) szorosa pl. Európa: 576*0.7 = 403
Gamma torzításGamma torzítás
- egy fontos színreprodukciós módosító is - képcsöves megjelenítők
gradáció (gamma) torzítása- ez egy nemlíneáris torzítás, mely az elektromos jelek fénnyé alakítása során lép fel, nem felvételkor- oka: a képernyő fénysűrűsége és a vezérlő feszültség közt nem áll fenn líneáris kapcsolat
- mérések útján (minden csatornára) γ értéke 2,2
Gamma torzításGamma torzítás
- megoldás a képátvitel előtt - az eredeti jelet inverz torzítottan továbbítjuk
- még minden előtt megjegyzés, nem RGB-t továbbítunk!
Gamma torzításGamma torzítás
Gamma torzításGamma torzításwithout correctionwithout correction
Gamma torzításGamma torzításwith correctionwith correction
Színelméleti alapokSzínelméleti alapok
- Human Visual System (HVS) az emberi látórendszer- látórendszerünk csak bizonyos elektromágneses hullámokra érzékeny- 400 nm – 700 nm, ez megfelel az ultraibolya felső (kék) és az infravörös (vörös) alsó határainak- több főszínt különböztetünk meg: sötétkék, enciánkék, zöld, sárga, narancs, vörös, bíbor- hallásunkhoz hasonlóan e tartományon belül sem egységesen érzékeljük az egyes fényhullámokat- ellenben vannak jól elkülöníthető sávok
Szemünk működéseSzemünk működése
- csapok (erős fény), pálcikák (gyenge fény, sötétben csak egy látóbíbor (rodopszín)), retina (ideghártya) - felbontás és dinamika (kb. 20000:1 kontraszt és 3600x2400-as felbontás, 30 fok, a többi perem)
Szemünk felépítéseSzemünk felépítése
Szemünk felépítéseSzemünk felépítése
- csapok különböző spektrális fényelnyelési képességgel (rodopszin,cianopszin, jodopszin)
(kb. kék, zöldessárga, vörös NEM RGB!)- gyakorlatban éjjel csak a kék komponenst látjuk
(pálcikák, rodopszin)
SzínterekSzínterek- a már említett megkülönböztethető sávok meghatározása nem egyértelmű (pl. Filmszalag )
- több alapszín -> nagyobb komplexitás, nagyobb információmennyiség
- kevés alapszín -> színhűség csökken
Megoldás: Kompromisszum- három (néhol öt vagy több) alapszín
kiválasztása - célirányos színtér (magazin, napilap,
filmszínház, fotó, rajz stb.)- elektromos átvitelnél képvisszaadó
berendezések korlátjait is figyelembe vesszük
Színtér:egy teret színtérnek nevezünk, ha bármely
színingert egy és csak egy színvektor ábrázol
SzínterSzínterszabványokszabványok
- több dimenziós vektorok - súlyozott színterek egyes alkalmazások esetében- színkeverési instrukciók- járulékos pontosítások
- nyomda- előnye: alsó korlát minden szempontból, legalább a média készítőkre vonatkozóan- hátrány: nehezen mérhető a végfelhasználhatói ponton
SzínterekSzínterekSzíntér:
egy teret színtérnek nevezünk, ha bármely színingert egy és csak egy színvektor ábrázol
- Tulajdonságai:- a színtér alapvektoraihoz rendelt irányok a
színtengelyek- összegző színkeverésről beszélünk, ha a
színingereket egyidejűleg vagy nagyon gyors változásokkal a szem ugyanazon a helyén érzékeli vagy annyira finom rasztert alkot, mely a szem számára már felbonthatatlan
- speciális színterek
AdditívAdditív színkeverésszínkeverés
SzínterekSzínterek- az RGB színtér 3D-ós tere sajnos nehézkes (színszerkesztés stb.)- amennyiben síkproblémává szeretnénk átalakítani, mindenképp információt veszítünk- viszont egy megfelelő transzformáció (ebben az esetben líneáris) lehetőséget teremthet, hogy a gyakorlatban megoldjuk a problémát- negatív színösszetevő függvények! - X-Y-Z RGB-ből!
SzínterekSzínterekX-Y-ZX-Y-Z
- transzformációs mátrix K:
- CIE szabvány- a látható színek az RGB-vel ellentétben csak pozitív
értékeket vehessenek fel- 540 és 700 nm közötti elhelyezkedő spektrál színek
kikeverhetők X-Y-al- Fénysűrűség csak az Y értékétől függ- cél: az első tér-nyolcadot a látható színek a lehető
leginkább töltsék ki
SzínterekSzínterekX-Y-ZX-Y-Z
- Az Y összetevő 1:4,59:0,06
- az x+y+z=1 egységsík segítségével térproblémából síkproblámává
egyszerüsödik a színmérés
SzínterekSzínterek- képezzük a színvektorok döféspontjait az egységsíkkal, majd a Z tengely irányából rávetítjük az Y síkra
- a kis x,y és z-t színkoordinátáknak nevezzük- meghatározható a színkoordináták spektrális színösszetevő függvénye is
SzínterekSzínterekx-y-z spektrálisx-y-z spektrális
színösszetevő függvényei színösszetevő függvényei
SzínterekSzínterek
- az RGB-hez hasonlóan bármilyen spektrális eloszlású színinger színösszetevőjét meghatározhatjuk
- CIE x-y színdiagram:- Z irányból az egységsík vetülete, vagyis az x-y altér- csak a látható színtartományt
ábrázoljuk
SzínterekSzínterek- a középső rész az akromatikus tartomány (gyakorlatilag fehér színingert kiváltó pontok halmaza)- A CIE feketestek természetesen különböző pontokban találhatók- bíboregyenes (kék,vörös)- a határvonalon az adott hullámhosszak láthatóak
SzínterekSzínterekCIE nyomdatechnikaCIE nyomdatechnika
SzínterekSzínterekCIE általánosCIE általános
SzínterekSzínterekszíninger meghatározásszíninger meghatározás
- az x-y koordinták nem határozzák meg pontosan a színingereket- modulus
X+Y+Z=m- a színkoordináták pontos meghatározása alapszínösszetevőkből:
SzínterekSzínterek
- Színinformációk közvetlenül ismertek az x-y koordinátákból, ellenben additív színkeveréskor elengedhetetlen a modulus ismerete- additív színkeverés során két színinger x-y értéke mellett általában ismerjük az Y-t (fénysűrűség) - az eredő kiszámítása a két pontot összekötő egyenesen fekszik
AdditívAdditív színkeverés színkeverés
Additív Additív színkeverésszínkeverés
- miután a két pont modulusa és fénysűrűsége ismert
- Mindezek segítségével az eredő színinger már egyértelműen meghatározható:
x-y patkóx-y patkóAz előbb ismertett színösszegzéshez pár megjegyzés
- bármely színinger előállítható egy fehér és egy megfelelő másik pont felhasználásával
- spektrálszínek felhasználásával majd minden színinger előállítható egy alkalmas fehér összegzésével (a bíboregyenes ugyanez a kék vagy a vörös pontokkal)- az eredő pont a modulusok arányában osztja a két pontot összekötő szakaszt
EgyenletesEgyenletes színességű diagram színességű diagram
- a színezetváltozásra az emberi szem a patkó különböző régióiban másképp reagál- a színezetváltozás a HVS által minimálisan érzékelhető mértéke az JND (Just Noticable Difference)- Mac-Adam ellipszisek
az ellipsziseken belül végbement változásokat az emberi szem képtelen érzékelni
UCSUCSuniformity chromacity scalesuniformity chromacity scales
CIE-UCSCIE-UCS- zöld területek a leginkább kritikusak- a CIE színdiagram nem arányos a színezettel- az eredeti 1931-es CIE színdiagram módosítása az 1960-as CIE-UCS diagram- egy új koordináta transzformáció után a két koordináta: u-v- kiszámításuk:
u-v diagramu-v diagram
- alakra szerencsésebb mint az x-y (~ háromszöggel közelíthető)
u-v diagramu-v diagram
- meghatározott állandó JND 0,008- líneáris transzformáció útján jutottunk az u,v diagramhoz az x-y diagramból- a valós színek tartomány háromszöggel közelíthető szemben az x-y koordináta rendszerben
Színes TVSzínes TV
- televíziós képátvitel során rendkívül fontos a minimális információmennyiség- miután az előbbiekben tárgyaltuk, hogy a metamer színeket átvitelkor egyenrangúnak tekinthetjük, s mivel a CIE színdiagramon belül egyes változások érzékelhetetlenek, lehetőségünk nyílik egyes információkat elhagyni átvitelkor- a pontos (végtelen alapszín, alak miatt) CIE diagram szerinti átvitel lehetősége egyébként sem adott
Színes TVSzínes TV
- a diagram jól közelíthető egy négyszöggel
Színes TVSzínes TV
- ha azonban lemondunk a Mac-Adam ellipszisek miatt amúgy sem túl fontos zöld területekről, a négyszög átalakul háromszöggé- három alapszínnel így képesek vagyunk színes képek leírására, kikeverésére - sajnos a televíziós képfelvétel és –visszaadás nem ideális fénykibocsájtó anyagok felhasználásával történik, így a pontos háromszögbeli színvisszaadást sem lehet garantálni- ellenben kis kompromisszumokkal elfogadható színreprodukció hozható létre a CIE színdiagramhoz képest
Színes TVSzínes TV- több alapszín rendszert szabványosítottak:
- FCC RGB(Federal Communication Commission, USA) 1953
- CIE XYZ
- EBU (European Brodcasting Union)
Alapszínek Alapszínek
AlapszínekAlapszíneku-v diagrammonu-v diagrammon
Színes tvSzínes tv
- az FCC RGB a CIE C fehért tekinti referens fehérnek- egyszerű transzformációval válthatunk az FCC RGB és a CIE XYZ rendszere között
világosság (fénysűrűség): Y = 0,3R + 0.59G + 0,11B
Színes TVSzínes TV
- színkülönbségi jelek- G-Y, R-Y, B-Y - csak színességinformációt hordoznak- CIE C fehér
Színes TVSzínes TV
- világosság televízió esetében
- megegyezik a fénysűrűséggel (Y)- {0,1} értékeket vehet fel, ahol Y=0
jelenti a fekete színt- Így a három színkülönbségi jel
értéktartománya
Színes TVSzínes TV- miután a három színkülönbségi jelből kettő egyértelműen meghatározza a világosságjellel együtt a harmadikat, egyet elhagyhatunk- általános szabály, hogy a továbbítandó jel minél nagyobb értéktartományt öleljen fel, így választásunk egyértelmű: a zöld színkülönbségi jelet nem továbbítjuk- a színinformációt így elegendő e két színkülönbségi jel koordináta rendszerében ábrázolni- így a színezet definiciója is módosul
Színes TVSzínes TVszínezetszínezet
Színes TVSzínes TV
- telítettség színes tv esetén„fehér” hígitottság
- egységnyi a háromszög határán
Színes TVSzínes TV
- a telítettséget a legnagyobb abszolútértékű negatív színkülönbségi jel határozza meg
- ahol értelemszerűen az Y a világosságjel
Színes TVSzínes TV
- minden elméleti alap adott a színes televízió bevezetéséhez
- az előbb bevezetett világosságjel-re alapozott színreprodukció megoldja az első komoly problémát, a fekete-fehér kompatibilitás kérdését- A sávszélesség problémákat azonban már nem ilyen egyszerű kezelni
színes televízió jelet a már felosztott frekvencia sávokban lehet sugározni
Színes TVSzínes TV
- képpontonkénti három csatornás átvitel lehetetlen (sávszélesség!) a korabeli lehetőségek mellett- szerencsére (sajnos?) a szemünk nem olyan érzékeny
- a színkülönbségi jelre jóval kevésbé mint a világosságjel felbontására
- már így is spórolunk a világosságjel átvitelén is (interlace átvitel)
Színes TVSzínes TV
- szuperponált jelátvitel során csíkozódás és egyéb zavarok lépnek fel- a gond a szuperponált színkülönbségi jel fekete-fehér világossági jelre gyakorolt kioltó és erősítő hatása- megfelelő frekvenciaválasztással azonban minimalizálható (segédvivő választás)- a legideálisabb a félsorfrekvencia páratlan számú többszöröse (sorfrekvencia felének páratlanszorosa)
Színes TVSzínes TV
- a megfelelő frekvencia megválasztása a jel modulációja miatt még egy elemet tartalmaz- a színsegédvivőn kívül a hangsegédvivő frekvencia távolsága is okozhat zavaró hibákat demoduláció során- itt is hasonló elvek érvényesülnek- szintén a sorfrekvencia felének páratlan számú többszörösének, mint távolságnak érvényesülnie kellene
Színes TVSzínes TVNTSCNTSC
- így a hang és képvivő (világosságjel) távolsága ezzel ellentétben épp a sorfrekvencia többszörösének kell lennie, hogy páratlan távolságra lehessen tőlük a színsegédvivő, azonban ez az amerikai rendszerben nem volt igaz!
Színes TVSzínes TVNTSCNTSC
- mivel se a képvivő se a hang segédvivő frekvencia megváltoztatása nem jöhetett szóba (utánhangolás), egy köztes megoldás segített
Színes TVSzínes TVNTSCNTSC
- a tökéletes szinkronizáció miatt a félképváltás frekvenciáját módosították:
- így a színsegédvivő frekvencia
- ahol végül a (2k+1)-et 455-re választották
Színes TVSzínes TVNTSCNTSC
- az NTSC szabvány korai bevezetése számos gyermekbetegséget is magával hozott, többek között a moduláció során torzuló frekvenciaátvitelt, melynek zavaró színhelyességi problémáit mai napig a vevőkészülékeken korrigálják- QAM, azaz kvadratúra amplitudó moduláció- az akkor ismert egyetlen modulációs lehetőség két független jel továbbítására- a moduláció során nem a két színkülönbségi jelet továbbítjuk! (R-Y,B-Y)
Színes TVSzínes TVNTSCNTSC
- alapvető okok- mivel a jel szuperponáltnem léphetjüktúl a maximumot
- módosított maximális kivezérlés- az eredeti R-Y és B-Y helyett egy a bőrszínre sokkal jobban illeszkedő elforgatott koordináta rendszer
Színes TVSzínes TVNTSCNTSC
- az így bevezett Q’ és I’ jelek sem egyenlő értékűek- míg az I’ felel a megfelelő bőrszínekért s ezért 1,5 MHz sávszélességgel továbbítják, a Q’ kevésbé szignifikáns színek felbontásáról felel 0,5 MHz sávszélesség mellett
Színes TVSzínes TVNTSC jelNTSC jel
Színes TVSzínes TVNTSC szuperponált jeleNTSC szuperponált jele
NTSCNTSC
- National Television System Committee (FCC)
- félképváltási frekvencia: 59,97005- 480 váltott-soros aktív sor- a látható fényhullámok csak egy része- QAM moduláció- 1953-től- tint control- USA, Japan, Dél-Amerika egyes részein
PALPAL
- Telefunken 1963 (Walter Bruch)- 50 Hz, igaz már csak kényszerből, nem a hálózati frekvencia miatt- módosított QAM- Phase Alternating Line - fázishibák kiküszöbölhetőek- 4,43 MHz-es színsegéd
vivőfrekvencia
SECAMSECAM- „francia ellenállás”- „Sequentiel couleur a memoire” sequential color with memory- a két színkülönbségi jel külön továbbított
- a szinkronizációhoz a vevőkészülékben tárolni kell az egyiket
- FM moduláció- 1967 első francia SECAM adó- a szocialista blokkon kívül csak
Görögországban használták Európában
ÖsszehasonlításÖsszehasonlítás
NTSC PAL SECAM
Félképfrekvencia
59,975Hz
50Hz 50Hz
Aktív Sorfelbontás
480 576 576
Szubjektív képminőség
közepes jó legjobb
DigitálizálásDigitálizálás
- analóg: folytonos idő és jelfelbontás- digitális: diszkrét idő és jelfelbontás- az átalakítás célja elsősorban a átviteli
hibák kiküszöbölése- lehetőség hibajavító kódok
alkalmazására - analóg jel átalakítása két lépésben:mintavételezés és kvantálás
Analóg jelAnalóg jel
- az analóg jel:- időben folytonos (t) f(t) jel- f(t) általában folytonos
- a átvitel előtti jel szinte sose egyezik meg az átvitel utánival
- gyakorlatban nem használható egyes esetekben (korlátozott pontosság)
- elektromos zajokra különösen érzékeny
Analóg jelAnalóg jel- átviteli csatorna tulajdonságain túl függ a
környezeti változóktól (időjárás, külső hatások)- az átvitt jel erősen függ az adó és a vevő
karakterisztikájától- nehezen feldolgozható- árnyékolással javítható több hiba- felerősített jelnél(mely drágább)
valamelyest javul- számítógép által feldolgozhatatlan- nincs garantálható minőség
ADCADCAnalog Digital ConverterAnalog Digital Converter
- szokás A/D-ként is emlegetni- analóg jel átalakítása digitálissá
két művelet segítségével:- mintavételezés: az időbeli
diszkretizálást- kvantálás: a mintavételezett
helyeken felvett értékek véges ábrázolása
MintavételezésMintavételezés
- f(t) egy folytonos függvény- minden T időpontban mintát veszünk az eredeti f(t) jelből:
f(nT) ahol n 0,1,2...- a mintavételezett (diszkrét) jel:
f[n] = f(nT)- mivel a mintavételezett pontokon kívül nem ismerjük az eredeti jelet,
lehetséges, hogy a mintavételezett jelből nem tudjuk visszaállítani a folytonos jelet
MintavételezésMintavételezés
- a mintavételezési frekvencia, 1/T, ahol T a mintavételezés időköze- Nyquist-Shannon mintavételezési
elmélete szerint sávkorlátozott jelek visszaállíthatóak, amennyiben a mintavételezési frekvencia a mintavételezett jel sávszélességének legalább kétszerese
- pl. az emberi fül számára hallható hangok esetében 2x20KHz
1D mintavétel1D mintavétel
- a mintavételi pontok szabályos időközönként követik egymást
- a mintavételi helyeken a mintavételezett és az eredeti jel megegyezik, a többi helyen a mintavételezett jel nulla
- a mintavétő jel Dirac-impulzusok sorozata
- spektrum átlapolódás, ha a mintavételi tétel nem teljesül
1D mintavétel1D mintavétel
1D mintavétel1D mintavétel
- túl kevés mintavételi pont esetén
1D mintavétel1D mintavétel
- ebben a speciális esetben mégis lehet jól választani:
- a kérdés a minimálisan elegendő mintavételi frekvencia
1D mintavétel1D mintavétel
- spektrum átlapolodásha a mintavételi frekvencia alacsony
TöbbdimenziósTöbbdimenziós mintavétel mintavétel
- nem minden analóg jel egy dimenziós
- több dimenziós mintavétel esete nem mindig egyezik meg több egy dimenziós mintavétel líneáris kombinációjával
- a színes tv jel három három dimenziós jel (szinkomponensenként
x,y,t)
2D mintavétel2D mintavétel2D jel spektruma és az ortogonális rács2D jel spektruma és az ortogonális rács
2D mintavétel2D mintavételA rács és a mintavételezett jel spektrumaA rács és a mintavételezett jel spektruma
2D mintavétel2D mintavétel
- természetesen elképzelhető különböző x és y köz is - ez még mindig csak állóképre érvényes! - Nincs idődimenzió!- viszont a mintavételi frekvencia nem
értelmezhető fogalom- a Nyquist-szabály mindezek ellenére
természetesen fennáll, csak egy más frekvencia értékre
2D mintavétel2D mintavétel
- térbeli frekvencia:A jel átlagszintjén történő három
egymás utáni null-átmenet közötti térbeli távolságának reciproka
- vízszintes és függőleges térbeli frekvencia
- Nyquist-Shannon tétel a kéttőre külön-külön
2D mintavétel2D mintavétel
- térbeli frekvencia szemléltetése
2D mintavétel2D mintavétel
- vízszintes térbeli frekvencia:X/∆x [ppw – period per width] - függőleges térbeli frekvencia:Y/∆y [pph – period per height]
2D mintavétel2D mintavételkis mintavételi frekvencia hatásakis mintavételi frekvencia hatása
3D mintavétel3D mintavétel
- az előbb ismertetett térbeli mintavételezést szabályos időközönként újra elvégezzük (térbeli és időkoordináták)
- mivel az idő és a térbeli koordináták függetlenek (a két térbeli nem!) az időbeli mintavételezésre mint egydimenziós mintavételezésre érvényes a Nyquist-szabály
3D mintavétel3D mintavételprogresszív jelprogresszív jel
3D mintavétel3D mintavétel
- a váltott-soros megjelenítés jó példa, hogy miként csökkenti a szükséges sávszélességet
3D mintavétel3D mintavételváltott-soros és progresszív jel váltott-soros és progresszív jel
KvantálásKvantálás
- a mintavétel után keletkezett jel még mindig folytonos értékeket vehet fel egy pontban, viszont csak meghatározott pontokban vesz fel értékeket
- a kvantálás során a jel pontjainak diszkrét értékeket adunk
- a jel tulajdonságait figyelembe véve szokás megválasztani a kvantálási szintek
számát
KvantálásKvantálás
- a kvantálási hiba:a kvantált jel értékeinek össz eltérése az
eredeti jelhez képest
KvantálásKvantálás- a kvantálási zaj, ahol a szintek száma Qa signal-to-noise ratio:
- jel függő a kívánt minimális SNR- pl. hangok esetében magasabb, mint
mozgóképek vagy színes képek esetén- digitális jelfeldoglozás esetében viszont minden zaj felerősödhet, így ott több
kvantálási szint szükséges
KvantálásKvantálásalacsony kvantálási szintalacsony kvantálási szint
KvantálásKvantálás
KvantálásKvantálás
ADCADChibákhibák
Kvantálási hibaAlacsony mintavételi frekvencia
Eredeti kép
ADCADC
- nem egyértelmű melyik a fontosabb- felhasználástól függ- általánosságban elmondható, hogy hangok
esetében 32Khz és 12-14 bit már elfogadható- állóképeknél a felbontás (mintavételi frekvencia függvénye) a néző távolságától függ (lsd. televízió ), a kvantálási szintek száma pedig szürkeskálánál minimum 8 bit, színkülönbségi
jeleknél pedig minimum 6 bit
Színes televízióSzínes televízió digitalizálása digitalizálása
- a 60-as évek végére egyre több gondot okoz a formátumok közti konvertálás(átvett adások, élő közvetítés stb.)- először kazettán, majd mind inkább
műholdas átvitel- mind a frekvencia (50Hz <-> 60Hz),
mind a felbontás váltás nehézkes (625 sor <-> 525 sor)- veszteség nélkül CSAK digitális
eszközökkel lehetséges!
Színes televízióSzínes televízió digitalizálása digitalizálása
- digitális eszközök a műsorok manipulásához már a 70’-es években
- a stúdiók egyre több digitális eszközt hasznosítanak, minden ilyen elem beépítése A/D és
D/A konvertálást igényel, mellyel folyamatosan romlik a jel- 1979 EBU-SMPTE Digitális stúdió szabványosítása
(SMTPE - Society of Motion Picture and Television Engineers)
(EBU - European Broadcasting Union)
Színes televízióSzínes televíziójeleijelei
- ellentétben a valóságos jelekkel, melyek folyamatosak
- vízszintes és függőleges síkban (x,y) - időben (t)
- hullámhossz értékekben (λ)- intenzitásban (I)- telítettségben- stb.az analóg színes televízió mind időben (pl.
képfrekvencia), mind térben (sorfelbontás) diszkrétek
Színes TVSzínes TV
- három térbeli jel:világosság: Y(x,y)Cb és Cr: Cb(x,y), Cr(x,y)
- ugyanígy az RGB:R(x,y), G(x,y), B(x,y)
- mozgóképek:Y(x,y,t), Cb(x,y,t), Cr(x,y,t)R(x,y,t), G(x,y,t), B(x,y,t)
Színes TVSzínes TV
- mivel az intenzitást, telítettséget és a szín hullámhosszát az RGB, YUV, YCbCr egyértelműen meghatározza, nem szükséges további dimenziók bevezetése
- viszont ezek a jelek a gyakorlatban mégis végtelen memóriát igényelnek
(folytonos x,y,t)
Színes TVSzínes TV- időbeli mintavételezés felső korlátja
adott (50 illetve 60 Hz )- a térbeli mintavételezés szintén adódik (625 illetve 525 sor –> függőleges térbeli frekvencia, képarányból és a függőleges térbeli frekvenciából pedig -> vízszintes frekvencia)képpontok száma (mintavételi pontok a térben, elég az aktív sorokat
mintavételezni!): NTSC 640x480 PAL 720x576
Digitalizálás előnyeiDigitalizálás előnyei televíziós jeleknél televíziós jeleknél
- hibajavítás lehetősége - tárolás és rögzítés transzparens
(immunitás tárolási és rögzítési torzítással és zajjal szemben)
- könnyű multiplexálhatóság- egyszerű és hatékony tárolás, rögzítés
és manipuláció digitális eszközökkel- költséghatékony üzemeltetés és
karbantartás
Digitalizálás előnyeiDigitalizálás előnyei televíziós jeleknél televíziós jeleknél
- lehetőség redundancia csökkentő eljárások alkalmazására- multimédia tartalmak beillesztése videófolyamokba- digitális áramkörök kezelése,
beállítása egyszerűbb
Színes televízióSzínes televízió digitalizálása digitalizálása
- 1982 CCIR 601-es szabvány(Comite Consultatif International des Radio-
communications)
Studio Encoding Parameteres of Digital Television for Standard 4:3 and Wide-screen 16:9 Aspect Ratios
ma : ITU-R BT601-5
- a szabvány tartalmazza mind a 625 mind az 525 soros jelek digitalizásának feltételeit és paramétereit, úgymint mintavételi frekvencia, mintavételi rács, RGB/YUV
átalakítás mátrixai és az analóg jel szűréséhez szükséges adatokat
Színes televízióSzínes televízió digitalizálása digitalizálása
- fontos különbség a stúdió és a végfelhasználói videó jelek között, hogy előbbi komponens alapú
is lehet- komponens átvitelnél a három csatorna (Y,U,V) külön továbbítandó ellentétben a CVBS jellel (melyet modulálva fogunk)- kevesebb hiba, kevésbé érzékeny az A/D D/A konvertálásra- könnyebb manipulálhatóság- az ITU 601 CSAK komponens jelekre vonatkozik
Színes televízióSzínes televízió digitalizálása digitalizálása
- CCIR 656-os (1986) szabványa, mely a digitális interface-t specifikálja, már a világosságjel és a színkülönbségi jel multiplexálását és
szinkronizálását is leírja (de nem kompozit!)- ezen felül a kioltási időket és az elektromos és mechanikai jellemzőket is tartalmazza- soros és párhuzamos átvitel- Interfaces for Digital Component Video Signalsin 525-line and 625-line Television Systems
Operating at the 4:2:2 Levelof Recommendation ITU-R BT.601
Színes televízióSzínes televízió digitalizálása digitalizálása
- 625x50=15625 és 525x29,975=15734- miután elhanyagolható a különbség, egységes mintavételi frekvencia- viszont legkisebb közös többszörös 2,25 MHz- stúdió! (kamera jele: RGB!)- a világosságjelhez képest 2:1 arányban
mintavételezzük a színkülönbségi jeleket (fele sávszélesség)
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601ITU 601
- Véglegesített mintavételi frekvenciák 4:3-as képarány mellett:
- világosságjel: 13,5 MHz, mellyel 5,8 MHz-es jelet állítunk vissza
- színkülönbségi jelek: 6,25 MHz és 2,6 MHz-s sávszélesség
- az átvitel biztonsága miatt magasabb a faktor- ortogonális a mintavételi struktúra
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601ITU 601
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601ITU 601
- a fenti ortogonális struktúraval 27MHz-es teljes mintavételezett jel
13,5 : 6,25 : 6,25 MHz (4:2:2)- a 4:2:2 mellett más ortogonális
struktúrákat is tartalmaz az ajánlás eltérő felhasználási területekhez
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601ITU 601
- 4:1:1 – hírgyüjtő rendszerek kisebb sávszélesség- 2:1:1 – otthoni rendszerek ma már nem használják- 4:2:0 – hírgyűjtő vagy utómunkát nem
igénylő rendszerek (a DVD is!)- 4:4:4 – professzionális stúdió- 4:2:2:4 és 4:4:4:4 – speciális jeleket
használó (pl. alpha csatorna) rendszerek
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601 4:2:2ITU 601 4:2:2
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601 4:4:4ITU 601 4:4:4
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601 4:1:1ITU 601 4:1:1
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601 4:2:0ITU 601 4:2:0A színkülönbségi jelek mintavételi helyei lehetnek félsorokban is.
Színes televízióSzínes televízió digitalizálása digitalizálása
ITU 601 kvantálásITU 601 kvantálás
- mintavételezett jelek kvantálására kezdetben 8 bit-et használtak csatornánként, ma már a stúdiókban jellemzően 10 vagy a fölötti bit felbontás a megszokott -> deep colour 36 bit
- 4:2:2, 4:3-as képarány:27MHz x 8bit/minta = 216 Mbit27MHz x 10bit/minta = 270 Mbit
- 4:2:2, 16:9-es képarány:36MHz x 10 bit/minta = 360 Mbit
Digitális csatornaDigitális csatornacsatornakódoláscsatornakódolás
-mivel elektomos jelek átvitele csak analóg csatornán lehetséges, az analóg digitális átalakítás után legalább egy műveletet el kell végeznünk, mielőtt az elektromos jelet kiküldjük a csatornára
- a csatornakódolás során kiegészítő bitekkel bővítjük az eredeti digitális jelet
a hibajavításhoz (általában redundancia alapúak)- a csatornakódolás során modulálunk
Digitális csatornaDigitális csatornaforráskódolásforráskódolás
- mint általában a természetes jelek, a videójelek is tartalmaznak redundás részeket
- az egyéb, elhanyagolható részek kiválasztása mellett a redundáns területek
tömörített reprezentációját a forráskódolás során állítjuk elő
- ez a tömörítés helye
Digitális csatornaDigitális csatorna
Digitális csatornaDigitális csatornasávszélesség igénysávszélesség igény
- analóg televíziós jelek sávszélessége, komponens esetben:
maximálisan 11 MHz (CVBS 6MHz)- ezzel szemben egy digitális csatorna ennek a többszöröse- 1 bit/Hz-et feltételezve:
270Mbit -> 270 MHz!- ez koax kábellel ma is nehézkes- optikai átvitellel lehetséges (drága)- tömöríteni kell!
Videó formátumokVideó formátumok
Videó formátumokVideó formátumok
-
ForráskódolásForráskódoláscélok és követelményekcélok és követelmények
- redundáns vagy elhanyagolhatórészek kiszűrése a jelből- bitsebesség adaptív konvertálás(mobil telefon <-> HD kivetítő)- a tömörítés (kódolás) legyen gyors! (pl. élő adás, vagy streaming)- a dekódolás legyen minél
egyszerűbb (olcsóbb vevőkészülék)
Videó tömörítésVideó tömörítésmegállapításokmegállapítások
- a mozgóképek statisztikai redundanciája:
térben közeli képpontok és időben közeli képek egymáshoz hasonlóak
- a felvevőkészülékek az emberi látórendszer számára érdektelen információkat is tartalmaznak
- térbeli (intra), időbeli (inter) redundancia
Videó tömörítésVideó tömörítésmegállapításokmegállapítások
- az emberi szem kevésbé érzékeny a kvantálási zajra, ha a képváltási frekvencia
nagy (gyors mozgás)- az emberi szem hirtelen képváltásoknál, gyors mozgásoknál kevésbé veszi észre a képminőségi problémákat- világosságjelre sokkal érzékenyebbek
vagyunk mint a színkülönbségi jelekre- a hanghoz képest sokkal kisebb jel-zaj
viszonyt is elfogadhatónak tartunk
Videó tömörítésVideó tömörítésmegállapításokmegállapítások
- gyorsan mozgó képek esetében a felbontásigényünk jóval kisebb, mint álló vagy lassan változó jeleneteknél
- vannak olyan speciális mozgások, melyeknél (élőlények) fontosabb a
minőség- mindezen ismeretek megalapozzák a
videó tömörítés lehetséges útjait
ForráskódolásForráskódolás
- reprezentáció váltás:- új ábrázolási sík- kisebb redundancia- lehet DPCM (differential pulse code
modulation), predikció, transzformációs kódolás, mozgás kompenzáció
ForráskódolásForráskódolás
- Irreverzibilis kódolás:- lényegtelen részek kiszűrése- pontosság csökkentése
- kvantálás - alul-mintavételezés(kisebb fps, kisebb
felbontás)
ForráskódolásForráskódolás
- Reverzibilis kódolás- kódszavak megadása(információ elmélet)- lehet adott bitsebesség (CBR)constant bit rate- változó bitsebesség (VBR)various bit rate- futamhossz kódolás (RLC)Run length coding
VideótömörítésVideótömörítés1. Előzetes szűrés:
lényegtelen elemek 2. Formátum konverzió
cél felbontás, képfrekvencia3. Predikció
redundancia4. Transzformáció
reprezentáció váltás5. Futamhossz kódolás
információ elmélet6. Változó szóhosszúságú kódolás
Videó tömörítésVideó tömörítés
Előzetes szűrés- a színinformációkból csak a számunkra látható elemeket haggyuk meg- hatása általában nem szignifikáns
Formátum konverzió- a hiányzó képpontok kiszámításainterpolációval
Videó tömörítésVideó tömörítéspredikciópredikció
- redundancia csökkentő eljárás - időben (inter)
a jel jövőbeli elemeinek jóslásaaz eddig ismert elemekből
- térben (intra)az ismert elemekhez közeli
ismeretlen elemek jóslása
Videó tömörítésVideó tömörítéspredikciópredikció
- x(n) jóslása x(n-1), x(n-2)...x(n-N) ismert elemekből
- az N megválasztása önkényes- a h súlyzó tényezők általában erősen
különböznek- természetes a cél: a jóslás minimálisan térjen el az eredeti jeltől
Videó tömörítésVideó tömörítéspredikciópredikció
- minimalizáljuk a predikciós hibát:
- erősen jelfüggő- nagy redundancia esetén hatékony
Videó tömörítésVideó tömörítéspredikciópredikció
Kvantált predikciós hiba:
Predikciós hiba:
Kvantálási hiba:
Videó tömörítésVideó tömörítéspredikciópredikció
- csak a kvantált predikciós hibát továbbítjuk- ennek a jelnek sokkal kisebb bitsebesség is
elég lesz átvitelkor - viszont sajnos az előbbi elképzelés tartalmaz egy hibát:
- a kvantálási hiba folyamatosan továbbterjed, így rontva mind a predikció, mind a dekódolt jel minőségét
Megoldás: a dekódert beépítjuk a kóderbe!
Videó tömörítésVideó tömörítéspredikciópredikció
Videó tömörítésVideó tömörítéspredikciópredikció
- többdimenziós eset a blokkvázlatot nem bonyolítja
Videó tömörítésVideó tömörítéspredikciópredikció
- az együtthatók optimális meghatározása csak utólag lehetséges, ismerve a jelet- ez természetesen a legtöbb esetben
lehetetlen, így kompromisszumra kényszerülünk
- a cél, olyan predikció kialakítása, mely átlagosan jól teljesít- gyorsabb, de pontatlanabb, optimálisnál kisebb tömörítési ráta
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- kísérletek bebizonyították, hogy megfelelő, diszjunkt blokkokat kiválaszva a képből (NxN), a blokkokon belül fellépő redundancia igen nagy
- amennyiben olyan reprezentáció állna rendelkezésünkre, mellyel az adott NxN-es
blokk könnyebben kezelhető válna, komplexitása kisebb lenne, jelentősen csökkenthetnénk a tárolt információ mennyiségét
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- transzformáció után a blokkokon belül a korreláció kisebb (ideális esetben zérus)
- a transzformáció során az együtthatók változnak meg, az információ hossza nem!
- mivel az eredeti kétdimenziós képinformációt dekódoláskor szeretnénk visszaállítani,
alapkövetelmény, hogy a transzformációs kódolás inverze létezzen és minél egyszerűbb, gyors
algoritmusokkal megvalósítható legyen
Videó tömörítésVideó tömörítéstranszormációs kódolástranszormációs kódolás
- 1D eset N hosszúságú blokkokat feltételezve:
- az eredeti jel x=[x(0),x(1)...x(N-1)]
- a transzformált jelx’=[x’(0),x’(1)...x’(N-1)]
- a transzformáció egy NxN-es mátrix : T inverze pedig T’
x’=Tx és x=T’x’
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- a T megválasztásánál további követelmény, hogy unitér legyen illetve együtthatói valósak legyenek
- T orthonormált - ilyen feltételek mellett a transzformáció gyors és hatékony
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- többdimenziós esetben az eredeti NxN-es blokkok korrelációja mind horizántális mind vertikális irányban csökkenthető
- természetesen ebben az esetben is egy mátrix művelettel transzformálunk- a térbeli redundancia kihasználásához itt is fontos a megfelelő N megválasztása - így az eredeti x(i,j) jelből egy x’(i,j) jel
keletkezik, ahol i,j természetes számok
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- optimális esetben a korreláció a transzformált blokkban zérus
- mivel ez az ideális eset csak utólagos jelelemzéssel érhető el, gyakorlatban szinte alkalmazhatatlan
-gyakorlatban minden NxN-es blokkhoz meg kell találni a jel autokorrelációs mátrixának
sajátvektorait, majd a sajátvektorok által feszített térbe transzformálni az eredeti jelet
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- a transzformált tartomány legfontosabb jellemzője, hogy az eredeti energia eloszlással
ellentétben, szerencsés transzformáció után az blokk elemei közt egyenlőtlen energia eloszlás alakul ki, azaz lesznek elhanyagolható (sok zérus érték) és kiemelt fontosságú elemek
- ez az egyenlőtlenség alkalmat ad számunkra, hogy csak a lényeges együtthatókat továbbítsuk, ezzel is csökkentve a redundanciát
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- amenyiben minden együtthatót meghagyunk, az transzformáció-inverz transzformáció vesztegségmentes művelet
- persze ebben az esetben nem lenne értelme a transzformációnak, hiszen így az átvitel
szempontjából az információmennyiség megmarad- viszont az egyenlőtlen energiaeloszlás miatt
elhagyott (általában az új blokk jobb alsó végén sorakozó zérus elemek) együtthatókat már tekinthetjük tiszta nyereségnek
- az elhagyható zérus elemek száma jelfüggő
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- amennyiben előre meghatározzuk az átvitt együtthatók számát a transzformáció
veszteségessé válik- a cél ezt a veszteséget minimalizálni
olcsón előállítható áramköröket használva- a transzformáció igazi veszteségét a
kvantálás után állapíthatjuk meg
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- optimális transzformáció tehát jelfüggő
Karhunen Loeve Transformation- amennyiben a transzformáció bázisát
előre meghatározzuk (mint pl. a legtöbb ma is használt tömörítő algoritmusnál) sajnos a korreláció csak speciális esetekben lesz zérus
- a kompromisszum szerencsére nem befolyásolja jelentősen a tömörítés
minőségét és hatékonyságát
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
- pár, gyakorlatban is használt nem optimális transzformáció:
- Discrete Cosine Transformation - Discrete Sinus Transformation- Discrete Fourier Transformation- Discrete Walsh Hadamard
Transformation- Discrete Haar Transformation- Discrete Slant Transformation
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
DCT (Discret Cosinus Transformation)
- közel optimális természetes videóképekre
- könnyen számolható (olcsó)- valós együtthatós (gyakorlati
követelmény, melyet pl. a DFT sem tud teljesíteni)
- általában pár együtthatóba (<10) összpontosul a teljes energia
- az NxN-es mátrix bal felső eleme (DC együttható - átlag)
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
DCT (Discret Cosinus Transformation)
Videó tömörítésVideó tömörítéstranszformációs kódolástranszformációs kódolás
DCT (Discret Cosinus Transformation)
Videó tömörítésVideó tömörítésDCT bázis (8x8)DCT bázis (8x8)
Videó tömörítésVideó tömörítéskvantáláskvantálás
- az együtthatók elhagyása helyett egy alternatív információtömörítő eljárást is alkalmazhatunk
- az eddigiekben láttuk, hogy egy jól transzformált jel alacsony koordinátájú elemei
fontosabbak mint a többi- amennyiben a fontosabb elemeket egy több lépcsőből álló skálán próbálnánk meg
közelíteni, a nagy koordinátájú elemeket elegendő lenne pár lépcsővel leírni, hiszen a legtöbbjük úgy is zérus
Videó tömörítésVideó tömörítéskvantáláskvantálás
- kvantálás hatása általában információ veszteség
- az elvesztett információ nem minden esetben okoz komoly minőségbeli csökkenést
- a transzformált NxN-es blokk elemeit helyfüggően újrakvantálva egy, az eredeti jelhez képest alacsony információtartalmú jelet
kapunk- az újrakvantálási hiba növeli a digitalizálás során fellépett kvantálási hibát
Videó tömörítésVideó tömörítéskvantálási hibakvantálási hiba
Videó tömörítésVideó tömörítéskvantáláskvantálás
- az újrakvantálás szintén egy mátrix művelet
- W(k,l) a kvantálási erőssége, az eredeti jelet ekkora értékkel osztjuk- a kis koordinátájú együtthatókat kisebb,
a nagyobb koordinátájú elemeket nagyobb értékkel osztjuk, majd kerekítünk
Videó tömörítésVideó tömörítéskvantáláskvantálás
- a kvantálási mátrix megválasztása önkényes
- értelemszerűen durvább kvantálás (nagyobb értékek) rosszabb minőséget eredményez
- miután az emberi látórendszer nem feltétlenül a közvetlen SNR értéknek megfelelően érzékeli a minőségcsökkenést,
sok esetben alacsony SNR és durva kvantálás mellett is kielégítő a képminőség
Videó tömörítésVideó tömörítéskvantálási mátrix MPEGkvantálási mátrix MPEG
Videó tömörítésVideó tömörítéskvantáláskvantálás
- a megállapítás, hogy a mátrix alacsony koordinátájú elemei fontosabbak, mint a magas koordinátájú elemek, nem teljesen
helyes- amennyiben kicseréljük az alacsony és
magas koordinátákat, kis és nagy térbeli frekvencia értékekre vonatkozó koordinátákra, már közelebb járunk a valósághoz
- mindezek ternészetesen megint visszavezethetőek az emberi látás hiányosságáira, mint pl. kevésbé látjuk a nagyfrekvenciás változásokat
Videó tömörítésVideó tömörítéskvantáláskvantálás
- az így kalakult fontossági sorrend egy cikk- cakkban haladó letapogatást igényel
Videó tömörítésVideó tömörítésmozgás kompenzációmozgás kompenzáció
- az már ismertetett predikció természetesen rendkívül sokféle formában és igéretes lehetőség kiaknázására is használható- az egyik, mozgóképek szempontjából
legfontosabb ilyen predikció az időbeli predikció kihasználása
- egy természetes felvétel időbeli redundanciája általában meglehetősen magas, így ennek
kihasználása tömörítéshez több mint egy igéretes ötlet
Videó tömörítésVideó tömörítésmozgás kompenzációmozgás kompenzáció
Videó tömörítésVideó tömörítésmozgás kompenzációmozgás kompenzáció
- a képkülönbség meghatározása:
- természetesen a cél egy olyan d vektor meghatározása, mellyel ez a differencia minimális:
Videó tömörítésVideó tömörítésmozgás kompenzációmozgás kompenzáció
- a keresett vektor megtalálása komoly erőforrásigénnyel rendelkező feladat
- ezzel ellentétben a dekódolás már sokkal egyszerűbb művelet- felmerül két kérdés:
Milyen pontosságú vektor tárolása éri meg?
Mely differencia felett éri meg tovább keresni a megfelelő vektort, növelve a
számításigényt?
Videó tömörítésVideó tömörítésmozgásbecslésmozgásbecslés
- a mozgáskeresés még ma is nehéz feladatnak minősül
- a 90’es évek elején emiatt a mozgáskeresést csak a világosságjel feldolgozására korlátozták
- az így elérhető tömörítési ráta még így is rendkívül magas- nem élő adások esetében pedig
lehetőség nyílik pontosabb mozgás kompenzációra (pl. DVD lemez)
Videó tömörítésVideó tömörítésmozgás kompenzációmozgás kompenzáció
- az eddig ismertetett mozgásbecslés minden egyes képpontra fölösleges és kevés haszonnal járó algoritmust eredményezne
- igazán érdemleges tömörítés csak abban az esetben érhetünk el, ha a képpontokat
blokkokba rendezzük, és az össz differenciát próbáljuk minimalizálni
Videó tömörítésVideó tömörítésmozgás kompenzációmozgás kompenzáció
- a blokkok méretétől (NxM) függően lehetőségünk nyílik jobb-rosszabb tömörítési rátát elérni
- a keresést elvégezhetjük a referencia kép minden blokkjára, viszont statisztikailag egy meghatározott keresési ablakon belül nagy százalékkal megtalálunk egy már megfelelő vektort
Videó tömörítésVideó tömörítésmozgás kompenzációmozgás kompenzáció
- ennek a megoldásnak természetesen előnye, hogy egy adott keresési ablakban a vektorok koordinátája is korlátozott, így könnyen tömöríthető
Videó tömörítésVideó tömörítésinter és intra predikciós kódolásinter és intra predikciós kódolás
- videótömörítési szempontból létezik mind térbeli, mind időbeli redundancia- a két típusú redundancia csökkenthető- az egy képen belüli redundancia térbeli
predikcióval (intra frame), az időbeli pedig mozgásbecsléssel (inter frame)
- az így kialakult predikciós hiba még tartalmazhat redundáns részeket
Videó tömörítésVideó tömörítéstranszformált predikciós hibatranszformált predikciós hiba
- a transzformált és újrakvantált predikciós hibát szerencsére már alacsony
redundacia jellemzi, de ettől függetlenül még mindig lehetséges tovább tömöríteni- futamhossz kódolás (RLC – Run Length Coding)- a kódolás során párokat alakítunk ki - a páros első eleme maga a következő
elem, a második pedig az elem összefüggő előfordulásának hossza pl. (green,15)
Videó tömörítésVideó tömörítésRLCRLC
- digitális kódszavak tömörítésénél még az előbb említett párost módosíthajuk is, csökkentve a tárolandó információ nagyságát
- (nulla sorozat hossza, nem nulla sorozat hossza (1 sorozat hossza))
- természetesen ez a fajta tömörítés csak már kódolt folyamra érvényes
- megfelelő kódszavak megválasztása szintén növelheti a tömörítés hatékonyságát
Videó tömörítésVideó tömörítésváltozó szóhosszúságú kódolásváltozó szóhosszúságú kódolás
- információelméleti tétel, hogy hatékony (minimális bitszámú) reprezentációhoz a gyakran előforduló elemeket kell a legrövidebb kódszavakkal párosítani, míg a legritkábbaknak adhatunk hosszabb kódszavakat is
- a Variable Length Coding is szintén ezen az alapelven működik- minden összetartozó elemcsoportnak
különböző (kódszó,elem) táblázatot alakít ki gyakorisági alapon
Videó tömörítésVideó tömörítésVLCVLC
- az átvitel során először a kódtábla, majd maga az információ jut ki a csatornába- hatékonysága az elemek histogramjától függ- egyenletes eloszlás esetén rossz- könnyen algoritmizálható, akár többször elvégezhető valós idejű rendszerekben is
Videó tömörítésVideó tömörítéshibrid kódolási elvekhibrid kódolási elvek
- amennyiben egy tömörítési eljárás mind intra mind inter predikciós megoldásokat
is alkalmaz hibrid kódolóról beszélünk- miután az inter predikciós kódolás csak korlátozottan értelmezhető önmagában, amai modern kódolók mind hibrid kódolók, kivéve, pár speciális feladatra készített
intra kódoló eljárást (az első képet mindenképp intra kódoltan kell továbbítani)
Videó tömörítésVideó tömörítéshibrid kódoláshibrid kódolás
Videó tömörítésVideó tömörítésIntra kódoló (JPEG)Intra kódoló (JPEG)
- mindenben megfelel az eddig ismertetett tömörítési elveknek- általános digitális képek tömörítésére- csak állókepekre érvényes -> intra kódoló (önmagában kódolt)- Joint Photographic Experts GroupISO/CCITT 10918- egy képen belül hasonló kihívás mint egy
videó képkocka tömörítése (8bit/channel, bármely színtérben)
Videó tömörítésVideó tömörítésJPEGJPEG
- a tavalyi Microsoft kiegészítés ellenére már az eredeti szabvány is megengedte 65534x65534-es felbontású képek tömörítését- a szabvány tág formában korlátoz(felbontás, színek, méret stb.)- cserébe gyors és általános dekódolási szabvány- lehetőség gyors minőségbeli váltásra (pl.
negyed méretbe könnyen konvertálható)- nyílt szabvány, bárki készíthet kódolót (a
szabvány csak a jpeg dekódolás menetét tartalmazza ajánlás formában)
Videó tömörítésVideó tömörítésJPEG codecJPEG codec
Videó tömörítésVideó tömörítésJPEGJPEG
- fix kvantálási tábla- DCT transzformáció- Huffman kódolás (VLC)- cikk-cakk elrendezés- minimum tízszeres méretcsökkenés- az átlag jelszint és az aktuális jel
differenciáját kódoljuk (a jel amplitudója így a felére csökken)
- általában szimmetrikus komplexitás (kóder-dekóder)
Videó tömörítésVideó tömörítésMPEGMPEG
- Motion Picture Experts Group- általános célú videó és audió tömörítési szabvány (csak a dekódolás menete előre meghatározott)- maga a feladat bonyolultsága
megkívánta az első MPEG videó- és hangfolyamokra vonatkozó korlátozásait
- hibrid kódolási eljárás
Videó tömörítésVideó tömörítésMPEGMPEG
- a specifikáció tartalmazza- a kódolt videó, audió és adat
összefűzésének szintaxisát a szinkronizált visszajátszáshoz
- a bitsebesség csökkentett videó bitfolyamának szintaxisát és a videó
dekóder modelljének leírását- a bitsebesség csökkentett audió
bitfolyamának szintaxisát és az audió dekóder modelljének leírását
Videó tömörítésVideó tömörítésMPEGMPEG
- MPEG-1 (ISO 11172/1993) cél:- alacsony bitsebességű
multimédiás alkalmazások , mint pl. VideoCD, CD-I
- 1,5Mbit/s legfeljebb VHS minőségű felvétel, de többféle fps- SIF felbontás (352x288)
(progresszív!) (max 4096x4096)- az audió általában mono (stereo is
lehet)
Videó tömörítésVideó tömörítésMPEG-1MPEG-1
- mégis nagyon fontos, hisz nélküle nem születik meg az MPEG-2 - a kódolás menete később csak módosul,
az alapelvek megmaradnak- VCD elterjedésének gátló tényezője
kezdetleges minősége, problémás kezelése, nem tud túllépni a VHS lehetőségein
(még csak nem is írható) (egy CD-re max egy óra fér)
Videó tömörítésVideó tömörítésMPEG-2MPEG-2
- MPEG-2 (ISO 13818/1994-95) cél:- az MPEG-1 bővítése!- műsorszórás DVB (Digital Video Broadcasting)2-8 Mbit/s- Stúdiótechnika 25-50 Mbit/s- Digital Verstile Disc (DVD)
3-7 Mbit/s- ITU-R BT-601-re
Videó tömörítésVideó tömörítésMPEG-1/2MPEG-1/2
- a JPEG-el ellentétben az MPEG kódere és dekódere jelentősen különbözik, legfőképp számításigényükben (asszimmetrikus)
- a tömörített információ egymásba ágyazott rétegekből áll- fontos megállapítás, hogy a
rétegek nem mindegyike dekódolható önmagában
Videó tömörítésVideó tömörítésMPEG-1/2MPEG-1/2
Közös tulajdonságok:- DCT- VLC- fix kvantálási mátrix- intra predikció - inter predikció- három képtípus I,P és B
stb.
Videó tömörítésVideó tömörítésMPEG-1/2MPEG-1/2
A képkockákat három féle módon tömörítjük.
Intra kódolt kép (Intra coded, I kép):
- önmagában kódolt kép, a dekódoláshoz nem szükséges
referencia képInter kódolt kép lehet P vagy B.
Videó tömörítésVideó tömörítésMPEG-1/2MPEG-1/2
Predictive coded (P):inter predikált kép, referenciája az őt megelőző P vagy I kép(csak múltbeli referencia)
Bidirectionally coded (B):két referencia képből predikált kép,
referencia lehet múltbeli és jövőbeli I vagy P