Multimédia ismeretek
10. évfolyam
informatika orientáció
Összeállította: Nagy Zsolt
2
3
Tematika
1. Multimédia fogalma
1.1. Médium
1.2. Média
2. A multimédia alkalmazások alkotóelemei
2.1. Szöveges alkalmazások
2.2. Hangállományok
2.3. Grafikus objektumok
2.4. Videoállományok
3. Multimédia alkalmazások jellemzői
3.1. Idődimenzió
3.2. Adatfolyam
3.3. Valós idejű működés
4. Egy multimédia számítógép hardvere
4.1. CPU
4.2. Memória
4.3. Belső sínrendszer
4.4. Sínrendszerek
4.5. Monitor
4.6. Grafikus kártya
4.7. Lapolvasók
4.8. Hangkártya, hangszóró, mikrofon
4.9. Videokártya
4.10. CD technika
4.11. DVD technika
5. Szöveges alkalmazások
5.1. Szöveg elkészítésének menete
5.2. Szövegbevitel képolvasóval
5.3. Az OCR programok működése
5.4. Objektumok csatolása és beágyazása
4
6. Világháló
6.1. Hypertext
6.2. Hypermédia
6.3. Kép, hang és videoállományok az Interneten
7. Digitális hangtechnika
7.1. A hang fizikai jellemzői
7.2. A hang érzékelése
7.3. Akusztikai alapfogalmak
7.4. A hang rögzítése
7.5. A hang digitális rögzítése és lejátszása
7.6. Digitális hangállomány mérete
7.7. Hangfelvétel készítése
7.8. Hangállomány tömörítése
7.9. Környezeti hangtér
8. Grafikus alkalmazások, animáció
8.1. Az emberi látás informatikai vonatkozásai
8.2. Színlátás
8.3. Szín koordinátarendszerek
8.4. Számítógépes grafika
8.5. Képek jellemzői
8.6. Képek digitalizálása
8.7. Képállományok tömörítése
8.8. Animáció
9. Digitális videotechnika
9.1. Színes TV rendszerek
9.2. Videojelek digitalizálása
9.3. Digitalizált videoállomány jellemzői
9.4. Videoállományok tömörítése
9.5. Videoállomány tömörítési eljárások
5
1. Multimédia
1.1. Médium fogalma:
Az információk terjesztésére és bemutatására szolgáló eszközök.
Pl.: nyomtatott szöveg, kép, grafika, beszéd, zene, videó.
A művelés, közvetítés, kifejezés eszköze. A tömegtájékoztatás gyűjtőneve.
1.2. Média:
A médium többes száma. Több médiumot jelent.
Multimédia:
Sok-sok médium.
A multimédiát független információelemek számítógép-vezérelt, integrált
előállítása, célorientált feldolgozása, bemutatása, tárolása és továbbítása jellemzi.
A multimédia szó tágabb értelmezésben egy kreatív alkotó közeg, olyan rendszert
definiál, amely biztosítja az egyén vagy csoportok számára a különböző struktúrában
(kép, grafika, mozgókép, hang, írott szöveg, adatállományok, stb.) rögzített, nem
szükségszerűen egy adatbázisban lévő digitális információ interaktív elérhetőségét,
annak a felhasználás helyén történő rögzítését, átstrukturálását, bővítését. A cél
tehát az ember információval történő magas színvonalú kiszolgálása, a hatékonyság
érdekében lehetőleg minden érzékszervre egyidejűleg gyakorolt ingerekkel.
A médiumok besorolhatók időfüggetlen (pl. szöveg, ábra) és időfüggő (hang,
mozgókép) kategóriákba.
6
2. A Multimédia alkalmazások alkotóelemei
2.1. Szöveges alkalmazások:
A közlendő információ szövegesen jelenik meg.
Létrehozás:
Hagyományos (begépelés)
Beolvasás (lapolvasó)
Előbb kép, majd OCR (Optical Character Recognition)
karakterfelismerés.
Legyen:
Tömör, lényegre törő, átlátható.
Kiemelések, hyperlinkek alkalmazása.
2.2. Hangállományok:
A hatás javítása érdekében a multimédia alkalmazás keretein belül,
hangállományt is el lehet helyezni. Digitális, lehetőleg tömörített állapotban.
Feltétel, hogy a számítógépben legyen hangkártya és hangszóró.
Jellemzi:
Tömörítés
Hangcsatornák száma
o Mono 1 csatorna
o Sztereo 2 csatorna
o Dolby 4.1, 5.1 csatorna
o Theatre 7.1 csatorna
Analóg hang Hangkártya Digitális hang
2.3. Grafikus objektumok:
Általában a szöveges részeket egészítik ki járulékos információkkal.
Létrehozásuk:
Lapolvasóval beolvasás
Fényképezőgép
Rajzoló, képszerkesztő programok
A legelterjedtebb grafikus formátumok: BMP, TIF, GIF, JPG, PNG
A formátumokat a képpontszám, a színkezelés és a tömörítés jellemzi.
Grafikus kártya Monitor viszonya !?
7
2.4. Videoállományok: (videó, mozgókép)
Videoállományokat elhelyezhetünk szöveges állomány kiegészítésére, pl.
bemutató készítésénél figyelemfelkeltés.
A videót szinkronban működő hang és mozgókép jellemzi.
Videoállományok jellemzői:
Képméret (szélesség * magasság)
Képkocka / másodperc
Színkezelés
Tömörítés
Hangcsatornák száma
Videokártya:
D A átalakítás (CRT)
D (TFT)
Digitalizálás:
A D átalakítás
8
3. Multimédia alkalmazások jellemzői:
3.1. Idődimenzió:
A szolgáltatott információ időbeli jellege szerint megkülönböztetünk:
Időfüggetlen médiumokat (szöveg, állókép) időben állandó érték.
Időfüggő médiumokat (hang, videó) időben változó érték.
3.2. Adatfolyam:
Adatok, csomagok sorozata.
Így a pillanatnyi (időponthoz kötött adatérték) változik (pl.: hang, videó, animáció,
fényreklám, stb.).
Van-e az adatfolyam átvitelének időbeli megkötése?
Nincs aszinkron átvitel:
Az adatcsomagok a vevőhöz időbeli megkötés nélkül jutnak el.
Van szinkron átvitel:
A csomagok a végpontok közötti maximális késleltetés mellett jutnak el a
vevőhöz.
3.3. Valós idejű működés:
Minden multimédia rendszer valósidejű, ha a folyamatos adatfolyamok valós
időben történő feldolgozása lényeges szempont.
A valós idejű rendszernek minden eseményt fogadni kell, időben fel kell dolgozni és
időben vissza kell küldeni az adatokat.
Kritikus időtartamok: T(eseményre reagálás) + T(feldolgozás) + T(válasz)
A feldolgozás eredményének egy szigorúan szabályozott időtartamon belül (kritikus
idő) az igénylő rendelkezésére kell állnia.
Pl. Hangállományoknál a természetes beszéd dinamikájának (időben változó érték)
megfelelően kell a hang adatfolyamot szolgáltatni a hangkártyának a hangszóróhoz.
Fontos:
Az átvitel és a feldolgozás sebessége.
Megfelelő feldolgozási kapacitás.
Tömörítés alkalmazása (kódolás dekódolás)
9
4. Egy multimédia számítógép hardvere Egy multimédia rendszerben legyen nagy számítási teljesítmény, legyen a
busznak nagy átviteli sebessége és tartalmazza a multimédia-alkalmazások
használatához szükséges perifériákat.
Ma általában egy hagyományos munkaállomás nagyfelbontású színes
képernyővel, 3D grafikus kártyával, hangszóróval és mikrofonnal, CD-ROM-mal,
audió- kártyával. (+ digitalizálókkal, stb.)
4.1. CPU jellemzői:
Típusok
Sebesség [MHz, GHz]
Címsín [32 – 64 bit]
Adatsín [32 – 128 bit]
Memória – processzor sebesség
Kevesebb célhardver, nagyobb processzor teljesítményt igényel!
4.2. Operatív memória jellemzői:
Típusok (RAM EDO, SDRAM DDR-SDRAM, DDR II, RAMBUS, stb.)
Sebesség [MHz] 100, 133, 266, 333, 400, 533, 600, stb.
Méret [MB, GB] 512 - …
4.3. Belső sínrendszer:
Nagymennyiségű adat gyors továbbítását kell lehetővé tenni a számítógép egyik
részegységétől, perifériától a másik részegységig, perifériáig.
A számítógép az adatokat a belső sínrendszerén továbbítja, amely
párhuzamosan futó vezetékek együttese.
Részei:
Adatsín
Címsín
Vezérlő sín
A belső sínen az adatátviteli sebességet meghatározza:
A sín sebessége [Hz, bit / secundum]
A sín szélessége: egyszerre mennyi adatot tud továbbítani.
10
4.4. Sínrendszerek:
PCI:
o 32 bit széles címsín
o 32 bit adatsín
o átviteli sebesség 33 MHz
AGP (Accelerated Graphics Port – Gyorsított Grafikus Port):
Az AGP nagysebességű interfész a központi memória és a
videoprocesszor között. Mivel csak két eszközt kapcsol össze, igazából
nem tekinthető busznak.
A processzor és a grafikus kártya közötti adatátviteli sebesség növelése
miatt hozták létre.
Részei:
Videoprocesszor (sebesség)
Videomemória (méret, sebesség)
Az AGP elválasztja a grafikus kártyát a többi perifériától
Szorzó sebesség sávszélesség szélesség
2* 66 MHz 254,3 MB/s 32 bit
4* 133 MHz
8* 266 MHz
USB 1-2:
o A perifériák felfűzhetők
o Plug and play
o USB 1.1: 1,5 MB/s; 12 MB/s
o USB 2: 480 MB/s
FireWire 1-2:
o Főleg videorekorderek csatlakoztatása.
o 1-es: 400 MB/s
o 2-es: 800 MB/s
11
4.5. Monitor
Grafikus kártya Monitor.
A megjelenített kép minősége függ a monitortól.
A monitor lelke a katódsugárcső, amelyben elektronágyúk találhatók. A
monokróm monitorban egy, a színesben három. Minden elektronágyú
elektronsugarat bocsát ki, mellyel bombázza a monitor belső falát borító foszfor
réteget. Az így gerjesztett foszfor fényt bocsát ki. Három különböző foszforanyagot
használnak. Egyet-egyet a piros – zöld – kék szín számára. Minél nagyobb az
elektronsugárba csapódó elektronsugár intenzitása, annál erősebben villan fel a
foszfor és annál erősebb fényt bocsát ki.
Az egységnyi elrendezésben lévő három különböző típusú foszfor által kibocsátott
színek keveréke adja az adott területen megjelenő színt. Azonos erősségű R, G, B
fényerőnél, különböző intenzitásnál szürkeárnyalatos színeket kapunk. Különböző
színeket az R, G, B elektronágyúk különböző intenzitásainál kapunk.
Az elektronsugár képpontonként (3 szubpixel) halad, balról jobbra és fentről
lefele. Egy eltérítő-egység változtatja az elektronsugarak hajlásszögét. A bal felső
sarokból a jobb alsó sarokig haladva kirajzol egy képet.
Interlaced (váltósoros) letapogatás
Non interlaced (sorfolytonos) letapogatás
Miután a pásztázó elektronsugár elhagyta a foszforpontot, a foszfor rövid ideig még
világít, ez az utánvilágítás.
Miért zavaró ez a játékoknál?
A teljes képet kirajzolása után, az elektronika újra kezdi a rajzolást a képfrissítési
frekvenciának megfelelően.
Képfrissítési frekvencia: [kép / sec]
A pixel (picture element – képpont) a képernyő legkisebb megvilágítható része.
Színes technikában egy pixel 3 alpixelből áll az R, G, B színeknek megfelelően.
A képernyő felbontását a képpont mérete és a képernyő nagysága határozza
meg. Minél kisebb a képpont, annál több fér el egy adott nagyságú képernyőn, és
annál finomabb felbontású képet kapunk.
CRT: 0,31; 0,28; 0,21
12
4.6. Grafikus kártya:
A számítógépből érkező digitális jeleket a grafikus kártya fogadja. A kártya az
átvett analóg jelekből a digitál – analóg átalakító (DAC – Digital Analóg
Converter) segítségével analóg jeleket alakít ki.
A színes grafikus kártya három DAC-ot tartalmaz (R, G, B). A digitális – analóg
áramkörök az egyes színekhez tartozó digitális jelekből a színnek megfelelő analóg
jeleket állít elő, és ezek vezérlik a monitorok elektronsugarainak intenzitását.
A grafikus kártyák alapvető jellemzői:
Felbontás
Megjeleníthető színek száma
Felbontás:
A képernyőn függőleges és vízszintes irányban megjeleníthető képpontok számát
határozza meg. Adott képpont-méretnél, minél több a képpontok száma, annál
nagyobb a kép.
Felbontás pixelek száma
640*480 307200
800*600 480000
1024*768 786432
1280*1024 1310720
1600*1200 1920000 1.9 Mpixel
Színmélység:
A képpontokhoz tartozó színinformáció mennyisége határozza meg a képen
megjeleníthető színek számát. A színek száma a színmélység, ami nagyban függ a
grafikus kártyától.
A grafikus kártya a videomemóriájában tárolja a képpontok színinformációit. Minél
nagyobb a videomemória, annál több színinformációt lehet tárolni.
Egy képpont színinformációja 1,2,4,8,16,24,32 hosszú lehet. A videomemória mérete
korlátozhatja a választott felbontáshoz tartozó színmélységet.
1600*1200, 24 bit 6 MB memória szükséges.
Grafikus kártya szabványok:
A szabványban meghatározzák a monitor felbontását és színmélységét. Pl.: EGA,
VGA, SVGA, XGA, SXGA, WXGA, stb.
13
4.7. Lapolvasók:
A lapolvasó papír- vagy diahordozón található szöveget vagy ábrát bittérképes,
digitális formában olvas be a számítógép memóriájába.
Digitalizáláskor a lapolvasó a hordozón található információt, sűrű beosztású
rácsozattal kis területekre, képelemekre bontja. Majd a képelemekhez hozzárendel
egy, a képelem színétől és a lapolvasó színmélységétől függő értéket. Ez az érték a
lapolvasó működésétől függően 1-24 bit lehet.
A lapolvasók nem különböztetik meg a szöveget és az ábrát, mindkét fajta
információt bittérképes formában olvassák be. A beolvasott szöveget nem lehet
szövegszerkesztővel közvetlenül szerkeszteni, azt előbb egy optikai karakter
felismerő programmal karakteres formára kell alakítani.
A lapolvasók legfontosabb műszaki paraméterei:
Felbontás: A felbontás megadja, hogy a lapolvasó egységnyi hosszon
hány képelemet különböztet meg. Általában [dot/inch, dpi] mértékben
adják meg, ami az egy inch hosszon (2,54 cm) megkülönböztetett
képelemek száma.
Értékei: 72 – 2400 dpi
Színmélység: Egy képelem színkódját meghatározó bitek száma. Fekete-
fehér lapolvasók két színt különböztetnek meg, 1 bit. Színes
lapolvasóknál ez az érték 24 bit is lehet.
Működés:
Kézi
Asztali
4.8. Hangkártya, hangszóró, mikrofon:
Hangkártya:
A multimédia számítógép hangkártyájának két fő rendeltetése van.
Az első a külső akusztikus analóg jelek digitalizálása, hogy azok
hangállományként a számítógép memóriájában vagy a lemezén
tárolhatók legyenek.
A második a hangállományoknak hangszórón, fejhallgatón vagy MIDI
készüléken való lejátszásának biztosítása.
14
A hardver két részre osztható:
Az egyik feladata a hangok vétele, digitalizálása, lejátszása.
A másik rész zene előállítására szolgál.
Az első a hangkártya hangosító hardvere, a másik a szintetizátor része.
A hangosító hardvert egy analóg-digitális és egy digitális-analóg átalakító körül
alakítják ki.
A hangrögzítés legfontosabb adata a mintavételi frekvencia (pl. 44,1 KHz) A
mintavételi frekvencia megadja, hogy hangfelvétel készítésekor milyen gyakorisággal
vesznek az analóg hangjelből mintákat. Minél nagyobb a mintavételi frekvencia,
annál élethűbben lehet az hangot rögzíteni. Viszont ekkor arányosan növekszik a
digitalizált hangot tartalmazó hangállomány mérete is.
Másik fontos adat a hangminták amplitúdó értékeinek tárolásához használt bitek
száma, a kvantálási hossz. Minél több biten (nagyobb felosztású skálán) tároljuk az
amplitúdó értékeit, annál pontosabban követi a digitális hangállomány az analóg
hang alakját. A 16 bites kvantálási hossz CD minőséget eredményez.
A szintetizátor hardverrel jó minőségű hangot lehet előállítani.
A hangkártyák több bemenettel illetve kimenettel rendelkeznek:
Mikrofon bemenet
CD-ROM audio bemenet
Hangszóró kimenet
MIDI csatlakozó
Hangszórók:
A hangkártya a hangokat a hangszórón keresztül szólaltatja meg. Hangkártyán
van egy kis teljesítményű erősítő, mely fejhallgató megszólaltatására alkalmas. Ha
nagyobb teljesítmény szükséges, akkor aktív hangszórókat csatlakoztatnak.
Erősítővel ellátott hangszórók.
Mikrofon:
A hangkártyához csatlakoztatott mikrofonnal lehet beszédet, zenét vagy
hangeffektusokat a multimédia rendszerbe beolvasni.
15
4.9. Videokártyák:
Feladata a nagy bitsebességű videoállományok digitalizálása és megjelenítése a
monitoron. TV technika képmegjelenítési rendszerének és a monitorok
képmegjelenítési rendszerének összekapcsolását kell megoldani. A bemeneti oldal
analóg (TV, kamera) a kimeneti oldal digitalizált jelsorozat.
A videodigitalizáló mintavételi frekvenciája több mint 10 MHz és bitszáma 16-24 bit.
Képernyőképenként mintegy 30 MB adatot állít elő (10MHz * 3 MB ~ 30 MB), a
videoállomány hossza a másodpercenkénti képváltástól függően (25 Pal, 30 NTSC)
750 MB, 900 MB lehet.
Ezt az adatmennyiséget csak tömörítés után lehet megjeleníteni a számítógépen.
4.10. CD technika:
CD-ROM:
Az információ a lemezen spirálvonalban, az úgynevezett információs sávon
szekvenciálisan szektorokba szervezve kerül rögzítésre és a spirálvonalon belülről
kifelé haladva helyezkedik el. Az információkat a spirálvonalban lévő lyukak (pit-ek)
síkok (land-ek) átmenetei tartalmazzák.
A CD lemez keresztmetszeti képe:
CD meghajtó:
Feladata a lemez írása olvasása.
Ehhez:
Az író olvasó fejet stabilan a sáv felett kell tartani.
A lemez egyenetlenségeit korrigálni kell.
Megvalósítás: három sugárnyalábos technikával.
16
A CD technika optikai és elektronikus hibajavítást használ az olvasási hibák
elhárítására. A letapogatott információ azért javítható, mert a kódolásnál az
információt bőven ellátták hibajavító kóddal. Ez viszont redundanciát okoz. Minden
CD-nél a hibakezelést és javítást a CIRC (Cross Interleaved Reed-Solomon Code)
eljárás valósítja meg. A CD-ROM meghajtó 3500 bitre kiterjedő csoportos hibát (2,5
mm hosszú karcolás) képes kijavítani.
Adatátviteli sebesség:
Az információ letapogatása állandó átviteli sebességgel történik (CLV – Constant
Linear Velocity).
1 * audio CD: 150 Kbit/s
A lemezek külső részein a spirálvonal hosszabb, tehát ott több információ
található, mint a belső részeken. Ezért folyamatosan csökkenteni kell a lemez
fordulatszámát, ahogy az olvasófej az információ letapogatása közben kifelé halad. A
lemezt egy szervómotor forgatja, melynek fordulatszámát egy vezérlő elektronika
szabályozza. A nagysebességű meghajtók állandó fordulatszámmal is képesek
működni CAV (Constant Angular Velocity). Így változik az átviteli sebesség.
24 *-es 5400 ford/perc
A puffer és az adatátvitel módja:
2-8 MB
A nagyobb puffer kedvező, ha az adatátvitel a DMA-n keresztül valósul meg. A DMA
tehermentesíti a CPU-t.
CD-DA (audio CD)
120 mm 76-79 perc hosszú 44,1 KHz mintavételezési frekvenciával és 16 bit
kvantálási hosszal felvett hangállományt képes tárolni. Lejátszáshoz 172,3 KB/s
értékű állandó kerületi sebesség (CLV) szükséges.
Hibakezelés
CD-DA (digital audio) hibakezelése
1 szektorban 1/75 sec alatti adatátvitel 3234 információ byte 8*3234 = 25852
byte.
17
Ezt 17*3234 = 54978 csatornabit rögzíti a lemezen. Tehát szektoronként 8*2352 =
18816 bit hangadatot 54978 csatornabit tárol 34% felhasználói adat.
CD-ROM Mode 1
1 szektorban 3236 byte (54978 csatornabit rögzít), ebből 2048 byte (8*2048 =
16384 bit) hasznos. A lemez 30%-a hasznos adat.
CD-ROM Mode 2
Tömörített audio, video, kép. 1 szektorban 3234 byte, ebből 2336 byte hasznos.
Kisebb biztonság.
4.11. DVD- technika:
DVD lemezek:
A DVD egy 2*0,6 mm vastag összeragasztott polikarbonát lemez. Mindkét
hordozó tárolhat mindkét oldalán információt.
DVD 5 egy oldal egy réteg 4,7 GB
DVD 9 egy két 8,5 GB
DVD 10 két egy 9,4 GB
DVD 17 két két 17,0 GB
A CD lemezeknél az információt a lemezek felső részén tárolják, míg a DVD
lemezeken az információs réteg a lemez közepén található, mert biztosítani kell a
kétoldalas tárolási lehetőséget.
Az egyszeres sebességű DVD meghajtó 1250 Kbit/sec átviteli sebességet ad.
18
5. Szöveges alkalmazások A megjelenítendő szöveg formájának megalkotása során felmerülő kérdések:
Mekkora szövegmennyiség fér egy képernyőoldalra anélkül, hogy
zsúfolttá, nehezen olvashatóvá válna a képernyő?
Hogyan célszerű a megjelenítendő információkat csoportosítani?
Hogyan kell a szöveget kialakítani, hogy az a képernyőn szépen nézzen
ki és a szöveg egyhangúságából, kiemelkedjenek azok az információk,
amelyeket ki szeretnénk emelni?
5.1. A szöveg elkészítésének menete:
A szöveg megfogalmazása és beírása a számítógépbe valamilyen
szövegszerkesztő segítségével.
A szöveg formázása, ami a szövegnek képernyő oldalakra bontásával
kezdődik, majd kiemelések elvégzése.
Az elkészült szöveg beépítése a multimédia alkalmazás megfelelő
helyére.
5.2. Szövegbevitel lapolvasóval:
Nyomtatott szöveg [digitalizálás] bittérkép, képfájl [OCR karakterfelismerés]
szerkeszthető szövegfájl.
A formázás többé-kevésbé megegyezik az eredetivel.
A beolvasott fájl mérete:
A lapolvasó felbontása és a színkezelés mértéke határozza meg a beolvasott
adat mennyiségét.
A lapolvasó vízszintes irányban minden sorban a felbontás által meghatározott
számú képelemet olvas be, míg függőleges irányban az egységnyi hosszon
beolvasott sorok száma megfelel a felbontás által meghatározott értéknek.
A4-es (210 mm * 297 mm) papírlap beolvasásánál a képelemek száma: 210*297*
(lappolvasó felbontása * lapolvasó felbontása) /25,4*25,4
300 dpi-nél 8700632 képelem
1 bites színmélységnél 8700632:8 = 1087579 byte
19
5.3. Az OCR programok működése:
Az OCR programok a memóriában található képelemeket vizsgálva próbálják
eldönteni, hogy egy-egy képelem milyen karakternek felel meg. Ez a művelet a
felismerés.
A két leggyakrabban használt felismerési eljárás:
Összehasonlítás: Az OCR program a képelemet a karaktereknek a
háttértárban tárolt mintaábrájával hasonlítja össze, hogy felismerje azt a
mintaábrát, ami leginkább hasonlít a képelemhez. A mintaábra
karakterkódja a felismert karakternek a kódja. A módszer hátránya a
betűtípus és betűméret függőség, ami jelentősen befolyásolja a
felismerés pontosságát.
Körvonalelemzés: Az OCR program a képelemek körvonalelemei
méretének, illetve arányainak elemzésével határozza meg a
képelemekhez rendelhető karakterek kódját. Ez a módszer a betűtípustól
és a betűmérettől független felismerést biztosít.
5.4. Szöveg a képernyőn:
Esztétikus és ergonómikus elrendezés!
1. Betűtípusok, betűméret:
Legyen a szöveg elég nagy méretű.
Ne legyen kettőnél több betűtípus egy képernyőoldalon.
Ne legyen túl sok szöveg egy képernyőoldalon.
2. Szövegstílusok: Javítani lehet a kinézetet.
Ritkán szabad csupa nagybetűből álló szöveget készíteni.
A képernyőn félkövér betűkkel emeljünk ki, ezek feltűnőek és jól
olvashatóak.
Az árnyékolt szöveg, változatos jól olvasható.
A keretezés javítja a szöveg olvashatóságát.
Használhatunk karakterek közötti változó távolságot.
3. Háttér:
Igazodjon a tartalomhoz és a stílushoz.
Ne rontsa az olvashatóságot.
20
4. Színek:
Kontrasztdús színkombinációkat célszerű használni az előtérben illetve
a háttérben lévő elemeknél.
Ne legyen túl sok szín egy képernyőoldalon.
Ne csak színekkel különböztessünk meg képelemeket.
A színek hangulatot, benyomást közvetítenek.
Kerüljük a telített színeket, vakítanak!
Figyelembe kell venni a színvakokat, színtévesztőket.
5.5. Objektumok csatolása és beágyazása:
Objektumként be lehet ágyazni egy dokumentumba egy másik program által
készített eredményt. Ezt az OLE (Object Linking and Embeding) technika teszi
lehetővé.
Forrásdokumentum: ahonnan a beágyazandó objektum származik
Céldokumentum: ahová az objektum beszúrásra kerül.
Win95 óta a céldokumentumban lehet az OLE objektumot szerkeszteni. Ha
kétszer kattintunk a beszúrt objektumon, akkor a céldokumentumon belül aktiválódik
az OLE-szerver, vagyis az a program, amellyel az objektum készült. Ekkor az
objektum elkészítésekor használt jelhasználói felületen keresztül szerkeszthetjük.
Objektumcsatolás:
Olyan eljárás, melyben az objektum a forrásdokumentumban marad. A
céldokumentumba egy, a forrásdokumentumra vonatkozó referencia
kerül beszúrásra. Így nem nő a fájlméret a csatolt objektummal, de a
hordozhatóság korlátozott lesz. A céldokumentum nem helyezhető át
másik számítógépbe. Az objektum csak a forrásdokumentumban
módosítható, megjelenése a forrás- és a céldokumentumban azonos.
Objektum beágyazás:
Egy céldokumentumot, melybe beágyaztak egy objektumot,
problémamentesen lehet egy másik számítógépre áthelyezni, mert a
céldokumentum tartalmazza a teljes objektumot. Így nő a céldokumentum
mérete. Az objektum a forrásdokumentumban és a céldokumentumban
egymástól függetlenül módosítható.
21
6. Világháló (Internet, WWW): Az Internet vagy rövidebb nevén Web az a médium, ami lehetővé teszi az
információnak az egész világon való terjesztését.
Internet őse USA – ARPANET csomagkapcsolt.
Katonai intézmény egyetemek, kutatóközpontok, könyvtárak.
Internet CERN 1989 – kutatásokat segítő globális információs rendszer.
Az Internet helyi hálózatok összessége. A helyi hálózatok eltérő felépítése,
operációs rendszere és egyéb sajátosságai miatt ki kellett dolgozni a kommunikáció
szabványait, amit az RFC (Request For Comments) dokumentumok tartalmaznak
és a különböző hálózati protokollok valósítanak meg. Az adatforgalmat a helyi
hálózatokban lévő átjárók (gateway’s) bonyolítják le. A gateway az adatforgalmat a
Web felé TCP/IP protokoll szerint valósítja meg.
Mivel az Internet központi számítógép nélkül működő, önszervező rendszer, nincs
lehetőség arra, hogy a rajta folyó tevékenységet lehetetlenné tegyék, korlátozzák
vagy cenzúrázzák.
Az Internet a kliens-szerver modell alapján működik. Egyik eleme a Web-szerver,
egy számítógép, ami háttértárjában információkat: szöveget, adatokat, képeket,
hangokat stb. tárol. A Web-szerver funkciót egy program valósítja meg, ami azon a
számítógépen fut, ahonnan információkat kell a kliens számára továbbítani.
Az Internet kliens egy olyan számítógépes program, ami kapcsolatot tart a Web-
szerverrel. Egyik funkciója alapján böngészőnek is nevezik.
A Web alkalmazások HTTP (Hypertext Transmission Protokol) alapján
kommunikálnak egymással. Ezért minden Web-szervernek és kliensnek ismernie kell
ezt a protokollt.
6.1. Internet szolgáltatások:
Az Internetnek mint csomagkapcsolt hálózatnak a szolgáltatásait a Web-
szerverek különböző protokollokkal valósítják meg. A leglényegesebb protokollok: e-
mail, www, ftp, gopher, telnet.
22
6.2. HTML:
Az Internet szabványos nyelve a HTML (Hypertext Markup Language), amellyel
hypermédia dokumentumokat lehet előállítani. A HTML felhasználásával létrehozott
dokumentumok egyszerű alfanumerikus szövegfájlok, amelyekben formátumvezérlő
utasítások vannak. A HTML horgokat használ a hypermédia kapcsolatok leírására. A
horgok használatával nyílik lehetőség arra, hogy egy hypermédia dokumentumban
egy másik hypermédia dokumentumra hivatkozzunk, és elérjük azt.
6.3. Hypertext:
Egy dokumentumot olvashatunk az elejétől a végéig is, de olvashatjuk
részleteiben is. A dokumentációk gyakran viszonylag független egységekből állnak,
melyekben sok kereszthivatkozás van. A kereszthivatkozásnál a hivatkozott helyet a
dokumentumban meg kell keresni. Ilyen esetekben az információknak elektronikus
úton történő összekapcsolása nagyon hasznos lehet. A kereszthivatkozások gyors
elérésének biztosítására a dokumentumokba olyan lehetőségeket építenek be,
melyekkel az alkalmazó elérheti a hivatkozott szövegrészt. Ezek a lehetőségek
biztosítják, hogy az alkalmazó az általa kívánt sorrendben olvassa végig a
dokumentumot.
A hypertext dokumentum lényegében egy olyan szöveg, melyben
kereszthivatkozások lehetnek. A hivatkozások kiindulópontjai csomópontok,
melyekhez más információegységek vannak csatolva. Az egyetlen különbség egy
normál és egy hypertext szöveg között az, hogy az utóbbi szöveg olvasója a
képernyőn rámutathat egy csomópontként viselkedő információegységre, és ennek
hatására a képernyőn megjelenik egy, a csomóponthoz tartozó „önálló tartalmú”
információegység. A hypertext dokumentumban ezek a szövegrészek a készítő által
meghatározott korláton belül, bármilyen sorrendben elérhetők.
6.4. Hypermédia
A hypermédia dokumentum általánosított hypertext dokumentum, ami a szöveg
mellett tartalmazhat képeket, audió és videó klippeket, animációkat.
A hypermédia dokumentum struktúrája egy gráf, mely csomópontokból és élekből
áll:
A csomópontok a tulajdonképpeni információegységek.
Lehetnek: szöveg, kép, hang, videó, stb.
23
Az élek létesítenek kapcsolatot a különféle információegységek között.
Ezeket linkeknek vagy hivatkozásoknak szokás nevezni. A link
legtöbbször egy irányított él.
A hivatkozások kiindulópontja a horog (URL: Uniform Resource Locator). A horoggal
lehet egy hypermédia dokumentumban egy másik hypermédia dokumentumra
hivatkozni, illetve elérni azt.
6.5. Kép, hang és videoállományok az Interneten
Az Interneten az átviteli sebesség figyelembe vétele mellett kell az állományok
méretét meghatározni.
1 perc CD minőségű sztereó hang: 10584000 byte, 64 Kbites letöltés esetén 2,75
perc.
A hang, kép és videoállományok viszonylag nagy mérete és a korlátozott letöltési
sebesség miatt, tömörítést alkalmaznak.
Tömörítés:
Veszteséges
Veszteségmentes
Képfájlok:
GIF fájl: Veszteségmentesen tömörített, maximum 8 bit színinformáció.
Elsősorban vonalas rajzoknál, kevés színt, nagy egy nagy egyszínű
foltokat tartalmazó képeknél célszerű alkalmazni.
JPG fájl: Veszteséges tömörítés, maximum 24 bit színinformáció. Jó
minőségű színes képeknél alkalmazzák.
Videoállományok:
Nagy méretűek. Az állományok méretét alapvetően befolyásolja a használt
képméret, képváltási frekvencia. Az Interneten általában MPEG4 eljárással tömörített
videoállományokat használnak.
24
7. Digitális hangtechnika A hang a multimédia alkalmazások elválaszthatatlan integrált részét alkotja.
7.1. A hang fizikai jellemzői:
A hang mechanikai rezgés, ami valamilyen anyagi közegben terjed. A mindennapi
életben hallott hang a levegő molekuláinak a hangforrástól kiinduló, egyre
csillapodva terjedő mechanikai rezgése. A hang nemcsak levegőben, hanem egyéb
rezgésre hajlamos rugalmas közegben is létrejöhet. A hangforrás közelében a
rezgést továbbító levegő részecskéinek elmozdulása miatt nyomásingadozás
keletkezik, ami átterjed a szomszédos részecskékre és így a levegőben tovaterjedő
hanghullámok jönnek létre.
A hang terjedési sebessége normál páratartalmú 15°C-os levegőben 340 m/s,
szilárd anyagokban és folyadékokban ennél is nagyobb.
7.2. A hang érzékelése:
A hang érzékelése, vagyis a hallás, az embert körülvevő közegben (levegőben)
fellépő nyomásingadozások érzékelése. Az emberi hallószerv által érzékelhető
hangok frekvenciája általában 16 Hz és 20 KHz közé esik. A kisebb rezgésszámú
hangokat mélyebb, a nagyobb rezgésszámú hangokat pedig magasabb hangként
érzékeli. Az érzékelt hangmagasság a hang frekvenciájától függ, bár kis mértékben
befolyásolja a hangerősség is.
16 Hz alatti hang infrahang
20 KHz feletti hang ultrahang
Az emberekben ezek nem keltenek hangérzetet.
7.3. Akusztikai alapfogalmak:
Az emberi hallás jellemzőivel foglalkozik. Érzeti tulajdonságot fejez ki, hogy
„hangosan beszélsz” (hangerő), „mély a hangod” (hangmagasság), vagy „fakó a
hangod” (hangszín).
Hangerő (hangintenzitás) a hangrezgés amplitúdója. Egyenesen
arányos a hangnyomással, fordítva arányos a közvetítő közeg
sűrűségével és az adott közegben a hang terjedési sebességével.
Mértékegysége az egy négyzetméterre eső wattban mért
hangteljesítmény.
A hangerő és a hangnyomás leírására használják az akusztikus decibel
25
(db) fogalmat. Az akusztikus decibel értéke alkalmazkodik az emberi
hangérzékeléshez. A hangerő nagyság tízes alapú logaritmusának
húszszorosával egyenes arányban növekszik. A hallásküszöb 0 db a
fájdalomküszöb 120 db.
Hangmagasság a hang frekvenciájától függ. Ha a hangforrás csak
egyetlen frekvenciájú hangot sugároz, akkor ezt a hangot tiszta hangnak
nevezzük. Magányos szinusz rezgések a természetben nincsenek, a
valóságban előforduló természetes hang fizikai szempontból több,
különböző frekvenciájú és amplitúdójú szinusz rezgések összessége. A
magányos szinusz rezgéseket részhangnak hívják. A folytonosan változó
természetes hang különböző frekvenciákon rezgő részhangokból áll. Egy
természetes hang részhangjainak összessége a hang frekvencia
spektruma.
A mélyebb részhang határozza meg a természetes hang
alapfrekvenciáját. A további részhangok frekvenciái általában az
alaphang frekvenciájával kapcsolatban álnak, legtöbbször annak
egészszámú többszörösei.
A természetes hangok további összetevői a felhangok. Ezeknek
összetétele, amplitúdója és fázisa határozza meg a természetes hang
hangszínét.
Ha a felhang frekvenciája az alaphang frekvenciájának valamilyen egész
számú többszöröse, akkor felharmonikusnak is szokták hívni.
Az alaphang és a felhangok eredője határozza meg a természetes
hangjel frekvenciatartományi viselkedését, amit az eredő hangjel
burkológörgéje szemléltet. Tehát a hangszín az adott hangjel
frekvenciatartományi viselkedése: sávszélessége, burkoló görbéje, a
különböző frekvenciájú hangok amplitúdó és fázis viszonyai.
7.4. A hang rögzítése:
Nem más, mint a levegőben keletkező nyomásingadozások tárolása az újbóli
előállítás céljából. A nyomásingadozásoknak, vagyis a hangjeleknek valamilyen
információhordozóra történő rögzítése.
26
Rögzítés:
A hangjel átalakítása rögzíthető elektromos jelformára, melyben a jel
frekvenciái és intenzitásai megfelelnek az eredeti hangjelnek.
Az elektromos jel rögzítése.
Lejátszás:
A rögzített jelek érzékelése, elektromos jellé alakítása.
Az elektromos jel felerősítése és visszaadása az eredeti hangjelhez
hasonló alakban.
A rögzítés történhet:
Analóg
Digitális formában.
7.5. A hangok digitális rögzítése és lejátszása:
Eredeti formájukban a hangok analóg, időben és értékben folytonos jelek. A
hangok digitális rögzítésekor az eredeti analóg hangjelekből mintákat vesznek, emiatt
a mintavételezett hangjel időben és értékben nem folytonos, hanem egymástól
elkülönülő impulzusok sokaságából áll. A mintavételezett impulzusok amplitúdó
értékét bináris formában megadva, megkapjuk az analóg hanganyag digitális
megfelelőjét, ami elkülönülő (diszkrét) minták sorozatából áll.
Mintavételezés:
Mintavételezéskor időben és értékben folytonos analóg hangjelekből
impulzussorozatot állítunk elő. Ebben az impulzussorozatban minden
egyes impulzus amplitúdója azonos az analóg jelnek az adott ponton
felvett értékeivel.
Shanon tétele: A mintavételezett jelből akkor lehet az eredeti jelet
információveszteség nélkül visszaállítani, ha a mintavételezési frekvencia
értéke legalább kétszerese az eredeti analóg jelben előforduló
legnagyobb frekvenciának. A gyakorlatban ezt nem használják.
telefontechnika 8 KHz
MPEG audio 32
CD-DA 44,1
DAT, Dolby Digital 48
27
Kvantálás:
A mintavételezett impulzussorozat impulzusai végtelen sok értéket
vehetnek fel, ezért ez a jelsorozat analóg impulzussorozatnak tekinthető.
Az amplitúdók digitális jellé történő átalakítását, az analóg-digitális
átalakító (A/D konverter) végzi. Az A/D konverter bemenetére vezetet
impulzusok bináris adatokká átalakítva jelennek meg a konverter
kimenetén.
Az A/D konverter meghatározott számú bitet használ a kimenő jel
amplitúdójának megadására. Az analóg bemenőjel amplitúdó értékének
digitális ábrázolásához létrejövő szóhossz a szóban található bitek
számától függ.
Ezt a bitszámot nevezzük kvantálási hossznak. Minél finomabb
felbontású a kvantálás (minél több lépcsője van), tehát minél hosszabbak
(minél több bitből állnak) a kódszavak, annál pontosabb képét adja az
eredeti analóg jel amplitúdójának.
Általában 8 illetve 16 bites kvantálási hosszat alkalmaznak.
8 bittel 256 féle adatszó 48 db átfogható hangerő tartomány
16 bittel 65536 adatszó 96 db
7.6. Minőség
Digitalizált hangállomány minőségén azt értjük, hogy milyen hibával lehet a
mintavételezett és kvantált jelsorozatból visszaállítani az eredeti analóg hangot.
7.7. Digitalizált hangállomány mérete:
A méretet a következő három paraméter befolyásolja:
Mintavételezési frekvencia értéke.
A kvantálási hossz.
A rögzített hangcsatornák száma.
A mintavételezési frekvencia értéke és a kvantálási hossz meghatározza az
analóg hanganyagról a digitalizált hangállományba rögzített információ mennyiségét.
Minél több információt rögzítünk, annál pontosabban írja le a digitalizált
hangállomány az eredeti hangállományt, azonban annál nagyobb lesz az állomány
mérete. A rögzített csatornák száma határozza meg, hogy milyen felvétel készül.
Méret: mintavételezési frekvencia [Hz] * kvantálási hossz [bit] * csatornaszám * idő
[sec] :8 = [byte]
28
Pl.: 44,1 KHz – 16 bit – sztereó – 1 sec hangállomány hossza: 44100*16*2*1:8 =
176400 byte
7.8. Hangfelvétel készítése:
Hangfelvétel készíthető a hangkártya mikrofon bemenetére csatlakoztatott
mikrofonról, a line in bemenetére csatlakoztatott erősítőről, esetleg a számítógép CD-
ROM meghajtóról.
Mikrofon típusai:
Irányított
Gömbkarakterisztikájú
7.9. Hangállomány tömörítése:
Digitális hangállományokat digitalizálással állítunk elő analóg hanganyagokból.
Egy digitális hangállomány hossza a mintavételi frekvenciától, a kvantálási hossztól
és a csatornaszámtól függ. A CD lemezeken használt 44,1 KHz, 16 bites
hangállomány hossza csatornánként és percenként 5,048 Mbyte. Ezt nehéz
gazdaságosan tárolni és továbbítani. Tömörítés szükséges.
A digitális hangállományok méretét az ISO egyik albizottsága az MPEG (Motion
Picture Expert Group) által kidolgozott új digitális kódolási eljárással lehet
csökkenteni.
MPEG audio:
Veszteséges tömörítési eljárás, ami kihasználja az emberi fülnek az érzékelési
tulajdonságait. Még 1:12 tömörítési arány mellett is CD hangminőséget biztosít.
Az MPEG audio eljárás két részre osztható. A kódolás alkalmával a wav fájlban
található hangállományból tömörített bitfolyam, kódolt hangállomány készül. Ezt a
hangállományt a hangkártyák dekódolás után képesek megszólaltatni. A dekódolás
során a tömörített bitfolyamból wav fájl készül.
A kódoló algoritmus az ember hallószervének működése alapján elemzi a
hangadatokat és törli a lényegtelen és redundáns részeket.
Kódoláskor az eljárás egy pszichoakusztikus modell szerinti szűrőbank számítással
elemzi a hangadatok spektrális alkotóelemeit és meghatározza az érzékelhető
zajszintet. A kódoló nem épít be a kódolt bitfolyamba redundáns, lényegtelen, csak
zajnak tekinthető hangelemeket.
29
A tömörítési és a bitsebesség között szoros kapcsolat van. A tömörítést a
bitsebességnél nehezebben lehet mérni, ezért az MPEG audio eljárással kapcsolatos
információkban a bitsebesség szerepel.
Az MPEG audio eljárás három réteg (layer) szerinti tömörítés közötti választást
tesz lehetővé. Az egyes rétegekben különböző tömörítési arány és bitsebesség
érhető el.
Layer 1: A legegyszerűbb eljárás. 128 Kbit/s bitsebesség esetén
használható.
Layer 2: Közepes bonyolultságú eljárás. 128 Kbit/s bitsebesség körül
használható.
Layer 3: A legbonyolultabb eljárás. A legjobb hangminőséget 64 Kbit/s
bitsebességnél biztosít csatornánként. Ez az MP3 eljárás.
MPEG audio Layer 3 (MP3):
A család leghatékonyabb tagja. Megadott hangminőség esetén a legkisebb
bitsebesség érhető el vele, azaz egy adott bitsebességhez vele érhető el a legjobb
hangminőség.
7.10. Környezeti hangtér:
Cél az életszerű térbeli hanghatás elérése.
A Dolby Laboratories cég:
1970-es évek vége: Dolby Stereo, Dolby Sorround
4 csatorna, 5 hangszóró: bal, közép, jobb, és két közös hangcsatornás
környezeti (Sorround) hangszóró.
1992 Dolby Stereo Digital: (D.S.D.)
30
Dolby Digital (AC-3) 5.1: (D.D)
RS, R, C, C, LS egyenrangú csatornák, 20 Hz – 20 KHz közötti
frekvenciatartományban.
LFE opcionális (Low Frekvency Effects) alacsony frekvenciás hatások 20
Hz – 120 Hz
A D.D rendszer „lebontás” jellegzetessége lehetővé teszi, hogy D.D dekódoló
után a csatornaszámtól függően hangszóróval lehet megszólaltatni az 5.1 csatornás
D.D. bitfolyamot. A dekódoló valósidőben állítja elő a D.D., D.S.D. keverék, sztereó
vagy mono hang kimenőjelét.
31
8. Grafikus alkalmazások, animáció
8.1. Az emberi látás informatikai vonatkozásai:
Két előrenéző szem miatt térlátás.
Az ember nem képes egymással 2 szögpercnél kisebb szöget bezáró
pontszerű fényforrásokat megkülönböztetni.
Eltérő színű fényforrások színeit már 10 szögperc alatt sem tudjuk
megkülönböztetni.
Az ember által kellemesnek tartott képek oldalarányai 4 : 3.
Folyamatos mozgás érzékeléséhez 20 – 30 képváltás elégséges
másodpercenként, de csak akkor lesz villogásmentes az élmény, ha a
képfrissítési frekvencia 50 Hz-nél nagyobb.
8.2. Színlátás:
400 nm – 700 nm közötti hullámhosszúság
400 nm körüli fények ibolya színűek
700 nm körül vörös
< 400 nm ultraibolya
> 700 nm infravörös.
Az emberi szem két fényt nemcsak akkor lát azonos színűnek, ha a fények
spektrális összetevői megegyeznek, hanem bizonyos feltételek mellett eltérő
frekvencia spektrumú színeket is.
Az azonos színűnek látott, de eltérő frekvencia spektrumú fényeket metamer
színeknek nevezzük.
Az emberi szem fogyatékossága miatt majdnem az egész színtartományt be lehet
mutatni három, egyfrekvenciás (egyszínű) fényforrások színeinek keverésével.
A mai megjelenítők (TV, monitor) a színes kép előállítására, három egyfrekvenciás
fényforrást használnak: R, G, B
8.3. Szín-koordinátarendszerek:
A képpont színét a képernyő vörös, zöld, kék színű képpontjaiból kilépő színes
fények eredő fényereje határozza meg. A kilépő fények fényerejét és ezzel a képpont
színét a képpont kódok határozzák meg.
A szín koordinátarendszer a színekre vonatkozó információkat szolgáltató
háromdimenziós koordinátarendszer.
32
RGB szín-koordinátarendszer:
Az egyes tengelyek R, G, B színűek. A vörös, a zöld és a kék alapszín
jeleit külön-külön tartalmazza. Minden más szín ezen három alapszín
additív (összeadó) keverésével állítható elő.
fehér: R+G+B = 1
fekete: R+G+B = 0
Azonos intenzitás esetén szürkeárnyalat.
YUV szín-koordinátarendszer:
Számítás: Y = 0,3 R + 0,59 G + 0,11 B
U = (B – Y)*0,493
V = (R – Y)*0,877
A PAL és SECAM TV rendszerek mellett a kép- és videoállományok
tömörítésében (jpeg, mpeg) használják.
Y a világosságkód (luminancia).
U, V a színkódok (kominancia)
8.4. A számítógépes grafika:
Illusztrálható velük szöveg, felhasználhatók az egyes szövegek magyarázataként,
de készíthető velük multimédiaalkalmazások számára animáció.
Állóképek létrehozhatók:
Rajzolóprogrammal,
Digitális fényképezőgépből beolvasással,
Lapolvasóval fényképről,
Digitalizálással, konverzióval egyéb médiumból (video).
Bármilyen módon hoztuk létre az állóképet, az a képernyőn mindig bittérképes
formában jelenik meg. A bittérképes formában megjelenő színes ábra minden egyes
képpontját 4 – 24 bit ír le, ezért nagy méretűek. A bittérképes formában megjelenített
képeket a háttértárakban vektorgrafikus, vagy bittérképes formában lehet tárolni.
Vektorgrafika:
Ha egy rajzolóprogrammal vektorgrafikus képet hozunk létre, akkor a
rajzolóprogram egy láthatatlan hálóra rajzolja ki a grafikát. Ezt a grafikát aztán
utasítások halmazaként tárolja el a rajzolóprogram egy grafikus állományba. Az
utasítások pontosan leírják az összes rajzelem (pont, vonal, kör sokszög, stb.) helyét
, irányát, méretét, színét, alakját és egyéb a megjelenítéssel kapcsolatos
33
tulajdonságait. Kirajzoláskor a program végrehajtja az állományban lévő utasításokat,
és összeállítja a bittérképes ábrát.
A vektorgrafikával készült rajz grafikus állománya nem a képet alkotó pontokat
tárolja, hanem a képben található megjelenítéséhez szükséges információkat,
melyeket a megjelenítő program értelmez és végrehajt.
Előnyei:
Mivel a rajzelemek azonosítható formában külön-külön vannak tárolva,
így egyszerűbben lehet a grafikus kép egyes részeivel műveletet végezni
(nagyítás, forgatás, eltolás, tükrözés, stb.).
Másik nagy előnye, hogy általában kisebb méretű az állomány, mint a
bittérképes grafikánál.
Hátrányként említhető, hogy minél összetettebb a kép annál tovább tart a
kirajzolása.
Felhasználása: műszaki vonalas ábrák (CAD/CAM).
Bittérképes grafika:
A kép vízszintes és függőleges irányban képpontokra van felosztva, és minden
egyes pontról tárolásra kerül a színinformáció. Megjelenítéskor a képernyő
képpontjaiban megjelennek az adott pontról tárolt színinformációk.
Színinformáció mennyiség képpontonként. Megjeleníthető színek száma.
4 bit 16
8 bit 256
16 bit 65536
24 bit 16777216
Minél több színinformációt szeretnénk egy-egy képpontról tárolni, annál nagyobb
helyet foglal a létrejövő grafikus állomány.
Előnye a jó minőségű kép!
Hátránya, hogy nehéz a torzításmentes műveletvégzés!
34
8.5. A kép jellemzői:
A kép mérete a képernyőn:
Vízszintes és függőleges kiterjedés.
Ha egy kép 320 pont széles és 240 pont magasságú, akkor 320*240 =
76800 képpontból áll:
A kép megjelenítését a képernyő felbontása is befolyásolja. 320*240-es
képet egy 640*480-as monitoron jelenítjük meg, akkor a kép a képernyő
¼-ét foglalja el.
Fordított a helyzet, ha a megjelenítendő kép több pontból áll, mint a
képernyő felbontása.
A színek száma:
A megjeleníteni kívánt kép minden egyes pontján megjeleníthető színek
száma a kép színmélysége. A színmélységet a színinformáció határozza
meg, ami 1 bittől 24 bitig terjedhet (32 bit).
Befolyásolja a képállomány méretét, színhűségét.
A képállomány mérete:
A képek mérete meghatározza az eltárolt információ mennyiségét, és a
betöltés sebességét is.
Méret = kép vízszintes felbontása képpontban * a kép függőleges
felbontása képpontban * színinformáció bitben / 8 [byte]
35
8.6. Képek digitalizálása:
Lapolvasó felhasználásával. Az analóg képből létrejön a kép digitális képe, ami
lehetővé teszi használatát a multimédia alkalmazásokban.
Mintavételezés (felbontás):
A kép mintavételezésének célja összekapcsolni az analóg kép egyes
képelemeit a digitális kép képpontjaival, hogy a kép valósághűen
megjeleníthető legyen a képernyőn. Ez azt jelenti, hogy
mintavételezéskor egy képzeletbeli rácshálót helyezünk a képre, és a
rácselemeket egy egységként kezelve állapítjuk meg az eredő
színinformációit (~ átlag). Ez az információ még analóg a teljes,
mintavételezéssel átfogható színtartományban.
Mintavételezéskor kell meghatározni a beolvasásra kerülő kép
szélességét és magasságát, majd ezt rá kell helyezni a digitális képet
megjelenítő képernyőre, melyet a képernyő felbontása jellemez.
Mintavételezést a lapolvasó felbontásának változtatásával lehet
szabályozni. A lapolvasó felbontásával lehet beállítani a digitális
képállományba kerülő képpontok számát.
A mintavételezés lényegében egy integrálás, mert a kapott érték a
képelemet alkotó részelemek színének és fényességének összegétől
függő érték (eredője).
A felbontás mértékegysége: [dpi]
A kvantálás:
A kvantálás során történik meg az egyes analóg képelemek szín- és
fényesség információinak diszkrét képpont-értékekhez való rendelése.
Ezt az információt döntően befolyásolja a használt színmélység.
Gondolatban végezzük el a mintavételezést úgy, hogy a képre egy
milliméter rácsozatot helyezünk, és a rácsozat határozza meg a képelem
méretét. A rácselemekben található képelemek színinformációinak
eredője lesz a mintavételezett analóg képjel.
A kép minősége: alacsony magas
Színmélység kicsi nagy
Méret kicsi nagy
36
8.7. A képállományok tömörítése:
Cél a digitalizáláskor keletkező képállomány méretének csökkentése.
GIF (Graphic Interchange Format):
Veszteségmentes képtömörítési eljárás.
A tömörítés alapja egy helyettesítési eljárás, melyben adatsorozatokat egy
mintatáblázat sorszámával helyettesítenek.
A képpontok színkódjai ismétlődő adatsorozatok. Ha ezeket az adatsorozatokat
beírják egy mintatáblázatba, akkor a képpontokból alkotott adatsorozat
helyettesíthető, a mintatáblázat megfelelő sorára mutató pointerrel.
Pl. a fájlban: 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
A mintatáblában: 1 2 3 4 5 6
Helyettesítés után: 1 1 1 tömörített fájl
A GIF fájlokkal elérhető maximális méretcsökkenés a képállományban előforduló
ismétlődő minták számától függ. Nagy azonos mezőket tartalmazó képek esetén 10*-
es méretcsökkenés is elérhető.
16 bit színinformáció fölött licenszdíj fizetése kötelező.
JPEG (Joint Fotographic Expert Group):
Veszteséges képtömörítési eljárás. A jpeg eljárás elhagy a képből bizonyos
adatokat. Érzékelésen alapuló tömörítési eljárás, mert az elhagyásra kerülő adatokat,
az emberi szem érzékelési tulajdonságainak figyelembe vételével választja ki.
Leghatékonyabban színes vagy szürkeárnyalatos képeket tömörít. Fekete-fehér
képek tömörítésére nem érdemes használni. Nem tömöríti hatékonyan azokat a
képeket sem, amiben sok a színváltozás.
Tömörítés:
Az eljárás először YUV szín-koordinátarendszerbe transzformálja a képfájlok
RGB szín-koordinátarendszerben magadott színinformációit, majd elválasztja
egymástól a világosság- és a színkódokat. Ezzel alkalmazkodik az emberi látás
jellemzőihez. Az emberek ugyanis a képben bekövetkező kis mértékű világosság
változásokat inkább észreveszik, mint a színekben bekövetkező nagymértékű
változásokat.
Emiatt a JPEG elsősorban a színinformáció mennyiségét csökkenti. A második
lépésben az eljárás csökkenti a színkódok bitszámát. Ez a 4:1:1 (vízszintesen és
37
függőlegesen megfelezett színinformáció), vagy 4:2:2 (csak vízszintesen megfelezett
színinformáció) beállítás.
Az eredeti képfájlban egy képpont világosság- és két színkódját elvileg azonos
számú bit alkotja.
A 4:2:2 beállításnál két képpont színkódjai közül az egyik elmarad, vagyis
a két képpont azonos színkódokkal rendelkezik. Emiatt a kép változik, de
alig észrevehetően. A legtöbb képnél ugyanis két egymás melletti
képpont színe alig különbözik egymástól.
A 4:1:1 beállításnál az eljárás két sor színkódját közösen kezeli
Harmadik lépésben, a képfájlban található képpontokat 8*8 tagból álló
makroblokkokra bontja, majd diszkrét koszinusz-transzformációval kiszámítja a
blokkokat alkotó frekvencia komponensek amplitúdóját. Majd Huffmann-kódolással
tömöríti tovább és előáll a tömörített képállomány.
M-JPEG (Motion JPEG):
Ha 16 képkocka/sec sebességgel jelenítünk meg képeket, akkor mozgóképet
kapunk. Az M-JPEG a JPEG eljárást használja. Minden egyes képet külön-külön
tömörít össze, anélkül, hogy a szomszédos képek közötti összefüggéseket vizsgálná.
A képállomány egyes képei nagy pontossággal azonnal elérhetők, ezért alkalmas
videoállomány szerkesztéshez, vágáshoz.
8.8. Animáció
Az animáció mozgás szimuláció, melyet állókép-sorozatok megjelenítésével
állítunk elő. Az animáció és a videó között alapvető különbség az, hogy az animáció
önálló képekből indul el és ezek összerakásával kelti a mozgás érzetét.
A videó folyamatos mozgásnál készített pillanatfelvételek sorozata.
Az animáció két fontos része az előtér és a háttér.
A háttér az animáció alapja, az animációban mindig a háttér előtt történik
az esemény.
Minden animáció elkészítésénél létre kell hozni a hátteret és az előtert.
38
9. Digitális videotechnika
9.1. Színes TV rendszerek:
Színes TV műsorszórásnál az adó egyetlen jelet sugároz, ez tartalmazza a színes
képjelet és a hangot. Az egyidejűleg sugárzott kép- és hangjelet a különböző
vivőfrekvencia választja szét. A színes képjel a kép összes színösszetevőjének egy-
csatornás kombinációja. A kombinált jelet az adó a világosságkódból és a két
színkódból állítja elő.
A sugárzott videojelet a TV készülékek először szétbontják kép és hangjelre,
majd a képjelet dekódolják, kialakítják belőle a világosságkódot és a színkódokat. A
fekete-fehér TV készülékek a világosságkódból állítják elő a képeket.
Különböző TV rendszerek működnek:
NTSC videojel
1949 USA
képváltás: 29,97 kép/sec = 59,94 félkép/sec
sorok száma: 525 sor / váltósoros
képarány (aspect ratio): 4:3
SECAM videojel
1957 Francia
képváltás: 25 kép/sec = 50 félkép/sec
sorok száma: 625 sor / váltósoros
képarány: 4:3
PAL videojel
1961 Német
képváltás: 25 kép/sec = 50 félkép/sec
sorok száma: 625 sor
képarány: 4:3
1996-ban az MTV is áttért a PAL rendszerre.
A különböző videojel rendszerekben készített TV készülékek képernyőinek
felbontását a képarány ismeretében lehet megbecsülni az alábbi formulából:
Vízszintes felbontás = sorok száma * képarány [képpont/sor]
Függőleges felbontás = sorok száma
39
9.2. Videojelek digitalizálása
A számítógépnek a videojeleket először hang- és képjelekre kell bontani.
A hangjel a hangkártyára kerül, amelyből mintavételezés és kvantálás
után lesz digitális hangállomány.
Az analóg képjelet is csak digitalizálás után lehet használni, amelyet egy
digitalizáló hardver végez (videokártya, digitalizálókártya).
A képjelek digitalizálása több lépésben történik, ezek: leképezés,
mintavételezés, kvantálás. A képjelek digitalizálásakor az analóg jelből
indulnak ki, melyben analóg formában rögzített képkockák vannak. A
digitalizálás eredménye a digitális képállomány, a képkockák
képpontjainak digitális adataival.
Leképezés:
Az a művelet, melynek során az analóg képjelből kétdimenziós képfüggvény jön
létre. A képfüggvény tartalmazza a képjelek képkockáit.
A leképezés során kialakuló képfüggvényből történik a mintavételezés és a
kvantálás.
Mintavételezés:
A mintavételezés az állóképek mintavételezéséhez hasonlóan történik. Ekkor jön
létre a kapcsolat az analóg képjelek képelemei és a digitális képkockák képpontjai
között.
A képsíkot kis területekre (képelemekre) bontjuk. A létrejövő digitális képkocka
minőségét alapvetően befolyásoló tényező a képelem mérete és a képelemet
reprezentáló elektromos jel értéke. Minél kisebb a képelem mérete, annál finomabb
felbontású a kép. A felbontás azonban nem tetszőleges nagyságú. A képelemek
vízszintes irányú számának meg kell egyeznie a digitális kép egyes soraiban
található pixelek számával. A képelemek függőleges száma azonos a digitális képet
alkotó sorok számával.
Tehát az analóg képet annyi képelemre kell bontani, ahány pixelből áll majd a
digitális képkocka.
A mintavételezési frekvencia: 10 MHz.
40
Kvantálás:
A kvantálásnál kerül bináris számokkal megadásra a mintavételezéssel kapott
analóg jel világosságkódja, és két színkódja. Ezek a kódok alkotják majd a képpont
értékét.
A művelet végén minden képpontnak lesz egy háromdimenziós értéke, ezekből áll
össze a digitális kép. A képpont értékek ábrázolása meghatározott számú biten
történik. A bitszámot az A/D átalakító bitszáma adja meg. Szokásosan 3*8 bit az R,
G, B színeknek.
9.3. A digitalizált videoállomány jellemzői:
Képváltási frekvencia:
A mozgások jó minőségű előállításához 50 állóképet kell
másodpercenként az embernek egymás után látni. A TV-nél 50-60
félképet sugároznak. A számítástechnikában 70-100 Hz.
Képméret:
4:3-as aránynál 320*240
352*288
16:9-es arány
A digitális videoállomány mérete:
videoállomány mérete: képfájl + hangfájl
képfájl mérete: képkocka mérete [byte] * képváltási frekvencia [Hz] *
video hossza [sec]
képkocka mérete: pl. 320*240*24/8 [byte]
9.4. Videoállományok tömörítése:
1 sec hosszú digitalizált videoállomány kb. 5,661 MB. 1 perc 339,66 MB.
A tömörített állományok lényegesen kevesebb helyet foglalnak el, és mozgatásukhoz
is kisebb átviteli sebesség szükséges. A tömörített állományokat a felhasználás előtt
vissza kell alakítani eredeti formájukra. Ez a kicsomagolás vagy dekódolás művelete.
A tömörítés / kibontás történhet:
Szoftverrel a CPU-t terheli.
Hardverrel a célhardver processzorát terheli.
41
Tömörítés képkockák között:
A videoállományok képkockák sorozatából állnak. Legtöbbször az egymást
követő képkockák alig térnek el egymástól. Egyes tömörítő eljárások kihasználják azt
a lehetőséget, hogy egy képkocka legnagyobb része azonos az előzővel. Ezek az
eljárások egy képkockáról nem a teljes képpont információt tárolják, hanem csak
azon képrészek információit, melyek az előző képkockához képest megváltoztak. A
képkockák közötti tömörítés esetén az eljárás keretbe foglalja a megváltozott
képrészeket, és egy képkockánál csak ezt a keretet tárolja. Ennek a keretnek
deltakeret a neve. A képkocka képe, tehát a korábbi képkockákból származó
adatokból, és a hozzáadott deltakeretekből állítható össze.
Egy képsorozat összes képkockáját nem lehet a képkockát megelőző
képkockákból származtatni, mert ez teljesen lehetetlenné teszi a vágást. Ezért a
sorozatokban mindig találhatók olyan képkockák, melyek kódolt változatának
kibontásához nincs szükség az előtte található képkocka ismeretére. Ezek az
úgynevezett referencia képkockák. A leggyakrabban minden 15. képkocka
referencia képkocka. A referencia képkockák lehetnek vágási pontok.
Vannak ezenkívül olyan képkockák, amelyek nem származtathatók a korábbi
képkockákból, ezeknél a képkockáknál az eljárás felrajzolja a teljes képkockát. A
referencia képkocka is teljes képkocka.
A képkockák közötti tömörítést alkalmazó eljárások veszteséges tömörítési
eljárások, viszont a velük elérhető tömörítési arány jóval nagyobb, mint amit a
képkockán belüli tömörítéssel el lehet érni (M-JPEG).
A tömörítő eljárások bizonyos módszerekkel döntik el, hogy mely képrészeket
tekintsenek megváltozottnak, és melyeket változatlannak.
Bitsebesség:
Egyes tömörítő eljárások pontosan meghatározott bitsebességgel működnek. Ez
azt jelenti, hogy minden képernyőre rajzolt képkocka kibontása mindig meghatározott
számú bitből kerül kialakításra. Ezt a meghatározott számú bitet kell a
számítógépnek a háttértárolóról beolvasni. Pl.: 24 bit színmélységnél, 320*240, 25
Hz képváltás esetén: 8*5625 KB = 40000 Kbit = 43,35 MBit/s. Tízszeres tömörítés
esetén csak ~4500 Kbit/s.
42
9.5. Videoállomány-tömörítési eljárások:
A videoállományokat veszteséges tömörítési eljárásokkal szokták tömöríteni, mert
a veszteségmentes eljárásokkal nem érhető el elég nagy tömörség.
AVI (Audio Video Interleaved)
A neve arra utal, hogy az állományokban a kép- és hanginformáció váltakozva
követi egymást. Így az AVI állomány lejátszásakor a számítógép egymás után
olvassa be, majd jeleníti meg a kép és hanginformációkat.
A Microsoft által kidolgozott AVI formátum a RIFF formátumnak egy speciális fajtája.
A RIFF formátum egy általános célú multimédia fájlformátum, amit a Microsoft és az
IBM dolgozott ki.
Az AVI fájl fejléccel kezdődik, amit különböző típusú adatfolyamok követnek. Egy
AVI fájl tartalmazhat 0-1 kép adatfolyamot, továbbá 0-n hang-adatfolyamot.
A képadatok lehetnek tömörítés nélküli adatok, vagy tömörített adatok. A tömörítés
nélküli képadatok DIB formátumúak. A DIB (Device Independent Bitmap) formátum
azonos az ismert bittérkép formátummal.
A képadatokat különböző eljárásokkal lehet tömöríteni, de a tömörítési eljárásokat
ismerni kell a Windows alatti lejátszóknak, szerkesztőknek.
A képadat-folyamban található adatok formátumát a képadat-folyam fejléce
tartalmazza. Függetlenül a képadatok belső formátumától, az AVI szoftver képkockák
közötti tömörítést is végez. A tömörítő szoftver nagyvonalúan dönt arról, hogy egy
képkocka melyik részét tekintse megváltozottnak, ezért csak a jelentősen átalakult
képrészeket tekinti módosultnak. Az AVI fájlokban általában kisméretű deltakeretek
találhatók, bár emiatt elvész néhány apró képadat. Nagy tömörítés kis
deltakeretekkel érhető el, ennek viszont képminőség romlás az ára.
A képminőség egyébként is minden deltakeret megjelenése után romlik, ezért
bizonyos számú deltakeret megjelenése után a deltakeret felismerhetetlenné válik.
Ennek megakadályozására az AVI szoftver bizonyos számú (ált. 15) képkocka után
egy teljes képkockát (referencia képkocka) rögzít.
Ha egy képkocka-sorozatban sok gyors mozgás követi egymást, akkor az egyes
képkockák nagymértékben különböznek egymástól. Ebben az esetben az egyes
deltakeretek is nagyméretűek lehetnek, azaz sok adatot tartalmaznak, emiatt nő az
AVI állomány mérete.
43
Az AVI állományban a hang és kép felváltva kerül tárolásra. Egy képelem egy
képkocka képállományát tartalmazza. Ezt követi a képkockához tartozó hangelem.
Képkocka-elem + hangelem rekord.
Az AVI állományok felvételekor a videojelet egy videodigitalizáló kártya
digitalizálja, azaz a képjelet bittérképes képsorrá alakítja. Ezzel párhuzamosan
digitalizálja a hangjelet a hangkártya.
Az AVI-nál a hang általában nem tömörített.
Lejátszásnál elcsúszás nem következhet be a kép- és a hanginformációknál, mert
a szinkronizálás az egymásutánisággal biztosítva van.
Ha a deltakeret kisméretű, a feldolgozandó adatmennyiség csekély, vagyis a
lejátszást kisebb teljesítménnyel is meg lehet oldani. Viszont a video minősége is
rosszabb.
MPEG (Moving Picture Experts Group)
Egy digitális tömörítési szabványcsalád és fájlformátum neve. Az MPEG
szabványok az AVI, Indeo szabványoknál jobb képminőség mellett nagyobb
tömörítést biztosítanak.
Az MPEG eljárások veszteséges tömörítési eljárások, melyekkel nagyfokú
tömörítés érhető el. Elfogadható képminőség mellett 1:50, 1:200 tömörítési arány is
elérhető. A képek mellett a hangadatot is jó minőséggel tömörítik.
MPEG 1: 1992, 320*240 képpontból álló videoállományt olyan mértékben
lehet tömöríteni, hogy az 1,5 MBit/s sebességgel kiolvasható a
háttértárolóról. Ezzel a bitsebességgel a 2* CD-ROM meghajtók képesek
működni.
RGB YUV JPEG alapú képkockán belüli képkockák közötti
tömörítés.
A tömörítés végén egy állományba helyezi átlapoltan a tömörített kép és
hang adatokat.
MPEG 2: Az adatátviteli sebesség és ezzel a tömörítés változtatható 3
MBit/s – 40 GBit/s értékig. A leggyakrabban használt átviteli sebesség 4
– 15 MBit/s.
A bitsebesség növelése lehetővé teszi a digitális videotechnikában
használt, igen nagy méretű (1920*1600) képpontból is állhat. A DVD
technika használja.
44
MPEG 3: Nem készült el.
MPEG 4: 1998
Ez a szabvány kis átviteli sebességre készült (4,8 – 64 Kbit/s). A
multimédia kommunikáció számára dolgozták ki. Legfontosabb
újdonsága, hogy tetszőleges alakú képi objektumokat lehet önállóan
kezelni.
(A DivX, Xvid is erre épül.)