Upload
nami
View
52
Download
7
Embed Size (px)
DESCRIPTION
Különböző médiaelemek feldolgozása. Összeállította : Kosztyán Zsolt Tibor e-mail : [email protected], [email protected], [email protected], honlap : http://vision.vein.hu/~kzst. Médiumok. Szöveg Kép Hang Videó Animáció. Szöveg bevitele. Hagyományos módon – begépeléssel - PowerPoint PPT Presentation
Citation preview
Különböző Különböző médiaelemek médiaelemek feldolgozásafeldolgozása
ÖsszeállítottaÖsszeállította: : Kosztyán Zsolt TiborKosztyán Zsolt Tibore-maile-mail: [email protected],: [email protected],
[email protected],[email protected],[email protected],[email protected],
honlaphonlap: http://vision.vein.hu/~kzst: http://vision.vein.hu/~kzst
Médiumok• Szöveg• Kép• Hang• Videó• Animáció
Szöveg bevitele1. Hagyományos módon –
begépeléssel2. Már korábban elkészült szöveg
beszerkesztése3. OCR (karakterfelismerő program
segítségével)
OCR karakterfelismerő algoritmusok
• Összehasonlítás• Körvonalelemzés
Szövegfelismerés lépései
1. Feldolgozandó kép elérése2. A kép előfeldolgozása3. Felbontás, zónázás4. Felismerés5. Ellenőrzés, tanítás6. Mentés
Szöveg elhelyezése a képernyőn
1. Legyen a szöveg megfelelően nagy méretű
2. Ne legyen túl sok betűtípus a képernyőn
3. Ne legyen túl sok szöveg egy képernyőn
Színmetrika - alapfogalmak
• Az elektromágneses sugárzás 1 nm és 1 mm közé eső részét hívjuk optikai sugárzásnak, ennek része a látható sugárzás.
• A színinger a látható színképtartományban sugárzott teljesítmény.
A szem szerkezete
A szem szerkezete
Színlátási rendellenességek
• a protanópia, vagy vörös gyengeség. Ezen személyek a vörös színeket sötét árnyalatúnak látják „vörös” színészleletük nincs. Valószínű oka, hogy az L fotopigmensük hiányzik (vagy nincsenek L csapjaik, vagy az M csapokra jellemző fotopigmens van ezen csapokban is.
• a deuteranópia, vagy zöld gyengeség. Deuteranopok a zöld színeket látják viszonylag sötéteknek, ez a leggyakoribb színtéveszési forma. Valószínű oka, hogy az M fotopigmensük hiányzik (vagy nincsenek M csapjaik, vagy az L csapokra jellemző fotopigmens van ezen csapokban is.
• tritanópia, vagy kék-vakság: tritanopok a kék színeket nem látják (igen ritkán fordul elő, valószínű oka az S-csappigmens hiánya).
Színlátási rendellenességek
Láthatósági függvény
0,000
0,200
0,400
0,600
0,800
1,000
1,200
350 400 450 500 550 600 650 700
hullámhossz, nm
szín
képi
érz
éken
ység
Színingermetrika – színinger egyeztetés
Színmetrika – Grasmann törvények
• Szimmetria törvény: Ha A stimulus megfelel B stimulussal, akkor B stimulus is megfelel A stimulussal.
• Transitivitás törvénye: Ha A megfelel B-vel és B megfelel C-vel, akkor A is megfelel C-vel.
• Proporcionalitás törvénye: Ha A megfelel B-vel, akkor aA megfelel aB-vel, ahol a tetszésszerinti pozitív tényező.
• Additivitás törvénye: Ha A, B, C, D négy színinger, akkor ha bármely két egyenlőség az alábbiak közül fennállA B, C D, (A +C) (B + D) akkor fennáll a következő egyenlőség is (A +D) (B + C)
Színképi érzékenység
-0.15
-0.10
-0.05
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
350 400 450 500 550 600 650 700 750 800
wavelength, nm
CMF R(lambda)
G(lambda)
B(lambda)
R k P( r
G k P( g
B k P( b
) ( )
) ( )
) ( )
380 nm
780 nm
380 nm
780 nm
380 nm
780 nm
R k P( r G k P( g B k P( b ) ( ) , ) ( ) , ) ( )d d d380 nm
780 nm
380 nm
780 nm
380 nm
780 nm
L = 1,0000R + 4,5907G + 0,0601B.
CIE XYZ színingertér• olyan színingerösszetevő függvényekhez vezet,
melyeknek csak pozitív értékei vannak,• melynél az egyik alapszíninger megegyezik a
V()-függvénnyel (az ezzel meghatározott színingerösszetevő fotometriai adatot szolgáltat),
• az equienergetikus színinger mindhárom színingerösszetevője azonos, és
• a lehető legszorosabban veszi közre a valós színinger vektorok által meghatározott színtérrészt
BGR
,,,,,,,,,
ZYX
594275056510000000060100590704000001130161751751768882
CIE XYZ színingertér
CIE (x,y,Y) diagram
ZYXZz
ZYXYy
ZYXXx
ZYX
1
MacAdam ellipszisek
CIE LUV
31224'
yxxu
31229'
yxyv
6'8'3'2
vuvy
'4'9yvux
CIE LUV
CIE LUV• huv = arctg[(v' - v'n) / (u' - u'n)] =
arctg (v* / u*) (színezeti szög)• suv = 13[(u' - u'n)2 + (v' - v'n)2]1/2
(telítettség)
CIA LAB
További szín-koordinátarendszerek
• YUV szín-koordinátarendszer (PAL-SECAM)– Y = 0,3 R +0,59G + 0,11 B
(luminancia)– U = (B-Y) x 0,493 (krominancia)– V = (R-Y) x 0,877 (krominancia)
További szín-koordinátarendszerek
• YIQ szín-koordinátarendszer (NTSC)– Y = 0,30 R + 0,59 G + 0,11 B– I = 0,60 R – 0,28 G – 0,32 B– Q = 0,21 R – 0,52 G + 0,31 B
• HSB szín-koordinátarendszer– Brightness = Y– Hue = arctg((R-Y)/(B-Y))– Saturation = 1 – min {R, G,
B}/Y
Számítógépes grafika• Vektorgrafika
– A program egy láthatatlan hálóra rajzolja ki a készülő grafikát
– A grafikát utasítások halmazaként tárolja. (pl. pont, vonal, kör stb. helyét esetleg irányítását)
– Megjelenítéskor ezek az utasítások hajtódnak végre– Előny: Kis méret (általában)– Hátrány: Bonyolult (foto-realisztikus) ábrákat nem,
vagy nagyon nehezen lehet leírni vektorgrafikus állományként
Alkalmazás: pl. CAD/CAM
Számítógépes grafika• Bittérképes grafika
– Kép függőleges és vízszintes irányban pontokra (pixel) van felosztva
– Megjelenítéskor a képernyő pontjaiban megjelennek az adott pontról tárolt színinformációk
– Előnye: Foto-realisztikus képek egyszerű megjelenítése
– Hátránya: Nagyobb méret. Nem vagy nehezen lehet műveleteket végezni a képeken lévő alakzatokkalMegjegyzés: Vektorgrafikus=>Bittérképes konverzió egyszerű, Bittérképes=>Vektorgrafikus konverzió nagyon bonyolult
Képek jellemzői – színmélység
Színinfromáció-mennyiség
képpontonként
Megjeneíthető színek száma
4 bit 168 bit 256
16 bit 65 53624, 32 bit (True Color),
48 bit 16 777 216
Képek jellemzői - színmélység
Képek jellemzői - méret• A képállomány mértét meghatározza:
– Vízszintes felbontás– Függőleges felbontás– Színmélység
• Leggyakoribb monitorfelbontások (általában 4:3)– 320 x 200, 320 x 240– 640 x 480– 800 x 600– 1024 x 768– 1240 x 1024– 1600 x 1240 Pl. 800 x 600 x 24 bit = 1 440 000 Byte
Képek digitalizálása• Lapolvasók fajtái:
– Kézi szkenner– Asztali (lap) szkenner
• A kép digitalizálás folyamata:– Analóg kép (pl. fénykép)– Kvantálás (dpi=dot per inch)– Digitális képPl. 3 inch (7,62 cm) x 300 dpi x 2 inch
(5,08) x 300 dpi x 24 bit = 540 000 képpont x 3 Byte = 1 620 000 Byte
Képek digitalizálása - szempontok• Felbontás:
– Kép esetén általában 100-300 dpi elég. Ha túl magas dpi-n mintavételezünk, akkor egyrészt túl nagy lesz a kép másrészt a képen túl sok zaj jelenhet meg.
– Szövegfelismerés esetén kb. 400 dpi• Színmélység:
– Lehető legmagasabb színmélységben mintavételezzünk, és ha szükséges a színek számát csak később a digitalizálás után redukáljuk.
Képek jellemzése - hisztogram• Hisztogram: Adott színből (gradációs
fokozatból) mennyit tartalmaz
Képfeldolgozás – különböző digitalizálási hibák kijavítása
• Leggyakrabban előforduló hibák– Nem megfelelő (relatív) világosság– Nem megfelelő kontraszt– Nem megfelelő élesség– Különböző zajok megjelenése a képen– Kicsinyítésből és nagyításból eredő
hibák
(Relatív) világosság, kontraszt változtatása
Gamma karakterisztika, hisztogram kiegyenlítése
Elmosás, élkiemelés, éldetektálás – Diszkrét
konvolúció segítségével
k
kn
l
lm
lmknkmjnifw
jif )1,1(),(1),(
111111111
,91
010151
010
010141
010
Különböző zajok szűrése a képen
Mean Square Error (MSE)
1
0
1
0
2,, )~(1 M
j
N
ijijiMSE xx
NME
Jel-zaj arány (signal to noise ratio - SNR)
MSEESNR
2
10log10
Szórásnégyzet(variance):
M
m
N
nnm xx
NM 1 1
2,
2 )(1
Átlag (mean):
M
m
N
nnmxNM
x1 1
,1
Nagyításból és kicsinyítésből eredő hibák kiküszöbölése
• Kicsinyítésből eredő hibák– Elvesznek élek– Információ
vesztés• Nagyításból eredő
hibák– „pixelesség”
Színes képek manipulálása
• A képfeldolgozó program esetében szükséges egy belső színtér, mely legyen:– Egyenlő közű– Legyen értelmezve rajta a:
• Világosság• Színezet, vagy színezeti szög• Telítettség, vagy a króma
Irodalom1. CSÁNKY LAJOS: Multimédia PC-s
környezetben, LSI Oktatóközpont, Budapest, 1996.
2. RALF STEINMETZ: Multimédia Springer Hungarica Kiadó Kft., Budapest
Irodalom - Internet1. http://www.adobe.com2. http://www.matrox.com/mga3. http://www.sysopt.com/reviews/matrox-g4504. http://www.fontolo.hu/magazin/digivideo/
digivideo.html5. http://www.mpeg.org/MPEG/audio.html6. http://www.fraunhoffer.iis7. http://www.intermedia.c3.hu/oktanyag/
video/videotechgyak8. http://www.movie-collage.de
Köszönöm a Köszönöm a figyelmet!figyelmet!