49
Algorytmy graficzne Marcin Wilczewski Politechnika Gdańska, 2009/10

Algorytmy graficzne - Strona Główna · Modele barw. Charakterystyki obrazu. Reprezentacja i opis. Kwantyzacja skalarna i wektorowa obrazów cyfrowych. Wyszukiwanie obrazów cyfrowych

Embed Size (px)

Citation preview

1

Algorytmy graficzne

Marcin Wilczewski Politechnika Gdańska, 2009/10

2

Zagadnienia, wykład, laboratorium

Wykład:

Światło i barwa. Modele barw.

Charakterystyki obrazu. Reprezentacja i opis.

Kwantyzacja skalarna i wektorowa obrazów cyfrowych.

Wyszukiwanie obrazów cyfrowych ze względu na treść.

Obrazy binarne i ich przetwarzanie.

Obrazy barwne i ich przetwarzanie.

Metody przetwarzania obrazu w dziedzinie przestrzennej.

Algorytmy kompresji danych obrazowych.

Wykład kończy się pisemnym zaliczeniem (ostatnie zajęcia w semestrze, 20 punktów).

Literatura:

Rafael C. Gonzalez, Richard E. Woods, „Digital Image Processing

Oceny

Zaliczenie pisemne: >10 punktów oraz

[26,30] – 3; [31-35] – 3+; [36,40] – 4; [41,45] – 4+; [46-50] - 5

Laboratorium:

Problemy do rozwiązania omawiane na wykładzie. Czas realizacji od 1 do 4 tygodni.

Maksymalnie: 30 punktów.

Możliwość zdobycia punktów na wykładzie.

3

Obszar zainteresowań wykładu

Dziedziny związane z tworzeniem i przetwarzaniem obrazów cyfrowych:

grafika komputerowa – generowanie obrazów, tworzenie obrazów sztucznych, przetwarzanie

obrazów naturalnych. Celem jest stworzenie obrazu,

cyfrowe przetwarzanie obrazów – celem jest wydobywanie lub podkreślanie istotnych informacji

zawartych w obrazie,

computer vision (widzenie komputerowe)

in/out obraz opis

obraz przetwarzanie obrazów (image processing)

computer vision (widzenie komputerowe)

opis grafika komputerowa sztuczna inteligencja

4

Układ wzrokowy człowieka

Siatkówka. Wyściela dno oka. Uważa się, że stanowi najbardziej wysuniętą na zewnątrz część mózgu.

Plamka żółta stanowi centralny obszar siatkówki i wraz dołkiem centralnym (fovea) jest obszarem najostrzejszego widzenia. Jednym z zadań zwężającej się źrenicy jest skupienie strumienia światła na plamce żółtej. Dlaczego nadmiar światła w oku jest niepożądany?

Komórkami fotoreceptorowymi oka są pręciki i czopki. Ich położenie oraz proporcje zależne są od konkretnego regionu siatkówki. Czopki dominują w regionach centralnych (plamka żółta i dołek centralny) tworząc obszar widzenia o największej rozdzielczości. Wraz z oddalaniem się od plamki żółtej maleje ilość czopków, przy jednoczesnym wzroście liczby pręcików. Plamka ślepa jest obszarem braku fotoreceptorów.

Związkiem absorbującym światło w pręcikach jest rodopsyna o maksimum absorpcji dla fal długości 500nm. Dla czopków istnieją trzy różne związki absorbujące (jodopsyny) o maksimach absorpcji 450nm, 530nm oraz 570nm, przy czym pojedynczy czopek zawiera jeden rodzaj opsyny.

Dwa systemy widzenia: pręcikowy (nocny, skotopowy) oraz czopkowy (dzienny, fotopowy). Przełączanie systemów regulowane jest przez natężenie światła docierającego do oka.

Proporcje pomiędzy pręcikami i czopkami zależą od trybu życia organizmu (u człowieka stosunek pręcików do czopków wynosi ok.. 120:6).

W oku zachodzi silna redukcja (i przekształcanie) informacji nie tylko przez rozpraszanie i absorpcję światła padającego na komórki pigmentowe, ale również przez uśrednianie sygnałów pochodzących z poszczególnych receptorów (pola receptorowe).

Absorpcja fotonów i wywołane tym reakcje można uważać za pierwszy etap procesu przetwarzania informacji niesionej przez promieniowanie elektromagnetycznie przez organizm.

Rys. (a) schemat ludzkiego oka, (b) schemat budowy pręcika i czopka.

a

b

5

Cechy detekcji ludzkiego oka (1)

Efekt pasm Macha (efekty graniczne, złudzenie kontrastu brzegowego) tłumaczy się zjawiskiem hamowania obocznego sąsiednich fotoreceptorów lub pól receptorowych. Prowadzi to do odczucia rozjaśnienia części jasnej i przyciemnienia części ciemnej wzdłuż granicy pól. Hamowanie oboczne interpretuje się jako proces wzmacniania poziomu sygnału do szumu (zwiększania kontrastu).

Rozdzielczość przestrzenna jest związana z gęstością upakowania fotoreceptorów w siatkówce. W określonych warunkach dwa punkty zewnętrzne emitujące światło są percepowane jako jeden punkt świetlny.

Rozdzielczość przestrzenna związana jest z natężeniem sygnału. Spadek natężenie sygnału pociąga za sobą poszerzenie otworu źrenicy, zwiększenie rozpraszania światła w gałce ocznej i zmniejszenie kontrastu (pobudzenie pól receptorowych o mniejszej rozdzielczości w peryferyjnych obszarach siatkówki).

Adaptacja do poziomu oświetlenia wiąże się z koniecznością przejścia z systemu czopkowego na pręcikowy lub odwrotnie Efektami adaptacji tego typu są m. in. oślepienie wskutek działania silnego bodźca świetlnego (globalne podwyższenie progu pobudzenia fotoreceptorów), utrzymujące się oślepienie po ustaniu działania bodźca, niższa wrażliwość na ciągłe zmiany jasności (natężenia) niż na zmiany skokowe (nieliniowa wrażliwość na zmiany jasności).

Prawo Webera – progowa wielkość dostrzegalnej różnicy jasności, I, jest proporcjonalna do wartości bodźca początkowego, I, tzn. I/I 0.02=const. Prawo to nie stosuje się dla skrajnie dużych i

małych wartości bodźca.

Kontrast równoczesny luminancji oraz barwy

Rozdzielczość czasowa (efekt stroboskopowy).Rys. Efekt pasm Macha (kontrast graniczny) wywołany przez

hamowanie oboczne pól receptorowych w ludzkim oku.

6

Cechy detekcji ludzkiego oka (2)

Rys. Zjawisko kontrastu jednoczesnego (a) luminancji oraz (b) barwy (chrominancji). W pierwszym przypadku pole znajdujące się na ciemniejszym tle wydaje się jaśniejsze w stosunku do identycznego pola na jaśniejszym tle.

W drugim przypadku dwa identyczne pola czerwone wydają się być różne pod względem barwy. Pole na niebieskim tle wydaje się być cieplejsze i o większym nasyceniu niż pole na tle żółtym.

a

b

7

Złudzenia wieloznaczne (sylwetki alternatywne)

ab

Rys. Sylwetki alternatywne: twarz i puchar. (a) – interpretacja obrazu jest zależna od definicji tła i obiektu. Wieloznaczna interpretacja rysunku (b) nie jest tak oczywista jak rysunku (a) (tzn. widać raczej puchar niż twarze).

8

Kontrast równoczesny – przykład 1

[http://web.mit.edu/persci/]

9

Kontrast równoczesny – przykład 1

10

Kontrast równoczesny – przykład 2

Rys. Pierścienie Koffka. Ilustracja kontrastu jednoczesnego luminancji.

a b

c

11

Światło i barwa

Elementem koniecznym zjawiska widzenia jest

triada optyczna (źródło światła, obiekt,

obserwator).

Barwa nie jest immanentną cechą obiektów

materialnych, ale wypadkową cech obiektu

(materiał, geometria), cech padającego

światła (skład fizyczny) oraz zjawisk

psychologicznych.

Czym jest światło?

Czym jest barwa?

Długość fali światła

[nm]

Wrażenie barwy przy postrzeganiu w warunkach

widzenia

fotopowego skotopowego

380-440 fioletowa

nie występuje

wrażenie barwy

440-470 Indygo

470-480 błękitna

480-490 niebieska

490-510 niebieskozielona

510-530 niebieskawozielona

530-560 zielona

560-580 żółtozielona

580-590 żółta

590-600 żółtopomarańczowa

600-610 pomarańczowa

610-620 pomarańczowoczerwona

620-780 czerwona

12

Czym jest barwa?

Światło odbite od poszczególnych pól powyższej sekwencji i rejestrowane przez ludzkie oko jakościowo identyczne. Różni się jakością.

Do opisu wrażenia wywołanego działaniem każdego bodźca świetlnego używa się wielkości ilościowych (jasność) oraz

jakościowych (chromatyczność):

jakość (chromatyczność) - odcień oraz nasycenie

ilość (jasność) - luminancja

Barwa (wrażenie barwne) jest wrażeniem wzrokowym powstającym na skutek oddziaływania (w określonych

warunkach) fali świetlnej z materią (receptorami). Rodzaj wrażenia barwnego zależy od: cech fizycznych fali

świetlnej (właściwości promieniowania), zjawisk fizjologicznych zachodzących pod wpływem światła oraz zjawisk

natury psychologicznej.

Barwa jest atrybutem każdego wrażenia świetlnego postrzeganego w warunkach widzenia fotopowego i określa

jakość tego wrażenia (światła).

13

Trójpobudzeniowa teoria percepcji barw

Zgodnie z teorią trójpobudzeniową wrażenia barwne powstają na skutek działania fali świetlnej na trzy rodzaje receptorów siatkówki oka: czopków S (B-blue, niebieskie), M (G-green, zielone) oraz L (R-ed, czerwone). Każdy z rodzajów czopków posiada szczytową czułość dla różnych zakresów długości fali i jest zdolny pobrać światło tylko z jednego zakresu widma.

Wrażenie barwne (barwa uświadamiana) jest funkcją stosunku trzech

sygnałów: : :

Suma + + wpływa na odczucie jasności (luminancji) bodźca świetlnego.

Równocenne pobudzenie trzech receptorów : : =1:1:1 prowadzi do

wrażenia bieli lub szarości (w zależności od sumy sygnałów).

Na gruncie teorii trójpobudzeniowej można wyjaśnić zjawisko

metameryzmu: =const., =const., =const.

Wniosek: oko nie analizuje fizycznego składu spektralnego światła, ale

uśrednia (całkuje) docierający sygnał. Całe promieniowane

elektromagnetyczne zostaje zredukowane do trzech czynników (silna

redukcja informacji). Skoro tak, to w metodach uzyskiwania barwnych

obrazów rzeczywistości nie trzeba odtwarzać właściwości spektralnych.

Przyjmując, że padające na receptory światło opisane jest przez funkcję

rozkładu spektralnego E( ), na wyjściu czopków pojawiają się sygnały:

14

Metameryzm

Światła (bodźce barwowe) o czterech podanych wyżej rozkładach widmowych wywołują to samo wrażenie barwne (podane obok), są zatem percepcyjnie nierozróżnialne – są metamerami.

Bodźce świetlne różniące się rozkładem spektralnym mogą wywoływać to samo wrażenie barwne (wrażenie

barwy). Bodźce takie nazywane są metamerami, a zjawisko - metameryzmem.

Na podstawie właściwości spektralnych (skład widmowy, skład fizyczny) bodźca świetlnego można

określić wrażenie barwne jakie bodziec ten wywoła.

Zależność w przeciwną stronę nie jest prawdziwa, tzn. barwa nie implikuje składu widmowego bodźca

świetlnego.

Czerwone światło żarówki (widmo ciągłe) i czerwone światło lasera (światło monochromatyczne)– skład

fizyczny świateł różny, a wrażenie barwne może być identyczne. Prosty eksperyment: ta sama fotografia

kolorowa oglądana w świetle obu źródeł wygląda inaczej! Jak?

Zależność widmo-barwa jest zależnością typu wiele do jednego.

Jak wyjaśnić zjawisko metameryzmu na gruncie trójpobudzeniowej teorii widzenia

W zastosowaniach technicznych nie odtwarza się składu widmowego światła, ale jedynie składowe , ,

.

15

Prawa Grassmanna (1853)

Trzy prawa addytywnego mieszania bodźców barwowych (Grassmann – 1853)

Każdy bodziec barwowy (wrażenie barwy) może być odtworzony jednoznacznie przez addytywne

zmieszanie trzech odpowiednio dobranych bodźców podstawowych (niezależnych). Należy podkreślić,

że taka synteza addytywna nie odtwarza własności fizycznych bodźca, ale jedynie efekt (wrażenie),

jaki on wywołuje w układzie widzenia (oku).

Jasność bodźca wynikowego jest równa sumie jasności bodźców składowych.

Różne bodźce świetlne (różniące się rozkładem spektralnym) wywołujące to samo wrażenie barwy

zmieszane w jednakowych stosunkach z innych bodźcem świetlnym dają jednakowe nowe bodźce

barwowe, tzn. wywołują jednakowe wrażenia barwne.

Wniosek:

Wrażenie barwne można odtworzyć bez konieczności rekonstrukcji składu widmowego bodźca.

Podstawowy wniosek wykorzystywany w realizacjach technicznych reprodukcji barw obiektów

występujących w rzeczywistości.

W praktyce różne barwy uzyskać można na dwa różne sposoby: w drodze syntezy addytywnej i

subtraktywnej.

16

Addytywna synteza barw

Cechy modelu

Określone wrażenie barwne uzyskiwane jest poprzez zmieszanie świateł (barw) podstawowych.

Z reguły stosuje się mieszanie świateł: czerwonego (R), zielonego (G) i niebieskiego (B). Teoretycznie można użyć innych świateł (o innych barwach) ale wówczas gama (gamut) barw odtwarzanych jest mniejsza. Jednocześnie podobne efekty można uzyskać przez mieszanie więcej niż trzech świateł.

Równocenne połączenie barw podstawowych daje czystą biel. Zerowe składowe każdej z barw podstawowych dają czerń – brak barwy.

Wrażenie światła białego można też uzyskać przez zmieszanie tylko dwóch świateł. Barwy tych świateł są wówczas nazywane barwami dopełniającymi.

Zwykle przyjmuje się, że intensywności barw podstawowych R, G oraz B leżą w zakresie [0,1], a tym samym dostępne barwy opisywane są w sześcianie jednostkowym.

Stosuje się do opisu „źródeł” światła – monitory CRT, odbiorniki TV

Synteza addytywna zachodzić może przy niejednoczesnym mieszaniu barw (pod pewnymi warunkami. Jakimi?)

17

Subtraktywna synteza barw - 1

Cechy modelu

Barwami podstawowymi modelu są barwy dopełniające barw podstawowych R, G, B:

cyjan (niebiesko-zielona), purpura oraz barwa żółta

Model subtraktywny – barwy powstają poprzez selektywne usunięcie wybranego zakresu widma światła białego (filtracja, absorpcja)

Warunkiem koniecznym syntezy jest obecność światła białego oraz substancji o selektywnej absorpcji promieniowania świetlnego

Zastosowanie w poligrafii

Łatwość konwersji do barw modelu RGB

18

Subtraktywna synteza barw - 2

Filtrowanie światła białego przez barwy podstawowe modelu CMY

19

Barwa – potrzeba obiektywnego opisu

Istnieje potrzeba określania barwy w sposób

ścisły

obiektywny

precyzyjny

nadający się do przetwarzania komputerowego

bez konieczności korzystania z wzorników.

W praktyce powstało wiele sposób obiektywnego i numerycznego opisu barw

modele kolorymetryczne: CIE RGB, CIE XYZ, CIE UVW, CIE LUV

modele komputerowe i telewizyjne: RGB, HSV, YCbCR, YUV, YIQ.

20

Cechy barwy

Określenia fizyczne (fizykalne)

dominująca długość fali

zakres spektralny światła

natężenie

W zastosowaniach technicznych opis tego

typu jest nieefektywny. Dlaczego?

Określenia percepcyjne

odcień barwy (np. czerwony, niebieski,

zielony, żółty)

nasycenie (np. zielony, seledynowy,

oliwkowy, etc.) lub czystość pobudzenia

jasność

21

Jak opisywać barwy?

Istnieją dwie podstawowe metody określania barw:

wzorniki i atlasy barw publikowane w postaci tradycyjnej (wzorniki PANTONE, Villalobos,

Euroscala, atlasy barw Munsella oraz Ostwalda, etc.). Zawierają próbki numerowane i

usystematyzowane według określonych kryteriów. Istnieją rozwiązania elektronicznego pomiaru

koloru PANTONE (kolorymetry elektroniczne). Reprodukcja barw z katalogów PANTONE w druku w

oparciu o triadę CMYK nie zawsze jest możliwa. Sugeruje się stosowanie innych katalogów, np.

Euroscala.

Zalety: wygodne i naturalne w użyciu. Wady: nietrwałość wzorców, konieczność uwzględnienia

takich parametrów jak rodzaj podłoża.

metody kolorymetryczne oparte na trójchromatycznym mechanizmie widzenia człowieka:

dowolny bodziec świetlny opisuje się udziałami trzech bodźców podstawowych (prawa

Grassmanna).

patrz: www.pantone.pl

22

System barw Munsella - 1

Okrąg barw Newtona

[http://www.colorsystem.com]

Koncepcja Newtona okręgu barw pozwala interpretować odcień barwy (hue) jako wielkość przyjmującą wartości z przedziału 0-360 stopni i odłożoną na obwodzie koła. Nie istnieje więc pojęcie wartości minimalnych i maksymalnych odcienia.

23

System uporządkowania barw Munsella (1905) - 2

Przestrzeń trzech parametrów HVC systemu uporządkowania barw Munsella

System barw Munsella jest jednym z najstarszych i dotychczas powszechnie stosowanym sposobem opisu barw.

Parametry modelu: odcień, chroma (nasycenie), wartość (jasność).

Na osi wartości (oś z) położone są barwy achromatyczne (czerń, szarości, biel)

Wartość (value) leży w przedziale [0,10], nasycenie w przedziale [0,28] w zależności od konkretnej barwy

W 1942 ASO rekomendowała model Munsella jako standard oznaczania barwy powierzchni (np. gleby). Stosowany do zastosowań naukowych i przemysłowych, ale nie poligraficznych.

24

System uporządkowania barw Munsella (1905) - 3

Krąg barw Munsella

System Munsella:

5 barw głównych: Red, Yellow, Green,

Blue, Purple

5 barw rozszerzonych (pośrednich):YR

(pomarańczowy), GY (jasnozielony),

BG (cyjan), PB (fiolet), RP (róż)

Kręgi barw podzielone są na 10

segmentów, których środki

odpowiadają barwom głównym

Nazewnictwo barw zgodnie z

konwencją: H V/C. Przykład:

5RP2/12, 5RP5/26

Porównanie próbki barwy lub światła z

wzorcem jest procedurą subiektywną

Znacznie ograniczona przestrzeń barw

25

System uporządkowania barw Munsella (1905) - 4

Barwa 5PB w atlasie barw MunsellaReprezentacja przestrzenna modelu barw Munsella

http://www.daicolor.co.jp

26

Eksperyment kolorymetrii trójchromatycznej (idea)

Eksperyment zrównania (dopasowania, matching) barw. Zrównywanie bodźców odbywa się w odpowiednich warunkach, które mają zapewnić wyeliminowanie czynników psychologicznych i innych, takich jak struktura podłoża (widzenie makswelowskie).

Posługiwanie się wzornikami jest wygodne w praktyce, ale nieprecyzyjne (np. określenie barwy

zależy od rodzaju podłoża).

Kolorymetria dziedzina nauki, która ma na celu liczbowy opis wrażeń barwnych (obiektywny opis

chromatyczności bodźców barwowych). Metody kolorymetryczne opierają się na prawach

Grassmanna. Jak uzasadnić prawa Grassmanna?

Mieszanie bodźców podstawowych nie odtwarza fizycznie bodźca zadanego, ale jedynie

kolorymetrycznie, tzn. odtwarza wrażenie barwne, ale nie skład widmowy światła. Po

zrównaniu, próbka testowa oraz mieszanina barw podstawowych są metamerami.

27

Równanie barwy

Posługując się schematem eksperymentu kolorymetrycznego

uzyskuje się tzw. równanie barwy prezentujące fakt zrównania

bodźca świetlnego o zadanym rozkładzie spektralnym przez

mieszaninę trzech niezależnych bodźców podstawowych

Z drugiego prawa Grassmanna wynika, że zachodzi równanie

(pod warunkiem, że nastąpiło zrównanie jakości i ilości światła)

Równanie barwy ma postać równania wektorowego. Barwa jest punktem (elementem) rzeczywistej

trójwymiarowej przestrzeni wektorowej, której bazą są bodźce podstawowe.

Równanie barwy można uprościć do postaci:

Współczynniki a,b i c nazywane są składowymi trójchromatycznymi, natomiast unormowane a’, b’

i c’ z przedziału [0,1] – współrzędnymi trójchromatycznymi w układzie bodźców podstawowych.

Do określenia chromatyczności bodźca (barwy) wystarczy znajomość trzech składowych lub

dwóch współrzędnych trójchromatycznych.

Metoda matematycznego, numerycznego, obiektywnego opisu barwy.

28

Model CIE-RGB 1931

Przykład przedstawiony wcześniej jest czysto teoretyczny i nie specyfikuje barw podstawowych. Najbardziej znanym przykładem przestrzeni (systemu, modelu) barw jest model CIE RGB opracowany przez Commision Internationale de L’Eclairage (Międzynarodową Komisję Oświetleniową) w roku 1931.

Cechy modelu CIE RGB 1931

Barwy powstają jako mieszanina barw podstawowych: R=700nm, G=546,1nm oraz B=435,8nm (dwie ostatnie długości fal to linie widma rtęci).

Proporcje dopasowania podawane są w tzw. jednostkach trójchromatycznych, tzn. tak by wrażenie bieli ekwienergetycznej uzyskać przy jednakowej ilości bodźców podstawowych. Użycie jednostek trójchromatycznych wymaga jedynie odpowiedniego przeskalowania. Dzięki temu punkt bieli ekwienergetycznej leży pośrodku trójkąta barw.

Dzięki stosowaniu jednostek trójchromatycznych punkt bieli ekwienergetycznej leży pośrodku trójkąta barw.

W oparciu o kolorymetr wykorzystujący jako podstawowe barwy świateł monochromatycznych o długościach fal podanych wyżej wyznaczono równanie barwy dla wszystkich barw świateł monochromatycznych w widmie światła białego oraz obserwatora normalnego. Wynikiem tego są funkcje dopasowania barw (color matching function).

29

Funkcje dopasowania barw modelu CIE RGB 1931

Funkcje dopasowania barw modelu CIE-RGB. Składowa r przyjmuje ujemne wartości w zakresie światła o długości fal pomiędzy długościami fal bodźców B oraz G, natomiast składowa g wartość ujemną przyjmuje dla świateł o długości fali poniżej długości fali bodźca B.

Jakie jest znaczenie funkcji dopasowania?

Funkcje dopasowania określają proporcje w jakich należy dokonać addytywnej syntezy barw podstawowych modelu aby odtworzyć barwę światła o zadanej długości fali

Postać krzywych wyznaczonych na podstawie danych eksperymentalnych (Wright, 1928,1929 oraz Guild, 1931) wskazuje, że nie każdą barwę można dopasować kombinacją barw podstawowych. Przykładem są barwy świateł monochromatycznych o długościach fal poniżej 546,1nm.

Oznaczając barwy podstawowe jako R, G, B, każdą barwę widzialną reprezentować można jako wektor w przestrzeni wektorowej, której bazą są wektory R, G oraz B – jest to przestrzeń CIE RGB.

Posługując się kolorymetrem CIE RGB wyznaczyć można współrzędne trójchromatyczne dla światła o dowolnym rozkładzie spektralnym. Problem: jest to niepraktyczne! Istnieją tablice.

Funkcje dopasowania przedstawione na rysunku odpowiadają dopasowaniu barw za pomocą konkretnych użytych w modelu barw podstawowych. Użycie innych barw podstawowych prowadzi do innym krzywych dopasowania.

Równania określające współrzędne w przestrzeni CIE-RGB dla koloru określonego rozkładem widmowym P( ):

∫∫

),()(=

),()(=),()(=

λbλPλdb

λgλPλdgλrλPλdr

30

Pole barw modelu CIE-RGB

Wykres chromatyczności (pole możliwych barw) w modelu CIE-RGB. Wykres powstał przez zrzutowanie płaszczyzny (trójkąta) o równaniu r+g+b=1 na płaszczyznę RG. Zwróć uwagę na fakt, że składowa r przyjmuje wartości ujemne.

df Pole wszystkich możliwych barw zawiera również tzw. linię purpur (podstawa podkowy pola barw)

Purpura nie jest składową światła białego, jednak jest możliwa do odtworzenia przez zmieszanie świateł o długości fali 380nm oraz 700nm.

Lokus widma jest krzywą łączącą punkty odpowiadające barwom świateł monochromatycznych 380nm-780nm (barwy o największym nasyceniu). Krańce lokusu połączone są tzw. odcinkiem purpur.

Punkt E odpowiada bieli ekwienergetycznej, (1/3,1/3, 1/3).

Wadą modelu CIE RGB jest konieczność posługiwania się ujemnymi wartościami składowych i współrzędnych trójchromatycznych.

31

Model CIE-XYZ

Model barw opracowany w 1931 roku przez Międzynarodową Komisję Oświetleniową (CIE) dla rozwiązania problemu ujemnych współrzędnych i składowych trójchromatycznych.

Układ XYZ powstaje przez transpozycję układu RGB.

Bodźcami podstawowymi stają się bodźce oznaczane jako XYZ leżące poza obszarem barw fizycznie realizowalnych. Bodźce XYZ są więc fikcyjnymi, abstrakcyjnymi bodźcami barwowymi. Tym samym nie jest możliwa konstrukcja kolorymetru wykorzystującego bodźce XYZ.

Bodźce XYZ prowadzą do funkcji dopasowania o wartościach dodatnich (patrz rysunek obok).

Transformacja składowych trójchromatycznych pomiędzy CIE RGB oraz CIE XYZ opisana jest równaniem

Funkcje dopasowania (funkcje współczynników rozkładu) barw modelu CIE XYZ 1931

i można je odnaleźć w odpowiednich tablicach.

Składowe trójchromatyczne dowolnego bodźca świetlnego o zadanym rozkładzie widmowym S( ) określające położenie dowolnej barwy w przestrzeni barw CIE XYZ określone są równaniami:

32

Przestrzeń barw modelu CIEXYZ

Przestrzeń barw modelu CIE XYZ 1931 jest bryłą o kształcie zbliżonym do stożka i o wierzchołku w początku układu współrzędnych.

Bryła składa się z punktów stanowiących współrzędne trójchromatyczne bodźców barwowych możliwych fizycznie do odtworzenia. Ponieważ w modelu CIE XYZ składowe trójchromatyczne przyjmują wartości dodatnie, to bryła barw znajduje się w pierwszym oktancie układu.

Posługiwanie się bryłą barw jest niewygodne, dlatego stosuje się wykres chromatyczności (pole barw).

Wykres chromatyczności uzyskuje się przez zrzutowanie płaszczyzny x+y+z=1 (równanie dla współrzędnych a nie składowych trójchromatycznych) na płaszczyznę XY.

Współrzędne x oraz y jednoznacznie określają położenie punktu barwy na polu chromatyczności w układzie XYZ. Znajomość współrzędnych trójchromatycznych identyfikuje bodziec barwny i pozwala nazwać wrażenie barwne jakie bodziec ten wywoła.

Przestrzeń barw modelu CIE XYZ 1931 (A) oraz wykres chromatyczności (B)

A

B

33

Model CIE-XYZ - cechy

Wykres chromatyczności modelu CIE-XYZ

Na brzegu obszaru w kształcie podkowy zlokalizowane są barwy nasycone (barwy spektralne, odcień barwy). Wnętrze obszaru wypełniają barwy nienasycone

Odcinek łączący barwę z lokusu z punktem bieli odpowiada barwom nienasyconym odcienia barwy z lokusu. Odcień danej barwy można określić przez przedłużenie odcinka przechodzącego przez punkt bieli i punkt danej barwy aż do punktu na lokusie

Nasycenie barwy określa stosunek długości odcinka łączącego punkt bieli z punktem barwy do odcinka łączącego punkt bieli z punktem lokusu i przechodzącego przez punkt barwy (barwy na lokusie są maksymalnie nasycone, czyste)

Odcinek łączący dwie dowolne barwy zawiera wszystkie barwy jakie można uzyskać przez odpowiednie zmieszanie barw na brzegach odcinka

Wykres chromatyczności nie zawiera informacji o jasności (luminancji). Pełną paletę barw tworzy nieskończenie wiele płaszczyzn przecinających bryłę barw. Wniosek: wykres nie zawiera pełnej palety barw.

Podstawę „podkowy” stanowią barwy niespektralne (linia purpury)

Reprezentacja gamutów – palety barw możliwych do reprezentacji na odpowiednim nośniku

34

Gamuty

Gamuty

urządzeń inośników

35

Gamuty

Porównanie gamy barw reprodukowalnych w systemach PANTONE, CMYK oraz standardowego monitora CRT.

Żaden z systemów nie daje możliwości odwzorowania pełnego zestawu barw występujących w rzeczywistości (naturze)

36

Elipsy Stilesa w modelu CIE-XYZ

Obok podanych zalet model CIE XYZ posiada też wady. Podstawową wadą jest fakt percepcyjnej niejednorodności: jednakowym odległościom na wykresie chromatyczności nie odpowiadają jednakowe różnice barw postrzeganych przez normalnego obserwatora. Innymi słowy: odległość pomiędzy barwami nie niesie informacji o stopniu podobieństwa pomiędzy barwami.

Punkty odpowiadające bodźcom barwowym nierozróżnialnym przez człowieka tworzą elipsy o różnych wielkościach (barwy o współrzędnych wewnątrz elips są nierozróżnialne).

Problem ten ujawnia się w przypadkach, gdy konieczne jest określenie różnicy pomiędzy barwą uzyskaną w drodze reprodukcji a oryginałem. Zwykła odległość euklidesowa nie jest wówczas efektywną miarą zniekształcenia barwy.

Elipsy Stilesa w układzie XYZ (elipsy są powiększone ok. 10x)

37

Model RGB

Model RGB stanowi najpopularniejszą reprezentację barw.

Model oparty o trójchromatyczną teorię postrzegania barw, zgodnie z którą wrażenie barwy powstaje wskutek pobudzenia trzech rodzajów czopków o maksimach absorpcji spektralnej dla światła czerwonego, zielonego i niebieskiego.

Bryła barw modelu RGB jest sześcianem w wierzchołkach którego znajdują się barwy podstawowe: czerwona, zielona, niebieska, barwy do nich dopełniające: żółty, niebieskozielony (cyjan), purpura (magenta) oraz czerń (0,0,0) i biel (1,1,1).

Model addytywny – barwy uzyskuje się w drodze mieszania barw podstawowych R, G, B w różnych proporcjach. Brak barw odpowiada czerni.

Zalety: wszystkie barwy pośrednie można reprezentować liniową kombinacją barw podstawowych (wygoda i szybkość obliczeń), odpowiada sposobom generowania barw w urządzeniach typu monitor i telewizor…

Model RGB posiada wady, które powodują, że w wielu zastosowaniach konieczna jest transformacja obrazu RGB do innej przestrzeni barw posiadającej lepsze własności. Podstawowe wady modelu RGB to:

percepcyjna niejednorodność, tzn. słabe korelacje pomiędzy postrzeganą różnicą dwóch barw a ich euklidesową odległością w sześcianie RGB,

nieintuicyjność posługiwania się składowymi R, G i B w określaniu barwy – problem z wizualizacją barwy na podstawie znajomości składowch RGB,

korelacje pomiędzy poszczególnymi składowymi. Istnieją szacunki, że dla obrazów naturalnych korelacje pomiędzy składowymi R i B, R i G oraz G i B wynoszą odpowiednio: 0.78, 0.98 oraz 0.94. Obraz zapisany w formacie RGB jest podatny na kompresję.

wrażliwość wartości składowych na zmiany poziomu oświetlenia (iluminacji) sceny,

jednoczesne operacje wykonywane na wszystkich składowych mogą prowadzić do przekłamania kolorów (np. rozjaśnianie obrazu RGB wymaga ingerencji we wszystkie składowe obrazu).

Rys. (a) – sześcian barw modelu RGB; (b) – nieintuicyjność modelu RGB. Lewa kolumna odpowiada barwom (R,G,B)=(10,200,10..150), prawa kolumna barwom (R,G,B)=(100,200,10..150); (c) – dwa przykładowe kolory, dla których odległość euklidesowa w przestrzeni RGB jestidentyczna (d=90) z odległością pomiędzy kolorami w dowolnym wierszu na rysunku (b).

b

a

c

38

Model rgb (unormowany RGB)

Wartości składowych RGB są proporcjonalne do ilości światła padającego na obrazowany obiekt (fragment sceny). Wszystkie lokalne zaburzenia w ilości światła padającego na obiekt spowodowane, dla przykładu zacienieniem, powodują wyraźne zmiany wszystkich składowych obrazu. Jest to niepożądane zjawisko, które może prowadzić do błędów segmentacji prowadzonej na obrazie RGB (lub błędów innego rodzaju).

Prostą operacją uniezależniającą składowe barwy od ilości światła jest proces normalizacji składowych postaci:

w której rezultacie powstają barwy unormowane r, g oraz b spełniające warunek: r+g+b=1 (znajomość dwóch składowych pozwala wyznaczyć trzecią).

Problem osobliwości: R+G+B=0.

Składowe rgb w przeciwieństwie do RGB posiadają pożądaną cechę: ich wartości nie zmieniają się pod wpływem zmiany oświetlenia obiektu (sceny) bez zmiany składu spektralnego światła.

Czy znajomość składowych r, g oraz b wystarcza do jednoznacznego odtworzenia wartości składowych R, G oraz B?

39

Model rgb (unormowany RGB) - ilustracja

Rys. (a) - obraz oryginalny; (b), (c), (d) odpowiednio składowe R, G, B obrazu (a); (e), (f), (g) odpowiednio składowe unormowane r, g, b obrazu (a); (h) oraz (i) wartości pikseli w wierszu 100 dla składowej odpowiednio G oraz g obrazu oryginalnego. Widać stabilnośćskładowych rgb na zmiany poziomu oświetlenia, któremu nie towarzyszy zmiana składu spektralnego światła.

50 100 150 200 250 300 350

50

100

150

200

250

300

0 100 200 300 400

0

50

100

150

200

250

300

0 100 200 300 400

0

50

100

150

200

250

300

0 100 200 300 400

0

50

100

150

200

250

300

0 100 200 300 400

0

50

100

150

200

250

300

0 100 200 300 400

0

50

100

150

200

250

300

0 100 200 300 400

0

50

100

150

200

250

300

100 200 300 400

50

100

150

200

250

100 200 300 400

0.4

0.5

0.6

0.7

a

b c d

e f g

h i

40

Model HSV (1)

Model HSV (hue, saturation, value) jest modelem, który nawiązuje do naturalnego sposobu interpretacji i opisu barw za pomocą trzech atrybutów: odcienia (hue), nasycenia (saturation) oraz jasności (intensity, brightness, value). Dwa pierwsze atrybuty związane są z cechą jakościową światła (chromatyczność), trzeci parametr, jasność, jest związany z ilością światła.

Model HSV pozwala rozłożyć wrażenie barwne na trzy składowe, przy czym tylko dwie dotyczą chromatyczności.

Barwy w modelu HSV reprezentowane są jako punkty leżące na oraz w wewnątrz ostrosłupa foremnego o podstawie sześciokąta. Ostrosłup HSV można uzyskać przez transformację sześcianu RGB.

Oś V (value, intensity) przyjmuje wartości z przedziału [0,1] i stanowi oś ostrosłupa. Punkty osi V reprezentują barwy achromatyczne (poziomy szarości od czerni do bieli)

Nasycenie S (saturation) przyjmuje wartości z przedziału [0,1] i jest mierzona jako odległość punkty barwy od osi V. Barwy o maksymalnym nasyceniu odpowiadają barwom świateł monochromatycznych.

Odcień H (hue) przyjmuje wartości z przedziału [0,360] i mierzony jest jako kąt obrotu wokół osi V (przeciwnie do kierunku ruchu wskazówek zegara). Jak zmienia się odcień w przypadku S=0?

Analiza ostrosłupa HSV wskazuje, że maksymalne nasycenie barwy jakie można uzyskać zależy od wartości jasności (ilości światła). Podobny efekt jest wbudowany np. w system barw Munsela. Przecięcie sześcianu płaszczyzną prostopadłą do osi V dla ustalonej wartości V daje możliwe barwy dla danego poziomu jasności. Dla płaszczyzny V=0 jedynym wrażeniem jest czerń.

Rys. Przestrzeń barw modelu HSV.

41

Model HSV (2)

Równania opisujące konwersję pomiędzy modelami RGB oraz HSV w sposób przybliżony odpowiadają psychofizycznemu wrażeniu (odcień, nasycenie, jasność) wywołanemu przez kombinację barw RGB.

Przy założeniu, że R,G,B=[0,1] konwersja modelu RGB do modelu HSV opisana jest równaniami:

Zaproponowano wiele wersji powyższych równań o znacznie mniejszej złożoności obliczeniowej. Przykładem jest równanie na składową H, które nie zawiera funkcji trygonometrycznych:

Implementując powyższe równania należy zwrócić uwagę na osobliwości! (np. dla barw achromatycznych) oraz na fakt, że zmienna jest wartością kątową wyrażoną w stopniach (nie radianach).

42

Model HSV (3) - ilustracja

Rys. (a) – sześcian RGB; obrazy (b), (c) i (d) to obrazy odpowiednio H, S oraz V obrazu oryginalnego wyrażonego w modelu HSV.

Obraz (e) jest obrazem składowej H obrazu oryginalnego (a) silnie skompresowanego algorytmem JPEG.

a b

c d

50 100 150 200 250

50

100

150

200

250

0 50 100 150 200 250 300

0

50

100

150

200

250

0 50 100 150 200 250 300

0

50

100

150

200

250

0 50 100 150 200 250 300

0

50

100

150

200

250

0 50 100 150 200 250 300

0

50

100

150

200

250

e

43

Obraz w składowych RGB…

Rys. Obraz RGB. Na następnym slajdzie przedstawiona jest wersja HSV obrazu.

ba

c d

44

…Model HSV (4) - ilustracja

Rys. (a) – obraz oryginalny oraz odpowiednio jego składowe H, S, V w modelu HSV.

Obraz (e) stanowi pokolorowaną wersję obrazu składowej H (obrazu (b)).

Obrazy (b) oraz (e) wskazują na wyraźne rozseparowanie obszarów o różnym odcieniu co podkreśla istnienie obiektów na jednolitym tle.

ba

dc e

45

Model HSV (5) – przykład segmentacji

ba

dc

Rys. Przykład segmentacji przez kwantyzację składowej H obrazu w modelu HSV.

(a) – obraz oryginalny; (b)-(d) obrazy powstałe po kwantyzacji odcienia do odpowiednio 6, 4 oraz 3 poziomów.

46

Model HSV (6)

Zalety modelu HSV:

Naturalność i zgodność ze sposobem opisu barw przez człowieka.

Separacja wielkości opisujących wrażenia chromatyczne od achromatycznych (HS oraz V). Dla przykładu, wykonanie operacji rozjaśnienia obrazu RGB wymaga modyfikacji wszystkich trzech składowych. Ta sama operacja w obrazie po konwersji do przestrzeni HSV wymaga modyfikacji tylko składowej V. Podobnie w przypadku modyfikacji nasycenia i odcienia.

Możliwość opisu barwy poprzez tylko dwie składowe: H oraz S. Ta cecha pozwala wykorzystywać model HSV w zastosowaniach do rozpoznawania obiektów na podstawie koloru (barwy) niezależnie od zmian jasności (podobnie jak model rgb).

Pozwala zdefiniować efektywne miary w przestrzeni obrazu. Przykładem miar może być liczba unikalnych kolorów mierzonych jako liczba odcieni, nasycenie pikseli (pixel saturation) jako stosunek liczby pikseli o maksymalnym nasyceniu do liczby pikseli nienasyconych oraz często stosowana miara odległości na histogramach HSV.

Wady modelu HSV:

Istnienie osobliwości w równaniach konwersji RGB do HSV: osobliwość H dla wszystkich barw achromatycznych oraz osobliwość S dla czerni (R=G=B=0),

Percepcyjna niejednorodność pomimo zorientowania modelu na intuicyjność.

Przykłady wykorzystania modelu HSV w przemyśle i technice:

identyfikacja obiektów kodowanych barwą,

sortowanie i klasyfikacja owoców i warzyw…

rozpoznawanie znaków drogowych.

47

Modele barw YUV oraz YIQ

Jednakowe traktowanie składowych R, G i B prowadzi do nieefektywnego opisu barwy. Z jednej strony ludzkie oko jest najbardziej wrażliwe na zieleń, mniej na czerwień oraz barwę niebieską. Z drugiej strony, bardziej czułe na zmiany luminancji niż chrominancji. Obie te cechy zostają wykorzystane w konstrukcji modeli YUV oraz YIQ.

Modele YUV (Europa) oraz YIQ (USA, Kanada, Japonia) niezależnie opisują składowe luminancji oraz chrominancji barwy: reprezentacja barwy w formacie: chrominancja–luminancja.

Modele YUV oraz YIQ wykorzystuje się do kodowania barw w transmisji sygnału TV (analogowy kompozyt) w systemach kodowania PAL, SECAM oraz NTSC.

Składowa Y obu modeli jest identyczna i odpowiada luminancji (luma). Składowa Y stanowi czarno-białą treść obrazu barwnego. Pozostałe składowe, UV oraz IQ są tzw. sygnałami różnicowymi (patrz równania) i niosą informacje o barwie (chrominancja).

Równania konwersji pomiędzy modelem RGB oraz YUV i YIQ są potaci:

Składowe modelu YUV w systemie PAL Składowe modelu YIQ

Modele YUV i YIQ wykorzystują własności ludzkiego widzenia (np. wagi składowych R, G, B w równaniu na luminancję Y odpowiadają wrażliwości oka na barwy podstawowe)

Składowe U, V oraz I, Q mogą przyjmować wartości ujemne.

48

Modele barw YUV oraz YIQ

0 50 100 150 200 250

0

50

100

150

200

250

300

350

0 50 100 150 200 250

0

50

100

150

200

250

300

350

0 50 100 150 200 250

0

50

100

150

200

250

300

350

Rys. Przykładowy obraz oraz jego składowe Y, I oraz Q.

49

Model YCbCr

Model YCbCr stanowi przesuniętą (offset) oraz przeskalowaną wersję systemu YUV.

Barwa reprezentowana jest przez składową luminancyjną (Y) oraz dwie składowe chrominancji Cb oraz Cr.

Model Ohta I1I2I3. Model w którym stopień korelacji pomiędzy składowymi jest bliski wartości osiąganej przez transformację Karhunena-Loeve’go.

Model PhotoYCC opracowany przez firmę Kodak w 1992 jako format archiwizacji obrazów na płytach Photo CD.

Model CMY(K).

Modele CIELUV oraz CIELAB.

Rys. Formaty modelu YCbCR. Format 4:4:4, 4:2:2 oraz 4:2:0.

YCbCr dopuszcza kilka formatów kodowania barwy różniących się częstością próbkowania składowych. Stosowanie różnych formatów jest oparte o własność ludzkiego oka polegającą na mniejsze wrażliwości na zmiany barwy niż zmiany luminancji. Format 4:4:4 odpowiada jednakowej częstości próbkowania składowych Y oraz Cb i Cr. Dla formatu 4:2:2 składowe Cb oraz Cr są w poziomie próbkowane z częstością dwukrotnie mniejszą niż składowa Y. W przypadku formatu 4:2:0 częstość próbkowania jest zmniejszana dwukrotnie zarówno w pionie, jak i w poziomie.