15

Click here to load reader

Compresia Imaginilor Binare

Embed Size (px)

DESCRIPTION

compresie

Citation preview

Compresia Imaginilor Binare

Compresia imaginilor binare

Rezumat

Aceasta lucrare isi propune a fi o introducere in metodele de compresie a imaginilor binare. De aceea tratarea subiectului nu se pretinde a fi exhaustiva. Se urmareste familiarizarea studentilor cu diversele procedee de codare exacta dezvoltate pina in prezent. Vor fi luate in considerare trei metode de codare exacta a imaginilor binare: (a) White Block Skipping (WBS), (b) Run Length Coding (RLC) si (c) Block Coding (BC). Prima metoda, WBS, va fi analizata din punctul de vedere al factorului de compresie si al modelului de Lant Markov asociat. A doua metoda, RLC, va cuprinde analiza atit a Codarii Lungimii Sirurilor Independent de Culoare cit si Codarea Lungimii Sirurilor Functie de Culoare. Si in cazul RLC va fi dezvoltat modelul Lantului Markov asociat. Pentru a treia metoda va fi calculat factorul de compresie maxim, corespunzator unei codari absolut optimale, iar apoi va fi implementat codul Huffman asociat statisticii preluate dintr-o imagine si din mai multe imagini. Cele trei metode studiate vor fi apoi comparate din punctul de vedere al factorului de compresie. In final se vor face considerente asupra altor metode de codare a imaginilor binare si asupra standardelor existente.

1. Introducere

A comprima un mesaj inseamna a pastra numai acei parametri care sint esentiali pentru destinatar. Ceilalti parametri nu se transmit, respectiv nu se stocheaza.

Sistemele de compresie pot fi grupate in doua categorii:

- sisteme care utilizeaza procedee care conserva entropia sursei, dar reduc redundanta ( codare exacta).

- sisteme care utilizeaza procedee care reduc entropia sursei ( o parte din informatie se pierde).

In cele ce urmeaza va fi tratata doar codarea exacta, deci la receptor, prin decodare va putea fi reprodusa exact sursa initiala.

Conform primei teoreme a lui Shanon [1], printr-o codare corespunzatoare, sursa de entropie H poate fi transformata intr-o sursa de entropie maxima HMAX ( sau aproape de maximum), respectiv se efectueaza o operatie de reducere a redundantei. Simbolurile sursei de entropie maxima, respectiv de redundanta zero, sint codate in cuvinte de lungime medie minima si in consecinta eficienta transmisiunii este maxima, iar stocarea lor se poate face in memorii de capacitate mai mica decit in absenta codarii.

Imaginile binare sint semnale discrete, bidimensionale, cu suport finit care pot lua doar doua valori ( negru = "0" si alb = "1" ). Aceste imagini se intilnesc in practica sub forma de pagini tiparite, scrisori, documente, ziare, harti geografice, harti meteorologice, fise cu amprente etc. Ca urmare transmisia si stocarea unor astfel de imagini este intilnita astazi in diverse domenii de activitate incepind cu uzuala, de acum, transmisie prin fax si terminind cu bazele de date de amprente utilizate in criminalistica. Datorinta volumului mare de memorie pe care il necesita o imagine binara ( un format standard de scrisoare de 8.5 x 11 inch esantionat la 200 puncte/inch contine aprox. 3,7 Mbiti ) apar avatajoase diversele metode de compresie, care reduc timpul de transmisie, largimea de banda necesara transminiei si necesarul de capacitate de stocare.

Compresia exacta este posibila datorita redundantei existente in imaginile binare. Astfel se constata existenta unei corelatii bibimensionale puternice intre elementele (pixeli) alaturate ale imaginii.Unele imagini binare sint caracterizate de zone intinse de nivel "1" (alb). De aici apare ideea utilizata de WBS [2], adica "sarirea blocurilor de alb".

Tehnica RLC [2], [3] exploateaza eficient corelatia orizontala a elemetelor imaginii prin gruparea lor in siruri negre si siruri albe, rezultind deci "codarea lungimii sirurilor".

Metoda BC [3] exploateaza in plus si corelatia verticala a elementelor imaginii prin gruparea acestora in blocuri, de unde denumirea de "codarea pe bloc".

Factorul de compresie obtinut printr-un procedeu de codare care reduce redundanta sursei este definit astfel:

Q = NO / NC

(1)

unde:

NO este numarul total de biti din imaginea originala

NC este numarul total de biti din aceasi imagine dupa codare.

Notind cu "b" rata de bit, adica numarul mediu de biti pe pixel dupa codare, atunci, factorul de compresie poate fi definit si in functie de rata de bit:

Q = 1 / b

(2)

Relatiile (1) si (2) aplicate asupra aceleiasi imagini si aceluiasi procedeu de codare, conduc la acelasi rezultat numeric.

Limita superioara a factorului de compresie este:

QMAX = 1 / H

(3)

unde H este entropia sursei de semnal, care poate fi evaluata apriori doar aproximativ, utilizind un model matematic al sursei.

In cele ce urmeaza imaginile vor fi presupuse de dimensiune n x n.

2. Tehnica White Block Skipping ( WBS )

a) Descriere

WBS este o metoda foarte simpla, recomandata pentru compresia imaginilor binare care contin mult alb.

Fiecare linie a imaginii este divizata in blocuri de N pixeli. Pentru blocurile formate numai din pixeli albi se atribuie cuvintul de cod "0". Petru toate celelalte blocuri se atribuie un cuvint de cod de lungime N+1 avind primul bit "1", urmat de N biti ce constituie pattern-ul digital al blocului respectiv.

Rata de bit pentru metoda WBS cu blocuri de dimensiune N este data de expresia:

b( N ) = ( 1 - PN + 1 / N ) biti / pixel

(4)

unde PN este probabilitatea ca un bloc cu N pixeli sa contina numai pixeli albi.

Raportul de compresie este dat de relatia (2).

b) Modelul Lantului Markov

Se presupune ca imaginea binara este generata de o sursa Markov de ordinul intii. Dupa cum se cunoaste un proces Markov de ordinul intii este in mod complet descris din punct de vedere statistic de densitatea de probabilitate de ordinul al doilea. Asadar culoarea (alb sau negru) a unui pixel din imagine va fi statistic dependenta numai de culoarea pixelului precedent din aceeasi linie. Procesul este prin urmare complet descris de probabilitatile conditionate:

P( B/W ) = q0,

P( W/W ) = 1-q0 ,

P( W/B ) = q1 ,

P( B/B ) = 1-q1,

(5)

unde P( B/W ) este probabilitatea ca pixelul k+1 sa fie negru atunci cind pixelul k este alb, etc.

Se demonstreaza ( vezi Anexa ) ca probabilitatea ca un bloc cu N pixeli sa contina numai pixeli albi este :

PN = [ q1 / (q0+q1)] (1-q0)N-1

(6)

Din relatiile (2), (4) si (6) rezulta ca factorul de compresie in cazul utilizarii metodei WBS, cu blocuri de dimensiune N, asupra unei imagini generate de o sursa Markov de ordinul intii, este:

Q( N, q0, q1 ) = 1 / { 1- [ q1 / (q0+q1)] (1-q0)N-1 + 1 / N }

(7)

Observatia 1:

Probabilitatile q0 si q1 se presupun cunoscute apriori. Ele se pot evalua din relatile:

q0 = Ntr W-B / NW

(8)

q1 = Ntr B-W / NB

(9)

unde:

Ntr W-B reprezinta numarul de tranzitii alb-negru din imagine;

Ntr B-Wreprezinta numarul de tranzitii negru-alb din imagine;

NW

reprezinta numarul de pixeli albi din imagine;

NB

reprezinta numarul de pixeli negri din imagine.

3. Tehnica Run Length Coding ( RLC )

Metoda RLC presupune codarea si transmiterea lungimii sirurilor de pixeli consecutivi de aceeasi culoare dintr-o linie de imagine. Atunci cind codarea lungimii sirurilor nu depinde de culoarea sirului curent ( alb sau negru) , alocind acelasi cod pentru siruri de lungime egala si culori diferite, metoda se numeste RLC Independent de Culoare. Cind insa, codul alocat depinde de culoarea sirului metoda se numeste RLC Functie de Culoare.

a) RLC Independent de Culoare ( RLC-IC )

Pentru aceasta metoda de codare factorul de compresie poate fi exprimat prin:

Q = / c

(10)unde:

(11)

reprezinta lungimea medie a sirurilor inainte de codare,

iar:

(12)

reprezinta lungimea medie a cuvintelor de cod.

Cu pi a fost notata probabilitatea de aparitie a unui sir de lungime "i" iar li reprezinta lungimea cuvintului de cod alocat petru sirul de lungime "i". Lungimea minima a unui sir este 1 iar lungimea maxima este limitata de dimensiunea unei linii, adica n.

Raportul de compresie maxim se obtine printr-o codare absolut optimala a lungimii sirurilor, caz in care lungimea medie a cuvintelor de cod devine egala cu entropia sirurilor H.

c SYMBOL 179 \f "Symbol" c min = H

(13)

Entropia sirurilor este:H

(14)

Asadar, limita superioara a factorului de compresie care poate fi obtinut prin RLC-IC este:

QMAX = ( ) / ()

(15)

In practica se utilizeaza o codare optimala de tip Huffman, care nu este insa absolut optimala. Din acest motiv raportul de compresie obtinut este mai mic decit QMAX.Observatia 2:

Pentru o imagine data, probabilitatea pi poate fi evaluata astfel:

pi = Ni / Nt,

(16)

unde:

Nireprezinta numarul de siruri avind lungimea "i";

Ntreprezinta numarul total de siruri din imagine.

Modalitatea de codare a lungimii sirurilor cea mai simpla (dar in acelasi timp cea mai putin eficienta) este codarea binara. Aceasta codare presupune ca fiecarui sir sa-i fie alocat cuvintul de cod format din reprezentarea in baza 2 a lungimii sirului. Este clar ca tote cuvintele de cod vor avea aceeasi lungime:

i =

c = log n ,

(17)

unde n reprezinta lungimea unei linii din imagine.

Utilizind codul binar, se poate deci defini o limita inferioara a raportului de compresie:

QMIN = (

) / log n

(18)

b) RLC Functie de Culoare ( RLC-FC )

Daca se utilizeaza coduri diferite pentru sirurile albe si respectiv pentru sirurile negre atunci:

c TITLE

SYMBOL 179 \f "Symbol"

WB min

(19)

unde:

WB min = HWB = PW ( HW /

W ) + PB ( HB /

B )

(20)

In relatia (20) s-au utilizat notatiile:

PWprobabilitatea ca un pixel sa fie alb;

PBprobabilitatea ca un pixel sa fie negru;

[biti / sir] = entropia sirurilor albe;

(21)

[biti / sir] = entropia sirurilor negre;

(22)

pWiprobabilitatea ca un sir alb sa fi de lungime i ;

pBiprobabilitatea ca un sir negru sa fi de lungime i ;

= lungimea medie a sirurilor albe (

);

(23)

= lungimea medie a sirurilor negre (

);

(24)

Din relatiile (10), (20), (21) si (22) rezulta ca limita superioara a factorului de compresie este:

QMAX = 1 / HWB

(25)

sau echivalent:

Q MAX = -1 / [ PW (

) / (

) + PB (

) / (

) ](26)

Observatia 3:

Pentru o imagine data probabilitatile pWi si pBi pot fi evaluate cu relatiile:

pWi = NWi / NtW ,

(27)

pBi = NBi / NtB ,

(28)

unde:

NWieste numarul de siruri albe avind lungimea "i" pixeli;

NBieste numarul de siruri negre avind lungimea "i" pixeli;

NtWeste numarul total de siruri albe;

NtBeste numarul total de siruri negre.

c) Modelul Lantului Markov

Considerind imaginea generata de o sursa Markov de ordinul intii, caracterizata de probabilitatile conditionate q0 si q1 ( relatia (5) ) , atunci, pentru probabilitatile pWi si pBi se obtin relatiile:

pWi = q0 ( 1-q0 ) i-1 , ( pentru i SYMBOL 179 \f "Symbol" 1 )

(29)

pBi = q1 ( 1-q1 ) i-1 , ( pentru i SYMBOL 179 \f "Symbol" 1 )

(30)

Limita superioara a factorului de compresie pentru metoda RLC-FC, in coditiile unei surse Markov de ordinul intii, rezulta egala cu ( relatiile (5), (26), (29) si (30)) :

QMAX= -1/{ q1/(q0+q1)[ q0 logq0 + (1-q0) log(1-q0)] + q0/(q0+q1)[ q1 logq1 + (1-q1) log(1-q1)] }

(31)

Pentru metoda RLC-IC, se considera un lant Markov simplificat, presupunind ca numarul de siruri albe si respectiv negre este egal. ( Presupunerea facuta este foarte aproape de adevar. Deoarece sirurile albe si negre se succed in mod alternat, diferenta intre numarul de siruri albe si respectiv negre este de SYMBOL 177 \f "Symbol"1 ). Deci:

(32)

Atunci lungimea medie a sirurilor este:

= (

W+

B ) / 2

(33)

Notind:

q = 2q0q1 / ( q0+ q1 ) ,

(34)

si introducind in (15) se obtine expresia limitei superioare a factorului de compresie in cazul modelului Markov pentru metoda RLC-IC:

QMAX = -1 / [ q logq + (1-q) log( 1-q) ]

(35)

4. Tehnica Block Coding ( BC )

Aceasta metoda presupune impartirea imaginii in blocuri bidimensionale de m x k pixeli. Deoarece fiecare pixel din cei mk pixeli ai unui bloc poate sa ia doua valori, se obtin N = 2mk combinatii posibile, deci N tipuri de blocuri. Deci imaginea poate fi considerata ca fiind generata de o sursa cu N = 2mk simboluri. Deoarece nu toate tipurile de blocuri sint egal probabile se justifica implementarea unui cod Huffman adaptat statistic probabilitatilor de aparitie ale celor N simboluri ale sursei. Constructia si utilizarea codului Huffman este dificil de utilizat in practica pentru dimensiuni ale blocurilor mai mari decit 3x3 ( tabela de cod de dimensiune 29 = 512 ).

Limita superioara a raportului de compresie care poate fi atins prin metoda BC este:

QMAX = mk / H ,

(36)

unde H reprezinta entropia blocurilor:

(37)

iar pi reprezinta probabilitatea de aparitie a blocului "i".

Prin impartirea imaginii in blocuri, metoda BC exploateaza atit corelatia orizontala cit si corelatia verticala a pixelilor, ceea ce determina, pentru anumite imagini, factori de compresie mai mari in comparatie cu metodele precedente.

Observatia 4:

Utilizind pentru metoda BC o codare sub-optimala se poate obtine o extensie la doua dimensiuni a metodei WBS. Astfel blocurilor formate numai din pixeli albi li se atribuie cuvintul de cod "0". Celorlalte blocuri li se aloca un cuvint de cod de lungime mk+1, care are primul bit "1", urmat de mk biti reprezentind pattern-ul digital al blocului respectiv. La fel ca si metoda WBS, acest procedeu este eficient in cazul imaginilor cu mult alb.

5. Alte metode de codare

In practica se utilizeaza si alte metode de codare, a caror implementare este mai complexa, dar care determina factori de compresie mai ridicati. Ca metode exacte au fost dezvoltate Predictive Coding ( PC ) si Line-to-Line Run-Length Difference Coding ( LLRLDC). Metoda PC se bazeaza pe calculul unor predictori si transmiterea sau stocarea doar a erorilor de predictie. Metoda LLRLDC exploateaza corelatia existenta intre lungimile sirurilor adiacente din doua linii succesive. Astfel in loc sa se codeze lungimile sirurilor de pixeli de aceeasi culoare, se codeaza diferentele intre lungimile a doua siruri adiacente.

Metodele prezentate pina acum, permit, asa cum s-a subliniat, in conditiile unei transmisii lipsite de erori, reproducerea exacta la receptie a imaginii binare originale. Exista insa metode care se bazeaza pe o codare aproximativa. Se obtine astfel o imbunatatire a factorului de compresie fara o degradare semnificativa a calitatii imaginii reproduse. Pentru detalii se recomanda consultarea lucrarii [3].

6. Standardizare

Comparatia intre performantele diverselor metode de codare se face conform normelor CCITT (Comit Consultatif International Tlgraphique et Tlphonique). Sistemele de comunicatie prin Fax respecta de asemenea recomandarile CCITT, astfel incit comunicatia intre doua masini Fax realizate de doi producatori diferiti sa fie posibila.

Standardul CCITT care cuprinde conversia digitala si codarea documentelor Fax pentru transmisie este Standardul Grup 3 ( sau G3 ). Standardul G3 contine doua tehnici de codare: prima exploateaza pentru codare corelatia orizontala din imaginea binara, iar a doua exploateaza corelatia bidimensionala. Deoarece tehnicile din G3 sint utilizare in transmisia datelor prin reteaua telefonica, deci in conditiile unei transmisii cu erori, schemele de codare prevad introducerea de informatie redundanta in scopul protectiei la erori.

Documentele CCITT au densitatea de 3.86 pixeli / mm sau 7.7 pixeli / mm, dimensiunea standard A4 ( 210 x 298 mm ) rezultind astfel 1728 x 2376 pixeli / document.

Pentru comparatie, se prezinta mai jos performantelor celor doua metode de codare CCITT (schema unidimensionala si shema bidimesionala) aplicate asupra celor 8 documente CCITT:

Document

CCITT

Nr.Lungimea

medie a

sirurilor

albe Lungimea

medie a

sirurilor

negre Entropia

sirurilor

albe Entropia

sirurilor

negre QMAX

Metoda

CCITT-1 QREAL Metoda

CCITT-1 QREAL Metoda

CCITT-2

1 134.6 6.790 5.230 3.592 16.02 15.16 21.6

2 167.9 14.02 5.989 4.457 17.41 16.67 32.4

3 71.50 8.468 5.189 3.587 9.112 8.350 14.6

4 36.38 5.673 4.574 3.126 5.461 4.911 6.5

5 66.41 6.966 5.280 3.339 8.513 7.927 13.2

6 90.65 8.001 5.063 3.651 11.32 10.78 23.2

7 39.07 4.442 5.320 3.068 5.188 4.990 6.5

8 64.30 60.56 4.427 5.310 11.52 8.665 20.7

Pentru detalii se recomanda de asemenea lucrarea [3].

7. Desfasurarea lucrarii

a) Descrierea Suportului Software

Analiza tehnicilor de compresie WBS, RLC-IC, RLC-FC si BC se face utilizind interfata "TurIf" care permite manipularea simultana a mai multor imagini pe ecranul display-ului. Se utilizeaza imagini binare de dimensiune 256 x 256 pixeli, obtinute sau prin preluare cu camera TV, esantionare si cuantizare sau prin editare.

Programul principal se lanseaza cu comanda "t".

Selectarea unui meniu se face prin utilizarea mouse-ului sau prin actionarea simultana a tastei "Alt" si a tastei corespunzatoare literei subliniate din numele meniului dorit.

Selectarea unei optiuni sau a unui submeniu se face prin utilizarea mouse-ului sau prin actionarea tastei corespunzatoare literei subliniate din numele optiunii sau din numele submeniului.

Pentru incarcarea unei imagini se utilizeaza optiunea "Load" din meniul "Image". In fereastra de dialog "Load an Image File" care apare se selecteaza ( cu mouse-ul sau cu tastele "Tab", "Enter", " SYMBOL 221 \f "Symbol" " si " SYMBOL 223 \f "Symbol" " ) numele imaginii a carei incarcare se doreste. In urmatoarea fereastra de dialog "Set File Load Options" se selecteaza tipul de imagine "BIN 256" ( cu mouse-ul sau cu tastele "Tab", "Blank" si "Enter").

Imaginea activa ( cea asupra careia se fac prelucrarile ) are numele scris pe fond alb.

Rezultatele aplicarii metodei WBS asupra imaginii active se obtin prin selectarea meniului "Comprs", a submeniului "Binary" si a optiunii "WBS".

Rezultatele aplicarii metodei RLC-IC asupra imaginii active se obtin prin selectarea meniului "Comprs", a submeniului "Binary" si a optiunii "RLC-I".

Rezultatele aplicarii metodei RLC-FC asupra imaginii active se obtin prin selectarea meniului "Comprs", a submeniului "Binary" si a optiunii "RLC-C".

Metoda BC se gaseste in submeniul "Block" din meniul "Algor". Sint implementate urmatoarele optiuni:

"Block Model" - Calculeaza factorul maxim de compresie prin metoda BC ;

"Huffman Code"- Calculeaza factorul real de compresie si implementeaza codul Huffman, cosiderind ca imaginea este generata de o sursa cu 29 = 512 simboluri ( tipuri de blocuri );

"Make Prob"- Actualizeaza un fisier ce contine probabilitatile de aparitie a tipurilor de blocuri din mai multe imagini cu statistica imaginii active de pe ecran.

"Gen Huffman" - Calculeaza factorul real de compresie si implementeaza codul Huffman pe baza fiserului ce contine probabilitatile de aparitie a blocurilor din mai multe imagini;

"Del Prob" - Sterge fisierul de probabilitati.

Observatia 5:

Justificarea utilizarii ultimelor trei optiuni este urmatoarea:

Asa cum s-a afirmat mai sus imaginea binara impartita in blocuri este considerata ca fiind generata de o sursa care are 512 simboluri. Daca sursa ar fi stationara atunci in fiacare imagine generata de sursa, probabilitatea de aparitie a unui anumit bloc ar fi aceeasi ( nu depinde de realizarea particulara). Insa imaginile binare (si imaginile in general) sint recunoscute ca semnale nestationare. Atunci, codul Huffman implementat pe baza probabilitatii de aparitie a blocurilor dintr-o imagine este un cod optimal doar pentru imaginea respectiva, nu si pentru altele. De aici ar rezulta ca procesul de codare ar trebui sa implementeze un cod Huffman pentru fiecare imagine, a carui tabela sa fie transmisa la receptie. Insa timpul de generare a codului si supraincarcarea provenita din dimensiunea mare a tabelei de cod ( 512 intrari) care se transmite, fac ca acest procedeu sa fie complet ineficient. De aceea se prefera generarea unui cod Huffman general pe baza statisticilor culese de la mai multe tipuri de imagini. In acest fel codul obtinut, desi nu este optimal este totusi adaptat statistic pentru mai multe tipuri de imagini.

b) Obtinerea rezultatelor experimentale

Se utilizeaza optiunile specificate la punctul 7.a) pentru a aplica metodele de codare WBS, RLC-IC, RLC-FC si BC pentru imaginile de test care se gasesc in directorul curent.

Pentru metodele WBS, RLC-IC si RLC-FC se vor trasa graficele corespunzatoare factorilor de compresie maximi pentru diferite imagini de test.

Pentru metoda BC se va determina factorul de compresie maxim si factorul de compresie real pentru diferite imagini de test si se vor trasa graficele corespunzatoare. Apoi se vor colecta statisticile imaginilor de test cu optiunea "Make Prob" aplicata asupra fiecarei imagini si se va determina factorul de compresie real prin utilizarea codului Huffman general.

Se vor justifica rezultatele.

8. Intrebari si teme

8.1. Justificati relatia (4) de la metoda WBS.

8.2. Explicati relatia (20) ( expresia entropiei sirurilor albe si negre de la metoda RLC-FC).

8.3. Demonstrati relatiile (29) si (30) de la metoda RLC-FC.

8.4. Demonstrati relatia (31) de la metoda RLC-FC.

Indicatie: Se are in vedere faptul ca

si

.

8.5. Demonstrati relatia (35) de la metoda RLC-IC.

8.6. Justificati obtinerea unor factori de compresie mai mici in cazul imaginilor de test utilizate in laborator, comparativ cu factorii de compresie prezentati la punctul 6 ( CCITT ).

8.7. Justificati obtinerea unor factori de compresie mai mici in cazul imaginilor de test care au fost preluate in conditii de zgomot.

8.8. Considerind imaginea binara un tablou de dimensiune 256 x 256 scrieti o rutina de calcul a entropiei blocurilor de dimensiune 3 x 3 ( relatia (37)).

9. Bibliografie

[1] Al. Spataru, Teoria Transmisiunii Informatiei, Bucuresti,1983.

[2] V. E. Neagoe et al., Predictive and Ordering Techniques Cascaded, Buletinul IPB.

[3] A. N. Netravali si B. G. Haskell, Digital Pictures, Plenum Press, 1988.

10. Anexa - Demonstratia relatiei (6) de la metoda WBS

Notatiile facute sint urmatoarele:

P( B/W ) = q0,

P( W/W ) = 1-q0 ,

P( W/B ) = q1 ,

P( B/B ) = 1-q1,

unde P( B/W ) este probabilitatea ca pixelul k+1 sa fie negru atunci cind pixelul k este alb, etc.

Probabilitatea ca un bloc de lungime N sa contina numai pixeli albi este:

P = P( W ) [P( W/W)]N-1 = P( W ) ( 1-q0 )N-1,

(1A)

deci probabilitatea de aparitie a unui pixel alb urmat de alti N-1 pixeli albi.

Pe de alta parte probabilitatea de aparitie a unui pixel alb si a unui pixel negru este:

P( W,B ) = P( W ) P( B/W ) = P( B )P( W/B )

(2A)

sau:

P( W ) q0 = P( B ) q1

(3A)

In plus :P( W ) + P( B ) = 1

(4A)

Rezolvind sistemul format din ecuatiile (3A) si (4A) rezulta:

P( W ) = q1 / ( q0 + q1 )

(5A)

P( B ) = q0 / ( q0 + q1 )

(6A)

Introducind (5A) in (1A) se obtine relatia (6).