65
Univerzitet u Ni ˇ su Prirodno - matemati ˇ cki fakultet Departman za matematiku Generalisani inverzi matrica Master rad Student: Marko - Diki´ c Mentor: Prof. dr Dragana Cvetkovi´ c - Ili´ c Niˇ s, 2013.

Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Embed Size (px)

Citation preview

Page 1: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Univerzitet u Nisu

Prirodno - matematicki fakultet

Departman za matematiku

Generalisani inverzi matricaMaster rad

Student:Marko -Dikic

Mentor:Prof. dr Dragana Cvetkovic - Ilic

Nis, 2013.

Page 2: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Sadrzaj

1 Uvod 2

2 Osnovni pojmovi linearne algebre i teorije operatora 42.1 Linearni operatori na normiranim prostorima . . . . . . . . . . . . . . . . 42.2 Dekompozicije prostora . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.3 Konacno-dimenzionalni vektorski prostori . . . . . . . . . . . . . . . . . . 82.4 Norme na prostoru matrica. Matricni eksponent . . . . . . . . . . . . . . 12

3 Penroseove jednacine i generalisani inverzi matrice 143.1 Penroseove jednacine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.2 Osobine {1} i {2}-inverza . . . . . . . . . . . . . . . . . . . . . . . . . . 153.3 Konstrukcija {1, 2, 3} i {1, 2, 4}-inverza . . . . . . . . . . . . . . . . . . . 193.4 Razne konstrukcije Moore-Penroseovog inverza . . . . . . . . . . . . . . . 203.5 Osobine Moore-Penroseovog inverza . . . . . . . . . . . . . . . . . . . . . 223.6 Neprekidnost Moore-Penroseovog inverza . . . . . . . . . . . . . . . . . . 24

4 Drazinov inverz matrice 274.1 Grupni inverz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274.2 Definicija Drazinovog inverza . . . . . . . . . . . . . . . . . . . . . . . . 314.3 Osobine Drazinovog inverza . . . . . . . . . . . . . . . . . . . . . . . . . 344.4 Osobine spektra grupnog i Drazinovog inverza . . . . . . . . . . . . . . . 394.5 Neprekidnost Drazinovog inverza . . . . . . . . . . . . . . . . . . . . . . 41

5 Primene generalisanih inverza matrice 445.1 Matricne jednacine i generalisani inverzi . . . . . . . . . . . . . . . . . . 445.2 Optimalno resavanje sistema linearnih jednacina . . . . . . . . . . . . . . 495.3 Diferencijalne jednacine i generalisani inverzi . . . . . . . . . . . . . . . . 52

6 Zakljucak 62

Literatura 63

Biografija 64

1

Page 3: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Glava 1

Uvod

U mnogim situacijama pri radu sa matricama, pogodno je da matrice kojima se bavimobudu invertibilne. Recimo, resenje matricne jednacine AX = B, uz uslov da je A inver-tibilna matrica, nalazimo gotovo trivijalno. Ipak, u opstem slucaju, matrice ne morajubiti invertibilne, pa cak ni kvadratne, sto znatno komplikuje probleme koje resavamo.Desava se da pri koriscenju inverznih matrica, zapravo koristimo samo neke od osobinakoje inverzna matrica poseduje. Prirodno je onda zapitati se, da li i onim matricamakoje nisu invertibilne, mozemo pridruziti matrice koje imaju neke od osobina inverznihmatrica. Te osobine se mozda mogu izabrati tako da nam nije potrebna pretpostavkao invertibilnosti matrice da bi resili neki problem. Drugim recima, mozda budu do-voljne matrice koje nisu zaista inverzi, vec samo dovoljno ”lice” na njih. Ovim pitanjembavi se teorija generalisanih inverza matrice. Naime, pod generalisanim inverzom nekematrice podrazumevamo matrice cije osobine podsecaju na osobine inverzne matrice.Uobicajeno je da se u slucaju invertibilne matrice, njeni generalisani inverzi zapravopoklapaju sa pravim inverzom. U zavisnosti od ciljanih osobina, dobijamo razlicitegeneralisane inverze matrica, a dva najpoznatija i najkoriscenija su Moore-Penroseov iDrazinov generalisani inverz matrice.

Razvitak teorije generalisanih inverza pocinje s pocetkom dvadesetog veka. Maloneuobicajeno za matematicku teoriju, generalisani inverzi se najpre javljaju u vezi saopstijim pojmovima od pojma matrice. Naime, 1903. godine, Fredholm u svom radupominje ”pseudoinverz” operatora na prostoru funkcija. Dvadesetak godina nakon tograda, Moore objavljuje rad u vezi sa generalisanim inverzima matrica, ali ovaj rad ostajenezapazen. Najzad, 1955. godine, Penrose objavljuje rad u kojem isti onaj inverz kojije definisao Moore, definise na drugaciji nacin. Nakon pruzanja ovakvog pogleda nageneralisane inverze, ova teorija krece da se siri velikom brzinom. Od tada je objavljenovise hiljada radova na ovu temu. U ovom radu, dajemo samo uvod u teoriju generalisanihinverza matrica i opisujemo samo najpoznatije generalisane inverze.

Rad se sastoji iz sest glava, od kojih su centralne cetiri glave podeljene na poglavlja.

U Glavi 2 dati su osnovni pojmovi i tvrdenja iz linearne algebre i teorije operatora.Na cinjenice navedene u ovoj glavi, pozivacemo se tokom celog rada.

U Glavi 3 razmatramo generalisane inverze matrica koji su odredeni kao resenjaPenroseovih jednacina. Opisujemo klase generalisanih inverza, od sirih ka uzim, sa

2

Page 4: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

3

Moore-Penroseovim inverzom na kraju. Dajemo nekoliko razlicitih nacina za konstruk-ciju Moore-Penroseovog inverza, a zatim opisujemo osobine tog inverza. Jedna od teo-rema odnosi se na konstrukciju ovog inverza ako matricu interpretiramo kao operator,sto se moze primeniti i na uopstenim Hilbertovim prostorima, pod izvesnim uslovima.Navodimo i primere koji svedoce o osobinama koje ovaj inverz ne poseduje. U posled-njem poglavlju dajemo dokaz teoreme o potrebnim i dovoljnim uslovima da niz matrica{A†n} konvergira ka A†, pod pretpostavkom da niz matrica {An} konvergira ka A.

U Glavi 4 bavimo se samo kvadratnim matricama i opisujemo grupni i Drazinov inverzmatrice, kao i njihove osobine. Dokazujemo teoremu o indeks 1-nilpotentnoj dekompozi-ciji matrice, i ponovo dajemo teoremu o konstrukciji Drazinovog inverza za operator nakonacno-dimenzionalnim vektorskim prostorima, koja se moze uopstiti i na proizvoljneBanachove prostore pod izvesnim uslovima za operator. Zatim, dokazujemo teoreme ospektru grupnog i Drazinovog inverza i na kraju, bavimo se pitanjem o neprekidnostiDrazinovog inverza.

U Glavi 5 pokazujemo kako se pomocu generalisanih inverza matrica koji su opi-sivani u Glavi 3 resava matricna jednacina AXB = D i sistem matricnih jednacinaAX = B,XD = E. Pomocu ovih resenja potpuno opisujemo neke klase generalisanih in-verza. Zatim, pokazujemo kako se pomocu generalisanih inverza nalaze pribrizna resenjasistema linearnih jednacina, sto ce predstavljati i karakterizaciju nekih klasa inverza. Nakraju, pomocu Drazinovog inverza dajemo eksplicitnu formulu za resenja nekih sistemalinearnih diferencijalnih jednacina prvog reda.

U Glavi 6 dajemo sazetak rezultata iz rada i komentare o daljem izucavanju teorijegeneralisanih inverza.

U okviru jedne glave, definicije, teoreme i jednacine numerisane su prirodnim bro-jevima, redom, bez prefiksa koji oznacava redni broj glave i poglavlja. Pri pozivanjuna neku teoremu ili jednacinu, navodimo samo njen redni broj ukoliko je referenca uistoj glavi kao i teorema, odnosno jednacina. U suprotnom, navodimo i redni broj glaveiz koje je teorema na koju se pozivamo. Primera radi, ako u okviru Glave 5 koristimoTeoremu 18 iz Glave 4, onda je navodimo kao Teorema 4.18. Ukoliko se pozivamo naTeoremu 18 u okviru Glave 4 iz koje je ova teorema, navodimo je kao Teorema 18.

Ovom prilikom se zahvaljujem svom mentoru, prof. dr Dragani Cvetkovic - Ilic, nasmernicama i strpljenju. Retko se desava da neki rad bude bez gresaka, uprkos velikomtrudu autora. Mogucnost i nacin obrade ove teme zasluga su mentora, a sve greske uradu su iskljucivo moja zasluga.

Page 5: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Glava 2

Osnovni pojmovi linearne algebre iteorije operatora

U ovoj glavi je dat pregled elementarnih svojstava matrica i linearnih operatora, kaoi oznake (najcesce standardne) koje cemo koristiti. Teoreme su date bez dokaza, kojise mogu naci u [15], [10], [7] i [13], ili jednostavno izvesti iz navedenih cinjenica. Svivektoriski prostori u ovom radu su nad poljem skalara C i ovo je jedino mesto u radugde ce to biti istaknuto. Iako ce u ovom radu biti prezentovani samo generalisani inverzimatrica, prvo dajemo osobine linearnih operatora na normiranim, Banachovim i Hilber-tovim prostorima, kao i osobine samih Banachovih i Hilbertovih prostora. Ove osobinese prenose i na matrice i vektorski prostor Cn. Zatim dajemo osobine svojstvene matri-cama, tj. operatorima na konacno-dimenzionalnim vektorskim prostorima. Na taj nacincemo lakse uociti koje su to osobine matrica, koje u opstem slucaju nemaju operatori navektorskim prostorima, potrebne za konstrukciju generalisanih inverza. Takode, laksecemo uociti pod kojim uslovima mozemo da konstruisemo ovakve generalisane inverze iu slucaju proizvoljnih operatora.

2.1 Linearni operatori na normiranim prostorima

Neka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X uprostor Y oznacavacemo sa L(X, Y ). Linearna preslikavanja drugacije nazivamo linearnioperatori, ili krace, operatori. Za operator T ∈ L(X, Y ) sliku operatora, tj. skup T (X)obelezavacemo sa R(T ), a jezgro operatora, odnosno skup T←({0}) sa N(T ). SkupL(X, Y ), na prirodan nacin, poprima strukturu vektorskog prostora. Identicki operatorcemo obelezavati sa I, a nula operator sa O.

Kod razlicitih normiranih vektorskih prostora, koristimo istu oznaku za normu uvekkada ne postoji mogucnost zabune.

Definicija 1 Neka su X i Y normirani prostori. Linearni operator T ∈ L(X, Y ) jeogranicen ako postoji realan broj M ≥ 0 takav da je

‖Tx‖ ≤M‖x‖, za svako x ∈ X.

4

Page 6: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

5

Definicija 2 Neka su X i Y normirani prostori i T ∈ L(X, Y ) ogranicen operator.Norma operatora T se oznacava sa ‖T‖ i definise

‖T‖ = supx 6=0

‖Tx‖‖x‖

. (1)

Teorema 1 Neka su X i Y normirani vektorski prostori i T ∈ L(X, Y ). Tada je

‖T‖ = sup‖x‖≤1

‖Tx‖ = sup‖x‖=1

‖Tx‖.

Neka je B(X, Y ) skup svih ogranicenih operatora izX u Y . Ako jeX = Y koristicemooznaku B(X). Zbir dva ogranicena operatora, kao i skalarni umnozak ogranicenog op-eratora, jesu ograniceni operatori, pa B(X, Y ), na prirodan nacin, dobija strukturu vek-torskog prostora. Stavise, vazi naredna teorema.

Teorema 2 Neka su X i Y normirani prostori. Tada je B(X, Y ) normirani prostor saoperatorskom normom (1).

Ako je X konacno-dimenzionalan vektorski prostor, tada je B(X, Y ) = L(X, Y ).Naredna osobina naziva se jos i submultiplikativnost operatorske norme.

Teorema 3 Neka su X, Y i Z normirani prostori nad poljem kompleksnih brojeva iT ∈ B(X, Y ), S ∈ B(Y, Z). Tada je ST ∈ B(X,Z) i ‖ST‖ ≤ ‖S‖‖T‖.

Prirodna metrika na normiranom prostoru X je odredena sa d(x, y) = ‖x−y‖, x, y ∈X. Normirani prostorX je Banachov prostor ako je (X, d) kompletan metricki prostor.Svaki konacno-dimenizonalni podprostor normiranog prostora je Banachov. Specijalnoje i svaki konacno-dimenzionalni prostor Banachov.

Ukoliko je X unitaran prostor (snabdeven skalarnim proizvodom 〈·〉 : X ×X 7→ C),mozemo definisati normu na X:

‖x‖ = 〈x, x〉1/2, x ∈ X.

Unitaran prostor X je Hilbertov prostor ako je Banachov u odnosu na normu defin-isanu skalarnim proizvodom.

Teorema 4 Neka su Xi Y Hilbertovi prostori i T ∈ B(X, Y ). Postoji jedinstven operatorS ∈ B(X, Y ) takav da je za svako x ∈ X i svako y ∈ Y

〈Tx, y〉 = 〈x, Sy〉.

Operator ciju egzistenciju i jedinstvenost garantuje prethodna teorema se nazivaHilbert adjungovan operator operatoru T i obelezava sa T ∗. Navescemo neka svo-jstva Hilbert adjungovanog operatora.

Teorema 5 Neka su X, Y i Z Hilbertovi prostori, S, T ∈ B(X, Y ), V ∈ B(Y, Z) i λ ∈ C.Tada je:

Page 7: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

6

(i) (S + T )∗ = S∗ + T ∗;

(ii) (λT )∗ = λT ∗;

(iii) (T ∗)∗ = T ;

(iv) ‖T‖ = ‖T ∗‖ i ‖T ∗T‖ = ‖TT ∗‖ = ‖T‖2;

(v) N(T ∗T ) = N(T ) i N(TT ∗) = N(T ∗);

(vi) (V S)∗ = S∗V ∗.

Teorema 6 Neka je T ∈ B(X, Y ), X i Y Hilbertovi prostori. Postoji T−1 ∈ B(Y,X)ako i samo ako postoji (T ∗)−1 ∈ B(X, Y ) i vazi (T ∗)−1 = (T−1)∗.

Definicija 3 Neka je X Hilbertov prostor i T ∈ B(X). Operator T je:

(i) samokonjugovan (ermitski) operator ako je T = T ∗;

(ii) normalan operator ako je TT ∗ = T ∗T ;

(ii) unitaran operator ako je TT ∗ = T ∗T = I.

2.2 Dekompozicije prostora

Ako su M i N podprostori vektorskog prostora X, kazemo da su M i N algebarskikomplementi ako je X = M ⊕N i ovakvo predstavljanje prostora X nazivamo dekom-pozicija prostora. Ukoliko je X normiran prostor, a podprostori M i N zatvoreni alge-barski komplementi, onda kazemo da su M i N topoloski komplementi. PodprostorM normiranog prostora je komplementaran ako postoji neki njegov topoloski komple-ment (dakle, samo zatvoreni podprostori mogu biti komplementarni).

Element P ∈ L(X) za koji vazi P 2 = P nazivamo idempotent. Ukoliko je, poredtoga, P i ogranicen, tj. ukoliko je P ∈ B(X), tada P nazivamo projektor. Ako jeP idempotent, tada je i I − P idempotent i R(P ) = N(I − P ). Za svaki idempotentvazi da su R(P ) i N(P ) algebarski komplementi, ali i obrnuto, ako su M i N algebarskikomplementi, tada postoji idempotent P tako da je R(P ) = M i N(P ) = N . Zaprojektore vazi i da su R(P ) i N(P ) topoloski komplementi. Vezu izmedu projektora ikomplementarnih podprostora Banachovog prostora daje naredna teorema.

Teorema 7 Neka je M zatvoren podprostor Banachovog prostora X. Tada je M kom-plementaran ako i samo ako postoji projektor P takav da je R(P ) = M .

Zanimljiva je dekompozicija Banachovog prostora kada je jedan podprostor slikaogranicenog operatora. Naime, vazi naredna teorema.

Teorema 8 Neka su X i Y Banachovi prostori i A ∈ B(X, Y ). Ako postoji zatvorenpodprostor Z prostora Y tako da je R(A)⊕ Z = Y , tada je i R(A) zatvoren.

Page 8: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

7

Ako je M podskup Hilbertovog prostora X, ortogonalni komplement skupa M jeskup M⊥ odreden sa

M⊥ = {x ∈ X : 〈x, y〉 = 0 za sve y ∈M}.

Navedimo nekoliko bitnih teorema u vezi sa ortogonalnim komplementom podprostora.

Teorema 9 Neka su X i Y Hilbertovi prostori i T ∈ B(X, Y ). Tada vazi:

N(T ) = R(T ∗)⊥,

N(T ∗) = R(T )⊥,

R(T ) = N(T ∗)⊥,

R(T ∗) = N(T )⊥,

X = N(T )⊕R(T ∗),

Y = N(T ∗)⊕R(T ).

Teorema 10 Ako je X Hilbertov prostor i M zatvoren podprostor od X, tada su M iM⊥ topoloski komplementi.

Posledica 1 Svaki zatvoren podprostor Hilbertovog prostora je komplementaran.

Posledica 2 Za svaki zatvoren podprostor M Hilbertovog prostora X postoji projektorP tako da je R(P ) = M .

Projektor P kod koga je R(P ) = N(P )⊥ nazivamo jos i ortogonalni projektor.Bice nam od koristi naredna teorema.

Teorema 11 Neka je X Hilbertov prostor i P ∈ B(X). Ako je P projektor, tada je Portogonalni projektor ako i samo ako je P ermitski operator.

Za linearan operator T na vektorskom prostoru X, vazi N(I) = N(T 0) ⊂ N(T 1) ⊂N(T 2) ⊂ ... . kao i R(I) = R(T 0) ⊃ R(T 1) ⊃ R(T 2) ⊃ ... . Uspon operatora T ,koji obelezavamo sa asc(T ), definise se kao nenegativan ceo broj k tako da je N(T k) =N(T k+1); ukoliko takav broj ne postoji, kazemo da je asc(T ) = ∞. Analogno, padoperatora T , koji obelezavamo sa dsc(T ), definise se kao najmanji nenegativan ceo brojk takav da je R(T k) = R(T k+1) ili kao∞ ukoliko takav k ne postoji. Kazemo da dekom-pozicija prostora T = M ⊕ N potpuno redukuje operator T ako su M i N invarijantniza operator T , tj. ako vazi T (M) ⊂M i T (N) ⊂ N . Vazi naredna teorema.

Teorema 12 Neka je T operator na vektorskom prostoru X. Ako je asc(T ) < ∞ idsc(T ) <∞ tada je asc(T ) = dsc(T ) = p i vazi

X = R(T p)⊕N(T p),

pri cemu ova dekompozicija potpuno redukuje operator T i T1 = T |R(T p) je bijekcija, dokje T2 = T |N(T p) nilpotentan.

Page 9: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

8

Ukoliko vaze uslovi upravo navedene teoreme, a pored toga je X Banachov prostori T ogranicen operator, na osnovu Teoreme 8, tada je i R(T p) zatvoren podprostor odX, dakle sam za sebe je Banachov prostor, pa je T1 ogranicen operator na Banachovomprostoru. Zbog toga je i T−11 ogranicen, o cemu svedoci poznato tvrdenje o ogranicenominverzu.

Teorema 13 Ako su X i Y Banachovi prostori i T ∈ B(X, Y ) bijekcija, tada je T−1 ∈B(Y,X).

2.3 Konacno-dimenzionalni vektorski prostori

Kao sto znamo, svi konacno-dimenzionalni vektorski prostori iste dimenzije nad istimpoljem su medusobno izomorfni. Zbog toga cemo posmatrati samo prostore Cn. Na

prostoru Cn definisemo standardni skalarni proizvod sa 〈x, y〉 =n∑i=1

xiyi, gde je x =

(x1, x2, ..., xn) i y = (y1, y2, ..., yn), koji indukuje standardnu (euklidsku) normu ‖x‖ =(n∑i=1

|xi|2)1/2

. Svaki unitaran prostor dimenzije n izometrican je sa Cn. Prostor Cn je

Hilbertov prostor, pa se sve teoreme u vezi sa operatrima na normiranim, Banachovim iHilbertovim prostorima prenose i na operatore na prostorima Cn.

Svaki konacno-dimenzionalan podprostor normiranog prostora je zatvoren. Dakle,svaki podprostor prostora Cn, buduci konacno-dimenzionalan, zatvoren je, sto utice naocigledno poostravanje tvrdenja istaknutih u prethodnom delu.

Skup svih kompleksnih matrica dimenzije m× n obelezavamo sa Cm×n. Ukoliko je uprostoru Cn fiksirana baza e : {e1, e2, ..., en}, a u prostoru Cm baza e′ : {e′1, e′2, ..., e′m},tada se svakom linearnom operatoru A ∈ L(Cn,Cm) pridruzuje matrica A = [aij]m×ntako da je aij koeficijent pri baznom vektoru e′i u razvoju vektora A(ej) u bazi e′. Ma-trica A naziva se matrica linearnog operatora A u odnosu na baze e i e′. Nadalje,podrazumevacemo da su u prostorima Ck uvek fiksirane standardne baze i na taj nacinidentifikovacemo matrice sa linearnim operatorima cije su to matricne reprezentacije uodnosu na standardnu bazu. Ako je A matrica linearnog operatora A ∈ L(Cn,Cm) uodnosu na standardne baze, tada za svaki x ∈ Cn vazi A(x) = Ax. Necemo koristitirazlicite oznake za matricu A ∈ Cm×n i linearni operator A ∈ L(Cn,Cm) cija je to ma-tricna reprezentacija, sem kada postoji mogucnost zabune. Naravno, imamo u vidu dase matricne operacije upravo i definisu tako da podrazavaju odgovarajuce operacije nadoperatorima, kao sto su sabiranje, mnozenje skalarom i kompozicija operatora. Napom-injemo i to da cemo kod matricnih operacija najcesce precutno zahtevati da su matriceodgovarajucih dimenzija. Tako, na primer, ako teorema pocinje sa: ”Ako za matrice A iB vazi AB = C, tada...” to znaci: ”Ako su matrice A i B takve da je proizvod matricaAB definisan i da je AB = C, tada...”. Nula matricu iz prostora Cm×n obelezavamosa Om×n, ili samo sa O kad su dimenzije matrice jasne iz konteksta. Takode, jedinicnumatricu dimenzije n× n, obelezavamo sa In, ili samo sa I.

Za matricu A ∈ Cm×n, sa r(A) cemo oznacavati rang matrice A. Ako je r(A) = r,pisemo jos i A ∈ Cm×n

r . Sa R(A) oznacavamo skup {Ax : x ∈ Cn}, a sa N(A) skup

Page 10: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

9

{x ∈ Cn : Ax = 0}, tj. sliku i jezgro operatora A. R(A) i N(A) su podprostori prostoraCm i Cn redom. Pored toga, vazi r(A) = dim R(A) kao i naredna teorema.

Teorema 14 Za proizvoljnu matricu A ∈ Cm×n vazi

dim R(A) + dim N(A) = n.

Za kvadratnu matricu dimenzije n× n ciji je rang jednak n, tj. za koju postoji inverznamatrica, kazemo da je regularna, u suprotnom, kazemo da je singularna.

Sa A∗ oznacavamo matricu koja odgovara Hilbert-adjungovanom operatoru A∗, oper-atora A. S obzirom da standardna baza cini ortonormiran sistem u odnosu na standardniskalarni proizvod, matrica A∗ dobija se od matrice A konjugovanjem svih elementa ma-trice A i transponovanjem tako dobijene matrice. Matrica A je normalna, ermitska iliunitarna, prema tome da li je operator A normalan, ermitski ili unitaran, respektivno,ili sto je ekvivalentno, prema tome da li je AA∗ = A∗A, A = A∗ ili AA∗ = A∗A = I, re-spektivno. Primenom Teoreme 9 zakljucujemo da je R(A)⊥ = N(A∗) i N(A)⊥ = R(A∗).

Pomenimo nekoliko dekompozicija matrice koje ce u ovom radu biti od koristi. Prvateorema odnosi se na tvrdenje o Gausovoj eliminaciji. Matrice E i P mogu se opisati idetaljnije, ali ce za nase potrebe i ovakva formulacija biti dovoljna.

Teorema 15 Za svaku matricu A ∈ Cm×nr postoje regularne matrice E i P takve da je

EAP =

[Ir KO O

],

za neku matricu K ∈ C(m−r)×(n−r).

Ako je A ∈ Cm×nr , gde je r > 0, tj. A nije nula matrica, tada A ima r linearno

nezavisnih kolona i svaka druga kolona je linearna kombinacija ovih r. Ako od ovihr linearno nezavisnih kolona sastavimo novu matricu F ∈ Cm×r

r , tada postoji matricaG ∈ Cr×n tako da je A = FG. Pri tom je i r(G) = r. Naime vazi naredna teorema otzv. faktorizaciji potpunog ranga matrice A.

Teorema 16 Ako je A ∈ Cm×nr , r > 0, tada postoje matrice F ∈ Cm×r

r i G ∈ Cr×nr tako

da je A = FG.

Za kvadratnu matricu A, polinom p(λ) = det (A − λI) naziva se karakteristicnipolinom matrice (operatora) A. Ako je A ∈ Cn×n, tada je stepen polinoma p(λ)jednak n. Nule polinoma p(λ) su sopstvene vrednosti matrice A, tj. takvi brojeviλ za koje postoji nenula vektor x ∈ Cn tako da je (A − λI)x = 0. Vektor x se utom slucaju naziva sopstveni vektor koji odgovara sopstvenoj vrednosti λ. Svakamatrica dimenzije n× n ima n sopstvenih vrednosti λ1, λ2, ..., λn, kada svaku racunamoonoliko puta kolika je njena visestrukost kao nule karakteristicnog polinoma. Skup svihsopstvenih vrednosti nazivamo spektar matrice A i obelezavamo sa σ(A). Kao sto jepoznato, svaka matrica je nula svog karakteristicnog polinoma, u matricnom smislu: akoje p(λ) = anλ

n + ... + a1λ + a0, tada je anAn + ... + a1A + a0I = O. Monican polinom

Page 11: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

10

minimalnog stepena m(λ) koji ima osobinu m(A) = 0 naziva se minimalni polinommatrice A. Minimalni polinom matrice uvek deli karakteristican polinom te matrice.

Na osnovu Teoreme 12, kako je za kvadratnu matricu A, odnosno za operator A,obavezno asc(A) <∞ i dsc(A) <∞, sledi da je asc(A) = dsc(A) = p. Broj p naziva seindeks matrice A i obelezava sa ind(A). Napomenimo da cemo za regularne matrice,tj. upravo za one matrice za koje je p = 0, u ovom radu govoriti da je njihov indeks 1.Drugim recima, indeks matrice je uvek prirodan broj i jednak je p, ako je i p prirodanbroj, ili je jednak jedinici, u slucaju da je p = 0. Mnoga tvrdenja ce na taj nacin dobitikompaktniji oblik. U vezi sa indeksom matrice vazi naredno tvrdenje.

Teorema 17 Neka je A ∈ Cn×n, ind(A) = k i l ∈ N. Sledeca tvrdenja su ekvivalentna:

(i) l ≥ k;

(ii) R(Al) = R(Al+1);

(iii) N(Al) = N(Al+1);

(iv) r(Al) = r(Al+1);

(v) Prostori R(Al) i N(Al) su komplementarni;

(vi) R(Al) = R(As), za neko s ∈ N.

Matrica A za koju postoji prirodan broj k takav da je Ak = O, naziva se nilpotentnamatrica. Najmanji takav prirodan broj k naziva se stepen (ili indeks) nilpotentnostimatrice A i obelezava sa n(A). Za nilpotentne matrice je n(A) = ind(A), ali naziv”indeks nilpotentnosti” i oznaka n(A) su deskriptivniji od ”indeks” i ind(A), pa cemo ihzato koristiti.

Ako za matricu A, nenula vektor x i kompleksan broj λ postoji prirodan broj k takavda je (A − λI)kx = 0, tada se x naziva generalisani sopstveni (skraceno: g-sopstveni)vektor od A koji odgovara sopstvenoj vrednosti λ, ili skraceno λ-vektor. Najmanji priro-dan broj k sa opisanom osobinom naziva se red tog λ-vektora. Kao sto vidimo, nenulavektor x je sopstveni vektor za A ako i samo ako je on λ-vektor reda 1, za neko λ ∈ C.

Kvadratna matrica oblika:

Jk(λ) =

λ 1 0 · · · 0 00 λ 1 · · · 0 00 0 λ · · · 0 0...

......

. . ....

...0 0 0 · · · λ 10 0 0 · · · 0 λ

∈ Ck×k,

naziva se Zordanov blok dimenzije k×k, koji odgovara broju λ. Kvazidijagonalna matricaoblika:

J =

Jk1(λ1) O · · · OO Jk2(λ2) · · · O...

.... . .

...O O · · · Jkl(λl)

∈ Cn×n,

Page 12: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

11

naziva se Zordanova matrica dimenzije n×n. Jedan od centralnih rezultata u linearnojalgebri je da za svaki operator A na konacno-dimenzionalnom vektorskom prostoru nadpoljem C, postoji baza tog prostora u kojoj je matrica operatora A upravo Zordanovamatrica1. Ne uocava se tesko da, u tom slucaju, navedena baza mora biti sacinjena odg-sopstvenih vektora matrice A. Naime, vazi naredna teorema.

Teorema 18 Za matricu A ∈ Cn×n postoji regularna matrica P ∈ Cn×n i Zordanovamatrica J , takva da je P−1AP = J . Pri tome, kolone matrice P predstavljaju g-sopstvenevektore matrice A. Ukoliko za neku regularnu matricu Q vazi Q−1AQ = J ′, gde je J ′

neka Zordanova matrica, tada se J i J ′ razlikuju eventualno u rasporedu Zordanovihblokova po dijagonali.

Matrica J iz prethodne teoreme naziva se Zordanova normalna forma matriceA. Matrica A ima vise Zordanovih normalnih formi, ali su one sve sustinski jednake:razlikuju se samo po redosledu Zordanovih blokova. Ukoliko je svaki Zordanov bloku Zordanovoj normalnoj formi matrice A dimenzije 1 × 1 (J1(λ) =

[λ]), tada je J

dijagonalna matrica. Kolone matrice P u tom slucaju predstavljaju sopstvene vektorematrice A, a za matricu A kazemo da moze da se dijagonalizuje. Jos jedan od izuzetnobitnih rezultata linearne algebre je sledeca teorema.

Teorema 19 Svaka normalna matrica moze da se dijagonalizuje.

Osobine Zordanove normalne forme matrice koje ce nama biti od koristi su:

- Za svaku sopstvenu vrednost λ ∈ σ(A) postoji barem jedan Zordanov blok Jk(λ)u Zordanovoj normalnoj formi matrice A.

- Zbir dimenzija svih Zordanovih blokova koji odgovaraju sopstvenoj vrednosti λpredstavlja visestrukost λ kao nule karakteristicnog polinoma matrice A.

- Ako je Jk(λ) Zordanov blok za λ 6= 0, tada je Jk(λ) invertibilna matrica. Sa drugestrane, Jk(0)k = O i Jk(0)l 6= 0, za l = 1, 2, ..., k − 1.

- U slucaju da je matrica A singularna, indeks matrice A jednak je dimenziji na-jveceg Zordanovog bloka koji odgovara sopstvenoj vrednosti 0. Sem toga, matricaJ ind(A) je kvazidijagonalna matrica koja na dijagonali ima blok matrice jednake saJk(λ)ind(A), za λ 6= 0 ili O.

- Rang matrice Aind(A) predstavlja zbir dimenzija Zordanovih blokova koji odgo-varaju nenula sopstvenim vrednostima matrice.

- Matrica A je nilpotentna ako i samo ako je σ(A) = {0}. U tom slucaju, ste-pen nilpotentnosti matrice A predstavlja dimenziju najveceg Zordanovog bloka uZordanovoj normalnoj formi.

1Vazi i opstije, dovoljno je da polje nad kojim je vektorski prostor bude algebarski zatvoreno. Nar-avno, tada u definiciji Zordanovog bloka, λ i 1 nisu kompleksni brojevi, vec odgovarajuci elementi togpolja.

Page 13: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

12

Kvadratne matrice A i B su slicne, ako postoji regularna matrica S takva da jeA = SBS−1. Slicne matrice imaju jednake Zordanove normalne forme, pa dakle i istesopstvene vrednosti, kao i jednake karakteristicne polinome.

Kvadratnu matricu P za koju vazi P 2 = P nazivamo idempotent ili projektor (nakonacno-dimenzionalnim prostorima ne pravimo razliku). Sve u vezi sa projektorima nanormiranim prostorima prenosimo i na matrice, pa je tako recimo R(P )⊥ = N(P ) ako isamo ako je P ∗ = P , itd.

2.4 Norme na prostoru matrica. Matricni eksponent

Skup matrica Cm×n na prirodan nacin poprima strukturu vektorskog prostora dimenzijem·n i zbog toga je izomorfan sa Cm·n. Prostor Cm×n je konacno-dimenzionalan, pa su svenorme definisane na prostoru matrica medusobno ekvivalentne. Svaka norma indukujei metriku na prostoru Cm×n, ali zbog ekvivalentnosti normi, ako niz matrica {Ai} tezimatrici A u jednoj metrici (normi), onda taj niz tezi matrici A u bilo kojoj drugoj metrici(normi) na tom prostoru. Zbog toga ne naglasavamo koju normu imamo na umu kadakazemo da niz matrica konvergira nekoj matrici. S obzirom da je ‖A‖∞ = max

i,j|aij|

norma na prostoru Cm×n, zakljucujemo da niz matrica {Ai} tezi matrici A (u bilo kojojnormi) ako i samo ako taj niz pokoordinatno tezi matrici A. Tako jednostavno uocavamoda, ako Ai → A i Bi → B, tada i A∗i → A∗, Ai ±Bi → A±B i AiBi → AB.

Postoje norme na prostoru Cn×n koje zauzimaju posebno mesto i koje se nazivajumatricne norme. To su norme koje, pored osnovnih aksioma normi, zadovoljavajui submultiplikativnost : ‖AB‖ ≤ ‖A‖‖B‖. Svaka norma vektora na skupu Cn indukujejednu matricnu normu, definisanu analogno kao u (1). Euklidska norma vektora indukujematricnu normu: ‖A‖ = max{

√|λ| : λ ∈ σ(A∗A)}. Naravno, i dalje vazi da su sve

norme na prostoru Cn×n, one koje su matricne i one koje to nisu, medusobno ekviva-lentne, i da je konvergencija niza matrica nekoj matrici ekvivalentna pokoordinatnojkonvergenciji. Ipak, moze se desiti da jednostavnije dokazemo neku konvergenciju akoizaberemo pogodniju normu.

Na normiranom prostoru Cn×n mozemo posmatrati matricne redove. Narocito vazanje red

I +1

1!A+

1

2!A2 + ...+

1

k!Ak + ...

Za svaku matricu A ∈ Cn×n, ovaj red je konvergentan2, i matricu kojoj ovaj red konver-gira obelezavamo sa eA. Osobine matrice eA koje su nama od znacaja su:

- eO = I.

- Matrica eA je regularna za svaku matricu A i vazi e−AeA = I.

- Ako matrica A komutira sa matricom B, tada matrica A komutira sa matricomeB.

2Ovo tvrdenje je najjednostavnije pokazati ako posmatramo neku matricnu normu. Tada je ‖Ak‖ ≤‖A‖k, pa sledi apsolutna konvergencija ovog reda, a prostor Cn×n je Banachov.

Page 14: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

13

- Ako matrice A i B komutiraju, tada je eA+B = eAeB.

- Ako je S regularna matrica, tada je eSAS−1

= SeAS−1.

- Ako je A =

A1 O · · · OO A2 · · · O...

.... . .

...O O · · · Ak

kvazidijagonalna matrica, tada je

eA =

eA1 O · · · OO eA2 · · · O...

.... . .

...O O · · · eAk

.

Za fiksiranu matricu A, preslikavanje t 7→ etA predstavlja funkciju iz R u Cn×n. Akoje q ∈ Cn, onda etAq jedna vektorska funkcija promenljive t, tj. preslikavanje iz R u Cn.Vektorske funkcije uopste, oznacavamo podebljanim slovom f(t) = (f1(t), f2(t), ..., fn(t)).Za izvod vektorske funkcije koristicemo notaciju uobicajenu za diferencijalne jednacine

(tj. dinamicke sisteme) ddtf(t) = f(t) = (f ′1(t), f

′2(t), ..., f

′n(t)). Takode

b∫a

f(t) dt =

(b∫a

f1(t) dt,b∫a

f2(t) dt, ...,b∫a

fn(t) dt). Za funkciju etAq vazi ddtetAq = AetAq.

Napomenimo na kraju da cemo, malo neuobicajeno, mahom pisati eAt, a ne etA, jeru nekim situacijama, kao sto je situacija sa izvodom, matrica A se formalno ponasa kao”koeficijent” uz promenljivu t.

Page 15: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Glava 3

Penroseove jednacine i generalisaniinverzi matrice

U ovoj glavi definisacemo Moore-Penroseov generalisani inverz matrice, kao i druge klasegeneralisanih inverza. Generalisani inverzi kojima se bavimo u ovoj glavi, imaju velikuprimenu u resavanju matricnih jednacina, kao i u odredivanju pribliznih resenja sistemalinearnih jednacina, onda kada ”prava” resenja ne postoje. U to cemo se uveriti u Glavi5.

3.1 Penroseove jednacine

Neka je A matrica iz prostora Cm×n. Jednacine

AXA = A, (1)

XAX = X, (2)

(AX)∗ = AX, (3)

(XA)∗ = XA, (4)

nazivaju se Penroseove jednacine za matricu A. U svom radu [12] iz 1955. godine,Penrose je pokazao da ove cetiri jednacine imaju jedinstveno resenje za svaku matricuA ∈ Cm×n i to resenje obelezio sa A†. Posto je osobine matrice A†, definisane na drugacijinacin, izucavao i Moore tridesetak godina pre Penrosea, matrica A† u cast oba naucnikanaziva se Moore-Penroseov inverz matrice A. Pored matrice A†, koja zadovoljava svecetiri navedene jednacine, od velikog interesa bice i one matrice X koje zadovoljavajusamo neke, a ne obavezno sve Penroseove jednacine.

Za matricu A ∈ Cm×n sa A{i, j, ..., k} obelezavamo skup svih matrica X ∈ Cn×m kojezadovoljavaju Penroseove jednacine (i), (j), ..., (k). Tako ce, na primer, skup A{1} cinitisve matrice X ∈ Cn×m koje zadovoljavaju jednacinu (1), skup A{2, 3} sve matrice kojeistovremeno zadovoljavaju jednacine (2) i (3), itd. Za matricu X ∈ A{i, j, ..., k} kazemo

14

Page 16: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

15

da je {i, j, ..., k}-inverz matrice A; za proizvoljan {i, j, ..., k}-inverz matrice A koristimooznaku A(i,j,...,k).

Vec smo napomenuli, a kasnije cemo i dokazati, da je skup A{1, 2, 3, 4} jednoclani jedini njegov element je A†. Raspolazuci tom cinjenicom, zakljucujemo i da su sviskupovi A{i, j, ..., k} neprazni, jer svaki od njih sadrzi A†. Ipak, da bi ilustrovali osobinegeneralisanih inverza, postepeno cemo konstruisati razlicite {i, j, ..., k}-inverze matriceA i to pocevsi od {1}-inverza i {2}-inverza.

3.2 Osobine {1} i {2}-inverza

Za svaku matricu A ∈ Cm×nr postoje regularne matrice E ∈ Cm×m i P ∈ Cn×n tako da

vazi

EAP =

[Ir KO O

]tj. A = E−1

[Ir KO O

]P−1,

kao sto smo naveli u Teoremi 2.15. U narednoj teoremi pokazacemo kako se konstruise{1}-inverz matrice A, koristeci navedenu dekompoziciju. Treba obratiti paznju na is-pravnu interpretaciju navedene blok matrice u slucaju r = m ili r = n. Ipak, narednorazmatranje se, u tim slucajevima, razlikuje samo notacijski, ne i sustinski, pa ih necemoposebno isticati.

Teorema 1 Neka je A ∈ Cm×nr i neka su E ∈ Cm×m

m i P ∈ Cn×nn , tako da je

A = E−1[Ir KO O

]P−1.

Tada, za svaku matricu L ∈ C(n−r)×(m−r), matrica

X = P

[Ir OO L

]E

predstavlja {1}-inverz matrice A.

Dokaz. Direktnom proverom nalazimo:

AXA = E−1[Ir KO O

]P−1 · P

[Ir OO L

]E · E−1

[Ir KO O

]P−1 = E−1

[Ir KO O

]P−1 = A,

imajuci u vidu da je IrK = K, posto je K ∈ Cr×(n−r). �

Matrice P i E u prethodnoj teoremi su regularne, zato je

r(X) = r(

[Ir OO L

]) = r + r(L).

S obzirom na to da je matrica L bila proizvoljna, na ovaj nacin mozemo konstruisati {1}-inverz bilo kog ranga izmedu r i min{n,m}. U narednoj teoremi, u kojoj dokazujemonajosnovnije osobine {1}-inverza, dokazacemo da je rang {1}-inverza matrice uvek nemanji od ranga same matrice.

Page 17: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

16

Teorema 2 Neka je A ∈ Cm×nr , λ ∈ C i A(1) proizvoljan {1}-inverz matrice A. Tada

vazi:(a) (A(1))∗ ∈ A∗{1};(b) Ako je A regularna matrica, tada je A{1} = {A−1};

(c) λ†A(1) ∈ (λA){1}, gde je λ† =

{1λ, λ 6= 0

0, λ = 0;

(d) r(A(1)) ≥ r(A);(e) Ako su S i T regularne matrice, onda je T−1A(1)S−1 ∈ SAT{1}.

Dokaz. Tvrdenja (a), (c) i (e) dokazuju se direktnom proverom.(b): Neka je A−1 inverz matrice A. Tada je A−1 ∈ A{1}, a ako je X proizvoljni elementskupa A{1}, tada mnozeci jednakost AXA = A sa A−1 sa leve i desne strane, dobijamoX = A−1. Ovim je pokazano da je A{1} = {A−1}.(d): Vazi r(A(1)) ≥ r(AA(1)A). S druge strane, r(AA(1)A) = r(A), jer je AA(1)A = A,pa imamo r(A(1)) ≥ r(A). �

Za proizvoljni {1}-inverz A(1), iz jednakosti AA(1)A = A, slede jednakosti:

AA(1)AA(1) = AA(1) i A(1)AA(1)A = A(1)A. (5)

Naime, vazi naredna teorema.

Teorema 3 Matrice AA(1) i A(1)A su idempotentne matrice i njihov rang jednak je rangumatrice A. Pored toga, vazi R(AA(1)) = R(A) i N(A(1)A) = N(A).

Dokaz. Iz jednakosti (5) sledi da su matrice AA(1) i A(1)A idempotentne. S drugestrane, imamo r(A) ≥ r(AA(1)) ≥ r(AA(1)A) = r(A), pa je r(A) = r(AA(1)). Takoder(A) ≥ r(A(1)A) ≥ r(AA(1)A) = r(A), pa vazi i r(A) = r(A(1)A). Na slican nacinpokazujemo i trazene jednakosti sa slikama i jezgrima. R(A) = R(AA(1)A) ⊂ R(AA(1)) ⊂R(A) i zato je R(A) = R(AA(1)). Analogno: N(A) ⊂ N(A(1)A) ⊂ N(AA(1)A) = N(A),odakle sledi N(A) = N(A(1)A). �

U slucaju da je matrica A potpunog ranga vrsta, ili potpunog ranga kolona, {1}-inverzi matrice A predstavljaju leve, odnosno, desne inverze te matrice, o cemu svedocinaredna teorema.

Teorema 4 Neka je A ∈ Cm×nr . Tada vazi:

(a) A(1)A = In ako i samo ako je r = n;(b) AA(1) = Im ako i samo ako je r = m.

Dokaz. (a): U oba smera, koristimo Teoremu 3: ako je A(1)A = In, buduci da jer(A) = r(A(1)A) sledi r(A) = n, odnosno r = n. Sto se tice suprotnog smera, ukoliko jer(A) = n, tada je A(1)A matrica dimenzije n× n i ranga n, tj. ova matrica je regularna.Mnozeci izraz (A(1)A)2 = A(1)A sa (A(1)A)−1 sa obe strane, dobijamo A(1)A = In.(b): Analogno sa (a). �

Pomocu {1}-inverza matriceA, mozemo konstruisati {1, 2}-inverz matriceA, na nacinopisan u narednoj teoremi.

Page 18: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

17

Teorema 5 Neka su Y, Z ∈ A{1} i neka je

X = Y AZ.

Tada je X ∈ A{1, 2}.Dokaz. Direktnom proverom dobijamo:

AXA = (AY A)ZA = AZA = A i

XAX = Y (AZA)Y AZ = Y (AY A)Z = Y AZ = X.

Kao sto mozemo da primetimo, jednacine (1) i (2) simetricne su po X i A. MatricaX je {1}-inverz matrice A ako i samo ako je matrica A {2}-inverz matrice X. Takode,X ∈ A{1, 2} ako i samo ako A ∈ X{1, 2} i zato u takvoj situaciji kazemo da su matrice A iX {1, 2}-inverzi jedna drugoj. Setimo se da iz Teoreme 2.(d) sledi r(A(1)) ≥ r(A), pa zbognavedene simetrije, zakljucujemo da {1, 2}-inverzi uvek imaju jednake rangove. Suprotnotvrdenju za rang {1}-inverza matrice, rang proizvoljnog {2}-inverza neke matrice ne mozebiti veci od ranga te matrice:

r(A(2)) = r(A(2)AA(2)) ≤ r(A).

Naredna teorema govori o tome da su matrice iz skupova A{1} i A{2} koje imaju istirang kao i matrica A upravo matrice skupa A{1, 2}. Pre teoreme, dokazacemo pomocnotvrdenje koje cemo cesto koristiti.

Lema 1 Za matrice A ∈ Cm×n i B ∈ Cn×p vazi:(a) R(AB) = R(A) ako i samo ako je r(AB) = r(A). U tom slucaju, postoji matricaC ∈ Cp×n, tako da je ABC = A;(b) N(AB) = N(B) ako i samo ako je r(AB) = r(B). U tom slucaju, postoji matricaC ∈ Cn×m, tako da je CAB = B.

Dokaz. (a): Posto za proizvoljnu matricuX vazi dim R(X) = r(X), iz R(AB) = R(A),sledi r(AB) = r(A). S druge strane, buduci da uvek vazi R(AB) ⊂ R(A), a iz jednakostir(AB) = r(A) imamo i jednakost dimenzija dim R(AB) = dim R(A), sledi i R(AB) =R(A). Da bi dokazali drugi deo tvrdenja, setimo se da je podprostor R(AB) razapet nadvektorima koji predstavljaju kolone matrice AB, dok je podprostor R(A) razapet nadvektorima koji predstavljaju kolone matrice A. Kako se ova dva podprostora poklapaju,onda linearnom kombinacijom kolona matrice AB mozemo dobiti svaku kolonu matriceA. Zato postoji matrica C, takva da je ABC = A, gde kolone matrice C cine koeficijentiu pomenutim linearnim kombinacijama.(b): Neka je N(AB) = N(B). Kao sto smo naveli u Teoremi 2.14, vazi:

r(AB) + dim N(AB) = p = r(B) + dim N(B), (6)

pa je r(AB) = r(B). Durgi smer dokazujemo na sledeci nacin: bez obzira na usloveteoreme, vazi N(B) ⊂ N(AB), a iz r(AB) = r(B) i jednakosti (6) sledi i dim N(B) =dim N(AB), pa je N(B) = N(AB). Za drugi deo tvrdenja koristimo tvrdenje pod(a), jer iz r(AB) = r(B), sledi r(B∗A∗) = r(B∗), pa postoji matrica C∗ tako da jeB∗A∗C∗ = B∗, tj. CAB = B. �

Page 19: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

18

Teorema 6 Bilo koja dva od navedena tri uslova impliciraju treci:

X ∈ A{1}X ∈ A{2}

r(X) = r(A).

Dokaz. Da prva dva uslova impliciraju treci, vec smo pokazali. Pretpostavimo davaze prvi i treci uslov, tj. da je X {1}-inverz matrice A, istog ranga kao i matrica A.Iz Teoreme 3 sledi da je r(XA) = r(A), pa je onda r(XA) = r(X). Na osnovu Leme 1,sledi da postoji matrica Y tako da je XAY = X. Zbog toga je

XAX = XA(XAY ) = X(AXA)Y = XAY = X,

odnosno, X ∈ A{2}. Preostalo je da dokazemo da drugi i treci uslov impliciraju prvi, ato sledi iz dokazanog:

X ∈ A{2} ∧ r(X) = r(A)⇔ A ∈ X{1} ∧ r(A) = r(X)⇒ A ∈ X{2} ⇒ X ∈ A{1}.

Zbog simetrija kod {1, 2}-inverza, mozemo jos detaljnije opisati strukturu projektoraAA(1,2) i A(1,2)A.

Posledica 1 Za proizvoljnu matricu A(1,2) iz A{1, 2} vazi: matrica AA(1,2) je projektorna R(A), paralelno sa N(A(1,2)), a matrica A(1,2)A je projektor na R(A(1,2)) paralelno saN(A).

Dokaz. Da je matrica AA(1,2) projektor i da je R(AA(1,2)) = R(A), posledica je Teoreme3. Pored toga, posto je A {1}-inverz matrice A(1,2), na osnovu pomenute teoreme sledi iN(AA(1,2)) = N(A(1,2)). Analogno se pokazuje i drugi deo tvrdenja. �

Kao sto mozemo da vidimo, za svaku matricu A ∈ Cm×n vazi

R(A)⊕N(A(1,2)) = Cm kao i R(A(1,2))⊕N(A) = Cn.

Drugim recima, slika matrice A i jezgro nekog {1, 2}-inverza te matrice su komplemen-tarni podprostori, a isto vazi i za jezgro matrice A i sliku nekog {1, 2}-inverza. Prirodnoje sada postaviti pitanje, ukoliko su podprostori S i T takvi da je R(A) ⊕ S = Cm, aN(A)⊕T = Cn, da li obavezno postoji {1, 2}-inverz X matrice A takav da je R(X) = T iN(X) = S? Odgovor na to pitanje je potvrdan, stavise, postoji tacno jedan {1, 2}-inverzmatrice A sa navedenom slikom i jezgrom, sto dokazujemo u narednoj teoremi.

Teorema 7 Neka je A ∈ Cm×n i neka za podprostore S ⊂ Cm i T ⊂ Cn vazi R(A) ⊕S = Cm i N(A) ⊕ T = Cn. Postoji jedinstveni {1, 2}-inverz X matrice A takav da jeR(X) = T i N(X) = S.

Page 20: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

19

Dokaz. Najpre cemo konstruisati {1, 2}-inverz matrice A sa navedenom osobinom,a onda pokazati da je on jedinstven. Obelezimo sa P ∈ Cm×m projektor na R(A)paralelno sa S. Za matrice A i P vazi PA = A, jer je za svako x ∈ Cn, Ax ∈ R(A),pa je P (Ax) = Ax. Obelezimo sa Q ∈ Cn×n projektor na T paralelno sa N(A). Zamatrice A i Q vazi AQ = A. Zaista, I − Q je projektor na N(A) paralelno sa T , paje za svako x ∈ Cn (I − Q)x ∈ N(A), odakle sledi da je A(I − Q) = O, tj. A = AQ.Neka je A(1) proizvoljan {1}-inverz matrice A. Matrica AA(1) je projektor na R(A), pavazi AA(1)P = P . Takode, matrice A(1)A je projektor sa jezgrom N(A), pa je I −A(1)Aprojektor sa slikomN(A) i zato jeQ(I−A(1)A) = O, odnosnoQ = QA(1)A. Obelezimo saX = QA(1)P . Dokazimo da je X trazena matrica. AXA = (AQ)A(1)(PA) = AA(1)A =A i XAX = QA(1)(PA)QA(1)P = QA(1)(AQ)A(1)P = QA(1)(AA(1)P ) = QA(1)P = X.Dakle, X zaista jeste {1, 2}-inverz matrice A. Imajuci u vidu da je R(X) = R(XA) iN(X) = N(AX), kao i XA = QA(1)PA = QA(1)A = Q i AX = AQA(1)P = AA(1)P =P , imamo R(X) = R(Q) = T i N(X) = N(P ) = S.

Ostaje jos da pokazemo da je X jedinstveni {1, 2}-inverz sa navedenom osobinom.Pretpostavimo da je Y {1, 2}-inverz matrice A za koji vazi R(Y ) = T i N(Y ) = S. IzPosledice 1 sledi da je AY = P i Y A = Q. Zato vazi

X = XAX = XP = XAY = QY = Y AY = Y,

cime smo dokazali i jedinstvenost ovakvog {1, 2}-inverza. �

Napomenimo sada, a dokazacemo kasnije, da je Moore-Penroseov inverz upravo{1, 2}-inverz matrice A koji se dobija za odabir T = R(A∗) = N(A)⊥ i S = N(A∗) =R(A)⊥.

3.3 Konstrukcija {1, 2, 3} i {1, 2, 4}-inverza

Koristeci {1}-inverze matrica A∗A i AA∗ mozemo konstruisati {1, 2, 3} i {1, 2, 4} inverzmatrice A.

Teorema 8 Za proizvoljnu matricu A vazi

Y = (A∗A)(1)A∗ ∈ A{1, 2, 3}

iZ = A∗(AA∗)(1) ∈ A{1, 2, 4}.

Dokaz. Kao sto smo naglasili u Teoremi 2.5, za proizvoljnu matricu A vazi N(A∗A) =N(A). Iz Leme 1 sledi da onda postoji matrica U takva da je A = UA∗A. Zbog toga je

AY A = UA∗A((A∗A)(1)A∗)A = U(A∗A(A∗A)(1)A∗A) = UA∗A = A,

pa je Y ∈ A{1}. Dovoljno je pokazati da je r(Y ) = r(A) da bi dokazali da je Y ∈ A{1, 2},imajuci u vidu Teoremu 6. Vazi r(Y ) = r((A∗A)(1)A∗) ≤ r(A∗) = r(A), a sa drugestrane, pokazali smo da je Y ∈ A{1}, pa po Teoremi 2.(d) sledi da je r(Y ) ≥ r(A).

Page 21: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

20

Znaci r(Y ) = r(A) i Y je zaista {1, 2}-inverz matrice A. Ostaje pitanje da li je AY =A(A∗A)(1)A∗ ermitska matrica. Kako je A = UA∗A, to je A∗ = A∗AU∗ pa je

AY = UA∗A(A∗A)(1)A∗AU∗ = UA∗AU∗,

sto jeste ermitska matrica.Deo tvrdenja za matricu Z dokazuje se analogno. �

Prethodnom teoremom pokazali smo da su skupovi A{1, 2, 3} i A{1, 2, 4} neprazni.Naravno, odatle sledi da su neprazni i skupovi A{1, 3}, A{2, 3}, A{1, 4} i A{2, 4}. Raz-motricemo blize matrice iz skupova A{1, 3} i A{1, 4}, imajuci u vidu da za skupoveA{2, 3} i A{2, 4} vazi X ∈ A{2, 3} ako i samo ako A ∈ X{1, 4} i X ∈ A{2, 4} ako isamo ako A ∈ X{1, 3}. Ukoliko je X ∈ A{1, 3}, tada je AX ermitska matrica, ali kaosto znamo iz Teoreme 3, AX je i projektor. Iz Teoreme 2.11 sledi da je AX ortogonalniprojektor na R(A). Posto je ortogonalni projektor na fiksirani podprostor jedinstvenoodreden, iz ovog razmatranja sledi da, koji god {1, 3}-inverz X matrice A uzeli, proizvodAX ce uvek biti isti i jednak ortogonalnom projektoru na R(A). Potpuno analogno ra-sudivanje moze da se sprovede i za {1, 4}-inverze matrice A. Za proizvoljno X ∈ A{1, 4}matrica XA bice ortogonalni projektor sa jezgrom N(A), dakle, matrica XA je kon-stantna, za razlicite odabire X ∈ A{1, 4}. Formulisimo ove zakljucke (kao i obrnutesmerove) kao teoremu.

Teorema 9 Neka su A(1,3) i A(1,4) proizvoljni {1, 3} i {1, 4}-inverzi matrice A. Tadavazi:

X ∈ A{1, 3} ako i samo ako AX = AA(1,3)

iX ∈ A{1, 4} ako i samo ako XA = A(1,4)A.

Dokaz. Dokazujemo tvrdenje samo za {1, 3}-inverze, jer je za {1, 4}-inverze situacijaanalogna. Ako je X ∈ A{1, 3}, vec smo objasnili da je tada AX jednako ortogonalnomprojektoru na R(A). S druge strane, ako je AX = AA(1,3) tada je AX ermitska matricai pri tom je AXA = AA(1,3)A = A, pa je X ∈ A{1, 3}. �

Teoremu 9 cemo iskoristiti u Glavi 5, kada cemo pomocu nje potpuno opisati skupoveA{1, 3}, A{1, 4}, A{1, 2, 3}, A{1, 2, 4} i A{1, 3, 4}.

3.4 Razne konstrukcije Moore-Penroseovog inverza

Dolazimo najzad i do skupa A{1, 2, 3, 4}. U ovom poglavlju, prikazacemo nekoliko nacinaza konstrukciju Moore-Penroseovog inverza. Teorema 12 je teorema iz rada [12], kojace biti narocito korisna za ispitivanje neprekidnosti Moore-Penroseovog inverza, kao stocemo pokazati u poslednjem poglavlju ove glave.

Teorema 10 Ako su A(1,3) i A(1,4) proizvoljni {1, 3} i {1, 4}-inverzi matrice A, tada je:

A(1,4)AA(1,3) ∈ A{1, 2, 3, 4}.

Sem toga, vazi i |A{1, 2, 3, 4}| = 1.

Page 22: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

21

Dokaz. Neka je X = A(1,4)AA(1,3). Iz Teoreme 5 direktno sledi da je X ∈ A{1, 2}.Pored toga je AX = (AA(1,4)A)A(1,3) = AA(1,3) i XA = A(1,4)(AA(1,3)A) = A(1,4)A pa jeprema Teoremi 9, X ∈ A{1, 3} i X ∈ A{1, 4}, tj. X ∈ A{1, 2, 3, 4}.

Neka su sada X i Y matrice iz skupa A{1, 2, 3, 4}. Tada vazi:

X = XAX = XX∗A∗ = XX∗(A∗Y ∗A∗) = (XAX)(AY )∗ = XAY =

= A∗X∗Y AY = (A∗X∗A∗)Y ∗Y = A∗Y ∗Y = Y AY = Y.

Naredna konstrukcija vazice za nenula matrice A (za nula matricu A, jednostavnoje uociti da je A{1, 2, 3, 4} = {O}) i koristice faktorizaciju potpunog ranga matrice.Podsetimo se, ako je A ∈ Cm×n

r , r > 0, tada postoje matrice F ∈ Cm×r i G ∈ Cr×n takoda je A = FG i r(F ) = r(G) = r.

Teorema 11 Neka je A nenula matrica i neka je A = FG faktorizacija potpunog rangamatrice A. Tada je F ∗AG∗ regularna matrica i vazi

A† = G∗(F ∗AG∗)−1F ∗.

Dokaz. Kako je F ∗AG∗ = (F ∗F )(GG∗) i kako su F ∗F i GG∗ matrice dimenzije r× r iranga r, dakle regularne, sledi i da je F ∗AG∗ regularna i (F ∗AG∗)−1 = (GG∗)−1(F ∗F )−1.Ako je X = G∗(F ∗AG∗)−1F ∗, tada je X = G∗(GG∗)−1(F ∗F )−1F ∗ i jednostavno seproverava da X zadovoljava Penroseove jednacine za A, imajuci u vidu da su F ∗F iGG∗ ermitske matrice, pa su takve i njihove inverzne matrice. Dakle X ∈ A{1, 2, 3, 4}.Dokazali smo vec da je jedini element skupa A{1, 2, 3, 4} upravo A† i zato je X = A†. �

Pokazimo sada i kako je Penrose u radu [12] konstruisao matricu A†, kao polinom poA i A∗. Za dokaz teoreme bice nam potrebno naredno pomocno tvrdenje, takode iz [12].

Lema 2 Vaze sledece implikacije:

BAA∗ = CAA∗ ⇒ BA = CA i BA∗A = CA∗A ⇒ BA∗ = CA∗.

Dokaz. Buduci da za svaku matricu S vazi SS∗ = O ako i samo ako S = O, izidentiteta

(BAA∗ − CAA∗)(B∗ − C∗) = (BA− CA)(BA− CA)∗,

koji se proverava direktno, sledi prva implikacija. Druga implikacija dokazuje se analogno.�

Teorema 12 Za proizvoljnu matricu A, Penroseove jednacine (1)-(4) imaju jedinstvenozajednicko resenje.

Dokaz. Dokazimo da su jednacine (2) i (3) ekvivalentne jednacini:

XX∗A∗ = X. (7)

Page 23: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

22

Jednacina (7) dobija se zamenom (3) u (2). S druge strane, ako X zadovoljava jednacinu(7), tada je AXX∗A=AX, pa je AX ermitska matrica, tj. zadovoljava (3). Sada iz (7)sledi X = XX∗A∗ = XAX, pa X zadovoljava i (2). Na slican nacin mozemo pokazatida su jednacine (1) i (4) ekvivalentne jednacini:

XAA∗ = A∗. (8)

Dakle, dovoljno je pronaci matricu X koja zadovoljava jednacine (7) i (8) i onda cematrica X biti resenje svih Penroseovih jednacina. Primetimo da je dovoljno pronacimatricu B za koju ce vaziti:

BA∗AA∗ = A (9)

jer je onda X = BA∗ trazena matrica. Zaista, iz (9) direktno sledi (8). No, kako iz (8)sledi i A∗X∗A∗ = A∗ imamo i XX∗A∗ = BA∗X∗A∗ = BA∗ = X, tj. vazi i (7).

Neka je p(z) karakteristicni polinom matrice A∗A i neka je q(z) = z · p(z) = λ1 · z +λ2 · z2 + ...+ λk · zk. Tada vazi:

λ1A∗A+ λ2(A

∗A)2 + ...+ λk(A∗A)k = O. (10)

Neka je λr prvi koeficijent u nizu λ1, λ2, ..., λk koji je razlicit od nule. Ako je r = k,tada su sve sopstvene vrednosti matrice A∗A jednake 0. Matrica A∗A je ermitska, paje i normalna, dakle moze da se dijagonalizuje (Teorema 2.19). Zbog toga je Zordanovanormlna forma matrice A∗A nula matrica, pa je i A∗A = O, tj. A = O. U tom slucaju,neka je B = O. Ako je r < k, neka je:

B = − 1

λr(λr+1I + λr+2A

∗A+ ...+ λk(A∗A)k−r−1). (11)

Iz jednakosti (10) sledi da je B(A∗A)r+1 = (A∗A)r. U razvijenom obliku, leva stranaizgleda BA∗AA∗A...A∗A, a desna A∗AA∗A...A∗A, pa primenjujuci Lemu 2, ”brisemo”po jedno A i A∗ dok ne dobijemo BA∗AA∗ = A∗, sto je i trebalo dobiti.

Jedinstvenost resenja jednacina (1)-(4) pokazuje se kao u Teoremi 10. �

3.5 Osobine Moore-Penroseovog inverza

U ovom poglavlju dokazacemo nekoliko osnovnih osobina Moore-Penroseovog inverza.

Teorema 13 Za proizvoljnu matricu A i λ ∈ C vazi:(a) (A†)† = A;(b) (A†)∗ = (A∗)†, kao i (A†)T = (AT )†;(c) Ako je A regularna matrica, tada je A† = A−1;(d) (λA)† = λ†A†;(e) (A∗A)† = A†(A†)∗ i A† = (A∗A)†A∗ = A∗(AA∗)†.

Page 24: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

23

Dokaz. Tvrdenje (a) sledi zbog simetrije jednacina (1) i (2) kao i (3) i (4) u odnosuna A i X. Tvrdenje (b) sledi direktno, kao i tvrdenje (d). Tvrdenje (c) sledi iz Teoreme2.(b). Jedini deo tvrdenja koji eventualno nije ocigledan je (e).(e): Da je (A∗A)† = A†(A†)∗ proverava se, recimo, ovako:

(A∗A)A†(A†)∗(A∗A) = A∗(AA†((A†)∗A∗)A) = A∗AA†AA†A = A∗A,

zatim

A†(A†)∗(A∗A)A†(A†)∗ = A†((A†)∗A∗)(AA†)(A†)∗ =

= (A†AA†)((A†)∗A∗(A†)∗) = A†(A†)∗.

Pored toga

(A∗A)(A†(A†)∗) = A∗(A†)∗A∗(A†) = (A†)AA∗(A†)∗

kao i

(A†(A†)∗)(A∗A) = A†(AA†)A = A∗(A†)∗A†A,

sto jesu ermitske matrice.Koristeci dokazanu jednakost, sledi i (A∗A)†A∗ = A†(A†)∗A∗ = A†AA† = A†. Posto

je (A∗A)† = A†(A†)∗, okretajuci uloge za A i A∗, koristeci deo (b), dobijamo (AA∗)† =(A†)∗A†, pa je A∗(AA∗)† = A∗(A†)∗A† = A†AA† = A†. �

Dokazimo sada ranije najavljeno svojstvo Moore-Penroseovog inverza, a to je R(A†) =R(A∗) i N(A†) = N(A∗).

Teorema 14 Za svaku matricu A vazi: AA† je ortogonalni projektor na R(A) i A†A jeortogonalni projektor na R(A∗). Pored toga, ako je X {1, 2}-inverz matrice A, tada jeX = A† ako i samo ako je R(X) = R(A∗) i N(X) = N(A∗).

Dokaz. Na osnovu Posledice 1, AA† je projektor na R(A) paralelno sa N(A†), a A†A jeprojektor na R(A†) paralelno sa N(A). Matrice AA† i A†A su ermitske, pa po Teoremi2.11 sledi da su ovi projektori ortogonalni. To dalje znaci da je R(A)⊥ = N(A†), aliR(A)⊥ = N(A∗), pa je N(A†) = N(A∗); takode N(A)⊥ = R(A†), ali N(A)⊥ = R(A∗),pa je R(A†) = R(A∗). Suprotan smer drugog tvrdenja sledi iz Teoreme 7 i cinjeniceCm = R(A)⊕N(A∗) i Cn = N(A)⊕R(A∗). �

Zadrzimo se sada na operatorskoj prirodi matrica, gde cemo matrice posmatrati kaoreprezentacije linearnih operatora. Neka je A ∈ Cm×n

r , r > 0. Posmtrajmo redukcijuA1 : R(A∗) → R(A) operatora A. A1 je preslikavanje ”na”, a pri tom je dim R(A∗) =r(A∗) = r(A) = dim R(A), pa je A1 izomorfizam izmedu R(A∗) i R(A). Neka je A−11

njemu inverno preslikavanje, dakle A−11 : R(A) → R(A∗). S obzirom da vazi Cm =R(A)⊕N(A∗), za svaki vektor y ∈ Cm postoje jedinstveno odredeni vektoi yR(A) ∈ R(A)i yN(A∗) ∈ N(A∗) tako da je y = yR(A) + yN(A∗). Definisimo onda preslikavanje B :y 7→ A−11 yR(A). Iz navedenih razloga B, je dobro definisano preslikavanje iz Cm u Cn, tj.B ∈ Cn×m. Uz navedene oznake dokazimo narednu teoremu.

Teorema 15 Za proizvoljnu matricu A 6= O, vazi A† = B.

Page 25: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

24

Dokaz. Posto je Cn = N(A) ⊕ R(A∗), za svaki x ∈ Cn postoje jedinstveno odredenixN(A) i xR(A∗) tako da je x = xN(A) + xR(A∗). Pored toga, za svaki x je Ax = A(xN(A) +xR(A∗)) = AxR(A∗), dok je zbog nacina na koji smo definisali matricu B tacno BAx =BAxR(A∗) = xR(A∗). Slicno je i By = ByR(A) i ABy = AByR(A) = yR(A). Sada mozemojednostavno dokazati da vazi ABA = A i BAB = B. Naime, za x ∈ Cn je: ABAx =AxR(A∗) = Ax, pa je ABA = A, kao i BABy = ByR(A) = By, pa je BAB = B.Dakle, A i B su {1, 2}-inverzi, pa je AB projektor na R(A) paralelno sa N(B), dok jeBA projektor na R(B) paralelno sa N(A). Iz definicije matrice B sledi R(B) = R(A∗)i N(B) = N(A∗), a R(A)⊥ = N(A∗) i R(A∗)⊥ = N(A), pa su projektori AB i BAortogonalni, tj. matrice AB i BA su ermitske. Ovim smo pokazali da je A† = B. �

Navedimo sada neke osobine koje Moore-Penroseov inverz ne poseduje. Recimo,matrice A i A†, u opstem slucaju, ne komutiraju. Nije dovoljno ni da matrica A budekvadratna. Na potrebne i dovoljne uslove za komutiranje matrice sa svojim Moore-Penroseovim inverzom cemo se vratiti kasnije, u Glavi 4. Pokazimo primerom da uopstem slucaju ne vazi (Ak)† = (Ak)†, kao ni λ ∈ σ(A)⇔ λ† ∈ σ(A†).

Primer 1 Neka je A =

[1 −10 0

]. Tada je A† = 1

2

[1 0−1 0

]. Vazi A2 = A, dok je

(A†)2 = 12A†. Kako je A2(A†)2 = 1

2AA†, sledi da A2(A†)2 nije idempotent, pa dakle (A†)2

nije Moore-Penroseov inverz matrice A2. Pored toga, σ(A) = {1, 0}, a σ(A†) = {12, 0},

pa ne vazi da iz λ ∈ σ(A) sledi λ† ∈ σ(A†).

Moore-Penroseovi inverzi slicnih matrica, u opstem slucaju, nisu slicne matrice. Otome svedoci naredni primer.

Primer 2 Neka je A =

1 1 −12 0 −2−1 1 1

. Tada je A = BJB−1, gde je B =

1 0 10 1 11 0 0

i

J =

0 1 00 0 00 0 2

. Moze se proveriti da je A† = 112

1 2 −16 0 6−1 −2 1

i J† =

0 0 01 0 00 0 1

2

. Da

bi pokazali da matrice A† i J† nisu slicne, dovoljno je da uocimo da su karakteristicnipolinomi ovih matrica razliciti. Naime, karakteristican polinom matrice A† je λ(λ −1+√13

12)(λ− 1−

√13

12), dok je karakteristican polinom matrice J† jednak λ2(λ− 1

2).

3.6 Neprekidnost Moore-Penroseovog inverza

U ovom poglavlju razmatracemo sledece pitanje: ako niz matrica {An} konvergira matriciA, da li niz matrica {A†n} konvergira matrici A†? Jednostavno se konstruise primer kojipokazuje da, u opstem slucaju, ovo ne mora da vazi.Primer 3 Neka je

An =

[1 00 1

n

]i A =

[1 00 0

].

Tada An → A. Vazi A†n = A−1n =

[1 00 n

]pa niz {A†n} nije konvergentan, dakle ne tezi

Page 26: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

25

matrici A†.Glavni rezultat ovog poglavlja tvrdi da je potreban i dovoljan uslov za ostvarivanje

navedene konvergencije, to da je pocevsi od nekog indeksa n0 rang svake matrice Anjednak rangu matrice A. Penrose je u svom radu [12] ovaj rezultat prokomentarisao,ali mu nije dao narocit znacaj (nije formulisan kao posebna teorema). Dokaz koji ovdedajemo je voden tim komentarima. Pre nego sto dokazemo glavnu teoremu, dokazujemopomocna tvrdenja.

Lema 3 Ako za matricu P ∈ Cn×n vazi P 2 = P , tada je r(P ) = tr(P ), gde smo sa tr(·)oznacili trag matrice.

Dokaz. Za proizvoljne matrice A i B vazi tr(AB) = tr(BA). Ako je J = S−1PSZordanova normalna forma matrice P tada vazi tr(J) = tr(S−1PS) = tr(SS−1P ) =tr(P ). Posto je P 2−P = O, minimalni polinom matrice P deli polinom λ2−λ i zato sujedine sopstvene vrednosti matrice P 0 ili 1. U uvodu smo napomenuli da je rang matriceP ind(P ) jednak zbiru dimenzija Zordanovih blokova koji odgovaraju nenula sopstvenimvrednostima matrice P . S obzirom da je indeks idempotentne matrice jednak 1 i da je zbirdimenzija Zordanovih blokova koji odgovaraju nenula sopstvenim vrednostima matrice P(dakle sopstvenoj vrednosti 1) jednak tragu matrice J , sledi da je r(P ) = tr(J) = tr(P ).�

Lema 4 Ako matrica A ∈ Cn×n moze da se dijagonalizuje, visestrukost nule λ = 0karakteristicnog polinoma p(λ) matrice A jednaka je dimenziji jezgra dimN(A) = n −r(A).

Dokaz. Tvrdenje direktno sledi iz Teoreme 2.18 i cinjenice da matrice i njena Zordanovanormalna forma imaju isti rang i identican karakteristicni polinom. �

Sada dokazujemo i glavni rezultat.

Teorema 16 Neka je {An} ⊂ Cm×s, A ∈ Cm×s i neka An → A. Tada vazi

A†n → A† ako i samo ako postoji n0 ∈ N tako da je r(An) = r(A), n ≥ n0. (12)

Dokaz. Dokazimo prvo da je navedeni uslov potreban. Ako A†n → A† tada vazii AnA

†n → AA†. Kako niz matrica {AnA†n} pokoordinatno konvergira matrici AA†,

vazi i tr(AnA†n) → tr(AA†). Matrice AnA

†n i AA† su idempotentne, pa iz Leme 3

sledi r(AnA†n) → r(AA†). Kako je rang matrice ceo broj, odavde sledi da je niz

{r(AnA†n)} pocevsi od nekog clana konstantan i jednak sa r(AA†). Iz Teoreme 3 sledida je r(AnA

†n) = r(An) i r(AA†) = r(A), sto dokazuje zeljeno tvrdenje.

Pokazimo sada da je navedeni uslov i dovoljan. Kako An → A, onda vazi A∗n → A∗,zatim A∗nAn → A∗A kao i (A∗nAn)k → (A∗A)k, za bilo koje k ∈ N. Ako je p proizvoljanpolinom, tada i p(A∗nAn) → p(A∗A) i p(A∗nAn)A∗n → p(A∗A)A∗. Neka je r0 = r(A).Pokazacemo da postoji polinom p(λ) takav da, za svaku matricu S ∈ Cm×n za kojuje r(S) = r0 vazi p(S∗S)S∗ = S†. Kako je r(An) = r0, pocevsi od nekog n0, slediceA†n = p(A∗nAn)A∗n → p(A∗A)A∗ = A†. Takav polinom dat je u (11). Naime, polinomdat u (11) zavisi od broja r definisanog tom prilikom. Za one matrice za koje je takav

Page 27: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

26

broj r jednak, dobijamo i jednake polinome u (11). Dovoljno je pokazati da je broj rneka funkcija (samo) od ranga matrice A∗A. Broj r definisan u dokazu Teoreme 12,predstavlja broj koji je za 1 veci od visestrukosti nule λ = 0 karakteristicnog polinomaq(λ) matrice A∗A. Matrica A∗A je ermitska, dakle normalna, pa se moze dijagonalizovati(Teorema 2.19). Iz Leme 4 sledi da je visestrukost nule karakteristicnog polinoma matriceA∗A jednaka dimenziji jezgra dim N(A∗A) sto svakako jeste funkcija od ranga matriceA jer je dim N(A∗A) = dim N(A) = s − r0. Dakle, kada bi polinom iz (11) definisalinanovo za svaku matricu An, za n > n0, uvek bi dobili isti polinom p(λ). U Teoremi 12pokazano je da je onda A†n = p(A∗nAn)A∗n, sto smo i zeleli da dokazemo. �

Neprekidnost Moore-Penroseovog inverza matrice razmatrao je i Stewart u radu [19],objavljenom 1969. godine. U ovom radu mogu se naci i opstiji rezultati od ovdedokazanog. Zatim, 1983. godine Izumino u radu [9] daje potrebne i dovoljne usloveza konvergenciju niza {A†n} ka A† (pod uslovom da niz {An} konvergira ka A), gde suAn, A ∈ B(H,K), n ∈ N, a H i K proizvoljni Hilbertovi prostori. Radi potpunosti,navodimo taj rezultat (bez dokaza).

Teorema 17 Neka su H i K Hilbertovi prostori. Neka je niz {An} ⊂ B(H,K), A ∈B(H,K) i An → A. Ako, za svako n ∈ N, postoji A†n i A†, tada su sledeca tvrdenjaekvivalentna:

(i) A†n → A†;

(ii) supn∈N‖A†n‖ <∞;

(iii) A†nAn → A†A;

(iv) AnA†n → AA†.

Rakocevic u radovima [17] i [18], iz 1991. i 1993. godine, ispituje neprekidnostMoore-Penroseovog inverza na Banachovim i C∗-algebrama, gde pokazuje da analognirezultat vazi i u opstijim strukturama.

Page 28: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Glava 4

Drazinov inverz matrice

Generalisani inverzi matrice koje smo do sada proucavali su veoma korisni u resavanjumatricnih jednacina kao i sistema matricnih jednacina, kao sto cemo videti u Glavi 5.Ipak, oni u opstem slucaju ne poseduju mnoge osobine koje mogu biti od znacaja unedostatku pravog inverza. Recimo, neke od tih osobina, iskazane za slucaj inverzaregularne matrice su sledece:

(i) AA−1 = A−1A;

(ii) (SAS−1)−1 = SA−1S−1;

(iii) (A−1)k = (Ak)−1, za svaki prirodan broj k;

(iv) λ ∈ σ(A) ⇔ λ−1 ∈ σ(A−1);

(v) Ak+1A−1 = Ak, za neki prirodan broj k.

U narednim poglavljima opisacemo generalisane inverze matrice koji ce, izmedu os-talih, imati i navedene osobine. Ti inverzi nece imati primenu u resavanju sistemalinearnih jednacina, ali ce zato naci primenu, recimo, u resavanju sistema linearnih difer-encijalnih jednacina, kao sto cemo pokazati u Glavi 5.

4.1 Grupni inverz

Razmotrimo sta dobijamo ako za matricu A potrazimo matricu X koja sem jednacina

AXA = A (1)

XAX = X (2)

zadovoljava i jednacinuAX = XA, (3)

tj. komutira sa matricom A. Ocigledno je da ovakva matrica X ne moze postojati zaproizvoljnu matricu A, kao sto je to bio slucaj sa generalisanim inverzima opisivanim do

27

Page 29: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

28

sada. Da bi matrice A i X komutirale, potrebno je da obe budu kvadratne. Dakle, uokviru ovog i narednih poglavlja ove glave, radicemo iskljucivo sa kvadratnim matricamai to necemo posebno naglasavati. Ipak, nije dovoljno da matrica A bude kvadratna.Naime, kada bi ovakva matrica X postojala, iz Posledice 1 bi sledilo da je AX projektorna R(A) paralelno sa N(X), dok je XA projektor na R(X) paralelno sa N(A). Postovazi AX = XA, sledi da mora da vazi i R(A) = R(X) i N(A) = N(X), odakle dobi-jamo i da su R(A) i N(A) komplementarni prostori. Iz Teoreme 2.17, kako su R(A) iN(A) komplementarni, sledi da je indeks matrice A jednak 1. Dakle, potreban uslov zanalazenje matrice X koja ispunjava navedene jednakosti je da je A (kvadratna) matricaindeksa 1. Ovo je i dovoljan uslov o cemu svedoci naredna teorema.

Teorema 1 Za matricu A ∈ Cn×n postoji matrica X koja ispunjava jednakosti (1), (2),(3) ako i samo ako je ind(A) = 1. U tom slucaju, matrica X je jedinstveno odredena.

Dokaz. Da je uslov ind(A) potreban, sledi iz predasnjeg razmatranja. Da je uslovind(A) = 1, tj. R(A)⊕N(A) = Cn dovoljan i da je, u tom slucaju, matrica X jedinstvenoodredena, sledi iz Teoreme 3.7. Naime, posto su R(A) i N(A) komplementarni prostori,iz Teoreme 3.7 sledi da postoji {1, 2}-inverz X matrice A, cija je slika jednaka sa R(A),a jezgro jednako sa N(A). Zbog toga, sem sto direktno zadovoljava jednakosti (1) i (2),matrica X zadovoljava i jednakost (3), jer su u tom slucaju projektori AX i XA jednaki,posto imaju jednake slike i jezgra. Sa druge strane, bilo koja matrica koja zadovoljavajednakosti (1), (2), (3), jeste {1, 2}-inverz sa slikom R(A) i jezgrom N(A), a kako jeR(A)⊕N(A) = Cn, iz Teoreme 3.7 sledi da postoji tacno jedna takva matrica. �

Definicija 1 Matricu X koja zadovoljava jednakosti (1), (2) i (3) nazivamo grupniinverz matrice A.

Dakle, grupni inverz matrice A postoji ako i samo ako je indeks matrice A jednak1. U tom slucaju je jedinstven i uobicajeno se obelezava sa A#. Neke od elementarnihosobina grupnog inverza sadrzane su u narednoj teoremi.

Teorema 2 Neka je A matrica indeksa 1. Tada vazi:(a) Ako je A regularna matrica, tada je A# = A−1;(b) A## = A;(c) (A#)∗ = (A∗)#;(d) (A#)T = (AT )#

(e) (Al)# = (A#)l, za svaki prirodan broj l;(f) R(A#) = R(A) i N(A#) = N(A).

Dokaz. Tvrdenja (a),(b),(c) i (d) dokazuju se direktno, dok smo tvrdenje (f) vecdokazali. Jedini, eventualno, neocigledan deo je (e). Ipak, koristeci komutativnost ma-trica A i A#, tvrdenje (e) se, takode, direktno dokazuje. �

Naredna teorema predstavlja neposrednu posledicu Teoreme 3.7 i Teoreme 2.(f)

Teorema 3 Neka je ind(A) = 1. Ako je X ∈ A{1, 2} tako da je R(X) = R(A) iN(X) = N(A), tada je X = A#.

Page 30: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

29

Opravdanje za naziv grupni inverz nalazimo u narednoj teoremi. Napominjemo danulti stepen matrice definisemo kao jedinicnu matricu.

Teorema 4 Neka je A matrica indeksa 1 i A# njen grupni inverz. Skup A = {Ak(A#)l :k, l ∈ N0, k + l > 0} sa operacijom mnozenja matrica cini Abelovu grupu sa jedinicomAA#.

Dokaz. Na osonvu komutativnosti matrica A i A#, zakljucujemo da je skup A zatvorenu odnosu na operaciju mnozenja, pa sa tom operacijom cini grupoid, tj. polugrupu, jer jemnozenje matrica asocijativno i to komutativnu polugrupu. Da je AA# jedinica ove polu-grupe dokazujemo jednostavno: Ak(A#)lAA# = Ak(A#)l−1A#AA# = Ak(A#)l, ukolikoje l > 0, a u slucaju da je l = 0, mora biti k > 0, pa je tada AkAA# = Ak−1AA#A = Ak.Ostalo je jos da pokazemo da svaki element iz skupa A ima inverz. Ako je Ak(A#)l

proizvoljan element ovog skupa, njegov inverz je Al(A#)k, jer je Ak(A#)lAl(A#)k =(A(A#))k+l = AA#, jer smo vec pokazali da je AA# jedinica u ovoj strukturi. Dakle,skup A sa operacijom mnozenja matrica zaista jeste Abelova grupa. �

Upravo dokazana teorema, u slucaju regularne matrice A, kada je A# = A−1, nepredstavlja iznenadenje. Ono sto je zanimljivo je to da i u slucaju singularne matriceindeksa 1, skupu A formalno mozemo dati oblik koji lici na slucaj regularne matrice A.Naime, ako uvedemo negativne stepene matrice A na sledeci nacin: A−l = (A#)l, l ∈ Ni definisemo A0 = AA#, tada za bilo koja dva cela broja l i m vazi AlAm = Al+m,sto se pokazuje direktno. Zbog toga skup A definisan sa A = {Al : l ∈ Z}, gdesmo nepozitivne stepene definisali na opisan nacin, sa operacijom mnozenja matrica ciniAbelovu grupu.

Narednom teoremom dacemo drugacije uslove za postojanje grupnog inverza matriceA, precnizije, opisacemo grupni inverz matrice A pomocu faktorizacije potpunog rangamatrice.

Teorema 5 Neka je A = FG faktorizacija potpunog ranga matrice A. Grupni inverzmatrice A postoji ako i samo ako je matrica GF regularna. U tom slucaju je

A# = F (GF )−2G. (4)

Dokaz. Pretpostavimo da postoji grupni inverz matrice A ∈ Cn×n, tj. da je matricaA indeksa 1. Tada je r(A) = r(A2) = r, tj. r(FG) = r(FGFG) i pri tom je F ∈ Cn×r

r ,G ∈ Cr×n

r i GF ∈ Cr×r. Ako bi vazilo r(GF ) = l < r tada bi dobili r = r(A) =r(FG) = r(FGFG) ≤ r(GF ) = l < r, sto nije moguce. Zbog toga je r(GF ) = r, paje GF regularna matrica. Sa druge strane, ako je GF regularna matrica, tada matricaX definisana sa X = F (GF )−2G jeste resenje jednacina (1), (2) i (3), sto se utvrdujedirektno, pa u ovom slucaju neposredno dokazujemo egzistenciju grupnog inverza, kao ito da za njega vazi jednakost (4). �

Jos jedan od nacina izrazavanja grupnog inverza dat je narednom teoremom.

Teorema 6 Za matricu A indeksa 1 vazi

A# = A(A3)(1)A,

gde je (A3)(1) ∈ A3{1} proizvoljan.

Page 31: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

30

Dokaz. Neka je X = A(A3)(1)A. Matrica A je indeksa 1, pa je zato (izmedu ostalog)R(A) = R(A3) i N(A) = N(A2). Iz Leme 3.1 sledi da postoje matrice K i L takve daje A = A3K i LA2 = A. Pored toga, kako je R(A3) = R(A2) i A3(A3)(1) je projektor naR(A3), vazi A3(A3)(1)A2 = A2. Zato je

XAX = A(A3)(1)A3(A3)(1)A = A(A3)(1)A3(A3)(1)A3K = A(A3)(1)A3K = A(A3)(1)A,

kao i

AXA = AA(A3)(1)A2 = LA2A(A3)(1)A2 = LA3(A3)(1)A2 = LA2 = A.

Ovim smo pokazali da je X {1, 2}-inverz matrice A. Kako je R(X) = R(A(A3)(1)A) ⊂R(A) i N(X) = N(A(A3)(1)A) ⊃ N(A), a pored toga vazi i r(X) = r(A) (jer je X{1, 2}-inverz od A), imamo da je R(X) = R(A) i N(X) = N(A). Zato je AX = XA,cime smo pokazali da je X upravo onaj {1, 2}-inverz matrice A koji komutira sa A, tj.grupni inverz matrice A. �

Na kraju ovog poglavlja, proucimo i povezanost izmedu grupnog i Moore-Penroseovoginverza matrice. Vec smo dokazali u Teoremi 3.14 da za proizvoljnu (pravougaonu)matricu A vazi da je A† onaj {1, 2}-inverz cija je slika upravo R(A∗), a jezgro upravoN(A∗). Sa druge strane, za grupni inverz A# vazi (onda kada on postoji) da je to {1, 2}-inverz cija je slika R(A), a jezgro N(A). U narednoj teoremi opisujemo slucajeve kadasu ova dva inverza jednaka.

Teorema 7 Za proizvoljnu kvadratnu matricu A vazi:(a) Ako je A matrica indeksa 1 i ako je A† = A# tada je R(A) = R(A∗) i N(A) = N(A∗);(b) Ako je R(A) = R(A∗) tada je matrica A indeksa 1 i vazi A† = A#;(c) Ako je N(A) = N(A∗) tada je matrica A indeksa 1 i vazi A† = A#.

Dokaz. (a) Ako je A† = A#, tada je R(A†) = R(A#) i N(A†) = N(A#) odakledirektno sledi tvrdenje teoreme.

(b) i (c) Jednakost R(A) = R(A∗), ekvivalentna je sa N(A) = N(A∗), jer je R(A)⊥ =N(A∗) i R(A∗)⊥ = N(A), zbog toga tvrdenja (b) i (c) dokazujemo odjednom. Iz R(A) =R(A∗) dobijamo R(A) = N(A)⊥, tj. R(A) i N(A) su ortogonalni komplementi. Odavdenajpre sledi da je matrica A indeksa 1 i da postoji grupni inverz. Zatim, grupni inverz je{1, 2}-inverz sa slikom R(A) = R(A∗) i jezgrom N(A) = N(A∗). Iz Teoreme 3.14 sledida je i A† {1, 2}-inverz matrice A sa tom slikom i jezgrom, a iz Teoreme 3.7 onda slediA† = A#. �

Definicija 2 Matrica A za koju vazi R(A) = R(A∗) naziva se rang-ermitska, ili EP-matrica.

Prethodnu teoremu mozemo iskazati na sledeci nacin, sa izvesnim, ali lako pre-mostivim, nepreciznostima u vezi sa egzistencijom grupnog inverza.

Teorema 8 Za matricu A vazi A† = A# ako i samo ako je A rang-ermitska matrica.

Page 32: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

31

Iz prethodnih razmatranja sledi da je matrica A rang-ermitska ako i samo ako jeN(A) = N(A∗). Primera radi, svaka normalna matrica A jeste rang-ermitska, jer je, poTeoremi 2.9, N(A) = N(A∗A) = N(AA∗) = N(A∗), pa je za svaku normalnu matricunjen Moore-Penroseov inverz ujedno i grupni inverz.

Jos jedan prirodan nacin za karakterizaciju rang-ermitskih matrica daje narednateorema.

Teorema 9 Matrica A komutira sa svojim Moore-Penroseovim inverzom A† ako i samoako je A rang-ermitska matrica.

Dokaz. Ako je A rang-ermitska, tada postoji grupni inverz A# i on se poklapa sa A†,pa je zbog toga AA† = A†A. Sa druge strane, ako je AA† = A†A, tada je A† zajednickoresenje jednacina (1), (2), (3). Odatle sledi da je A† upravo grupni inverz matrice A, aodatle da je ona rang-ermitska. �

4.2 Definicija Drazinovog inverza

U ovom poglavlju definisacemo generalisani inverz matrice A koji se naziva Drazinovinverz. U slucaju da je matrica A indeksa 1, Drazinov inverz ce se poklapati sa grup-nim inverzom, a za razliku od grupnog inverza, Drazinov inverz ce postojati za bilokoju kvadratnu matricu. U tom smislu, mozemo ga smatrati uopstenjem grupnog in-verza. Napomenimo i to da cemo u ovom poglavlju Drazinov inverz matrice definisatine upustajuci se u operatorsku prirodu matrice, kao i sve inverze do sada. Ipak, nalikna Teoremu 3.15, i u ovom slucaju cemo pokazati na kojim je podprostorima Drazinovinverz zapravo inverz. Kao i u slucaju Moore-Penroseovog inverza, tako i ovde, upravote teoreme mogu posluziti kao definicije tih inverza (narocito u opstijim okolnostima, naBanachovim i Hilbertovim prostorima). Drazinov inverz prvi put se javlja u radu [5], aliu opsijim algebarskim strukturama.

Kod grupnog inverza, za matricu A trazili smo matricu X koja je resenje jednacina(1), (2), (3). Da bi postojalo zajednicko resenje tih jednacina morali smo da nametnemoneke osobine matrici A. U ovom slucaju, za datu proizvoljnu matricu A, pitamo se da lipostoji prirodan broj k i matrica X koja istovremeno zadovoljava naredne tri jednakosti:

AkXA = Ak (1k)

XAX = X (2)

AX = XA. (3)

Za fiksirano k, sistem jednacina (1k), (2), (3) ekvivalentan je sledecem sistemujednacina:

Ak+1X = Ak (1′k)

XAX = X (2)

AX = XA. (3)

Page 33: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

32

Da bi jednacina (1′k) imala resenje, potrebno je da vazi R(Ak) = R(Ak+1X) ⊂R(Ak+1) ⊂ R(Ak), odakle sledi da mora da vazi R(Ak) = R(Ak+1), tj. ind(A) ≤ k.Koristeci Lemu 3.1 zakljucujemo da je ind(A) ≤ k i dovoljan uslov za egzistenciju resenjajednacine (1′k). Zaista, ako je ind(A) ≤ k, tada je R(Ak) = R(Ak+1), pa postoji matricaX za koju je Ak = Ak+1X. Dakle, da bi jednacina (1′k) imala resenje potrebno je idovoljno da broj k nije manji od indeksa matrice A. Ciljani rezultat ovog poglavljaglasi: za svako k ≥ ind(A), sistem jednacina (1′k),(2),(3) ima jedinstveno resenje i poredtoga, to resenje ne zavisi od prirodnog broja k, tj. za svako k ≥ ind(A), kao resenjesistema (1′k),(2),(3), dobija se jedna te ista matrica. Tu matricu cemo obeleziti sa AD izvati Drazinov inverz matrice A.

Da bi dokazali navedenu tvrdnju, dokazacemo najpre nekoliko lema.

Lema 1 Za matricu A, neka je k najmanji prirodan broj za koji jednacina (1′k) imaresenje, a l red nule λ = 0 minimalnog polinoma m(λ) matrice A, ukoliko je A singularnamatrica, a u suprotnom neka je l = 1. Tada vazi

ind(A) = k = l.

Dokaz. Ukoliko je matrica A regularna, tada je ind(A) = k = l = 1. Pretpostavimozato da je matrica A singularna. Vec smo pokazali da, ako jednacina (1′k) ima resenje,mora da vazi k ≥ ind(A). Sa druge strane, kako je R(Aind(A)) = R(Aind(A)+1), po Lemi3.1 postoji matrica X tako da je Aind(A) = Aind(A)+1X. Dakle k = ind(A).

Pokazimo da je k = l. Neka je m(λ) = λlp(λ) i p(0) 6= 0. Vazi O = m(A) = p(A)Al.Kada bi bilo l > k, tada iz Ak+1X = Ak, sledi AlX = Al−1, pa bi zato imali

O = p(A)AlX = p(A)Al−1,

sto nije moguce, jer ne moze matrica A biti nula polinoma p(λ)λl−1, koji je manjegstepena od m(λ). Dakle l ≤ k. Posto p(0) 6= 0, polinom p(λ) mozemo zapisati kao

p(λ) = c(1− λq(λ)). (5)

Iz p(A)Al = O sada dobijamo c(I − Aq(A))Al = O, tj. imajuci u vidu da A i q(A)komutiraju:

Al+1q(A) = Al.

Broj k je najmanji prirodan broj za koji jednacina (1′k) ima resenje, pa dobijamo da jel ≥ k. Dakle l = k, cime smo pokazali i ind(A) = k = l. �

Lema 2 Za svaku matricu A, postoji resenje sistema jednacina (1′ind(A)), (3).

Dokaz. Koristeci Lemu 1, nalazimo da je q(A) resenje sistema jednacina (1′ind(A)), (3),gde je polinom q(λ) definisan jednakoscu (5). Zaista, vazi (koristimo oznake iz Leme 1)Al+1q(A) = Al i ind(A) = l i Aq(A) = q(A)A, jer je q(A) polinom po A. Napomenimoda definicija polinoma q(λ) ne zavisi od regularnosti matrice A i ako smo ga u dokazuLeme 1 definisali tek nakon pretpostavke da je A singularna matrica. U slucaju regularnematrice bi zapravo bilo m(λ) = p(λ) kao i q(A) = A−1. �

Page 34: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

33

Lema 3 Neka je Y zajednicno resenje jednacina (1′k) i (3), za neko k ∈ N. Tada je

X = AkY k+1

resenje sistema jednacina (1′k), (2), (3).

Dokaz. Kako A i Y komutiraju, X jeste resenje jednacine (3). Posto je Ak+1Y = Ak,onda je i Al+1Y = Al, za svako l ≥ k. Koristeci to, dobijamo:

Ak+1X = A2k+1Y k+1 = A2kY k = ... = Ak,

pa je X resenje i jednacine (1′k). Na kraju, imamo i

XAX = A2k+1Y 2k+2 = A2kY 2k+1 = ... = AkY k+1 = X.

Teorema 10 Neka je ind(A) = k. Sistem jednacina (1′k),(2),(3) ima jedinstveno resenjei ono se moze izraziti kao polinom po A. Takode, za svako l ≥ k, sistem jednacina(1′l), (2), (3) ima jedinstveno resenje i ono se poklapa sa resenjem sistema jednacina(1′k),(2),(3). Za l < k, sistem jednacina (1′l), (2), (3) nema resenja.

Dokaz. Iz Lema 1, 2 i 3 dobijamo da je X = Ak(q(A))k+1 resenje sistema jednacina(1′k),(2),(3). Za svako l ≥ k, matrica X jeste resenje i sistema jednacina (1′l), (2), (3),sto se jednostavno uocava. Ukoliko je l < k, tada jednacina (1′l) nema resenja, o cemusmo vec diskutovali. Takode, neposredno se uocava da smo X izrazili kao polinom poA. Da bi kompletirali dokaz svih tvrdenja iz teoreme, potrebno je jos da pokazemo dasistem jednacina (1′l), (2), (3) ne moze imati vise od jednog resenja.

Neka je Y jos jedno resenje sistema jednacina (1′l), (2), (3), za neko l ≥ k. Oznacimosa E = AX = XA i F = AY = Y A. Matrice E i F su idempotentne, pa je

E = AX = (AX)l = AlX l = AY AlX l = F (AX)l = FE,

F = Y A = (Y A)l = Y lAl = Y lAlXA = (Y A)lE = FE.

Dakle, vazi E = F . Najzad dobijamo:

X = XAX = EX = FX = Y AX = Y E = Y F = Y AY = Y,

cime smo zavrsili dokaz ove teoreme. �

Dakle: ako za neki prirodan broj k sistem jednacina (1′k),(2),(3) ima resenje (apokazali smo da je to slucaj za svako k ≥ ind(A)), to resenje je upravo matrica X defin-isana u prethodnoj teoremi. Ta matrica naziva se Drazinov inverz matrice A i najcesce seobelezava sa AD. Kao sto vidimo, Drazinov inverz postoji za svaku (kvadratnu) matricuA.

Page 35: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

34

4.3 Osobine Drazinovog inverza

Osnovne osobine Drazinovog inverza sadrzane su u narednoj teoremi.

Teorema 11 Neka je A proizvoljna matrica i ind(A) = k. Tada vazi:(a) (A∗)D = (AD)∗;(b) (AT )D = (AD)T ;(c) (Al)D = (AD)l, l ∈ N;(d) k = 1 ⇒ AD = A#;(e) Za prirodne brojeve l > m vazi Am(AD)l = (AD)l−m;(f) Za prirodne brojeve l,m za koje je l −m ≥ k vazi Al(AD)m = Al−m;(g) Ako je X regularna matrica, tada vazi A = XBX−1 ⇒ AD = XBDX−1;(h) Za svako l ≥ k, matrica Al je indeksa 1 i (Al)# = (AD)l;(i) ind(AD) = 1 i (AD)# = A2AD;(j) (AD)D = A ako i samo ako je k = 1;(k) ((AD)D)D = AD;(l) Za svako l ≥ k vazi R(AD) = R(Al) i N(AD) = N(Al);(m) Ako je A nilpotentna matrica, tada je AD = O.

Dokaz. Tvrdenja (a), (b) i (d) necemo dokazivati jer su ocigledni.

(c) Kako je Ak+1AD = Ak i A i AD komutiraju, mozemo da stepenujemo sa l i levu idesnu stranu jednakosti i dobijamo (Al)k+1(AD)l = (Al)k. Pored toga, Al i (AD)l takodekomutiraju i vazi (AD)lAl(AD)l = (ADAAD)l = (AD)l. Dakle, (AD)l je zaista Drazinovinverz matrice (Al)D (mada k ne mora biti indeks matrice Al).

(e) Direktno sledi iz komutativnosti matrica A i AD i osobine ADAAD = AD.

(f) Direktno sledi iz komutativnosti matrica A i AD i osobine Ak+1AD = Ak.

(g) Matrice A = XBX−1 i XBDX−1 komutiraju i vazi (XBDX−1)XBX−1(XBDX−1) =XBDX−1. Za neko l je Bl+1BD = Bl, pa je i XBl+1X−1XBDX−1 = XBlX−1, tj.Al+1(XBDX−1) = Al, jer je Ap = (XBX−1)p = XBpX−1, za svako p ∈ N. DakleAD = XBDX−1.

(h) Da je za svako l ≥ k, ind(Al) = 1 sledi iz toga sto je za l ≥ k R(Al) = R(Ak), pa jeR(Al) = R(Ak) = R(A2l) = R((Al)2). Drugi deo tvrdenja sledi iz (d) i (c).

(i) Kako je ADAAD = AD, tj. (AD)2A = AD, jednacina (AD)2X = AD ima resenje,pa je ind(AD) = 1. Matrica AD komutira sa A2AD. Sem toga, (A2AD)AD(A2AD) =A4(AD)3 = A2AD i AD(A2AD)AD = A2(AD)3 = AD, cime smo pokazali da je (AD)# =A2AD.

(j) Ako je (AD)D = A, onda je ind(A) = ind((AD)D) = ind(BD) = 1. Sa drugestrane, ako je ind(A) = 1, onda je AD = A#, a takode je i (AD)D = (AD)#, pa je(AD)D = (A#)# = A.

(k) Obelezimo sa B = AD. Koristeci (g) i (h) dobijamo ind(B) = 1 i (BD)D = B, tj.((AD)D)D = AD.

(l) Matrica Ak je indeksa 1 i zato je (Ak)D = (Ak)# (deo (d)), a sa druge strane je(Ak)D = (AD)k (deo (c)), dok je matrica AD takode indeksa 1. Koristeci to sto za

Page 36: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

35

matricu B indeksa 1 vazi R(B) = R(B#) kao i N(B) = N(B#) dobijamo:

R(Ak) = R((Ak)#) = R((Ak)D) = R((AD)k) = R(AD).

Analogno izvodimo zakljucak i za jezgra. Za bilo koje l ≥ k vazi R(Al) = R(Ak) iN(Al) = N(Ak), pa sledi tvrdenje ovog dela teoreme.

(m) Direktno sledi iz (l). �

Dokazimo jos neka bitna i interesantna tvrdenja u vezi sa Drazinovim inverzom.

Teorema 12 Neka je ind(A) = k. Matrica AAD = ADA je projektor na R(AD) = R(Ak)paralelno sa N(AD) = N(Ak).

Dokaz. Da je matrica AAD = ADA projektor, sledi iz osobine ADAAD = AD. Iznavedene osobine, takode, sledi i A ∈ AD{1}, pa iz Teoreme 3.3 zakljucujemo da jeR(ADA) = R(AD) = R(Ak) i N(ADA) = N(AAD) = N(AD) = N(Ak). �

U narednoj teoremi pokazacemo, izmedu ostalog, da se grupni inverz matrice, ondakada on postoji, moze izraziti kao polinom te matrice. Imamo na umu da nakon Teoreme10, ta cinjenica ne predstavlja iznenadenje.

Teorema 13 Neka je A proizvoljna matrica. Postoji {1, 2}-inverz matrice A koji semoze izraziti kao polinom po A ako i samo ako je ind(A) = 1. U tom slucaju je taj{1, 2}-inverz upravo grupni inverz matrice A i vazi

A# = A(q(A))2,

gde je polinom q(λ) definisan kao u (5).

Dokaz. Ako postoji {1, 2}-inverz X matrice A koji je jednak polinomu po A, tada Xkomutira sa A, pa je on upravo grupni inverz matrice A. Zbog toga je i ind(A) = 1.Ukoliko je ind(A) = 1, tada, kao u dokazu Teoreme 10, Drazinov inverz matrice A jednakje AD = A(q(A))2. Posto je ind(A) = 1, vazi AD = A#, pa je ovo upravo zeljeni {1, 2}-inverz matrice A koji je jednak nekom polinomu po A. Drugi deo tvrdenja direktno slediiz prvog. �

Dajemo jos jednu karakterizaciju rang-ermitskih matrica i posledicu koja povezujeDrazinov i Moore-Penroseov inverz.

Teorema 14 Matrica A je rang-ermitska ako i samo ako se A† moze izraziti kao polinompo A.

Dokaz. Ako je A rang-ermitska, tada je A† = A#, a upravo smo pokazali da se A#

moze izraziti kao polinom po A. Sa druge strane, ako se A† moze izraziti kao polinompo A, tada A† komutira sa A, pa iz Teoreme 9 zakljucujemo da je A rang-ermitska. �

Posledica 1 Za matricu A vazi A† = AD ako i samo ako je A rang-ermitska matrica.

Page 37: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

36

Dokaz. Ako je A† = AD, tada je A† jednak nekom polinomu po A, pa po prethodnojteoremi zakljucujemo da matrica A mora biti rang-ermitska. Ukoliko je A rang-ermitska,iz Teoreme 8 sledi da je A# = A†, tj. AD = A†. �

Analogno Teoremi 6, dokazacemo da se i Drazinov inverz moze dobiti na slican nacin.Zapravo, Teorema 6 bice specijalan slucaj naredne teoreme. Sem toga, narednu teoremucemo iskoristiti u poslednjem poglavlju ove glave, kada se budemo bavili neprekidnoscuDrazinovog inverza.

Teorema 15 Neka je l proizvoljan prirodan broj takav da je l ≥ ind(A). Tada vazi

AD = Al(A2l+1)(1)Al,

gde je (A2l+1)(1) ∈ A2l+1{1} proizvoljan.

Dokaz. Obelezimo sa X = Al(A2l+1)(1)Al. Broj l nije manji od indeksa matriceA i zato je R(Al) = R(A2l+1). Matrica A2l+1(A2l+1)(1) je projektor na R(A2l+1) =R(Al), pa je A2l+1(A2l+1)(1)Al = Al. Zbog toga je Al+1X = Al. Dalje, imamo XAX =Al(A2l+1)(1)A2l+1(A2l+1)(1)Al = Al(A2l+1)(1)Al = X. Ostalo je jos da pokazemo da jeAX = XA. Posto je N(Al) = N(A2l+1), zbog Leme 3.1 znamo da postoji matrica Ktakva da je Al = KA2l+1. Posto je i A2l+1(A2l+1)(1)Al+1 = Al+1, jer je R(A2l+1) =R(Al+1), vazi:

AX = AAl(A2l+1)(1)Al = KAA2l+1(A2l+1)(1)Al = KAl+1, kao i

XA = Al(A2l+1)(1)Al+1 = KA2l+1(A2l+1)(1)Al+1 = KAl+1.

Pokazali smo da je AX = XA, te je zaista AD = Al(A2l+1)(1)Al. �

U narednoj teoremi, opisacemo Drazinov inverz proizvoda matrica.

Teorema 16 Za matrice A,B ∈ Cn×n vazi (AB)D = A((BA)D)2B. Ukoliko matrice Ai B komutiraju, tada je (AB)D = ADBD = BDAD, kao i ABD = BDA i BAD = ADB.

Dokaz. Neka jeX = A((BA)D)2B. Tada jeXABX = A((BA)D)2BABA((BA)D)2B =A((BA)D)2B, kao i XAB = A((BA)D)2BAB = ABA((BA)D)2B = ABX. Neka jek = ind(BA). Tada vazi

(AB)k+2X = (AB)k+2A((BA)D)2B = (AB)k+1ABA((BA)D)2B =

= (AB)k+1A(BA)DB = A(BA)k+1(BA)DB = A(BA)kB = (AB)k+1.

Ovim smo pokazali da je (AB)D = A((BA)D)2B. Dokazimo i drugi deo tvrdenja. Ma-trice AD i BD mogu se izraziti kao polinomi po A, odnosno, B. Zato iz AB = BAsledi i ADBD = BDAD, zatim ABD = BDA, kao i BAD = ADB. Ostalo je josda pokazemo da je (AB)D = BDAD. Jasno je da AB komutira sa BDAD, a vazi iBDAD(AB)BDAD = (BDBBD)(ADAAD) = BDAD. Ako je l = max{ind(A), ind(B)},tada je (AB)l+1BDAD = Al+1ADBl+1BD = AlBl = (AB)l. Dakle, zaista jeste (AB)D =BDAD. �

Page 38: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

37

Za matricu A, matrica (AD)#, tj. (AD)D (znamo da je ind(AD) = 1), predstavlja”inverz od inverza”. U slucaju da je A regularna matrica, ili singularna indeksa 1, (AD)D

bi bila jednaka sa A (Teorema 11.(j)). Ipak i u slucaju singularne matrica A vecegindeksa, razlika A − (AD)D ”nije daleko” od nule. Tacnije, matrica A − (AD)D = N jenilpotentna i ovakav zapis A = (AD)D+N naziva se indeks 1 - nilpotentna dekompozicija1

matrice A iz ociglednih razloga. Naredna teorema govori o ovoj dekompoziciji.

Teorema 17 Za matricu A postoje jedinstvene matrice B i N koje zadovoljavaju sledecacetiri uslova:

(i) A = B +N ;

(ii) ind(B) = 1;

(iii) N je nilpotentna matrica;

(iv) BN = NB = O.

Pored toga, vazi B = (AD)#, kao i ind(A) = n(N).

Dokaz. Pokazimo prvo da matrice B = (AD)# i N = A − (AD)# imaju navedeneosobine. Iz same konstrukcije sledi B +N = A, a iz Teoreme 11.(i) sledi da je (AD)# =A2AD = AADA, pa je BN = NB = O. Sem toga, iz iste teoreme sledi i ind(AD) = 1,pa je ind(B) = 1. Matrica N jednaka je A − (AD)# = A − A2AD = A(I − AAD), amatrica I − AAD je idempotentna (Teorema 12). Zbog toga je Nk = Ak(I − AAD), paje Nk = O ako i samo ako je Ak+1AD = Ak. Najmanji prirodan broj k za koji jednacinaAk+1X = Ak ima resenje je upravo ind(A) (Lema 1), a jedno od tih resenja je, naravno,AD i zato je ind(A) = n(N).

Pokazimo sada da, ako matrice B i N imaju osobine (i), (ii), (iii), (iv), onda to im-plicira B = (AD)#, tj. B# = AD. Time cemo dokazati jedinstvenost matrica B i N .Kako je BN = O, mnozeci sa leve strane sa (B#)2 i koristeci B#BB# = B#, dobijamoB#N = O. Analogno vazi i NB# = O. Zbog toga je AB# = BB# = B#B = B#A,a odatle sledi i A(B#)2 = B#BB# = B#. Iz uslova (iii) sledi da je, za svaki prirodanbroj l: Al = (B + N)l = Bl + N l, pa ce za l ≥ n(N) vaziti N l = O, tj. Al = Bl. Sadaimamo Al+1B# = Bl+1B# = Bl = Al. Dakle, matrica B# komutira sa A, pored toga jeB# ∈ A{2}, a vazi i Al+1B# = Al. Zato je AD = B#, pa je (AD)# = (B#)# = B, sto jei trebalo pokazati. �

Matricu N iz prethodne teoreme nazivamo nilpotentni deo matrice A i obelezavamosa A(N). Dokazimo sada kako se iz Zordanove normalne forme matrice A mogu izrazitimatrice AD, (AD)# i A(N).

Teorema 18 Neka je

J =

[J1 OO J0

]= P−1AP,

1Matrica (AD)D naziva se jos i jezgro ili srz matrice A - na engleskom jeziku core. Zbog toga seovakva dekompozicija naziva i core-nilpotent dekompozicija.

Page 39: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

38

Zordanova normalna forma matrice A, gde je J1 kvazidijagonalna matrica sastavljenaiz Zordanovih blokova koji odgovaraju nenula sopstvenim vrednostima, dok je J0 kvazdi-jagonalna matrica sastavljena od blokova koji odgovaraju sopstvenoj vrednosti 0. Tadaje:

AD = P

[J−11 OO O

]P−1, zatim (AD)# = P

[J1 OO O

]P−1 i A(N) = P

[O OO J0

]P−1.

Dokaz. Ako je k ≥ ind(A), tada je

Ak = (PJP−1)k = PJkP−1 = P

[Jk1 OO Jk0

]P−1 = P

[Jk1 OO O

]P−1.

Zbog toga je Ak+1P

[J−11 OO O

]P−1 = Ak. Dalje, imamo

P

[J−11 OO O

]P−1AP

[J−11 OO O

]P−1 = P

[J−11 OO O

] [J1 OO J0

] [J−11 OO O

]P−1 =

= P

[J−11 OO O

]P−1.

Komutativnost se, takode, ispituje neposredno:

AP

[J−11 OO O

]P−1 = P

[I OO O

]P−1 = P

[J−11 OO O

]P−1A.

Dakle, zaista je AD =

[J−11 OO O

]. Neka je

B = P

[J1 OO O

]P−1 i N = P

[O OO J0

]P−1.

Iz same definicije sledi A = B+N . Matrica B je indeksa 1 jer je r(B) = r(B2) = r(J1) =r(J2

1 ), dok je matrica N nilpotentna, jer je N s = O, gde je s × s dimenzija matrice J0.Vazi i BN = O = NB, pa na osnovu Teoreme 17 zakljucujemo da je B = (AD)# iN = A(N). �

Posmatrajmo sada matricu A ∈ Cn×n kao linearni operator na prostoru Cn. Pret-postavimo da matrica A nije nilpotentna. Ukoliko je ind(A) = k, tada je Cn =R(Ak) ⊕ N(Ak), zatim R(Ak) 6= {0} i za svaki vektor x ∈ Cn postoje jedinstveni vek-tori xR i xN za koje je x = xR + xN , xR ∈ R(Ak) i xN ∈ N(Ak). Prostor R(Ak) jeinvarijantan u odnosu na A, pa mozemo posmatrati redukciju A1 : R(Ak)→ R(Ak) op-eratora A na R(Ak). Pored toga, A1(R(Ak)) = A(R(Ak)) = R(Ak+1) = R(Ak), pa je A1

surjekcija, odnosno bijekcija, po poznatom tvrdenju za linearne operatore na konacno-dimenzionalnim vektorskim prostorima. Zbog toga, postoji A−11 : R(Ak) → R(Ak).Definisimo operator B na Cn na sledeci nacin: Bx = A−11 xR. Iz navedenih razloga B jedobro definisano preslikavanje. Uz navedene osnake dokazimo narednu teoremu.

Page 40: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

39

Teorema 19 Za matricu A koja nije nilpotentna, vazi AD = B.

Dokaz. Dokazimo prvo da A i B komutiraju. Za proizvoljno x ∈ Cn vazi AxR ∈ R(Ak)i AxN ∈ N(Ak), pa je BAx = B(AxR + Axn) = BAxR = A−11 AxR = A−11 A1xR = xR, atakode je i ABx = AA−11 xR = A1A

−11 xR = xR, pa je AB = BA. Zatim, za svako y je

Aky ∈ R(Ak), pa je Aky = (Aky)R i zato je, za svako x ∈ Cn: BAk+1x = BAk(Ax) =A−11 Ak(Ax) = A−11 A(Akx) = A−11 A1(A

kx) = Akx. Ovim smo pokazali da je BAk+1 = Ak.Ostalo je jos da dokazemo da je BAB = B. Za svako x ∈ Cn vazi BABx = BAA−11 xR =BA1A

−11 xR = BxR, a takode je i Bx = BxR, pa smo pokazali da vazi i BAB = B.

Dakle, zaista je AD = B. �

U Teoremi 3.15 pokazali smo da je A† inverz koji se moze definisati u odnosu nadekompoziciju prostora Cn = R(A∗) ⊕ N(A) = R(A) ⊕ N(A∗), jer je A invertibilnopreslikavanje posmatrano na domenu R(A∗) i kodomenu R(A). U slucaju Drazinovog(odnosno grupnog) inverza, dekompozicija prostora za koju vezujemo Drazinov inverz jeCn = R(Aind(A))⊕N(Aind(A)), jer je u ovom slucaju A invertibilno preslikavanje prostoraR(Aind(A)) na samog sebe.

4.4 Osobine spektra grupnog i Drazinovog inverza

U ovom poglavlju dokazacemo da grupni, odnosno Drazinov inverz matrice, imaju spek-tar sa osobinama koje podsecaju na spektar inverzne matrice, onda kada ona postoji. Uslucaju singularne matrice A, grupni, odnosno Drazinov inverz nece biti jedine matricekoje imaju navedene osobine, ali bice jedine takve u skupu A{1}∪A{2}. Dokazimo prvodve leme koje ce nam kasnije biti od koristi.

Lema 4 Neka je x λ-vektor matrice A, gde je λ 6= 0. Tada za svaki prirodan broj l vazix ∈ R(Al).

Dokaz. Dokaz cemo izvesti indukcijom po l. Kako je x λ-vektor, za neki prirodanbroj p vazi (A− λI)px = 0, tj. x = c1A+ c2A

2 + ...+ cpApx, gde je ci = (−1)i−1λ−i

(pi

).

Dakle, dobili smo x = Ar(A)x, za neki polinom r(λ) i ovim smo pokazali da je x ∈ R(A).Pretpostavimo sada da je x ∈ R(Al) i dokazimo da je x ∈ R(Al+1). Kako je x ∈ R(Al),sledi da je x = Aly, za neko y. Sada imamo x = Ar(A)x = Ar(A)Aly = Al+1r(A)y, paje x ∈ R(Al+1), sto smo i zeleli da pokazemo. �

Lema 5 Neka za matrice A i X i neki prirodan broj l vazi

XAl+1 = Al. (6)

Ako je λ 6= 0, tada je svaki λ-vektor reda p matrice A ujedno i λ−1-vektor reda p matriceX.

Dokaz. Dokaz izvodimo indukcijom po p. Neka je p = 1 i neka je Ax = λx. Tada je iAsx = λsx za svaki prirodan broj s, tj. x = λ−sAsx. Vazi:

Xx = λ−l−1XAl+1x = λ−l−1Alx = λ−1x,

Page 41: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

40

cime smo dokazali bazu indukcije. Pretpostavimo da tvrdenje vazi za p = r i dokazimoda vazi i za p = r + 1.

Neka je x λ-vektor matrice A reda r+ 1. Tada je (A−λI)x λ-vektor matrice A redar, pa je po indukcijskoj pretpostavci, (A− λI)x λ−1-vektor matrice X reda r. Zato je

(X − λ−1I)r(A− λI)x = 0 dok je z = (X − λ−1I)r−1(A− λI)x 6= 0,

pri tom je z sopstveni vektor matrice X koji odgovara sopstvenoj vrednosti λ−1. Izprethodne leme, imamo da je x = Aly, za neko y, sto nam omogucuje da vektor v =(X − λ−1I)x zapisemo na sledeci nacin:

v = (X − λ−1I)Aly = X(Al − λ−1Al+1)y = X(I − λ−1A)Aly = −λ−1X(A− λI)x.

Najzad, dobijamo

(X − λ−1I)r+1x = −λ−1X(X − λ−1I)r(A− λI)x = 0, kao i

(X − λ−1I)rx = −λ−1X(X − λ−1I)r−1(A− λI)x = −λ−1Xz = λ−2z 6= 0.

Ovim smo pokazali da je x λ−1-vektor reda r+1 matrice X, cime smo kompletirali dokazindukcijom. �

Za matrice A i X kazemo da su jedna drugoj S-inverzi ako imaju osobinu da za svakoλ ∈ C i svaki vektor x vazi: x je λ-vektor reda p matrice A ako i samo ako je x λ†-vektorreda p matrice X. Sledeca teorema je jedna od centralnih teorema ovog poglavlja.

Teorema 20 Neka je A ∈ Cn×n matrica indeksa 1. Tada je A# S-inverz matrice A.Sem toga, skup matrica A{1}∪A{2} sadrzi samo jedan S-inverz matrice A i to je upravomatrica A#. Ukoliko matrica A moze da se dijagonalizuje, jedini S-inverz matrice A jeA#.

Dokaz. Dokazimo prvo da su A i A# S-inverzi. Ako primenimo Lemu 5 na matrice Ai A#, imajuci u vidu da je A(A#)2 = A# i A#A2 = A, zakljucujemo da za λ 6= 0 vazi: xje λ-vektor reda p matrice A ako i samo ako je x λ−1-vektor reda p matrice A#. Trebajos pokazati da vazi ista tvrdnja za λ = 0. Kako je ind(A) = 1, svi 0-vektori matrice Asu ujedno i sopstveni vektori matrice A, jer je N(A) = N(A2) = N(A3) = ..., tj. svi onicine skup N(A). Isto vazi i za A#. Kako je N(A) = N(A#), sledi tvrdenje.

Neka je X ∈ A{1}∪A{2} i neka je X S-inverz matrice A. Razmotrimo najpre kakveposledice ima cinjenica da su A i X S-inverzi i da je uz to ind(A) = 1, bez obzira naX ∈ A{1} ∪A{2}. Vec smo objasnili da svi 0-vektori matrice A pripadaju skupu N(A).Svi λ-vektori matrice A, za λ 6= 0 pripadaju skupu R(A), kao sto smo dokazali u Lemi4. Neka je r(A) = dim R(A) = r. Postoji baza e prostora Cn sacinjena od g-sopstvenihvektora matrice A (Teorema 2.18). Kako je dim R(A)+dim N(A) = n i svaki g-sopstvenivektor (pa i svaki vektor iz e) je ili u R(A) ili u N(A), sledi da u bazi e imamo tacnor g-sopstvenih vektora od A koji nisu 0-vektori i n − r onih koji jesu 0-vektori. Onivektori iz e koji nisu 0-vektori za A, razapinju prostor R(A), a oni koji jesu 0-vektorirazapinju prostor N(A). Posmatrajmo sada matricu X. Matrice X i A su S-inverzi, akako svaki 0-vektor matrice A jeste reda 1, sledi da je i svaki 0-vektor matrice X reda

Page 42: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

41

1. Odatle zakljucujemo da je N(X) = N(X2), tj. da je ind(X) = 1. Vektori iz baze esu g-sopstveni vektori i za X (jer su A i X S-inverzi), pa kao i za matricu A, tako i zaX vazi da je svaki od vektora iz e ili u R(X) ili u N(X), u zavisnosti od toga da li je0-vektor za X. No, kako su A i X S-inverzi, vektor iz e je u R(X) ako i samo ako je uR(A) i isto vazi i za N(X) i N(A). Dakle, vazi R(A) = R(X) i N(A) = N(X), kao ir(A) = r(X).

Posto je X ∈ A{1} ∪ A{2} i r(A) = r(X), iz Teoreme 3.6 sledi da je X ∈ A{1, 2}.Sada je X {1, 2}-inverz matrice A za koji je R(A) = R(X) i N(A) = N(X), dakle X jeupravo A#, kao sto je navedeno u Teoremi 3.

Pretpostavimo sada da matrica A moze da se dijagonalizuje i da je X njen S-inverz.Postoji regularna matrica P cije kolone su sopstveni vektori matrice A i takva da jeA = PJP−1, gde je J dijagonalna matrica koja po dijagonali ima sopstvene vrednostimatrice A. Posto su A i X S-inverzi, kolone matrice P predstavljaju sopstvene vektore iza matricu X. Takode, x je λ-vektor za A ako i samo ako je λ†-vektor za X. Zbog togaje XP = PJ ′, gde smo sa J ′ oznacili dijagonalnu matricu koja se dobija od J tako stose na dijagonali svako λ zameni sa λ† (zapravo vazi J ′ = J†). Dakle X = PJ ′P−1 i sadaje trivijalno proveriti da vazi AXA = A, XAX = X i AX = XA, tj. da mora da vaziX = A#. �

Razmotrimo sada matrice indeksa ne obavezno jednakog 1. Iz dokaza prethodneteoreme, izmedu ostalog sledi i da, ako je indeks matrice A jednak 1 i pri tom su A i XS-inverzi, onda je i indeks matrice X jednak 1. Ovo automatski povlaci da, u opstemslucaju, matrica A i AD nisu S-inverzi, jer je ind(AD) = 1. Ipak za λ-vektore, kada jeλ 6= 0, vazi isto tvrdenje kao i u slucaju ind(A) = 1.

Teorema 21 Za proizvoljnu matricu A vazi: ukoliko je λ 6= 0, tada je x λ-vektor redap matrice A ako i samo ako je x λ-vektor reda p matrice AD. Pored toga vazi: x je0-vektor matrice A ako i samo ako je x 0-vektor matrice AD.

Dokaz. Prvi deo tvrdenja direktno sledi iz Leme 5, jer je, za k = ind(A), ADAk+1 = Ak

i A(AD)2 = AD. Vektor x je 0-vektor za A ako i samo ako je x ∈ N(Ak). Ovo sledi izN(Ak) = N(Ak+1) = .... Sa druge strane, posto je ind(AD) = 1, x je 0-vektor za AD akoi samo ako je x ∈ N(AD). Iz Teoreme 11.(l) sledi N(AD) = N(Ak), odakle sledi i drugideo tvrdenja. �

4.5 Neprekidnost Drazinovog inverza

Kao i u slucaju Moore-Penroseovog inverza i ovde cemo odgovoriti na sledece pitanje: akoniz matrica {An} konvergira matrici A, pod kojim uslovima niz matrica {ADn } kovergiramatrici AD? Ovaj rezultat pripisuje se Campbellu i Meyeru, a objavljen je 1975. godineu radu [4]. Dokaz koji cemo ovde prezentovati je znatno kraci od originalnog dokaza.Takode, primeri koje cemo navesti su iz navedenog rada.

Da je neophodno nametnuti neke uslove matricama An, sledi iz istog primera kao kodMoore-Penroseovog inverza.

Page 43: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

42

Primer 1 Ukoliko je An =

[1 00 1

n

]tada je ADn = A−1n =

[1 00 n

], a taj niz ne konvergira.

Da uslov: r(An) = r(A) pocevsi od nekog n0, nije ni dovoljan ni potreban, svedocenaredna dva primera.

Primer 2 Neka je

An =

1 0 00 0 1

n

0 0 0

i A =

1 0 00 0 00 0 0

.Tada An → A i ADn = A = AD, pa ADn → A, ali r(An) > r(A) za svako n.

Primer 3 Neka je

An =

1n

1 0 00 0 0 00 0 0 10 0 0 0

i A =

0 1 0 00 0 0 00 0 0 10 0 0 0

.Tada je

ADn =

n n2 0 00 0 0 00 0 0 00 0 0 0

,dok je AD = O. U ovom slucaju je An → A, r(An) = r(A), ali ADn ne konvergira ka AD.

Obelezimo sa ρ(A) = r(Aind(A)) = r(ADA) = r(AD). Glavna teorema ovog poglavljatvrdi da u slucaju niza {An} koji konvergira ka matrici A, niz ADn konvergira ka AD akoi samo ako postoji n0, tako da je ρ(An) = ρ(A) za svako n ≥ n0. Dokaz da je navedeniuslov dovoljan, oslanja se na Teoremu 3.16.

Teorema 22 Neka je {An} ⊂ Cm×m, A ∈ Cm×m i An → A. Ako pocevsi od nekogindeksa n0 vazi ρ(An) = ρ(A), tada ADn → AD.

Dokaz. Dokazimo prvo da je navedeni uslov potreban. Postupamo analogno kao uTeoremi 3.16. Iz An → A i ADn → AD sledi AnA

Dn → AAD, a odavde i tr(AnA

Dn ) →

tr(AAD). Matrice AnADn i AAD su idempotentne, pa iz Leme 3.3 sledi da je r(AnA

Dn )→

r(AAD). Dakle, mora postojati neki indeks n0 tako da za svako n ≥ n0 vazi r(AnADn ) =

r(AAD), tj. ρ(An) = ρ(A).Dokazimo da je navedeni uslov i dovoljan. Iz Teoreme 15 sledi da je

ADn = Amn (A2m+1n )†Amn i AD = Am(A2m+1)†Am,

jer je m sigurno ne manje od indeksa matrica An i A. Iz An → A sledi i Amn → Am, kaoi A2m+1

n → A2m+1. Kako je ρ(An) = r(Amn ) = r(A2m+1n ) i ρ(A) = r(Am) = r(A2m+1),

sledi da na niz {A2m+1n } mozemo primeniti Teoremu 3.16, pa dobijamo da (A2m+1

n )† →(A2m+1)†. Dakle, vazi ADn = Amn (A2m+1

n )†Amn → Am(A2m+1)†Am = AD.

Page 44: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

43

Neprekidnost Drazinovog inverza ogranicenog operatora na Banachovom prostorurazmatrao je Rakocevic u radu [14], objavljenom 1999. godine. Kao specijalan slucajrezultata iz tog rada, dobija se tvrdenje iz Teoreme 22. U istom radu, dokzane su iteoreme o neprekidnosti Drazinovog inverza na Banachovim algebrama. U radu [16] istogautora, data je odlicna sistematizacija rezultata na temu neprekidnosti generalisanihinverza (Moore-Penroseovog i Drazinovog).

Page 45: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Glava 5

Primene generalisanih inverzamatrice

U ovoj glavi izlozicemo nekoliko upecatljivih primera primene generalisanih inverza. Naj-pre cemo pokazati kako pomocu generalisanih inverza resavamo neke matricne jednacine,od kojih je specijalan slucaj i sistem linearnih jednacina Ax = b. Ovo je i glavna primena{1}-inverza matrice. Pokazacemo kako se, u slucaju protivrecnog sistema jednacina,odreduje ”resenje” koje je, u nekom smislu, najbolje moguce, gde ce nam od koristi biti{1, 3} i {1, 4}-inverzi matrice. Takode, prikazacemo kako se pomocu Drazinovog inverzaresava sistem linearnih diferencijalnih jednacina prvog reda: Ax(t) + Bx(t) = f(t), uslucaju kada je matrica A singularna. Ovo je klasican rezultat Campbella, Meyera iRosea iz 1976. godine objavljen u radu [2]. U [1] i [3] mogu se naci jos mnogo primeraprimene generalisanih inverza, a neki od njih su: primena na probleme linearnog pro-gramiranja, elektricne mreze, lance Markova, diferencne jednacine itd.

5.1 Matricne jednacine i generalisani inverzi

Osnovna teorema ovog poglavlja tice se matricne jednacine AXB = D. Pokazacemokako se pomocu {1}-inverza matrica A i B ispituje da li ova jednacina ima resenja idacemo opis skupa resenja, onda kada on nije prazan. Ovu teoremu je dokazao Penroseu radu [12].

Teorema 1 Neka je A ∈ Cm×n, B ∈ Cp×q, D ∈ Cm×q. Matricna jednacina

AXB = D (1)

ima resenje, ako i samo ako postoje A(1) ∈ A{1} i B(1) ∈ B{1}, takvi da je

AA(1)DB(1)B = D. (2)

U tom slucaju, skup resenja jednacine (1) je

{A(1)DB(1) + Y − A(1)AY BB(1) : Y ∈ Cn×p}, (3)

gde su A(1) i B(1) proizvoljni {1}-inverzi matrica A i B tim redom.

44

Page 46: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

45

Dokaz. Ukoliko jednacina (1) ima resenje X0, tada za svaki A(1) i B(1) vazi

AA(1)DB(1)B = AA(1)AX0BB(1)B = AX0B = D.

Sa druge strane, ako za neki A(1) i B(1) vazi (2), evidentno je da jednacina (1) ima resenje.Fiksirajmo sada proizvoljne A(1) i B(1) i pokazimo da je sa (3) zaista opisan skup

resenja jednacine (1). Neka je X = A(1)DB(1) + Y − A(1)ADBB(1), za neko Y ∈ Cn×p.Tada je

AXB = AA(1)DB(1)B + AY B − AA(1)ADBB(1)B = AA(1)DB(1)B = D,

pa je svaka matrica iz skupa (3) zaista resenje jednacine (1). Sa druge strane, ako je X0

proizvoljno resenje ove jednacine, tada je X0 = A(1)DB(1) + X0 − A(1)AX0BB(1), pa je

svako resenje ove jednacine element skupa (3). Ovim smo kompletirali dokaz teoreme.�

Dakle, u slucaju da jednacina (1) ima resenja, jedno njeno resenje je A(1)DB(1),gde su A(1) i B(1) proizvoljno odabrani {1}-inverzi matrica A i B. Pomocu {1}-inverzadobijamo i jednostavan kriterijum za proveru egzistencije resenja jednacine (1). Dovoljnoje proveriti da li vazi jednakost (2). Razmotrimo detaljnije opste resenje jednacine (1).Ako je X0 proizvoljno resenje ove jednacine (dakle, ne mora da vazi X0 = A(1)DB(1)),opste resenje jednacine (1) dobija se kao X = X0+Z, gde je Z resenje jednacine AXB =O. Zaista, ako je X bilo koje drugo resenje jednacine (1), tada je A(X −X0)B = O, paje X = X0 +Z, za neko Z koje zadovoljava AZB = O; drugi smer je evidentan. U opisuskupa (3), matrica A(1)DB(1) je tu kao (proizvoljno) resenje jednacine AXB = D, dokje drugi deo: Y −A(1)AY BB(1) zapravo kljucan. On predstavlja opste resenje jednacineAXB = O, sto nije tesko pokazati (ako je AXB = O, onda je X = X −A(1)AXBB(1)).Potpuno isti skup se dobija i kada umesto A(1)DB(1) uzmemo bilo koje drugo resenjejednacine (1). Tj. skup resenja jednacine (1) je i

{X0 + Y − A(1)AY BB(1) : Y ∈ Cn×p},

gde je X0 proizvoljno resenje te jednacine. Sada mozemo da primetimo i da, u opisuskupa (3), {1}-inverzi matrica A i B koji ucestvuju u proizvodu A(1)DB(1) uopste nemoraju da budu isti oni {1}-inverzi kao u drugom delu Y −A(1)AY BB(1). I jedne i drugebiramo potpuno proizvoljno, ali smo ipak u Teoremi 1 odabrali iste {1}-inverze u obasabirka, sto je skratilo dokaz, ali ne i razjasnilo celu situaciju. Prvi odabir {1}-inverza:A(1)DB(1) obezbeduje (partikularno) resenje jednacine AXB = D, a drugi odabir, u deluY −A(1)AY BB(1) obezbeduje da, menjanjem matrice Y dobijemo sva resenja jednacineAXB = O. Shodno tome, skup resenja jednacine (1) moze se opisati i sa:

{A1DB1 + Y − A2AY BB2 : Y ∈ Cn×p},

gde su A1, A2 ∈ A{1} i B1, B2 ∈ B{1} proizvoljno odabrani.Kao jednostavnu posledicu Teoreme 1, dobijamo opis svih matrica skupa A{1}.

Naime, vazi X ∈ A{1} ako i samo ako je AXA = A, tj. A{1} je skup resenja jednacineAXA = A. Narednu posledicu navodimo bez dokaza, jer smo sve neophodno za dokazvec obrazlozili.

Page 47: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

46

Posledica 1 Neka je A ∈ Cm×n i A(1) proizvoljan {1}-inverz matrice A. Tada je

A{1} = {A(1) + Z − A(1)AZAA(1) : Z ∈ Cn×m}.

U navedenoj posledici smo, ponovo, odabrali isti {1}-inverz i kao proizvoljno resenjejednacine AXA = A i za opis opsteg resenja jednacine AXA = O. Stavise, u opisu opstegresenja jednacine AXA = O, koristili smo isti {1}-inverz za ”levu” i ”desnu” matricu A,a nismo morali. Imajuci u vidu prethodno razmatranje, mogli smo da zakljucimo i daje, recimo: A{1} = {A† + Z − A(1)AZAA(1,3) : Z ∈ Cn×m}, gde je A(1,3) proizvoljanelement skupa A{1, 3}.

Specijalan slucaj matricne jednacine (1) je i sistem linearnih jednacina Ax = b.U ovom slucaju, matricu B, koja nedostaje, identifikujemo sa jedinicnom matricomdimenzije 1× 1.

Posledica 2 Neka je A ∈ Cm×n, b ∈ Cm. Jednacina

Ax = b (4)

ima resenje ako i samo ako za neko A(1) ∈ A{1} vazi

AA(1)b = b.

U tom slucaju, skup resenja jednacine (4) je

{A(1)b+ (I − A(1)A)y : y ∈ Cn},

gde je A(1) proizvoljan {1}-inverz matrice A.

Preskocili smo jedan korak u specijalizaciji matricne jednacine (1), a to je matricnajednacina AX = B. Promenom malih slova x, b i y u velika u prethodnoj posledici,formalno dobijamo resenje problema matricne jednacine AX = B. Precizno, jednacinaAX = B je isto sto i jednacina AXI = B cije resenje smo opisali. Matricnu jednacinuXA = B resavamo isto kao i jednacinu IXA = B.

Naredna teorema daje zanimljivu karakterizaciju skupa A{1}, preko sistema linearnihjednacina Ax = b.

Teorema 2 Neka je A ∈ Cm×n i X ∈ Cn×m. Vazi X ∈ A{1} ako i samo ako, za svakob za koje jednacina Ax = b ima resenja, x = Xb jeste jedno resenje.

Dokaz. Ako je X ∈ A{1}, tada je Xb resenje jednacine Ax = b, onda kada ovajednacina ima resenje, sto sledi iz Posledice 2. Dokazimo i drugi smer tvrdenja. Zasvaku kolonu ai, i = 1, 2, ..., n jednacina Ax = ai ima resenje, pa je zato AXai = ai. No,kako ovo vazi za i = 1, 2, ..., n, vazi i AXA = A, tj. X ∈ A{1}. �

U narednoj teoremi pokazacemo kako se pomcu {1}-inverza resava sistem matricnihjednacina koji ce biti od koristi za karakterizaciju nekih klasa generalisanih inverza. Ovateorema je takode dokazana u radu [12].

Page 48: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

47

Teorema 3 Sistem matricnih jednacina

AX = B XD = E, (5)

ima resenje ako i samo ako je svaka jednacina sistema (5) ponaosob resiva i vazi AE =BD. U tom slucaju, opste resenje sistema (5) je dato sa

X = X0 + (I − A(1)A)Y (I −DD(1)), (6)

gde je X0 proizvoljno resenje ovog sistema, A(1) i D(1) proizvoljni {1}-inverzi matrica Ai D, a matricu Y biramo proizvoljno (obracajuci paznju na dimenziju).

Dokaz. Ako sistem jednacina (5) ima resenje X0, onda, naravno i svaka jednacinazasebno ima resenje i vazi BD = AXD = AE. Pretpostavimo sada da je AE = BD ida svaka jednacina zasebno ima resenje. Iz Teoreme 1 sledi da je onda AA(1)B = B iED(1)D = E, za proizvoljne A(1) i D(1). Neka je

X = A(1)B + ED(1) − A(1)AED(1) = A(1)B + ED(1) − A(1)BDD(1).

Tada jeAX = AA(1)B + AED(1) − AA(1)AED(1) = B,

XD = A(1)BD + ED(1)D − A(1)BDD(1)D = E,

pa ovaj sistem jednacina ima resenje.Pokazimo da je sa (6) dato opste resenje sistema (5), gde je X0 proizvoljno resenje

tog sistema. Pokazimo, najpre, da je sa

Z = (I − A(1)A)Y (I −DD(1)) (7)

dato opste resenje sistema jednacina

AZ = O ZD = O. (8)

Za Z odredeno sa (7) evidentno vazi AZ = O = ZD. Sa druge strane, ako za neko Zvazi AZ = O i ZD = O, tada je (I − A(1)A)Z(I −DD(1)) = Z. Kada smo to pokazali,ostalo je jos da pokazemo da je opste resenje sistema (5) dato sa X = X0 + Z, gde je Zresenje sistema (8). Da je X0 + Z resenje sistema (5), onda kada je Z resenje sistema(8), sledi nakon direktne provere. Sa druge strane, za proizvoljno resenje X sistema (5),matrica X −X0 jeste resenje sistema (8), sto se, takode, direktno proverava. Ovim smokompletirali dokaz teoreme. �

Opisimo sada sve {1, 3} i {1, 4}-inverze matrice A. Iz Teoreme 3.9 sledi da za proizvol-jan A(1,3) ∈ A{1, 3} vazi: X ∈ A{1, 3} ako i samo ako AX = AA(1,3). Drugim recima,skup A{1, 3} predstavlja skup resenja jednacine AX = B, za B = AA(1,3), gde je A(1,3)

potpuno proizvoljan {1, 3}-inverz matrica A. Na taj nacin dolazimo do naredne teoreme.

Teorema 4 Neka je A ∈ Cm×n i A(1,3) proizvoljan element skupa A{1, 3}. Tada je

A{1, 3} = {A(1,3) + (I − A(1,3)A)Z : Z ∈ Cn×m}. (9)

Page 49: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

48

Za skup A{1, 4} vazi analogno tvrdenje.

Teorema 5 Neka je A ∈ Cm×n i A(1,4) proizvoljan element skupa A{1, 4}. Tada je

A{1, 4} = {A(1,4) + Z(I − AA(1,4)) : Z ∈ Cn×m}. (10)

Opisimo sada i skupove A{(1, 3, 4)}, A{(1, 2, 3)} i A{(1, 2, 4)}. Za svaki od ovihskupova formiracemo sistem jednacina cije resenje upravo predstavlja posmatrani skup.Tako cemo i dokazati narednu teoremu.

Teorema 6 Neka je A ∈ Cm×n i neka su A(1,3,4), A(1,2,3), A(1,2,4), proizvoljni elementiskupova A{1, 3, 4}, A{1, 2, 3}, A{1, 2, 4} tim redom. Tada vazi:

A{1, 3, 4} = {A(1,3,4) + (I − A(1,3,4)A)Z(I − AA(1,3,4)) : Z ∈ Cn×m}; (11)

A{1, 2, 3} = {A(1,2,3) + (I − A(1,2,3)A)ZAA(1,2,3) : Z ∈ Cn×m}; (12)

A{1, 2, 4} = {A(1,2,4) + A(1,2,4)AZ(I − AA(1,2,4)) : Z ∈ Cn×m}. (13)

Dokaz. Neka je A(1,3,4) proizvoljan {1, 3, 4}-inverz od A. Vazi A{1, 3, 4} = A{1, 3} ∩A{1, 4}, kao i X ∈ A{1, 3} ako i samo ako AX = AA(1,3,4) kao i X ∈ A{1, 4} ako i samoako XA = A(1,3,4)A. Iz svega navedenog zakljucujemo da je

X ∈ A{1, 3, 4} ako i samo ako AX = AA(1,3,4) i XA = A(1,3,4)A.

Posto navedeni sistem jednacina sigurno ima resenja (jedno resenje je A(1,3,4)), koristeciTeoremu 3, zakljucujemo da vazi:

A{1, 3, 4} = {A(1,3,4) + (I − A(1,3,4)A)Z(I − AA(1,3,4)) : Z ∈ Cn×m}.

Sada dokazujemo tvrdenje za skup A{1, 2, 3}. Neka je A(1,2,3) ∈ A{1, 2, 3} proizvoljan{1, 2, 3}-inverz. Pokazimo prvo da je X ∈ A{1, 2, 3} ako i samo ako je AX = AA(1,2,3)

i XAA(1,2,3) = X ⇔ X(I − AA(1,2,3)) = O. Ako je X ∈ A{1, 2, 3}, tada prva jed-nakost sledi iz Teoreme 3.9, dok druga jednakost sledi iz prve jednakosti: X(AA(1,2,3)) =X(AX) = X, jer je X i {2}-inverz. Pokazimo sada i drugi smer. Ako je AX = AA(1,2,3),sledi da je X ∈ A{1, 3}. No, sada je X(AX) = X(AA(1,2,3)) = X, pa je X ∈ A{2}.Dakle X ∈ A{1, 2, 3}. Ovim smo pokazali da je skup A{1, 2, 3} zapravo skup resenjasistema jednacina

AX = AA(1,2,3) X(I − AA(1,2,3)) = O. (14)

Prema Teoremi 3, skup resenja ovog sistema, imajuci u vidu da je A(1,2,3) jedno resenje,je

{A(1,2,3) + (I − A(1,2,3)A)Z(I − (I − AA(1,2,3))(I − AA(1,2,3))(1)) : Z ∈ Cn×m}, (15)

gde je (I − AA(1,2,3))(1) proizvoljan {1}-inverz matrice I − AA(1,2,3). Iz Teoreme 3.3znamo da je AA(1,2,3) idempotent, pa je to i I−AA(1,2,3). Zbog toga je I−AA(1,2,3) jedan{1}-inverz te matrice, pa mozemo odabrati bas taj {1}-inverz u (15). Nakon sredivanjadobijamo upravo (12).

Page 50: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

49

Za skup A{1, 2, 4} dokaz se izvodi analogno, posmatrajuci sistem jednacina:

(I − A(1,2,4)A)X = O XA = A(1,2,4)A.

I ovde imamo na umu da je I − A(1,2,4)A ∈ (I − A(1,2,4)A){1}. �

Napomenimo na kraju da se skup A{2} ne moze elegantno opisati poput skupova kojesmo opisivali u prethodnim teoremama. Teorema 1 ne moze se primeniti na jednacinuXAX = X, posredno ili neposredno, a razlog je to sto se X ne javlja linearno u ovojjednacini. Ipak neke karakterizacije skupa A{2} i nekih podskupova ovog skupa moguse naci u [1].

5.2 Optimalno resavanje sistema linearnih jednacina

Neka je A ∈ Cm×n i b ∈ Cm. Predmet ovog poglavlja bice primena generalisanih inverzana nalazene optimalnog resenja sistema linearnih jednacina, zapisanog u matricnoj formikao:

Ax = b. (4)

U Posledici 2 dali smo jednostavan algebarski kriterijum ispitivanja egzistencije resenjasistema (4), a takode smo opisali sva resenja tog sistema. Pitanje je sta raditi u slucajukada sistem (4) nema resenja. U tom slucaju, trazimo vektor x za koji ce odstupanjevektora Ax od vektora b: ‖Ax − b‖, biti sto manje1. Svaki vektor x za koji je ‖Ax −b‖ najmanje moguce nazivacemo LS-resenje2 sistema (4). Pokazacemo da je A(1,3)bLS-resenje jednacine (4), za svaki A(1,3) ∈ A{1, 3}. Zapravo, ovo svojstvo ce dati ikarakterizaciju skupa A{1, 3}.

Teorema 7 Neka je A ∈ Cm×n, b ∈ Cm i A(1,3) proizvoljan element skupa A{1, 3}. Tadaje

infx∈Cn‖Ax− b‖ = ‖AA(1,3)b− b‖.

Sem toga, ako je X ∈ Cn×m matrica za koju vazi

infx∈Cn‖Ax− b‖ = ‖AXb− b‖, za svako b ∈ Cm, (16)

tada je X ∈ A{1, 3}.

Dokaz. Neka je P ortogonalni projektor na R(A) i Q ortogonalni projektor na N(A∗).Znamo da je R(A)⊥ = N(A∗), pa vazi P = I−Q i zato je b = Pb+Qb. Za svako x ∈ Cn

je Ax ∈ R(A) i b − Ax = (Pb − Ax) + Qb. Vektori Pb − Ax ∈ R(A) i Qb ∈ N(A∗) suortogonalni, odakle dobijamo da je

‖Ax− b‖2 = ‖Pb− Ax‖2 + ‖Qb‖2. (17)

1U uvodu smo napomenuli da cemo, za vektorsku normu, koristiti standardnu euklidsku normu‖x‖2 = |x1|2 + |x2|2 + ...+ |xn|2, gde je x = (x1, x2, ..., xn) ∈ Cn

2LS zbog naziva na engleskom jeziku: least-square resenje, jer pokusavamo da minimizujemo ‖Ax−b‖, odnosno ‖Ax− b‖2 = (y1 − b1)2 + ...+ (yn − bn)2, gde je yi =

∑nj=1 aijxj i b = (b1, b2, ..., bm).

Page 51: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

50

Kako je Pb ∈ R(A), svakako postoji x0 tako da je Ax0 = Pb tj. infx∈Cn‖Ax − b‖ =

minx∈Cn‖Ax− b‖ = ‖Qb‖. Dakle:

minx∈Cn‖Ax− b‖ = ‖Ax0 − b‖ ako i samo ako Ax0 = Pb. (18)

Kako za bilo koji {1, 3}-inverz A(1,3) matrice A vazi da je AA(1,3) ortogonalni projektorna R(A), tj. AA(1,3) = P , sledi AA(1,3)b = Pb, pa je x0 = A(1,3)b zaista LS-resenjesistema (4).

Dokazimo i drugi deo tvrdenja. Pretpostavimo da za matricu X vazi (16). Iz (18)sledi da je onda AXb = Pb, za svako b ∈ Cm, a kako je P = AA(1,3), to znaci da jeAXb = AA(1,3)b, za svako b ∈ Cm. Odavde sledi da je AX = AA(1,3), sto znaci da jeX ∈ A{1, 3}, kao sto smo pokazali u Teoremi 3.9. �

Ukoliko sistem linearnih jednacina i trazenje resenja (ili LS-resenja) interpretiramogeometrijski, mozemo da kazemo da, zapravo, trazimo vektor iz prostora R(A) koji je”najblizi” vektoru b. Taj vektor je upravo normalna projekcija vektora b na prostorR(A), sto se poklapa i sa nasom intuicijom. Ukoliko je b ∈ R(A), tada je svako LS-resenje ujedno i ”pravo” resenje sistema (4).

U narednoj teoremi cemo opisati sva LS-resenja sistema (4).

Teorema 8 Vektor x ∈ Cn je LS-resenje sistema (4) ako i samo ako je resenje sistema

Ax = AA(1,3)b, (19)

gde je A(1,3) proizvoljan {1, 3}-inverz matrice A. Skup LS-resenja sistema (4) je:

{A(1,3)b+ (I − A(1)A)y : y ∈ Cn}. (20)

Dokaz. Prvi deo tvrdenja sledi iz (18), dok drugi deo tvrdenja sledi iz Posledice 2. �

Kao sto mozemo da vidimo iz (20), LS-resenje je jedinstveno ako i samo ako jeI − A(1)A = O, sto je ekvivalentno, na osnovu Teoreme 3.4, sa tim da je r(A) = n,odnosno sa tim da je A 1− 1 preslikavanje izmedu Cn i Cm.

Jos jedan od nacina za nalazenje LS-resenja dat je narednom teoremom.

Teorema 9 Vektor x ∈ Cn je LS-resenje sistema (4) ako i samo ako je resenje sistema

A∗Ax = A∗b. (21)

Dokaz. Iz (18) sledi da je x LS-resenje sistema (4) ako i samo ako je Ax = Pb, tj. akoi samo ako je b−Ax = QB, sto je ekvivalentno sa cinjenicom da je b−Ax ∈ N(A∗), stoje ekvivalentno sa (21). �

Razmotrimo sada drugaciji problem. Pretpostavimo da jednacina (4) ima resenje,tj. da je b ∈ R(A). Pitanje je koje od resenja jednacine (4) ima najmanju normu? Kaosto znamo iz razmatranja u vezi sa Teoremom 3.15, za svaki vektor y ∈ R(A) postojijedinstveni vektor x ∈ R(A∗) takav da je Ax = y. Pokazacemo da postoji samo jedanvektor x takav da je Ax = b i da je ‖x‖ minimalno. Ovaj vektor x bice upravo onaj kojise nalazi u skupu R(A∗). Pokazacemo i da je on jednak sa A(1,4)b, gde je A(1,4) ∈ A{1, 4}proizvoljno odabran, kao i da ovo svojstvo karakterise matrice skupa A{1, 4}.

Page 52: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

51

Teorema 10 Neka je A ∈ Cm×n i neka je b ∈ R(A). Tada postoji jedinstveni x0 ∈ Cn

takav da jeAx0 = b i ‖x0‖ = inf{‖x‖ : Ax = b} (22)

i vazi x0 ∈ R(A∗). Ako je A(1,4) proizvoljni {1, 4}-inverz od A, tada je x0 = A(1,4)b. Semtoga, ako matrica X zadovoljava:

AXb = b i ‖Xb‖ = inf{‖x‖ : Ax = b}, za svako b ∈ R(A), (23)

tada je X ∈ A{1, 4}.

Dokaz. Svaki vektor x iz Cn moze se prikazati kao x = xR + xN , gde je xR ∈ R(A∗) ixN ∈ N(A) i vektori xR i xN su jedinstveno odredeni. Ovo sledi iz Cn = R(A∗)⊕N(A).Za prostore R(A∗) i N(A) vazi i R(A∗)⊥ = N(A), pa je

‖x‖2 = ‖xR‖2 + ‖xN‖2. (24)

U prostoru R(A∗), kao sto smo vec naveli, postoji samo jedan vektor x0 takav da jeAx0 = b. Zbog toga vazi

Ax = b ⇔ A(xR + xN) = b ⇔ AxR = b ⇔ xR = x0. (25)

Iz (24) i (25) dobijamo da, za svako x za koje je Ax = b, vazi ‖x‖2 = ‖x0‖2 + ‖xN‖2.Iz ovoga sledi da je vektor x0 zaista onaj vektor medu resenjima jednacine (4) koji imanajmanju normu. Pored toga, sledi i da je x0 jedini takav vektor, jer ako je x resenjejednacine i ‖x‖ = ‖x0‖, zbog (24) i (25) sledi da je xN = 0, tj. x = x0.

Ako je A(1,4) proizvoljan {1, 4}-inverz matrice A, tada je A(1,4)b resenje jednacine (4)i dovoljno je jos da pokazemo da je A(1,4)b ∈ R(A∗). Kako je b ∈ R(A), to je b = Ab′,za neko b′ ∈ Cn. Zato je A(1,4)b = A(1,4)Ab′, a iz razmatranja u vezi sa Teoremom 3.9znamo da je A(1,4)A ortogonalni projektor sa jezgrom N(A), tj. sa slikom R(A∗). Dakle,A(1,4)b = A(1,4)Ab′ ∈ R(A∗).

Dokazimo sada i drugi smer tvrdenja. Neka X zadovoljava (23) i neka je A(1,4)

proizvoljan {1, 4}-inverz matrice A. Iz dokazanog dela teoreme, sledi da za svako b ∈R(A) vazi Xb = A(1,4)b. Ovo drugim recima znaci da za svako x ∈ Cn vazi XAx =A(1,4)Ax, tj. XA = A(1,4)A. Iz Teoreme 3.9 sledi da je onda X ∈ A{1, 4}. �

O resenju sa najmanjom normom mozemo da govorimo samo onda kada jednacina(4) uopste ima resenja. Formulisimo ovakav problem: medu LS-resenjima jednacine (4)trazimo ono sa najmanjom normom. Ovakav problem ne zaivis od toga da li jednacina(4) ima resenja. Ukoliko jednacina ima resenja, LS-resenja su zapravo prava resenja,pa cemo u tom slucaju dobiti zaista resenje sa najmanjom normom. Za resavanje ovakouopstenog problema koristimo Moore-Penroseov inverz A† i kao u prethodne dve teoreme,na ovaj nacin dajemo karakterizaciju ovog inverza.

Teorema 11 Neka je A ∈ Cm×n i b ∈ Cm. Medu svim LS-resenjima jednacine (4),postoji jedinstveno resenje sa minimalnom normom i to je upravo A†b. Sem toga, akoje matrica X takva da je, za svako b ∈ Cm, vektor Xb LS-resenje sistema (4) i to bastakvo da ima minimalnu normu, tada je A† = X.

Page 53: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

52

Dokaz. Vektor x je LS-resenje sistema (4) ako i samo ako je resenje sistema (19).Dakle, x LS-resenje sa najmanjom normom sistema (4) ako i samo ako je x resenjesa najmanjom normom sistema (19), sto prema prema prethodnoj teoremi znaci da jex = A(1,4)AA(1,3)b. Iz Teoreme 3.10 sledi da je A(1,4)AA(1,3) = A†, sto dokazuje prvi deoteoreme.

Drugi deo teoreme sledi direktno iz prvog, jer vazi Xb = A†b, za svako b ∈ Cm. �

5.3 Diferencijalne jednacine i generalisani inverzi

U ovom poglavlju, pokazacemo kako se mogu resiti neki sistemi diferencijalnih jednacinaprimenom Drazinovog inverza. Posmatramo sistem linearnih diferencijalnih jednacinaprvog reda, zapisan u matricnoj formi kao:

Ax(t) +Bx(t) = f(t), (26)

gde su A,B ∈ Cn×n, x(t) = (x1(t), x2(t), ..., xn(t)) : R → Cn vektorska funkcija realnogparametra, a f(t) = (f1(t), f2(t), ..., fn(t)) : R → Cn, proizvoljna vektorska funkcija.Pored sistema (26) posmatramo i homogeni sistem:

Ax(t) +Bx(t) = 0, (27)

kao i Kosijev problem, odnosno problem sa pocetnim uslovima:

Ax(t) +Bx(t) = f(t), x(t0) = c, c ∈ Cn, (28)

u kome se trazi resenje sistema diferencijalnih jednacina (26) koje ce u zadatoj tackit0 uzimati zadatu vrednost c. Pod resenjem sistema (26) ili (27) podrazumevamobilo koju diferencijabilnu3 vektorsku funkciju x(t) definisanu na nekom, konacnom ilibeskonacnom, intervalu (a, b) ⊂ R, koja zadovoljava navedenu jednacinu. Pod resenjemKosijevog problema (28) podrazumevamo diferencijabilnu vektorsku funkciju x(t) defin-isanu na intervalu koji sadrzi tacku t0 i koja zadovoljava obe navedene jednakosti. Raz-motrimo na pocetku, sta se desava ako je matrica A regularna.

U tom slucaju sistem (26) ekvivalentan je normalnom sistemu:

x(t) = Cx(t) + f1(t), (29)

gde je C = −A−1B i f1(t) = A−1f(t). Homogeni sistem (27) ekvivalentan je sistemu:

x(t) = Cx(t), (30)

a Kosijev problem je ekvivalentan problemu:

x(t) = Cx(t) + f1(t), x(t0) = c, c ∈ Cn. (31)

Za sisteme (29), (30) i (31) poznate su sledece cinjenice:

3Ne zalazeci u neke opstije okvire pojma diferencijabilnosti, koji bi zahtevali dodatna objasnjenja,vektorsku funkciju nazivamo diferencijabilna onda i samo onda kada su joj sve koorinatne funkcijediferencijabilne. Isto vazi i za pojmove k puta diferencijabilna, neprekidna, integrabilna i sl.

Page 54: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

53

- Opste resenje sistema (30) je x(t) = eCtq, gde je q ∈ Cn proizvoljan;

- Homogeni Kosijev problem x(t) = Cx(t), x(t0) = c ima jedinstveno resenje:x(t) = eC(t−t0)c;

- Ukoliko je f1(t) neprekidna funkcija, opste resenje sistema (29) je x(t) = eCtq +t∫a

eC(t−s)f1(s) ds, gde je a ∈ R i q ∈ Cn;

- Ukoliko je f1(t) neprekidna funkcija, Kosijev problem (31) ima jedinstveno resenje:

x(t) = eC(t−t0)c+t∫t0

eC(t−s)f1(s) ds.

Posmatrajmo sada sistem (26) u slucaju kada matrica A nije regularna. U tom slucajumogu nastati situacije koje nisu moguce u slucaju regularne matrica A. Recimo, neka je

A =

[0 10 0

]i B =

[1 00 1

]. Posmatrajmo homogeni Kosijev problem Ax(t) + Bx(t) =

0, x(0) = (1, 1). Ne postoji funkcija x definisana u nekoj okolini tacke (0, 0) koja jeresenje ovog problema. Kao sto vidimo, moze se desiti da homogeni Kosijev problemnema resenje. Takode, moze se desiti da homogeni Kosijev problem ima beskonacno

mnogo resenja. Recimo, za A =

[0 10 0

]i B =

[0 10 0

]i pocetni uslov x(t) = (1, 1),

resenje je x(t) = (e−t, αt), za proizvoljno α > 0. Uvodimo zato naredne definicije.

Definicija 1 Neka su A,B ∈ Cn×n i t0 ∈ R. Vektor c ∈ Cn je konzistentan sa t0 akojednacina (28) ima barem jedno resenje.

Definicija 2 Sistem (26) je integrabilan u tacki t0 ako Kosijev problem (28) ima jedin-stveno resenje za svaki vektor c konzistentan sa t0. Kazemo da Kosijev problem imajedinstveno resenje ako za svaka dva resenja problema (28) postoji okolina tacke t0 gdese ta dva resenja poklapaju.

Mozemo primetiti da je za homogeni sistem (27) suvisno naglasavati u kojoj je tackiintegrabilan, jer ako je integrabilan u tacki t0 ∈ R, onda je integrabilan u svakoj tackit1 ∈ R i skup vektora konzistentnih sa t0 se poklapa sa skupom vektora konzistentnih sat1. Ovo sledi iz zapazanja da, ukoliko je x(t) resenje sistema (27) definisano na intervalu(a, b), onda je to i y(t) = x(t− t′) na intervalu (a+ t′, b+ t′), za proizvoljno t′ ∈ R. Zatocemo za homogeni sistem govoriti samo da li je integrabilan ili nije.

Nas cilj je resiti sledece probleme:

- Okarakterisati sve integrabilne homogene sisteme;

- Dati formulu opsteg resenja integrabilnog homogenog sistema;

- Okarakterisati skup konzistentnih vektora (za proizvoljnu tacku) integrabilnog ho-mogenog sistema;

- Dati formulu za partikularno resenje nehomogenog sistema kada je pridruzeni ho-mogeni sistem integrabilan;

Page 55: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

54

- Okarakterisati skup konzistentnih vektora za datu tacku t0 nehomogenog sistema,kada je pridruzeni homogeni sistem integrabilan;

- Dati formulu jedinstvenog resenja Kosijevog problema (28) u slucaju kada je ovajsistem integrabilan i vektor c konzistentan sa t0.

Dokazimo nekoliko pomocnih tvrdenja, pre nego sto dokazemo jedan od glavnih rezul-tata poglavlja.

Lema 1 Neka su A,B, P ∈ Cn×n, pri cemu je P regularna matrica. Posmatrajmosisteme:

PAx(t) + PBx(t) = 0, (32)

AP x(t) +BPx(t) = 0. (33)

Tada vazi: sistem (27) je integrabilan ako i samo ako je sistem (32) integrabilan, kao isistem (27) je integrabilan ako i samo ako je sistem (33) integrabilan.

Dokaz. Za bilo koji realan broj t0 i c ∈ Cn vazi: x(t) je resenje Kosijevog prob-lema Ax(t) +Bx(t) = 0, x(t0) = c ako i samo ako je x(t) resenje Kosijevog problemaPAx(t) + PBx(t) = 0, x(t0) = c. Iz ovoga sledi prvi deo tvrdenja. Dokazimo i drugideo tvrdenja. Pretpostavimo da je sistem (27) integrabilan u t0. Ukoliko pretpostavimoda sistem (33) nije integrabilan u t0, onda postoji vektor c′ konzistentan sa t0, ali takavda postoje dva razlicita resenja Kosijevog problema AP x(t) +BPx(t) = 0, x(t) = c′.Neka su to y(t) i z(t). Posmatrajmo funkcije y1(t) = Py(t) i z1(t) = Pz(t). Funkcijey1(t) i z1(t) su razlicite, zato sto su funkcije y(t) i z(t) razlicite, a P je regularnamatrica. Pored toga, zbog linearnosti operacija, vazi y1(t) = P y(t) i z1(t) = P z(t),a vazi i y1(t0) = Pc′ = z1(t0). Odavde sledi da su y1(t) i z1(t) dva razliita resenjaKosijevog problema Ax(t) + Bx(t) = 0 x(t0) = Pc′, a to nije moguce, jer je sistem(27) integrabilan (u t0). Pretpostavimo sada da je sistem (33) integrabilan. Na os-novu vec dokazanog smera, posto je matrica P−1 takode regularna, sledi da je i sistemAPP−1x(t)+BPP−1x(t) = 0 integrabilan, odnosno, sledi da je sistem (27) integrabilan.Ovim smo pokazali da su (27) i (33) istovremeno integrabilni ili nisu integrabilni, cimesmo kompletirali dokaz leme. �

Lema 2 Neka su A =

[A1 OO A2

]i B =

[B1 OO B2

]kvazidijagonalne matrice, gde je

A1, B1 ∈ Cm×m i A2, B2 ∈ Ck×k. Posmatrajmo sisteme:

A1x(t) +B1x(t) = 0, (34)

A2x(t) +B2x(t) = 0. (35)

Tada vazi: sistem (27) je integrabilan ako i samo ako su oba sistema (34) i (35) inte-grabilna.

Dokaz. Funkcija x(t) = (x1(t), ..., xm(t), xm+1(t), ..., xm+k(t)) je resenje sistema (27)koje zadovoljava pocetni uslov x(t0) = c = (c1, ..., cm, cm+1, ..., cm+k) ako i samo ako

Page 56: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

55

su funkcije x1(t) = (x1(t), ..., xm(t)) i x2(t) = (xm+1(t), ..., xm+k(t)) resenja sistema(34) i (35) redom, koja zadovoljavaju pocetne uslove x1(t0) = (c1, ..., cm) i x2(t0) =(cm+1, ..., cm+k). Dakle, ako su sistemi (34) i (35) integrabilni, sistem (27) je takodeintegrabilan. U suprotnom, ukoliko za jedan konzistentan vektor postoje dva razlicitaresenja sistema (27), to ce indukovati postojanje dva razlicita resenja za neki konzistentnivektor barem jednog od sistema (34) i (35). Ako neki od sistema (34) ili (35) nijeintegrabilan, recimo sistem (34), to povlaci i da sistem (27) nije integrabilan. Zaista, akoje c′ = (c′1, ..., c

′m) konzistentan vektor sa t0 za koji postoje dva razlicita resenja x′1(t) =

(x′1(t), ..., x′m(t)) i x′′1 (t) = (x′′1(t), ..., x′′m(t)) sistema (34), tada je c = (c′1, ..., c

′m, 0, ..., 0)

konzistentan vektor sa t0 za sistem (27) za koji postoje dva razlicita resenja: x′(t) =(x′1(t), ..., x

′m(t), 0, ..., 0) i x′′(t) = (x′′1(t), ..., x′′m(t), 0, ..., 0). Ovim smo dokazali zeljenu

ekvivalenciju. �

Lema 3 Neka su A,B ∈ Cn×n, gde je A nilpotentna, a B regularna matrica i vaziAB = BA. Tada sistem (27) ima samo trivijalno resenje.

Dokaz. Neka je k = n(A) i neka je x(t) resenje sistema (27). Ako sistem (27)pomnozimo sa Ak−1 sa leve strane, posto matrica A i B komutiraju, dobijamo da jeBAk−1x(t) = 0, odakle iz regularnosti matrice B, sledi da je Ak−1x(t) = 0, za svako t.Kako je Ak−1x(t) = 0, onda je i Ak−1x(t) = 0. Pomnozimo sada sistem (27) sa Ak−2.Posto je Ak−1x(t) = 0, sledi da je BAk−2x(t) = 0, odakle sledi da je Ak−2x(t) = 0. Sadanastavljamo postupak kao i ranije: iz Ak−2x(t) = 0, sledi i Ak−2x(t) = 0, pa ako sistem(27) pomnozimo sa Ak−3 dobijamo da je Ak−3x(t) = 0, itd. Na kraju, dobijamo da jeAx(t) = 0, odakle sledi Ax(t) = 0, pa je i Bx(t) = 0, tj. x(t) = 0, jer je B regularnamatrica. �

Sada mozemo dokazati jedno od glavnih tvrdenja poglavlja.

Teorema 12 Neka su A,B ∈ Cn×n. Homogeni sistem (27) je integrabilan ako i samoako postoji λ ∈ C tako da je matrica λA+B regularna.

Dokaz. Pretpostavimo da postoji λ tako da je matrica λA + B regularna i neka jeAλ = (λA+B)−1A i Bλ = (λA+B)−1B. Iz Leme 1 sledi da je sistem (27) integrabilanako i samo ako je integrabilan sistem Aλx(t) + Bλx(t) = 0. Neka je

J =

[J1 OO J0

]= P−1AλP

Zordanova normalna forma matrice Aλ, sa strukturom (i oznakama) kao u Teoremi 4.18.Kako je λAλ + Bλ = I, to je

Bλ = P

[I − λJ1 OO I − λJ0

]P−1.

Iz Lema 1 i 2 zakljucujemo da, ako pokazemo da su sistemi J1x(t) + (I − λJ1)x(t) = 0 iJ0x(t) + (I − λJ0)x(t) = 0 integrabilni, odatle sledi da je i sistem (27) integrabilan, jerje

Aλ = P

[J1 OO J0

]P−1 i Bλ = P

[I − λJ1 OO I − λJ0

]P−1.

Page 57: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

56

J1 je regularna matrica, pa je prvi sistem ekvivalentan normalnom sistemu (30) kojijeste integrabilan. Iz Leme 3 sledi da je i drugi sistem integrabilan. Naime, matrica J0 jenilpotentna. Matrica I−λJ0 je, zbog toga, regularna, jer je (I−λJ0)(I+λJ0 + (λJ0)

2 +... + (λJ0)

n(J0)−1) = I − (λJ0)n(J0) = I. Matrice J0 i I − λJ0 komutiraju, dakle jedino

resenje sistema J0x(t)+(I−λJ0)x(t) = 0 je trivijalno resenje, odakle sledi integrabilnostovog sistema (jedini konzistentan vektor za bilo koju tacku je nula vektor i jedino resenjeje trivijalno resenje). Time smo dokazali jedan smer tvrdenja, a dokazimo sada i suprotnismer.

Pretpostavimo da je za svako λ ∈ C matrica λA + B singularna. Dokazacemo dapostoji resenje sistema (27) koje nije trivijalno, ali koje je u tacki t0 = 0 jednako nulavektoru. Time cemo dokazati da sistem (27) nije integrabilan. Za svako λ ∈ C postojinenula vektor vλ ∈ Cn takav da je (λA + B)vλ = 0, jer je matrica λA + B singularna.Za svaki takav vektor, xλ(t) = eλtvλ predstavlja resenje sistema (27). Posto za svako λpostoji vektor vλ sa opisanom osobinom, mozemo da izaberemo nekoliko takvih vektoravλ1 , vλ2 , ..., vλs koji su linearno zavisni (mozemo recimo uzeti v1, v2, ..., vn+1, ako su sviovi vektori razliciti; ako su recimo vi i vj jednaki, onda mozemo uzeti vi i 2vj). Posto suvektori vλ1 , vλ2 , ..., vλs linearno zavisni, postoje kompleksni brojevi α1, α2, ..., αs koji nisusvi jednaki nula i takvi da je

∑αivλi = 0. Posto je svaka funkcija xλi(t) resenje sistema

(27), a ovaj sistem je homogen, to je i y(t) =∑αixλi(t) resenje ovog sistema. Funkcije

eλ1t, eλ2t, ..., eλst su linearno nezavisne, pa su takve i funkcije α1eλ1t, α2e

λ2t, ..., αseλst, jer

nisu svi αi jednaki nuli. Odatle sledi da resenje y(t) nije identicki jednako nula funkciji.Sa druge strane, y(0) =

∑αivλi = 0, sto smo i zeleli da pokazemo. �

Postojanje broja λ takvog da matrica λA+B bude regularna, jednostavno se prover-ava. Ako je A,B ∈ Cn×n dovoljno je proveriti n+ 1 razlicitu vrednost za λ. Ako za svenjih, matrica λA + B bude singularna, onda ne postoji λ takvo da je matrica λA + Bregularna. O tome svedoci naredna teorema.

Teorema 13 Neka su A,B ∈ Cn×n i neka su λ1, λ2, ..., λn+1 proizvoljni medusobnorazliciti kompleksni brojevi. Ako su matrice λ1A+B, λ2A+B,..., λn+1A+B singularne,onda je λA+B singularna za svako λ ∈ C.

Dokaz. Obelezimo sa P (λ) = det(λA + B). Tada je P polinom po λ i to stepenanajvise n. Ako je P (λ1) = P (λ2) = ... = P (λn+1) = 0, sto je ekvivalentno sa tim dasu matrice λ1A+B, λ2A+B,..., λn+1A+B singularne, onda je polinom P (λ) identickijednak sa 0, pa je det(λA+B) = 0, za svako λ ∈ C, sto je i trebalo da pokazemo. �

Iz dokaza Teoreme 12 mozemo izvesti opste resenje sistema (27), u slucaju kada jetaj sistem integrabilan. No pre toga, dokazimo jednu lemu u vezi sa matricama Aλ i Bλ

u kojoj cemo opisati neke osobine ovih matrica.

Lema 4 Neka su A,B ∈ Cn×n. Za svako λ ∈ C takvo da je λA+ B regularna matrica,uvedimo oznake: Aλ = (λA+B)−1A, Bλ(λA+B)−1B, zatim qλ = (λA+B)−1q, gde jeq ∈ Cn. Ako su α i β kompleksni brojevi takvi da su matrice αA+B i βA+B regularne,tada vazi:(a) Matrice Aα i Bα komutiraju;(b) ADα Aα = ADβ Aβ i AαB

Dα = AβB

Dβ ;

Page 58: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

57

(c) ADα Bα = ADβ Bβ;

(d) ind(Aα) = ind(Aβ) i R(Akα) = R(Akβ) za svako k ∈ N;

(e) Aαqα = Aβqβ;

(f) Bαqα = Bβqβ;

(g) (I − AαADα )BαBDα = (I − AαADα ).

Dokaz. (a) Za matrice Aα i Bα vazi αAα + Bα = I, odnosno, Bα = I − αAα, odaklesledi da ove matrice komutiraju.

(b) Postupamo na sledeci nacin:

ADα Aα = ((αA+B)−1A)DAα = ((αA+B)−1(βA+B)(βA+B)−1A)DAα

= ([(βA+B)−1(αA+B)]−1Aβ)DAα

= ([αAβ + Bβ]−1Aβ)DAα

= ADβ (αAβ + Bβ)Aα na osnovu Teoreme 3.16

= ADβ (βA+B)−1(αA+B)(αA+B)−1A

= ADβ Aβ.

Dokazimo i drugi deo. Iz Teoreme 4.16 i tvrdenja (a) ove teoreme, sledi da matrice Aαi BD

α komutiraju. Naravno, isto vazi i za matrice Aβ i BDβ . Potpuno analogno kao u

slucaju matrice ADα i ovde se moze dokazati BDα = BD

β (βA+B)−1(αA+B), zbog toga je

BDα Aα = BD

β (βA+B)−1(αA+B)(αA+B)−1A = BDβ Aβ,

sto je i trebalo pokazati.

(c) Iz dokaza tvrdenja (b) sledi da je ADα = ADβ (βA+B)−1(αA+B), pa je

ADα Bα = ADβ (βA+B)−1(αA+B)(αA+B)−1B = ADβ Bβ.

(d) U dokazu tvrdenja (b) dokazali smo da je Aα = (αAβ + Bβ)−1Aβ = Aβ(αAβ + Bβ)−1,

jer Aβ komutira sa αAβ + Bβ, pa komutira i sa njenim inverzom. Odvade sledi da, za

svaki prirodan broj k vazi Akα = Akβ((αAβ + Bβ)−1)k, pa je zato za svaki prirodan broj k

tacno R(Akα) = R(Akβ). Odavde slede oba tvrdenja ovog dela.

Tvrdenja (e) i (f) dokazuju se analogno kao tvrdenje (b), koristeci ADα = ADβ (βA +B)−1(αA+B) i qα = (αA+B)−1q i analogno za B.

(g) Ukoliko je α = 0, tvrdenje trivijalno vazi. Pretpostavimo da je α 6= 0. Za projektoreP i Q vazi PQ = P ako i samo ako je N(Q) ⊂ R(I − P ). Zaista PQ = P ⇔ O =P (I − Q) ⇔ R(I − Q) ⊂ N(P ) ⇔ N(Q) ⊂ R(I − P ). Pokazimo da je N(BαB

Dα ) ⊂

R(I − (I − AαADα )) = R(AαADα ). Neka je j = ind(Bα). Tada je N(BαB

Dα ) = N(Bj

α) =N((I − αAα)j) = N((−α)j(Aα − α−1I)j) = N((Aα − α−1I)j). Ovaj skup cine α−1-vektori matrice Aα reda ne veceg od j. Iz Leme 4.4 sledi da svi ti vektori pripadaju

skupu R(Aind(Aα)α ), tj. skupu R(AαA

Dα ). Dakle, vazi N(BαB

Dα ) ⊂ R(AαA

Dα ) = R(I −

(I − AαADα )), sto je i trebalo pokazati. �

Page 59: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

58

Upravo dokazana lema pokazuje da u izrazima: AλADλ , A

Dλ Bλ, itd. mozemo izostaviti

indeks λ, jer navedene matrice (indeksi, skupovi) ne zavise od λ. Tako cemo i postupati,uz pretpostavku da postoji λ takvo da je λA+B regularna matrica (ili ekvivalentno, uzpretpostavku da je sistem (27) integrabilan).

Vratimo se sada na opis opsteg resenja sistema (27) u slucaju kada je on integrabilan.U dokazu Teoreme 12 gotovo da smo i dali opis opsteg resenja ovog sistema, kao sto cese videti iz naredne teoreme. Takode, dajemo karakterizaciju svih konzistentnih vektoraza ovaj sistem (vec smo objasnili da u slucaju homogenog sistema, nije vazno za kojutacku vezujemo vektor pocetnih vrednosti).

Teorema 14 Neka je sistem (27) integrabilan. Opste resenje sistema (27) je

x(t) = e−ADBtAADq, q ∈ Cn (36)

Vektor c ∈ Cn je konzistentan za sistem (27) ako i samo ako c ∈ R(AAD) = R(Aind(A)).

Dokaz. Neka je λ ∈ C takvo da je λA+B regularna matrica i neka je k× k dimenzijamatrice J1 definisane u dokazu Teoreme 12. Funkcija

y(t) = (y1(t), ..., yk(t), yk+1(t), ..., yn(t))

je resenje sistema (27) ako i samo ako je resenje sistema Aλx(t) + Bλx(t) = 0, tj. ako isamo ako vazi (koristimo oznake kao u dokazu Teoreme 12):

P

[J1 OO J0

]P−1x(t) + P

[I − λJ1 OO I − λJ0

]P−1x(t) = 0. (37)

Funkcija y(t) je resenje sistema (37) ako i samo ako za funkciju

(z1(t), ..., zk(t), zk+1(t), ..., zn(t)) = z(t) = P−1y(t) vazi

J1z1(t) + (I − λJ1)z1(t) = 0 i J0z2(t) + (I − λJ0)z2(t) = 0, (38)

gde je z1(t) = (z1(t), ..., zk(t)) i z2(t) = (zk+1(t), ..., zn(t)). Matrica J1 je regularna, pa je

z1(t) resenje prvog sistema ako i samo ako je z1(t) = e−J−11 (I−λJ1)tq1, gde je q1 ∈ Ck. Sto

se tice drugog sistema, pokazali smo vec da drugi sistem ima samo trivijalno resenje, pa jez2(t) je resenje drugog sistema ako i samo ako je z2(t) = 0. Dakle, funkcija y(t) = Pz(t)je resenje sistema (37) ako i samo ako je

y(t) = P

[e−J

−11 (I−λJ1)t OO O

]q,

gde je q proizvoljni vektor iz Cn. Posto je P singularna matrica, tacno je ako kazemo ida je y(t) resenje sistema (27) ako i samo ako je

y(t) = P

[e−J

−11 (I−λJ1)t OO O

]P−1q.

Page 60: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

59

Preostalo je samo jos da sredimo dobijeni izraz. Posto je matrica

S(t) =

[−J−11 (I − λJ1)t O

O O

]kvazidijagonalna, vazi:[

e−J−11 (I−λJ1)t OO eO

]= eS(t), pa je eS(t)

[Ik OO O

]=

[e−J

−11 (I−λJ1)t OO O

].

Iz Teoreme 4.18 sledi da je ADλ = P

[J−11 OO O

]P−1. Zato je −ADλ Bλt = PS(t)P−1, pa je

e−ADλ Bλt = ePS(t)P

−1= PeS(t)P−1. Najzad, vazi:

e−ADλ BλtAλA

Dλ = PeS(t)P−1P

[Ik OO O

]P−1 = P

[e−J

−11 (I−λJ1)t OO O

].

Ovim smo dokazali da je opste resenje sistema (27) zaista dato sa (36), ako imamo uvidu razlog za izostavljanje indeksa λ, koji smo vec objasnili.

Drugi deo tvrdenja sledi direktno iz oblika opsteg resenja. Naime, dovoljno je dapogledamo skup konzistentnih vektora sa tackom 0. Ako u opstem resenju stavimot = 0, dobijemo da je x(0) = AADq, odakle sledi da je skup konzistentnih vektoraupravo R(AAD). �

Iz prethodne teoreme vidimo da je za integrabilan sistem (27), resenje definisanona celom skupu R. Iz opsteg resenja jednostavno mozemo izvesti formulu za resenjehomogenog Kosijevog problema, za konzistentan vektor c. U narednoj teoremi sadrzanoje drugo kljucno tvrdenje ovog poglavlja. Naime, u narednoj teoremi dajemo konstrukcijupartikularnog resenje jednacine (26) u slucaju integrabilnog sistema (27) i pod uslovomda je funkcija f(t) dovoljno puta diferencijabilna. Pomocu partikularnog resenja sistema(27) i opsteg resenja pridruzenog homogenog sistema (27) dobijamo opste resenje sistema(26). Na taj nacin cemo zakljuciti koji su konzistentni vektori za posmatranu tacku ikako izgleda resenje Kosijevog problema (28).

Teorema 15 Neka je sistem (27) integrabilan i neka je k = ind(A). Neka je f(t) kputa diferencijabilna u okolini Ot0 tacke t0 ∈ R. Sistem (26) je integrabilan u t0, a jednopartikularno resenje sistema (26), definisano u okolini Ot0, je:

xP (t) = e−ADBt

t∫t0

eADBsADf(s) ds+ (I − AAD)

k−1∑i=0

(−1)i(ABD)iBDf(i)

(t), (39)

gde je nulti stepen matrice jedinicna matrica, a nulti izvod funkcije je sama ta funkcija.Opste resenje sistema (26) dato je sa:

x(t) = e−ADBtAADq + xP (t), q ∈ Cn. (40)

Page 61: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

60

Vektor c je konzistentan sa t0 ako i samo ako je c ∈ R(Ak) + w(t0), gde je

w(t) = (I − AAD)k−1∑i=0

(−1)i(ABD)iBDf(i)

(t).

Jedinstveno resenje Kosijevog problema (28) je:

xK(t) = e−ADB(t−t0)AADc+ e−A

DBt

t∫t0

eADBsADf(t) ds+ w(t). (41)

Dokaz. Napomenimo da matrice A, AD, B, BD, eADBt komutiraju i to nadalje necemo

naglasavati. Neka je

xP1(t) = e−ADBt

t∫t0

eADBsADf(t) ds

xP2(t) = (I − AAD)k−1∑i=0

(−1)i(ABD)iBDf(i)

(t).

Pokazacemo da je AxP1(t)+BxP1(t) = AADf(t) i AxP2(t)+BxP2(t) = (I−AAD)f(t),odakle ce da sledi prvo tvrdenje.

Kako xP1(t) u sebi ”sadrzi” matricu AD, koju mozemo ”prebaciti” na pocetak izraza,a vazi AADAD = AD, imamo

AxP1(t) = A(−ADBxP1(t) + ADe−ADBteA

DBtf(t)) =

= −AADBxP1(t) + AADf(t) = −BxP1(t) + AADf(t).

Ovim smo dokazali prvu jednakost. Da bi dokazali drugu jednakost postupimo na sledecinacin:

Page 62: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

61

AxP2(t) = A(I − AAD)k−1∑i=0

(−1)kAi(BD)i+1f(i+1)

(t)

= (I − AAD)k−1∑i=0

(−1)i(ABD)i+1f(i+1)

(t)

= −(I − AAD)k∑i=1

(−1)i(ABD)if(i)

(t)

= −(I − AAD)k−1∑i=1

(−1)i(ABD)if(i)

(t), jer je (I − AAD)Ak = O

= −(I − AAD)BBD

k−1∑i=1

(−1)i(ABD)if(i)

(t), iskoristili smo Lemu 4.(f)

= −(I − AAD)B

(−BDf

(0)(t) +

k−1∑i=0

(−1)i(ABD)iBDf(i)

(t)

)= (I − AAD)B(BDf(t)− xP2(t))

= −B(I − AAD)xP2(t) + (I − AAD)BBDf(t)

= −BxP2(t) + (I − AAD)f(t);

u poslednjem redu smo ponovo iskoristili Lemu 4.(f) kao i to sto xP2(t) u sebi ”sadrzi”projektor (I − AAD). Ovim smo dokazali da je sa (39) zaista dato partikularno resenjesistema (26). Da je sistem (26) integrabilan sledi direktno iz integrabilnosti sistema (27).Sva ostala tvrdenja teoreme se jednostavno dokazuju. Da je opste resenje dato sa (40)sledi iz toga sto je svaka funkcija definisana sa (40) zaista resenje sistema (26) i iz togasto razlika dva partikularna resenja sistema (26) predstavlja resenje sistema (27). Sa t0su konzistentni oni i samo oni vektori koji se dobijaju u (40) za t = t0 i razlicite vrednosti

vektora q. Zbog komutativnosti matrica A i AD sa matricom e−ADBt0 i zbog toga sto je

poslednja navedena matrica regularna, sledi da je skup konzistentnih vektora sa t0 zaistaR(Ak) + w(t). Da je sa (41) dato resenje sistema (26) sledi iz svega navedenog. Da jexK(t0) = c, sledi iz toga sto je c = AADc′ + w(t0) i (AAD)2c′ = AADc′ i AADw(t0) = 0.�

Page 63: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Glava 6

Zakljucak

U prethodnim glavama dali smo osnove teorije generalisanih inverza matrica. Definisalismo Moore-Penroseov inverz, kao i druge klase generalisanih inverza matrica koji su uvezi sa Penroseovim jednacinama i opisali njihove osobine. Zatim, definisali smo grupni,odnosno, Drazinov inverz matrice, proucili njegove osobine i na taj nacin, posredno ineposredno, uporedili ga sa Moore-Penroseovim inverzom matrice. Na kraju, ukazali smona vaznost generalisanih inverza kroz primere za njihovu primenu na druge matematickeprobleme. Pokazali smo kako se pomocu generalisanih inverza resavaju neke matricnejednacine, kao i neki sistemi diferencijalnih jednacina. Pored toga, naveli smo i drugenacine za primenu generalisanih inverza kao i reference gde se oni mogu naci.

Teorija generalisanih inverza je mlada, ali jako siroka i popularna oblast matematike.Tema ovog rada bili su generalisani inverzi matrica, a pored toga, mogu se proucavati igeneralisani inverzi operatora na Banachovim i Hilbertovim prostorima, kao i generalisaniinverzi na Banachovim i C∗-algebrama, pa i na opstijim algebarskim strukturama. Zbogtoga su mogucnosti za dalja istrazivanja vrlo raznovrsne. Recimo, neki od skorasnjihrezultata su u vezi sa generalisanim inverzima proizvoda matrica i zakonom obrnutog re-dosleda, zatim, generalisani inverzi blok matrica, osobine tezinskih generalisanih inverzaitd. Na temu daljeg proucavanja ove oblasti, pomenimo i to da je Koliha u radu [11] naBanachovim algebrama definisao generalisani inverz koji je nazvao generalizovani Drazi-nov inverz. U vezi sa generalisanim inverzima matrica, veoma je bitno izucavati nacineza odredivanje generalisanih inverza. Bez efikasnih metoda za odredivanje generalisanihinverza, uzaludno je govoriti o njihovoj primeni.

62

Page 64: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Literatura

[1] A. Ben-Israel, T. N. E. Greville, Generalized inverses: theory and aplications, (2nd ed.),Springer, New York, 2002.

[2] S. L. Campbell, C. D. Meyer, Jr., N. J. Rose, Aplications of the Drazin inverse to linearsystem of differential equations, SIAM J. appl. Math. 31 (1976), 411-425

[3] S. L. Campbell, C. D. Meyer, Jr., Continuity Properties of the Drazin Pseudoinverse,Linear Alg. Applic. 10 (1975), 77-83.

[4] S. L. Campbell, C. D. Meyer, Jr., Generalized Inverses of Linear Transformation, SIAM,Philadelphia, 2009.

[5] M. P. Drazin, Pseudoinverse in associative rings and semigroups, American MathematicalMonthly 65 (1958), 506-514.

[6] D. S. -Dordevic, V. Rakocevic, Lectures on Generalized Inverses, PMF, Nis, 2008.

[7] R. A. Horn, C. R. Johnson, Matrix Analysis, Cambridge University Press, Cambridge NewYork Melbourn, 1990.

[8] R. A. Horn, C. R. Johnson, Topics in Matrix Analysis, Cambridge University Press, Cam-bridge New York Melbourn, 1991.

[9] S. Izumino, Convergence of generalized inverses and spline projectors, J. Approx. Theory38 (1983), 269-278

[10] Lj. Kocinac, Linearna algebra i analiticka geometrija, Prosveta, Nis, 1996.

[11] J. J. Koliha, A generalized Drazin inverse, Glasgow Math. J. 38 (1996), 367-381.

[12] R. Penrose, A generalized inverse for matrices, Proc. Cambridge Phil. Soc. 51 (1955),406-413

[13] L. Perko, Differential equations and dynamic systems, Springer-Verlag, New York, 1991.

[14] V. Rakocevic, Continuity of the Drazin inverse, J. Operator Theory 41 (1999), 55-68.

[15] V. Rakocevic, Funkcionalna analiza, Naucna knjiga, Beograd, 1994.

[16] V. Rakocevic, On continuity of the Moore-Penrose and Drazin inverses, Mat. Vesnik 49(1997), 163-172

[17] V. Rakocevic, On the continuity of the Moore-Penrose inverse in Banach algebras, FactaUniv. Ser. Math. Soc. 123 (1995), 3823-3825.

[18] V. Rakocevic, On the continuity of the Moore-Penrose inverse in C∗-algebras, Math. Mon-tisnigri 2 (1993), 89-92.

[19] G. W. Stewart, On the continuity of the generalized inverse, SIAM 17 (1969), 33-45.

[20] Z. Stojakovic, D. Herceg, Numericke metode linearne algebre, Gradevinska knjiga,Beograd, 1985.

63

Page 65: Generalisani inverzi matrica - pmf.ni.ac.rs · PDF fileNeka su X i Y vektorski prostori. Skup svih linearnih preslikavanja iz prostora X u prostor Y ozna cava cemo sa L(X;Y)

Biografija

Marko -Dikic je roden 6.8.1989. godine u Leskovcu. Osnovnu skolu ”Josif Kostic” uLeskovcu i Gimnaziju ”Svetozar Markovic” u Nisu, specijalizovano matematicko ode-ljenje, zavrsio je kao nosilac Vukove diplome.

Skolske 2008/2009. godine upisao je osnovne studije matematike na Departmanu zamatematiku, Prirodno-matematickog fakulteta u Nisu, koje je zavrsio skolske 2010/2011.godine sa prosecnom ocenom 10,00. Skolske 2011/2012. godine upisao je master aka-demske studije na Departmanu za matematiku, Prirodno-matematickog fakulteta u Nisu,studijski program: matematika. Master akademske studije zavrsio je skolske 2012/2013.godine sa prosecnom ocenom 10,00.

Tokom osnovne i srednje skole, ucestvovao je na takmicenjima iz matematike, infor-matike i fizike i osvajao nagrade na saveznim i drzavnim takmicenjima iz ovih oblasti.Sve vreme studiranja, ucestvovao je u organizovanju pripremne nastave za takmicenjaiz matematike za ucenike specijalizovanog matematickog odeljenja Gimnazije ”SvetozarMarkovic” iz Nisa. Takode, tokom studiranja, kao student saradnik ucestvovao je u re-alizaciji seminara matematike u Istrazivackoj stanici ”Petnica”. Avgusta 2013. godinebio je voda niskog tima na finalu takmicenja Medunarodni matematicki turnir gradova,koje je bilo organizovano u mestu Borovka u Belorusiji.

64