18
Matematiˇ cke metode u kemiji Numeriˇ cke metode u kemiji Mnogi na matematiku svedivi kemijski problemi nisu egzaktno rjeˇ sivi. Stoga se u kemiji puno koriste numeriˇ cke metode. 1 Metoda najmanjih kvadrata Jedna od najvaˇ znijih metoda za obradu eksperimentalnih podataka je metoda najmanjih kvadrata. Radi se o metodi s elementima numeriˇ cke matematike i statistike, koju studenti matematike u pravilu ne susre´ cu tokom studija te ´ cemo ovdje dati i izvod te metode (za neke specijalne sluˇ cajeve). Osnovni problem koji rjeˇ sava ova metoda je: kako iz dobivenih eksperimentalnih podataka dobiti funkcionalnu ovisnost. Malo konkretnije, Problem 1: Za zadani niz parova (x i ,y i )(i =1,...,n) traˇ zi se funkcija y = f (x) takva da je ukupna greˇ ska aproksimacije ˇ sto manja. Primjer 1 Pri eksperimentu su za razne temperature dobivene idu´ ce vrijednosti tlaka pare etanola kad su teku´ ca i plinovita (???) faza u ravnoteˇ zi 1 : t/ C T/K p/torr 25 298, 15 55, 90 30 303, 15 70, 00 35 308, 15 93, 80 40 313, 15 117, 50 45 318, 15 154, 10 50 323, 15 190, 70 55 328, 15 241, 90 60 333, 15 304, 15 65 338, 15 377, 90 ˇ Sto uˇ ciniti ˇ zelimo li procijeniti koliki je tlak pri temperaturi 28 C? Jedna mogu´ cnost za opis ovisnosti y o x bila bi naravno provlaˇ cenje” interpolacijske funkcije kroz dane toˇ cke. No, kako u pravilu pri mjerenjima oˇ cekujemo da toˇ cke (x i ,y i ) zapravo nisu toˇ cni parovi tj. oˇ cekujemo da postoji eksperimentalna greˇ ska, u pravilu nam je cilj na´ ci funkciju koja ne mora prolaziti kroz te toˇ cke (ne zahtijevamo y i = f (x i ) za sve i kao kod interpolacije), nego traˇ zimo funkciju kod koje je ukupno raspianje” danih toˇ caka oko njenog grafa ˇ sto manje. Precizirani, statistiˇ cki, oblik metode najmanjih kvadrata zove se regresijska analiza. Tu se zahtjev da je f (x i ) y i zamjenjuje s f (x i )= y i + ε i , gdje je ε i sluˇ cajna varijabla medijana nula. Nadalje, postoji joˇ s jedan razlog zaˇ sto interpolacija ˇ cesto nije primjenjiva: zato jer se za mnoge parove podataka zna o kakvom tipu ovisnosti (recimo: afinom) se radi, samo nisu poznati potrebni koeficijenti. 1 Dvije faze su u ravnoteˇ zi ako su im kemijski potencijali μ jednaki. Kad se radi o sustavima sa samo jednom komponentom, μ je jednaka molarnoj Gibbsovoj energiji G m = G n . Tu je G = H - TS Gibbsova energija, a H = U + pV je entalpija (entalpija je, kao i entropija, funkcija stanja). Ukratko: μ = G m = U+pV -TS n . 1

Metoda Najmanjih Kvadrata

  • Upload
    fejza

  • View
    50

  • Download
    11

Embed Size (px)

Citation preview

Matematicke metode u kemijiNumericke metode u kemiji

Mnogi na matematiku svedivi kemijski problemi nisu egzaktno rjesivi. Stoga se u kemijipuno koriste numericke metode.

1 Metoda najmanjih kvadrata

Jedna od najvaznijih metoda za obradu eksperimentalnih podataka je metoda najmanjihkvadrata. Radi se o metodi s elementima numericke matematike i statistike, koju studentimatematike u pravilu ne susrecu tokom studija te cemo ovdje dati i izvod te metode (zaneke specijalne slucajeve). Osnovni problem koji rjesava ova metoda je: kako iz dobiveniheksperimentalnih podataka dobiti funkcionalnu ovisnost. Malo konkretnije,Problem 1: Za zadani niz parova (xi, yi) (i = 1, . . . , n) trazi se funkcija y = f(x) takva daje ukupna greska aproksimacije sto manja.

Primjer 1 Pri eksperimentu su za razne temperature dobivene iduce vrijednosti tlaka pareetanola kad su tekuca i plinovita (???) faza u ravnotezi1:

t/◦C T/K p/torr25 298, 15 55, 9030 303, 15 70, 0035 308, 15 93, 8040 313, 15 117, 5045 318, 15 154, 1050 323, 15 190, 7055 328, 15 241, 9060 333, 15 304, 1565 338, 15 377, 90

Sto uciniti zelimo li procijeniti koliki je tlak pri temperaturi 28◦C?

Jedna mogucnost za opis ovisnosti y o x bila bi naravno”provlacenje” interpolacijske

funkcije kroz dane tocke. No, kako u pravilu pri mjerenjima ocekujemo da tocke (xi, yi)zapravo nisu tocni parovi tj. ocekujemo da postoji eksperimentalna greska, u pravilu namje cilj naci funkciju koja ne mora prolaziti kroz te tocke (ne zahtijevamo yi = f(xi) za svei kao kod interpolacije), nego trazimo funkciju kod koje je ukupno

”raspianje” danih tocaka

oko njenog grafa sto manje. Precizirani, statisticki, oblik metode najmanjih kvadrata zovese regresijska analiza. Tu se zahtjev da je f(xi) ≈ yi zamjenjuje s f(xi) = yi + εi, gdje je εi

slucajna varijabla medijana nula. Nadalje, postoji jos jedan razlog zasto interpolacija cestonije primjenjiva: zato jer se za mnoge parove podataka zna o kakvom tipu ovisnosti (recimo:afinom) se radi, samo nisu poznati potrebni koeficijenti.

1Dvije faze su u ravnotezi ako su im kemijski potencijali µ jednaki. Kad se radi o sustavima sa samojednom komponentom, µ je jednaka molarnoj Gibbsovoj energiji Gm = G

n . Tu je G = H − TS Gibbsovaenergija, a H = U + pV je entalpija (entalpija je, kao i entropija, funkcija stanja). Ukratko: µ = Gm =U+pV−TS

n .

1

Primjer 2 Etil-propionat se saponificira pomocu vodene otopine natrijevog hidroksida. Nadalje,u vise trenutaka mjerena je koncentracija etil-propionata i dobiveni su iduci rezultati:

t/min 0 5 10 20 40

[R]/10−3mol L−1 25, 00 15, 53 11, 26 7, 27 4, 25

Nije poznato je li reakcija prvog ili drugog reda - kako to utvrditi?

Iako na prvi pogled vrlo razliciti, oba prethodna primjera se oba svode na isti prob-lem: trebalo bi pretpostaviti nekakav oblik funkcijske ovisnosti izmedu parova podataka tega, ukoliko je opravdan, iskoristiti za dobivanje trazenih rezultata. U primjeru 2 vec samtekst problema navodi da trebamo uzeti dva moguca tipa funkcijske ovisnosti. Nude sedva tipa ovisnosti koncentracije o vremenu. Ako je reakcija prvog reda, ovisnost je opisanajednadzbom

[R] = [R]0exp(−k1νRt),

a ako je drugog reda opisana je s

νRk2t =1

[R]0− 1

[R].

U oba slucaja nepoznat je produkt stehiometrijskog koeficijenta s koeficijentom brzine reak-cije, a kao bolji model cemo odabrati onaj koji daje manje greske.Problem 2: Kako za danu funkciju y = f(x) izmjeriti ukupnu gresku obzirom na daneparove (xi, yi) (i = 1, . . . , n)?

Kako obicno podrazumijevamo da nema greske u apscisama (apscise su egzaktno izm-jerene, sto ne mora nuzno biti tocno), razumno je gledati samo

”vertikalna” odstupanja od

funkcije: yi − f(xi) odnosno f(xi)− yi. Buduci je obicno nebitno je li rezultat manji ili veciod tocnog, kao mjeru greske za pojedinu tocku bilo bi razumno uzeti |f(xi)−yi|. No, kao stocemo uskoro vidjeti, biti ce nam potrebna derivabilnost ovih gresaka te je uobicajeno greskuaproksimacije funkcijom f u tocki (xi, yi) mjeriti izrazom (f(xi) − yi)

2. Ukupna greskaaproksimacije u tom slucaju dobije se kao zbroj ovakvih lokalnih gresaka:

E =n∑

i=1

(f(xi)− yi)2.

Problem 3: Kako minimizirati E?Jasno je da jos uvijek nemamo dovoljno podataka kako bi prethodno pitanje bilo matema-

ticki smisleno. Radi preciziranja tog pitanja uvijek se pretpostavlja vrsta funkcije f kojomcemo aproksimirati podatke. Najcesce se koriste afine funkcije f(x) = ax + b, kvadratnefunkcije f(x) = ax2 + bx + c, eksponencijalne f(x) = aebx odnosno f(x) = aebx + c ililogaritamske f(x) = a ln x + b. Stvarni problem je sadaProblem 3’: Ako smo pretpostavili oblik funkcije f , s nepoznatim parametrima a, b, c, . . .,kako onda minimizirati E?

Konkretno, u navedena cetiri slucaja imamo redom

E =n∑

i=1

(axi + b− yi)2,

E =n∑

i=1

(ax2i + bxi + c− yi)

2,

2

E =n∑

i=1

(aebxi + c− yi)2,

E =n∑

i=1

(a ln xi + b− yi)2.

U svim ovakvim slucajevima poznate su vrijednosti (xi, yi), i = 1, . . . , n, a nepoznati suparametri a, b, c, . . .. Stoga u svrhu minimizacije od E mozemo uzeti da je E funkcija nepoz-natih parametara funkcije f tj. trazimo (globalni) minimum funkcije oblika E(a, b, c, . . .).Radi se dakle o problemu odredivanja ekstrema diferencijabilne realne funkcije vise varijabli.Kako su jedine kriticne tocke takve funkcije stacionarne tocke, moguci koeficijenti a, b, c, . . .dobiju se rjesavanjem sustava

∇E = 0

tj.∂E

∂a=

∂E

∂b=

∂E

∂c= . . . = 0

Konkretno dobivamo iduce sustave:Aproksimacija afinom funkcijom - sustav dvije linearne jednadzbe s dvije nepoznan-

ice a i b:(∑

x2i )a + (

∑xi)b =

∑xiyi

(∑

xi)a + nb =∑

yi

Aproksimacija kvadratnom funkcijom - sustav tri linearne jednadzbe s tri nepoz-nanice a, b i c:

(∑

x4i )a + (

∑x3

i )b + (∑

x2i )c =

∑x2

i yi

(∑

x3i )a + (

∑x2

i )b + (∑

xi)c =∑

xiyi

(∑

x2i )a + (

∑xi)b + nc =

∑yi

Za aproksimacije eksponencijalnom i logaritamskom funkcijom dobivaju se nelinearnisustavi koji su u opcem slucaju rjesivi samo numerickim metodama. Takve aproksimacije sucesto ugradene u razne programske pakete, ali su nepogodne za racun obicnim kalkulatorom.Stoga se te metode rjede koriste u primjenama. Nadalje, ocito je matematicki svejednoaproksimiramo li ln y kao ax + b ili y kao eax+b = ebeax, pa je cesto moguce eksponencijalnuaproksimaciju zamijeniti afinom. Napomenimo ovdje ipak da metoda najmanjih kvadrata nemora dati iste vrijednosti za a i b u prethodna dva slucaja. Razlog je sto promjena varijablemijenja relativnu vaznost pojedinih tocaka. To se ispravlja koristenjem tezinskih faktora.

Vratimo se na aproksimaciju afinom i kvadratnom funkcijom. Iz navedenih sustavavidimo da bismo za konkretnu tablicu (xi, yi)-ova lako izracunali koeficijente sustava i rijesilisustav. Time bismo dobili stacionarnu tocku (a, b) odnosno (a, b, c) za E. Radi li se o tockiminimuma? Odgovor je ’da’. Intuitivni razlog za to je da je E

”u biti” kvadratna funkcija s

pozitivnim vodecim koeficijentom (odnosno, suma takvih) pa ocekujemo da ima tocno jedanekstrem koji je ujedno globalni minimum. Precizniji dokaz dobivamo koristenjem Hesseovematrice.

U slucaju aproksimacije afinom ili kvadratnom funkcijom, Hesseova matrica za E biti cekonstantna: za aproksimaciju afinom funkcijom dobivamo

HE(a, b) = 2

[ ∑x2

i

∑xi∑

xi n

]= 2

n∑

i=1

[x2

i xi

xi 1

],

3

a za aproksimaciju kvadratnom funkcijom

HE(a, b, c) = 2

∑x4

i

∑x3

i

∑x2

i∑x3

i

∑x2

i

∑xi∑

x2i

∑xi n

= 2

n∑

i=1

x4i x3

i x2i

x3i x2

i xi

x2i xi 1

Pokazimo da su HE(a, b) za svaki odabir xi-ova od kojih su bar dva (tri) razlicita pozitivnodefinitne (dokaz za HE(a, b, c) je slican, ali tehnicki kompliciraniji). Ako to dokazemo, slijedida je svaka stacionarna tocka, dakle gore izracunati a, b (a, b, c) tocka minimuma za E.

Kao prvo, uocimo da su sve matrice u sumi za HE(a, b) pozitivno semidefinitne (x2i ≥ 0,

x2i − xi · xi = 0 za sve i). Zbroj prve dvije je pozitivno definitan jer se radi o matrici

oblika

[x2

1 + x22 x1 + x2

x1 + x2 2

], ciji gornji lijevi kut je ocito pozitivan, a determinanta joj je

2(x21 +x2

2)− (x1 +x2)2 = (x1−x2)

2, sto je takoder pozitivno (nenegativnost je u oba slucajaocigledna, a pozitivnost slijedi jer x1 6= x2).

Primjer 3 Kad bismo metodu najmanjih kvadrata (aproksimacija afinom funkcijom) prim-ijenili na podatke iz prvog primjera, dobili bismo p(T ) = 7, 866T − 2324, 182. To bi dalo tlakpri temperaturi 28◦C=273, 15 + 28K=301, 15K iznosa p(301, 15) = 44, 664torr.

Pogledamo li bolje, podaci iz prvog primjera prilicno ocigledno ne daju linearnu zavisnost,no moguce je linearizirati problem.

Postoje nacini za odredivanje faznih granica tj. tlakova i temperatura pri kojima tvarpostoji u dvije faze. Iz uvjeta jednakosti kemijskih potencijala moze se odrediti ovisnost tlakao temperaturi, ali najjednostavnija diskusija faznih granica dobije se opisom koeficijentasmjera tangente na graf p = p(T ). Za njega vrijedi Clapeyron-ova jednadzba:

dp

dT=4trsS

4trsV

(trs oznacava da gledamo promjenu entropije odnosno volumena pri tranziciji iz jedne udrugu fazu). Za granicu izmedu tekuce i plinovite faze njen oblik je

dp

dT=

4vapH

T4vapV

jer je entropija isparavanja 4trsS = 4vapHT

. Nazivnik je u ovom slucaju uvijek bitno veci od

brojnika (i oba su pozitivni) pa je dpdT

mali pozitivan broj.Pretpostavimo li da je volumen tekuceg dijela zanemariv u odnosu na plinoviti dio te da

je plin idealan (pV = nRT ), imamo

4vapV ≈ Vgas ≈ RT

P

Clapeyron-ove jednadzba uz pretpostavku da je 4vapH = const. nakon integriranja daje

ln p = −4vapH

RT+ C

Konstanta integracije C ovisi o promatranoj tvari i sustavu.Vidimo dakle da je ln p uz navedene pretpostavke afina funkcija od 1

T.

4

Sad imamo tablicu1/T · 103 ln p3, 354 4, 0243, 299 4, 2483, 245 4, 5413, 193 4, 7663, 143 5, 0383, 095 5, 2513, 047 5, 4893, 002 5, 7182, 957 5, 935

za koju po navedenom znamo da njene podatke ima smisla aproksimirati afinom funkcijom.Metoda najmanjih kvadrata daje

ln p = −4.854 · 103T−1 + 20, 283 = 20, 283− 4854T−1

Za pitanje iz primjera 1 (tlak pri temperaturi 301, 15K) imali bismo ln p(301, 15−1) = 4, 164tj. p = 64, 379torr. Usporedite rezultat graficki!

Da smo zeljeli izracunati recimo promjenu entalpije pri isparavanju, imali bismo −4vapHR

=−4854, pa uvrstavanje plinske konstante R = 8, 3145JK−1mol−1 daje 4vapH = 40359Jmol−1.

Kao sto vidimo iz prethodnog primjera, vrlo je bitno imati neki argument za koristenjeodredenog tipa aproksimacijske funkcije. Konkretnu, Clapeyron-ova jednadzba je bila ar-gument da ln p aproksimiramo afinom funkcijom od 1/T . Cesto ne postoji takav teorijskiargument, nego eventualno skica parova podataka moze sugerirati odgovarajuci tip funkcije.Cesto je nuzno isprobati i vise mogucih aproksimacija:

Primjer 4 Recimo da smo pri nekoj kemijskoj reakciji mjerili koncentracije (jedinog) reak-tanta i zelimo odrediti kojeg je reda reakcija. Imamo osnove za pretpostavku da je reakcijareda bar 1 i najvise 3. Kako smo naucili u prvom poglavlju ovog kolegija, reakcije prvog redasu opisane s

ln [A] = k1νAt + ln [A]0,

reakcije drugog reda s1

[A]=

1

[A]0− k2νAt,

a reakcije treceg reda s1

2[A]2=

1

2[A]20− k3νAt.

Za dane podatke, ako ne znamo kojeg reda je reakcija, mozemo isprobati tri aproksimacijeafinom funkcijom i vidjeti koja daje najmanje greske Ei = |f(xi)− yi|.

Konkretno, neka su dani podaci

t/min [A]/molL−1

5 0, 71510 0, 60215 0, 50120 0, 41925 0, 36030 0, 30035 0, 24940 0, 21445 0, 173

5

Pretpostavka da je reakcija prvog reda daje ln [A] = −0, 0350t− 0, 1592 i pritom imamogreske redom 0,001; 0,002; 0,006; 0,01; 0,013; 0,006; 0,004; 0,019; 0,019.

Pretpostavka da je reakcija drugog reda daje 1

[A]= 0, 1052t + 0, 4846 i pritom imamo

greske redom 0,388; 0,125; 0,066; 0,201; 0,336; 0,306; 0,149; 0,018; 0,563.Pretpostavka da je reakcija treceg reda daje 1

2[A]2 = 0, 0355t − 3, 054 i pritom imamo

greske redom 2,259; 0,888; 0,263; 1,19; 1,953; 2,029; 1,293; 0,212; 3,803.Ocito smo u prvom slucaju dobili najmanje greske te zakljucujemo da je reakcija prvog

reda, a koeficijent brzine reakcije je k1 = 0, 035.

Zadatak. Rijesite problem zadan primjerom 2.Poopcimo sad gornje metode. U primjenama je cesto potrebno naci aproksimativnu

realnu funkciju ne jedne, vec vise varijabli. Pretpostavimo dakle da su xi ∈ Rk, i = 1, . . . , n.Cilj je odrediti realnu funkciju φ koja aproksimira podatke. Prvo pretpostavljamo da je φlinearna kombinacija nekih m jednostavnijih funkcija φ(j):

φ(x) =m∑

j=1

ajφ(j)(x)

Recimo, za k = 1 i aproksimaciju afinom funkcijom imamo m = 2, φ(1)(x) = 1, φ(2)(x) =x.

Prvo pitanje koje se postavlja je koliki treba biti m i kakve funkcije trebaju biti φ(j)-ovi.Sto je m manji, krivulja φ ce imati manje oscilacija, ali ce i lokalne greske biti vece. Pre-porucljiva orijentaciona vrijednost je m ≤ n

2. Kao φ(j)-ovi najcesce se uzimaju monomi, no

odabir tih funkcija ovisi o tome sto ocekujemo, kao i kod osnovnog oblika metode najmanjihkvadrata.

Pretpostavimo u daljnjem da znamo m i φ(j)-ove. Uvjet minimizacije greske glasi

‖ Y − Φa ‖2= (Y − Φa)t(Y − Φa)→min,

pri cemu je Y = (y1, . . . , yn)t, a = (a1, . . . , am)t, Φ =

φ(1)(x1) · · · φ(m)(x1)...

...φ(1)(xn) · · · φ(m)(xn)

. Vidimo

da imamo zadatak minimizacije realne funkcije m varijabli F (a) =‖ Y − Φa ‖2. Standardnipostupak za odredivanje ekstrema funkcije vise varijabli daje uvjet tj. sustav

ΦtΦa = ΦtY

(DZ: sami izvedite taj uvjet!) Kao i prije, ovaj uvjet izrazava trazenje stacionarne tocke ai on je dovoljan. Matrica ΦtΦ je invertibilna kad god je Φ maksimalnog ranga, pa imamoformulu

a = (ΦtΦ)−1ΦtY

Matrica (ΦtΦ)−1Φt se zove pseudoinverz matrice Φ (ovo je zapravo samo specijalni slucajpojma pseudoinverzne matrice). Primijetimo da je za dimenzije matrica Y , a i Φ nebitno ukojem Rk

”zive” xi-ovi.

Primjer 5 Ako je k = 1, m = 2, φ(1)(x) = 1, φ(2)(x) = x, onda dobivamo

Φ =

1 x1...

...1 xn

,

6

ΦtΦ =

[m

∑xi∑

xi∑

x2i

],

ΦtY =

[ ∑yi∑

xiyi

].

2 Numericko rjesavanje nelinearnih jednadzbi

Mnoge jednadzbe koje se pojavljuju u kemiji nisu linearne te ih je potrebno rijesiti numericki.U pravilu se za to naravno koriste gotovi programi, npr. Mathematica, no kemicari vecinomtokom studija nauce osnovne tehnike numerickog rjesavanja nelinearnih jednadzbi.

Primjer 6 Van der Waals-ova jednadzba stanja plina glasi(P +

n2a

V 2

)(V − nb) = nRT,

pri cemu su a i b parametri neovisni o temperaturi, ali ovisni o plinu kojeg promatramo. Takosu im recimo za ugljikov dioksid CO2 vrijednosti a = 0, 364 Pa m6 mol−2, b = 4, 267 · 10−5

m3 mol−1.Promatrana kao jednadzba za volumen V , van der Waalsova jednadzba je kubna jed-

nadzba. Pomocu Mathematice ili pak pomocu Cardanovih formula dobije se da ima jednorealno i dva kompleksna rjesenja, i sva tri su bez specificiranja vrijednosti za P, T, n, a, b vrlo

”ruzni” izrazi. Zbog konteksta, ocigledno je jedino potrebno rjesenje ono realno.

U konkretnoj situaciji (tj. za konkretne vrijednosti P, T, n, a, b) ta se jednadzba mozeefikasno rijesiti nekom numerickom metodom. Tako npr. za 1000 mola ugljikovog dioksidapri temperaturi 298, 15K i tlaku 105Pa imamo jednadzbu

(105 +

3, 64 · 105

V 2

)(V − 4, 267 · 10−2) = 2478968, 175

Mnozenjem s V 2 i sredivanjem (uz zaokruzivanje na tri decimalna mjesta) dobivamo

V 3 − 24, 8324V 2 + 3, 64V − 0, 155319 = 0.

Podsjetimo se Newtonove metode tangente za numericko rjesavanje nelinearnih jednadzbif(x) = 0: Neka je f klase C2 i u [a, b] ima nultocku (tj. f(a)f(b) < 0); dodatna pretpostavkaza konvergenciju Newtonove metode je da f ′ i f ′′ ne mijenjaju predznak na [a, b]. Newtonovametoda iterativno konstruira sve bolje aproksimacije nultocke formulom

xn+1 = xn − f(xn)

f ′(xn).

Kao pocetna aproksimacija x0 uzima se a ili b tako da vrijedi f(x0)f′′(x0) > 0 (tj. tako da u

x0 f i f ′′ imaju isti predznak).

Primjer 7 Nastavimo gornji primjer:

f(V ) = V 3 − 24, 8324V 2 + 3, 64V − 0, 155319

f ′(V ) = 3V 2 − 49, 6648V + 3, 64

f ′′(V ) = 6V − 49, 6648

7

f(24) = −392, 223 < 0

f(25) = 195, 632 > 0

Na intervalu [a, b] su f ′ i f ′′ pozitivne (tj. f je rastuca i konveksna). Kao pocetnu aproksi-maciju uzimamo 25.

Newtonove iteracije daju tablicu:

xn f(xn) f ′(xn) xn+1 − xn

25 195, 632 637, 02324, 6929 4, 70249 606, 493 −0, 30710424, 6851 0, 00296012 605, 729 −0, 0077535824, 6851 1, 11781E − 9 605, 729 −4, 88687E − 06

U zadnjoj od dobivenih aproksimacija je x = 24, 6851 i greska je reda velicine 10−6.

Primjer 8 Prema Planckovoj teoriji zracenja crnog tijela, spektralna gustoca zracenja jeopisana formulom

ρ(λ) =8πhc

λ5(ehc/λkT − 1),

gdje je h = 6, 62608 · 10−34Js je Planckova konstanta, kB = 1, 38066 · 10−23JK−1 je Boltz-mannova konstanta, c = 3 · 108ms−1 je brzina svjetlosti. Odredite valnu duljinu λmax za kojuje pri T = 6600K gustoca zracenja maksimalna! Izrazite λmax u mikrometrima i provjeriteu koji dio spektra spada.

Deriviranjem funkcije ρ dobije se jednadzba za stacionarnu tocku

−8πhc

kT· 5kTλehc/λkT − 5kTλ− hcehc/λkT

λ7(ehc/λkT − 1)2= 0

tj.5kTλehc/λkT − 5kTλ− hcehc/λkT = 0

koju se mora rjesavati numericki. Njeno rjesenje je trazeni λmax jer je ρ zapravo funkcijagustoce vjerojatnosti.

3 Izgladivanje

Prije koristenja numerickih formula cesto se prvo radi tzv. izgladivanje funkcije (prilago-davanje ordinata tako da budu sto blize polozaju na grafu neke glatke funkcije). Razlog je utome sto rezultati mjerenja cesto sadrze

”sum” te ga je potrebno nekako razdvojiti od pravog

”signala”. To je nemoguce potpuno napraviti te je cilj izgladivanja povecati udio signala u

odnosu na sum bez da se podaci previse iskrive.Izgladivanje radi tako da se stare ordinate zamijene pogodnim linearnim kombinacijama

tih ordinata. Ideja metode Savitzky-Golay je da redom (slijeva udesno) uzimamo jednakbroj N susjednih cvorova kroz koje povlacimo polinom p zadanog stupnja (manjeg od N) kojiu smislu metode najmanjih kvadrata najbolje aproksimira dane vrijednosti; nakon toga seizmjerene vrijednosti u srednjoj tocki yi zamijene vrijednostima p(xi). Broj N se cesto zovesirina prozora, jer zamisljamo da ucrtane podatke gledamo samo kroz prozor s N apscisa, aostatak ignoriramo. Iz dobivenih koeficijenata moze se procijeniti kako signal, tako i njegovederivacije (do reda pet). Postoje i druge metode, no prednost metode Savitzky-Golay je dacuva lokalne ekstreme.

8

Tako npr. za N = 5 redom radimo aproksimacije za x1, . . . , x5 (zamjena y3 s p2(y3)),x2, . . . , x6 (zamjena y4 s p3(y4)), itd. do xn−4, . . . , xn (zamjena yn−2 s pn−3(yn−2)). U opcemslucaju formula je oblika (za N = 2n + 1)

yi =

∑nj=−n Ajyi+j∑n

j=−n Aj

Formula metode Savitzky-Golay za sirinu filtera 5 i kvadratne polinome (funkcionirasamo za ekvidistantne mreze) dana je s

yi =17yi + 12(yi+1 + yi−1)− 3(yi+2 + yi−2)

35,

a za sirinu filtera 7 i polinome stupnja 2 dana je s

yi =7yi + 6(yi+1 + yi−1) + 3(yi+2 + yi−2)− 2(yi+3 + yi−3)

21.

Dodatni materijali:- Excel-worksheet s primjerom izgladivanja,- SGManual.nb (155 KB) - Example notebook for SavitzkyGolay.m (s web-stranicehttp://library.wolfram.com/infocenter/MathSource/789/).

4 Numericko deriviranje

U nekim situacijama potrebno je odrediti vrijednost derivacije u tocki bez deriviranja funkcije.To se posebno cesto desava kad nemamo na raspolaganju tocnu formulu za funkciju, negosamo eksperimentalne podatke, ali i kad je analiticka formula jako slozena. Osnovna idejanumerickog deriviranja je aproksimacija putem definicije:

f ′(x) ≈ 4f

4x

Aproksimacija je to bolja sto je 4x blizi nuli. Koristenje Taylorovog polinoma daje procjenugreske pri takvoj aproksimaciji. Ako je f klase Cn imamo

f(x +4x) = f(x) + f ′(x)4x +n∑

k=2

f (k)(x)

k!(4x)k +

f (n+1)(ξ)

(n + 1)!(4x)n+1

gdje je ξ neki broj izmedu x i x + 4x. Stoga je greska numerickog deriviranja pomocu

definicije E(x) =∑n

k=2f (k)(x)

k!(4x)k + f (n+1)(ξ)

(n+1)!(4x)n+1.

Varijante formule za aproksimaciju f ′(x) su:

f ′(x) ≈ f(x +4x)− f(x)

4x

f ′(x) ≈ f(x)− f(x−4x)

4x

f ′(x) ≈ f(x +4x)− f(x−4x)

24x

9

Zadnja formula je specijalni slucaj procjene koju dobijemo koristenjem interpolacijekvadratnom funkcijom kroz tocku xi i njene susjede xi−1, xi+1, pa je

f ′(xi) ≈ f(xi)− f(xi−1)

xi − xi−1

+f(xi+1)− f(xi)

xi+1 − xi

− f(xi+1)− f(xi−1)

xi+1 − xi−1

Za slucaj ekvidistantne mreze (s razmakom h medu cvorovima) bolji rezultati mozu sedobiti iduca formula:

f ′(xi) ≈ 1

h

n∑

i=1

(−1)i+14yi

i

Pritom je41yi = yi+1 − yi,

4i+1yi = 4iyi+1 −4iyi

Primjer 9 Uzmimo sad podatke iz primjera 1. U prilogu je Excel-Worksheet s izracunatimaproksimacijama derivacija sa i bez izgladivanja. Ako znamo temperaturu i tlak promjenuvolumena pri prijelazu izmedu tekuce i plinovite faze mozemo procijeniti s volumenom uplinovitom stanju (jer je bitno veci):

4Vvap ≈ Vvap(g) =RT

p

Nadalje, iz Clapeyronove jednadzbe dobijemo npr. da za t = 40◦C promjena entalpije iznosi(uzimamo podatke nakon izgladivanja)

4Hvap = T4Vvapdp

dT≈ 8, 3145 · 313, 152 · 5, 575

119, 72= 37968, 12J

Usporedimo li taj rezultat s rezultatom dobivenim u primjeru dva drugacijim numerickimpristupom

Dodatni materijal:- Excel-worksheet s primjerom numerickog deriviranja (reakcija prvog reda, odredivanje ko-eficijenta reakcije)

5 Numericko integriranje

U kemiji se mnogi integrali ne mogu racunati direktnim postupcima, Dva najcesca razlogaza to su integrali koji za rezultat nemaju elementarnu funkciju (poput integrala Gaussovefunkcije y = e−ax2

) ili potreba izracunavanja integrala iz tablice eksperimentalnih rezultata(tu je doduse moguce prvo aproksimirati, pa onda egzaktno integrirati, ali cesto je potrebnosamo izracunati integral). Napomenimo ovdje da se u praksi pojavljuju razni problemi i prinumerickom integriranju, od kojih je najlaksi taj da mnoge funkcije koje treba integrirati nisunenegativne na intervalu integriranja, ali trazimo povrsinu izmedu grafa i osi apscisa. Kao stoznamo, taj problem se rjesava integriranjem apsolutne vrijednosti funkcije: P =

∫ ba |f(x)| dx.

Vecina integrala u kemiji su odredeni integrali. Podsjetimo se na dvije najvaznije formuleza numericko integriranje (po ekvidistantnoj mrezi a = x0, . . . , xn = b s

”ocicom” h).

Produljena trapezna formula dobije se integriranjem pripadnog linearnog spline-a:

IT (h) =h

2

(f(x0) + 2

n−1∑

i=1

f(xi) + f(xn)

)

10

Greska te formule iznosi∣∣∣f ′′(t)·(b−a)3

12n2

∣∣∣ za neki t ∈ 〈a, b〉.Produljena Simpsonova formula dobije se integriranjem funkcije koju se dobije po

dijelovima kvadratnom interpolacijom (za n paran):

IS =h

3

f(x0) + 4

n2∑

i=1

f(x2i−1) + 2

n2−1∑

i=1

f(x2i) + f(xn)

Greska ove formule je∣∣∣f (4)(t)·(b−a)5

180n4

∣∣∣ za neki t ∈ 〈a, b〉.U slucaju neekvidistantne mreze, najlakse je koristiti opcu varijantu od IT :

IT =1

2

n−1∑

i=0

(f(xi) + f(xi+1))(xi+1 − xi)

Primjer 10 U eksperimentu su dobiveni iduci podaci ovisnosti toplinskog kapaciteta olovau ovisnosti o temperaturi:

T/K 10 15 20 25 30 50 70 100 150 200 250 298Cp 2.8 7.0 10.8 14.1 16.5 21.4 23.3 24.5 25.3 25.8 26.2 26.6

Potrebno je izracunati entropiju pri temperaturi 298K tj.

S(298) =∫ 298

0

Cp(T )

TdT

Kako je najniza promatrana temperatura 10K, prvo je potrebno podatke ekstrapoliratitzv. Debye-vom ekstrapolacijom: pretpostavljajuci da je toplinski kapacitet pri malimtemperaturama proporcionalan s T 3, pretpostavi se da je ovisnost od 0 do Tmin (u nasemslucaju Tmin = 10K) dana s Cp(T ) = aT 3. Tada je

∫ Tmin

0

Cp(T )

TdT =

∫ Tmin

0

aT 3

TdT =

1

3aT 3|Tmin

0 =Cp(Tmin)

3

Stoga je∫ 100

Cp(T )T

dT = 13Cp(10) = 0, 93333. Slijedi:

S(298) ≈ Cp(10)

3+

∫ 298

10

Cp(T )

TdT

Integral od 10 do 298 izracunamo trapeznom formulom (opci oblik):

S(298) ≈ 65, 2039

Kod ekvidistantne mreze cesto se Rombergovom metodom poboljsava rezultat. Za tumetodu koristi padajuci niz h-ova (obicno definirani induktivno s h0 = b− a, hj+1 = hj/2),njih recimo m + 1, te se za svaki od njih poopcenom trapeznom formulom dobije iznosprve aproksimacije I0,k. Sad se konstruira trokutasta shema aproksimacija Ij,k koja imasvojstvo da niz (I1,j) s rastucim j brzo konvergira prema tocnoj vrijednosti I - puno brzenego konvergira niz (I0,j). Konkretno imamo algoritam:

for (k=0; k≤m; k++) I0,k = IT (hk);for (j=1; j≤m; j++)

for (k=j; k≤m; k++) Ij,k = Ij−1,k + (Ij−1,k − Ij−1,k−1)/((hk−j/hk)2 − 1);

Za slucaj da je hj+1 = hj/2 za sve j zadnja formula se pojednostavljuje na

Ij,k = Ij−1,k + (Ij−1,k − Ij−1,k−1)/(4j − 1)

11

Primjer 11 Kroz ravnu cijev radijusa R tece ulje visokog viskoziteta, brzinom w ovisnomo udaljenosti r od osi cijevi. Poznato je da u tim uvjete u jendoj minuti kroz svaki presjekcijevi prode

v = 2π∫ π

0rw(r)dr

ulja (npr. izrazeno u m3min−1).U cijevi radijusa 0,4 m mjerene su brzine strujanja i dobivene iduce vrijednosti:r/m 0,00 0,05 0,10 0,15 0,20 0,25 0,3 0,35 0,4w(r) / m min−1 1,20 0,82 0,58 0,44 0,32 0,23 0,18 0,14 0,12

Izracunamo li pripadne vrijednosti podintegralne funkcije r · w(r) dobivamor/m 0,00 0,05 0,10 0,15 0,20 0,25 0,3 0,35 0,4rw(r) / m2min−1 0,000 0,041 0,058 0,066 0,064 0,058 0,054 0,049 0,048

Neka je m = 3 i h0 = b − a = 0, 4, h1 = h0/2 = 0, 2, h2 = h1/2 = 0, 1 i h3 = h2/2 =0, 05. Produljena trapezna formula redom daje I0,0 = 0, 0096, I0,1 = 0, 0176, I0,2 = 0, 02 iI0,3 = 0, 0204. Sad dalje racunamo Rombergovom metodom:

j 0 1 2 30, 0096

0, 0202670, 0176 0, 020836

0, 0208 0, 0204940, 02 0, 020515

0, 0205330, 0204

Zakljucujemo da je v ≈ 2π · 0, 020494 = 0, 128765m3min−1.

6 Numericko rjesavanje obicnih diferencijalnih jednadzbi

Obicne (i parcijalne) diferencijalne jednadzbe koje se pojavljuju u fizici i kemiji cesto nisurjesive analiticki tj. egzaktno. Stoga je potrebno koristiti numericke metode za dobivanjerjesenja. Postoji niz numerickih metoda za rjesavanje obicnih diferencijalnih jednadzbi, anajpoznatija je Eulerova metoda.

Recimo da je potrebno rijesiti Cauchy-jev problem

y′(t) = f(t, y(t)), y(t0) = y0

Derivaciju y′(t) aproksimiramo s y′(t) ≈ y(t+h)−y(t)h

, cime dobijemo

y(t + h) ≈ y(t) + hf(t, y(t)).

Odaberemo duljinu koraka h i iteriramo po nizu t0, t1 = t0 +h, . . . , tn+1 = tn +h,. . . Nekaje yn dobivena numericka procjena vrijednosti tocnog rjesenja y(tn). Ona se iz gornje formuleza y(t + h) dobiva rekurzijom

yn+1 = yn + hf(tn, yn).

Leonhard Euler je opisao ovu metodu 1768. Ona spada u tzv. eksplicitne metode (tosu one u kojima se yn+1 raˇuna iz vec izracunatih podataka). Postoje i druge varijante ovemetode kao i njena poboljsanja (osobito u numerickom smislu). Koristenjem aproksimacije

derivacije korakom unatrag (y′(t) ≈ y(t)−y(t−h)h

) dobiva se npr. Eulerova metoda s korakom

12

unatrag: yn+1 = yn + hf(tn+1, yn+1) koja spada u implicitne metode (potrebno je rjesavatijednadzbu da bismo izracunali yn+1). Greska Eulerove metode je reda h pa se radi o tzv.metodi prvog reda. Uocimo: ideja Eulerove metode je da se

”visina” iduce ordinate iz

prethodne konstruira po (aproksimativnoj) tangenti u toj prethodnoj tocki (ako imamodiferencijalnu jednadzbu y′ = f(x, y), znaci da je f(xn, yn) koeficijent smjera tangente utocki (xn, yn)).

Primjer 12 Reakcije prvog reda opisane su jednadzbom tipa:

−c′ = kc

Neka je c0 = 1, 000mol l−1 i k = 1, 000 s−1. S raznim koracima h i Eulerovom metodomizracunajte koncentraciju nakon dvije sekunde.

Eulerovu metodu lako je poopciti na sustave jednadzbi: ako je dan sustav

y′ = f1(t, y, z, . . .)

z′ = f2(t, y, z, . . .)

...

s pocetnim uvjetom (t0, y0, z0, . . .), Eulerove iteracije dane su s

yn+1 = yn + hf1(tn, yn, zn, . . .),

zn+1 = zn + hf2(tn, yn, zn, . . .),

...

Primjer 13 Promatramo li reakcijski mehanizam A+B⇀↽X, X+B→R+S, dobivamo sustav

d[A]

dt= −k

(−1)1 [A][B] + k

(1)1 [X]

d[B]

dt= −k

(−1)1 [A][B] + k

(1)1 [X]− k

(2)1 [B][X]

d[X]

dt= k

(−1)1 [A][B]− k

(1)1 [X]− k

(2)1 [B][X]

Taj sustav nije rjesiv analiticki. Napravite prikladni Excel-worksheet za rjesavanje ovogsustava Eulerovom metodom.

Bolje metode od Eulerove imaju vise koraka o kojima ovisi iduca aproksimacija. Na-jpoznatije su Runge-Kutta metode, osobito Runge-Kutta metoda cetvrtog reda (greskaje reda velicine h4)

yn+1 = yn +h

6(k1 + 2k2 + 2k3 + k4)

gdje jek1 = f (tn, yn) ,

k2 = f

(tn +

h

2, yn +

h

2k1

),

k3 = f

(tn +

h

2, yn +

h

2k2

),

k4 = f (tn + h, yn + hk3) .

13

7 Faktorska analiza i dekompozicija matrice po singu-

larnim vrijednostima (SVD)

Faktorska analiza je zajednicko ime za statisticke tehnike kojima se pokusavaju objasniti ra-zlike u vrijednostima opazenih slucajnih varijabli koristeci manji broj neopazenih slucajnihvarijabli, koje se zovu faktori. Mnoge mjerljive velicine koje opisuju neki sustav su lin-earne kombinacije nekih faktora (gdje su koeficijenti u linearnoj kombinaciji tezine koje sepridruzuju tim faktorima). Recimo, gledamo li tablicu ocjena studenata kod razlicitih pro-fesora, nju mozemo shvatiti kao matricu s ocjenama dij (retci: studenti; stupci: profesori),pri cemu je svaka dij oblika

∑mk=1 siklkj, gdje je sik uspjeh studenta i u faktoru ocjene k,

a lkj je tezina koju profesor j daje faktoru k. Iz definicije vidimo da se matrica D mozeprikazati kao produkt matrica SL. Pritom matrica S = [sik] sadrzi uspjehe studenata upojedinim faktorima ocjena, a L = [lkj] sadrzi tezine faktora za pojedine profesore. MatricaD obicno se zove matrica podataka; cesta oznaka je i X. Izvorni cilj faktorske analize bioje dobivanje matrice S iz D kako bi se znali uspjesi studenata u pojedinim faktorima bezutjecaja profesorovih subjektivnih kriterija.

Recimo da imamo na raspolaganju tablice mjerenja, kojoj retci predstavljaju objekte(na kojima smo nesto mjerili), a stupci parametre mjerenja. Tablica se zove heterogena akosu mjerne jedinice razlicite za razlicite stupce, a homogena ako su mjerne jedinice za svestupce iste. Kompozicijske tablice su vrsta homogenih u kojima se nalaze relativne koncen-tracije uzoraka (svaki red tada ima sumu 1). Ako imamo homogenu tablicu (poput tablicespektroskopskih adsorpcija kemijskih uzoraka) koje se mogu urediti po nekom fizikalnomparametru (recimo valnim duljinama pri kojima su izvrsena mjerenja) govorimo o uredenojtablici. Postupci se donekle razlikuju za analizu pojedinih vrsta tablica. Ovdje cemo opisatisamo neke glavne korake analize glavnih komponenti.

Na apstraktnom nivou, cilj faktorske analize je faktoriziranje matrice podataka X ∈ Mnp

na dvije matrice R i C (X = RC), gdje se broj stupaca od R (= broj redaka od C) zovebroj faktora. Broj faktora cemo oznacavati s r. Ono sto je u primjenama obicno najveciproblem je dobivanje fizikalno smislene interpretacije apstraktnih faktora.

Recimo da su u eksperimentu mjerene UV-absorbancije pet smjesa (recimo razlicitorazrijedene otopine ???) za koje znamo da se sve sastoje od istih kemijskih komponenti,a mjerenja su vrsena pri sest razlicitih valnih duljina: 278, 274, 270, 266, 262 i 258 nm.Tablicu podataka predocavamo matricom u kojoj retci odgovaraju navedenim valnim dulji-nama, a stupci pojedinim smjesama.

— matrica X sa str. 6 u knjizi [4]Problem je sto u pravilu ne znamo od koliko (i kojih) kemijskih komponenti se nase smjese

sastoje, i u kojim koncentracijama. Faktorska analiza pomaze odgovoriti na to pitanje.Faktorizacija matrice podataka dati ce medu inim i broj faktora r; taj broj npr. u gornjem

primjeru odrazava uzimanje u obzir samo onih absorbancija koje leze unutar eksperimen-talne greske. Ako dobijemo apstraktnu faktorizaciju matrice podataka, ona obicno neceimati fizikalno smislenu interpretaciju, pa nakon prvog matematickog dijela posla preostajenalazenje odgovarajuce transformacije apstraktnog rjesenja u fizikalno smisleni oblik. Uslucaju absorbancije (u pravilu) vrijedi Beer-Lambertov zakon: xij =

∑k εikckj, gdje je

εik molarna absorptivnost po jedinicnoj duljini za komponentu k pri i-toj valnoj duljini, a ckj

je molarna koncentracija komponente j u k-toj smjesi. Stoga je potrebno dobiti faktorizacijuoblika X = RC (R = [εik], C = [ckj]), gdje ce stupci od E odgovarati absorbancijama poje-dine komponente pri razlicitim valnim duljinama, a retci matrice C ce odgovarati njihovimkoncentracijama u pojedinim smjesama. Kako bi se dobio tocan r i dobra faktorizacija, ko-

14

risti se tzv. analiza glavnih komponenti (faktora) (engl. principal component analysis).U biti, radi se o odredivanju linearnog operatora koji podatke prebacuje u novi koordinatnisustav u kojem ce na prvoj koordinati biti opisani podaci s najvecom varijancom, na drugojoni s prvom manjom itd. Odabirom rada samo s onim koordinatama koje imaju dovoljnoveliku varijancu, skup podataka se reducira na

”glavne komponente” koje u dovoljnoj mjeri

zadrzavaju karakteristike.Jedna od tehnika za analizu glavnih komponenti i vrlo cesto koristena je SVD dekom-

pozicija matrice.Kao sto je poznato, regularne (i ne samo takve) kvadratne matrice A moguce je fak-

torizirati na donjetrokutastu matricu L i gornjetrokutastu matricu U Gaussovom metodomeliminacija. Takva je faktorizacija namijenjena prije svega rjesavanju sustava linearnih jed-nadzbi. Osim ove faktorizacije, u numerickoj linearnoj algebri poznat je i niz drugih korisnihfaktorizacija, a ovdje cemo se upoznati sa SVD-faktorizacijom koja se cesto koristi u fizikalnojkemiji. SVD-faktorizacija je u biti poopcenje spektralnog teorema na nekvadratne matrice.Podsjetimo se: spektralni teorem kaze da za normalnu matricu postoji ortonormiranja bazanjihovih svojstvenih vektora u kojoj se ta matrica dijagonalizira.

Teorem 1 (SVD-faktorizacija) Neka je X ∈ Mnp(F), gdje je F polje realnih ili komplek-snih brojeva. Tada postoje unitarne matrice U ∈ Mn(F) i V ∈ Mp(F) te matrica Σ ∈ Mnp(F)sa svojstvom Λij = 0 za i 6= j i li = Λii ≥ 0 (i = 1, . . . ,min(n, p)) takve da je

A = UΛV t

Takva faktorizacija zove se dekompozicija matrice A po singularnim vrijednostima, kratkoSVD-faktorizacija.

Nepomenimo da se cesto koristi i varijanta gornjeg teorema u kojoj je Λ ∈ Mr, U ∈ Mnr

i V ∈ Mpr uz r ≤ min(n, p).Elementi li na dijagonali matrice Λ su singularne vrijednosti matrice A, a stupci matrica

U i V se zovu i singularni vektori (oni od U cine ortonormiranu bazu za Rn, a oni od Vza Rp). Singularne vrijednosti normalne matrice podudaraju se s njenim svojstvenimvrijednostima, a opcenito se definiraju singularne vrijednosti linearnog operatora2 X kaosvojstvene vrijednosti linearnog operatora3 (X∗X)1/2. Standardno se singularne vrijednostinavode u padajucem redoslijedu, pa u SVD-faktorizaciji podrazumijevamo da je l1 ≥ l2 ≥. . . ≥ 0.

Vratimo se na faktorsku analizu. Kako nam SVD-faktorizacija pomaze za dobivanjekorektne faktorizacije X = RC? Ako je X = UΛV t, onda se (bar kao apstraktno rjesenje)uzima R = UΛ, C = V t. U opcem slucaju mogu se uzeti R = UΛα i L = ΛβV t s α + β = 1.

Neka je X ∈ M43 tablica tj. matrica mjerenja. Uzmimo npr.

X =

0, 212 0, 399 0, 1900, 072 0, 133 0, 1550, 036 0, 063 0, 2130, 078 0, 141 0, 273

,

2Singularne vrijednosti su definirane za svaki kompaktan operator na nekom Hilbertovom prostoru. Kakose ovdje bavimo iskljucivo operatorima na konacnodimenzionalnim prostorima, a svi takvi su kompaktni,nije na to potrebno obracati posebnu paznju.

3Pozitivno definitan operator B je operator na Hilbertovom prostoru H sa svojstvom 〈Bx, x〉 > 0 zasve x ∈ H. Kvadratni korijen pozitivno definitnog operatora B je operator A takav da je A · A = B. Zasvaki pozitivno definitan operator B postoji i jedinstven je njegov kvadratni korijen. Za normalne operatoretakoder postoje kvadratni korijeni, ali nisu nuzno jedinstveni. Operator X∗X je uvijek pozitivno definitan.

15

gdje retci predstavljaju mjerenja koncentracija elemenata u atomosferskom uzorku pri sm-jerovima vjetra 0◦, 90◦, 180◦, 270◦, a stupci predstavljuju konkretne elemente, redom: Na,Cl, Si. Znamo da je X moguce zapisati u obliku X = UΛV t s Λ ∈ Mr, U ∈ M4r i V ∈ Mr sr ≤ 3 i ortogonalnim matricama U i V (U tU = V tV = Ir).

Osnovni koraci u algoritmu za dobivanje SVD-dekompozicije su:

1. Odredivanje svih r svojstvenih vrijednosti matrice X tX ∈ Mr i njihovo sortiranje upadajucem redoslijedu;

2. Odredivanje koliko ima nenul svojstvenih vrijednosti matrice X tX;

3. Matrica V za stupce ima svojstvene vektore pripadajuce svojstvenim vrijednostima odX tX (u istom redoslijedu kao gore);

4. Matrica Λ je dijagonalna matrica s kvadratnim korijenima svojstvenih vrijednosti li odX tX na dijagonali (u istom redoslijedu kao gore);

5. Za j = 1, . . . , r stupci od U dobiju se kao uj = ljXvj, a preostali se dobiju Gram-Schmidtovim postupkom ortogonalizacije.

Imamo redom:

X tX =

0, 058 0, 107 0, 0800, 107 0, 201 0, 1480, 080 0, 148 0, 180

,

σ(X tX) = {0, 392, 0, 046, 1, 98 · 10−8}Zadnju svojstvenu vrijednost cemo zanemariti jer je bitno manja (priblizno jednaka nuli) odostale dvije pa cemo uzeti r = 2 i dobiti l1 = 0, 626 i l2 = 0, 214. Korakte 3., 4. i 5. proveditesami. Dobijemo:

U =

0, 753 0, 6180, 343 −0, 1270, 302 −0, 5670, 473 −0, 529

,

Λ =

[0, 626 0

0 0, 214

],

V =

0, 371 0, 2800, 690 0, 5560, 622 −0, 783

.

Sto znaci r < min(n, p) kao gore? Vidjeli smo da takav r biramo kad je jedna ili visesvojstvenih vrijednosti od X tX (priblizno) jednaka nuli tj. kad X tX nije punog ranga. Tose pak moze desiti samo ako X nije punog ranga tj. ako su stupci od X linearno zavisni.U konkretnom slucaju to nam znaci da smo stupac koncentracija Na mogli dobiti npr. kaolinearnu kombinaciju stupaca Cl i Si.

Kao sto smo rekli, stupci od U i V predstavljaju ortonormirane baze za Rn odnosno Rp.Problem je u tome sto te baze (obicno) nemaju prirodnu fizikalno-kemijsku interpretaciju tepreostaje posao transformacije tih baza u neke koje ju imaju.

16

Seminar: Teorem i algoritam za SVD s razradenim primjerom primjene u kemiji. Liter-atura: http://www.uwlax.edu/faculty/will/svd/index.html,http://web.mit.edu/be.400/www/SVD/Singular Value Decomposition.htm,http://www.cs.ut.ee/∼toomas l/linalg/lin2/node14.html,http://www.cs.brown.edu/research/ai/dynamics/tutorial/Postscript/SingularValueDecomposition.ps,http://www.cs.ut.ee/∼toomas l/linalg/lin2/node11.html,http://www.civilized.com/mlabexamples/svd.htmld/,

8 Interpolacija

Za razliku od pristupa u metodi najmanjih kvadrata, kod interpolacije zahtijevamo dafunkcija kojom aproksimiramo podatke prolazi kroz cvorove tj. da vrijedi yi = f(xi) zasve i = 0, . . . , n. Osnovni tipovi interpolacije su interpolacija polinomom i spline-interpolacija.

Kod interpolacije polinomom pokazuje se da ako su sve apscise xi razlicite postoji jedin-stven interpolacijski polinom f stupnja n koji ima svojstvo f(xi) = yi za sve i. Najefikasnijinacin racunanja f je pomocu Newton-ovog oblika interpolacijskog polinoma:

f(x) = f [x0] + f [x0, x1](x− x0) + f [x0, x1, x2](x− x0)(x− x1) + . . . +

+ . . . + f [x0, x1, . . . , xn](x− x0)(x− x1) · · · (x− xn−1)

Podijeljene razlike f [x0, . . . , xi] racunaju se iz rekurzije

f [xi] = yi, i = 0, . . . , n

f [xi, . . . , xi+k] =f [xi, . . . , xi+k−1]− f [xi+1, . . . , xi+k]

xi+k − xi

, i = 0, . . . , n, k = 1, . . . , n− i

Uniformna ocjena greske interpolacije (ako interpoliramo funkciju F ) iznosi

‖ F (x)− f(x) ‖∞= max{F (x)− f(x) : x ∈ [x0, xn]} =Mn+1

(n + 1)!‖

n∏

i=0

(x− xi) ‖∞

Kako znamo, za velike n greska interpolacije u pravilu jako raste; najmanja mogucaocjena dobije se biranjem xi-ova kao nultocaka Cebisevljevog polinoma. U primjenama jepak u pravilu n (broj parova podataka) relativno velik, a nema niti mogucnosti biranjaapscisa pomocu Cebisevljevih polinoma. Uz to pogreske mjerenja povlace jos veci poraststvarne greske. Stoga je u pravilu pogodnije koristiti interpolaciju linearnim ili kubicnimspline-ovima, tj. interpolirati po dijelovima afinim odnosno kubicnim funkcijama. Osobitopogodna je interpolacija kubicnim spline-ovima jer istovremeno daje i glatkocu i

”razumno”

ponasanje greske.Cesto se koristi i visedimenzionalna interpolacija. Tako se npr. ploha potencijalne enrgije,

o kojoj smo govorili u poglavlju o reakcijskoj koordinati, moze konstruirati samo interpo-lacijom.

9 Literatura

1. D. Babic - materijali iz Matematickih metoda u kemiji,http://www.irb.hr/korisnici/dbabic/2005-06/

17

2. P. W. Atkins, J. De Paula Physical Chemistry

3. P. W. Atkins, M. J. Clugston Nacela fizikalne kemije

4. E. R. Malinowski Factor Analysis in Chemistry

5. R. G. Mortimer Mathematics for Physical Chemistry, 3rd ed., Elsevier, 2005.

6. B. G. M. Vandeginste, D. L. Massart, L. M. C. Buydens, S. De Jong, P. J. Levi,J. Smeyers-Verbeke Handbook of Chemometrics and Qualimetrics, Part B

7. http://classweb.gmu.edu/sdavis/chem331/num-intg/num-intg.htm

8. http://oregonstate.edu/instruct/ch490/lessons/lesson11.htm

9. http://www.chem.ed.ac.uk/teaching/undergrad/cp2/examples/questions/maths.pdf

10. http://www.shodor.org/unchem/index.html

11. http://www.chem.uoa.gr/applets/AppletSmooth/Appl Smooth2.html

12. Wikipedia: Principal Components Analysis,http://en.wikipedia.org/wiki/Principal components analysis

13. http://www.fizyka.umk.pl/nrbook/c14-8.pdf

18