7/22/2019 kemometri ders notlar
1/41
Prof.Dr.Durmu ZDEMR
YTE Fen FakltesiKimya Blm
zmir
KEMOMETR DERS NOTLARI
BLM I
DENEYSEL TASARIM VE OPTMZASYON
KONULAR
1. Deneysel Tasarmn nemi2. Tarama Tasarmlar (Screening Designs)
2.1.Ful Faktriyel Tasarm
2.2. Fraksiyonel faktriyel tasarm
2.3. Plackett-Burman tasarm
3. Optimizasyon
3.1. Merkezi Kompozit Tasarm
1. DENEYSEL TASARIMIN NEM
Deneysel tasarmn nemi drt maddede aklanabilir.
Tarama (Screening): Bu tasarmlar deneysel almalarda sonucu etkileyen nemlifaktrleri belirlemek iin kullanlr. Bir kimyasal reaksiyonun verimini etkileyen faktrler,kullanlan reaktif konsantrasyonu, katalizr konsantrasyonu, scaklk, pH, reaksiyon sresi,kartrma hz, vb. 10 faktr etkiledii dikkate alndnda bu faktrlerden hangilerinemlidir, hangileri elimine edilebilir ve hangileri ayrntl incelenmelidir? Bu sorularncevaplar faktriyel ve Plackett-Burman tasarmlar ile verilebilir.
Optimizasyon: Tarama tasarmlar ile bulunan nemli faktrlerin optimum deerlerioptimize edilerek reaksiyonun verimi ve kromatografik ayrma iyiletirilebilir. En yaygn
7/22/2019 kemometri ders notlar
2/41
7/22/2019 kemometri ders notlar
3/41
ekil 2. pH 3.4te sabit tutularak bulunan optimum konsantrasyon.
Daha sonra any deneysel alma istatistiksel deneysel tasarm ynetemi ilegereekletirilmi ve elde edilen sonular ekil 3te verilmitir.
ekil 3. pH ve katalizr konsantrasyonuna bal olarak reaksiyon verimindekideiimi.
statistiksel deneysel tasarm metodu kullanlarak elde edilen optimum artlar pH 4.4 vekonsantrasyon 1.0 mM olarak bulunmutur. Bu noktada klasik yaklamla bulunan optimumartlar ile istatistiksel deneysel tasarm metodu ile bulunan sonulardan olduka farkl olduu
grlmektedir. Bu farkn nedeni pH ve konsantarsyon arasndaki etkilemedir. Bu nedenleistatistiksel deneysel tasarm kullanlarak bu etkileimler gz nnde bulundurulmal ve
7/22/2019 kemometri ders notlar
4/41
deneysel tasarm yntemine gre optimum deerler bulunmaldr.leriki blmde benzer birrnek uygulamal ekilde ayrntl olarak tekarar incelenecektir.
2. TARAMA TASARIMLARI
2.1 Tam Faktriyel Tasarm
Tam faktriyel tasarm sonu zerine etki eden faktrlerin hangileri ve ne kadar etkiliolduunu anlamada kullanlan iki seviyeli bir tarama tasarmdr. rnein, bir kimyasalreaksiyon pH ve scakla bal olarak deiiyorsa, iki seviyeli iki faktrl bir deneytasarlanabilir. Deney says 2kforml ile hesaplanr. Burada 2, seviye says (-1 ve +1 olarakkodlanr), k ise faktr saysdr (burada 2 faktr var). Faktriyel tasarmda, 2 faktr iin deneysays 4 (22), 3 faktr iin deney says 8dir (23). Tam faktriyel tasarm tablosu hazrlamakiin, her bir faktr iin yksek ve dk seviyeler belirlenir. rnein scaklk 30oC ve 60oC,
pH 4 ve 6. Yksek (+1) ve dk (-1) seviyelere gre tasarm tablosu oluturulur (izelge1).
izelge1. ki seviyeli iki faktrl tam faktriyel tasarm
Deney x1 x2
1 -1 -1
2 +1 -1
3 -1 +1
4 +1 +1
izelge 2 ve 3te srasyla 3 ve 4 faktrl iki seviyeli tam faktriyel tasarmlarn tablolarverilmitir
izelge2. ki seviyeli faktrl tam faktriyel tasarm
Deney x1 x2 x3
1 -1 -1 -1
2 +1 -1 -1
3 -1 +1 -1
4 +1 +1 -1
5 -1 -1 +1
6 +1 -1 +1
7 -1 +1 +1
8 +1 +1 +1
izelge3. ki seviyeli drt faktrl tam faktriyel tasarm
7/22/2019 kemometri ders notlar
5/41
Deney x1 x2 x3 x41 -1 -1 -1 -12 +1 -1 -1 -13 -1 +1 -1 -14 +1 +1 -1 -1
5 -1 -1 +1 -16 +1 -1 +1 -17 -1 +1 +1 -18 +1 +1 +1 -19 -1 -1 -1 +110 +1 -1 -1 +111 -1 +1 -1 +112 +1 +1 -1 +113 -1 -1 +1 +114 +1 -1 +1 +115 -1 +1 +1 +116 +1 +1 +1 +1
Deneysel tasarm tablosu hazrlandktan sonra kodlanm deerler yerine faktrleringerek deerleri yerletirilerek deneysel alma gerekletirilir. rnein, faktrl ikiseviyeli bir sistemde faktrlerin minimum ve maksimum seviyeleri izelge 4te verilmitir.
izelge 4. faktr iki seviyeli bir sistemde faktrlerin minimum ve maksimum aralklar
Faktrler (-1) seviye (+1) seviye
Katalizr konsantrasyonu (%) 0.1 0.3Reaksiyon scakl ( C) 60 80Reaksiyon sresi (dk) 20 40
izelge 5, iki seviye zerinden gerekleitirilen ve katalizr konsantrasyonu (x1),reaksiyon scakl (x2) ve reaksiyon sresi (x3) faktrlerinden oluan 8 deneye ait her bir
faktrn gerek skalasndaki deerleri ve bu sistemde elde edilen sonular (y deerleri)gstermektedir.
izelge 5. Deneysel sonular da ieren faktrl tasarm
Deney x1 x2 x3 y
1 0.1 60 20 73
2 0.3 60 20 71
3 0.1 80 20 79
4 0.3 80 20 82
5 0.1 60 40 78
6 0.3 60 40 89
7/22/2019 kemometri ders notlar
6/41
7/22/2019 kemometri ders notlar
7/41
7/22/2019 kemometri ders notlar
8/41
izelge 8. ki faktrl seviyeli deneysel tasarmda faktrlerin minimum, orta vemaksimum seviyeleri.
Faktr Minimum Orta Maksimum
Kodlanm -1 0 +1
pH 3 6 9
KatalizrKonsantrasyonu, M
1 2 3
izelge 8de verilen faktrlerin seviyeleri deneysel tasarm matrisinin oluturulmasndagenellikle kodlanm olarak verilir. Bunun nedeni her bir faktrn genellikle olduka farkl
skalalara sahip olmasdr ve tasarmnn istatistiksel analizinin bu skala farkndan etkilenmesitercih edilmez. izelge 9de gerekletirilen deney elde edilen verimlerle birlikte verilmitir.
izelge 9. ki faktrl 3 seviyeli tam faktriyel deneysel tasarm ve elde edilen verimler.
No pH, x1 Katalizr Konsantrasyonu, M, x2 Verimi, y
1 3 1 41
2 3 2 59
3 3 3 60
4 6 1 61
5 6 2 76
6 6 3 71
7 9 1 61
8 9 2 69
9 9 3 59
izelge 9de gerekletirilen 9 deneyin verimleri incelendiinde en yksek verimin pH 6 ve 2M katalizr konsantrasyonunda olduu grlmektedir. Ancak szkonusu reaksiyonda enuygun artlarn ne olaca ve ve reaksiyon verimine etki ettii dnlen bu iki faktrnistatistiksel olarak nasl bir katk yaptn grebilmek iin deneysel verim deerleri ile bufaktrler aras ilikiyi veren bir denklem kurarak inceleyebiliriz. Bu noktada, her iki faktr 3farkl seviyede alld iin bu faktrlerin dorusal etkilerinin yannda ikinci derecedenetkileri ile birbirleri ile olan etkileimlerininde incelenmesinde fayda vardr. Eitlik 3te ikifaktrl bir sistemde ikincidereceden model denklemi verilmitir.
y = b0+ b1x1 + b2x2 + b11x1^2 + b22x2^2 + b12x1x2 + e (3)
7/22/2019 kemometri ders notlar
9/41
Eitlik 3 de b0, her bir faktr kodlanm olarak orta seviyede (sfr alndnda) tutulduunda
denklemin alaca sabit deeri gsterirken, b1 ve b2 katsaylar her bir faktrn dorusal
katksn gsterir. te yandan b11 ve b22 deerleri ikinci dereceden (dorusal olmayan)
katklar gsterirken, b12 degeride her iki faktrn etkileimlerini temsil etmektedir. Son
olarak, e terimide modellenemyen artklar gstermektedir. izelge 10, eitlik 3de verilenmodel denklemine gre hazrlanm deneysel tasarm matrisini oluturmaktadr.
izelge 10. ki faktrl seviyeli tam faktriyel bir sistemde kullanlan deneysel tasarmmatrisi.
No b0 x1 x2 x1^2 x2^2 x1x2 y
1 1 -1 -1 1 1 1 41
2 1 -1 0 1 0 0 59
3 1 -1 1 1 1 -1 604 1 0 -1 0 1 0 61
5 1 0 0 0 0 0 76
6 1 0 1 0 1 0 71
7 1 1 -1 1 1 -1 61
8 1 1 0 1 0 0 69
9 1 1 1 1 1 1 59
izelge 10da verilen tasarm matrisinin ilk stunu deneylerin srasn gsterirken son stn
ise elde edilen deneysel verimleri gstermektedir. Arada kalan 6 adet stn ise asl tasarmmatrisini oluturmaktadr. Bylece matris notasyonunda eitlik 3 yeniden dzenlenirse, eitlik4te verilen model denklemi elde edilir.
y = D xb + e (4)
Eitlik 4den de grlecei gibi koyu renk kk harf vektr temsil ederken koyu renkli
byk harf matrisi temsil etmektedir. Bu denklemde y ve D bilinmekte olup bilinmeyenkatsaylar vektrnn hesab enkk kareler metoduna gre matris notasyonunda eitlik 5teverildii gibi hesaplanr.
=(DxD) 1xDxy(5)
Eitlik 5 kullanlarak elde edilen katsaylar eitlik 4de yerine konarak tahmin edilen
deerleri ve daha sonrada deneysel y deerleri ile hesaplanan deerieri arasndaki
farklardan artklar (eitlik 6) hesaplanabilir.
7/22/2019 kemometri ders notlar
10/41
e = y - (6)
Bu noktaya kadar verilen bu reaksiyon verimine ilikin rnein regresyon, ANOVA ve t-testianalizleri aada verilen MS Excel sayfalarnda adm adm verilmitir. ncelikle Data
sekmesinden Data Analysis seenei seilerek Regression seilmelidir (Resim 1).
Resim 1. Regresyon analizi iin verilerin regresyon analizi basama.
Aada verilen (Resim 2) resimde grld gibi ilgili alanlar seildikten sonra regresyonanalizi gereekletirilir.
7/22/2019 kemometri ders notlar
11/41
Resim 2. Regresyon analizinin gereekletirilmesi.
Regresyon analizinin sonular aagda (izelge 11, 12, 13, 14 ve 15) verilmitir. ncelikleizelge 11de seilen ikinci dereceden model denklemi kullanlarak elde edilen modelindeneysel sonular ne kadar iyi tahmin ettiini gsteren R2 deerinini grmekteyiz. Buradaelde edilen R
2 deeri 0.998 gibi olduka iyi bir sonu olduundan seilen model denklemininolduka baarl olduunu grmekteyiz.
izelge 11. Regresyon analizinin zeti.
zet kts
Regresyon statisitii
okluR 0.999034
R2 0.998068
ayarlanmR2 0.994849
Standart hata 0.713624
Gzlem says 9
izelge 12de regresyon analizinin ANOVA sonularn grmekteyiz. Burada elde edilen F-deerinin 310 gibi byk bir rakam olams faktr seviyelerinin deitirilmesi ile elde edilendeneysel verim sonularnn %95 gven snrnda istatistiksel olarak anlaml olduunusyleyebiliriz.
izelge 12. Regresyon analizinin ANOVA sonular
ANOVA
df SS MS F P-deeri
Regresyon 5 789.3611 157.8722 310.0036 0.000287767Artklar 3 1.527778 0.509259
7/22/2019 kemometri ders notlar
12/41
Toplam 8 790.8889
izelge 13, ngrlen ikinci dereceden model denklemi (eitlik 3) katsaylar ve bukatsaylarn standart hatalar, t-deerleri, P-deerleri ve %95 alt ve st gven aral (GA)verilmektedir.
izelge 13. ngrlen ikinci dereceden model denklemi katsaylar ve bu katsaylarnstandart istatistiksel analiz sonular.
Katsaylar Standart Hata t-deeri P-deeri %95 alt GA %95 st GA
b0 75.4444 0.5319 141.8385 0.0000 73.7517 77.1372
b1 4.8333 0.2913 16.5902 0.0005 3.9062 5.7605
b2 4.5000 0.2913 15.4461 0.0006 3.5728 5.4272
b11 -11.1667 0.5046 -22.1294 0.0002 -12.7726 -9.5608
b22 -9.1667 0.5046 -18.1659 0.0004 -10.7726 -7.5608
b12 -5.2500 0.3568 -14.7136 0.0007 -6.3855 -4.1145
izelge 13den grld gibi her iki faktrn dorusal (b1ve b2) etkilerinin P-deerleri 0.05(=0.05) ten kk olduu iin szkonusu terimler %95 gnen snrnda istatistiksel olarakanlaml terimleridir ve model sdenkleminde bulumas gerekir. Ayrca szkonusu iki faktrnikinci dereceden etkileri (b11ve b22) ile bu faktrlerin birbirleri ile olan etkileimi (b12) %95gven snrnda istatisitiksel olarak nemlidir. Bylelikle reaksiyon veriminin modeldenklemi Eitlik 7te verildii gibidir.
y = 75.44 + 4.83x1 + 4.50x211.17x1^29.17b22x2^25.25x1x2 + e (7)
izelge 14de, eitlik 7de verilen model denklemi kullanlarak hesaplanan tahmini verimdeerleri ve artk deerleri standardize edilmi artk deerleri ile birlikte verilmitir. izelge15de normal olaslk ktlar verilmitir. ekil 4de deneysel verim deerlerinin normalolaslk grafii verilmitir.
izelge 14. Tahmin edilen verimler ve artklar
Artklar
sra tahmin y Artklar Standart artklar
1 40.5278 0.4722 1.0806
2 59.4444 -0.4444 -1.0170
3 60.0278 -0.0278 -0.0636
4 61.7778 -0.7778 -1.7798
5 75.4444 0.5556 1.2713
6 70.7778 0.2222 0.5085
7 60.6944 0.3056 0.6992
8 69.1111 -0.1111 -0.2543
9 59.1944 -0.1944 -0.4449
7/22/2019 kemometri ders notlar
13/41
izelge 15. Normal olaslk kts
Olaslk kts
Yzde y
5.555555556 41
16.66666667 59
27.77777778 59
38.88888889 60
50 61
61.11111111 61
72.22222222 69
83.33333333 71
94.44444444 76
ekil 4. Normal olaslk grafii
ekil 5de deneysel verim deerleri ile model denklemi kullanlarak hesaplanan verimdeerlerinin korelasyon grafii verilmitir. ekilden de grlecei gibi olduka baarl
tahmin deerleri elde edilmitir. ekil 6, artklarn grafiini gstermektedir.
7/22/2019 kemometri ders notlar
14/41
ekil 5. Deneysel verim deerlerine kar hesaplanan verim deerleri.
ekil 6. Deneysel verim deerlerine kar elde edilen artklarn grafii.
Artklarn dalm incelendiinde normal bir dalm gsterdikleri grnmektedir. Bu
noktada elde edilen model denklemi kullnlarak optimum artlarn belirlenmesi uygunolacaktr. Bu amala MS Excel de solver kullanlarak (Resim 3) en yksek verimi eldeedebilmek iin en uygun pH ve katalizr konsantrasyonunun belirlenebilir.
7/22/2019 kemometri ders notlar
15/41
Resim 3.a. Optimumartlar iin solver uygulamas ilk pencere.
Resim 3.b. Optimumartlar iin solver uygulamas ikinci pencere
Resim 3.bde grld gibi en yksek verimin elde edildii koullar pH (x1) iin kodlanmdeer olarak 0.2304 ve katalizr konsantrasyonu (x2) iin 0.3126 olarak bulunmutur. Buradaoptimum koullarn faktrlerin gerek skalas iin kar gelen deerler Eitlik 8 ile hesaplanr.
)()(
ortastveyaaltorta
ortaxkod
(8)
7/22/2019 kemometri ders notlar
16/41
Eitlik 8 kulanlarak pH ve katalizr konsantrasyonu (K.K.) iin optimum deerler:
6912.6)36(
62304.0
pHpH
3126.2..)23(
2..3126.0
KK
KK
Bylece pH 6.6912 ve katalizr konsantrasyonu 2.3126 M olduunda reaksiyon veriminin%76.86 olacan gryoruz. Bu noktada bulduumuz optimum arlarn dnda baka lokaloptimum blgelerin olup olamdn anlamak iin faktrlere (x1 ve x2) karlk reaksiyon
veriminin nasl deitiini grebileceimiz boyutlu yant yzey grafiinin (ekil 7)oluturulmas faydal olacaktr.
1
1.5 2
2.53
2
4
6
8
1040
50
60
70
80
Katalizr Konsantrasyonu (M)pH
Verim(
y)
45
50
55
60
65
70
75
ekil 7. Katalizr konsantrasyonu ve pHa karlk reaksiyon veriminin deiimini gsterenyant yzey grafii.
ekil 6dan grld gibi pHn 6 ve katalizr konsantrasyonunun yaklak 2 olduublgede bir plato olumakta ve verim en yksek deerine ulamaktadr.
7/22/2019 kemometri ders notlar
17/41
2.3 Plackett-Burman tasarm
ok sayda faktrn etkisi incelenmek istendiinde full faktriyel ve fraksiyonelfaktriyel tasarm yntemlerin pratik olarak uygulanmas zorlamaktadr. Sadece faktrlerin
kendi etkileri incelendii, yani faktrler arasndaki etkileimlerin nemli olmad durumlardaPlackett-Burman tasarm pratik olarak uygulanabilir. Bu tasarmda geerli olan deney says, faktr says ve retici izelge 16dagsterilmitir.
izelge 16. Plackett-Burman tasarm iin reticiler
Deney says Faktrler retici8 7 + + + - + - -12 11 + + - + + + - - - + -
16 15 + + + + - + - + + - - + - - -20 19 + + - + + + + - + - + - - - - + + -24 23 + + + + + - + - + + - - + + - - + - + - - - -
11 faktr ve 12 deneyi ieren Plackett Burman tasarm izelge 17degsterilmektedir.
izelge17. 11 faktr iin Plackett Burman tasarm
Bu tasarmn baz zellikleri vardr.
Birinci satr ayn seviyeye sahiptir (-1 veya +1).
kinci satr retici satrdr. Tablo 3teki reticilerden birisi kullanlr. Faktr says her
zaman tek say ve deney says faktr saysndan bir fazladr.nc satr ikinci satrn bir yana kaydrlmas ile elde edilir (izelge17).
7/22/2019 kemometri ders notlar
18/41
Btn faktrler iin yksek ve dk seviye says eittir. Bu da kolonlarn birbiri ileortagonal (kolonlar birbirinden bamsz) olduunu gsterir.
Placktett-Burman tasarmda faktrsays deney saysndan bir dktr. 11 faktr iin12 deney yapmak gerekir. Ancak gerekte 10 faktr var ise 11. faktr sonu zerindeherhangi bir etkisi olmayan rastgele bir faktr seilir. Bu faktre dummy faktr denilir.
Tasarm tablosuna kesim noktas (b0) ilave edildiinde kare matris elde edilir.
3. OPTMZASYON
3.1 Merkezi kompozit tasarm
ki seviyeli faktriyel tasarmlar her bir faktrn etkilerini genel olarak inceleyenyntemlerdir. nemli faktrler belirlendikten sonra detayl inceleme yani optimum deerlerin
bulunmas gerekebilir. Her bir faktrn optimum koullarnn bulunmas merkezi kompozittasarm yntemi ile yaplr. ki nedenle optimizasyona ihtiya vardr. Birincisi, deneyselsonucu etkileyen faktrlerin optimum deerlerini bulmak. rnein, organik sentezdemaksimum verimi etkileyen faktrlerin veya kromatografik ayrmada ayrma gcnetkileyen faktrlerin optimizasyonu gibi. kinci neden, her bir faktrn sonuca etkisinigsteren matematiksel modelin oluturulmas. rnein, bir rnn FTIR spektrumu ilernn zellii ve retim prosesi arasndaki iliki kurulmasna ihtiya duyulabilir.
Faktriyel tasarmlar tekrarlanan deney says ve parabolik etkileri incelemez.Plackett-Burman ve fraksiyonel faktriyel tasarmn baz faktrlerinde, faktrler arasndakietkileimleri incelemek mmkn deildir. nemli faktrler belirlendikten sonra parabolik
etkiler ve faktrler arasndaki etkileimler hesaplanr.Merkezi kompozit tasarmda deney says aadaki formle gre belirlenir.
Tasarm says 122 kk (k: faktr says)
Formldeki 2kfull faktoriyel veya fraksiyonlu faktoriyel tasarmdaki deney saylarn,2k star tasarm deney saysn ve 1 ise orta seviyedeki deney saysn gsterir. 2 kdakiseviyeler (-1) ve (+1), 2kdakiler , 1deki ise (0) dr. deeri dairesel ve ortagonaltasarma gre farkl seviyeler alr.
Dairesel tasarmda aadaki formle gre hesaplanr.
4 2k
Ortagonal tasarmda ise aadaki formle gre hesaplanr.
k
rnek: 3 faktr (k=3) iin dairesel tasarmda = 1.682, ortagonal tasarmda =1.732 bulunur.
rnek 2: Petrol rafinasyonunda kkrt (S) uzaklatrlmas ileminde etkin olduubelirlenen scaklk (T, oC), ak kz (V, g/sn) ve basn (P, bar) faktrlerinin optimizasyonuhedeflenmektedir. izelge 18de faktrlerin 5 ayr seviyede ald deerler kodlanm ve ham
hallerinde verilmitir. Bu almann amac rafine edilecek olan rnde en dk kkrt
7/22/2019 kemometri ders notlar
19/41
miktarn elde etmek iin optimum scaklk, ak hz ve basncn belirlenmesidir.
Denemelerden elde edilen sonularppm Scinsinden hesaplanmtr.
izelge 18. faktrl merkezi kompozit tasarmda faktrlerin ald deerler.
Faktrler - -1 Orta +1 +
Kodlanm -1.682 -1 0 +1 +1.682
x1, T (oC) 334.18 341 351 361 367.82
x2, V (g/sn) 99.54 120 150 180 200.46
x3, P (bar) 46.64 48 50 52 53.36
izelge 18de verilen 1.682 kodlanm seviyesindeki faktrlerin gerek deerleri aada
verildii gibi hesaplanabilir. rnein,x2 faktr iin:
)150180()120150(
1502
veya
x
46.20030
150682.1
54.9930
150682.1
12
12
xx
xx
Bu deerlere gre tasarm tablosu kodlanm ve kodlanmam halde aadaki ekilde(izelge 19) dzenlenir.
izelge 19. Merkezi Kompozit Tasarm Tablosu
7/22/2019 kemometri ders notlar
20/41
deney T (oC) V (g/sn) P (bar) x1 x2 x3 y, (ppm S)
1 341 120 48 -1 -1 -1 68
2 341 120 52 -1 -1 1 81
3 341 180 48 -1 1 -1 170
4 341 180 52 -1 1 1 200
5 361 120 48 1 -1 -1 38
6 361 120 52 1 -1 1 55
7 361 180 48 1 1 -1 67
8 361 180 52 1 1 1 62
9 334.18 150 50 -1.6818 0 0 180
10 367.82 150 50 1.6818 0 0 39
11 351 99.54 50 0 -1.6818 0 17
12 351 200.46 50 0 1.6818 0 130
13 351 150 46.64 0 0 -1.6818 44
14 351 150 53.36 0 0 1.6818 5515 351 150 50 0 0 0 42
16 351 150 50 0 0 0 41
17 351 150 50 0 0 0 43
18 351 150 50 0 0 0 45
19 351 150 50 0 0 0 44
20 351 150 50 0 0 0 43
izelge 19dakitasarmda;
k 8 deney (23=8) iki seviyeli full faktriyel tasaqrma edeer deney saysn,
Takip eden 7 deney (2*3+1= 7) ydz noktalarn ve bir adet orta noktadaki deneyleri,
Son 5 deney orta seviyenin tekrar edilen deney says olmak zere toplam 20 deneyyaplmaktadr.
Bu faktrl tasarmda ikini dereceden matematiksel model aadaki (Eitlik 9) gibigsterilebilir.
y = b0 + b1x1 + b2x2 + b3x3 + b11x12 + b22x2
2 + b33x32 + b12x1x2 + b13x1x3 + b23x2x3 +b123x1x2x3
(9)
Bu modelde;
1 kesim noktas (b0),
3 (=k) lineer etkileimler (b1, b2, b3),
3 (=k) parabolik terimler (b112, b22
2, b33
2),
3 ikili etkileimler (b12, b13, b23)
terimleri bulunmaktadr.
izelge 20de yukarda verilen eitlikteki model denklemine kar gelen deneysel tasarmizelgesi vailmitir.
7/22/2019 kemometri ders notlar
21/41
izelge 20. kinci dereceden 3 faktrl merkezi kompozit tasarm tablosu.
deney x1 x2 x3 x1 2 x2^2 x3^2 x1x2 x1x3 x2x3 x1x2x3 y, (ppm S)
1 -1 -1 -1 1 1 1 1 1 1 -1 68
2 -1 -1 1 1 1 1 1 -1 -1 1 813 -1 1 -1 1 1 1 -1 1 -1 1 170
4 -1 1 1 1 1 1 -1 -1 1 -1 200
5 1 -1 -1 1 1 1 -1 -1 1 1 38
6 1 -1 1 1 1 1 -1 1 -1 -1 55
7 1 1 -1 1 1 1 1 -1 -1 -1 67
8 1 1 1 1 1 1 1 1 1 1 62
9 -1.682 0 0 2.828 0 0 0 0 0 0 180
10 1.682 0 0 2.828 0 0 0 0 0 0 39
11 0 -1.682 0 0 2.828 0 0 0 0 0 17
12 0 1.682 0 0 2.828 0 0 0 0 0 130
13 0 0 -1.682 0 0 2.828 0 0 0 0 4414 0 0 1.682 0 0 2.828 0 0 0 0 55
15 0 0 0 0 0 0 0 0 0 0 42
16 0 0 0 0 0 0 0 0 0 0 41
17 0 0 0 0 0 0 0 0 0 0 43
18 0 0 0 0 0 0 0 0 0 0 45
19 0 0 0 0 0 0 0 0 0 0 44
20 0 0 0 0 0 0 0 0 0 0 43
izelge 20 yakndan incelendiinde en dk kkrt deerine sahip deney 11inci srada
verilen ve 17 ppm S deerini gsteren denemedir. Bu denemde ak scaklk iin sfrkodlanm deer, ak hz iin -1.682 ve basn iin sfr kodlanm deerler szkonusudur.Bylece, bu denemede ak hznn en dk olduu, scaklk ve basncn orta seviyedetutulmas ile en dk kkrt oranna eriildii grlmektedir. Ancak, szkonusu 20denemenin istatistiksel analizleri yapldnda farkl optimum deerlerde ortaya kabilir.Resim 4, bu rnein MINITAB ortamndaki veri analizinin adm adm nasl yapldngstermektedir.
7/22/2019 kemometri ders notlar
22/41
7/22/2019 kemometri ders notlar
23/41
18 18 45.000 42.575 3.801 2.425 0.28
19 19 44.000 42.575 3.801 1.425 0.17
20 20 43.000 42.575 3.801 0.425 0.05
R denotes an observation with a large standardized residual.
Estimated Regression Coefficients for y, (ppm S) using data in uncoded units
Term Coef
Constant 29429.8T (oC) -166.968
V (g/sn) 24.1582
P (bar) -54.3591
T (oC)*T (oC) 0.262546
V (g/sn)*V (g/sn) 0.0150331
P (bar)*P (bar) 1.26620
T (oC)*V (g/sn) -0.0770833
T (oC)*P (bar) -0.193750
V (g/sn)*P (bar) -0.0104167
20100-10-20
99
90
50
10
1
Residual
Percent
20015010050
10
0
-10
Fitted Value
Residual
151050-5-10
8
6
4
2
0
Residual
Frequen
cy
2018161412108642
10
0
-10
Observation Order
Residual
Normal Probability Plot Versus Fits
Histogram Versus Order
Resim 5. MINITAB kullanlarak elde edilen modelin grafik sonularn.
7/22/2019 kemometri ders notlar
24/41
CurHigh
Low0.00000D
New
d = 0.00000
Targ: 17.0
y, (ppm
y = 20.3864
0.00000
Desirability
Composite
46.640
53.360
99.540
200.460
334.180
367.820V (g/sn) P (bar)T (oC)
[351.7966] [116.9115] [48.9596]
Resim 6. Elde edilen bu model kullanlarak oluturulan optimum artlar.
200
0
100
150
200
300
340 350 100360
y, ( ppm S)
V ( g/sn)
T (oC)
520 50
50
100
150
48340 350 360
y, ( ppm S)
P (bar)
T (oC)
5250
50
100
100
150
48150
200
y, ( ppm S)
P (bar)
V (g/sn)
T (oC) 352
V (g/sn) 117
P (bar) 50
Hold Values
Surface Plots of y, (ppm S)
Resim 7. boytutlu yant yzey grafikleri.
7/22/2019 kemometri ders notlar
25/41
V (g/sn)*T (oC)
360350340
200
175
150
125
100
P (bar)*T (oC)
360350340
52.5
51.0
49.5
48.0
P (bar)*V (g/sn)
200175150125100
52.5
51.0
49.5
48.0
T (oC) 352
V (g/sn) 117
P (bar) 50
Hold Values
>
< 50
50 100
100 150
150 200
200 250
250 300
300
y, (ppm S)
Contour Plots of y, (ppm S)
Resim 8. kontur grafikleri.
7/22/2019 kemometri ders notlar
26/41
BLM II
YNLENDRMESZ SINIFLANDIRMA VE KMELEME TEKNKLER
KONULAR
1. Temel Bileen Analizi (Principal Component Analysis)
1.1. Eigen Deerler
1.2. Verilerin Analize Hazrlanmas
a. Merkeziletirme
b. Standartlatrma
c. Normalizasyon
2. Ynlendirmesiz Kmeleme Teknikleri (Unsupervised Pattern Recognition: ClusterAnalysis)
2.1. klit Uzakl (Euclidien distance)2.2. Manhattan uzakl (Manhattan distance)2.3. Mahalanobis uzakl (Mahalanobis distance)
1. TEMEL BLEEN ANALZ (PRINCIPAL COMPONENT ANALYSIS, PCA)
ok deikenli veri analizinde temel bileen analizi en ok kullanlan tekniklerden
biridir. Temel bileen analizi rnekler ve deikenler arasndaki ilikiyi incelemek iinkullanlan bir keomoetrik yntemdir. Temel bileen analizinde X ile gsterilen bir verimatrisi, T ile gsterilen bir skore matrisi, P ile gsterilen bir loadings matrisi ve E ilegsterilen bir hata matrisi bulunur. Bu deerlerle ilgili eitlik (Eitlik 1) aadaki gibiverilebilir.
X = TP+E (1)
Temel bileen analizinin uygulanmasnda eitli algoritmalar kullanlmaktadr. En ok
kullanlan algoritmalar NIPALS (Srekli olmayan en kk kareler) ve SVD ( Tek deerayrma)dr. NIPALS algoritmas istenilen sayda temel bileen hesaplamak iin kullanlr.SVD algoritmas ise temel bileenlerin tamamn hesaplamaktadr.
PCA iin genel eitlik temel bileenlerin toplam olarak eitlik 2de aadaki gibi deyazlabilir.
X = Ept k
K
k
k
'
1
(2)
Eitlikte kbileen saysn belirtmektedir. Veri matrisinin ayrntl yaps yledir
7/22/2019 kemometri ders notlar
27/41
Burada grld gibi ilk olarak t1skor ve p1 loadigsi ile t1p
1arpm elde edilir.
Eer t1p1arpmn Xmatrisinden karlrsa E1hatas hesaplanm olur. Bu hata bir sonraki
hatay hesaplamada kullanlr. Bununla ilgili bantlar aadadr (Eitlik 3 ve 4)
E1= Xt1p
1
(3)
E2= E1t2p
2 (4)
ksayda bileen iin hata hesabna ynelik aadaki eitlik (Eitlik 5) kullanlmaktadr.
Ek= Ek-1- tkp
k (5)
Yukardaki eitliktepksimgesiyle gsterilen loadings vektr u ekilde hesaplanr (Eitlik6).
p
k= tX / t t (6)
Ayn ekilde benzer bir forml ile sckor vektr tkyle hesaplanr (Eitlik 7).
tk= X pk/ p
k pk (7)
Yukardaki eitliklerde verilen loadings (ykleme) ve skor vektrleri her bir bileen iinhesaplanr ve bylece temel bileenler elde edilir.
Temel bileen analizi hem analitik kimya ile ilgili almalarda hem dedieruygulamalarda ska kullanlan kemometrik yntemlerden biridir.
Temel bileenlerin hesaplanmasnda kullanlan loadings ve skor deerlerinormalizasyon ve ortagonallik gibi baz nemli zelliklere sahiptir. Normalizasyon her temel
bileendeki loadings deerlerinin karelerinin toplamnn 1e eit olmasdr (Eitlik 8).
12
1
kj
J
j
p
(8)
Eitliktepkjknc temel bileeninjinci loadingini ifade etmektedir. Ortagonallik ise
skor veya loadinglerin kolonlarnn arpmlarnn sfra eit olmasdr (Eitlik 9).
7/22/2019 kemometri ders notlar
28/41
01
il
I
i
iktt (9)
1.1 Eigen Deerler
Temel bileen analizinde eigen deerler verideki bileen saysnn bulunmasndakullanlr. En yksek eigen deeri en nemli temel bileen anlamna gelmektedir. Kemometriliteratrnde eigen deerlerine ynelik bir ok tanm bulunmaktadr. Genel istatistiksel tanm
bir temel bileenin deiimidir. Eigen deer genellikle temel bileen skorlarnn karelerinintoplamnn rnek saysnn bir eksiine blnmesiyle elde edilir. fade matemetiksel olarakyle verilmitir (Eitlik 10).
gk=1
1
2
I
tI
i
ik
(10)
Baz aratrmaclar ise eigen deerleri basit bir ekilde temel bileen skorlarnn karelerinintoplamn rnek saysna blerek hesaplamlardr (Eitlik 11).
gk=I
tI
i
ik1
2
(11)
1.2. Verilerin Analize Hazrlanmas
Kemometrik analizlerde ham veri byk neme sahiptir.Yaplan bir deneysel almasonrasnda elde edilen verilerin kemometrik hesaplamalarna gemeden nce verilerinzellikleri dikkatle incelenmelidir. Elde edilen veriler arasnda birbirinden ok farkl deerler
bulunuyorsa ya da deerler aras byk dengesizlik varsa, verilerin benzer birimlereevrilmeleri veya ortalama deer etrafnda toplanmas gerekebilir. Bunun gibi durumlardaverilere merkeziletirme, standartlatrma ve normalizasyon gibi verilerin analizehazrlanmasna ynelik ilemler uygulanr.
a) Merkeziletirme
Kemometrik analizde veri matrisinin X simgesiyle ifade edildii ve bu matrisinsatrlarnn istunlarnn ise jsimgeleriyle gsterildii daha nce belirtilmiti. Buna gre Xijeklindeki bir veri matrisinin merkeziletirme ilemi Eitlik 12 ile u ekilde yaplmaktadr.
7/22/2019 kemometri ders notlar
29/41
mxij= xijxj (12)
Eitlik 12de mxijmerkeziletirme ilemi yaplm matrisi ifade etmektedir. xij iinci
satr jinci stundaki matris elemann, xj ise her bir kolonun ortalamasn belirtmektedir.Eitlikten de grlebilecei gibi, matristeki her bir kolonun ortalamasnn kolonelemanlarndan karlmasyla matris verisinin merkeziletirme ilemi yaplm olmaktadr.Bylece matristeki her bir deer ortalama evresinde toplanm olmaktadr.
b) Standartlatrma
Standartlatrma ileminde ncelikle her bir kolonun ortalama ve standart sapmashesaplanr. Daha sonra kolondaki her bir elemandan kolon ortalamas karlr ve kolon
standart sapmasna blnr. Bylece matris verisi standartlatrlm olur (Eitlik 13).
1
)(1
2
N
xx
xxx
I
i
jij
jij
ij
S
(13)
Eitlik 13te ijSx simgesi standartlatrma ilemi yaplm matrisi ifade eder.
c) Normalizasyon
Normalizasyon ilemi verilerin sabit bir deere getirilmesi ilemidir. Matris zerindenormalizasyon ilemi yaplrken nce satr elemanlar toplanr ve toplam deerler her satriin ayr ayr hesaplanr. Sonra her bir satr toplam her satrn kendi elemanlarna blnr venormalizasyon ilemi tamamlanm olur (Eitlik 14).
I
i
i
ij
ij
N
x
x
x
1 (14)
Eitlik 14te ijNx simgesi normalize edilmi matrisi ifade etmektedir.
rnek 1.Aada tabloda farkl corafi blgede yetien ayn tr zmden yaplm 21 adetarap rneine ait 13 farkl deikenin incelendii veriler verilmitir. Bu almadaki ama,
bu verileri kullanarak szkonusu 21 adet rnei PCA analizi kullanarak doru ekilde aitolduu gruplara snflandrmaktr.
7/22/2019 kemometri ders notlar
30/41
No X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13
1 14.83 1.64 2.17 14 97 2.8 2.98 0.29 1.98 5.2 1.08 2.85 1045
2 13.86 1.35 2.27 16 98 2.98 3.15 0.22 1.85 7.22 1.01 3.55 1045
3 14.1 2.16 2.3 18 105 2.95 3.32 0.22 2.38 5.75 1.25 3.17 1510
4 14.12 1.48 2.32 16.8 95 2.2 2.43 0.26 1.57 5 1.17 2.82 1280
5 13.75 1.73 2.41 16 89 2.6 2.76 0.29 1.81 5.6 1.15 2.9 1320
6 14.75 1.73 2.39 11.4 91 3.1 3.69 0.43 2.81 5.4 1.25 2.73 1150
7 14.38 1.87 2.38 12 102 3.3 3.64 0.29 2.96 7.5 1.2 3 1547
8 11.66 1.88 1.92 16 97 1.61 1.57 0.34 1.15 3.8 1.23 2.14 428
9 13.03 0.9 1.71 16 86 1.95 2.03 0.24 1.46 4.6 1.19 2.48 392
10 11.84 2.89 2.23 18 112 1.72 1.32 0.43 0.95 2.65 0.96 2.52 500
11 12.33 0.99 1.95 14.8 136 1.9 1.85 0.35 2.76 3.4 1.06 2.31 750
12 12.7 3.87 2.4 23 101 2.83 2.55 0.43 1.95 2.57 1.19 3.13 463
13 12 0.92 2 19 86 2.42 2.26 0.3 1.43 2.5 1.38 3.12 278
14 12.72 1.81 2.2 18.8 86 2.2 2.53 0.26 1.77 3.9 1.16 3.14 714
15 12.25 3.88 2.2 18.5 112 1.38 0.78 0.29 1.14 8.21 0.65 2 855
16 13.16 3.57 2.15 21 102 1.5 0.55 0.43 1.3 4 0.6 1.68 830
17 13.88 5.04 2.23 20 80 0.98 0.34 0.4 0.68 4.9 0.58 1.33 415
18 12.87 4.61 2.48 21.5 86 1.7 0.65 0.47 0.86 7.65 0.54 1.86 625
19 13.32 3.24 2.38 21.5 92 1.93 0.76 0.45 1.25 8.42 0.55 1.62 650
20 13.08 3.9 2.36 21.5 113 1.41 1.39 0.34 1.14 9.4 0.57 1.33 550
21 13.5 3.12 2.62 24 123 1.4 1.57 0.22 1.25 8.6 0.59 1.3 500
Yukarda verilen tabloda rnekler satrlarda deikenler stunlarda verilmitir. Bu veriMINITAB ortamna aktarlarak aada verilen Resimdeki gibi PCA analizigerekletirilebilir.
ncelikle ilk iki temel bileen verideki toplam deikenliin %67.77 sini akladn aadaverilen izelgedeb grmekteyiz.
E.V % Varian C. % Var
6.134532 47.44872 47.44872
2.627051 20.31943 67.76815
7/22/2019 kemometri ders notlar
31/41
Bu noktadan haraketle PCA anlizinden gen ilk iki temel bileen skor vektrn birbirine kargrafie geirdiimizde aada verilen PCA skor grafiini elde etmi oluruz.
43210-1-2-3-4
3
2
1
0
-1
-2
PC1
PC2
21
2019
18
17
16
15
14
13
12
1110
9
8
7
6
5
4
3
2
1
Yukarda verilen PCA skor grafiini yakndan incelediimizde ilk 7 rnein karaktesitikolarak grafiin sa alt tarafndan yer aldklarnn ve digger rneklerden net bir ekildeayrldklarn grmekteyiz. Ayn ekilde sol alt kede kmelenen 7 rnek dier bir grubugsterirken ste grnen 7 rnekte 8-14 numaral rnekleri gstermektedir. PCA analizinde,ayrca bu rneklerin gruplandrlmasnda kullanlan 13 deikenin ykleme grafiioluturulur. Aadaki ekil PCA analizinden gelen ilk iki ykleme vektrnn birbirine kar
grafiini gstermektedir.
0.40.30.20.10.0-0.1-0.2-0.3-0.4
0.3
0.2
0.1
0.0
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6
PC1
PC2
X13
X12
X11
X10
X9
X8
X7X6
X5X4
X3
X2
X1
Yukarda verilen ykleme grafiini incelediimizde zellikle x1 ve x13 deikenleri ilk 7rnein snflandrmasnda byk rol alrken x3 ve x10 deikelnleri son 7 rnei daha iyikarakterize etmekte ve son olarak x8 ve x11 deikenleri 8-14 arasndaki rnekleri daha iyi
snflandrm grnmektedir.
7/22/2019 kemometri ders notlar
32/41
2. YNLENDRMESZ KMELEME ANALZ (UNSUPERVISED PATTERNRECOGNITION: CLUSTER ANALYSIS)
Kmeleme analizi rnekler ya da deikenler arasndaki benzerliklerin gsterilmesi ve
yorumlanmasna ynelik kimyada ska kullanlan kemometrik yntemlerden birisidir.Kmeleme analizi ile benzer rnekler ayn grup altnda toplanabilmektedir. Kmeleme analiziynlendirmesiz (unsupervised pattern recognition) ve ynlendirmeli (supervised patternrecognition) olmak zere iki ekilde yaplabilmektedir. Bu blmde ynlendirmes izkmeleme tekniinden bahsedilecektir.
Ynlendirmesiz kmeleme tekniinde birinci adm rnekler arasndaki benzerliibelirlemektir. Tablo 1de 6 ayr kan rneinde kalsiyum ve fosfat analizi sonular verilmitir.
izelge 1. Kan rneklerinde kalsiyum ve fosfat deerleri
rnek Kalsiyum (mg/100mL) Fosfat (mg/100mL)1 8.0 5.52 8.25 5.753 8.7 6.34 10.0 3.05 10.25 4.06 9.75 3.5
Kalsiyum ve fosfat ieriine gre 6 kan rnei arasnda benzerlik ilikisi kurulabilir.rnekler arasndaki benzerlik ilikisini veren ve en ok kullanlan 3 yntem aada
aklanmtr.
2.1. klit Uzakl(Euclidean distance)
ki rnek (kve l) arasndaki iliki aadaki formlle verilir (Eitlik 15).
2
1)(
J
jljkjkl xxd
(15)
Buradaj, llen deerleri gstermektedir. xijde irneinde jlmn, yani x323.rnekteki 2. lm, Tablo 1deki 6.3 fosfat deerini gsterir. ki rnek arasndaki klituzakl kk ise bu rnekler birbirine benzerdir. klit uzakl matris formatnda aadakigibi yazlabilir (Eitlik 16).
)').(( lklk xxxx kld (16)
Burada izelge 1de gsterilen her bir kolon bir vektrdr. Bu forml Excel veya
Matlabta kolaylkla hesaplanabilir.
7/22/2019 kemometri ders notlar
33/41
2.2. Manhattan uzakl (Manhattan distance)
klit uzaklndan biraz farkldr. rnekler arasndaki iliki benzer ekildedeerlendirilir. Manhattan uzaklnda matris tablosundaki deerler klit uzaklndan daha
byktr. Manhattan uzakl aadaki formlle hesaplanr (Eitlik 17).
||1
ljkj
J
jkl xxd
(17)
klit uzakl ile Manhattan uzakl arasndaki fark ekil 1de gsterilmitir.
ekil 1. klit ve Manhattan uzakl ilikisi
2.3. Mahalanobis uzakl (Mahalanobis distance)
En sk kullanlan kemometrik yntemleden birisidir ve klit uzaklna benzerdir.Birbiri ile korelasyona sahip deikenleri dikkate alan bir yntemdir. k ve l rnekleriarasndaki ilikiyi veren uzaklk aadaki matris terimi ile hesaplanabilir (Eitlik 18).
dkl= (xk - xl). C-1. (xk - xl)' (18)
Burada C deikenlerin varyans-kovaryans matrisi gsterir. Deiken says rneksaysndan fazla olduunda bu metot kolaylkla uygulanamaz. nk bu durumda varyans-kovaryans matrisinin tersi yoktur.
Kmeler aras uzaklklar farkl yntemlerle hesaplanabilir (Eitlikler 19, 20, 21, 22,23, 24 ve 25).
a. Ortalama link (Average Likage) (Eitlik 19)
2
BiAi
ki
ddd
(19)
klit uzaklManhattan uzakl
7/22/2019 kemometri ders notlar
34/41
b. Tekli link (Single Linkage)
Bu eitlikte kmeler aras en ksa mesafe aadaki gibi hesaplanr (Eitlik 20).
),min(22
BiAi
BiAiBiAi
ki dddddd
d
(20)
c. Toplam link (Complete Linkage)
Bu metotta kme noktalar arasndaki en geni mesafe dikkate alnarak klit uzaklhesaplanmaktadr (Eitlik 21).
),max(22
BiAi
BiAiBiAi
ki dddddd
d
(21)
d. Arlkl ortalama link (Weighted Average Linkage)
Bu metotta kmeler aras uzakln hesaplanmasnda bileen says dikkate alnr(Eitlik 22).
BABiB
AiA
ki NNNdN
Nd
N
Nd (22)
e. Merkezi (Centroid)
Bu metotta iki kmenin merkezleri arasndaki mesafe dikkate alnarak bek uzaklhesaplanmaktadr (Eitlik 23).
ABBA
BiB
AiA
ki dN
NNd
N
Nd
N
Nd
2 (23)
f. Medyan (Median)(Eitlik 24)
422
ABBiAi
ki
dddd (24)
g. Ward metodu (Wards Method)(Eitlik 25)
AB
i
iBi
i
iBAi
i
iAki d
NN
Nd
NN
NNd
NN
NNd
(25)
Yukarda verilen eitliklerde (k) ve (i) simgeleri (k) numaral kolonun (i) numaral elemannifade eder. A ve B simgeleri ise rnekleri gsterir.
7/22/2019 kemometri ders notlar
35/41
izelge 1deki veriler dikkate alnarak rnek klit uzakl aadaki ekilde hesaplanabilir.
Kalsiyum iin 1. ve 2. rnekler arasndaki klit uzakl,
d12= [(8-8.25)2+ (5.5-5.75)2]1/2= 0.354 dir.
Matristeki her rnek iin klit uzakl ayn ekilde hesaplandnda aadaki izelge 2 eldeedilir.
izelge 2.klit uzakl tablosu
rnek 1 2 3 4 5 61 02 0.354 0
3 1.063 0.711 04 3.201 3.260 3.347 05 2.704 2.658 2.774 1.031 06 2.658 2.704 2.990 0.559 0.707 0
Uzaklk matrisinin indirgenmesi rneklerin toplanmasyla yaplmaktadr. Burada kuralen ksa uzakla sahip rneklerin ilk olarak toplanmasdr. Aada toplama ilemi srasylagsterilmitir.
1. ndirgenmi matris
Tablo 2de grld gibi matristeki en ksa uzaklk 1. ve 2. rnekler arasndadr.Yani d12= 0.354 olmaktadr. 1. ve 2. rnek 1
*ile gsterilen yeni birbileen olarak birletirilir
ve aralarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklk deerleriaadaki gibi hesaplanr.
887.02
711.0063.1
22313
3*1
dd
d
231.32
260.3202.32
24144*1
ddd
681.22
658.2704.2
22515
5*1
dd
d
681.22
704.2658.2
22616
6*1
dd
d
1. ndirgenmi matris aadaki izelgede (izelge 3)gsterilmitir.
7/22/2019 kemometri ders notlar
36/41
izelge 3. ndirgenmi matris
rnek 1 3 4 5 61 03 0.887 04 3.231 3.347 05 2.681 2.774 1.031 06 2.681 2.990 0.559 0.707 0
2. ndirgenmi matris
Tablo 3te grld gibi matristeki en ksa uzaklk 4. ve 6. rnekler arasndadr. Yanid46= 0.559 olmaktadr. 4. ve 6. rnek 4
* ile gsterilen yeni bir bileen olarak birletirilir vearalarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklk deerleriaadaki gibi hesaplanr.
869.02
707.0031.1
25654
4*5
dd
d
269.32
990.2547.3
26343
3*4
dd
d
956.22
681.2231.3
2*61*41
*1*4
dd
d
2. ndirgenmi matris izelge 4te gsterilmitir.
izelge 4. ndirgenmi matris
rnek 1 3 4* 51 03 0.887 04* 2.956 3.269 05 2.681 2.774 0.869 0
3. ndirgenmi matris
Tablo 4te grld gibi matristeki en ksa uzaklk 5. ve 4*. rnekler arasndadr.Yani d54* = 0.869 olmaktadr. 5. ve 4
*. rnek 5
* ile gsterilen yeni bir bileen olarakbirletirilir ve aralarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklkdeerleri aadaki gibi hesaplanr.
819.22
956.2681.2
2*1*451
*5*1
dd
d
813.12
774.2887.0
2533*4
*35
dd
d
3. ndirgenmi matris izelge 5tegsterilmitir.
7/22/2019 kemometri ders notlar
37/41
izelge 5. ndirgenmi matris
rnek 1* 3 5*1 0
3 0.887 05* 2.819 1.831 0
4. ndirgenmi matris
izelge 5ten grld gibi matristeki en ksa uzaklk 1*. ve 3. rnekler arasndadr.Yani d1*3 = 0.887 olmaktadr. Bu veriler rnek 3
* ile gsterilen yeni bir bileen olarak
birletirildiinde rnekler arasndaki yeni uzaklk deerleri aadaki gibi hesaplanr.
325.22
274.2831.12
3*5*1*5*5*3
ddd
4. ndirgenmi matris izelge 6da gsterilmitir.
izelge 6. ndirgenmi matris
rnek 3* 5*3* 05* 2.547 0
Sonu olarak yukarda hesapladmz noktalar bir grafik zerinde gsterirsekaadaki dendrogram elde ederiz (ekil 2).
ekil 2. rnekler arasndaki ilikiyi veren dendrogram.
0
20
40
60
80
100
5 6 4 3 2 1
1*
3*5*
4*
Benzer
lik
rnekler
7/22/2019 kemometri ders notlar
38/41
Bu hesaplamalar karmak gibi grnse de konunun anlalmas asndan yararldr.Kmeleme analizi daha kolay olarak baz hazr programlarla (Statistica gibi) dayaplabilmektedir. ekil 2de grld gibi bu rnekte iki temel kme bulunmaktadr. 1,2,3
bir kme 4,5,6 baka bir kmeyi gstermektedir.
rnek 2. Aada izelgede farkl corafi blgelerden elde edilmi 20 adet zeytin yarneinin ya asitleri profilini gstermektedir. Bu veriler kullanlarak PCA ve HCA analizleriyaplacak ve szkonusu 20 rnein ka farkl gruba ayrlaca belirlenmek istenmektedir.
samples palmitic palmitoleic stearic oleic linoleic eicosanoic linolenic eicosenoic
1 911 49 268 7924 678 51 70 44
2 922 66 264 7990 618 49 56 29
3 1100 61 235 7728 734 39 64 35
4 1082 60 239 7745 709 46 83 33
5 1037 55 213 7944 633 26 52 30
6 1285 129 244 7323 819 57 65 36
7 1248 107 313 7299 840 46 66 33
8 1356 106 236 7209 866 48 75 36
9 1260 102 228 7354 870 49 64 28
10 1261 121 312 7238 877 47 65 25
11 1364 204 225 6929 1084 21 50 14
12 1410 199 216 7130 955 21 48 19
13 1384 178 208 7105 999 29 67 26
14 1412 185 217 6842 1203 34 72 3215 1410 232 280 6715 1233 32 60 24
16 1136 72 341 7616 661 49 65 32
17 926 41 277 7815 784 45 65 25
18 1105 69 373 7714 532 51 68 37
19 1109 79 305 7576 763 45 64 36
20 1284 93 265 7235 893 43 77 46
Yukarda verilen veri ncelikle MINITAB ortamna aktarlm ve PCA ve HCA analizleri ayrayr gerekletirilmitir. Yukarda PCA rnei verilirken MINITAB ortamnda analizin nasl
balatld bir resim ile verilmiti. Bu nedenle burada sadece HCA analizi nasl balatlyorzerinde durulacak ve aada verilen resim HCA analizinin emasn gstermektedir.
7/22/2019 kemometri ders notlar
39/41
Yukarda MINITAB alma sayfasnda gsterilen veriler ncelikle PCA analizine tabitutulmu ve szkonusu 20 rnein nasl snfland aada verilen ilk iki temel bileen skorvektrnn birbirine kar grafii izilerek gsterilmitir.
3210-1-2-3-4
3
2
1
0
-1
-2
PC1
PC2
20
19
18
17
16
15
14
13
1211
10
9
8
7
6
5
4
3
2
1
PCA analizinden gelen ilk iki skor vektrnn grafiini incelediimizde rneklerin genelolarak alt gruba ayrldn syleyebiliriz. Aada verilen izelgede PCA analizinde ilk ikitemel bileen vektrnn verideki toplam deikenliin %79.42siniakladn te yandanilk drt temel bileenin ise %95 civarndaki varyans kapsadn grmekteyiz.
7/22/2019 kemometri ders notlar
40/41
Eigenval % Varia C.% Var
4.690292 58.62865 58.62865
1.663256 20.7907 79.41935
0.893089 11.16362 90.58297
0.295994 3.699921 94.28289
0.245336 3.066701 97.34959
0.159076 1.98845 99.33804
0.050536 0.631696 99.96974
0.002421 0.030264 100
8
PCA analizinden sonra yaplan HCA analizinde ncelikle ham veriler kullanlarakdendrogram oluturulmu ve elde edilen dendrogram aadaki ekilde verilmitir.
1514131211208107961819165317241
19.67
13.11
6.56
0.00
rnekler
Uzaklk
Ward Linkage, Euclidean Distance
Yukarda verilen dendrogram yakndan incelendiinde 11, 12, 13, 14 ve 15 numaral
rneklerin bamsz bir grup olarak snflandrld grlmektedir. te yandan, geriye kalan15 rnekten 6, 7, 8, 9, 10 ve 20 numaral rneklerin bir baka alt grubu oluturduu ve sonolarak dendrogramn sol tarafndaki 10 rnein bir baka alt grubu oluturduugrlmektedir. Daha sonar HCA analizi, ham veriler yerine, PCA analizinden gelen ve verisetindeki toplam varyansn %95ini kapsayan ilk 4 temel bileen skor vektr kullanlarakoluturulmu ve elde edilen dendrogram aada verilmitir.
7/22/2019 kemometri ders notlar
41/41
1514131211107209861819165172341
20.10
13.40
6.70
0.00
rnekler
Uzaklk
Ward Linkage, Euclidean Distance
Yukarda verilen dendrogram incelendiinde ham veriler ile elde edilen dendrogramn hemenhemen aynsnn PCA analizinden gelen ilk drt temel bileen vektr ile de elde edilebildiigrlmektedir.