Upload
lucas-marsh
View
108
Download
6
Embed Size (px)
DESCRIPTION
Çok Örneklem Cucconi Testi ve Bir uygulaması. Mutlu Umaroğlu. UBK 16 – Antalya Çolaklı 10-12 Eylül 2014. Giriş. Grup karşılaştırması yapan testler en önemli istatistiksel yöntemlerden biridir. Bu testler sadece konum parametresini test eder. - PowerPoint PPT Presentation
Citation preview
Çok Örneklem Cucconi Testive
Bir uygulaması
Mutlu Umaroğlu
UBK 16 – Antalya Çolaklı10-12 Eylül 2014
Giriş• Grup karşılaştırması yapan testler en önemli
istatistiksel yöntemlerden biridir.
• Bu testler sadece konum parametresini test eder.
• Ölçek parametresini karşılaştıran çeşitli testler de vardır.
• Çoğu çalışmada konum parametresi test edilmesine rağmen bazı tür çalışmalarda hem konum hem de ölçek parametrelerinin test edilmesine gerek duyulur.
Giriş• Biyomedikal, biyoinformatik, iklim dinamikleri,
finans gibi alanlardaki bazı çalışmalarda konum ve ölçek parametresinin değişimi birlikte incelenmelidir.
• Tıpta tedavi sürerken ortalama ve değişkenliğin her ikisinin birden değişmesi önemli rol oynayabilir.
• Örneğin diyabet tedavisinde glikoz düzeyinin hem ortalama hem de değişkenlik açısından farklılaşması önemli olabilir.
Giriş• Bu tür durumlarla ilgili ilk kez Tukey 1959’da yeni
bir yöntem üzerine çalışmıştır. Ancak bu yöntemde güçten kayıp söz konusudur.
• Konum ve ölçek parametresini eşanlı olarak inceleyen testler: Cucconi(1968), Lepage(1971), Podgor-Gastwirth(1994), Neuhäuser(2000), Zhang(2006) ve Murakami(2007).
Lepage Testi• Konum ve ölçek parametresinin değişimini eş anlı
olarak inceleyen testler içinde en bilinenidir.
• İki örneklem konum-ölçek testi olarak konum parametresini inceleyen Wilcoxon testi ve ölçek parametresini inceleyen Ansari-Bradley testinin kombinasyonundan oluşur.
0 1 2 1 2
1 1 2 1 2
:
:
H
H
Lepage Testi
Wilcoxon test istatistiği
Ansari-Bradley test istatistiği
Beklenen değer
Varyans
2 2( ( )) ( ( ))( ) ( )
W E W AB E ABLV W V AB 1 1 2
( 1) ( 1)( ) , ( )
2 12n n n n n
E W V W
1 1 2( 2) ( 2)( 2)
( ) , ( )4 48
1
n n n n n nE AB V AB
n
2 21 1 2
2
( 1) ( 1)( 3)( ) , ( )
4 48n n n n n n
E AB V ABn n
W:
AB:
E:
V:
n çift
n tek
Cucconi Testi• Eş anlı olarak konum ve ölçek parametresini test
eder.
• İlk kez 1968 yılında önerilmiştir ancak Cucconi testi İtalyan yerel yayınında yayımlandığı için az bilinmektedir.
• 2009’dan bu yana Marozzi bu yöntem üzerine çalışmaktadır.
Cucconi Testi• Marozzi,
Cucconi testi üzerine çalışmış ve ilk defa exact kritik değerler tablosunu oluşturmuştur (Cucconi asimptotik kritik değerler tablosu).
Tip I hata olasılığı ve güç üzerine de çalışmıştır.Çok örneklem Cucconi testini oluşturmuştur.
Cucconi Testi• Cucconi testi ile ilgilenilmeye başlanmasının temel
nedenleri:Lepage testinden önce yayınlanmasıKonum testlerinin ve ölçek testlerinin
birleştirilmesinden oluşturulmamasıLepage testi ile karşılaştırıldığında güç ve test
istatistiğinin analitik olarak hesaplamasında sorun çıkmaması
Test istatistiğini hesaplamanın diğer yöntemlere göre daha kolay olması
Cucconi Testi• Test Hipotezi:
• Cucconi test istatistiği
0 1 2 1 2
1 1 2 1 2
:
:
H
H
2 2
22
2(1 )U V UVC
121 1
1
1 2
6 ( 1)(2 1)
( 1)(2 1)(8 11)/5
n
iiR n n n
Un n n n n
61
21
1E
n
iiR
1801
21
1V
n
iiR
121 1
1
1 2
6 ( 1 ) ( 1)(2 1)
( 1)(2 1)(8 11)/5
n
iin R n n n
Vn n n n n
1 12 21 1
1 1( 1 )
n n
i ii i
E n R E R
1 12 21 1
1 1( 1 )
n n
i ii i
V n R V R
22( 4) 1(2 1)(8 11)
nn n
Cucconi asimptotik kritik değerler tablosu
Çok Örneklem Lepage Testi• İkiden fazla grup için konum ve ölçek
parametresinin eşanlı değişimini inceleyen testler içinde en bilinenidir.
• Wilcoxon ve Ansari-Bradley testinin birleşiminden oluşur.
• Benzer amaçla geliştirilmiş Murakami MH1 ve MH2 testi de vardır. Bu testler de Lepage tipi testlerdir.
0 1 1 2 2
1
:( , ) ( , ) ... ( , )
:( , ) ( , )K K
i i j j
H
H
Çok Örneklem Lepage Testi• Test istatistiği:
2
1
12 1( )2( 1)
K
k kk
nML n W MABn n
1
1 kn
k kii
W Rnk
22
122 2
21
48( 1) 2( ) ,4( 4)
( 1)48 ( ) ,4( 1)( 3)
K
k kkK
k kk
MAB
n nn AB nçiftn n
nn n AB nteknn n n
1
1 1 1( )2 2
kn
k kii
n nAB Rnk
Çok Örneklem Cucconi Testi• Cucconi testi iki grup için eşanlı olarak konum ve
ölçek parametresini test etmektedir.
• Marozzi, Cucconi testi üzerinde çalışmış ve bu testi ikiden çok grup için genelleyen yeni bir yöntem geliştirmiştir.
• 2013’de geliştirilen bu yönteme göre ikiden çok grup için eşanlı olarak konum ve ölçek parametresini test etmek mümkündür.
Cucconi Testi• Test Hipotezi:
• Test istatistiği:
Çok Örneklem Cucconi Testi• Test Hipotezi:
• Test istatistiği:
0 1 1 2 2
1
:( , ) ( , ) ... ( , )
:( , ) ( , )K K
i i j j
H
H
2 2
21
212(1 )
KK K K K
k
U V U VMC
K
0 1 2 1 2
1 1 2 1 2
:
:
H
H
2 2
22
2(1 )U V UVC
Çok Örneklem Cucconi Testi• Test istatistiği:
2 2
21
212(1 )
KK K K K
k
U V U VMC
K
2 21
12
1
( )
( )
kk
k
nniki ki
inKi ki
R E RU
Var R
2 21
12
1
( 1 ) ( )
( )
kk
k
nniki ki
inKi ki
n R E RV
Var R
2 21 1( , ) , ( 1 )k kn ni ik k ki ki
Cor U V Cor R n R
1
1
11 12 1
Kk
k kk k
UMC U V
K V
Çok örnek Cucconi Testi• µ1>µ2 ve σ1=σ2 olduğunda daha
büyük olma eğilimindedir.
• Böylece U1 0’dan büyük olma V1 0’dan küçük olma eğilimindedir.
• µ1<µ2 olduğunda tam tersi doğrudur.
• µ1=µ2 ve σ1>σ2 olduğunda daha büyük olma eğilimindedir.
• Böylece U1 0’dan büyük olma eğilimindedir.
1 12 21 1
1 1, ( )'
n n
i ii iR E R den
1 12 21 1
1 1, ( )'
n n
i ii iR E R den
Çok Örneklem Cucconi Testi• Çok örneklem Cucconi Testi bir permutasyon
testidir ve P değeri permutasyon üzeriden hesaplanır.
• Permütasyon sayısı MC test istatistiğini etkilenmez sadece P değeri üzerinde etkilidir.
• Permutasyon testini uygularken çok örneklem Cucconi test istatistiğinin asimptotik dağılımı önemli değildir.
Çok Örneklem Cucconi Testi
1. Gözlenen verilerden MC istatistiği hesaplanır ve MC0 olarak atanır
2. Örneklemler birleştirilir (X=(X1,X2,…,Xk)) ve birleştirilmiş örneklemden rasgele olarak örnek seçilerek MC istatistiği hesaplanır ve MC1 olarak atanır
3. 2. adım B kez tekrarlanır (MC2, MC3,…,MCB)
4. Kestirilen P değeri α’dan küçük veya eşitse H0 hipotezini reddedilir 0
1
1 ( )ˆB
bb
p I MC MCB
Örnek• 54 yiyecek firmasının sattığı bir et ürünündeki
sodyum değerleri miligram cinsinden aşağıda verilmiştir. Bu ürün içerdiği et türüne göre (kırmızı et, beyaz et ve domuz eti) sınıflandırılmıştır.
• Bu sınıflar arasında konum-ölçek parametresi bakımından anlamlı bir farklılık var mıdır?
0 1 1 2 2 3 3
1
:( , ) ( , ) ( , )
:( , ) ( , )i i j j
H
H
ÖrnekKırmızı et
253 298 300 317 319 322 322 330 370 375
386 401 425 440 477 479 482 495 587 645
Domuz eti
144 339 360 372 386 387 393 405 405 428
458 473 496 506 507 511 545
Beyaz et
357 358 359 375 383 387 396 426 430 513
513 522 528 542 545 581 588
Örnek
Ortalama
%95 Güven Aralığı
Ortanca VaryansStd.
Sapma ÇAG En Küçük En BüyükAlt Sınır Üst SınırKırmızı Et 401,15 353,21 449,09 380,5 10492,87 102,44 158,75 253 645
Domuz Eti 418,53 370,26 466,79 405 8812,02 93,87 122 144 545
Beyaz Et 459 415,43 502,57 430 7180,75 84,74 156 357 588
Permütasyon Sayısı Cucconi P1 2,080299 0
10 2,080299 0,1100 2,080299 0,09
1000 2,080299 0,07310000 2,080299 0,0757
100000 2,080299 0,074581000000 2,080299 0,07494
Tartışma - Sonuç• Geleneksel yöntemlerde konum-ölçek probleminin
çözümünde konum testi ve ölçek testinin birleşiminden yararlanılır.
• MC testinde test istatistiği sadece ranklar üzerinden hesaplanır.
• Yokluk hipotezi doğru ise test istatistiğinin 0’a yakın olması beklenir. Eğer en az iki dağılım fonksiyonu farklı konum-ölçek parametresine sahip ise test istatistiği 0’dan farklıdır.
• Dağılımların farkı arttıkça test istatistiği büyür.
Tartışma - Sonuç• MC test istatistiği yeniden örnekleme temelli
yöntemler kullanılarak analitik olarak hesaplanabilir.
• Hesaplamalarda kullanılan iki önemli etken Tip I hata ve güçtür.
• MC testi asimptotik dağılımlardan bağımsız herhangi bir veri setine uygulanabilir.
• MC istatistiği Uk ve Vk arasındaki Mahalanobis uzaklığının yarısının ortalamasına eşittir.
KaynaklarMarozzi M., The Multisample Cucconi Test, Statistical Methods & Applications, Wiley, 2014
Bonnini S., Corain L., Marozzi M., Salmaso L., Nonparametric Hypothesis Testing: Rank and Permutation Methods with Applications in R ISBN: 978-1-119-95237-4, Wiley, 2014
Marozzi M., Some Notes on the Location-Scale Cucconi Test, Journal of Nonparametric Statistics, 2009
Marozzi M., Nonparametric Simultaneous Tests for Location and Scale Testing: A comparison of Several Methods, 2013
Marozzi M., A Modified Cucconi Test for Location and Scale Change Alternatives, 2013
Lepage Y., A combination of Wilcoxon's and Ansari-Bradley's statistics, Biometrika, 1971
Rublik F., The multisample version of The Lepage Test, Kybeynetika,2005
Neuhauser M. Leuchs A., Ball D., A new Location-Scale test based on a combination of the ideas of Levene and Lepage, Biometrical Journal, 2011
R KodlarıMultiSampleCucconiTest <- function(pooled.sample, sample.sizes, B){# Outer function: Inner fonksiyon yardimiyla permutasyona dayali test istatistiğini hesaplar# Argumanlar:# pooled.sample: birlestirilmis orneklem# sample.sizes: orneklem genisligi vektoru # B: permutasyon sayisi# Ciktilar:# mc.test[1]: MC test istatistigi# mc.test[2]: MC testinin p degeri
MultiSampleCucconiStat <- function(pooled.sample, sample.sizes){# Inner function: MC test istatistiğini hesaplar# Argumanlar:# pooled.sample: birlestirilmis orneklem# sample.sizes: orneklem genisligi vektoru# Ciktilar:# MC test istatistigisample.sizes <- c(0, sample.sizes)n <- sum(sample.sizes)K <- length(sample.sizes)ranks <- rank(pooled.sample)contrary.ranks <- n+1-ranksgroups.ranks <- vector("list", K-1)groups.contrary.ranks <- vector("list", K-1)cum.sample.sizes <- cumsum(sample.sizes)for (k in 1:(K-1)){groups.ranks[[k]] <- ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])]groups.contrary.ranks[[k]] <- contrary.ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])]}
sample.sizes <- sample.sizes[2:length(sample.sizes)]means <- vector(, K-1)st.dev <- vector(, K-1)for (k in 1:(K-1)){
means[k] <- sample.sizes[k]*(n+1)*(2*n+1)/6st.dev[k] <- (sample.sizes[k]*(n-sample.sizes[k])*(n+1)*(2*n+1)*(8*n+11)/180)^0.5}
covariance <- -(30*n+14*n^2+19)/(8*n+11)/(2*n+1)u.stat <- vector(, K-1)v.stat <- vector(, K-1)partial.c.stat <- vector(, K-1)for (k in 1:(K-1)){
u.stat[k] <- (sum(as.vector(groups.ranks[[k]])^2)-means[k])/st.dev[k]v.stat[k] <- (sum(as.vector(groups.contrary.ranks[[k]])^2)-means[k])/st.dev[k]partial.c.stat[k] <- (u.stat[k]^2+v.stat[k]^2-2*u.stat[k]*v.stat[k]*covariance) /2/(1-covariance^2)}
c.stat <- mean(partial.c.stat)return(c.stat)} # inner fonksiyon sonumc.test <- vector(, 2)permutation.cucconi.stat <- vector(, B)for (b in 1:B){
pooled.sample.perm <- sample(pooled.sample)permutation.cucconi.stat[b] <- MultiSampleCucconiStat(pooled.sample.perm,sample.sizes)}
mc.test[1] <- MultiSampleCucconiStat(pooled.sample, sample.sizes)mc.test[2] <- length(permutation.cucconi.stat[permutation.cucconi.stat >= mc.test[1]])/Breturn(mc.test)}
Teşekkürler