Çok Örneklem Cucconi Testi ve Bir uygulaması

Çok Örneklem Cucconi Testive

Bir uygulaması

Mutlu Umaroğlu

UBK 16 – Antalya Çolaklı10-12 Eylül 2014

Giriş• Grup karşılaştırması yapan testler en önemli

istatistiksel yöntemlerden biridir.

• Bu testler sadece konum parametresini test eder.

• Ölçek parametresini karşılaştıran çeşitli testler de vardır.

• Çoğu çalışmada konum parametresi test edilmesine rağmen bazı tür çalışmalarda hem konum hem de ölçek parametrelerinin test edilmesine gerek duyulur.

Giriş• Biyomedikal, biyoinformatik, iklim dinamikleri,

finans gibi alanlardaki bazı çalışmalarda konum ve ölçek parametresinin değişimi birlikte incelenmelidir.

• Tıpta tedavi sürerken ortalama ve değişkenliğin her ikisinin birden değişmesi önemli rol oynayabilir.

• Örneğin diyabet tedavisinde glikoz düzeyinin hem ortalama hem de değişkenlik açısından farklılaşması önemli olabilir.

Giriş• Bu tür durumlarla ilgili ilk kez Tukey 1959’da yeni

bir yöntem üzerine çalışmıştır. Ancak bu yöntemde güçten kayıp söz konusudur.

• Konum ve ölçek parametresini eşanlı olarak inceleyen testler: Cucconi(1968), Lepage(1971), Podgor-Gastwirth(1994), Neuhäuser(2000), Zhang(2006) ve Murakami(2007).

Lepage Testi• Konum ve ölçek parametresinin değişimini eş anlı

olarak inceleyen testler içinde en bilinenidir.

• İki örneklem konum-ölçek testi olarak konum parametresini inceleyen Wilcoxon testi ve ölçek parametresini inceleyen Ansari-Bradley testinin kombinasyonundan oluşur.

0 1 2 1 2

1 1 2 1 2

:

:

H

H

Lepage Testi

Wilcoxon test istatistiği

Ansari-Bradley test istatistiği

Beklenen değer

Varyans

2 2( ( )) ( ( ))( ) ( )

W E W AB E ABLV W V AB 1 1 2

( 1) ( 1)( ) , ( )

2 12n n n n n

E W V W

1 1 2( 2) ( 2)( 2)

( ) , ( )4 48

1

n n n n n nE AB V AB

n

2 21 1 2

2

( 1) ( 1)( 3)( ) , ( )

4 48n n n n n n

E AB V ABn n

W:

AB:

E:

V:

n çift

n tek

Cucconi Testi• Eş anlı olarak konum ve ölçek parametresini test

eder.

• İlk kez 1968 yılında önerilmiştir ancak Cucconi testi İtalyan yerel yayınında yayımlandığı için az bilinmektedir.

• 2009’dan bu yana Marozzi bu yöntem üzerine çalışmaktadır.

Cucconi Testi• Marozzi,

Cucconi testi üzerine çalışmış ve ilk defa exact kritik değerler tablosunu oluşturmuştur (Cucconi asimptotik kritik değerler tablosu).

Tip I hata olasılığı ve güç üzerine de çalışmıştır.Çok örneklem Cucconi testini oluşturmuştur.

Cucconi Testi• Cucconi testi ile ilgilenilmeye başlanmasının temel

nedenleri:Lepage testinden önce yayınlanmasıKonum testlerinin ve ölçek testlerinin

birleştirilmesinden oluşturulmamasıLepage testi ile karşılaştırıldığında güç ve test

istatistiğinin analitik olarak hesaplamasında sorun çıkmaması

Test istatistiğini hesaplamanın diğer yöntemlere göre daha kolay olması

Cucconi Testi• Test Hipotezi:

• Cucconi test istatistiği

0 1 2 1 2

1 1 2 1 2

:

:

H

H

2 2

22

2(1 )U V UVC

121 1

1

1 2

6 ( 1)(2 1)

( 1)(2 1)(8 11)/5

n

iiR n n n

Un n n n n

61

21

1E

n

iiR

1801

21

1V

n

iiR

121 1

1

1 2

6 ( 1 ) ( 1)(2 1)

( 1)(2 1)(8 11)/5

n

iin R n n n

Vn n n n n

1 12 21 1

1 1( 1 )

n n

i ii i

E n R E R

1 12 21 1

1 1( 1 )

n n

i ii i

V n R V R

22( 4) 1(2 1)(8 11)

nn n

Cucconi asimptotik kritik değerler tablosu

Çok Örneklem Lepage Testi• İkiden fazla grup için konum ve ölçek

parametresinin eşanlı değişimini inceleyen testler içinde en bilinenidir.

• Wilcoxon ve Ansari-Bradley testinin birleşiminden oluşur.

• Benzer amaçla geliştirilmiş Murakami MH1 ve MH2 testi de vardır. Bu testler de Lepage tipi testlerdir.

0 1 1 2 2

1

:( , ) ( , ) ... ( , )

:( , ) ( , )K K

i i j j

H

H

Çok Örneklem Lepage Testi• Test istatistiği:

2

1

12 1( )2( 1)

K

k kk

nML n W MABn n

1

1 kn

k kii

W Rnk

22

122 2

21

48( 1) 2( ) ,4( 4)

( 1)48 ( ) ,4( 1)( 3)

K

k kkK

k kk

MAB

n nn AB nçiftn n

nn n AB nteknn n n

1

1 1 1( )2 2

kn

k kii

n nAB Rnk

Çok Örneklem Cucconi Testi• Cucconi testi iki grup için eşanlı olarak konum ve

ölçek parametresini test etmektedir.

• Marozzi, Cucconi testi üzerinde çalışmış ve bu testi ikiden çok grup için genelleyen yeni bir yöntem geliştirmiştir.

• 2013’de geliştirilen bu yönteme göre ikiden çok grup için eşanlı olarak konum ve ölçek parametresini test etmek mümkündür.

Cucconi Testi• Test Hipotezi:

• Test istatistiği:

Çok Örneklem Cucconi Testi• Test Hipotezi:

• Test istatistiği:

0 1 1 2 2

1

:( , ) ( , ) ... ( , )

:( , ) ( , )K K

i i j j

H

H

2 2

21

212(1 )

KK K K K

k

U V U VMC

K

0 1 2 1 2

1 1 2 1 2

:

:

H

H

2 2

22

2(1 )U V UVC

Çok Örneklem Cucconi Testi• Test istatistiği:

2 2

21

212(1 )

KK K K K

k

U V U VMC

K

2 21

12

1

( )

( )

kk

k

nniki ki

inKi ki

R E RU

Var R

2 21

12

1

( 1 ) ( )

( )

kk

k

nniki ki

inKi ki

n R E RV

Var R

2 21 1( , ) , ( 1 )k kn ni ik k ki ki

Cor U V Cor R n R

1

1

11 12 1

Kk

k kk k

UMC U V

K V

Çok örnek Cucconi Testi• µ1>µ2 ve σ1=σ2 olduğunda daha

büyük olma eğilimindedir.

• Böylece U1 0’dan büyük olma V1 0’dan küçük olma eğilimindedir.

• µ1<µ2 olduğunda tam tersi doğrudur.

• µ1=µ2 ve σ1>σ2 olduğunda daha büyük olma eğilimindedir.

• Böylece U1 0’dan büyük olma eğilimindedir.

1 12 21 1

1 1, ( )'

n n

i ii iR E R den

1 12 21 1

1 1, ( )'

n n

i ii iR E R den

Çok Örneklem Cucconi Testi• Çok örneklem Cucconi Testi bir permutasyon

testidir ve P değeri permutasyon üzeriden hesaplanır.

• Permütasyon sayısı MC test istatistiğini etkilenmez sadece P değeri üzerinde etkilidir.

• Permutasyon testini uygularken çok örneklem Cucconi test istatistiğinin asimptotik dağılımı önemli değildir.

Çok Örneklem Cucconi Testi

1. Gözlenen verilerden MC istatistiği hesaplanır ve MC0 olarak atanır

2. Örneklemler birleştirilir (X=(X1,X2,…,Xk)) ve birleştirilmiş örneklemden rasgele olarak örnek seçilerek MC istatistiği hesaplanır ve MC1 olarak atanır

3. 2. adım B kez tekrarlanır (MC2, MC3,…,MCB)

4. Kestirilen P değeri α’dan küçük veya eşitse H0 hipotezini reddedilir 0

1

1 ( )ˆB

bb

p I MC MCB

Örnek• 54 yiyecek firmasının sattığı bir et ürünündeki

sodyum değerleri miligram cinsinden aşağıda verilmiştir. Bu ürün içerdiği et türüne göre (kırmızı et, beyaz et ve domuz eti) sınıflandırılmıştır.

• Bu sınıflar arasında konum-ölçek parametresi bakımından anlamlı bir farklılık var mıdır?

0 1 1 2 2 3 3

1

:( , ) ( , ) ( , )

:( , ) ( , )i i j j

H

H

ÖrnekKırmızı et

253 298 300 317 319 322 322 330 370 375

386 401 425 440 477 479 482 495 587 645

Domuz eti

144 339 360 372 386 387 393 405 405 428

458 473 496 506 507 511 545

Beyaz et

357 358 359 375 383 387 396 426 430 513

513 522 528 542 545 581 588

Örnek

Ortalama

%95 Güven Aralığı

Ortanca VaryansStd.

Sapma ÇAG En Küçük En BüyükAlt Sınır Üst SınırKırmızı Et 401,15 353,21 449,09 380,5 10492,87 102,44 158,75 253 645

Domuz Eti 418,53 370,26 466,79 405 8812,02 93,87 122 144 545

Beyaz Et 459 415,43 502,57 430 7180,75 84,74 156 357 588

Permütasyon Sayısı Cucconi P1 2,080299 0

10 2,080299 0,1100 2,080299 0,09

1000 2,080299 0,07310000 2,080299 0,0757

100000 2,080299 0,074581000000 2,080299 0,07494

Tartışma - Sonuç• Geleneksel yöntemlerde konum-ölçek probleminin

çözümünde konum testi ve ölçek testinin birleşiminden yararlanılır.

• MC testinde test istatistiği sadece ranklar üzerinden hesaplanır.

• Yokluk hipotezi doğru ise test istatistiğinin 0’a yakın olması beklenir. Eğer en az iki dağılım fonksiyonu farklı konum-ölçek parametresine sahip ise test istatistiği 0’dan farklıdır.

• Dağılımların farkı arttıkça test istatistiği büyür.

Tartışma - Sonuç• MC test istatistiği yeniden örnekleme temelli

yöntemler kullanılarak analitik olarak hesaplanabilir.

• Hesaplamalarda kullanılan iki önemli etken Tip I hata ve güçtür.

• MC testi asimptotik dağılımlardan bağımsız herhangi bir veri setine uygulanabilir.

• MC istatistiği Uk ve Vk arasındaki Mahalanobis uzaklığının yarısının ortalamasına eşittir.

KaynaklarMarozzi M., The Multisample Cucconi Test, Statistical Methods & Applications, Wiley, 2014

Bonnini S., Corain L., Marozzi M., Salmaso L., Nonparametric Hypothesis Testing: Rank and Permutation Methods with Applications in R ISBN: 978-1-119-95237-4, Wiley, 2014

Marozzi M., Some Notes on the Location-Scale Cucconi Test, Journal of Nonparametric Statistics, 2009

Marozzi M., Nonparametric Simultaneous Tests for Location and Scale Testing: A comparison of Several Methods, 2013

Marozzi M., A Modified Cucconi Test for Location and Scale Change Alternatives, 2013

Lepage Y., A combination of Wilcoxon's and Ansari-Bradley's statistics, Biometrika, 1971

Rublik F., The multisample version of The Lepage Test, Kybeynetika,2005

Neuhauser M. Leuchs A., Ball D., A new Location-Scale test based on a combination of the ideas of Levene and Lepage, Biometrical Journal, 2011

R KodlarıMultiSampleCucconiTest <- function(pooled.sample, sample.sizes, B){# Outer function: Inner fonksiyon yardimiyla permutasyona dayali test istatistiğini hesaplar# Argumanlar:# pooled.sample: birlestirilmis orneklem# sample.sizes: orneklem genisligi vektoru # B: permutasyon sayisi# Ciktilar:# mc.test[1]: MC test istatistigi# mc.test[2]: MC testinin p degeri

MultiSampleCucconiStat <- function(pooled.sample, sample.sizes){# Inner function: MC test istatistiğini hesaplar# Argumanlar:# pooled.sample: birlestirilmis orneklem# sample.sizes: orneklem genisligi vektoru# Ciktilar:# MC test istatistigisample.sizes <- c(0, sample.sizes)n <- sum(sample.sizes)K <- length(sample.sizes)ranks <- rank(pooled.sample)contrary.ranks <- n+1-ranksgroups.ranks <- vector("list", K-1)groups.contrary.ranks <- vector("list", K-1)cum.sample.sizes <- cumsum(sample.sizes)for (k in 1:(K-1)){groups.ranks[[k]] <- ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])]groups.contrary.ranks[[k]] <- contrary.ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])]}

sample.sizes <- sample.sizes[2:length(sample.sizes)]means <- vector(, K-1)st.dev <- vector(, K-1)for (k in 1:(K-1)){

means[k] <- sample.sizes[k]*(n+1)*(2*n+1)/6st.dev[k] <- (sample.sizes[k]*(n-sample.sizes[k])*(n+1)*(2*n+1)*(8*n+11)/180)^0.5}

covariance <- -(30*n+14*n^2+19)/(8*n+11)/(2*n+1)u.stat <- vector(, K-1)v.stat <- vector(, K-1)partial.c.stat <- vector(, K-1)for (k in 1:(K-1)){

u.stat[k] <- (sum(as.vector(groups.ranks[[k]])^2)-means[k])/st.dev[k]v.stat[k] <- (sum(as.vector(groups.contrary.ranks[[k]])^2)-means[k])/st.dev[k]partial.c.stat[k] <- (u.stat[k]^2+v.stat[k]^2-2*u.stat[k]*v.stat[k]*covariance) /2/(1-covariance^2)}

c.stat <- mean(partial.c.stat)return(c.stat)} # inner fonksiyon sonumc.test <- vector(, 2)permutation.cucconi.stat <- vector(, B)for (b in 1:B){

pooled.sample.perm <- sample(pooled.sample)permutation.cucconi.stat[b] <- MultiSampleCucconiStat(pooled.sample.perm,sample.sizes)}

mc.test[1] <- MultiSampleCucconiStat(pooled.sample, sample.sizes)mc.test[2] <- length(permutation.cucconi.stat[permutation.cucconi.stat >= mc.test[1]])/Breturn(mc.test)}

Teşekkürler

[email protected]

Documents

Çok Örneklem Cucconi Testi ve Bir uygulaması