27
Çok Örneklem Cucconi Testi ve Bir uygulaması Mutlu Umaroğlu UBK 16 – Antalya Çolaklı 10-12 Eylül 2014

Çok Örneklem Cucconi Testi ve Bir uygulaması

Embed Size (px)

DESCRIPTION

Çok Örneklem Cucconi Testi ve Bir uygulaması. Mutlu Umaroğlu. UBK 16 – Antalya Çolaklı 10-12 Eylül 2014. Giriş. Grup karşılaştırması yapan testler en önemli istatistiksel yöntemlerden biridir. Bu testler sadece konum parametresini test eder. - PowerPoint PPT Presentation

Citation preview

Page 1: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Çok Örneklem Cucconi Testive

Bir uygulaması

Mutlu Umaroğlu

UBK 16 – Antalya Çolaklı10-12 Eylül 2014

Page 2: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Giriş• Grup karşılaştırması yapan testler en önemli

istatistiksel yöntemlerden biridir.

• Bu testler sadece konum parametresini test eder.

• Ölçek parametresini karşılaştıran çeşitli testler de vardır.

• Çoğu çalışmada konum parametresi test edilmesine rağmen bazı tür çalışmalarda hem konum hem de ölçek parametrelerinin test edilmesine gerek duyulur.

Page 3: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Giriş• Biyomedikal, biyoinformatik, iklim dinamikleri,

finans gibi alanlardaki bazı çalışmalarda konum ve ölçek parametresinin değişimi birlikte incelenmelidir.

• Tıpta tedavi sürerken ortalama ve değişkenliğin her ikisinin birden değişmesi önemli rol oynayabilir.

• Örneğin diyabet tedavisinde glikoz düzeyinin hem ortalama hem de değişkenlik açısından farklılaşması önemli olabilir.

Page 4: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Giriş• Bu tür durumlarla ilgili ilk kez Tukey 1959’da yeni

bir yöntem üzerine çalışmıştır. Ancak bu yöntemde güçten kayıp söz konusudur.

• Konum ve ölçek parametresini eşanlı olarak inceleyen testler: Cucconi(1968), Lepage(1971), Podgor-Gastwirth(1994), Neuhäuser(2000), Zhang(2006) ve Murakami(2007).

Page 5: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Lepage Testi• Konum ve ölçek parametresinin değişimini eş anlı

olarak inceleyen testler içinde en bilinenidir.

• İki örneklem konum-ölçek testi olarak konum parametresini inceleyen Wilcoxon testi ve ölçek parametresini inceleyen Ansari-Bradley testinin kombinasyonundan oluşur.

0 1 2 1 2

1 1 2 1 2

:

:

H

H

Page 6: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Lepage Testi

Wilcoxon test istatistiği

Ansari-Bradley test istatistiği

Beklenen değer

Varyans

2 2( ( )) ( ( ))( ) ( )

W E W AB E ABLV W V AB 1 1 2

( 1) ( 1)( ) , ( )

2 12n n n n n

E W V W

1 1 2( 2) ( 2)( 2)

( ) , ( )4 48

1

n n n n n nE AB V AB

n

2 21 1 2

2

( 1) ( 1)( 3)( ) , ( )

4 48n n n n n n

E AB V ABn n

W:

AB:

E:

V:

n çift

n tek

Page 7: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Cucconi Testi• Eş anlı olarak konum ve ölçek parametresini test

eder.

• İlk kez 1968 yılında önerilmiştir ancak Cucconi testi İtalyan yerel yayınında yayımlandığı için az bilinmektedir.

• 2009’dan bu yana Marozzi bu yöntem üzerine çalışmaktadır.

Page 8: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Cucconi Testi• Marozzi,

Cucconi testi üzerine çalışmış ve ilk defa exact kritik değerler tablosunu oluşturmuştur (Cucconi asimptotik kritik değerler tablosu).

Tip I hata olasılığı ve güç üzerine de çalışmıştır.Çok örneklem Cucconi testini oluşturmuştur.

Page 9: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Cucconi Testi• Cucconi testi ile ilgilenilmeye başlanmasının temel

nedenleri:Lepage testinden önce yayınlanmasıKonum testlerinin ve ölçek testlerinin

birleştirilmesinden oluşturulmamasıLepage testi ile karşılaştırıldığında güç ve test

istatistiğinin analitik olarak hesaplamasında sorun çıkmaması

Test istatistiğini hesaplamanın diğer yöntemlere göre daha kolay olması

Page 10: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Cucconi Testi• Test Hipotezi:

• Cucconi test istatistiği

0 1 2 1 2

1 1 2 1 2

:

:

H

H

2 2

22

2(1 )U V UVC

121 1

1

1 2

6 ( 1)(2 1)

( 1)(2 1)(8 11)/5

n

iiR n n n

Un n n n n

61

21

1E

n

iiR

1801

21

1V

n

iiR

121 1

1

1 2

6 ( 1 ) ( 1)(2 1)

( 1)(2 1)(8 11)/5

n

iin R n n n

Vn n n n n

1 12 21 1

1 1( 1 )

n n

i ii i

E n R E R

1 12 21 1

1 1( 1 )

n n

i ii i

V n R V R

22( 4) 1(2 1)(8 11)

nn n

Page 11: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Cucconi asimptotik kritik değerler tablosu

Page 12: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Çok Örneklem Lepage Testi• İkiden fazla grup için konum ve ölçek

parametresinin eşanlı değişimini inceleyen testler içinde en bilinenidir.

• Wilcoxon ve Ansari-Bradley testinin birleşiminden oluşur.

• Benzer amaçla geliştirilmiş Murakami MH1 ve MH2 testi de vardır. Bu testler de Lepage tipi testlerdir.

0 1 1 2 2

1

:( , ) ( , ) ... ( , )

:( , ) ( , )K K

i i j j

H

H

Page 13: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Çok Örneklem Lepage Testi• Test istatistiği:

2

1

12 1( )2( 1)

K

k kk

nML n W MABn n

1

1 kn

k kii

W Rnk

22

122 2

21

48( 1) 2( ) ,4( 4)

( 1)48 ( ) ,4( 1)( 3)

K

k kkK

k kk

MAB

n nn AB nçiftn n

nn n AB nteknn n n

1

1 1 1( )2 2

kn

k kii

n nAB Rnk

Page 14: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Çok Örneklem Cucconi Testi• Cucconi testi iki grup için eşanlı olarak konum ve

ölçek parametresini test etmektedir.

• Marozzi, Cucconi testi üzerinde çalışmış ve bu testi ikiden çok grup için genelleyen yeni bir yöntem geliştirmiştir.

• 2013’de geliştirilen bu yönteme göre ikiden çok grup için eşanlı olarak konum ve ölçek parametresini test etmek mümkündür.

Page 15: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Cucconi Testi• Test Hipotezi:

• Test istatistiği:

Çok Örneklem Cucconi Testi• Test Hipotezi:

• Test istatistiği:

0 1 1 2 2

1

:( , ) ( , ) ... ( , )

:( , ) ( , )K K

i i j j

H

H

2 2

21

212(1 )

KK K K K

k

U V U VMC

K

0 1 2 1 2

1 1 2 1 2

:

:

H

H

2 2

22

2(1 )U V UVC

Page 16: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Çok Örneklem Cucconi Testi• Test istatistiği:

2 2

21

212(1 )

KK K K K

k

U V U VMC

K

2 21

12

1

( )

( )

kk

k

nniki ki

inKi ki

R E RU

Var R

2 21

12

1

( 1 ) ( )

( )

kk

k

nniki ki

inKi ki

n R E RV

Var R

2 21 1( , ) , ( 1 )k kn ni ik k ki ki

Cor U V Cor R n R

1

1

11 12 1

Kk

k kk k

UMC U V

K V

Page 17: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Çok örnek Cucconi Testi• µ1>µ2 ve σ1=σ2 olduğunda daha

büyük olma eğilimindedir.

• Böylece U1 0’dan büyük olma V1 0’dan küçük olma eğilimindedir.

• µ1<µ2 olduğunda tam tersi doğrudur.

• µ1=µ2 ve σ1>σ2 olduğunda daha büyük olma eğilimindedir.

• Böylece U1 0’dan büyük olma eğilimindedir.

1 12 21 1

1 1, ( )'

n n

i ii iR E R den

1 12 21 1

1 1, ( )'

n n

i ii iR E R den

Page 18: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Çok Örneklem Cucconi Testi• Çok örneklem Cucconi Testi bir permutasyon

testidir ve P değeri permutasyon üzeriden hesaplanır.

• Permütasyon sayısı MC test istatistiğini etkilenmez sadece P değeri üzerinde etkilidir.

• Permutasyon testini uygularken çok örneklem Cucconi test istatistiğinin asimptotik dağılımı önemli değildir.

Page 19: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Çok Örneklem Cucconi Testi

1. Gözlenen verilerden MC istatistiği hesaplanır ve MC0 olarak atanır

2. Örneklemler birleştirilir (X=(X1,X2,…,Xk)) ve birleştirilmiş örneklemden rasgele olarak örnek seçilerek MC istatistiği hesaplanır ve MC1 olarak atanır

3. 2. adım B kez tekrarlanır (MC2, MC3,…,MCB)

4. Kestirilen P değeri α’dan küçük veya eşitse H0 hipotezini reddedilir 0

1

1 ( )ˆB

bb

p I MC MCB

Page 20: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Örnek• 54 yiyecek firmasının sattığı bir et ürünündeki

sodyum değerleri miligram cinsinden aşağıda verilmiştir. Bu ürün içerdiği et türüne göre (kırmızı et, beyaz et ve domuz eti) sınıflandırılmıştır.

• Bu sınıflar arasında konum-ölçek parametresi bakımından anlamlı bir farklılık var mıdır?

0 1 1 2 2 3 3

1

:( , ) ( , ) ( , )

:( , ) ( , )i i j j

H

H

Page 21: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

ÖrnekKırmızı et

253 298 300 317 319 322 322 330 370 375

386 401 425 440 477 479 482 495 587 645

Domuz eti

144 339 360 372 386 387 393 405 405 428

458 473 496 506 507 511 545

Beyaz et

357 358 359 375 383 387 396 426 430 513

513 522 528 542 545 581 588

Page 22: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Örnek

  Ortalama

%95 Güven Aralığı

Ortanca VaryansStd.

Sapma ÇAG En Küçük En BüyükAlt Sınır Üst SınırKırmızı Et 401,15 353,21 449,09 380,5 10492,87 102,44 158,75 253 645

Domuz Eti 418,53 370,26 466,79 405 8812,02 93,87 122 144 545

Beyaz Et 459 415,43 502,57 430 7180,75 84,74 156 357 588

Permütasyon Sayısı  Cucconi P1 2,080299 0

10 2,080299 0,1100 2,080299 0,09

1000 2,080299 0,07310000 2,080299 0,0757

100000 2,080299 0,074581000000 2,080299 0,07494

Page 23: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Tartışma - Sonuç• Geleneksel yöntemlerde konum-ölçek probleminin

çözümünde konum testi ve ölçek testinin birleşiminden yararlanılır.

• MC testinde test istatistiği sadece ranklar üzerinden hesaplanır.

• Yokluk hipotezi doğru ise test istatistiğinin 0’a yakın olması beklenir. Eğer en az iki dağılım fonksiyonu farklı konum-ölçek parametresine sahip ise test istatistiği 0’dan farklıdır.

• Dağılımların farkı arttıkça test istatistiği büyür.

Page 24: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Tartışma - Sonuç• MC test istatistiği yeniden örnekleme temelli

yöntemler kullanılarak analitik olarak hesaplanabilir.

• Hesaplamalarda kullanılan iki önemli etken Tip I hata ve güçtür.

• MC testi asimptotik dağılımlardan bağımsız herhangi bir veri setine uygulanabilir.

• MC istatistiği Uk ve Vk arasındaki Mahalanobis uzaklığının yarısının ortalamasına eşittir.

Page 25: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

KaynaklarMarozzi M., The Multisample Cucconi Test, Statistical Methods & Applications, Wiley, 2014

Bonnini S., Corain L., Marozzi M., Salmaso L., Nonparametric Hypothesis Testing: Rank and Permutation Methods with Applications in R ISBN: 978-1-119-95237-4, Wiley, 2014

Marozzi M., Some Notes on the Location-Scale Cucconi Test, Journal of Nonparametric Statistics, 2009

Marozzi M., Nonparametric Simultaneous Tests for Location and Scale Testing: A comparison of Several Methods, 2013

Marozzi M., A Modified Cucconi Test for Location and Scale Change Alternatives, 2013

Lepage Y., A combination of Wilcoxon's and Ansari-Bradley's statistics, Biometrika, 1971

Rublik F., The multisample version of The Lepage Test, Kybeynetika,2005

Neuhauser M. Leuchs A., Ball D., A new Location-Scale test based on a combination of the ideas of Levene and Lepage, Biometrical Journal, 2011

Page 26: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

R KodlarıMultiSampleCucconiTest <- function(pooled.sample, sample.sizes, B){# Outer function: Inner fonksiyon yardimiyla permutasyona dayali test istatistiğini hesaplar# Argumanlar:# pooled.sample: birlestirilmis orneklem# sample.sizes: orneklem genisligi vektoru # B: permutasyon sayisi# Ciktilar:# mc.test[1]: MC test istatistigi# mc.test[2]: MC testinin p degeri

MultiSampleCucconiStat <- function(pooled.sample, sample.sizes){# Inner function: MC test istatistiğini hesaplar# Argumanlar:# pooled.sample: birlestirilmis orneklem# sample.sizes: orneklem genisligi vektoru# Ciktilar:# MC test istatistigisample.sizes <- c(0, sample.sizes)n <- sum(sample.sizes)K <- length(sample.sizes)ranks <- rank(pooled.sample)contrary.ranks <- n+1-ranksgroups.ranks <- vector("list", K-1)groups.contrary.ranks <- vector("list", K-1)cum.sample.sizes <- cumsum(sample.sizes)for (k in 1:(K-1)){groups.ranks[[k]] <- ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])]groups.contrary.ranks[[k]] <- contrary.ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])]}

sample.sizes <- sample.sizes[2:length(sample.sizes)]means <- vector(, K-1)st.dev <- vector(, K-1)for (k in 1:(K-1)){

means[k] <- sample.sizes[k]*(n+1)*(2*n+1)/6st.dev[k] <- (sample.sizes[k]*(n-sample.sizes[k])*(n+1)*(2*n+1)*(8*n+11)/180)^0.5}

covariance <- -(30*n+14*n^2+19)/(8*n+11)/(2*n+1)u.stat <- vector(, K-1)v.stat <- vector(, K-1)partial.c.stat <- vector(, K-1)for (k in 1:(K-1)){

u.stat[k] <- (sum(as.vector(groups.ranks[[k]])^2)-means[k])/st.dev[k]v.stat[k] <- (sum(as.vector(groups.contrary.ranks[[k]])^2)-means[k])/st.dev[k]partial.c.stat[k] <- (u.stat[k]^2+v.stat[k]^2-2*u.stat[k]*v.stat[k]*covariance) /2/(1-covariance^2)}

c.stat <- mean(partial.c.stat)return(c.stat)} # inner fonksiyon sonumc.test <- vector(, 2)permutation.cucconi.stat <- vector(, B)for (b in 1:B){

pooled.sample.perm <- sample(pooled.sample)permutation.cucconi.stat[b] <- MultiSampleCucconiStat(pooled.sample.perm,sample.sizes)}

mc.test[1] <- MultiSampleCucconiStat(pooled.sample, sample.sizes)mc.test[2] <- length(permutation.cucconi.stat[permutation.cucconi.stat >= mc.test[1]])/Breturn(mc.test)}

Page 27: Çok Örneklem  Cucconi  Testi ve Bir uygulaması

Teşekkürler

[email protected]