Upload
duonghanh
View
220
Download
0
Embed Size (px)
Citation preview
1
Metodi Statistici e Probabilistici per l’Ingegneria
FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZA
Corso di Laurea in Ingegneria Civile
Facoltà di Ingegneria, Università di Padova
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 1
Docente: Dott. L. CorainE-mail: [email protected] Home page: www.gest.unipd.it/~livio/Corso_Civile.html
SOMMARIO
Definizioni, principi e fasi del DoE (Design of Experiments)ANOVA ad una viaANOVA ad una viaConfronti multipliBlocco e covariataANOVA a due vieANOVA multivia
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 2
ANOVA multiviaPiani 2kFattori fissi e fattori casuali e studi di ripetibilità e riproducibilità
2
PRINCIPI E FASI DEL DOEUn esperimento è una serie di prove in cui losperimentatore fa variare deliberatamente dei fattori(controllabili) di input di un processo/sistema, osserva larisposta in un uscita e quindi, grazie ad opportuneelaborazioni statistiche inferenziali determina quali fattorielaborazioni statistiche inferenziali, determina quali fattoriinducono una variazione significativa nella risposta.Nell’esperimento sono sempre presenti anche dei fattori (fonti di variabilità) non controllabili(strumenti di esecuzione/misurazione della prova materiale sperimentale non
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 3
prova, materiale sperimentale non omogeneo/uniforme, campionamento, ecc.) i quali inducono una variabilità ulteriore alla risposta che si somma a quella determinata dai fattori controllabili.
PRINCIPI E FASI DEL DOESi noti che mentre la variabile risposta (TWT, ST,durezza, ecc.) deve necessariamente essere una misuradi tipo numerico, i fattori controllabili di input di unprocesso/sistema possono essere sia qualitativi (tipo di
i l di f i ) ireagente, materiale di confezionamento, ecc.) siaquantitativi (% di additivo, quantità di ossidante, ecc.).In un esperimento fattoriale, tutte le possibilicombinazioni dei livelli dei fattori (detti trattamenti)vengono testati, generalmente ciascuno per un ugualenumero di volte pari ad n (esperimento bilanciato).In un piano fattoriale frazionato invece non tutte le
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 4
In un piano fattoriale frazionato invece non tutte lecombinazioni dei trattamenti vengono testate, ma sonouna loro parte (detta frazione del piano).Se i trattamenti vengano testati una sola volta, si parla diesperimento/piano fattoriale non replicato. Esso ha ilforte limite di non consentire una analisi inferenziale.
3
PRINCIPI E FASI DEL DOEGrazie ad un opportuno modello statistico dirappresentazione dei dati sperimentali è possibileformalizzare il ruolo sia dei fattori controllabili sia di quellinon controllabili: Y = µ + ε,
dove Y è la risposta, µ rappresenta il valore mediodella risposta, che può dipendere (linearmente) dailivelli (cioè dai valori) dei fattori controllabili. Ad es.
µ = µ0 + τi (ANOVA ad una via)µ = µ0 + τi + βj (ANOVA ad una via con blocco)µ = µ0 + τi + βj + (τβ)ij (ANOVA a due vie)
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 5
j jε rappresenta il termine di errore sperimentale, doveconfluiscono tutte le fonti (fattori) di variabilità noncontrollabile e che si assume indipendente edidenticamente distribuito secondo una v.a. gaussiana:
ε∼IIN(0,σ2).
PRINCIPI E FASI DEL DOE
Gli esperimenti sono largamente utilizzati nell’industriaprincipalmente nell’area della ricerca e sviluppo e dellaqualità, ad esempio allo scopo di
Ridurre il tempo per progettare/sviluppare nuovip p p g ppprodotti e processi.Valutazione dei materiali, delle alternative di progetto,settare componenti e sistemi di tolleranza, ecc.Caratterizzare e migliorare le prestazioni dei processiesistenti.Migliorare l’affidabilità e le prestazioni dei prodotti.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 6
g p pRaggiungere robustezza di prodotto e processo.
In generale, tutti gli esperimenti sono progettati ed i datiottenuti elaborati con metodi statistici, tuttavia solo alcuniin modo adeguato ed opportuno, altri invece sonopianificati poco e male ed analizzati in modo improprio.
4
PRINCIPI E FASI DEL DOEÈ importante sottolineare che l’esperimento deve esseredebitamente progettato prima della sua esecuzione. Inparticolare bisogna stabilire:
l’idonea risposta (TWT, ST, durezza, ecc.) alla luce delproblema in oggetto;i fattori ed i rispettivi livelli che si vogliono manipolarenell’esperimento e che ci si aspetta possano influenzarela risposta; esiste un ovvio trade-off tra numero difattori/livelli e tempi/costi dell’esperimento;il numero n di prove per trattamento (numero direpliche); in generale si preferisce far sì che ogni
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 7
repliche); in generale si preferisce far sì che ognitrattamento abbia lo stesso numero di prove(esperimento bilanciato);una appropriata assegnazione del materialesperimentale ai trattamenti;un idoneo ordine di esecuzione delle prove.
PRINCIPI E FASI DEL DOEI principi basilari del DoE sono tre: randomizzazione,replicazione e blocco.Randomizzazione: sia l’ordine di esecuzione delleprove sia l’assegnazione del materiale sperimentale aitrattamenti deve avvenire in modo completamentecasuale (randomizzato); questo consente di mediare glieffetti di fattori non controllabili sempre presenti (ma“nascosti”) che vanno così ad incidere in modo uniformesui vari trattamenti.Replicazione: significa che ogni trattamento deveessere eseguito in più di una prova indipendente; questo
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 8
essere eseguito in più di una prova indipendente; questoconsente di migliorare la precisione della stimadell’effetto dei fattori, riducendo nel contempo la stimadell’errore e del rumore di fondo (si ricordi che l’errorestandard della media campionaria è uguale a σ, scartoquadratico medio della popolazione, diviso √n).
5
PRINCIPI E FASI DEL DOEBlocco: si tratta di un fattore di disturbo noto econtrollabile che quasi certamente produce sulla rispostaun effetto, che non interessa però allo sperimentatore.Tuttavia la variabilità che trasmette alla risposta deveessere minimizzata.Tipici fattori di disturbo/blocco sono: lotti di materialegrezzo, operatori, provini, attrezzature, il fattoretemporale (turni, giorni, ecc.).Se la variabilità del disturbo è nota e controllabile, si puòusare la tecnica dei blocchi; se il fattore di disturbo ènoto, osservabile ma non controllabile, si può usare
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 9
noto, osservabile ma non controllabile, si può usarel’analisi di covarianza per rimuovere l’effetto del fattoredi disturbo dall’analisi.Se il fattore di disturbo non è né noto né controllabile (a“variabile nascosta”), si spera che la randomizzazioneequilibri la sua influenza nei confronti dell’esperimento.
PRINCIPI E FASI DEL DOELe linee guida per la pianificazione ed analisi degliesperimenti sono le seguenti:
Identificazione e formulazione del problema.Scelta dei fattori, livelli ed intervalli.Identificazioni dei blocchi e delle covariate.Selezione della variabile di risposta.Scelta del piano sperimentale:
determinazione del numero di repliche;assegnazione del materiale sperimentale ai trattamenti;definizione dell’ordine di esecuzione delle prove.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 10
pEsecuzione dell’esperimento.Analisi statistica dei dati mediante metodi ANOVA(Analysis of Variance).Conclusioni e raccomandazioni (eventuale pianificazionedi un nuovo esperimento sulla base dei risultati ottenuti).
6
ANOVA AD UNA VIAConsideriamo un esperimento in cui è presente un unicofattore di interesse (% di cemento, spessore, tipo additivo,fornitore, ecc.) che può assumere a livelli.Il primo step è la progettazione dell’esperimento (DoE):p o s ep è a p oge a o e de espe e o ( o )
stabilire in numero di repliche sperimentali n e quindi ilnumero totale di prove: N = a × n;assegnare in modo casuale il materiale sperimentale(N provini) agli a trattamenti (1° randomizzazione);stabilire l’ordine di esecuzione delle N prove (2°randomizzazione)
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 11
randomizzazione).Il modello di rappresentazione dei dati:
Yij = µ + τj + εij = µj + εij, i=1,...,n, j =1,…,adove µ è la media generale, τj è l’effetto del j-thtrattamento (livello del fattore), Σjτj=0, εij∼IIN(0,σ2).
ANOVA AD UNA VIA
Il cambiamento del peso % di cotone cambia la resistenza
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 12
cambia la resistenza media a trazione?C’è un livello ottimaledi percentuale di cotone?
7
L’obiettivo è stabilire (testate) se al variare degli a livellidel fattore di interesse la risposta subisce (mediamente)degli scostamenti (variazioni significative).Il problema inferenziale riferibile a questo contesto è noto
ANOVA AD UNA VIA
p qcome “ANOVA ad una via” :
H0: τ1 = … = τa = 0 (o µ1 = … = µa)vs. H1: ∃ τj ≠ 0 (or ∃ µj ≠µh, j,h = 1,…,a; j ≠ h)se l’ipotesi nulla viene rigettata, allo sarà di interesseapprofondire l’analisi considerandoH : µ = µ j h = 1 C; j ≠ h;
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 13
H0(jh): µj = µh, j,h = 1,…,C; j ≠ h;ovvero l’insieme delle C×(C−1)/2 verifiche di ipotesichiamate “confronti a coppie o multipli”.
Prima di tutto è necessario sviluppare un proceduraidonea a testare l’ipotesi nulla (globale) H0 contro H1.
ANOVA AD UNA VIAL’acronimo ANOVA − “ANalysis Of Variance” si riferisceal fatto che la variabilità totale della variabile rispostaviene ripartita in componenti che sono coerenti con ilmodello di rappresentazione dei dati dell’esperimento.pp pLa variabilità totale SST viene rappresentata dallasomma totale dei quadrati:
La partizione ANOVA viene definita come:
2..
1 1( )
a n
T ijj i
SS y y= =
= −∑∑
2 2( ) [( ) ( )]a n a n
y y y y y y− = − + −∑∑ ∑∑
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 14
.. . .. .1 1 1 1
2 2. .. .
1 1 1
( ) [( ) ( )]
( ) ( )
ij j ij jj i j i
a a n
j ij jj j i
T Trattamenti E
y y y y y y
n y y y y
SS SS SS
= = = =
= = =
= +
= − + −
= +
∑∑ ∑∑
∑ ∑∑
8
V l i l i di SS ifl l i l i d i
T Trattamenti ESS SS SS= +
ANOVA AD UNA VIA
Valori elevati di SSTrattamenti riflettono elevati valori deiparametri τj e quindi grandi differenze nelle medie deitrattamenti (evidenza contro H0);Piccoli valori di SSTrattamenti suggeriscono che non ci sonodifferenze nelle medie dei trattamenti (ovvero che i τjsono tutti uguali a zero; evidenza a favore di H0);
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 15
Mentre le somme dei quadrati non possono esseredirettamente confrontate tra loro (il numero di addendi èdiverso), possono invece essere confrontati i cosiddettiquadrati medi definiti come la somma dei quadrati divisoi corrispondenti gradi di libertà.
I quadrati medi sono definiti come la somma dei quadratidiviso i corrispondenti gradi di libertà :
1 1 ( 1)Totale Trattamenti Erroredf df df
an a a n= +
− = − + −
ANOVA AD UNA VIA
Se Ie medie dei trattamenti fossero tutte uguali (τj tuttiuguali a zero), i quadrati medi dei trattamenti edell’errore sarebbero (teoricamente) anche’essi uguali.
1 1 ( 1)
,1 ( 1)
Trattamenti ETrattamenti E
an a a nSS SSMS MS
a a n
= +
= =− −
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 16
Se Ie medie dei trattamenti fossero diverse, i quadratimedi dei trattamenti sarebbero maggiori dei quadratimedi dell’errore. Ne consegue che, calcolando ilrapporto tra i due quadrati medi, possiamo ottenere unamisura dell’evidenza empirica contro l’ipotesi H0.
9
Questi calcoli vengono usualmente riportati nellacosiddetta tabella dell’Analisi della Varianza:
ANOVA AD UNA VIA
La distribuzione di riferimento della statistica test F è la
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 17
La distribuzione di riferimento della statistica test F0 è ladistribuzione F(a−1,N−a) (F di Fisher con a−1 e N−a gdl).L’ipotesi nulla (uguaglianza delle medie dei trattamenti)deve essere rifiutata se
oss ; 1,a N aF F − −> α
Output dell’esperimento di resistenza alla trazione (tabella ANOVA e dotplot con medie campionarie):
ANOVA AD UNA VIA
engh
t
25
20
15
Dotplot of Strenght vs Cotton%
p )
General Linear Model:Strenght versus Cotton%
Factor Type Levels ValuesCotton% fixed 5 15; 20; 25; 30; 35
Analysis of Variance for Strenght, using Adjusted SS for Tests
Cotton%
Str
3530252015
10
5
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 18
y g g j
Source DF Seq SS Adj SS Adj MS F PCotton% 4 475.76 475.76 118.94 14.76 0.000Error 20 161.20 161.20 8.06Total 24 636.96
S = 2.83901 R-Sq = 74.69% R-Sq(adj) = 69.63%
10
ANOVA AD UNA VIA
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 19
Qual è il meccanismo di funzionamento e perché ilmetodo ANOVA funziona correttamente?
2 21 0 ( 1)2 2
Stiamo campionando da popolazioni normali, quindi
se è vera, e Treamtents Ea a n
SS SSH− −∼ ∼χ χσ σ
ANOVA AD UNA VIA
il teorema di Cochran prova l'independenza di queste due variabili casuali di tipo chi-quadrato.
Qu
σ σ
21
0 1, ( 1)2( 1)
/ ( 1) / ( 1)indi / [ ( 1)] / [ ( 1)]
Trattmenti aa a n
E a n
a
SS a aF FSS a n a n
−− −
−
− −=
− −∼ ∼χχ
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 20
2
12 2Infine, ( ) e ( )1
Perciò un test unilateriale (coda destra) risulta essere appropriato
jj
Trattmenti E
nE MS E MS
aF
== + =−
∑τσ σ
.
11
Quando il fattore di interesse è tipo numerico, si puòapplicare all’esperimento anche un modello alternativo dirappresentazione dei dati detto modello di regressione(polinomiale):
ANOVA AD UNA VIA
(p )Yi = β0 + Σq
s=1 βs Xsi + εi, i=1,...,n,
engh
t
25
20
15
Scatterplot of Strenght vs Cotton%Nel caso dell’esperimento di resistenza alla trazione, assumendo un polinomio di terzo grado, otteniamo un
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 21
Cotton%
Str
e
3530252015
15
10
5
modello empirico che ci consente di stabilire che la percentuale di cotone che massimizza la risposta è attorno al 28-29%.
ANOVA AD UNA VIAIl controllo delle assunzioni attraverso l’analisi deiresidui è una fase importante.Le assunzioni sono riassunte in εij∼IIN(0,σ2), ovvero
1 Normalità1. Normalità2. Varianza costante (omoschedasticità)3. Indipendenza
del termine di errore casuale ε (non osservabile) checompare nel modello di rappresentazione dei dati.I residui sono definiti come .ˆij ij ij ij ie y y y y= − = −
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 22
ovvero come la differenza tra dato osservato e valoreprevisto da modello.Se gli errori rispettassero le assunzioni, i residui (daconsiderare delle realizzazioni della variabile casualeε) “erediterebbero” le stesse proprietà/caratteristiche.
12
99
90
5.0
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for Strenght
ANOVA AD UNA VIA
Residual
Per
cent
5.02.50.0-2.5-5.0
90
50
10
1
Fitted Value
Res
idua
l
20.017.515.012.510.0
2.5
0.0
-2.5
-5.0
4.8 5.0
Histogram of the Residuals Residuals Versus the Order of the Data
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 23
Residual
Freq
uenc
y
6420-2-4
3.6
2.4
1.2
0.0
Observation Order
Res
idua
l
24222018161412108642
2.5
0.0
-2.5
-5.0
L’esito di un esperimento dipende da molti aspetti, inclusoquale tipo di esperimento viene proposto, come saràcondotto, le risorse e la sensitività desiderata.La sensitività si riferisce alla differenza tra le medie che
ANOVA AD UNA VIA
La sensitività si riferisce alla differenza tra le medie chelo sperimentatore desidera mettere in evidenza.Generalmente, al crescere del numero di replichecresce la sensitività nel senso che diventano più facilemettere in evidenza anche piccole differenze tra le medie.Si può pensare di scegliere una dimensione campionariaopportuna per indagare una specifica differenza tra le
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 24
opportuna per indagare una specifica differenza tra lemedie a prefissati e desiderati valori di errore di I e II tipo.Errore di I Tipo: – rifiutare H0 quando è vera (α).Errore di II Tipo: non rifiutare H0 quando è falsa (β).Potenza = 1−β: rifiutare H0 quando è falsa.
13
A questo scopo sono state sviluppate le curve OC(operative caratteristiche) per il modello ad effetti fissi.Un modo molto comune per usare queste carte è definireuna differenza tra due medie d di interesse il minimo
ANOVA AD UNA VIA
una differenza tra due medie d di interesse, il minimovalore di d/σ è
Tipicamente funziona in termini di rapporto tra Φ2: siricercano valori di n fino a che non sia raggiunta la
22
22nDaσ
Φ =
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 25
potenza desiderata.
ANOVA AD UNA VIA
Potenza del test nel caso del test a due campioni.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 26
14
ANOVA AD UNA VIAPotenza del test nel caso del test a due campioni.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 27
d = ⏐ δ ⏐ / σ
ANOVA AD UNA VIAPotenza del test nel caso dell’ANOVA ad una via.
β = 0.10
β ≈ 0.40
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 28
Φ = 2.12, v2 = 12
15
Il metodo dell’analisi della varianza sottopone a verifical’ipotesi di uguaglianza delle medie dei trattamenti (dellemedie degli a livelli del fattore di interesse).Se questa ipotesi viene rigettata, non sappiamo però
CONFRONTI MULTIPLI
quale specifica media differisce (si veda laspecificazione dell’ipotesi alternativa).Stabilire quali specifiche medie differiscono a seguito diuna analisi ANOVA viene chiamato problema deiConfronti Multipli (o Confronti a Coppie).Ci sono diverse per affrontare questo problema.C id i i i t tt il t d d i t t t i
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 29
Consideriamo innanzi tutto il metodo dei t-test a coppiesulle differenze delle medie, chiamato metodo Fisher’sLeast Significant Difference – LSD:
0 =2
j hN a
E
Y YT t
MS n −
−
⋅i i ∼
Si rigetta l’ipotesi nulla H0(jh): µj=µh, j,h=1,…,a; j ≠ h se
È importante notare che quando il numero di confrontiche da realizzare simultaneamente cresce (a aumenta)
/2; /2;| | 2oss N C j h N C Et t y y LSD t MS n− −> ⇒ − > = ⋅ ⋅i iα α
CONFRONTI MULTIPLI
che da realizzare simultaneamente cresce (a aumenta),la probabilità di identificare almeno un falso positivo (untest statisticamente significativo, quando invece è veral’ipotesi nulla H0(jh)), aumenta anch’esso.Questo problema (noto come multiplicity issue –questione della molteplicità) è legato al controllodell’errore di I tipo globale (relativo a tutti i confronti) che
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 30
dell errore di I tipo globale (relativo a tutti i confronti) chetende a crescere all’aumentare del numero di confronti.Allo scopo di superare facilmente il problema, si deveapplicare la cosiddetta correzione di Bonferroni:α*=α/a×(a−1)/2, cioè si utilizza non l’α nominale ma
corretto in modo che l’errore globale sia ≤α.
16
No. of Sim. y11 y21 y31 y41 y12 y22 y32 y42 y13 y23 y33 y43 y1-bar y2-bar y3-bar y-bar SSTreat SSE F 0 p -value check1 69.766 68.348 72.404 70.104 69.52 70.154 68.752 69.022 70.856 69.391 70.579 69.459 70.16 69.36 70.07 69.86 1.52 11.33 0.60 0.57 02 71.372 69.187 70.751 70.032 69.069 69.963 69.595 71.101 69.017 70.627 71.64 67.933 70.34 69.93 69.80 70.02 0.61 13.05 0.21 0.81 03 70.389 70.769 69.088 70.138 69.714 69.854 71.151 70.063 67.638 71.361 70.409 71.842 70.10 70.20 70.31 70.20 0.09 13.43 0.03 0.97 04 68.955 70.158 68.837 70.015 69.312 70.309 69.77 70.547 68.793 70.317 70.007 69.599 69.49 69.98 69.68 69.72 0.50 3.66 0.61 0.56 05 70.729 68.182 72.48 69.227 70.17 71.541 70.261 70.586 69.168 69.275 69.328 70.646 70.15 70.64 69.60 70.13 2.14 13.13 0.74 0.51 06 70 088 69 199 71 592 68 91 71 039 71 452 69 386 69 706 70 099 69 438 70 736 70 151 69 95 70 40 70 11 70 15 0 41 8 23 0 23 0 80 0
CONFRONTI MULTIPLI
6 70.088 69.199 71.592 68.91 71.039 71.452 69.386 69.706 70.099 69.438 70.736 70.151 69.95 70.40 70.11 70.15 0.41 8.23 0.23 0.80 07 70.645 69.306 72.181 69.608 72.025 67.441 69.875 69.108 69.553 70.439 69.757 69.299 70.44 69.61 69.76 69.94 1.54 16.62 0.42 0.67 08 68.873 69.134 70.064 69.596 70.864 68.661 69.872 70.129 70.772 70.766 69.638 70.013 69.42 69.88 70.30 69.87 1.55 4.30 1.62 0.25 09 68.404 71.883 69.832 69.208 69.942 68.029 69.812 69.846 69.16 70.393 69.001 69.561 69.83 69.41 69.53 69.59 0.38 10.34 0.17 0.85 010 69.773 71.273 69.233 69.93 70.873 70.795 70.352 72.419 71.373 70.14 70.84 71.224 70.05 71.11 70.89 70.69 2.50 5.61 2.01 0.19 011 70.531 71.152 69.849 69.304 70.254 71.698 71.459 69.877 69.753 71.691 70.43 69 70.21 70.82 70.22 70.42 0.99 8.25 0.54 0.60 012 68.733 70.244 71.16 68.205 69.138 69.725 70.119 68.39 69.914 69.703 70.951 69.788 69.59 69.34 70.09 69.67 1.16 8.26 0.63 0.55 013 70.909 70.885 70.421 70.894 68.937 70.287 71.363 68.939 70.798 68.961 70.82 69.629 70.78 69.88 70.05 70.24 1.81 6.83 1.19 0.35 014 70.336 68.647 71.108 70.2 69.555 70.926 69.723 69.165 70.571 69.63 69.518 68.078 70.07 69.84 69.45 69.79 0.79 8.10 0.44 0.66 015 71.615 68.202 70.451 69.147 69.636 68.528 70.499 67.774 70.307 69.173 69.631 69.566 69.85 69.11 69.67 69.54 1.20 11.68 0.46 0.64 016 69.135 69.957 70.714 70.449 70.293 70.009 72.263 70.544 70.425 68.38 70.824 69.406 70.06 70.78 69.76 70.20 2.18 8.14 1.21 0.34 017 71.436 70.123 71.512 70.275 70.748 69.109 69.581 71.118 69.585 69.132 71.866 70.581 70.84 70.14 70.29 70.42 1.08 8.75 0.55 0.59 018 69.891 68.729 70.336 68.246 68.899 69.881 69.993 69.877 70.246 70.899 70.378 70.927 69.30 69.66 70.61 69.86 3.67 4.01 4.12 0.05 019 69.731 70.15 69.761 69.744 70.378 69.346 70.651 70.552 71.551 68.908 70.082 71.435 69.85 70.23 70.49 70.19 0.85 5.90 0.65 0.55 020 71.194 70.01 71.634 70.829 71.332 69.999 70.734 71.097 69.437 68.966 71.184 68.394 70.92 70.79 69.50 70.40 4.95 6.78 3.28 0.08 021 71.549 68.581 70.755 69.638 68.305 70.814 69.403 70.589 72.319 71.912 69.575 70.89 70.13 69.78 71.17 70.36 4.22 13.58 1.40 0.30 022 70.477 70.355 68.928 70.944 70.765 70.319 69.549 72.001 70.904 69.34 70.149 70.958 70.18 70.66 70.34 70.39 0.48 7.17 0.30 0.75 023 71.031 70.321 69.518 68.971 70.078 69.801 68.583 69.734 69.372 70.339 70.782 70.055 69.96 69.55 70.14 69.88 0.73 4.81 0.68 0.53 0
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 31
24 69.702 68.845 70.705 69.416 71.434 69.811 71.928 70.289 68.157 70.436 70.969 69.64 69.67 70.87 69.80 70.11 3.45 9.21 1.69 0.24 025 70.001 68.594 69.646 71.155 69.993 71.381 72.179 70.745 67.652 69.393 70.697 69.715 69.85 71.07 69.36 70.10 6.21 10.77 2.60 0.13 026 68.072 70.381 69.37 69.098 66.921 70.523 67.981 70.498 70.286 68.404 70.307 69.109 69.23 68.98 69.53 69.25 0.60 15.25 0.18 0.84 027 69.682 70.344 69.8 70.656 68.781 69.609 68.478 70.903 70.931 70.254 70.234 67.669 70.12 69.44 69.77 69.78 0.92 10.37 0.40 0.68 028 67.321 69.995 69.874 69.159 71.264 69.044 68.961 70.404 70.736 68.72 71.224 69.534 69.09 69.92 70.05 69.69 2.19 12.18 0.81 0.48 029 70.504 71.244 71.268 71.255 71.241 69.642 70.786 71.369 69.074 69.61 70.484 69.826 71.07 70.76 69.75 70.53 3.81 3.30 5.20 0.03 130 69.981 69.19 69.964 69.979 68.836 69.522 71.17 68.36 70.186 70.101 70.209 69.947 69.78 69.47 70.11 69.79 0.82 5.03 0.73 0.51 031 70.45 68.606 69.884 69.549 71.331 70.187 70.876 69.972 70.106 71.078 70.593 69.868 69.62 70.59 70.41 70.21 2.13 3.83 2.50 0.14 032 70.096 69.601 70.207 70.574 70.918 69.601 70.478 69.089 71.305 69.52 68.993 69.893 70.12 70.02 69.93 70.02 0.07 5.48 0.06 0.94 033 69.809 69.719 72.207 71.647 70.253 68.796 69.794 70.678 68.996 70.85 70.094 68.272 70.85 69.88 69.55 70.09 3.61 10.73 1.52 0.27 034 70.679 69.745 69.436 68.978 69.762 69.403 70.577 71.559 67.944 71.022 70.685 70.327 69.71 70.33 69.99 70.01 0.76 10.15 0.34 0.72 0
In alternativa (e con esito ovviamente equivalente), sipuò opportunamente aggiustare il valore del p-value:p* = p ⋅ a×(a−1)/2.L’inconveniente del metodo della correzione di
CONFRONTI MULTIPLI
L inconveniente del metodo della correzione diBonferroni è evidente: al crescere del numero diconfronti a coppie diminuisce la potenza complessivadella procedura e questo a causa di un aumentodell’errore di II tipo.Si dice che la correzione di Bonferroni è eccessivamente
ti ( ti il i tt d l li ll i l
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 32
conservativa (garantisce il rispetto del livello nominalema a discapito della potenza) e questo è causato dalfatto che l’effettivo valore dell’errore family-wise(dell’intera set di verifiche di ipotesi) può risultare anchemolto inferiore al livello prescelto α.
17
Una metodo alternativo (un po’ più potente) è lacosiddetta procedura di Tukey (o Tukey-Cramer) delrange studentizzato:
CONFRONTI MULTIPLI
dove Q è la statistica del range studentizzato, i cuipercentili sono stati tabulati per diversi valori di a e N−a(i gradi di libertà dell’MSE).
max min;=
2 C N CE
Y YQ qMS n −
−⋅
∼
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 33
Si rigetta l’ipotesi nulla H0(jh): µj=µh, j,h=1,…,a; j ≠ h se
( ; )j h Ey y HSD q c N a MS n⇒ − > = − ⋅i i α
( ; )ossq q a N a> − ⇒α
Bonferroni Simultaneous TestsResponse Variable StrenghtAll Pairwise Comparisons among Levels of Cotton%Cotton% = 15 subtracted from:
Difference SE of AdjustedCotton% of Means Difference T-Value P-Value20 5.600 1.796 3.1188 0.054125 7.800 1.796 4.3441 0.0031
Tukey Simultaneous TestsResponse Variable StrenghtAll Pairwise Comparisons among Levels of Cotton%Cotton% = 15 subtracted from:
Difference SE of AdjustedCotton% of Means Difference T-Value P-Value20 5.600 1.796 3.1188 0.038525 7.800 1.796 4.3441 0.0026
CONFRONTI MULTIPLI
30 11.800 1.796 6.5718 0.000035 1.000 1.796 0.5569 1.0000
Cotton% = 20 subtracted from:
Difference SE of AdjustedCotton% of Means Difference T-Value P-Value25 2.200 1.796 1.225 1.000030 6.200 1.796 3.453 0.025135 -4.600 1.796 -2.562 0.1859
Cotton% = 25 subtracted from:
30 11.800 1.796 6.5718 0.000035 1.000 1.796 0.5569 0.9798
Cotton% = 20 subtracted from:
Difference SE of AdjustedCotton% of Means Difference T-Value P-Value25 2.200 1.796 1.225 0.737330 6.200 1.796 3.453 0.018935 -4.600 1.796 -2.562 0.1163
Cotton% = 25 subtracted from:
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 34
Difference SE of AdjustedCotton% of Means Difference T-Value P-Value30 4.000 1.796 2.228 0.375435 -6.800 1.796 -3.787 0.0116
Cotton% = 30 subtracted from:
Difference SE of AdjustedCotton% of Means Difference T-Value P-Value35 -10.80 1.796 -6.015 0.0001
Difference SE of AdjustedCotton% of Means Difference T-Value P-Value30 4.000 1.796 2.228 0.210135 -6.800 1.796 -3.787 0.0091
Cotton% = 30 subtracted from:
Difference SE of AdjustedCotton% of Means Difference T-Value P-Value35 -10.80 1.796 -6.015 0.0001
18
Formalmente, la questione della molteplicità è legata alproblema del controllo degli errori inferenziali di tuttol'insieme della famiglia delle S=a×(a−1)/2 ipotesi nulle.Le procedure per i confronti multipli − MCPs (Multiple
CONFRONTI MULTIPLI
p p p ( pComparisons Procedures) sono metodi dedicati alcontrollo del cosiddetto FWER (Family-wise Error Rate).In senso forte, FWER è la probabilità di rigettare almenouna ipotesi nulla vera Hi contenuta in un sottoinsieme diipotesi nulle S, formalmente:
FWER(S) = Pr (Rigettare almeno una H0i, i ∈ S | H0i è
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 35
( ) ( g 0i, | 0ivera per tutti gli i ∈ S).
Mentre i metodi di Bonferroni e Tukey sono tipicamenteprocedure di tipo single-step, in letteratura sono stateproposte delle procedure MCPs di tipo step-wise che sirivelano più potenti nel controllo dell’FWER.
metodo di Bonferroni-Holm:si ordinano i p-value dal più piccolo al più grande, ovverop(1)<p(2)<…< p(S);il primo p-value p(1) viene testato a livello di significatività
CONFRONTI MULTIPLI
il primo p value p(1) viene testato a livello di significativitàα/S. Se p(1)>α/S la corrispondente ipotesi nulla non puòessere rifiutata e possiamo concludere che anche tuttele altre ipotese nulle sono vere;se p(1)≤α/S si deve proseguire con il secondo p-valueordinato, ma a livello α/(S−1), e così via, e l’s-esimo p-value sarà confrontato con il livello α/(S−s+1) fino a che
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 36
value sarà confrontato con il livello α/(S s+1), fino a cheuna ipotesi nulla non verrà rifiutata (o fino che si arriva alp-value più piccolo).
19
metodo di Bonferroni-Holm-Shaffer:si ordinano i p-value dal più piccolo al più grande, ovverop(1)<p(2)<…< p(S);l’s-esimo p-value deve essere confrontato con il livello di
CONFRONTI MULTIPLI
l s esimo p value deve essere confrontato con il livello disignificatività α/S*, dove S* rappresenta il numeromassimo di possibili ipotesi nulle vere al passo s-esimodella procedura, condizionate al numero di rifiuti ottenutial passo precedente:
Ordered p-value No of groups (C) and of
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 37
No. of groups (C) and of pair-wise comparisons (S) p (1) p(2) p(3) p(4) p(5) p(6) p(7) p (8) p(9) p(10) p (11) p(12) p(13) p(14) p(15)
C = 3 – S = 3 3 1 1 C = 4 – S = 6 6 3 3 3 2 1 C = 5 – S = 10 10 6 6 6 6 4 4 3 2 1 C = 6 – S = 15 15 10 10 10 10 10 7 7 7 6 4 4 3 2 1
BLOCCO E COVARIATABlocco e covariata rappresentano due tipologie di fattoredi disturbo noto di cui è possibile tener debitamenteconto per fare in modo che lo studio sul possibile effettodei fattori di interesse sulla risposta sia condotto in modoappropriato.Blocco: si tratta di un fattore di disturbo noto econtrollabile (quasi sempre di tipo qualitativo) che moltoprobabilmente produce sulla risposta un effetto, che noninteressa però allo sperimentatore. Tuttavia la variabilitàche trasmette alla risposta deve essere minimizzata.Tipici fattori di disturbo/blocco sono: lotti di materiale
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 38
Tipici fattori di disturbo/blocco sono: lotti di materialegrezzo, operatori, provini, attrezzature, il fattoretemporale (turni, giorni, ecc.).La presenza del fattore di blocco incide sul problema dadue punti di vista: 1. in sede di pianificazionedell’esperimento e 2. in sede di analisi statistica dei dati.
20
BLOCCOIl blocco, in sede di pianificazione, rappresenta unarestrizione alla randomizzazione, nel senso che larandomizzazione dovrà essere vincolata in modo tale daessere realizzata indipendentemente per ciascuno dei blivelli del fattore di blocco B.Il fattore di blocco verrà formalmente incluso nel modellostatistico di rappresentazione dei dati (ANOVA una via):
Yijk = µ + τi + βj + εijk,con i=1,...,a, j=1,...,b, k=1,...n.
Quindi, al momento di eseguire l’analisi statistica, unaparte della variabilità totale verrà assegnata all’effetto del
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 39
parte della variabilità totale verrà assegnata all effetto delblocco, e di conseguenza la tabella dell’ANOVA conterràuna riga aggiuntiva in cui si potrà eseguire una formaleverifica di ipotesi sulla significatività del fattore di blocco,ovvero si sottoporrà a verifica l’ipotesi H0B: β1=…=βb=0contro H1B: βj ≠ 0 per almeno un livello j.
BLOCCO
Esempio: per studiare le prestazioni di resistenza di travidi cemento in relazione ai giorni di stagionatura (3,7,28),si utilizzano due distinte macchine (A,B) per laconduzione della prova sperimentale, misurando sup p ,alcuni provini la forza massima di rottura.Modello statistico:
Yijk = µ + τi + βj + εijk i=3,7,28; j=A,B; k=1,…,4Statistica descrittiva:
40000
Boxplot of Forza Max by Stagion
40000
Boxplot of Forza Max by Macchina
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 40
Stagion
Forz
a M
ax
2873
35000
30000
25000
20000
Macchina
Forz
a M
ax
BA
35000
30000
25000
20000
21
BLOCCO
of F
orza
Max
40000
37500
35000
32500
Stagion Macchina
Main Effects Plot (fitted means) for Forza MaxFactor Type Levels ValuesStagion fixed 3 3; 7; 28Macchina fixed 2 A; B
Analysis of Variance for Forza Max
Source DF Seq SS Adj SS Adj MS F P
Mea
n o
2873
30000
27500
25000
BA
99 1000
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for Forza Max
Stagion 2 887893652 887893652 443946826 856.72 0.000Macchina 1 44772836 44772836 44772836 86.40 0.000Error 20 10363813 10363813 518191Total 23 943030301
S = 719.855 R-Sq = 98.90% R-Sq(adj) = 98.74%
Tukey Simultaneous TestsResponse Variable Forza MaxAll Pairwise Comparisons among Levels of StagionStagion = 3 subtracted from:
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 41
Residual
Per
cent
200010000-1000-2000
99
90
50
10
1
Fitted Value
Res
idua
l
40000350003000025000
1000
500
0
-500
-1000
ResidualFr
eque
ncy
10005000-500-1000-1500
8
6
4
2
0
Observation Order
Res
idua
l
24222018161412108642
1000
500
0
-500
-1000
Histogram of the Residuals Residuals Versus the Order of the Data
Difference SE of AdjustedStagion of Means Difference T-Value P-Value7 11670 359.9 32.42 0.0000
28 13856 359.9 38.50 0.0000
Stagion = 7 subtracted from:
Difference SE of AdjustedStagion of Means Difference T-Value P-Value28 2185 359.9 6.072 0.0000
BLOCCONel caso sia pari ad 1 il numero di repliche pertrattamento (definito dalle a×b combinazioni dei livelli delfattore di interesse A e del fattore di blocco B), il modellostatistico di rappresentazione dei dati diventa:
Yij = µ + τi + βj + εij, con i=1,...,a, j=1,...,b.e si parla in questo caso di RCB (RandomizedComplete Block) design.Si consideri uno studio dove si vuole determinare se 4differenti punte (Tip) producono diverse durezze (inmedia) leggendole in un durometro Rockwell. I 4 coupona disposizione sono
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 42
a disposizione sono piuttosto disomogenei,quindi vengono trattati come fattore di blocco(è possibile applicarele 4 punte ad ogni singolo provino).
22
BLOCCODa notare la struttura a due vie dell’esperimento.Ancora una volta, siamo interessati a testarel’uguaglianza delle medie dei trattamenti (punte deipenetratori), ma bisogna rimuovere la variabilitàassociata al fattore di disturbo (blocchi, ovvero i coupon).La variabilità totale deve essere scompostaconsiderando anche il fattore di blocco:
2 2.. . .. . .. . . ..
1 1 1 1
2 2 2
( ) [( ) ( ) ( )]
( ) ( ) ( )
a b a b
ij i j ij i ji j i j
a b a b
i j ij i j
y y y y y y y y y y
b y y a y y y y y y
= = = =
− = − + − + − − + =
+ − + − + − − +
∑∑ ∑∑
∑ ∑ ∑∑
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 43
I gradi di libertà per la somma dei quadrati sono:ab − 1 = (a − 1) + (b − 1) + (a − 1)×(b − 1)
. .. . .. . . ..1 1 1 1
( ) ( ) ( )i j ij i ji j i j
T Trattamenti Blocchi E
y y y y y y y y
SS SS SS SS= = = =
= + +
∑ ∑ ∑∑
BLOCCOI rapporti tra le somme dei quadrati e i rispettivi gdldefiniscono i quadrati medi, e il rapporto tra il quadratomedio dei trattamenti e il quadrato medio dell’erroredefinisce una statistica F che può essere usata pertestare l’ipotesi di uguaglianza delle medie tra gli a livellidel fattore di interesse.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 44
23
BLOCCOFactor Type Levels ValuesTip fixed 4 1; 2; 3; 4Coupon fixed 4 1; 2; 3; 4
Analysis of Variance for HardnessSource DF Seq SS Adj SS Adj MS F PTip 3 0.38500 0.38500 0.12833 14.44 0.001Coupon 3 0.82500 0.82500 0.27500Error 9 0.08000 0.08000 0.00889Total 15 1.29000
S = 0.0942809 R-Sq = 93.80% R-Sq(adj) = 89.66%
Tukey Simultaneous TestsResponse Variable HardnessAll Pairwise Comparisons among Levels of Tip
Tip = 1 subtracted from:Difference SE of Adjusted
Tip of Means Difference T-Value P-Value2 0.0250 0.06667 0.375 0.98093 -0.1250 0.06667 -1.875 0.30284 0.3000 0.06667 4.500 0.0067
Tip = 2 subtracted from:Difference SE of Adjusted
Factor Type Levels ValuesTip fixed 4 1; 2; 3; 4
Source DF Seq SS Adj SS Adj MS F PTip 3 0.38500 0.38500 0.12833 1.70 0.220Error 12 0.90500 0.90500 0.07542Total 15 1.29000
S = 0.274621 R-Sq = 29.84% R-Sq(adj) = 12.31%
10.0Coupon Tip
Main Effects Plot (fitted means) for Hardness
99
90 0.1
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for Hardness
Difference SE of AdjustedTip of Means Difference T-Value P-Value3 -0.1500 0.06667 -2.250 0.18164 0.2750 0.06667 4.125 0.0113
Tip = 3 subtracted from:Difference SE of Adjusted
Tip of Means Difference T-Value P-Value4 0.4250 0.06667 6.375 0.0006
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 45
Mea
n of
Har
dnes
s
4321
9.9
9.8
9.7
9.6
9.5
9.4
4321
Residual
Per
cent
0.20.10.0-0.1-0.2
50
10
1
Fitted Value
Res
idua
l
10.29.99.69.3
0.0
-0.1
Residual
Freq
uenc
y
0.160.120.080.040.00-0.04-0.08-0.12
4.8
3.6
2.4
1.2
0.0
Observation Order
Res
idua
l
16151413121110987654321
0.1
0.0
-0.1
Histogram of the Residuals Residuals Versus the Order of the Data
BLOCCOL’RCB design utilizza un modello additivo: è importantenotare che nessuna interazione tra trattamenti e blocchiè ammessa.La presenza simultanea di due fonti di variabilità didi t b bbli l’ tili di lt i ti l i di idisturbo obbliga l’utilizzo di un ulteriore tipologia di pianosperimentale: il piano a quadrati Latini.Anche in questo caso, una assunzione importante è chei trattamenti e i 2 fattori di disturbo non interagiscono.Esempio di quadrato latino 5×5:
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 46
In caso via siano 3 fattori i blocco, si utilizza il piano aquadrati Greco-Latini.
24
COVARIATASe il fattore di disturbo è noto, osservabile ma noncontrollabile, si può usare l’analisi della covarianza perrimuovere l’effetto del fattore di disturbo dall’analisi.Tipiche covariate sono: temperatura, umidità, ecc. (ingenerale variabili continue che caratterizzano ilgenerale variabili continue che caratterizzano ilcontesto/l’ambiente sperimentale).La presenza di (una o più) covariate non incide nellapianificazione, ma solo nella fase di analisi statistica.Il modello statistico di rappresentazione dei dati diventa:
Yij = µ + τi + Xij γ + εij, con i=1,...,a, j=1,..., n,dove Xij è il valore della(e) covariata(e).in sede di analisi statistica na parte della ariabilità
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 47
in sede di analisi statistica, una parte della variabilitàtotale verrà assegnata all’effetto della covariata e latabella dell’ANOVA conterrà una riga aggiuntiva in cui sipotrà eseguire una formale verifica di ipotesi sullasignificatività della covariata, ovvero si sottoporrà averifica l’ipotesi H0COV: γ =0 contro H1COV: γ ≠ 0.
COVARIATAIn uno studio sulle proprietà meccaniche di un nuovabarra di fibra di carbonio si vogliono confrontare leprestazioni in termini di tensione di rottura rispetto a trediversi fornitori (A,B,C). Nel condurre le prove si è volutotenere conto della massa lineica delle barre, in quanto èpossibile che anche da essa possa dipendere in modorilevante la tensione stessa.
Factor Type Levels ValuesFornitore fixed 3 A; B; CAnalysis of Variance for Tensione rottura
ean
of T
ensi
one
rott
ura
3500
3000
2500
2000
Main Effects Plot (fitted means) for Tensione rottura
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 48
Term Coef SE Coef T PConstant -2198 1113 -1.98 0.055Massa lineica 29.690 6.737 4.41 0.000
Source DF SS MS F PMassa lineica 1 264056 2264056 19.42 0.000Fornitore 2 2649091 1324546 11.36 0.000Error 41 4779190 116566Total 44 7444345
Fornitore
Me
CBA
1500
1000
25
COVARIATAAll Pairwise Bonferroni Simultaneous Comparisons among Levels of Fornitore
Fornitore = A subtracted from:Difference SE of Adjusted
Fornitore of Means Difference T-Value P-ValueB -2473 557.2 -4.438 0.0002C -107 137.5 -0.778 1.0000
Fornitore = B subtracted from:Difference SE of Adjusted
Fornitore of Means Difference T-Value P-ValueC 2366 500.9 4.723 0.0001
Per
cent
99
90
50
Res
idua
l
800
400
0
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for Tensione rottura
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 49
Residual
P
5000-500-1000
10
1
Fitted ValueR
30002750250022502000
-400
-800
Residual
Freq
uenc
y
6004002000-200-400-600-800
10.0
7.5
5.0
2.5
0.0
Observation Order
Res
idua
l
454035302520151051
800
400
0
-400
-800
Histogram of the Residuals Residuals Versus the Order of the Data
Nell’ANOVA a due vie si vuole stabilire se l’effetto dei duefattori di interesse A e B e della loro interazione ha unimpatto significativo sulla risposta.Si definisce interazione la possibile sinergia dei due
ANOVA A DUE VIE
p gfattori che si verifica quando l’effetto del fattore A sullarisposta è diverso a seconda dei livelli del fattore B.Il modello di rappresentazione dei dati è il seguente:
Yijk = µ + τi + βj + (τβ)ij + εijk,con i=1,...,a, j=1,...,b, k=1,...n.
Le analisi inferenziali di interesse corrispondono alle
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 50
verifiche d’ipotesi:H0A: τ1=…=τa=0 contro H1A: τi ≠ 0 per almeno un livello i;H0B: β1=…=βb=0 contro H1B: βj ≠ 0 per almeno un livello j;H0AB: (τβ)11= …=(τβ)ab= 0 contro H1AB: (τβ)ij≠0 per almeno
una combinazione di livelli ij.
26
Ad esempio, in uno studio sui materiali di costruzione vienemisurato lo stato tensionale in relazione allo stato di degradodei mattoni e delle malte. L’obiettivo è stabilire se degradodei mattoni e delle malte, così come la loro interazione,
ANOVA A DUE VIE
2 5Degr. mattoni Degr. malte
Main Effects Plot (fitted means) for Stato tens. [Mpa]
3.0 Degr.
Interaction Plot (fitted means) for Stato tens. [Mpa]
causa una variazione nello stato tensionale. I valori medicampionari della risposta, per ciascun livello dei singoli fattori(main effect plot) e per i 4 trattamenti in questione(interaction plot), possono fornire una preliminareindicazione descrittiva sul problema.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 51
Mea
n of
Sta
to t
ens.
[M
pa]
SINO
2.5
2.0
1.5
1.0
0.5SINO Degr. malte
Mea
n
SINO
2.5
2.0
1.5
1.0
0.5
mattoniNOSI
Per sviluppare una formale verifica di ipotesi, per ciascunadelle tre ipotesi H0 di interesse, è necessario considerare laseguente scomposizione della somma dei quadrati dellarisposta.
ANOVA A DUE VIE
2 2 2... .. ... . . ...
1 1 1 1 1
2 2. .. . . ... .
1 1 1 1 1
( ) ( ) ( )
( ) ( )
a b n a b
ijk i ji j k i j
a b a b n
ij i j ijk iji j i j k
y y bn y y an y y
n y y y y y y
= = = = =
= = = = =
− = − + −
+ − − + + −
∑∑∑ ∑ ∑
∑∑ ∑∑∑
p
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 52
gradi di libertà:1 1 1 ( 1)( 1) ( 1)
T A B AB ESS SS SS SS SSdfabn a b a b ab n
= + + +
− = − + − + − − + −
27
Grazie all’assunzione di normalità del termine di errorecasuale, è possibile considerare tre statistiche test di tipo F,riassunte nella usuale tabella ANOVA.
ANOVA A DUE VIE
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 53
Qualora uno o più p-value fossero inferiori al livello αprefissato, si potrebbe rigettare la corrispondente ipotesi H0e concludere che i relativi effetti sono significativi.
ANOVA A DUE VIESe applichiamo l’analisi inferenziale ANOVA al caso studiosul degrado delle malte otteniamo i seguenti risultati. Fissatoil livello α al 5%, si può concludere che sia il degrado dellemalte, sia quello dei mattoni sia la loro interazione ha un
Factor Type Levels ValuesDegr. mattoni fixed 2 NO; SIDegr. malte fixed 2 NO; SI
Analysis of Variance for Stato tens. [Mpa], using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
qeffetto significativo sullo stato tensionale.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 54
Source DF Seq SS Adj SS Adj MS F PDegr. mattoni 1 0.6765 0.6765 0.6765 56.13 0.000Degr. malte 1 11.8164 11.8164 11.8164 980.45 0.000Degr. mattoni*Degr. malte 1 2.1683 2.1683 2.1683 179.91 0.000Error 12 0.1446 0.1446 0.0121Total 15 14.8058
S = 0.109782 R-Sq = 99.02% R-Sq(adj) = 98.78%
28
ANOVA A DUE VIE
Tukey Simultaneous Tests - Response Variable Stato tens. [Mpa]ll i i i l f i* l
Grazie all’applicazione della procedura dei confronti a coppie(metodo di Tukey) possiamo affermare che tutti i 4 trattamentidifferiscono significativamente tra loro (a livello α=5%).
All Pairwise Comparisons among Levels of Degr. mattoni*Degr. malte
Degr. mattoni = NODegr. malte = NO subtracted from:Degr. Degr. Difference SE of Adjustedmattoni malte of Means Difference T-Value P-ValueNO SI -2.455 0.07763 -31.63 0.0000SI NO -1.147 0.07763 -14.78 0.0000SI SI -2.130 0.07763 -27.44 0.0000
Degr. mattoni = NODegr. malte = SI subtracted from:Degr. Degr. Difference SE of Adjusted
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 55
g g jmattoni malte of Means Difference T-Value P-ValueSI NO 1.3075 0.07763 16.843 0.0000SI SI 0.3250 0.07763 4.187 0.0060
Degr. mattoni = SIDegr. malte = NO subtracted from:Degr. Degr. Difference SE of Adjustedmattoni malte of Means Difference T-Value P-ValueSI SI -0.9825 0.07763 -12.66 0.0000
ANOVA A DUE VIEL’analisi dei residui indica che l’assunzione di normalità deltermine di errore è ragionevole, mentre vi sono delleperplessità sull’assunzione di omogeneità dalla varianza(ipotesi di omoschedasticità).( p )
Residual
Per
cent
0.20.10.0-0.1-0.2
99
90
50
10
1
Fitted Value
Res
idua
l
321
0.2
0.1
0.0
-0.1
-0.2
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for Stato tens. [Mpa]
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 56
Residual
Freq
uenc
y
0.20.10.0-0.1-0.2
4.8
3.6
2.4
1.2
0.0
Observation Order
Res
idua
l
16151413121110987654321
0.2
0.1
0.0
-0.1
-0.2
Histogram of the Residuals Residuals Versus the Order of the Data
29
E’ importante notare che la procedura dell’ANOVA trattaogni fattore come se fosse qualitativo,indipendentemente dal fatto che sia qualitativo oquantitativo.
ANOVA A DUE VIE
qA volte un esperimento può coinvolgere sia fattoriquantitativi che qualitativi.Questo fatto può essere considerato nell’analisistatistica in riferimento ad un modello di regressione, peri fattori quantitativi a ciascun livello (o combinazione deilivelli) dei fattori qualitativi. Si tratta di una analisi
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 57
aggiuntiva (e seguente a quella ANOVA) che può essereimplementata sugli stessi dati sperimentali.Queste curve e/o superfici di risposta sono spesso unaiuto considerevole nell’interpretazione pratica deirisultati.
Si consideri uno studio sulla durata di vita di una batteria infunzione della temperatura di esercizio (fattore A) ed deltipo di materiale utilizzato (fattore B).
ANOVA A DUE VIE
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 58
In questo caso, separatamente per ciascun materiale, èpossibile applicare anche un modello di regressione, ad es.
Yi = β0 + β1 Ti + β1 Ti2 + εi .
30
ANOVA A DUE VIEL’applicazione dell’analisi inferenziale ANOVA a due vie alcaso studio sulla durata della batteria mette in luce i seguentirisultati. Fissato il livello α al 5%, si può concludere che sia ilmateriale sia la temperatura di esercizio, così come la loro
Factor Type Levels ValuesMateriale fixed 3 1; 2; 3Temper fixed 3 15; 70; 125
Analysis of Variance for Batteri, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
pinterazione, hanno un effetto significativo sulla durata dellabatteria.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 59
Source DF Seq SS Adj SS Adj MS F PMateriale 2 10683.7 10683.7 5341.9 7.91 0.002Temper 2 39118.7 39118.7 19559.4 28.97 0.000Materiale*Temper 4 9613.8 9613.8 2403.4 3.56 0.019Error 27 18230.7 18230.7 675.2Total 35 77647.0
S = 25.9849 R-Sq = 76.52% R-Sq(adj) = 69.56%
ANOVA A DUE VIEAnalizzando i main effect e interaction plot (dopo l’analisiinferenziale) possiamo stabilire quale sia il materiale miglioree peggiore e quale sia l’effetto della temperatura (relazioneinversa con la durata). Inoltre si desume che al variare del
150
140
130
Materiale Temper
Main Effects Plot (fitted means) for Durata
150
125
Materiale
3
12
Interaction Plot (fitted means) for Durata
)materiale, l’effetto della temperatura non è lo stesso (ognimateriale ha un proprio profilo di durata in funzione dellatemperatura).
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 60
Mea
n of
Dur
ata
321
130
120
110
100
90
80
70
601257015 Temper
Mea
n
1257015
100
75
50
31
ANOVA A DUE VIEL’analisi dei residui non evidenzia alcuna criticità rispetto alletre assunzioni (normalità, indipendenza edomoschedasticità) sul termine di errore casuale del modello.
Residual
Per
cen
t
50250-25-50
99
90
50
10
1
Fitted Value
Res
idu
al
1501251007550
50
25
0
-25
-50
50
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Histogram of the Residuals Residuals Versus the Order of the Data
Residual Plots for Durata
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 61
Residual
Freq
uenc
y
4530150-15-30-45-60
10.0
7.5
5.0
2.5
0.0
Observation Order
Res
idua
l
35302520151051
50
25
0
-25
-50
ANOVA A DUE VIEDal momento che uno dei due fattori è di tipo quantitativo(temperatura) è possibile stimare una curva di risposta(polinomiale di 2° grado) per ciascuno dei tre materiali. Dairisultati si possono desumere delle importanti indicazioni sul
urat
a
200
150
100
Materiale
3
12
Scatterplot of Durata vs Temper
profili di durata per i tre materiali.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 62
Temper
Du
140120100806040200
50
0
32
In uno studio sulle frodi alimentari, si vuole stabilire se i duefattori “origine della produzione” (due livelli: standard ocommerciale) e “tipo di produzione” (due livelli: allevamentoo pescato) e la loro interazione hanno un impatto
ANOVA A DUE VIE
significativo sulla quantità di grasso nella carne di branzino.I valori medi campionari della risposta, per ciascun livello deisingoli fattori (main effect plot) e per i 4 trattamenti inquestione (interaction plot), possono fornire unapreliminare indicazione descrittiva sul problema.
Origine
Interaction Plot (fitted means) for grasso
Origine Tipo Prod
Main Effects Plot (fitted means) for grasso
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 63
Tipo Prod
Mea
n
PescatoAllevam
6
5
4
3
2
O g eCommStd
Mea
n of
gra
sso
StdComm
6.0
5.5
5.0
4.5
4.0
PescatoAllevam
Origine Tipo Prod
ANOVA A DUE VIESe applichiamo l’analisi inferenziale ANOVA al caso studiosulle frodi alimentari dei branzini otteniamo i seguentirisultati. Fissato il livello α al 5%, si può concludere che sia iltipo di produzione, sia l’origine sia la loro interazione ha un
Factor Type Levels ValuesOrigine fixed 2 Comm; StdTipo Prod fixed 2 Allevam; Pescato
Analysis of Variance for grasso, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
p p geffetto significativo sulla quantità di grasso nella carne.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 64
Source DF Seq SS Adj SS Adj MS F POrigine 1 88.630 93.720 93.720 12.83 0.001Tipo Prod 1 30.892 68.671 68.671 9.40 0.003Origine*Tipo Prod 1 122.552 122.552 122.552 16.78 0.000Error 102 745.100 745.100 7.305Total 105 987.173
S = 2.70276 R-Sq = 24.52% R-Sq(adj) = 22.30%
33
ANOVA A DUE VIEGrazie all’applicazione della procedura dei confronti multiplia coppie (metodo di Tukey) possiamo concludere chesolamente lo standard/pescato differisce (ha meno grasso, siveda l’interaction plot) rispetto agli altri 3 trattamenti, che
Tukey Simultaneous Tests Response Variable grassoAll Pairwise Comparisons among Levels of Origine*Tipo Prod
Origine = Comm, Tipo Prod = Allevam subtracted from:Difference SE of Adjusted
Origine Tipo Prod of Means Difference T-Value P-ValueComm Pescato 0.561 0.6605 0.849 0.8308Std Allevam 0.280 0.7616 0.368 0.9829Std Pescato -3.620 0.7742 -4.676 0.0001
presentano invece tra loro uguale valore medio di grasso.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 65
Origine = Comm, Tipo Prod = Pescato subtracted from:Difference SE of Adjusted
Origine Tipo Prod of Means Difference T-Value P-ValueStd Allevam -0.281 0.7659 -0.367 0.9831Std Pescato -4.181 0.7784 -5.371 0.0000
Origine = Std, Tipo Prod = Allevam subtracted from:Difference SE of Adjusted
Origine Tipo Prod of Means Difference T-Value P-ValueStd Pescato -3.900 0.8659 -4.504 0.0001
ANOVA A DUE VIEL’analisi dei residui indica che l’assunzione di normalità deltermine di errore è ragionevole, mentre qualche perplessitàrimane sull’assunzione di omogeneità dalla varianza (ipotesidi omoschedasticità).
Residual
Per
cent
1050-5-10
99.9
99
90
50
10
1
0.1
Fitted Value
Res
idua
l
65432
10
5
0
-5
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for grasso
)
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 66
Residual
Freq
uenc
y
9630-3-6
24
18
12
6
0
Observation Order
Res
idua
l
1009080706050403020101
10
5
0
-5
Histogram of the Residuals Residuals Versus the Order of the Data
34
ANALISI DELLA VARIANZA MULTIVIA
Modello statistico (3 fattori)
( ) ( ) ( ) ( )⎪
⎪⎪⎨
⎧==
++++++++=k
bjai
Y ijklijkjkikijkjiijkl 21,...,2,1,...,2,1
ετβγβγτγτβγβτµ
Numero di osservazioni totali: abcn
⎪⎪⎩ =
=nlckjijkjkikijjj
,...,2,1,...,2,1
Yijkl è variabile casuale che indica l’ijkl‐esima osservazione µ è il valore atteso totale, è un parametro comune a tutti i livelli
dell’esperimento iτ è l’effetto dell’i‐esimo livello del fattore A
jβ è l’effetto del j‐esimo livello del fattore B
kγ è l’effetto del k‐esimo livello del fattore C
( )ijτβ è l’effetto dell’interazione tra il fattore A e il fattore B
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 67
( )ijβ ( )ikτγ è l’effetto dell’interazione tra il fattore A e il fattore C
( ) jkβγ è l’effetto dell’interazione tra il fattore B e il fattore C
( )ijkτβγ è l’effetto dell’interazione tra il fattore A, il fattore B e il fattore C
ijklε rappresenta la componente dell’errore casuale avente distribuzione
normale con media zero e varianza 2σ .
La procedura di base è simile al caso a due fattori; tutti leabc…k combinazioni dei fattori (trattamenti) , ciascunareplicata n volte, vengono realizzate in ordine casuale.
ANALISI DELLA VARIANZA MULTIVIA
Anche l’analisi ANOVA è simile e si basa sullascomposizione della somma dei quadrati del tipo:
T A B AB AC
ABC AB K E
SS SS SS SS SSSS SS SS
= + + + + ++ + + +
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 68
Per quanto riguarda l’analisi inferenziale, si avrannotante verifiche di ipotesi (cosiddette sugli effetti principali)quanti sono i k fattori, così come si andrà a testare lasignificatività delle interazioni a due, a tre e così via.
35
PIANI 2KLo studio sulle frodi alimentari è un esempio di piano 22,ovvero di piano 2k con k=2. In generale, un piano 2k è uncaso particolare di piano multivia quando si consideranok fattori, ciascuno dei quali su 2 livelli (detti con-venzionalmente “alto”/”basso” o “presenza”/“assenza”venzionalmente alto / basso o presenza / assenza ,rispettivamente per fattori quantitativi o qualitativi).Si noti che il modello di rappresentazione dei dati includek effetti principali, e interazioni a 2 e a 3 e così via.Il piano 2k è particolarmente utile nelle fasi iniziali dellasperimentazione quando è probabile che ci siano moltifattori da analizzare. Dato che tale piano determina un
2k⎛ ⎞⎜ ⎟⎝ ⎠ 3
k⎛ ⎞⎜ ⎟⎝ ⎠
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 69
numero di trattamenti che il minimo valore possibile perlo studio di k fattori, il piano 2k viene ampiamenteutilizzato negli esperimenti di screening.Dato che si considerano solamente due livelli per fattore,si assume implicitamente che la risposta varilinearmente nel range dei livelli scelti del fattore.
Esempio: si consideri il processo di riempimento di unabevanda gasata dove la risposta (differenza dell’altezza dellivello target) è in funzione di 3 fattori, quali A: % dicarbonazione, B: pressione e C: velocità del macchinario.P i d li 8 i li 2
PIANI 2K
Per ciascuno degli 8 trattamenti sono state realizzate n=2repliche.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 70
36
PIANI 2K
Term Effect Coef SE Coef T PConstant 1.0000 0.1976 5.06 0.001A 3.0000 1.5000 0.1976 7.59 0.000B 2 2500 1 1250 0 1976 5 69 0 000
Risultati dell’analisi inferenziale.
B 2.2500 1.1250 0.1976 5.69 0.000C 1.7500 0.8750 0.1976 4.43 0.002A*B 0.7500 0.3750 0.1976 1.90 0.094A*C 0.2500 0.1250 0.1976 0.63 0.545B*C 0.5000 0.2500 0.1976 1.26 0.242A*B*C 0.5000 0.2500 0.1976 1.26 0.242
S = 0.790569 R-Sq = 93.59% R-Sq(adj) = 87.98%
Analysis of Variance for Y (coded units)
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 71
Source DF Seq SS Adj SS Adj MS F PMain Effects 3 68.500 68.500 22.8333 36.53 0.0002-Way Interactions 3 3.500 3.500 1.1667 1.87 0.2143-Way Interactions 1 1.000 1.000 1.0000 1.60 0.242Residual Error 8 5.000 5.000 0.6250Pure Error 8 5.000 5.000 0.6250
Total 15 78.000
PIANI 2KMain effect e interaction plot.
3025 2502004
2
A1012
Interaction Plot (data means) for Y
A
B
C
2
0
4
2
0
12
B2530
Y
2
1
0
A B
Main Effects Plot (data means) for Y
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 72
Mea
n of
1210 3025
250200
2
1
0
C
37
Hold ValuesA 10B 25
Surface Plots of Y
PIANI 2KSurface e contour plot.
30.0
Y
-2
0
27.5
2
B10 11 25.012A
240
Y
-2-101
220 C10 11 20012A
240
Y
-2
-1
0
1
220 C25.0 20027.5 30.0B
C 200
B*A30.0
27.5
C*A
240
220
Y
-1 - 00 - 11 - 2
> 2
< -2-2 - -1
Contour Plots of Y
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 73
12.011.511.010.510.025.0
12.011.511.010.510.0200
C*B
30.027.525.0
240
220
200
Hold ValuesA 10B 25C 200
2
ESEMPIO
PIANI 2K
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 74
38
Negli esperimenti che abbiamo considerato finora i fattorisi assumono come fissi: ciò significa che losperimentatore può fissare a propria scelta i livelli delfattore stesso.
FATTORI FISSI E FATTORI CASUALI
L’analisi inferenziale mira a stabilire se quei specificilivelli del fattore inducono una variazione significativanella risposta.Talvolta invece i livelli dei fattori non possono essereconsiderati fissi, ma sono di fatto estratti casualmente dauna più ampia popolazione di possibili livelli (ad es. alcun
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 75
tra tutti i possibili operatori, laboratori, ecc.).Parliamo in questo caso di fattori casuali. L’obiettivo èstabilire se l’intera popolazione di un dato fattore casualeha un effetto significativo sulla risposta.
FATTORI FISSI E FATTORI CASUALINei disegni con fattori casuali spesso l’obiettivo è anchequello di isolare e stimare la parte della variabilitàimputabile al fattore casuale, separandola dalla variabilitànon controllabile (rappresentata dal termine casuale ε).( pp )Nel caso di un singolo fattore casuale, il modello statisticoè definito come
sia τi sia εi sono assunte variabili casuali, ovvero
1, 2,...,1, 2,...,ij i ij
i ay
j nµ τ ε
=⎧= + + ⎨ =⎩
2 2(0 ) e (0 )IIN IINε σ τ σ
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 76
da cui, la variabilità totale della variabile casuale cherappresenta ciascuna osservazione è data da
(0, ) e (0, )ij iIIN IIN τε σ τ σ∼ ∼
2 2( )ijV y τσ σ= +
39
La variabilità totale delle osservazioni è scomposta in unacomponente che misura la variabilità tra i trattamenti e unache misura la variabilità all’interno dei trattamenti.La verifica di ipotesi sugli effetti di un trattamento individualeè i di i ifi l l i i
FATTORI FISSI E FATTORI CASUALI
è priva di significato, pertanto vengono valutate le ipotesisulle componenti di varianza:
Se σ2τ=0 tutti i trattamenti sono identici; se invece σ2
τ>0 c’èvariabilità tra i trattamenti (e quindi un effetto sulla risposta).
20
21
: 0
: 0
H
Hτ
τ
σ
σ
=
>
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 77
variabilità tra i trattamenti (e quindi un effetto sulla risposta).I valori attesi delle somme dei quadrati portano a
Bisogna quindi valutare la statistica test F con a-1 e N-1gradi di libertà: .0 /Trattamenti EF MS MS=
2 2 2( ) e ( )E TrattamentiE MS E MS n= = + τσ σ σ
Gli stimatori delle componenti della varianza sono:2 2 2
2
ˆ ˆ ˆ e
ˆ
E Trattamenti
Trattamenti E
MS n MSMS MS
= + =
−=
τσ σ σ
σ
FATTORI FISSI E FATTORI CASUALI
Nel caso di due o più fattori (tutti od in parte) di tipocasuale, si possono ricavare opportuni stimatori dellecomponenti della varianza e stimare il peso checiascuna di queste ha sulla variabilità (e quindi sulla
2ˆ E
nMS
=
=
τσ
σ
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 78
ciascuna di queste ha sulla variabilità (e quindi sullaripetibilità) dell’intero sistema/protocollo di misurazione.Si noti che talvolta il metodo di analisi della varianza puòcondurre ad una stima negativa (ovviamente priva disignificato) di un componente della varianza.
40
ESEMPIO: In uno studio sulla ripetibilità di un sistemasperimentale finalizzato all’indagine delle problematicheinerenti alla presenza dei detriti lignei in alveo, si èmisurato il flusso di portata (m3/s) tale da trascinar via i
hi i di hi di i di i i
FATTORI FISSI E FATTORI CASUALI
tronchi, per un campione di tronchi di varie dimensioni(lunghezza, diametro ed estensione delle radici).Per ciascunodei 16 tronchiconsiderati, la provaè stata ripetuta10 volte. [m
^3
/s]
30
28
26
Dot Plot della Portata (Y) [m^3/s] vs ID tronco
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 79
10 volte.
ID tronco
Por
tata
(Y
)
16151413121110987654321
24
22
20
FATTORI FISSI E FATTORI CASUALIFactor Type Levels ValuesID tronco random 16 1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; 13; 14; 15; 16
Analysis of Variance for Portata (Y) [m^3/s], using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F PID tronco 15 554.229 554.229 36.949 37.17 0.000Error 144 143.126 143.126 0.994Total 159 697 355Total 159 697.355
S = 0.996960 R-Sq = 79.48% R-Sq(adj) = 77.34%
Expected Mean Squares, using Adjusted SS
Expected MeanSquare for Each
Source Term1 ID tronco (2) + 10.0000 (1)2 Error (2)
Error Terms for Tests, using Adjusted SS
Per
cent
99.9
99
90
50
Res
idua
l
3.0
1.5
0.0
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for Portata (Y) [m^3/s]
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 80
Synthesisof Error
Source Error DF Error MS MS1 ID tronco 144.00 0.994 (2)
Variance Components, using Adjusted SS
EstimatedSource ValueID tronco 3.5955Error 0.9939
Residual
P
3.01.50.0-1.5-3.0
10
1
0.1
Fitted Value
R
28262422
-1.5
-3.0
Residual
Freq
uenc
y
210-1-2-3
40
30
20
10
0
Observation Order
Res
idua
l
160
150
140
130
120
110
1009080706050403020101
3.0
1.5
0.0
-1.5
-3.0
Histogram of the Residuals Residuals Versus the Order of the Data
41
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀSpesso risulta di interesse validare/studiare un protocollodi laboratorio mediante un esperimento pianificato al finedi studiare/stimare le componenti di variabilità di undeterminato sistema di misurazione. Si parla di ANOVAG R&R (R bili & R d ibili )Gauge R&R (Repeatability & Reproducibility).Per ripetibilità si intende la variazione nelle misure preseda una stessa persona/strumento sulla stessa unità e allestesse condizioni. La ripetibilità è la parte della variabilitàattribuibile al solo errore sperimentale (σ2 relativo ad ε) .Con riproducibilità ci si riferisce invece alla componentedella variabilità che può essere attribuita all’operatore
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 81
della variabilità che può essere attribuita all operatore(inteso quindi come fattore casuale, come se un operatorevenisse “estratto” da una ipotetica popolazione).Nel caso si considerasse anche il fattore laboratorio,saremmo di fronte ad un modello con due fattori casuali,entrambi con un possibile impatto sulla riproducibilità.
Il modello di riferimento per gli studi Gauge R&Rconsiste in un ANOVA a due fattori casuali (parti eoperatore), dove appunto entrambi i fattori sono assuntidelle variabili casuali con distribuzione normale con
l i l i di d i
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ
valore atteso zero e siano tra loro indipendenti:
2 2 2 2
2 2 2 2
( ) ,
1, 2,..., ; 1, 2,..., ; 1, 2,...,( ) , ( ) , [( ) ] , ( )
( )
ijk i j ij ijk
i j ij ijk
y
i a j b k nV V V V
V y
= + + + +
= = =
= = = =
= + + +τ β τβ
µ τ β τβ ε
τ σ β σ τβ σ ε σ
σ σ σ σ
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 82
Le ipotesi di interesse da sottoporre a verifica sono tre:
( )ijkV y = + + +τ β τβσ σ σ σ
2 2 20 0 0
2 2 21 1 1
: 0 : 0 : 0
: 0 : 0 : 0A B AB
A B AB
H H H
H H H
= = =
> > >τ β τβ
τ β τβ
σ σ σ
σ σ σ
42
I valori attesi dei quadrati medi sono:
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ
2 2 20
2 2 2
( )
( )A A A ABE MS n bn F MS MS
E MS n an F MS MS
= + + ⇒ =
= + + ⇒ =τβ τσ σ σ
σ σ σ
Le componenti della varianza possono essere stimateeguagliando i quadrati medi osservati ai loro valori attesi:
0
2 20
2
( )
( )
( )
B B B AB
AB AB AB E
E
E MS n an F MS MS
E MS n F MS MS
E MS
= + + ⇒ =
= + ⇒ =
=
τβ β
τβ
σ σ σ
σ σ
σ
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 83
eguagliando i quadrati medi osservati ai loro valori attesi:2 2
2 2
ˆ ˆ
ˆ ˆ
A AB B AB
AB EE
MS MS MS MSbn an
MS MS MSn
− −= =
−= =
τ β
τβ
σ σ
σ σ
ESEMPIO: uno strumento viene utilizzato per misurareuna dimensione critica di un pezzo. Venti pezzi sonostati scelti casualmente dal processo di produzione e treoperatori, scelti casualmente, misurano per due volte
i
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ
con questo strumento ciascun pezzo.
sura
32.5
30.0
27.5
25.0
Dot Plot of Misura vs Parti; Operatore
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 84
Mis
PartiOperatore
2019181716151413121110987654321
321321321321321321321321321321321321321321321321321321321321
22.5
20.0
17.5
15.0
43
Factor Type Levels ValuesParti random 20 1; 2; ...; 19; 20Operatore random 3 1; 2; 3
Analysis of Variance for Misura, using Adjusted SS for TestsSource DF Seq SS Adj SS Adj MS F PParti 19 1185.425 1185.425 62.391 87.65 0.000Operatore 2 2.617 2.617 1.308 1.84 0.173Parti*Operatore 38 27.050 27.050 0.712 0.72 0.861Error 60 59 500 59 500 0 992
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ
Error 60 59.500 59.500 0.992Total 119 1274.592
S = 0.995825 R-Sq = 95.33% R-Sq(adj) = 90.74%
Expected Mean Squares, using Adjusted SSSource Expected Mean Square for Each Term
1 Parti (4) + 2.0000 (3) + 6.0000 (1)2 Operatore (4) + 2.0000 (3) + 40.0000 (2)3 Parti*Operatore (4) + 2.0000 (3)4 Error (4)
Error Terms for Tests, using Adjusted SSSynthesisof Error nt
99.9
99
90
ual
1
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for Misura
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 85
Source Error DF Error MS MS1 Parti 38.00 0.712 (3)2 Operatore 38.00 0.712 (3)3 Parti*Operatore 60.00 0.992 (4)
Variance Components, using Adjusted SSEstimated
Source ValueParti 10.2798Operatore 0.0149Parti*Operatore -0.1399Error 0.9917
Residual
Per
cen
210-1-2
50
10
1
0.1
Fitted Value
Res
idu
32282420
0
-1
Residual
Freq
uenc
y
1.51.00.50.0-0.5-1.0-1.5
30
20
10
0
Observation Order
Res
idua
l
1201101009080706050403020101
1
0
-1
Histogram of the Residuals Residuals Versus the Order of the Data
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀTwo-Way ANOVA Table With Interaction Source DF SS MS F PParti 19 1185.43 62.3908 87.6470 0.000Operatore 2 2.62 1.3083 1.8380 0.173Parti * Operatore 38 27.05 0.7118 0.7178 0.861Repeatability 60 59.50 0.9917Total 119 1274.59
Two-Way ANOVA Table Without Interaction ySource DF SS MS F PParti 19 1185.43 62.3908 70.6447 0.000Operatore 2 2.62 1.3083 1.4814 0.232Repeatability 98 86.55 0.8832Total 119 1274.59
Gage R&R %ContributionSource VarComp (of VarComp)Total Gage R&R 0.8938 8.02Repeatability 0.8832 7.92Reproducibility 0.0106 0.10
Operatore 0.0106 0.10Part-To-Part 10.2513 91.98Total Variation 11.1451 100.00
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 86
Study Var %Study VarSource StdDev (SD) (6 * SD) (%SV)Total Gage R&R 0.94541 5.6724 28.32Repeatability 0.93977 5.6386 28.15Reproducibility 0.10310 0.6186 3.09
Operatore 0.10310 0.6186 3.09Part-To-Part 3.20176 19.2106 95.91Total Variation 3.33842 20.0305 100.00
Number of Distinct Categories = 4
44
erc
ent
100
50
% Contribution% Study Var
30
25
Components of Variation Misura by Parti
Gage R&R (ANOVA) for Misura
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ
Pe
Part-to-PartReprodRepeatGage R&R0
Sam
ple
Ran
ge
4
2
0
_R=1.15
UCL=3.757
LCL=0
1 2 3
Parti2019181716151413121110987654321
20
Operatore321
30
25
20
R Chart by Operatore
Xbar Chart by Operatore
Misura by Operatore
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 87
Sam
ple
Mea
n
30
25
20
__X=22.39
UCL=24.55
LCL=20.23
1 2 3
Parti
Ave
rage
2019181716151413121110 9 8 7 6 5 4 3 2 1
30
25
20
Operatore123
Xbar Chart by Operatore Operatore * Parti Interaction
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀFinora abbiamo considerato i due fattori operatore e particome crossed, ovvero ciascun operatore misura tutti ipezzi (le parti). Questo schema rappresenta il pianosperimentale standard degli studi R&R.p gTalvolta il fattore operatore può però risultare nidificato(nested) all’interno delle parti (ciascun operatore misuraun singolo pezzo) oppure all’interno di un terzo fattore, adesempio il laboratorio/reparto (un operatore operasolamente all’interno di un dato laboratorio).In presenza di fattori nested il numero di trattamenti e di
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 88
In presenza di fattori nested, il numero di trattamenti e digradi di libertà si calcolano in modo diverso dal casostandard (detto fattori crossed).
45
ESEMPIO: uno studio inter-laboratorio, dove la risposta è ilconteggio delle colonie batteriche aerobiche, è statocondotto in 10 laboratori in ciascuno dei quali 2 analistihanno provato 2 campioni di uno stesso lotto, facendo le
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ
p panalisi in doppio per ogni campione. Quindi, ogni laboratorioha effettuato 2x2x2=8 analisi e il numero totale di prove èpari ad 80. Si tratta di uno studio Gauge R&R con 3 fattori(full nested). Dall’analisi della tabella ANOVA, fissato illivello α=5%, si evince che sia tra laboratori sia tra campioniesiste una differenza significativa.
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 89
Analysis of Variance for Log(counts), using Adjusted SS for TestsSource DF Seq SS Adj SS Adj MS F PLaboratory 9 12.63583 12.63583 1.40398 9.42 0.001Analyst(Laboratory) 10 1.49058 1.49058 0.14906 2.22 0.062Sample(Laboratory Analyst) 20 1.34515 1.34515 0.06726 4.84 0.000Error 40 0.55540 0.55540 0.01389Total 79 16.02695S = 0.117835 R-Sq = 96.53% R-Sq(adj) = 93.16%
STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀVariance Components
% ofSource Var Comp. Total StDevLaboratory 0.157 71.99 0.396Analyst 0.020 9.39 0.143Sample 0.027 12.25 0.163
g(co
unts
)
6.5
6.0
5.5
Dotplot of Log(counts) vs Laboratory; Analyst; Sample
erce
nt
99.9
99
90
50 sidu
al
0.2
0.1
0.0
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Residual Plots for Log(counts)
Error 0.014 6.37 0.118Total 0.218 0.467
Ripetibilità = .014 (6.4%)Riproducibilità = .157 + .020 + .027
= .204(93.6%)
Log
LaboratoryAnalystSample
10987654321
21212121212121212121
2121212121212121212121212121212121212121
5.0
4.5
s)
6.5
Main Effects Plot (data means) for Log(counts)
PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 90
Residual
Pe
0.20.10.0-0.1-0.2
10
1
0.1
Fitted Value
Res
6.56.05.55.04.5
-0.1
-0.2
Residual
Freq
uenc
y
0.20.10.0-0.1-0.2
20
15
10
5
0
Observation Order
Res
idua
l
80757065605550454035302520151051
0.2
0.1
0.0
-0.1
-0.2
Histogram of the Residuals Residuals Versus the Order of the Data
Laboratory
Mea
n of
Log
(cou
nts
10987654321
6.0
5.5
5.0