18
DISEÑO ESTADÍSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERÍA - MASTER EN ESTADÍSTICA APLICADA - AUTORA: CARMEN MARÍA SÁNCHEZ CAMPOY 1 A A c c t t i i v v i i d d a a d d 5 5 T T e e m m a a 5 5 TRABAJO REALIZADO POR : CARMEN Mª SÁNCHEZ CAMPOY PROFESORES : RAMÓN GUTIÉRREZ SÁNCHEZ MARIA DOLORES RUIZ MEDINA CURSO : DISEÑO ESTADÍSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERÍA - MASTER ESTADÍSTICA APLICADA -

Actividad5 Sanchez Campoy CM

Embed Size (px)

DESCRIPTION

master

Citation preview

  • AAccttiivviiddaadd 55 TTeemmaa55

    TRABAJO REALIZADO POR: CARMEN M SNCHEZ CAMPOY

    PROFESORES: RAMN GUTIRREZ SNCHEZ MARIA DOLORES RUIZ MEDINA

    CURSO: DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA

    - MASTER ESTADSTICA APLICADA -

  • A1. CUESTIONES TERICAS Resolver tres actividades tericas.

    1.- Interpretar la frmula de eficiencia relativa del diseo aleatorizado por bloques. Establecer la relacin existente entre esta frmula y la estimacin de

    2CA derivada.

    La eficiencia relativa mide la efectividad de la bloquizacin para reducir la varianza del error experimental en el diseo de experimentos. En la prctica, la eficiencia relativa se mide para determinar la eficiencia del diseo usado en realidad respecto a otro diseo ms sencillo que pudo usarse. Por ejemplo, el estudio de un experimento puede ser realizado a travs de un diseo aleatorizado por bloques o mediante un diseo completamente aleatorizado, y se puede dar el caso de que no se obtenga la misma sensibilidad. En general, al utilizar un diseo completamente aleatorizado, la MSERROR (suma de cuadrados medios de los errores) podra ser mayor que al utilizar un diseo aleatorizado por bloques; ya que este reduce suficientemente la cantidad de ruido para lograr detectar diferencias significativas entre los tratamientos.

    La comparacin se suele hacer en trminos de eficiencia relativa mediante la frmula: 2

    2( 1)( 3)( 3)( 1)

    b CA CA

    b CA b

    df dfERdf df

    + +=

    + +

    siendo:

    2CA : varianza del error experimental del diseo completamente aleatorizado.

    2b : varianza del error experimental del diseo aleatorizado por bloques.

    CAdf : grados de libertad del error del diseo completamente aleatorizado. CAdf N a= bdf : grados de libertad del error del diseo aleatorizado por bloques. ( 1)( 1)bdf a b=

    En la prctica, se estimar la eficiencia relativa, para comparar ambos diseos, el valor que resulta de esta estimacin se puede interpretar como:

    -- El incremento del nmero de rplicas necesarias que hay que llevar a cabo en un diseo completamente aleatorizado, para que pueda ser usado en lugar de un diseo aleatorizado por bloques, y as mantener la misma sensibilidad en ambos diseos. --

    En la frmula de la eficicencia relativa, se realiza un ajuste sobre la diferencia de grados de libertad entre los dos diseos mediante la razn de grados de libertad que se recoge en la frmula mediante el factor:

    ( 1)( 3) ( 3)( 1)

    b CA

    b CA

    df dffactor de ajustedf df

    + +=

    + +

  • Para estimar la eficiencia relativa, se deben llevar a cabo estimaciones para 2CA y 2b ,

    es decir una vez calculadas las estimaciones de la varianza la frmula quedara de forma:

    2

    2( 1)( 3)( 3)( 1)

    CAb CA

    bb CA

    df dfERdf df

    + +=

    + +

    Estas estimaciones de las varianzas de los errores, puedo obtenerse de la siguiente manera:

    2b ERRORMS

    2 ( 1) ( 1)

    1BLOQUES ERROR

    CAb MS b k MS

    ab

    + =

    siendo:

    ERRORMS la suma de cuadrados medios del error ( 1)( 1)ERROR

    ERRORSSMS

    a b=

    BLOQUESMS la suma de cuadrados medios entre bloques 1BLOQUES

    BLOQUESSS

    MSb

    =

    Si 1ER = , entonces la informacin de los dos diseos es la misma y cada diseo requiere el mismo nmero de rplicas para tener la misma varianza en las medias de los tratamientos Si 1ER > , entonces el diseo aleatorizado por bloques es ms eficiente que el otro diseo. Por ejemplo, si 1.8ER = , entonces el diseo completamente aleatorizado requiere 1.8 veces el nmero de rplicas que el diseo por bloques para tener la misma varianza en la media del tratamiento.

    De forma general, la eficiencia relativa de dos diseos, se define como la razn de la informacin en los dos diseos, siendo su frmula:

    21 2 2

    21 2 1

    ( 1)( 3)( 3)( 1)

    f fER f f

    + +=

    + +

    2.- Deducir las ecuaciones normales que definen los estimadores mnimo-cuadrticos en el modelo lineal de efectos fijos para el diseo aleatorizado por bloques.

    El modelo estadstico considerado viene dado por:

    ij i j ijy = + + + 1,...,i k= 1,...,j b=

    la media general

    i el efecto del i-simo tratamiento

    j el efecto del j-simo bloque ij las componentes de error aleatorio que se suponen

    normalmente distribuidas e independientes.

  • Considerando los efectos fijos, se tiene:

    10

    k

    ii

    =

    = 1

    0b

    jj

    =

    =

    Queremos deducir las ecuaciones normales que definen los estimadores mnimo-cuadrticos en este modelo. El proceso para la obtencin por mnimos cuadrados de los estimadores , i y j para 1,...,i k= 1,...,j b= tiene por objetivo minimizar la suma de los cuadrados de los residuos, que denotamos por L . Partiendo de dicha funcin su expresin viene dada por:

    ( )221 1 1 1

    k n k n

    ij ij i ji j i j

    L y = = = =

    = =

    Para minimizar L , derivamos parcialmente respecto de , 1,...,i i k = y 1,...,j j b = :

    ( )1 1

    2k b

    ij i ji j

    L y

    = =

    =

    ( )1

    2b

    ij i jji

    L y

    =

    =

    1,...,i k=

    ( )1

    2k

    ij i jij

    L y =

    =

    1,...,j b=

    Las ecuaciones normales que definen a los estimadores mnimo-cuadrticos se obtienen igualando las anteriores derivadas a cero:

    ( )1 1

    2 0k b

    ij i ji j

    y = =

    =

    ( )1

    2 0b

    ij i jj

    y =

    = 1,...,i k=

    ( )1

    2 0k

    ij i ji

    y =

    = 1,...,j b= Operando se tiene:

    1 1 1 1 1 1 1 10

    k b k b k b k b

    ij i ji j i j i j i j

    y = = = = = = = =

    =

    1 1 1 10

    b b b b

    ij i jj j j j

    y = = = =

    = 1,...,i k=

    1 1 1 10

    k k k k

    ij i ji i i i

    y = = = =

    = 1,...,j b=

    Las ecuaciones normales quedan de la forma:

  • ..

    1 10

    k b

    i ji j

    y kb b k = =

    =

    .

    10

    b

    i i jj

    y b b =

    = 1,...,i k=

    .

    10

    k

    j i ji

    y k k =

    = 1,...,j b=

    Considerando los efectos fijos, 1

    0k

    ii

    =

    = ;1

    0b

    jj

    =

    = . Entonces se tiene que las

    ecuaciones normales se expresan de la manera siguiente:

    ..

    0y kb =

    .

    0i iy b b = 1,...,i k=

    .

    0j jy k k = 1,...,j b= Luego:

    ..

    kb y =

    .i ib b y + = 1,...,i k=

    .j jk k y + = 1,...,j b=

    3.- Calcular el estimador mnimo-cuadrtico de j , 1,...,j b= en el modelo balanceado por bloques incompletos.

    Sabemos que las ecuaciones normales de mnimos cuadrados para un modelo balanceado por bloques incompletos son:

    ..

    1 1

    a b

    i ji j

    N r k y = =

    + + = (1)

    .

    1

    b

    i jij ij

    r r n y =

    + + = 1,...,i a= (2)

    .

    1

    a

    i jij ji

    k n k y =

    + + = 1,...,j b= (3) Considerando a tratamientos y b bloques, con k tratamientos probados por bloque, repitindose r veces cada tratamiento en el diseo. El nmero total de observaciones es N ar bk= = . El nmero de veces que cada par de tratamientos ocurre en el mismo bloque es:

    ( 1)1

    r ka

    =

  • La descomposicin de la variacin total viene dada por:

    T TRATAMIENTOS CORREGIDA BLOQUE ESS SS SS SS= + + Donde:

    2

    1'

    b

    jj

    BLOQUE

    r QSS

    b=

    =

    con

    '

    . .

    1

    1 aj j ij i

    iQ y n y

    r=

    = 1,...,j b= Teniendo en cuenta lo anterior, queremos calcular el estimador mnimo-cuadrtico de

    j , 1,...,j b= , bajo las condiciones: 0i

    i = 0j

    j = .

    De (1) podemos deducir la siguiente expresin que sustituiremos en (2) y (3):

    ..

    N y = ..

    yN

    =

    Despejamos de (2) i :

    .

    1

    1 1 bi ji ij

    jy n

    r r

    =

    = 1,...,i a=

    Y lo sustituimos en (3) obteniendo la siguiente igualdad: ..

    . .

    1 1

    1 1a bj jij i ij j

    i j

    yk n y n k yN r r

    = =

    + + =

    1,...,j b=

    Haciendo operaciones:

    .. ... .

    1 1

    1 1 1a bm j jij i im ij j

    i mm j

    y yk n y n n k yN r N r r

    = =

    + + =

    1,...,j b=

    .. ... .

    1 1 1 1 1

    1 1 1a a a b am j jij i ij ij im ij j

    i i i m im j

    y yk n y n n n n k yN r N r r

    = = = = =

    + + =

    .. ... .

    1 1 1 1 1

    1 1 1a a b a am j jij ij im ij j ij i

    i i m i im j

    y yk n n n n k y n yN N r r r

    = = = = =

    + =

    Puesto que ijn vale 1 si el tratamiento i ocurre en el bloque j y 0, en caso contrario se tiene la siguiente simplificacin:

    .. ... .

    1 1 1

    1 1a b am j jij im j ij i

    i m im j

    y y kk k n n k y n yN N r r r

    = = =

    + =

    1,...,j b=

  • '

    1

    ( 1)( )b

    j j jmm j

    k b k rk Qr r

    =

    = 1,...,j b=

    Puesto que 0jj

    = podemos hacer lo siguiente:

    '

    1

    ( 1) ( 1) ( 1)( )b

    j j j j jmm j

    k b k r b k r b k rk Qr r r r

    =

    + =

    '( 1)j j

    k b k rk Qr r

    + =

    1,...,j b=

    'j j

    b Qr

    =

    1,...,j b=

    Luego, el estimador mnimo-cuadrtico de j es: '

    j jr Qb

    = 1,...,j b=

    A2. TRABAJO

    Elaborar un resumen sobre alguno de los siguientes puntos:

    DISEO MEDIANTE CUADRADOS DE YOUDEN Un cuadrado Youden I x K es una disposicin de I letras latinas en una matriz

    I x K , con K I< , de tal modo que cada letra aparece una vez en cada columna y a lo sumo una vez en cada fila. Anlogamente podra definirse un cuadrado Youden

    K x I , con K I< . Aunque se denomina cuadrado Youden no es un cuadrado. Podemos plantear el siguiente ejemplo:

    Es un diseo con I tratamientos e 2I unidades experimentales agrupadas en I bloques fila y K I< bloques columna, de tal forma que unidades experimentales en un mismo bloque fila son semejantes, unidades experimentales en un mismo bloque columna son semejantes y unidades experimentales en distintos bloques fila y distintos bloques columna son sustancialmente diferentes.

  • Adems, los bloques columna forman un diseo en bloques completamente aleatorizado y los bloques fila forman un diseo en bloques incompletos balanceados. Cada nivel del factor tratamiento se observa R K= veces (una vez en cada columna y a lo sumo una vez en cada fila). De todo ello podemos deducir la siguiente definicin: Definicin: Un cuadrado de Youden es un diseo en bloques incompletos balanceado y simtrico en el que:

    a) Cada tratamiento ocurre una vez en cada columna. b) La posicin del tratamiento dentro de un bloque indica el nivel del factor secundario correspondiente a las columnas. c) El nmero de rplicas de un tratamiento dado es igual al nmero de tratamientos por bloque.

    PLANTEAMIENTO DEL MODELO El modelo estadstico para este cuadrado es:

    ijk i j k ijky = + + + +

    1,...,i I= ; 1,...,j I= ; 1,...,k K= con K I<

    donde: es la media global. i es el efecto producido por el i-simo tratamiento.

    Dichos efectos estn sujetos a la restriccin: 1

    0I

    ii

    =

    =

    j es el efecto producido por el j-simo bloque. Dichos efectos estn sujetos a la restriccin:

    10

    I

    jj

    =

    =

    k es el efecto producido la k-sima posicin (columna).

    Dichos efectos estn sujetos a la restriccin: 1

    0K

    kk

    =

    =

    Cada posicin ocurre una vez en cada bloque y con cada tratamiento. ijk son variables aleatorias independientes con distribucin N(0, ).

    Este tipo de diseo es adecuado para aquellas situaciones donde no es posible tomar un tamao de bloque tan grande como el nmero de tratamientos en alguno de los dos factores de bloqueo. El anlisis de modelo se realiza de la misma manera que en el diseo en bloques incompletos balanceados, aadindole el clculo de la suma de cuadrados correspondiente a la posicin, estamos ante un cuadrado latino incompleto. Estos diseos fueron estudiados por W.J. Youden de ah su nombre. Youden (1937-1940) desarroll arreglos de Cuadrados Latinos Incompletos.

  • ANALISIS DE LOS TRATAMIENTOS Planteamos el contraste de igualdad del efecto de los tratamientos, cuya hiptesis nula recoge la afirmacin de la falta de significatividad de dichos efectos:

    0 1: 0IH = = =

    En este diseo la variabilidad total SCT se descompone en: *SCT SCTr SCBl SCC SCR= + + +

    donde: *SCTr es la suma de cuadrados ajustada de los tratamientos, cuya expresin coincide con la correspondiente a los diseos en bloques incompletos balanceados, es decir:

    2

    1*

    I

    ii

    K TSCTr

    I=

    =

    con:

    11

    KRI

    =

    iT el total ajustado del i-simo tratamiento, que viene dado por la expresin:

    .. . .

    1

    1 Ii i ij j

    jT y n y

    K=

    = 1,...,i I=

    donde, ..iy se obtiene sumando las observaciones en las que la letra

    latina se ha fijado al nivel i, e . .jy se obtiene sumando las

    observaciones correspondientes al bloque j-simo, y ijn vale uno si el tratamiento i ocurre en el bloque j y cero en caso contrario.

    Por ello se tiene que . .

    1

    1 Iij j

    jn y

    K=

    es el valor medio de los totales de los bloques

    que contienen al tratamiento i-simo. SCBl es la suma de cuadrados de los bloques, que tiene la siguiente expresin:

    22

    ...

    . .

    1

    1 Ij

    j

    ySCBl yK N

    =

    = con N IK=

    SCC es la suma de cuadrados de las columnas, que tiene la siguiente expresin:

    22

    ...

    ..

    1

    1 Kk

    k

    ySCC yI N

    =

    =

    donde ..ky se obtiene sumando las observaciones correspondientes a la

    columna k-sima. SCT es la suma de cuadrados total

  • 22

    ...

    (.)1 1

    I K

    jkj k

    ySCT yN

    = =

    =

    donde 2(.) jky indica la observacin correspondiente a la fila j y la columna k, independientemente de la letra que corresponda. SCR es la suma de cuadrados de los residuos que se obtienen despejando de la igualdad:

    *SCR SCT SCTr SCBl SCC=

    Los grados de libertad correspondientes a cada suma de cuadrados son : 1N

    para SCT 1I

    para *SCTr 1I

    para SCBl 1K

    para SCC 2 2N I K +

    para SCR Para el clculo del estadstico del contraste utilizamos la suma de cuadrados medios ajustada de los tratamientos y la suma de cuadrados medios residual:

    2 2SCRMCR

    N I k=

    +

    **

    1SCTrMSTr

    I=

    Siendo el estadstico del contraste: 0*MCTrF

    MCR=

    Rechazamos la hiptesis nula cuando se cumpla que 0 1, 2 2;I N I KF F +> en cuyo caso podramos aceptar la hiptesis de que los efectos de los tratamientos son significativos.

    ANALISIS DE LOS BLOQUES Podemos contrastar tambin la igualdad del efecto de los bloques:

    0 1: 0IH = = = Para ello la variabilidad total SCT se descompone en:

    *SCT SCTr SCBl SCC SCR= + + +

    donde: SCTr es la suma de cuadrados de los tratamientos, que tiene la siguiente expresin:

    22

    ...

    ..

    1

    1 Ii

    i

    ySCTr yK N

    =

    =

    *SCBl es la suma de cuadrados ajustada de los bloques, que tiene la siguiente expresin:

  • 2

    1*

    I

    jj

    R BSCBl

    I=

    =

    con:

    R es el nmero de veces que cada tratamiento se presenta en el diseo. jB es el total ajustado del j-simo bloque, dado por la siguiente expresin:

    . . ..

    1

    1 Ij j ij i

    iB y n y

    R=

    = 1,...,j I=

    Los grados de libertad correspondientes a estas suma de cuadrados son : 1I

    para SCTr 1I

    para *SCBl Para el clculo del estadstico del contraste utilizamos la suma de cuadrados medios ajustada de los bloques y la suma de cuadrados medios residual:

    2 2SCRMCR

    N I k=

    +

    **

    1SCBlMCBl

    I=

    Siendo el estadstico del contraste: 0*MCBlF

    MCR=

    Rechazamos la hiptesis nula cuando se cumpla que 0 1, 2 2;I N I KF F +> en cuyo caso podramos aceptar la hiptesis de que los efectos de los bloques son significativos.

    Planteamos un ejemplo para ver su aplicacin prctica: Se realiz un experimento para asegurar las resistencias de cuatro tipos de deportivas, de cuatro marcas distintas: Kelme, Adidas, Nike y Puma. Se us un medidor en la cual se probaron las muestras en tres situaciones distintas. Puesto que se conoce que diferentes ejecuciones del experimento dan resultados variables, se decidi hacer cuatro ejecuciones del mismo. Se obtuvieron los siguientes resultados:

    Ejecucin Posicin

    1 2 3 4

    1 A=118 B=127 C=174 D=130

    2 B=136 C=141 D=173 A=170

    3 C=168 D=129 A=126 B=125

    Este ejemplo es considerado como un Cuadrado de YOUDEN, ya que en l se analizan la resistencia de 4 tipos de deportivas, que son consideradas como los tratamientos.

  • Se conoce que las diferentes ejecuciones del experimento dan resultados variables, por lo tanto las 4 ejecuciones se toman como columnas y las 3 posiciones en que se prueban las muestras son tomadas como filas. Se pueden observar que en el experimento cada tratamiento ocurre exactamente una vez en cada columna y cada fila; pero no posee igual nmero de filas y columnas, es por eso que es un Cuadrado Latino que le falta una fila; por lo tanto es un Diseo de Bloques Incompletos, en donde los valores de los parmetros del modelo son:

    4I = tratamientos (Letras Latinas) que coincide con el nmero de bloques3K R= = nmero de tratamientos que se aplican en cada bloque y

    nmero de veces que dos tratamientos aparecen juntos1 23 21 3

    KRI

    = = =

    .

    12N IR= =

    Tenemos los siguientes resultados de las sumas de las observaciones:

    Ejecucin Posicin

    1 2 3 4 y..k

    1 A=118 B=127 C=174 D=130 549

    2 B=136 C=141 D=173 A=170 620

    3 C=168 D=129 A=126 B=125 548

    yi.. 422 397 473 425 y=1717

    y.j. 414 (A) 388 (B) 483 (C) 432 (D)

    2. .jy 171396 150544 233289 186624 741853

    2(.) jkk y 60644 52651 76081 61425 250801

    Realizamos un anlisis de los tratamientos: Las sumas de cuadrados necesarias para el anlisis de la varianza se calculan como sigue:

    *SCT SCTr SCBl SCC SCR= + + +

    Con:

    2

    1 32728,67* 1023, 258

    I

    ii

    K TSCTr

    I=

    = = =

    Donde: 1 2 3 4

    .. . .

    1

    1 Ii i ij j

    jT y n y

    K=

    = -21 -14,33 44,67 -9,33

    2..ky

    301401

    384400

    300304

    986105

  • 2 22

    ...

    . .

    1

    1 1 1717741853 1610, 253 12

    I

    jj

    ySCBl yK N

    =

    = = =

    2 22

    ...

    ..

    1

    1 1 1717986105 852,174 12

    K

    kk

    ySCC yI N

    =

    = = =

    2 22

    ...

    (.)1 1

    1717250801 5126,1712

    I K

    jkj k

    ySCT yN

    = =

    = = =

    * 5126,17 1023.25 1610, 25 852,17 1641, 25SCR SCT SCTr SCBl SCC= = =

    Los cuadrados medios:

    1641,25 547,08

    2 2 3SCRMCR

    N I k= = =

    +

    * 1023, 25

    * 341,081 3

    SCTrMSTrI

    = = =

    Siendo el estadstico del contraste: 0* 547,08 1,6

    341,08MCTrFMCR

    = = =

    Rechazamos la hiptesis nula cuando se cumpla que 0 1, 2 2;I N I KF F +> .

    Si realizamos el contraste al 5% y comparamos el valor del estadstico de contrate con el correspondiente valor de la F terica ( 1, 2 2; 3,3;0.05 9,28I N I KF F + = = ) concluimos que los efectos de los tratamientos no son significativos.

    Realizamos un anlisis de los bloques: Para ello la variabilidad total SCT se descompone en:

    *SCT SCTr SCBl SCC SCR= + + +

    2 22

    ...

    ..

    1

    1 1 1717740047 1008, 253 12

    I

    ii

    ySCTr yK N

    =

    = = =

    2

    1 34334* 1625, 25

    8

    I

    jj

    R BSCBl

    I=

    = = =

    con:

    1 2 3 4

    . . ..

    1

    1 Ij j ij i

    iB y n y

    R=

    = -16,67 -43,67 43,00 17,33

    Los cuadrados medios:

    1641,25 547,08

    2 2 3SCRMCR

    N I k= = =

    +

  • * 1625,25

    * 541,751 3

    SCBlMCBlI

    = = =

    Siendo el estadstico del contraste: 0* 541,75 0,99

    547,08MCBlFMCR

    = = =

    Rechazamos la hiptesis nula cuando se cumpla que 0 1, 2 2;I N I KF F +> . Realizando el contraste al 5% y comparando el valor del estadstico de contrate con el correspondiente valor de la F terica ( 1, 2 2; 3,3;0.05 9,28I N I KF F + = = ) concluimos que los efectos de los bloques no son significativos.

    A3. ANLISIS DE DATOS

    Para realizar el ejercicio, he utilizado el programa SPSS, y creado un archivo ACTIVIDAD5.sav, donde se recogen tres variables ACT_REN (los bloques), DOSIS (los tratamientos) y TOXICIDAD (los niveles de toxicidad heptica observados). Queremos estudiar por un lado si los distintos tratamientos (dosis de paracetamol) influyen en la toxicidad heptica, para ello realizamos un contraste, para analizar la significatividad de dichas dosis, con hiptesis nula:

    0 1 5: 0H = = = Es decir, contrastamos que no hay diferencia en las medias de los cinco tratamientos frente a la alternativa de que al menos una media difiere de otra. Por otro lado, previamente hay que comprobar si la presencia del factor bloque (niveles de actividad renal) afectan a dicha toxicidad. Por ello, realizamos igualmente un contraste para el estudio de la significatividad con hiptesis nula:

    0 1 4: 0H = = =

  • Este experimento se modeliza mediante un diseo en bloques complatmente aleatorizados, siendo dicho modelo: ij i j ijy = + + + 1,...,5i = 1,..., 4j =

    con:

    la media general

    i el efecto del i-simo tratamiento

    j el efecto del j-simo bloque ij las componentes de error aleatorio que se suponen

    normalmente distribuidas e independientes.

    Para resolver los contrastes planteados, realizamos el anlisis en SPSS, mediante la pestaa Analizar/Modelo lineal general/ Univariante , obtenindose la siguiente tabla:

    Puesto que la construccin de bloques se ha diseado para comprobar el efecto de una variable, nos preguntamos si ha sido eficaz su construccin. En caso afirmativo, la suma de cuadrados de bloques explicara una parte sustancial de la suma total de cuadrados. Tambin se reduce la suma de cuadrados del error dando lugar a un aumento del valor del estadstico de contraste experimental utilizado para contrastar la igualdad de medias de los tratamientos y posibilitando que se rechace la Hiptesis nula, mejorndose la potencia del contraste. De la Tabla ANOVA obtenida, el valor del estadstico de contraste de igualdad de bloques, F = 2,994 deja a su derecha un p-valor de 0.073, mayor que el nivel de significacin del 5%, por lo que se aceptara la Hiptesis nula de igualdad de bloques, lo que nos lleva a deducir que el diseo de bloques no es el diseo apropiado para este ejercicio, para evitar esto, podemos considerar un nivel de significacin del 10%. La eficacia de este diseo depende de los efectos de los bloques. Si los efectos de los bloques son muy pequeos, como es el caso, el anlisis de bloque quizs no sea necesario, siendo en algunas situaciones hasta perjudicial. En el diseo por bloques se desea que el valor del estadstico F sea mayor de 3, cuanto ms grande sea F mayor efecto tendr el factor bloque. El valor del estadstico de contraste de igualdad de tratamiento, F = 0,688 deja a su derecha un p-valor de 0.614, mayor que el nivel de significacin del 5%, por lo que se

  • acepta la hiptesis nula de igualdad de tratamientos. As, los tratamientos no influyen en la toxicidad heptica. La salida de SPSS tambin nos muestra que R cuadrado vale 0.494, indicndonos que el modelo explica el 49.4% de la variabilidad de los datos, resultado bastante malo.

    ESTUDIO DE LA IDONEIDAD DEL MODELO

    En este apartado vamos a comprobar que se verifican los supuestos del modelo de regresin lineal (normalidad, homocedasticidad (igualdad de varianzas) y linealidad). Previamente, estudiamos grficamente la interaccin entre el factor bloque y los tratamientos, para ello realizamos el grfico de residuos frente a los valores pronosticados por el modelo. Como el grfico obtenido no presenta ningn aspecto curvilneo se admite que el modelo es aditivo:

    Normalidad Podemos comprobarla de forma grfica o analticamente, grficamente podemos estudiar el grfico probabilstico normal, Para obtener dicho grfico seleccionamos Analizar/Estadsticos descriptivos/Grficos Q-Q... , obtenemos lo siguiente:

  • El Grfico representa las funciones de distribucin terica y emprica de los residuos tipificados. Desviaciones de los puntos del grfico respecto de la diagonal indican alteraciones de la normalidad. Observamos la ubicacin de los puntos del grfico, estos puntos se aproximan ms o menos a la diagonal lo que confirma la hiptesis de normalidad. Lo conformamos de forma analstica mediante el contraste de Kolmogorov-Smirnov:

    Esta tabla muestra la mayor diferencia entre los resultados esperados en caso de que los residuos surgieran de una distribucin normal y los valores observados. Se distingue entre la mayor diferencia en valor absoluto, la mayor diferencia positiva y la mayor diferencia negativa. Se muestra el valor del estadstico Z (0.875) y el valor del p-valor asociado (0.428, mayor que el nivel de significacin 0,05). Por lo tanto no se puede rechazar la hiptesis de normalidad de los residuos.

    Homocedasticidad Comprobamos la hiptesis de homogeneidad de las varianzas para los bloques y los tratamientos con variable dependiente la variable Toxicidad, para ello utilizamos el test de Levene:

    Para los bloques:

    El p-valor es 0.657 por lo tanto no se puede rechazar la hiptesis de homogeneidad de las varianzas. Si observemos el grfico de medias, donde en el eje de ordenadas figuran las medias de los niveles de toxicidad heptica y en el eje de abscisas los bloques, se observa el crecimiento de la grfica conforme aumenta la actividad renal.

  • Para los tratamientos:

    El p-valor es 0.914 por lo tanto no se puede rechazar la hiptesis de homogeneidad de las varianzas. Si observemos el grfico de medias, donde en el eje de ordenadas figuran las medias de los niveles de toxicidad heptica y en el eje de abscisas los tratamientos, se observa que conforme la dosis es mayor la toxicidad heptica tambin, permaneciendo constante desde la dosis 20 hasta que no se aumenta a 35 de paracetamol.

    Independencia de los residuos Observando el diagrama de dispersin de los residuos y las predicciones obtenido anteriormente, no observamos, en dicho grfico, ninguna tendencia sistemtica que haga sospechar del incumplimiento de la suposicin de independencia.