37
INTRODUCCIÓN Dr. Raúl Benito Siche Jara 1 Curso: Métodos Estadísticos para la Investigación ESCUELA ACADÉMICO PROFESIONAL DE INGENIERIA AGROINDUSTRIAL UNIVERSIDAD NACIONAL DE TRUJILLO

Clase 1 - Introducción.pdf

Embed Size (px)

Citation preview

  • INTRODUCCIN

    Dr. Ral Benito Siche Jara

    1

    Curso: Mtodos Estadsticos para la Investigacin

    ESCUELA ACADMICO PROFESIONAL DE INGENIERIA AGROINDUSTRIAL

    UNIVERSIDAD NACIONAL DE TRUJILLO

  • Conocimiento del problema

    Tenga presente la importancia del conocimiento del problema para considerar y explorar modelos provisionales y para saber donde buscar ayuda.

    Mtodos estadsticos para la investigacin 2 Dr. Ral Siche UNT

    INTRODUCCIN

  • El camino hacia la solucin no es nico

    Mtodos estadsticos para la investigacin 3 Dr. Ral Siche UNT

    INTRODUCCIN

  • Sin conocimiento de la ESTRATEGIA es posible jugar

    Sin conocimiento del PROBLEMA es absolutamente imposible hacerlo

    Grupo A

    ESTRATEGIA = ESTADSTICA

    El uso de los mtodos estadsticos ACELERA la convergencia hacia la solucin

    De este modo un BUEN investigador se convierte an en un MEJOR investigador

    Mtodos estadsticos para la investigacin 4 Dr. Ral Siche UNT

    INTRODUCCIN

  • La complejidad

    Temperatura

    Velocidad de alimentacin

    Concentracin

    Catalizador

    Rendimiento

    Contenido de impurezas

    Coste econmico

    PROCESO

    Tiempo

    Mtodos estadsticos para la investigacin 5 Dr. Ral Siche UNT

    INTRODUCCIN

  • El tener en cuenta todas estas posibilidades sita al investigador frente a un DESAFO ABRUMADOR. Las estrategias de realizar la experimentacin por prueba y ajuste, o la de realizar cambiar un factor a la vez hacen que sea poco probable alcanzar un buen resultado rpido y econmicamente.

    El uso del diseo estadstico de experimentos hace posible, ensayar varios factores simultneamente proporcionado una clara imagen de cmo influyen sobre la respuesta tanto aislados como conjuntamente.

    Metodologa de la Investigacin Cientfica 6 Dr. Ral Siche UNT

    INTRODUCCIN

  • El problema

    Peter y Rita desarrollaron una nueva resina de intercambio inico que adsorbe el nitrato contaminante, es ms econmica y fcil de regenerar que las otras resinas actualmente disponibles en el mercado. Desgraciadamente, en condiciones de laboratorio slo se puede preparar en cantidades experimentales. Se ha decidido que sera un buen objetivo el realizar nuevas investigaciones antes de que se pueda fabricar un producto viable comercialmente.

    Mtodos estadsticos para la investigacin 7 Dr. Ral Siche UNT

    INTRODUCCIN

  • Ciclos iterativos de investigacin

    ITERACIN I

    Comentario Peter cree y Rita no - que, si se utiliza una calidad muy pura y ms costosa de la resina se mejorar el rendimiento.

    Pregunta Cmo comparar su resina comn con la de alta pureza ms costosa?

    Respuesta Comparacin de dos tratamientos.

    Descubrimiento El rendimiento de la resina de alta pureza, ms costosa, es prcticamente igual al de la resina comn.

    Mtodos estadsticos para la investigacin 8 Dr. Ral Siche UNT

    INTRODUCCIN

  • Ciclos iterativos de investigacin

    ITERACIN II

    Comentario

    Peter ha descubierto que estaba equivocado respecto a la resina de alta pureza, pero la resina de calidad comn todava le parece prometedora. Por eso ellos deciden comparar las muestras de laboratorio de su nueva resina con cinco resinas estndar disponibles en el mercado.

    Pregunta Cmo comparar su resina comn con las cinco resinas disponibles en el mercado?

    Respuesta Comparacin de dos o ms tratamientos.

    Descubrimiento Las muestras de laboratorio de su nueva resina son tan buenas como las disponibles en el mercado y quizs mejores que alguna de ellas.

    Mtodos estadsticos para la investigacin 9 Dr. Ral Siche UNT

    INTRODUCCIN

  • Ciclos iterativos de investigacin

    ITERACIN III

    Comentario

    Se ha comprobado que la nueva resina funciona tan bien como sus competidoras. Sin embargo, en las condiciones que se ha considerado para realizar una fabricacin econmicamente viable, la eliminacin de nitrato resulta insuficiente para alcanza el valor que establece la normativa aplicable al agua potable.

    Pregunta

    Cules son los factores que ms influyen en la eliminacin de nitrato? Podran mejorar la eliminacin del nitrato algunas modificaciones del equipo que afecten a factores como el caudal, la profundidad del lecho y el tiempo de regeneracin de la resina?

    Respuesta Diseos fraccionados y factoriales.

    Descubrimiento Si se realizan las adecuadas modificaciones del equipo se pueden obtener niveles de nitrato suficientemente bajos.

    Mtodos estadsticos para la investigacin 10 Dr. Ral Siche UNT

    INTRODUCCIN

  • Ciclos iterativos de investigacin

    ITERACION IV

    Comentario La empresa de Peter y Rita llega a la conclusin de que la fabricacin de esa nueva resina es posible y de que podra ser rentable. Para estudiarlo se construye una planta piloto.

    Pregunta Cmo afectan los niveles de las variables del proceso de fabricacin a la calidad y el coste de la nueva resina?

    Respuesta Mtodo de mnimos cuadrados. Modelo multidimensional y ajuste de superficies de respuesta.

    Descubrimiento La investigacin en la planta piloto indica que, si se trabaja en los niveles adecuados de las variables de proceso, se puede fabricar la resina con una calidad satisfactoria y a un coste razonable.

    Mtodos estadsticos para la investigacin 11 Dr. Ral Siche UNT

    INTRODUCCIN

  • Ciclos iterativos de investigacin

    ITERACIN V

    Comentario Antes de que el proceso sea transferido a la fase de produccin deben resolverse los problemas de muestreo y medicin.

    Pregunta Cmo se pueden perfeccionar los mtodos de muestreo y medicin para determinar de forma fiable valores de las caractersticas de la nueva resina?

    Respuesta Fuentes de variacin mltiple

    Descubrimiento

    Es posible identificar y medir los componentes de variabilidad en el muestreo y los anlisis qumicos del producto. Sobre esta informacin se puede elaborar un protocolo de muestreo que minimice la varianza de las determinaciones al mnimo coste.

    Mtodos estadsticos para la investigacin 12 Dr. Ral Siche UNT

    INTRODUCCIN

  • Ciclos iterativos de investigacin

    ITERACIN VI

    Comentario La planta a gran escala no es fcil de controlar.

    Pregunta Cmo se puede alcanzar un mejor control del proceso?

    Respuesta Control de procesos, previsiones y series temporales.

    Descubrimiento Se puede alcanzar un adecuado control del proceso mediante tcnicas de depurado, seguimiento y retroalimentacin simple del proceso.

    Mtodos estadsticos para la investigacin 13 Dr. Ral Siche UNT

    INTRODUCCIN

  • Cada nuevo problema se debe tratar por s mismo y con cierto cuidado. El precipitarse demasiado puede conducir a errores, tales como obtener la solucin CORRECTA del problema EQUIVOCADO.

    Averiguar todo cuanto se pueda del problema. No olvidar el conocimiento no estadstico. Definir los objetivos.

    Qu hacer?

    Mtodos estadsticos para la investigacin 14 Dr. Ral Siche UNT

    INTRODUCCIN

  • Las tcnicas estadsticas son inservibles a menos que se combinen con el apropiado conocimiento del tema al que se aplican y con la experiencia previa.

    ES UN COMPLEMENTO AL CONOCIMIENTO DEL TEMA, NUNCA UN SUSTITUTO

    Mtodos estadsticos para la investigacin 15 Dr. Ral Siche UNT

    INTRODUCCIN

  • Una respuesta apropiada para un problema bien formulado es mucho mejor que una respuesta exacta para un problema aproximado

    John Wilder Tukey (1915-2000), estadstico estadounidense.

    Mtodos estadsticos para la investigacin 16 Dr. Ral Siche UNT

    REFLEXIN

  • Es la variabilidad de una respuesta NO ATRIBUIBLE a influencias conocidas.

    Responsables:

    Error de medicin Variaciones en la materia prima Muestreo Condiciones de trabajo

    ERROR EXPERIMENTAL

    Mtodos estadsticos para la investigacin 17 Dr. Ral Siche UNT

  • Cuando se repite una operacin o un experimento bajo condiciones lo ms similares posible, los resultados obtenidos nunca son totalmente idnticos. La fluctuacin que se observa de una repeticin a otra se denomina ruido, variacin experimental, error experimental o simplemente error.

    ERROR EXPERIMENTAL ERROR DEL EXPERIMENTO

    ERROR EXPERIMENTAL

    Mtodos estadsticos para la investigacin 18 Dr. Ral Siche UNT

  • DISEO DE INVESTIGACIN

    TIPOS

    Experimentales

    - Preexperimentos

    - Cuasi-experimentos

    - Experimentos puros

    Caractersticas Recoleccin de datos en

    un nico momento

    No Experimentales

    Grado de control mnimo

    Grupos intactos

    - Manipulacin intencional de

    variables independientes

    - Medicin de variables dependientes

    - Control y validez

    - Dos o ms grupos

    - Transeccionales

    o transversales

    - Longitudinales

    o evolutivos

    - Manipulacin

    de variables

    Tipos Exploratorios

    Descriptivos

    Correlacionales-causales

    Propsito Analiza cambios a travs

    del tiempo

    Tipos Diseo de tendencias

    Diseos de anlisis

    evolutivo de grupos

    Diseo panel

    Mtodos estadsticos para la investigacin 19 Dr. Ral Siche UNT

  • ANLISIS ESTADSTICO

    Mtodos estadsticos para la investigacin 20 Dr. Ral Siche UNT

  • MEDIDAS DE POSICIN Y DISPERSIN

    Media

    Varianza

    Desviacin Estndar

    Coeficiente de variacin

    Mtodos estadsticos para la investigacin 21 Dr. Ral Siche UNT

  • DISTRIBUCIN NORMAL

    Importancia

    Efecto del lmite central

    Robustez a la no

    normalidad

    Mtodos estadsticos para la investigacin 22 Dr. Ral Siche UNT

  • DISTRIBUCIN NORMAL

    Grficos para determinar una distribucin normal

    Diagrama de Puntos Histograma de Frecuencias

    Mtodos estadsticos para la investigacin 23 Dr. Ral Siche UNT

  • DISTRIBUCIN NORMAL

    Pruebas de Normalidad de una muestra

    Pruebas Grficas

    Pruebas Formales

    Histograma de Frecuencias IQR/S Grficos de Probabilidad normal

    Shapiro Wilk Kolmogorov Smirnov Test de DAgostino

    N < 50 N > 50 N 10

    Mtodos estadsticos para la investigacin 24 Dr. Ral Siche UNT

  • DISTRIBUCIN NORMAL

    Pruebas de Normalidad de una muestra

    Ho = Los datos siguen una distribucin normal Ha = Los datos no siguen una distribucin normal

    p 0.05 p < 0.05

    Pruebas Paramtricas

    Pruebas No Paramtricas Transformacin

    Prueba de Normalidad

    S

    No

    S

    No

    Distribucin normal

    Mtodos estadsticos para la investigacin 25 Dr. Ral Siche UNT

  • DISTRIBUCIN NORMAL

    Muestreo aleatorio, independencia y supuestos

    Sera conveniente que siempre se pudiera admitir el modelo de muestro aleatorio porque ello asegurara la validez de la hiptesis de IID y permitira algunas simplificaciones importantes. Si adems la distribucin comn de probabilidad fuera la normal, estaran Normal, Idntica e independientemente distribuidas (NIID).

    Mtodos estadsticos para la investigacin 26 Dr. Ral Siche UNT

  • DISTRIBUCIN NORMAL

    Robustez al supuesto de la Normalidad

    Aunque muchas tcnicas descritas, implican la suposicin de normalidad, todo lo que requieren para ser tiles es una normalidad aproximada.

    En particular las tcnicas para la comparacin de medias son generalmente robustas a la no normalidad.

    A menos que se advierta especficamente, no debe preocuparse excesivamente sobre la normalidad.

    Mtodos estadsticos para la investigacin 27 Dr. Ral Siche UNT

  • PRUEBAS PARAMTRICAS

    Las PRUEBAS PARAMTRICAS, generalmente requieren para su uso, el SUPUESTO DE NORMALIDAD, es decir, que las muestras aleatorias se extraen de poblaciones que estn normalmente distribuidas, o aproximadamente normal.

    Mtodos estadsticos para la investigacin 28 Dr. Ral Siche UNT

  • PRUEBAS NO PARAMTRICAS

    Las PRUEBAS NO PARAMTRICAS, son mtodos que no suponen nada acerca de la distribucin poblacin muestreada por eso tambin a los mtodos de la estadstica no paramtrica se le llama de distribucin libre. Estos mtodos se basan ms en el anlisis de los rangos de los datos que en las propias observaciones.

    Mtodos estadsticos para la investigacin 29 Dr. Ral Siche UNT

  • PRUEBAS ESTADSTICAS

    Mann Whitney

    (Independientes)

    Pruebas No Paramtricas

    Prueba de Normalidad

    Datos del Experimento

    Distribucin Normal Sin Distribucin Normal

    Shapiro Wilk n < 50

    Kolmogorov Smirnov n 50

    Test de DAgostino n 10

    Transformacin

    Pruebas Paramtricas

    2 muestras k muestras

    Test de

    Tamhane

    Kruskal Walis

    (Independientes)

    Wilcoxon

    (Relacionadas)

    Test de Friedman

    (Relacionadas)

    Comparacin de medias Test de Homogeneidad de

    Varianzas Test de Levene

    Duncan y/o

    Tuckey

    Transformacin

    1 muestra

    Prueba T

    Kruskal Walis

    Test de Friedman

    Si los datos vienen de muestras

    transformadas, se debe

    continuar con estos datos hasta

    el final del anlisis estadstico.

    Si al menos un trat. es

    diferente

    2 muestras

    Prueb T

    (Relacionada)

    Prueb T

    (Independ.)

    Kruskal Walis

    Test de Friedman

    Si al menos un tratamiento es diferente

    2 muestras

    Varianzas

    iguales

    k muestras

    ANOVA

    (1 Factor)

    K muestras

    Varianzas

    distintas

    Mtodos estadsticos para la investigacin 30 Dr. Ral Siche UNT

  • PRUEBAS PARAMTRICAS

    PRUEBA T

    Es la Prueba Paramtrica ms poderosa que existe para determinar diferencia entre dos poblaciones ( tratamientos), sin embargo requiere que los datos pertenezcan a una DISTRIBUCIN NORMAL y que LAS VARIANZAS DE LOS GRUPOS SEAN IGUALES (Existe una prueba T para varianzas distintas).

    ANOVA

    Requiere una DISTRIBUCIN NORMAL MODERADA (ROBUSTA), sin embargo es necesario que se cumpla la IGUALDAD DE VARIANZAS entre las muestras. Caso contrario puede usarse la Prueba de Kruskal-Walsis o el Test de Friedman (No Paramtricas)

    DUNCAN

    Y/O TUCKEY

    Pruebas de Comparaciones mltiples de medias, son robustas a la falta de normalidad, sin embargo requieren que se cumpla la IGUALDAD DE VARIANZAS, caso contrario usar la Prueba Paramtrica de Tamhane.

    TAMHANE

    Pruebas Paramtrica de Comparaciones mltiples de medias, robusta a la falta de normalidad, no requiere que se cumpla la igualdad de varianzas.

    Mtodos estadsticos para la investigacin 31 Dr. Ral Siche UNT

  • PRUEBAS NO PARAMTRICAS

    WILCOXON

    Prueba No Paramtrica, cuya finalidad es la misma que la Prueba T para muestras relacionadas, por lo tanto requiere que los individuos sean los mismos en ambos tratamientos.

    MANN WHITNEY

    Prueba No Paramtrica, cuya finalidad es la misma que la Prueba T para muestras independientes, por lo tanto NO requiere que los individuos sean los mismos en ambos tratamientos.

    FRIEDMAN

    Prueba de Comparacin de medias para ms de 2 poblaciones (tratamientos), cuyos individuo deben haber sido los mismos en todos los tratamientos.

    KRUSKAL

    WALIS

    Prueba de Comparacin de medias para ms de 2 poblaciones (tratamientos), cuyos individuos no necesariamente deben haber sido los mismos en todos los tratamientos.

    Mtodos estadsticos para la investigacin 32 Dr. Ral Siche UNT

  • DISEO DE INVESTIGACIN

    Prueba de Homogeneidad de Varianzas

    Uno de los pasos previos a la comprobacin de si existen diferencias entre las medias de varias muestras es determinar si las varianzas en tales muestras son iguales (es decir, si se cumple la condicin de homogeneidad de varianzas), ya que de que se cumpla o no esta condicin depender la formulacin que empleemos en el contraste de medias.

    Test de Levene (valor de p = 0.05)

    Mtodos estadsticos para la investigacin 33 Dr. Ral Siche UNT

  • DISEO DE INVESTIGACIN

    Anlisis de Varianza (ANOVA)

    Idea bsica Descomponer la variabilidad total en las partes asociadas a

    cada factor, ms una residual (no justificables por los factores estudiados).

    Variabilidad

    total =

    Variabilidad debida a

    diferencias entre

    tratamientos

    +

    Variabilidad residual

    (diferencias dentro

    de cada tratamiento)

    Usos: Determinar si existen diferencias significativas entre tratamiento.

    Evaluar si los factores tienen efecto significativo sobre las respuestas.

    Nivel de significancia = 95% y valor de p = 0.05

    Mtodos estadsticos para la investigacin 34 Dr. Ral Siche

    UNT

  • DISEO DE INVESTIGACIN

    Pruebas Pot Hoc

    Pruebas que permiten determinar diferencias estadsticas entre muestras o tratamientos mltiples (ms de dos).

    Test de Tukey

    (Asumiendo varianzas iguales; p>0.05)

    Test de Tamanhe

    (Asumiendo varianzas no iguales; p

  • DISEO DE INVESTIGACIN

    Otros diseos

    Diseos de Cuadrado Latino

    Diseos Fraccionados

    Diseos de Placket y Burman

    Diseo Compuesto Central Rotable

    Diseo de Mezclas

    Diseos de Taguchi

    Otros

    Mtodos estadsticos para la investigacin 36 Dr. Ral Siche UNT

  • DISEO DE INVESTIGACIN

    Programas a utilizar

    Statistica 7.0

    SPSS v15

    Excel v 2010

    Otros

    Mtodos estadsticos para la investigacin 37 Dr. Ral Siche UNT