View
12.447
Download
4
Embed Size (px)
DESCRIPTION
La prueba de los signos es una herramienta útil para hacer pruebas de hp cuando nos encontramos casos como la muestra es pequeña y tenemos datos cualitattivos.
Citation preview
PRUEBA DE LOS SIGNOS
PRESENTACION
INTRODUCCION
CONOCIMIENTOS PREVIOS
PRUEBA DE LOS SIGNOS
CONCLUSION
En las
investigaciones que
realizamos
contamos con una
muestra que nos
permite extraer
(medir) datos para
luego afirmar (o
negar) alguna
característica que
posteriormente la
extenderemos a la
población
De esta manera podemos hacer una
afirmación , por ejemplo que el 70%de los
empresarios leen El Comercio, basados en un
estudio y análisis donde la muestra debe
tener ciertos requerimientos, en especial
cuando estas son cuantitativas.
Pero que pasa cuando el tamaño de la
muestra que queremos analizar es pequeña,
como cuando queremos analizar a los
trabajadores de una pequeña empresa.
Que pasa cuando queremos medir ya no
unos datos cuantitativo sino cualitativo,
como sexo, o alternativas como: bueno,
regular y malo, o un grado: superior,
intermedio e inferior
La estadística no
paramétrica:
1.- Por lo general, son
fáciles de usar y
entender.
2.- Eliminan la
necesidad de
suposiciones
restrictivas de las
pruebas paramétricas.
3.- Se pueden usar con
muestras pequeñas.
4.- Se pueden usar con
datos cualitativos.
Muchas aplicaciones de negocios involucran
opiniones o sentimientos y esos datos se
usan de manera cualitativa. La Estadística
no paramétrica nos facilita el estudio de
estos casos.
Las pruebas
no
paramétricas
son pruebas
estadísticas
que no hacen
suposiciones
sobre la
constitución
de los datos
de la
población.
Por lo general,
las pruebas
paramétricas
son mas
poderosas que
las pruebas no
paramétricas
y deben
usarse
siempre que
sea posible.
Es importante observar, que aunque las
pruebas no paramétricas no hacen
suposiciones sobre la distribución de la
población que se muestrea, muchas veces se
apoyan en distribuciones muestrales como la
normal o la ji cuadrada.
1.- A veces, ignoran, desperdician o pierden
información.
2.- No son tan eficientes como las
paramétricas.
3.- Llevan a una mayor probabilidad de no
rechazar una hipótesis nula falsa
(incurriendo en un error de tipo II).
Ventajas y Desventajas
No tiene requisito previo (ventaja)
Con “n” pequeña (menor de 30) puede no haber
alternativa
Se necesita transformar los valores en rangos
(desventaja)
Rango: valor arbitrario del orden del dato en el
conjunto
Con “n” grande es menos potente que la
paramétrica
Con “n” muy pequeña es inconsistente; no
tabulada (n mayor de 5-6)
A veces es compleja; no aparece siempre en
programas informáticos estándar (desventaja),
pero suele ser más sencilla de aprender y aplicar
incluso ser más directa.
La Mediana 14
Se ha utilizado la media para distribuciones
como la normal y la binomial.
En la estadística no paramétrica el
parámetro de posicionamiento hacia el
centro de la distribución de mayor utilidad
es la Mediana y como medida de dispersión
el Rango o alguna variante de éste.
Una característica importante es que la
distribución de datos debe corresponderse
con el Orden Estadístico. Esto es, con el
número que tiene una variable en un
conjunto de datos ordenados
ascendentemente.
Factoriales
Un factorial se designa con un
número natural positivo seguido
por un signo de exclamación (es
decir 8!). El valor de un factorial
es el producto de todos los
números desde 1 hasta el
número del factorial. Por
ejemplo:
8! = 1*2*3*4*5*6*7*8 = 40,320.
Los factoriales se utilizan para
determinar las cantidades de
combinaciones y permutaciones
y para averiguar probabilidades.
http://www.aaamatematicas.com/sta-factorial.htm
Calculando un factorial cuando se conoce el
valor anterior
Si 9! = 362 880. Entonces:
10! = 10 x 9!
10! = 10 x 362 880 = 3 628 800
http://www.disfrutalasmatematicas.com/numeros/factorial.html
Numero combinatorio
Se tiene un conjunto con 6 objetos
diferentes {A,B,C,D,E,F}, de los cuales se
desea escoger 2 (sin importar el orden de
elección). Existen 15 formas de efectuar
tal elección:
6
Así 2 = 15
Puesto que hay 15
formas de escoger
2 objetos a partir
de un conjunto con
6 elementos
http://es.enc.tfode.com/N%C3%BAmeros_Combinatorios
Pruebas No paramétricas para una
sola muestra
Prueba de los Signos
Se usa para hacer pruebas de
hipótesis acerca de la mediana de
una población.
Ho: La Mediana poblacional es igual
a un valor dado.
Ha: La mediana es menor (mayor ó
distinta) del valor dado.
La prueba estadística está basada en la
distribución Binomial con probabilidad de
éxito p=½, puesto que la probabilidad de
que un dato sea mayor o menor que la
mediana es ½. Para calcularla se
determinan las diferencias de los datos con
respecto al valor dado de la mediana y se
cuentan los signos positivos y negativos.
Ejemplo
Los tiempos de sobrevivencia (en años) de
12 personas que se han sometido a un
trasplante de corazón son los siguientes:
3.1 .9 2.8 4.3 .6 1.4 5.8 9.9 6.3
10.4 0 11.5
Probar con 95% de confianza si los datos del
tiempo de vida después del trasplante
sugieren que la mediana sea distinta de 5.
3,1
0,9
2,8
4,3
0,6
1,4
5,8
9,9
6,3
10,4
0
11,5
El valor 0 nos esta
indicando que la persona no
salió vivo de la operación, el
que vivió más tiempo fue de
11.5 años.
Trasladamos los datos
en una tabla, se debe
observar que personas
con un trasplante de
corazón no es una
muestra que puedes
obtener al azar, por
ello utilizamos la
estadística no
paramétrica.
Proponemos que la mediana es
5, se calculan las diferencias
contra el valor de prueba (cada
dato menos 5).
El resultado de restar las
observaciones menos la
mediana (-5) nos arrojará tanto
números positivos como
negativos.
En el caso de salir 0 hay que
obviar esa observación o dato.
Como el resultado no arroja
ningún cero debemos considerar
todos los datos (12)
3,1 -5 -1,9
0,9 -5 -4,1
2,8 -5 -2,2
4,3 -5 -0,7
0,6 -5 -4,4
1,4 -5 -3,6
5,8 -5 0,8
9,9 -5 4,9
6,3 -5 1,3
10,4 -5 5,4
0 -5 -5
11,5 -5 6,5
3,1 -5 -1,9 (-)
0,9 -5 -4,1 (-)
2,8 -5 -2,2 (-)
4,3 -5 -0,7 (-)
0,6 -5 -4,4 (-)
1,4 -5 -3,6 (-)
5,8 -5 0,8 (+)
9,9 -5 4,9 (+)
6,3 -5 1,3 (+)
10,4 -5 5,4 (+)
0 -5 -5 (-)
11,5 -5 6,5 (+)
Ocupamos otra
columna solo para
señalar los signos,
sean estos positivos
(+) o negativos (-)
Así, para este caso,
tenemos 7 negativos
y 5 positivos.
Como tenemos 12
resultados debemos
evaluar los
resultados (de los
signos)7(-)
(5+)
La prueba se basa
en la distribución
binomial. Ya que
bien sale positivo o
negativo
Para ello podemos
usar la fórmula o
bien emplear una
herramienta de
software.
En este caso :
Probabilidad
binomial para
n= 12, p=0.5
Lo que deseamos saber es qué tan
acertado es encontrar , con 12 datos:
Que 12 sean positivos y 0 negativos
Que 11 sean positivos y 1 negativo
Que 10 sean positivos y 2 negativos
…
Que 0 sean positivos y 12 negativos
El primero y el ultimo son los valores
extremos y, tienen la misma probabilidad:
P(x=12) = P(x=0)
P(x =11) = P(x=1)
La función de probabilidad de la distribución
binomial, también denominada función de la
distribución de Bernoulli, es:
n es el número de pruebas.
k es el número de éxitos.
p es la probabilidad de éxito.
q es la probabilidad de fracaso.
El número combinatorio:
Si p = 0.5 entonces q= 0.5
Para trabajar con:
Debemos recordar que:
12! Es 12x11x10x9x8x7x6x5x4x3x2x1
También es: O:
12x11x10x9x8x7! 12x11!
Son diferentes formas de expresar lo mismo
pero que se puede usar de acuerdo a la
necesidad de relacionarla con otros valores
semejantes.
Recordemos que la formula es:
Para el caso de nuestro ejemplo:
n = 12
k = puede tomar valores de 0 a 12
p = 0.5
q = 05
Cual será la probabilidad de encontrar 12
positivos y 0 negativos o viceversa:
P(x = 12)= 12 0.5¹²x 0.5
12
P(12) = 12! 0.5¹²x 0.5
12! (12-12)!
P(12) = 0.0002
Hay que recordar que en el otro extremo
tenemos 0, y que ambos tienen el mismo
valor, por lo tanto:
P(x = 0) = 0.0002
Para verlo gráficamente,
tenemos que representar una
curva normal en el que se
presenta las 12
observaciones.
0.0002
0.0002
Hasta ahora solo se ha
encontrado la probabilidad
de encontrar 12 o 0 signos
positivos o negativos
Para:
P(x = 11)= 12 0.5¹¹x 0.5¹
11
P(11) = 12! 0.5¹¹x 0.5¹
11! (12-11)!
P(11) = 0.0029 = P(1)
0.0029
0.0029
Podemos seguir hallando las probabilidades
de que se presente otras combinaciones
como :
10 positivos y 2 negativos o viceversa
9 positivos y 3 negativos o viceversa
(…)
Lo recomendable es que se halle los
primeros de los extremos y solo uno de
ellos ya que en ambos lados los valores
son iguales.
La finalidad es probar si la mediana de la
muestra es diferente a la mediana de
prueba.
Esto implica que el valor de p (dentro del
95%) a 0 (Hipótesis nula).
Entonces α = 0.05 (5%)
Debemos sumar las
probabilidades de los extremos
pero no debemos pasarnos de
0.05.
Calculamos la suma de las probabilidades
de los extremos(“colas”) hasta llegar lo más
próximo a 0.05 y podemos ver que los
valores que nos interesan son 0,1,2 y 10,11
y 12
Sumando sus probabilidades,
0.0002+0.0029+0.016+0.016
+0.0029+0.0002=0.0382 nos acercamos a
0.05
Si usamos otro valor nos pasamos. Tiene
que ser por ambos lados
La zona de rechazo esta en los extremos
con los valores: 0,1,2 y 10,11,12
O sea que para que haya diferencia debe
haber 2 o menos o bien10 o más.
Como tenemos7 (-) y 5 (+) concluimos que
no hay diferencia con la mediana (no
podemos rechazar la hipótesis nula de que
no hay diferencia con la mediana).
Teníamos:
Ho: Me = 5
Ha: Me ≠ 5
Por lo tanto: aceptamos la Ho
Interpretación: Las personas que han sido
operadas del corazón tienen una mediana
del tiempo de vida que es de 5 años.