64
UNIDAD Nº 1 INTRODUCCIÓN DEFINICIÓN DE ESTADÍSTICA: La estadística es un área de la matemática aplicada orientada a recolectar, analizar, presentar e interpretar datos cuantitativos, resumiéndolos en tablas, gráficos e indicadores (estadísticos), que permiten la fácil compresión de las características concernientes al fenómeno estudiado; usa además la teoría de la probabilidad para calcular los parámetros de una población. CLASIFICACIÓN DE LA ESTADÍSTICA La estadística se puede clasificar en dos grandes ramas: ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA. Se emplea simplemente para resumir de forma numérica o gráfica un conjunto de datos. Se restringe a describir los datos que se analizan. Si aplicamos las herramientas ofrecidas por la estadística descriptiva a una muestra, solo nos limitaremos a describir los datos encontrados en dicha muestra, no se podrá generalizar la información hacia la población ESTADÍSTICA INFERENCIAL O INDUCTIVA. Permite realizar conclusiones o inferencias, basándose en los datos simplificados y analizados de una muestra hacia la población o universo. Por ejemplo, a partir de una muestra representativa tomada a los habitantes de una ciudad, se podrá inferir la votación de todos los ciudadanos que cumplan los requisitos con un error de aproximación. Muestra Población POBLACIÓN Puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir de cuáles datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se llama población. No debe confundirse la población en sentido demográfico y la población en sentido estadístico. 1

ESTADÍSTICA

Embed Size (px)

Citation preview

Page 1: ESTADÍSTICA

UNIDAD Nº 1 INTRODUCCIÓN

DEFINICIÓN DE ESTADÍSTICA:

La estadística es un área de la matemática aplicada orientada a recolectar, analizar, presentar e interpretar datos cuantitativos, resumiéndolos en tablas, gráficos e indicadores (estadísticos), que permiten la fácil compresión de las características concernientes al fenómeno estudiado; usa además la teoría de la probabilidad para calcular los parámetros de una población.

CLASIFICACIÓN DE LA ESTADÍSTICA

La estadística se puede clasificar en dos grandes ramas:

• ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA.

Se emplea simplemente para resumir de forma numérica o gráfica un conjunto de datos. Se restringe a describir los datos que se analizan. Si aplicamos las herramientas ofrecidas por la estadística descriptiva a una muestra, solo nos limitaremos a describir los datos encontrados en dicha muestra, no se podrá generalizar la información hacia la población

• ESTADÍSTICA INFERENCIAL O INDUCTIVA.

Permite realizar conclusiones o inferencias, basándose en los datos simplificados y analizados de una muestra hacia la población o universo. Por ejemplo, a partir de una muestra representativa tomada a los habitantes de una ciudad, se podrá inferir la votación de todos los ciudadanos que cumplan los requisitos con un error de aproximación. Muestra Población

POBLACIÓN

Puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir de cuáles datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se llama población.

No debe confundirse la población en sentido demográfico y la población en sentido estadístico.

Los datos de la totalidad de una población pueden obtenerse a través de un censo. Sin embargo, en la mayoría de los casos no es posible obtenerlos por razones de esfuerzo, tiempo y dinero, razón por la cual se extrae, de la población, una muestra, mediante un procedimiento llamado muestreo.

MUESTRA

Se llama muestra a un subconjunto de la población, preferiblemente representativo de la misma.

Por ejemplo, si la población es el conjunto de todas las edades de los estudiantes de la provincia de Buenos Aires, una muestra será conjunto de edades de 2000 estudiantes de la provincia de Buenos Aires tomados al azar.

PARÁMETRO

En estadística se llama valor representativo de la población, parámetro estadístico, medida estadística o parámetro poblacional a un valor representativo de una población, como la media

1

Page 2: ESTADÍSTICA

aritmética, la proporción de individuos que presentan determinada característica, o la desviación típica.[

Un parámetro es un número que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.[]

Principales parámetros

Habitualmente se agrupan los parámetros en las siguientes categorías:

Medidas de posición.[]

Se trata de valores de la variable estadística que se caracterizan por la posición que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen:

Las medidas de tendencia central: medias, moda y mediana.

Las medidas de posición no central: (cuartiles, deciles y percentiles).

Medidas de dispersión.

Resumen la heterogeneidad de los datos, lo separados que estos están entre sí. Hay dos tipos, básicamente:

Medidas de dispersión absolutas, que vienen dadas en las mismas unidades en las que se mide la variable: recorridos, desviaciones medias, varianza, desviación típica y meda.

Medidas de dispersión relativa, que informan de la dispersión en términos relativos, como un porcentaje. Se incluyen entre estas el coeficiente de variación, el coeficiente de apertura, los recorridos relativos y el índice de desviación respecto de la mediana.

Medidas de forma.

Su valor informa sobre el aspecto que tiene la gráfica de la distribución. Entre ellas están los coeficientes de asimetría y los de curtosis.

Otros parámetros.

Además, y con propósitos más específicos, existen otros parámetros de uso en situaciones muy concretas, como son las proporciones, los números índice, las tasas y el coeficiente de Gini.

ESTADÍSTICO

Es cualquier característica medible calculada sobre una muestra; más formalmente un estadístico es una función medible que, dada una muestra estadística de valores, les asigna un número, que sirve para estimar determinado parámetro de la distribución de la que procede la muestra. Así, por ejemplo, la media de los valores de una muestra (media muestral) sirve para estimar la media de la población de la que se ha extraído la misma; la varianza muestral podría usarse para estimar la varianza poblacional, etc.[] Esto se denomina como realizar una estimación puntual.

2

Page 3: ESTADÍSTICA

VARIABLE

Es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.

Existen diferentes tipos de variables:SEGÚN LA MEDICIÓN:

Variables cuantitativas

Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.

SEGÚN LA INFLUENCIA

Variables independientes

Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado; en investigación experimental se llama así a la variable que el investigador manipula.

Variables dependientes

Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes.

La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante números. Son caracteres susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario, la edad, etc.

ESCALAS DE MEDICIÓN

Medir significa asignar números a objetos y eventos de acuerdo a reglas. Esta definición es adecuada para el área de ciencias naturales; en el campo de las ciencias sociales medir es el proceso de vincular conceptos abstractos con indicadores empíricos.

La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos de las escalas miden variables categóricas y las otras dos miden variables numéricas. Los niveles de

3

Page 4: ESTADÍSTICA

medición son las escalas nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar en la clasificación de las variables, el diseño de las preguntas para medir variables, e incluso indican el tipo de análisis estadístico apropiado para el tratamiento de los datos.

La escala de medida de una característica tiene consecuencias en la manera de presentación de la información y el resumen. La escala de medición también determina los métodos estadísticos que se usan para analizar los datos. Por lo tanto, es importante definir las características por medir.

a) Escala Nominal.

En este nivel de medición se establecen categorías distintivas que no implican un orden específico. Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas se puede establecer la categoría género con dos niveles, masculino (M) y femenino (F), los respondientes solo tienen que señalar su género, no se requiere de un orden real.

Así, si se asignan números a estos niveles solo sirven para identificación y puede ser indistinto: 1=M, 2=F o bien, se pueden invertir los números sin que afecte la medición: 1=F y 2=M. En resumen en la escala nominal se asignan números a eventos con el propósito de identificarlos. No existe ningún referente cuantitativo. Sirve para nombrar las unidades de análisis en una investigación y es utilizada en cárceles, escuelas, deportes, etc. La relación lógica que se expresa es: (A es diferente de B).

b) Escala Ordinal.

La escala de medición ordinal es cuantitativa porque permite ordenar a los eventos en función de la mayor o menor posesión de un atributo o característica. Por ejemplo, en las instituciones escolares de nivel básico suelen formar por estatura a los estudiantes, se desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. La relación lógica que es: (A es mayor que B). Clasificar a un grupo de personas por la clase social a la que pertenecen implica un orden prescrito que va de lo más alto a lo más bajo. Estas escalas admiten la asignación de números en función de un orden prescrito.

Las formas más comunes de variables ordinales son ítems (reactivos) actitudinales estableciendo una serie de niveles que expresan una actitud de acuerdo o desacuerdo con respecto a algún referente. Por ejemplo, ante el ítem: La economía latinoamericana debe dolarizarse, el respondiente puede marcar su respuesta de acuerdo a las siguientes alternativas:

- Totalmente de acuerdo - De acuerdo - Indiferente - En desacuerdo - Totalmente en desacuerdo

Las anteriores alternativas de respuesta pueden codificarse con números que van del uno al cinco que sugieren un orden preestablecido pero no implican una distancia entre un número y otro. Las escalas de actitudes son ordinales pero son tratadas como variables continuas.

c) Escala de Intervalo.

Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables continuas pero carece de un punto cero absoluto. El ejemplo más representativo de este tipo de medición es un termómetro, cuando registra cero grados centígrados de temperatura indica el

4

Page 5: ESTADÍSTICA

PASO 1Selección y determinación de la población o muestra

PASO 2Obtención de los datos (observación, encuesta,

experimento)

PASO 3Clasificación, tabulación y

organización.

PASO 4Análisis descriptivo

PASO 5Análisis inferencial

(opcional)

PASO 6Informe final

nivel de congelación del agua y cuando registra 100 grados centígrados indica el nivel de ebullición, el punto cero es arbitrario no real, lo que significa que en este punto no hay ausencia de temperatura.

Una persona que en un examen de matemáticas que obtiene una puntuación de cero no significa que carezca de conocimientos, el punto cero es arbitrario por que sigue existiendo la característica medida.

d) Escala de Razón.

Determina la distancia exacta entre los intervalos de una categoría. Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero no existe la característica o atributo que se mide. Las variables de ingreso, edad, número de hijos, etc. son ejemplos de este tipo de escala. El nivel de medición de razón se aplica tanto a variables continuas como discretas.

LA INVESTIGACIÓN ESTADÍSTICA

El proceso de aplicación de la estadística implica una serie de pasos:

1. Selección y determinación de la población o muestra y las características contenidas que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico).

2. Obtención de los datos. Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos.

3. Clasificación, tabulación y organización de los datos. La clasificación incluye el tratamiento de los datos considerados anómalos que pueden en un momento dado, falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos.

4. Análisis descriptivo de los datos. El análisis se complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central, dispersión, posición y forma.

5. Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que involucran elementos probabilísticos que permiten inferir conclusiones de una muestra hacia la población (opcional).

6. Elaboración de conclusiones. Se construye el informe final.

5

Page 6: ESTADÍSTICA

UNIDAD Nº 2DISTRIBUCIÓN DE FRECUENCIAS

DATOS INDIVIDUALES Y DATOS ESTADÍSTICOS

Un dato individual es un dato de un solo individuo, mientras que un dato estadístico es un dato de una muestra o de una población en su conjunto. Por ejemplo, la edad de Juan es un dato individual, mientras que el promedio de edades de una muestra o población de personas es un dato estadístico.

Desde ya, puede ocurrir que ambos no coincidan: la edad de Juan puede ser 37 años, y el promedio de edades de la muestra donde está incluido Juan es 23 años.

Por esta razón un dato estadístico nada dice respecto de los individuos, porque solamente describe la muestra o población.

Los datos estadísticos que describen una muestra suelen llamarse estadísticos (por ejemplo, el promedio de ingresos mensuales de las personas de una muestra), mientras que los datos estadísticos descriptores de una población suelen llamarse parámetros (por ejemplo, el promedio de ingresos mensuales de las personas de una población).

LA MEDICIÓN

Los datos se obtienen a través un proceso llamado medición. Desde este punto de vista, puede definirse medición como el proceso por el cual asignamos una categoría (o un valor) a una variable, para determinada unidad de análisis.

Ejemplo: cuando decimos que Martín es varón, estamos haciendo una medición, porque estamos asignando una categoría (varón) a una variable (género) para una unidad de análisis (Martín).

Se pueden hacer mediciones con mayor o menor grado de precisión. Cuanto más precisa sea la medición, más información nos suministra sobre la variable y, por tanto, sobre la unidad de análisis. No es lo mismo decir que una persona es alta, a decir que mide 1,83 metros.

Ejemplo: Martín es electricista, Elena terminó la secundaria, Juan tiene 32 dientes María tiene 70 pulsaciones por minuto.

Unidad de análisis: Martín, Elena, Juan, María.

Variable: Oficio, Nivel de instrucción, Cantidad de piezas dentarias, Frecuencia cardíaca

Categoría o valor: Electricista, Secundaria Completa, 32, 70

RECOPILACIÓN DE DATOS

Se les llama datos sueltos a los datos recolectados que no han sido organizados numéricamente. Un ejemplo es el conjunto de las estaturas de 100 estudiantes hombres, obtenidas del registro universitario, que está ordenado en forma alfabética.

Una ordenación es un conjunto de datos numéricos en orden creciente o decreciente de magnitud. A la diferencia entre el número mayor y el menor se le conoce como rango de los datos. Por ejemplo si la estatura mayor de los 100 estudiantes es 74 plg., y la menor es 60 plg.; el rango es 74–60=14 plg.

6

Page 7: ESTADÍSTICA

FRECUENCIAS (f). Se denominan frecuencia de un dato estadístico al número de veces u ocasiones que un valor de la variable o una categoría o modalidad del atributo se repite en la investigación.

DISTRIBUCION DE FRECUENCIAS SIMPLES

Si se reúnen grandes cantidades de datos sueltos es útil distribuirlos en clases o categorías y determinar el número de individuos que pertenecen a cada categoría, a lo que se le llama frecuencia de clase. A una disposición tabular de los datos por clases, con sus correspondientes frecuencias de clase, se le conoce como distribución de frecuencia o tabla de frecuencias.

REGLAS GENERALES PARA CONSTRUIR DISTRIBUCIONES DE FRECUENCIA.

1. Determinar el número mayor y el menor en los datos sueltos con el fin de especificar el rango (la diferencia entre ambos).

2. Dividir el rango en un número adecuado de intervalo de clase del mismo tamaño. Si esto no es posible, usar intervalos de clase de distintos tamaños o intervalos de clase abiertos. Se suelen tomar entre 5 y 20 intervalos de clase, según los datos. Los intervalos de clase se eligen también de modo tal que las marcas de clase (o puntos medios) coincidan con los datos realmente observados. Ello tiende a disminuir el llamado error de agrupamiento que se produce en análisis matemáticos posteriores. No obstante, las fronteras de clase no debieran coincidir con los datos realmente observados.

3. Determinar el número de observaciones que corresponden a cada intervalo de clase; es decir, hallar las frecuencias de clase.

DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE

Se preguntó la edad (variable años) de 10 estudiantes de la P.U.C.E. (frecuencias), las respuestas fueron las siguientes:

X1 = 25 X2 = 21 X3 = 22 X4 = 28 X5 = 23X6 = 20 X7 = 22 X8 = 23 X9 = 18 X10 = 18

Debemos recordar que Xi es la característica cuantitativa, observada en cada unidad investigada, donde el subíndice i, sólo indica el orden en que se obtiene la información: 1, 2, 3,...,10. Entonces los datos originales obtenidos en la investigación sobre la edad (variable años) de los estudiantes frecuencias se expresan así:

Edad (años): 25, 21, 22, 28, 23, 20, 22, 23, 18, 18

n = total de datos de la muestra. Los datos presentados así, no nos permite ninguna interpretación del fenómeno investigado; por lo tanto lo procedente es organizar estos datos en una serie estadística de variable.

Primeramente debemos identificar la variable con su nombre, (Edad), luego simboliza en la categoría en que se está midiendo (años) y ordenar los valores que adopta en una secuencia de menor a mayor. Posteriormente procedemos a identificar a los elementos de la Investigación (estudiantes) que vendrían a ser las frecuencias (f); es decir el número que adoptan la variable, que equivale al número de estudiantes de administración que tienen una determinada edad.

7

Page 8: ESTADÍSTICA

Edad (Años) Alumnos (f)20 122 123 125 128 232 133 135 136 1

n = 10

Podemos observar que existen 2 alumnos de 28 años de edad.

DISTRIBUCIÓN DE FRECUENCIAS DE ATRIBUTO.

Con los mismos alumnos también se investigó su Estado Civil (Atributo). Las respuestas obtenidas (Modalidades) son las siguientes:

Estado Civil (A1): A1 = Soltero, A2 = Casado, A3 = Unión Libre, A4 = Divorciado A5 = Soltero, A6 = Soltero, A7 = Casado, A8 = Soltero, A9 = Unión Libre, A10 = Casado

Estado Civil (Ai) Alumnos (f)Casados 3Divorciados 1Solteros 4Unión Libre 2

n = 10

Observamos que los alumnos investigados nos indican que existen 4 estudiantes de estado civil solteros.

FRECUENCIA RELATIVA SIMPLE (fr). Son los valores proporcionales mayores que cero y menores que uno (0 < fr < 1). Se los calcula dividiendo cada frecuencia absoluta simple para el total de datos (f ÷ n). Necesariamente la suma de las frecuencias relativas simples es igual a la unidad (fr = 1). Generalmente las frecuencias relativas se las elabora con dos decimales.

Cargas Familiares de los Empleados de la Universidad Católica febrero del 2011.

Hijos f Fr1 8 0.112 12 0.173 30 0.435 14 0.207 6 0.09

Total 70 1.00

FRECUENCIA ACUMULADA (fa). Sus valores se los obtiene de las acumulaciones sistemáticas de las frecuencias simples, donde necesariamente la primera frecuencia acumulada es igual a la primera frecuencia simple (f = f1), y la última frecuencia acumulada es igual al total de datos (fn = n).

8

Page 9: ESTADÍSTICA

Cargas Familiares de los Empleados de la Universidad Católica febrero del 2009.

Hijos f fr fa1 8 0.11 82 12 0.17 203 30 0.43 505 14 0.20 647 6 0.09 70

Total 70 1

INTERPRETACIÓN DE LA TABLA DE FRECUENCIAS

Interpretación de las Frecuencias Simples. Para interpretar las frecuencias se lo hace según el orden de las filas y de derecha a izquierda sin considerar a las relativas, ya que éstas son sólo la base para determinar los porcentuales.

La tercera fila de las frecuencias simples nos indica, que el 43% de los empleados investigados son 30 (f) de ellos tienen 3 cargas familiares (Hijos).

Interpretación de las Frecuencias Acumuladas. Al igual que las simples, las acumuladas también se las interpreta de derecha a izquierda, y en lo que respecta al valor de la variable, y a partir de la segunda fila se utiliza la frase “desde hasta”, es decir, desde el primer valor que adopta la variable hasta el valor que está en dirección de la fila que se interpreta.La cuarta fila de las frecuencias acumuladas de los empleados investigados que son de 64 de ellos (fa) tienen desde 1 hasta cinco cargas familiares (hijos).

DISTRIBUCIÓN DE FRECUENCIAS DE DATOS AGRUPADOS EN INTERVALOS DE CLASE

Es menester que esta técnica de organización de los datos es aplicable cuando la variable investigada tiene una gran variación; es decir adopta una gran cantidad de valores diferentes, que volvería improcedente organizados como datos no agrupados, pues se presentaría columnas tan largas que además que la serie no presentaría Visión de Conjunto, generalidad del fenómeno estudiado, se complicaría el tratamiento matemático de los datos.

A continuación se enumeran los pasos a seguir para construir una distribución de frecuencias de datos agrupados en intervalos de clase.

1. Decidir el número de intervalos (m). Cabe indicar que no existe una forma única de decidir cuántos intervalos debemos formar en la distribución, otra forma de calcular la cantidad de intervalos es usando las siguientes fórmulas:

m=√nm=1+3 , 32 log n2k≥n

m = Número de intervalos.n = Total de datos de la población o muestra.k = Primer exponente positivo de 2 que hace que la potencia sea mayor o igual que n.

Otra manera de decidir el número de intervalos, es guiarse en la tabla que se muestra a continuación, la misma que puede dar una orientación adecuada en la mayoría de casos.

9

Page 10: ESTADÍSTICA

Número de Observaciones Número de clases Recomendado20 – 50 651 – 100 7101 – 200 8201 – 500 9501 – 1000 10Más de 1000 11 – 20

2. Determinar el rango o recorrido (R). Se determina el valor máximo y el valor mínimo que toma la variable.

La diferencia que hay entre el valor máximo y el valor mínimo se denomina rango o recorrido.

3. Calcular el ancho de cada intervalo (i). Una vez determinado el número de intervalos y el rango se calcula a la amplitud (ancho) del intervalo (i). Dicho valor constante se obtiene aplicando la fórmula siguiente:

i=Xmax−Xmin

m= R

m

i = Ancho del intervaloR = Rangom = Número de intervalos

Cuando i no es múltiplo del número de intervalos se aproximaría siguiendo las reglas del redondeo, si realiza esta operación altera el valor del rango. Si recordamos que m fue fijado y no se debe cambiar, por lo tanto el incremento debe ser distribuido proporcionalmente, sumando unas unidades al límite superior y restándole al límite inferior (observe bien en el ejercicio).

Ejemplo:

En la siguiente tabla se da los pesos, en libras de 150 docentes de la Universidad Católica.

158 176 165 179 168 159 119 162 176 168 184 173 175 169 173 170179 177 178 175 176 174 173 184 191 179 174 177 163 179 187 168158 180 181 160 176 171 179 160 163 176 178 178 170 175 173 181175 168 177 176 176 178 169 176 186 175 184 180 162 178 188 165171 176 189 178 161 183 175 171 171 187 177 172 168 186 174 180178 174 181 163 182 177 165 176 186 177 189 168 188 181 177 175189 171 177 166 184 189 175 183 180 181 166 179 188 185 178 176164 185 179 178 176 176 186 171 176 175 177 179 176 180 183 184180 172 188 165 179 184 186 187 170 167 176 182 188 186 170 178171 181 190 172 165 193

SOLUCIÓN.

Encontramos el número de intervalos aplicando la fórmula de Sturges, pero esta fórmula es conservadora, para lo cual hay que aproximar al inmediato superior al número de intervalos necesarios para agruparlos.

10

Page 11: ESTADÍSTICA

m = 1 + 3.3 log nm = 1 + 3.3 log 150m = 1 +3.3*2.18m = 1 +7.19m = 8.19m ¿ 8

Encontramos el Rango o Recorrido, observando el valor máximo y restando el valor mínimo.

R = Xmáx – Xmín

R = 193 – 158R = 35

Con estos dos valores encontramos el ancho del intervalo o la amplitud del intervalo, dividiendo el rango para el número de intervalos.

i=358

i=4 ,375i≈5

AJUSTE DEL RECORRIDO O RANGO

Para facilitar los cálculos se aproximó a 5; por lo tanto se altera el valor el rango. Si recordamos que m que fijado y no se debe cambiar, se tendrá:

i≈5R '=5×8R '=40

Este nuevo Rango se resta del original.

40 – 35 = 5; este resultado se suma y se resta proporcionalmente al límite inferior (se resta) al límite superior (se suma), proporcionalmente.

Se resta al límite Inferior: Se suma al límite Superior:

158 – 2 = 156193 + 3= 196

Luego tenemos ya otros valores esto es máximo y mínimo con el cual otro Rango o Recorrido, es decir: 196 – 156 = 40

Luego la amplitud del intervalo se tiene: 8Con estos datos procedemos a elaborar la tabla, recordando que el recuento de los datos se debe hacer aparte, ya que en la tabla no entra el recuento.

La marca de clase Xm se encuentra sumando los límites y dividiendo para dos

11

Page 12: ESTADÍSTICA

PESO DE 150 DOCENTES DE LA PUECE SEDE SANTO DOMINGO

Libras f fr fa Xm %fr %fa156 – 160 6 0,040 6 158 4 4161 – 165 12 0,080 18 163 8 12166 – 170 14 0,093 32 168 9,3 21,3171 – 175 27 0,180 59 173 18 39,3176 – 180 51 0,340 110 178 34 73,3181 – 185 19 0,127 129 183 12,7 86186 – 190 19 0,127 148 188 12,7 98,7191 – 195 2 0,013 150 193 1,3 100Total 150 1

El gobierno municipal realiza un programa de concientización sobre el uso racional del agua, en un sector de clase media. Para conocer la efectividad de dicho programa, se realizó un muestreo a familias de cuatro integrantes y se observó la reducción de consumo de agua. El número de familias encuestadas fue de 40 y se obtuvieron los datos en m

2.2 3.5 3.2 3.0 3.4 3.1 3.8 4.7 2.5 3.42.9 3.9 3.3 3.7 3.2 1.9 4.7 3.2 3.9 4.24.1 4.5 3.7 2.6 1.6 3.3 3.1 3.7 4.3 3.63.3 3.1 3.1 4.4 4.1 3.4 3.8 2.6 3.0 3.5

Primero calculamos el rango: R = 4,7 – 1,6 = 3,1

Calculamos el número de intervalos (m), se utilizará la fórmula: m = 2k > n

m = 26 > 40m = 64 > 40m = 6Calculamos el ancho del intervalo (i):

i= Rm

i=3,16

i = 0.5166666666...

Obtenemos el ancho del intervalo aumentando a un número que de tal forma sea divisible exactamente para el número de intervalos, pero sin tomar en cuenta el decimal, para luego este resultado dividir para 10, es decir:

i=366

=6

i= 610

=0,6

Se obtiene la diferencia entre el Rango real y el Rango teórico

12

Page 13: ESTADÍSTICA

R = 3,6 – 3,1 = 0,5Este valor es el incremento, mismo que se divide para dos y cuyo resultado se suma a límite superior y se resta al límite inferior.

Ls = 4,7 + 0,25= 4,95Li = 1.6-0.25 = 1.35 Luego se procede armar el número de intervalos, iniciando con 1,35, así.

M 3 f Xm fr fa % fr % fa1.35 – 1.95 2 1.65 2/40 = 0,050 2 5% 51.95 – 2.55 2 2.25 2/40 = 0,050 2 + 2 = 4 5% 102.55 – 3.15 9 2.85 9/40 = 0,225 4 + 9= 13 22,5% 32.53.15 – 3.75 15 3.45 15/40 = 0,375 13 + 15 = 28 37,5% 703.75 – 4.35 8 4.05 8/40 = 0,200 28 + 8 = 36 20% 904.35 – 4.95 4 4.65 4/40 = 0,100 36 + 4 = 40 10% 100

Total 40 1,00 100%

EJERCICIOS:

Elaborar tablas de distribución de frecuencias con los siguientes datos

8 9 11 13 13 15 15 17 20 22 24 25 26 27 28 28 29 31 32 3233 34 34 34 35 35 36 36 37 38 38 38 39 39 41 42 43 44 47 48

Estas son los puntajes obtenidos por los 75 candidatos que se presentaron a un concurso:

12 12 13 13 14 16 16 16 16 17 17 18 19 19 21 24 25 25 26 27 28 28 29 32 33

34 34 36 37 37 37 38 38 38 42 42 43 43 43 46 47 47 50 50 50 51 51 52 53 54

55 56 58 58 59 61 62 62 62 63 64 65 66 68 71 72 74 75 77 81 84 88 92 94 98

En una cierta ciudad, se registra el número de nacimientos ocurridos por semana durante las 52 semanas del año, siendo los siguientes los datos obtenidos:

6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 9 10 10 10 11 11 11 11 11 11 1212 12 12 12 12 12 13 13 13 13 14 14 14 15 15 15 15 16 16 16 17 17 18 18 18 19

Los socios de una cooperativa de viviendas tienen las siguientes edades:

20 21 21 21 23 24 27 27 27 27 28 28 28 29 30 30 32 33 33 3435 35 35 35 38 38 38 38 39 39 39 40 40 41 41 41 42 42 42 4343 44 45 45 45 47 47 47 48 48 48 49 49 50 51 52 53 53 53 5353 54 54 54 55 56 56 57 57 58 59 60 60 60 60 61 63 63 63 66

Se aplicó una prueba de inteligencia a 75 alumnos, obteniéndose los siguientes datos:

82 87 87 88 89 91 91 92 93 94 94 95 96 97 98 99 99100

100

101

101

101

102

102

103

103

104

104

105

105

105

106

107

107

108

108

108

108

108

109

110

111

112

112

113

113

114

114

114

114

115

115

115

116

117

118

118

118

122

123

124

125

127

129

130

131

132

132

132

135

138

140

141

141

145

13

Page 14: ESTADÍSTICA

En un diagnóstico de educación física se pidió a los alumnos de los cuartos medios que hicieran abdominales durante 3 minutos. Se obtuvieron los siguientes resultados:

23 27 28 28 29 32 33 33 34 34 34 34 34 34 34 36 37 37 37 38

38 38 38 38 40 41 41 42 42 43 43 43 43 43 43 44 44 44 44 45

45 45 45 45 45 46 47 48 49 54 54 54 56 56 57 57 60 61 62 62

UNIDAD Nº 3REPRESENTACIÓN GRÁFICA

HISTOGRAMA

En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.

Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.

Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Procedimiento para construir el histograma

1. Encontrar las frecuencias de clase.2. Dibujar y rotular los ejes

2.1. El eje vertical representa las frecuencias, por tanto en él se rotularán números naturales, dependiendo su valor y escala del número de datos que se han tomado.

2.2. El eje horizontal representa la magnitud de la característica medida por los datos. Este eje se divide en tantos segmentos iguales como clases se hayan definido.

3. Dibujar el Histograma3.1. Dibujar las barras verticales correspondientes a cada clase. Su base está situada en el eje

horizontal y su altura corresponderá a la frecuencia de la clase representada.4. Rotular el Gráfico

4.1. Poner el título, las condiciones en que se han recogido los datos, etc. Estas notas ayudan a los demás a interpretar el gráfico y sirven de recordatorio de la fuente de los datos. Ejemplo: Resultados de las mediciones de las estaturas de un grupo de estudiantes.

Procedimiento para construir el polígono de frecuencias u ojiva.

1. Elaborar la tabla de frecuencias acumuladas menor que y mayor que.

2. Dibujar y rotular los ejes2.1. El eje vertical representa las frecuencias acumuladas y se

rotularán números naturales, dependiendo su valor y escala del número de datos que se han tomado.

14

Altura (pulgadas)Número de estudiantes

Mayor que 74,5 100

Mayor que 71,5 92

Mayor que 68,5 65

Mayor que 65,5 23

Mayor que 62,5 5

Mayor que 59,5 0

Page 15: ESTADÍSTICA

3. Dibujar el polígono, partiendo de 0% hasta llegar al 100% en el caso de la ojiva menor que y/o partiendo de 100% hasta llegar a 0% si la ojiva es mayor que.

Altura (pulgadas)

Número de estudiantes

Menor que 59,5 0Menor que 62,5 5Menor que 65,5 23Menor que 68,5 65Menor que 71,5 92Menor que 74,5 100

Un gráfico que muestre las frecuencias acumuladas menores o mayores que cualquier límite real superior de clase trazado sobre los límites reales superiores de clase se llama polígono de frecuencias acumuladas u ojiva.

UNIDAD Nº 4MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

MEDIA ARITMÉTICA

En matemática y estadística, la media aritmética (también llamada promedio o simplemente media), de un conjunto finito de números, es igual a la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muéstrales.

Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación.

Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos

15

Men

or q

ue 5

9,5

Men

or q

ue 6

2,5

Men

or q

ue 6

5,5

Men

or q

ue 6

8,5

Men

or q

ue 7

1,5

Men

or q

ue 7

4,5

0

20

40

60

80

100

120

Altura (pulgadas)Fr

ecue

cias

acu

mul

adas

May

or q

ue 7

4,5

May

or q

ue 7

1,5

May

or q

ue 6

8,5

May

or q

ue 6

5,5

May

or q

ue 6

2,5

May

or q

ue 5

9,5

0

50

100

150

Altura (pulgadas)

Frec

uenc

ias A

cum

ulad

as

Page 16: ESTADÍSTICA

sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable.

También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no es necesariamente la mitad.

Una de las limitaciones de la media es que se ve afectada por valores extremos; valores muy altos tienden a aumentarla mientras que valores muy bajos tienden a bajarla, lo que implica que puede dejar de ser representativa de la población.

MEDIA PONDERADA

Se denomina media ponderada de un conjunto de números al resultado de multiplicar cada uno de los números por un valor particular para cada uno de ellos, llamado su peso y obteniendo a continuación la media aritmética del conjunto formado por los productos anteriores.

Se utiliza la media ponderada cuando no todos los elementos componentes de los que se pretende obtener la media tienen la misma importancia.

Para una serie de datos

X = {x1, x2,..., xn}

A la que corresponden los pesos

W = {w1, w2,..., wn}

La media ponderada se calcula como:

X=∑ x i wi

∑ wi

X=x1 w1+x2w2+x3w3+. ..+xn wn

w1+w2+w3+ .. .+wn

Un ejemplo es la obtención de la media ponderada de las notas de una oposición en la que se asigna distinta importancia (peso) a cada una de las pruebas de que consta el examen.MEDIA GEOMÉTRICA

En matemática y estadística, la media geométrica de una cantidad arbitraria de números (digamos n números) es la raíz n–ésima del producto de todos los números.

x=n√∏

i=1

n

xi=n√ (x1) (x2) . . . (xn )

Por ejemplo, la media geométrica de 2 y 18 es

2√2×18=2√36=6

Otro ejemplo, la media de 1, 3 y 9 sería

3√1×3×9=3√27=3

MEDIA ARITMÉTICA, PONDERADA Y GEOMÉTRICA PARA DATOS AGRUPADOS

16

Page 17: ESTADÍSTICA

Se procede de la misma manera que con los datos simples pero considerando las marcas de clase y las frecuencias de cada una de ellas.

MEDIANA

En el ámbito de la estadística, una mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.

Existen dos estrategias para calcular la mediana: considerando los datos en forma individual, sin agruparlos, o bien utilizando los datos agrupados en intervalos de clase. Veamos cada una de ellas.

DATOS SIN AGRUPAR

Sean x1, x2, x3,…,xn los datos de una muestra ordenada en orden creciente y designando la mediana como Me, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posición n + 1

2 una vez que los datos han sido

ordenados (en orden creciente o decreciente), porque éste es el valor central. Es decir:

M e=x n + 12

Por ejemplo, si tenemos 5 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9 => El valor

central es el tercero:

x 5 + 12

=x3=7

Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo (x1, x2) y otros dos por encima de él (x4, x5).

b) Si n es par, la mediana es la media aritmética de las dos observaciones centrales. Cuando n es

par, los dos datos que están en el centro de la muestra ocupan las posiciones n2

y n2+1 . Es decir:

M e=x n + 12

Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9, x6 = 10 =>

Hay dos valores que están por debajo del

x 62

=x3=7y otros dos que quedan por encima del

siguiente dato

x 62+1

=x4=8. Por tanto, la mediana de este grupo de datos es la media aritmética de

estos dos datos:

Me=7+82

=7,5

DATOS AGRUPADOS

Al tratar con datos agrupados, si

n2 coincide con el valor de una frecuencia acumulada, el valor de

la mediana coincidirá con la abscisa correspondiente. Si no coincide con el valor de ninguna abscisa, se calcula a través de semejanza de triángulos en el histograma o polígono de frecuencias acumuladas, utilizando la siguiente equivalencia:

17

Page 18: ESTADÍSTICA

Med=Li+

N2

−f am

f×i

Li = Límite inferior del intervalo en donde se ubica el dato n2 .

N = Tamaño de la muestra o población.

fam = Frecuencia acumulada anterior a la del intervalo donde se ubica el dato n2 .

f = Frecuencia absoluta del intervaloi = Amplitud del intervalo

MODA

En Estadística, la moda es el valor con una mayor frecuencia en una distribución de datos.

Mod= xi , Si ni = máx {f j , j∈ {1,2 , .. . , k }}

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.

La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p e i – p, siendo i la amplitud del intervalo.

MODA DE DATOS AGRUPADOS

Para obtener la moda en datos agrupados se usa la siguiente fórmula:

Mo=Li+f −f (−1 )

( f −f (−1 ) )+ ( f −f (+1 ) )×i

Donde:

Li −1 = Límite inferior de la clase modal.∆1 = Variación de la frecuencia absoluta modal con relación a la clase contigua inferior.∆2 = Variación de la frecuencia absoluta modal con relación a la clase contigua superior.i = Amplitud del intervalo.

Ejercicio:

Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta personas, encuentre la moda.

60 ; 66 ; 77 ; 70 ; 66 ; 68 ; 57 ; 70 ; 66 ; 52 ; 75 ; 65 ; 69 ; 71 ; 58 ; 66 ; 67 ; 74 ; 61 ;63 ; 69 ; 80 ; 59 ; 66 ; 70 ; 67 ; 78 ; 75 ; 64 ; 71 ; 81 ; 62 ; 64 ; 69 ; 68 ; 72 ; 83 ; 56 ;

18

Page 19: ESTADÍSTICA

65 ; 74 ; 67 ; 54 ; 65 ; 65 ; 69 ; 61 ; 67 ; 73 ; 57 ; 62 ; 67 ; 68 ; 63 ; 67 ; 71 ; 68 ; 76 ;61 ; 62 ; 63 ; 76 ; 61 ; 67 ; 67 ; 64 ; 72 ; 64 ; 73 ; 79 ; 58 ; 67 ; 71 ; 68 ; 59 ; 69 ; 70 ;66; 62; 63; 66;

UNIDAD Nº 5MEDIDAS DE POSICIÓN

En estadística descriptiva, las medidas de posición permiten conocer otros puntos característicos de la distribución que no son centrales, sino aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de frecuencias. Los tipos más importantes son:

Cuartiles, que dividen a la distribución en cuatro partes; Quintiles, que dividen a la distribución en cinco partes; Deciles, que dividen a la distribución en diez partes; Percentiles, que dividen a la distribución en cien partes.

DATOS NO AGRUPADOS

CUARTILES

Dados una serie de valores X1, X2, X3...Xn ordenados en forma creciente, definimos:

19

Page 20: ESTADÍSTICA

Primer cuartil (Q1) como la mediana de la primera mitad de valores; Segundo cuartil (Q 2) como la propia mediana de la serie; Tercer cuartil (Q 3) como la mediana de la segunda mitad de valores.

En estadística descriptiva los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.

Si se tienen una serie de valores X1, X 2, X 3 ... X n, se localiza mediante la siguiente fórmula:

Qk=kn4

k = número de cuartil que se desea saber.n = número de datos

Cuando un cuartil marca número con punto decimal, no se redondea, se deja el mismo resultado y se ubica en la recta numérica.

DECILES

Se representa con la letra D Dividen a la muestra en 10 partes de igual ancho. Cada decil se ubica el 10% a la derecha de su inmediato inferior. La fórmula para calcular el quintil es:

Dk=kn5

PERCENTILES

Es cada uno de los 99 segmentos que tomamos al dividir una muestra o un conjunto de elementos ordenados por cien partes de igual frecuencia.Análogamente podemos decir que: P25 es equivalente al Q 1. P50 es equivalente al Q 2 o mediana. P75 es equivalente al Q3.

Un método fácil para calcular un percentil, sería el siguiente: Calculamos Pk=kn

100 donde n es el

número de elementos de la muestra y k el percentil.

DATOS AGRUPADOS

CUARTILES

Qk=Li+kn4−f am

f k

×i

20

Li=Límite Inferior

k=número decuantil

n=númerode datos

i=ancho delintervalo

Page 21: ESTADÍSTICA

DECILES

Dk=Li+kn10

−f am

f k

×i

PERCENTILES

Pk=Li+kn

100− f am

f k

×i

UNIDAD Nº 6MEDIDAS DE DISPERSIÓN

Las medidas de dispersión, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).

RANGO

Es el indicador más elemental de la validez de las medidas centrales. En estadística descriptiva se denomina rango o recorrido al intervalo de menor tamaño que contiene a todos los datos; es calculable mediante la resta del valor mínimo al valor máximo; por ello. Permite obtener una idea

21

Page 22: ESTADÍSTICA

de la dispersión de los datos.

Por ejemplo, para una serie de datos de carácter cuantitativo como es la estatura tal y como: x1 = 185, x2 = 165, x3 = 170, x4 = 182, x5 = 155, es posible ordenar los datos como sigue: x(1) = 155, x(2) = 165, x(3) = 170, x(4) = 182, x(5) = 185 donde la notación x(i) indica que se trata del elemento i-eximo de la serie de datos. De este modo, el rango sería la diferencia entre el valor máximo (k) y el mínimo; o, lo que es lo mismo:

R = x(k) − x(1)

En nuestro ejemplo, con cinco valores, nos da que R = 185 – 155 = 30.

DESVIACIÓN MEDIA

La desviación media es la media de las diferencias en valor absoluto de los valores a la media.

Dm=∑i=1

n

|x i−x|

nEste valor estadístico no es usado con frecuencia debido a su precisión. Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media.

VARIANZA

La varianza representa la media aritmética de las desviaciones con respecto a la media que son elevadas al cuadrado.

Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviación estándar, la raíz cuadrada de la varianza, está sin embargo expresada en las mismas unidades.

Si la variable aleatoria X tiene media μ = E(X) se define la varianza Var(X) (también representada como σ2) de X como

σ 2=∑ ( X−X )2

n

DESVIACIÓN ESTÁNDAR

La desviación estándar o desviación típica (σ) es una medida de centralización o dispersión para variables de razón y de intervalo, de gran utilidad en la estadística descriptiva.

Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una medida que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.

Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuación.

Expresión de la desviación estándar:

22

Page 23: ESTADÍSTICA

s=√∑i=1

n

( X i−X )2

n

Tomando la raíz cuadrada positiva de la varianza. Así, si efectuamos la raíz de la varianza muestral, obtenemos la desviación típica muestral; y si por el contrario, efectuamos la raíz sobre la varianza poblacional, obtendremos la desviación típica poblacional.

Desviaciones estándar en una distribución normal.

Interpretación y aplicación

La desviación estándar es una medida del grado de dispersión de los datos con respecto al valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto a la media aritmética.

Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar son 8.08, 5.77 y 1.15, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.

La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. La desviación estándar es uno de tres parámetros de ubicación central; muestra la agrupación de los datos alrededor de un valor central (la media o promedio).

La desviación estándar, también llamada como desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución. De hecho, específicamente, la desviación estándar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma .

COEFICIENTE DE VARIACIÓN

Uno de los objetivos de la Estadística es comparar distribuciones que analizando distintas variables podemos determinar relaciones de comparación entre ellas, y este objetivo se lo consigue a través de coeficiente de variación.

Podemos definir al Coeficiente de Variación como: La razón de la Desviación Estándar a la Media Aritmética expresada en porcentaje.

Las Medidas de Tendencia Central y las de Dispersión se expresan en valores absolutos, el 23

Page 24: ESTADÍSTICA

coeficiente de variación es un valor relativo que al multiplicarse por cien se expresa porcentualmente.

Ejemplo: En el peso de 150 personas la media es 176,16 y la desviación estándar de 8.05 calcular el coeficiente da variación.

CV = sX

CV = 8 .05176 ,16

CV =0 , 0457

ASIMETRÍA

Las medidas de asimetría son indicadores que permiten establecer el grado de simetría (o asimetría) que presenta una distribución de probabilidad de una variable aleatoria sin tener que hacer su representación gráfica.

Como eje de simetría consideramos una recta paralela al eje de ordenadas que pasa por la media de la distribución. Si una distribución es simétrica, existe el mismo número de valores a la derecha que a la izquierda de la media, por tanto, el mismo número de desviaciones con signo positivo que con signo negativo. Decimos que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de la media es más larga que la de la izquierda, es decir, si hay valores más separados de la media a la derecha. Diremos que hay asimetría negativa (o a la izquierda) si la "cola" a la izquierda de la media es más larga que la de la derecha, es decir, si hay valores más separados de la media a la izquierda.

MEDIDAS DE ASIMETRÍA

COEFICIENTE DE ASIMETRÍA DE FISHER

En teoría de la probabilidad y estadística, la medida de asimetría más utilizada parte del uso del tercer momento estándar. La razón de esto es que nos interesa mantener el signo de las desviaciones con respecto a la media, para obtener si son mayores las que ocurren a la derecha de la media que las de la izquierda. Sin embargo, no es buena idea tomar el momento estándar con respecto a la media de orden 1 (Ya que una simple suma de todas las desviaciones siempre es cero). Por ello, lo más sencillo es tomar las desviaciones al cubo.

El coeficiente de asimetría de Fisher, representado por g1, se define como:

g1=∑i=1

n

f ( X−X )3

Ns3

Si g1 = 0, la distribución es simétrica.Si g 1 > 0, la distribución es asimétrica positiva o a la derecha.

24

Page 25: ESTADÍSTICA

Si g 1 < 0, la distribución es asimétrica negativa o a la izquierda.

COEFICIENTE DE ASIMETRÍA DE PEARSON

Sólo se puede utilizar en distribuciones campaniformes, unimodales y moderadamente asimétricas. Se basa en que en distribuciones simétricas la media de la distribución es igual a la moda.

Ap=X−Mod

sSi la distribución es simétrica, X = moda y Ap = 0. Si la distribución es asimétrica positiva la media se sitúa por encima de la moda y, por tanto, Ap = 0.

COEFICIENTE DE ASIMETRÍA DE BOWLEY

Está basado en la posición de los cuartiles y la mediana, y utiliza la siguiente expresión:

AB=Q3+Q1−2 Med

Q3−Q1

En una distribución simétrica el tercer cuartil estará a la misma distancia de la mediana que el primer cuartil. Por tanto AB = 0.

Si la distribución es positiva o a la derecha, AB = 0.

LA CURTOSIS

Es una medida de la forma o apuntamiento de las distribuciones. Así las medidas de curtosis (también llamadas de apuntamiento o de concentración central) tratan de estudiar la mayor o menor concentración de frecuencias alrededor de la media y en la zona central de la distribución.

g2=∑i=1

n

f ( X−X )4

ns4−3

Si este coeficiente es nulo, la distribución se dice normal y recibe el nombre de mesocúrtica.Si el coeficiente es positivo, la distribución se llama leptocúrtica, más puntiaguda que la anterior. Hay una mayor concentración de los datos en torno a la media.

Si el coeficiente es negativo, la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media, sería más achatada que la primera.

 UTILIDAD

La asimetría resulta útil en muchos campos. Muchos modelos simplistas asumen una distribución normal, esto es, simétrica en torno a la media. La distribución normal tiene una asimetría cero. Pero en realidad, los valores nunca son perfectamente simétricos y la asimetría de la distribución proporciona una idea sobre si las desviaciones de la media son positivas o negativas. Una asimetría positiva implica que hay más valores distintos a la derecha de la media.

Las medidas de asimetría, sobre todo el coeficiente de asimetría de Fisher, junto con las medidas de apuntamiento o curtosis se utilizan para contrastar si se puede aceptar que una distribución

25

Page 26: ESTADÍSTICA

estadística sigue la distribución normal. Esto es necesario para realizar numerosos contrastes estadísticos en la teoría de inferencia estadística.

Con los siguientes datos calcule todos los conceptos estudiados hasta el momento.

182, 185, 196, 206, 214, 216, 220, 224, 226, 229, 234, 230, 230, 236, 237, 240, 241, 242, 242, 245, 246, 248, 254, 256, 257, 264, 272, 202, 209, 199, 201, 210, 220, 226, 220, 210, 225, 222, 240, 211

UNIDAD Nº 7TASAS E ÍNDICES

PROPORCIONALIDAD

La proporcionalidad es una relación entre magnitudes medibles. Es uno de los escasos conceptos matemáticos ampliamente difundido en la población. Esto se debe a que es en buena medida intuitiva y de uso muy común. La proporcionalidad directa es un caso particular de las variaciones lineales. El factor constante de proporcionalidad puede utilizarse para expresar la relación entre cantidades.

Ejemplo 1:

La receta de un pastel de vainilla indica que para cuatro personas se necesitan 200 g de harina, 150 g de mantequilla, cuatro huevos y 120 g de azúcar. ¿Cómo adaptar la receta para cinco personas? Según varios estudios, la mayoría de la gente calcularía las cantidades para una persona (dividiendo entre cuatro) y luego las multiplicaría por el número real de personas, cinco, otras solo le sumarían lo que a una persona le corresponde. Una minoría no siente la necesidad de pasar por las cantidades unitarias (es decir por persona) y multiplicaría los números de la receta por 5/4 = 1,25 (lo que

26

Page 27: ESTADÍSTICA

equivale a añadir cinco huevos, 250 g de harina; 187,5 de mantequilla y 150 de azúcar tendrá el mismo sabor que el otro, si el cocinero aficionado se muestra tan bueno como el chef que escribió la receta.

Se dice que la cantidad de cada ingrediente es proporcional al número de personas y se representa

esta situación mediante una tabla de proporcionalidad: coeficiente k no nulo (54 en el ejemplo) tal

quey1=kx1 , y2=kx2 , .. . , yn=kxn

Si se consideran x1, x2,…, xn e y1, y2,…, yn como valores de variables x e y, entonces se dice que estas variables son proporcionales; la igualdad y = k·x significa que y es una función lineal de x.

La representación gráfica de esta función es una recta que pasa por el origen del sistema de coordenadas. Una variación (incremento o decremento) de x da lugar a una variación proporcional de y (y recíprocamente, puesto que k≠0: y = 1/k · x):

∆y = (∆x)k

La relación «Ser proporcional a» es:

Reflexiva ( toda variable es proporcional a sí misma, con el coeficiente 1) Simétrica (cuando y es proporcional a x entonces x lo es a y, con el coeficiente inverso) y Transitiva (si x es proporcional a y, e y a z, entonces x lo es con z, multiplicando los

coeficientes) por lo que se trata de una relación de equivalencia. En particular dos variables proporcionales a una tercera serán proporcionales entre sí).

Una proporción está formada por los números a, b, c y d, si la razón entre a y b es la misma que entre c y d.

Una proporción está formada por dos razones iguales:

a : b : : c : d

Dónde a, b, c y d son distintos de cero y se lee a es a b como c es a d.

Proporción múltiple:

Una serie de razones está formada por tres o más razones iguales:

a : b : : c : d : : e : f

Y se puede expresar como una proporción múltiple:

27

Page 28: ESTADÍSTICA

a : c : e : : b : d : f

En la proporción hay cuatro términos; a y d se llaman extremos; c y b se llaman medios. En toda proporción el producto de los extremos es igual al producto de los medios.

Ejemplo 2

Dos albañiles construyen un muro de doce metros de superficie en tres horas; ¿Qué superficie construirán cinco albañiles en cuatro horas?

Hay dos parámetros que influyen en la superficie construida: El número de albañiles y el tiempo de trabajo. No hay que resistir a la tentación de aplicar dos veces la proporcionalidad, pero eso sí, explicitando las hipótesis subyacentes.

Afirmar que el trabajo realizado es proporcional al número de albañiles equivale a decir que todos los obreros tienen la misma eficacia al trabajo (son intercambiables); y afirmar que la superficie es proporcional al tiempo de trabajo supone que el rendimiento no cambia con el tiempo: los albañiles no se cansan.

Ejemplo 3

Dos autos recorren exactamente el mismo camino. Al primero le ha tomado dos horas y media llegar al destino, rodando a una velocidad promedio de 70 km/h. El segundo rueda a 100 km/h. ¿Cuánto tiempo ha tardado en llegar?

Entre mayor velocidad tenga uno, menor tiempo durará el viaje. Si se multiplica por dos la velocidad, la duración del viaje se dividirá por dos. Aquí, claramente el tiempo del recorrido no es proporcional a la velocidad sino justamente lo contrario: es inversamente proporcional, es decir proporcional a la inversa de la velocidad. Esto permite responder a la pregunta:

Cambiando una multiplicación por una división tabla o aplicando la proporcionalidad con la inversa

de la velocidad (segunda tabla). El tiempo será 2,5× 7

10=1 , 75

, es decir una hora y 45 minutos.Más generalmente, si una variable y es inversamente proporcional a otra variable x, se puede aplicar

la proporcionalidad con

1x , o más bien utilizar la siguiente equivalencia:

Es decir que el producto de los valores correspondientes (aquí en la misma línea) es constante. En el ejemplo: 70 × 2,5 = 100 × 1, 75 = 175 km, que es la longitud del recorrido.

Una tabla de variación proporcional es aquella que sigue una secuencia utilizando de base el precio de algún objeto u otra cosa que pueda aumentar o disminuir cierto número u objeto de forma proporcional.

Magnitudes Directamente Proporcionales:

Dos magnitudes son directamente proporcionales cuando al multiplicar o dividir una de ellas por un número, la otra queda multiplicada o dividida respectivamente por el mismo número

Ejemplo:

28

Page 29: ESTADÍSTICA

Un automóvil consume 3 galones de gasolina por 120 km de recorrido ¿Cuantos kilómetros recorre con 20 galones?

Observamos que las magnitudes son directas Si la razón o cociente entre ellas es un valor constante. Con los datos de la tabla, hallamos la razón, elaboramos una tabla de proporcionalidad:

Gasolina 3 1 10 20 40 (galones)Recorrido

120 40 400 800 1600 (kilómetros)

Con 20 galones de gasolina, el auto recorre 800 kilómetros: Mientras más kilómetros se recorran, mas galones de gasolina de consumirán. El número de kilómetros recorridos es directamente proporcional (D. P.) al número de galones de gasolina. Siempre que las demás condiciones se mantuvieran constantes. Esto es, que no se modificaran las condiciones climáticas o geográficas que modificaran el consumo.

TANTO POR CIENTO O PORCENTAJE

La palabra "por ciento" significa "por cien", como si dividieras algo por cien. En otras palabras, por ciento significa una centésima parte de algo. Un por ciento es 1/100, 67% es 67/100, etcétera.

Se considera alguna cantidad, por ejemplo 65 o $489 o 1392, como "un total". Si se divide este "total" a cien partes iguales, entonces cada parte es un por ciento del total.

Si el "total" es 650 personas, entonces 1% de eso será 6,5 (si se trata de una aplicación práctica, necesitaría redondear tal respuesta a personas enteras, por supuesto).

Si el "total" es $42, luego 1% de él es $0.42. Y, 2% de él será $0.84 (doble de 1%). Entonces, para hallar 1% de algo, se divide por 100.

CÓMO HALLAR UN PORCENTAJE O TANTO POR CIENTO DE UN NÚMERO

Para hallar 24% o 8% o cualquier otro porcentaje de alguna cantidad, se puede primero hallar el 1% de la cantidad, y luego multiplicar el resultado por 24 o 8 o cualquier sea su tanto por ciento.Ejemplos:

Hallar 7% de $41,50. Primero se calcula $41,50/100 para obtener 1% ó 1/100 de $41,50. Entonces se multiplica eso por 7. Respuesta: $2,905.

Pero ese cálculo es la misma que (7/100) x $41,50. Recuerde que 7/100 es 0,07 como un decimal. En la mayoría de los cálculos, es más práctico usar decimales en lugar de esa regla de "divide por 100, luego multiplica".

Pues, para hallar 7% de $41,50, simplemente se calcula 0,07 x $41,50 con un calculador. Es tan simple que convertir el porciento en un decimal: 7% es 0.07.

Otra posibilidad es una regla: se multiplica por el "tanto" y se divide por el "ciento":

29

Page 30: ESTADÍSTICA

Hallar 78% de 905. El número 78 es el "tanto". Entonces se multiplica 78 × 905, y después se divide por cien: 78 × 905 / 100 = 705,9.

¿QUÉ POR CIENTO ES?

De la clase de 34 estudiantes, 12 son muchachas. ¿Qué por ciento de la clase son muchachas?

Aquí, la "entera" es 34, la clase entera. El problema es, si esa "entera" de 34 fuera dividida a 100 partes, ¿cuántas de esas partes necesitaríamos para representar las 12 estudiantes?

O, se podrían comparar 34 personas con una línea de 100 de "algo". Imaginemos todas las 34 personas posicionadas en la recta, y esas 12 muchachas están en un extremo de la línea. Si tuviéramos 100 unidades de medida iguales que alcanzarían a la longitud exacta que su línea de personas, ¿Cuántas de las unidades igualarán las 12 muchachas?

Este ejemplo nos guía a la proporción de tanto por ciento:

12/34 = x / 100

Resolviendo x, obtenemosx = (12/34) × 100.

Al resolver algunas veces este tipo de proporción, se nota que cada vez solo comparamos la parte con la totalidad (la entera) usando división, como 12/34 en el ejemplo anterior. Así es bastante rápido simplemente escribir esa comparación de parte/totalidad directamente, cuando resolviendo problemas de "qué por ciento".

Ejemplo 1:

Una guitarra de $199 se descuenta por $40. ¿Cuál es el por ciento de descuento?

Aquí, "la entera" es el precio original (total), $199. Se requiere qué por ciento es 40 de 199. Sólo se calcula 40/199, comparando la parte con la entera. Calculando: 40/199 = 0,201005025, y convierte eso en un porciento por multiplicar por 100. La respuesta es 20,1%.

Ejemplo 2:

1. Si una bicicleta vale $ 250 y el almacén está en promoción del 30%. ¿Cuánto valen 6 bicicletas?2. Se necesita hallar el precio de una bicicleta, entonces multiplicarlo por 6.3. Se han reducido los precios por 30%, lo que significa que "queda" 70% del precio de la

bicicleta. 4. Hallamos entonces 70% de 250.5. En esta ocasión es fácil primero hallar el 10% de 250, lo cual es 25. Luego lo multiplicamos por

siete: 7 x 25 = 175, lo cual es el nuevo precio de una bicicleta.6. Y seis veces de eso es 6 x 175 = $ 1 050.

COMO SE CALCULA UN INCREMENTO PORCENTUAL

Muchas personas tienen problemas para calcular el incremento porcentual de dos importes en un periodo especificado.

Supongamos que en enero tenemos $ 100 y en febrero tenemos $ 110 pesos, y queremos calcular el

30

Page 31: ESTADÍSTICA

incremento porcentual de nuestro dinero para esto usamos la siguiente fórmula:

VF: Valor FinalVI: Valor Inicial

Incremento porcentual = [(VF – VI) / VI] * 100 = %.Incremento porcentual [(110 – 100) / 100] *100 = 10%

Resolver el siguiente Problema:

En el conteo bacteriano de un cierto cultivo pasa de 1000 a 4000 en 3 días. ¿Cuál es el incremento porcentual por día?"

TASA

Tasa: Son las remuneraciones o mediciones expresadas generalmente en %, que percibe un mercado de valores, empresa u organismo, (según el rubro del que se hable) por la realización de sus actividades o la prestación de sus servicios.

Se puede hablar de "tasa" de mortalidad, o de desempleo, o de tasa de interés financiero.

NUMEROS INDICES

Un número índice mide qué tanto una variable ha cambiado con el tiempo.

Mide la variación relativa entre las variables económicas: Variaciones en los precios, en los salarios, en los ingresos, etc.

Se calculan para 2 períodos de una serie de tiempo o para todos los períodos de una serie de tiempo con respecto a un período fijo llamado período base.

¿Por qué usar números Índice?

Pueden utilizarse en diferentes contextos.

Un índice es una forma conveniente de expresar un cambio en un grupo heterogéneo de elementos. Por ejemplo, el IPC comprende más de 50 artículos. El usar el IPC permite conocer el cambio global de precios al consumidor.

La conversión de los datos a índices también facilita la estimación de la tendencia en una serie compuesta por números muy grandes.

En resumen, algunas razones por las cuales se usan los números índices:

1. Permite comparar dos o más series de tiempo que tienen diferentes unidades de medida. 2. Se pueden reducir números de magnitud considerable a cantidades manejables.3. Permiten comparar cambios en la producción de un conjunto de artículos, los que no pueden

expresarse en una misma unidad de medida.

TIPOS DE NÚMEROS INDICES

Índice de precios.

31

Page 32: ESTADÍSTICA

Índice de cantidad (o volumen). Índice de Valor.

CÁLCULO DE NÚMEROS INDICES

La construcción y cálculo de los números índices nos presenta los siguientes problemas:

a) Existe dificultad para hallar datos adecuados para calcular un índice. Los elementos incluidos en un índice responden a un interés o pregunta en particular.

b) Si existen cambios sustanciales en los componentes del índice, estos ya no son bien comparables: Los pesos seleccionados deberían representar la importancia relativa de los diferentes elementos. Lo que resulta apropiado en un período puede volverse inapropiado en un lapso muy corto.

c) Una ponderación no apropiada de factores puede distorsionar un índice: Debe seleccionarse el período base en forma correcta. El período “base” debe ser un período “normal” (que no corresponda ni a un pico, ni a una depresión).

El cálculo considera 2 métodos para elaborar índices: El No ponderado y El Ponderado

INDICES NO PONDERADOS O INDICES SIMPLES

Índice Simple de Precios o Precio relativo (Ip)

Mide la variación en el precio de un solo artículo en el período dado (t) con respecto al período base (o)

Ip= PtPo

×100

Índice Simple de Cantidades o Cantidad relativa (Iq)

Iq= QtQo

×100

Qt = Cantidad del bien en el período dadoQo = Cantidad del bien en el período baseINDICES COMPUESTOS (Agregados, Ponderados)

Índices agregados simples de precios y cantidades.

P=∑ Pt

∑ Po×100 Q=

∑ Qt

∑Qo×100

INDICE DE VALOR

Mide los cambios generales en el valor total de alguna variable. Como el valor de este índice está 32

Page 33: ESTADÍSTICA

determinado tanto por el precio como por la cantidad, un índice de valor mide los efectos combinados de los cambios de precios y cantidad. Es útil para medir cambios globales.

V=∑ PtQt

∑ PoQo×100

MÉTODOS PARA CALCULAR ÍNDICES

AGREGACIÓN SIMPLE.

En este método de calcular un índice de precios, expresamos el precio total de los artículos en el año dado como porcentaje del precio total de los artículos en el año base. En símbolos:

Índice de precios por agregación simple =

∑ pn

∑ p0

∑ p0 = Suma de todos los precios de los artículos en el año base.

∑ pn = Suma de todos los precios de los artículos en el año dado.

Y donde el resultado se expresa como porcentaje, al igual que se hace con los números índice en general.

Aunque este método es fácil de aplicar, tiene dos grandes desventajas que lo convierten en insatisfactorio:

1. No tiene en cuenta la importancia relativa de los diversos artículos. Así pues, asigna igual peso a la leche que a la crema de afeitar a la hora de calcular el índice de precios al consumo.

2. Las unidades escogidas al anotar los precios (galones, metros, libras,...) afectan al índice.

PROMEDIO SIMPLE DE RELACIONESEl índice producido por este método depende del procedimiento utilizado para promediar las relaciones de precios; así tenemos:

Índice de la media aritmética simple de relaciones de precios =

∑ Pn /P0

N

∑ Pn /P0

N = Suma de todas las relaciones de precios de los artículos.N = número de relaciones de precios de artículos utilizados.

Si bien este método no tiene ya la segunda desventaja antes citada, todavía mantiene la primera.AGREGACIÓN PONDERADA

Con el fin de evitar las desventajas del método de agregación simple, asignamos un peso al precio de cada artículo, en general la cantidad (o volumen) vendida durante el año base, durante el año dado o durante algún año típico (que puede ser un promedio de varios años). Tales pesos indican la

33

Page 34: ESTADÍSTICA

importancia del artículo en cuestión. Dependiendo de que se use el año base, el año dado o un año típico (denotados respectivamente por q0, qn y qt, usamos una de las siguientes fórmulas:

1. Índice de Laspeyres o método del año base:

Índice de precios por agregación ponderada con pesos de cantidad en el año base =

∑ pn q0

∑ p0 q0

2. Índice de Paasche o método del año dado:

Índice de precios por agregación ponderada con tiesos de cantidad en el año dado =

∑ pn qn

∑ p0 qn

ÍNDICE IDEAL DE FISHER

Índice ideal de Fisher = √(∑ pn q0

∑ p0 q0)(∑ pnqn

∑ p0qn)

Este índice de precios es la media geométrica de los números índice de Laspeyres y de Paasche.

El índice ideal de Fisher satisface los criterios de inversión temporal y de inversión de factores, lo que le confiere una cierta ventaja teórica sobre otros números índice.

ÍNDICE DE MARSHALL – EDGEWORTH

El índice de Marshall – Edgeworth usa el método de agregación ponderada con año típico, en el que los pesos se toman como la media aritmética de las cantidades del año base y del año dado; es decir, q t=

12 (q0+qn) . Entonces:

Índice de Marshall – Edgeworth =

∑ pn (q0+qn )∑ p0 (q0+qn )

PROMEDIO PONDERADO DE RELACIONES

Para paliar las desventajas del método del promedio simple de relaciones se puede usar un promedio ponderado de relaciones.En este método asignamos a cada relación de precios un peso dado por el valor total del artículo en términos de alguna unidad monetaria, digamos el dólar. Como el valor de un artículo se obtiene multiplicando su precio p por la cantidad q. Los pesos vienen dados por pq.

Su fórmula es entonces: I =

∑ ( pn / p0) ( pn qn)∑ pn qn

UNIDAD Nº 8PROBABILIDAD

34

Page 35: ESTADÍSTICA

La noción de probabilidad enlaza la Estadística Descriptiva y la Estadística Inferencial, permitiendo que los datos obtenidos mediante una muestra puedan ser generalizados al universo de estudio o población.

La probabilidad no tiene una definición única e incuestionable, pero existen dos principales:

a) Es el número que caracteriza la posibilidad de que se produzca un suceso (A) si hay n resultados igualmente posibles.

P ( A )=casos favorablescasos posibles

=hn

b) Es la frecuencia relativa con la que ocurre un acontecimiento.

Las probabilidades tienen una serie de propiedades, entre las que destacan:

a) La probabilidad de un suceso es un número real comprendido entre 0 y 1.b) La probabilidad de ocurrencia de un suceso cierto es igual a la unidad.c) La probabilidad de un suceso imposible es 0.

La probabilidad en cuanto número real permite las operaciones de adición y producto.

Las definiciones de probabilidad que hemos presentado son fácilmente aplicables a sucesos simples, sin embargo, para la obtención de probabilidades de sucesos complejos, la enumeración de los casos puede resultar tediosa y difícil. Para solucionar dicho problema es preciso echar mano de los principios básicos del análisis combinatorio, especialmente del principio de multiplicación, que dice:

“Si un suceso puede presentarse de n1 formas distintas, y cada una de estas formas distintas pueden ser también realizadas de n2 formas distintas, y estas últimas, a su vez en n3 formas distintas y así sucesivamente hasta nr formas distintas en que es posible realizar el experimento, el número total de posibles formas en que puede aparecer el resultado de ese experimento viene dado por la multiplicación de cada una de las n posibilidades, esto es:

n1•n2•n3•...•nr

Nos serviremos de este principio para obtener las diferentes variaciones, combinaciones y permutaciones de los elementos con los que contamos.

EJERCICIO 1:

1. La Comisión de Justicia del Parlamento de un determinado estado está compuesta por 4 diputados conservadores, 4 socialdemócratas, 1 liberal y 1 comunista. Uno de los miembros ha de encargarse de elaborar un resumen con las conclusiones sobre un tema debatido en dicha comisión. En pedazos de papel se escriben los nombres de los componentes y se colocan en un recipiente. Si se escoge uno de estos aleatoriamente:

a) ¿Cuál es la probabilidad de extraer un diputado conservador?b) ¿Y la de extraer un diputado comunista?c) ¿Cuál sería la de extraer un diputado conservador o socialdemócrata?d) ¿Y la de no extraer un diputado socialdemócrata?

35

Page 36: ESTADÍSTICA

e) Tras extraer un papel, se vuelve a colocar en el recipiente y se escoge un segundo papel. ¿Cuál es la probabilidad de que el primer nombre sea de un diputado socialdemócrata y el segundo de uno liberal?

Solución.

a) Conocemos el número de casos favorables (h=4). También conocemos el número de casos posibles (n=10).

La probabilidad de extraer un conservador vendrá dada por el cociente entre casos favorables y casos posibles.

p (conservador) =

410 = 0,4

Traduciéndolo a porcentajes, podemos decir que existe una probabilidad del 40% de que sea elegido un diputado conservador.

b) Para este caso seguimos el mismo procedimiento que en el anterior.

Casos favorables (h = 1) Casos posibles (n = 10)

p (comunista) =

110 = 0,1

Existe una probabilidad del 10% de elegir a un diputado comunista.

c) Como se trata de sucesos excluyentes (no podemos elegir de una sola vez a un conservador y a la vez, a uno socialdemócrata, aplicaremos la regla de la adición de las probabilidades para este tipo de sucesos:

p (conservador o socialdemócrata) = p (cons.) + p (sociald.) =

410

+ 410

= 810

=45=0,8=80 %

Existe una probabilidad de un 80% de que en una sola extracción se elija a un diputado conservador o socialdemócrata.

d) La probabilidad de elegir un socialdemócrata es el resultado de dividir los casos favorables entre los posibles: 4/10 = 0,4.

La probabilidad de que salga elegido un diputado no socialdemócrata será de:1 – p (socialdemócrata) = 1 – 0,4 = 0,6

Esto es, existe una probabilidad del 60% de no elegir a un socialdemócrata.

e) La primera extracción no modifica la segunda, ya que se vuelve a introducir el papel en el recipiente; se trata, por tanto, de sucesos independientes. Podemos, por consiguiente, utilizar la regla de la multiplicación de las probabilidades para sucesos independientes:

410

+ 110

= 4100

=0 , 04=4 %

36

Page 37: ESTADÍSTICA

Hay una probabilidad del 4% de que en una primera extracción se designe a un socialdemócrata y, reemplazado, en una segunda extracción, se designe a un liberal.

PROBABILIDAD CONDICIONAL

SUCESOS INDEPENDIENTES Y SUCESOS DEPENDIENTES

Si E1 y E2 son dos sucesos, la probabilidad de que E2 ocurra dado que haya ocurrido E1 se denota por Pr{E2|E1}, o Pr{E2 dado E1}, y se llama la probabilidad condicional de E2 dado E1.

Si la ocurrencia o no de E1 no afecta para nada la probabilidad de ocurrencia de E2, entonces Pr{E2|E1} = Pr{E2} y diremos que E1, y E2 son sucesos independientes; en caso contrario, se dirá que son sucesos dependientes.

Si denotamos por ElE2 el suceso de que ambos E1 y E2 ocurran, llamado un suceso compuesto, entonces:

Pr{E1E2} = Pr{E1} Pr{E1|E2}

En particular,

Pr{E1E2} = Pr{E1} Pr{E2} para sucesos independientes

Para tres sucesos E1 E2 y E3, tenemos:

Pr{ E1E2E3} = Pr{E1} Pr{E2|E1} Pr{E3|E2}

Esto es, la probabilidad de que ocurran E1, E2 y E3 es igual a (la probabilidad de E1 x (la probabilidad de E2 dado E1) x (la probabilidad de E3 dados El y E2. En particular,

Pr{ E1E2E3} = Pr{E1} Pr{E2} Pr{E3} para sucesos independientes.

En general, si E1 E2, E3,..., En son n sucesos independientes con probabilidades respectivas p1. p2, p3, ..., pn, entonces la probabilidad de que ocurran E1 y E2 y E3 y…En es p1p2p3…pn.

EJERCICIO 2

Sean El y E2 los sucesos “cara en el quinto lanzamiento” y “cara en el sexto lanzamiento” de una moneda, respectivamente. Entonces, E1 y E2 son sucesos independientes y, por tanto, la probabilidad de que salga cara en ambos intentos es.

Pr{E1E2} = Pr{E1} Pr{E2} = ( 1

2 )( 12 )=1

4

EJERCICIO 3

Si las probabilidades de A y B de estar vivos dentro de 20 años son 0.7 y 0.5, respectivamente, arronces la probabilidad de que ambos lo estén es (0.7)(0.5) = 0.35.

EJERCICIO 4

Una caja contiene 3 bolas blancas y 2 bolas negras. Sea E1 el suceso “la primera bola extraída es negra” y E2 el suceso “la segunda bola extraída es negra”. Las bolas extraídas no se devuelven a la

37

Page 38: ESTADÍSTICA

caja. El y E2 son sucesos dependientes.

La probabilidad de que la primera bola sea negra es Pr{E1} = 2/(3 + 2) = 25 . La probabilidad de que

la segunda sea negra, dado que ya lo haya sido la primera, es Pr{E2|E1} = 1/(3 + 1) = 14 . Luego la

probabilidad de que ambas sean negras es:

Pr{E1E2} = Pr{E1} Pr{E2|E1} = 25⋅1

4= 1

10

SUCESOS MUTUAMENTE EXCLUYENTES

Dos o más sucesos se llaman mutuamente excluyentes si la ocurrencia de cualquiera de ellos recluye la de los otros. De modo que si E1 y E2 son sucesos mutuamente excluyentes, entonces Pr{E1E2} = 0.

Si E1+E2 denota el suceso de que “ocurra E1 o bien E2 o ambos a la vez”, entonces

Pr{E1+E2} = Pr{E1}+Pr{E2} – Pr{E1E2}

En particular,

Pr{E1+E1} = Pr{E1} + Pr{E2} para sucesos mutuamente excluyentes.

Como extensión de esto, si E1 E2, ..., En son n sucesos mutuamente excluyentes con probabilidades respectivas E1 o E2 o … En es p1 + p2 +…+ pn.

EJERCICIO 5

Sean E1 el suceso “sacar un as de una baraja” y E2 “sacar un rey”. Entonces Pr{E1} = 452

= 113 y

Pr{E2} = 452

= 113 La probabilidad de sacar o un as o un rey en un solo ensayo es.

Pr{E1+E2} = Pr{E1} + Pr{E2} = 113

+ 113

= 213

Pues no es posible sacar ambos a la vez, y son, por tanto, sucesos mutuamente excluyentes.

EJERCICIO 6

Sean E1 el suceso “sacar un as” de una baraja y E2 “sacar una espada”. Entonces E¡ y E2 no •ea sucesos mutuamente excluyentes, porque puede sacarse el as de espadas. Luego la probabilidad de sacar un as o una espada o ambos es:

Pr{E1+E2} = Pr{E1} + Pr{E2} – Pr{E1E2} = 452

+ 1352

− 152

= 1652

= 413

ANÁLISIS COMBINATORIO

Al hallar probabilidades de sucesos complicados, suele resultar difícil y tediosa una enumeración de los casos. El análisis combinatorio facilita mucho esa tarea.Principio fundamental

38

Page 39: ESTADÍSTICA

Si un suceso puede ocurrir de n1 maneras, y si cuando éste ha ocurrido otro suceso puede ocurrir de n2 maneras, entonces el número de maneras en que ambos pueden ocurrir en el orden especificado es n1n2.

EJERCICIO 7.

Si hay 3 candidatos para gobernador y 5 para alcalde, los dos cargos pueden ocuparse de 3¿ 5 = 15 formas.

Factorial de n

La factorial de n, denotada por n!, se define como:

n! = n(n – 1)(n – 2)… ¿ 1

Así, 5! = 5¿ 4¿ 3¿ 2¿ 1 = 120, y 4!3! = (4¿ 3¿ 2¿ 1)(3¿ 2¿ 1) = 144. Conviene definir 0! = 1.

Permutaciones

Una permutación de n objetos tomados de r en r es una elección ordenada de r objetos de entre n. El número de permutaciones de n objetos tomados de r en r se denota por nPr P(n, r), o Pn , y viene dado por:

nPr = n(n – 1)(n – 2) … (n – r + 1) =

n !(n−r )!

En particular, el número de permutaciones de n objetos tomados de n en n es:

nn P=n (n−1 ) (n−2 ) . ..×1=n !

EJERCICIO 8.

El números de permutaciones que se pueden dar de las letras a, b y c tomadas de dos en dos es 3P2 = 3¿ 2 = 6. Son ab, ba, ac, ca, be y cb.

El número de permutaciones de n objetos, de los que n1 son iguales, n2 son iguales, ... es:

n !n1 !n2 ! . . . donde n = n1 + n2 + …

EJERCICIO 9.

El número de permutaciones de las letras de la palabra “statistics” es:

10 !3!3 !1 !2 !1! = 50,400

Porque hay 3 eses, 3 tes, 1 a, 2 íes y 1 c.

39

Page 40: ESTADÍSTICA

PROCESO PARA CALCULAR LA PROBABILIDAD DE UN EVENTO.

1. Haga una lista de todos los eventos contenidos en el espacio muestral.2. Asigne la probabilidad que corresponda a cada evento simple.3. Determine los eventos simples que constituyen el evento de interés.4. Sume las probabilidades de todos los eventos simples que constituyen el evento de interés.

REGLA DE SUMA DE PROBABILIDADES

P ( A∪B )=P ( A )+P ( B )−P ( A∩B )

REGLA DE MULTIPLICACIÓN DE PROBABILIDAD

Si los eventos de independientes:

Se dice que dos eventos son independientes si y solo si, P ( A|B ) = P(A)

P(A y B) = P(A ∩ B) = P(A)P(B)

Si los eventos son dependientes:

Se dice que dos eventos son dependientes si la ocurrencia de uno de ellos afecta la ocurrencia del otro. P ( A|B ) ≠ P(A)

Es la probabilidad de A multiplicada por la probabilidad condicional de B dado A.

P ( A∩B ) = P(A)P(B|A)

P ( A|B )=P ( A∩B )

P ( B )P (B|A )=

P ( B∩A )P ( A )

Si la posición de los dos eventos se invierte, se obtiene un valor equivalente.

P(A y B) = P(B y A ) = P(B)P(A|B)

En resumen:

a. Si A y B son eventos independientes, entonces, P ( A∩B )=P ( A )×P (B )

b. Si A y B son eventos dependientes, entonces, P ( A∩B )=P ( A )×P ( A|B )

EJERCICIOS A SOLUCIONAR CON REGLA DE LA SUMA

1. Una urna contiene 10 bolas, 6 blancas y 4 negras. Si se saca una bola al azar, ¿cuál es la probabilidad de que la bola sea blanca? Repuesta 0,60

2. Se saca una carta de un mazo de 52 cartas; calcular:

a. La probabilidad de que la carta sea un rey (0,077)b. La probabilidad que sea un As de corazón rojo (0,019)c. La probabilidad que la carta sea negra (0,5)d. La probabilidad que la carta sea de diamante (0,25)

40

Page 41: ESTADÍSTICA

3. Se saca una carta de un mazo de 52 cartas, ¿cuál es la probabilidad de que sea un As o un Rey? (0,1538).

4. Se saca una bola de una urna que contiene 20 bolas, 7 azules y 5 blancas, ¿cuál es la probabilidad de que sea azul o blanca? (0,6)

5. Un individuo que entra a una farmacia tiene una probabilidad de comprar pasta dental de 45%, de comprar desodorante de 35% y de comprar ambos de 25%. Si ese individuo entra a la farmacia, ¿cuál es la probabilidad de que compre pasta dental o desodorante? (0,55).

6. Se saca una carta de un mazo de 52 cartas, ¿cuál es la probabilidad de que se obtenga un As o una carta roja? (0,538)

7. En la población de Puerto Rico se ha estimado que la probabilidad de fumar es de 65% y la de fumar ocasionalmente de 20%; ¿cuál es la probabilidad de no fumar para esa población?

8. En una universidad 40% poseen un diploma en el idioma Francés, 30% poseen un diploma en el idioma Italiano y 10% poseen un diploma en ambos idiomas. Si se escoge un miembro de esa comunidad al azar, ¿cuál es la probabilidad de que posea un diploma de Francés o Italiano? (0,6)

9. Suponga que un distribuidor de autos recibe 12 nuevos modelos, 8 automáticos y 4 estándares. Si se venden cuatro autos el próximo mes, ¿cuál es la probabilidad de que los autos vendidos sean dos automáticos y dos estándares? ¿cuál es la probabilidad de que los 4 sean o automáticos o estándares? (0,34) y (0,1434).

10. La probabilidad de que ocurra el evento A es 35%, la probabilidad de que ocurra el evento B es 10%. Si A y B son eventos independientes, ¿cuál es la probabilidad de que ocurra el evento P ( A∪B ) ? (0,415).

EJERCICIOS A SOLUCIONAR CON REGLA DE LA MULTIPLICACIÓN

1. Se lanzan un dado blanco y un dado negro. Encontrar la probabilidad de que la suma de sus caras sea 7 y que el número del dado negro sea mayor que el del dado blanco.

2. Se sabe que el 50% de la población fuma y que el 10% fuma y es hipertensa. ¿Cuál es la probabilidad de que un fumador sea hipertenso?

3. Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen al azar 3 bolas. Calcular la probabilidad de que la primera sea azul, y las otras dos verdes.

4. Si una moneda equilibrada se lanza dos veces, la probabilidad de que ambos lanzamientos den por resultado una “cara” es:

5. Suponga que hay 10 rollos de película fotográfica en una caja y se sabe que tres están defectuosos. Se selecciona uno. Después se elige un segundo rollo de la caja sin devolver el primer rollo a ésta. ¿Cuál es la probabilidad de que el segundo sea defectuoso?

6. Un lote contiene 100 ítems de los cuales 20 son defectuosos. Los ítems son seleccionados uno después del otro para ver si ellos son defectuosos. Suponga que dos ítems son seleccionados sin remplazamiento (Significa que el objeto que se selecciona al azar se deja por fuera del lote). ¿Cuál es la probabilidad de que los dos ítems seleccionados sean defectuosos?

7. En una estantería hay 60 novelas y 20 libros de poesía. Una persona A elige un libro al azar de la estantería y se lo lleva. A continuación otra persona B elige otro libro al azar. ¿Cuál es la probabilidad de que el libro seleccionado por B sea una novela?

8. La probabilidad de que la batería de un automóvil sujeta a altas temperaturas dentro del compartimiento del motor reciba una corriente de carga mayor que la normal, es 0,8. La probabilidad de que la batería quede expuesta a altas temperaturas es 0,1. ¿Cuál es probabilidad de que la batería experimente tanto una corriente de carga alta como una temperatura alta? (0,08)

9. El 5% de la población de una ciudad sufre de presión sanguínea alta. De la población con presión sanguínea alta el 75% toman licor mientras que solamente el 50% que no sufren de presión sanguínea alta lo toman. Calcule el porcentaje de personas que toman licor y sufren de

41

Page 42: ESTADÍSTICA

presión sanguínea alta. 10. Un lote contiene 20 artículos de los cuales 12 son defectuosos y 8 no defectuosos son

inspeccionados uno por uno. Si los artículos son seleccionados al azar sin remplazamiento, calcular la probabilidad de que:

a. Los primeros dos artículos sean defectuosos b. Entre los tres primeros artículos, dos sean buenos c. El tercer artículo es defectuoso.

COMBINATORIALa Combinatoria es la parte de la Matemática que estudia las diversas formas de realizar agrupaciones con los elementos de un conjunto, formándolas y calculando su número.

Existen distintas formas de realizar estas agrupaciones, según se repitan los elementos o no, según se puedan tomar todos los elementos de que disponemos o no y si influye o no el orden de colocación de los elementos:

Variaciones sin y con repetición. Permutaciones sin y con repetición. Combinaciones sin y con repetición.

Una vez que se deduzca de qué tipo son, se puede realizar cálculos combinatorios, para obtener el número de agrupaciones que hay.

VARIACIONESLas variaciones son aquellas formas de agrupar los elementos de un conjunto teniendo en cuenta que:

Influye el orden en que se colocan. Si permitimos que se repitan los elementos, podemos hacerlo hasta tantas veces como elementos

tenga la agrupación.Existen dos tipos: variaciones sin repetición y variaciones con repetición:

VARIACIONES SIN REPETICIÓN VARIACIONES CON REPETICIÓNLas variaciones sin repetición de n elementos tomados de p en p se definen como las distintas agrupaciones formadas con p elementos distintos, eligiéndolos de entre los n elementos de que disponemos, considerando una variación distinta a otra tanto si difieren en algún elemento como si están situados en distinto orden. El número de variaciones que se pueden construir se puede calcular mediante la fórmula:

Las variaciones con repetición de n elementos tomados de p en p se definen como las distintas agrupaciones formadas con p elementos que pueden repetirse, eligiéndolos de entre los n elementos de que disponemos, considerando una variación distinta a otra tanto si difieren en algún elemento como si están situados en distinto orden. El número de variaciones que se pueden construir se puede calcular mediante la fórmula:

nVRr = nr

42

Page 43: ESTADÍSTICA

nVr =

n !(n−r )!

PERMUTACIONESLas permutaciones o, también llamadas, ordenaciones son aquellas formas de agrupar los elementos de un conjunto teniendo en cuenta que:

Influye el orden en que se colocan. Tomamos todos los elementos de que se disponen. Serán Permutaciones SIN repetición cuando todos los elementos de que disponemos son

distintos. Serán Permutaciones CON repetición si disponemos de elementos repetidos. (Ese es el nº de

veces que se repite elemento en cuestión).

PERMUTACIONES SIN REPETICIÓN:

PERMUTACIONES CON REPETICIÓN:

Las permutaciones sin repetición de n elementos se definen como las distintas formas de ordenar todos esos elementos distintos, por lo que la única diferencia entre ellas es el orden de colocación de sus elementos. El número de estas permutaciones será:

Pn = n!

Llamamos a las permutaciones con repetición de n elementos tomados de a en a, de b en b, de c en c, etc., cuando en los n elementos existen elementos repetidos (un elemento aparece a veces, otro b veces, otro c veces, etc.) verificándose que a+b+c+...=n. El número de estas permutaciones será:

nPRr, s, t =

n !r ! s ! t !

COMBINACIONES

Las combinaciones son aquellas formas de agrupar los elementos de un conjunto teniendo en cuenta que: NO influye el orden en que se colocan. Si permitimos que se repitan los elementos, podemos hacerlo hasta tantas veces como elementos

tenga la agrupación.

Existen dos tipos: combinaciones sin repetición y combinaciones con repetición.

COMBINACIONES SIN REPETICIÓN COMBINACIONES CON REPETICIÓNLas combinaciones sin repetición de n elementos tomados de p en p se definen como las distintas agrupaciones formadas con p elementos distintos, eligiéndolos de entre los n elementos de que disponemos, considerando una variación distinta a otra sólo si difieren en algún elemento, (No influye el orden de colocación de sus elementos). El número de combinaciones que se pueden construir se puede calcular mediante la fórmula:

Las combinaciones con repetición de n elementos tomados de p en p se definen como las distintas agrupaciones formadas con p elementos que pueden repetirse, eligiéndolos de entre los n elementos de que disponemos, considerando una variación distinta a otra sólo si difieren en algún elemento, (No influye el orden de colocación de sus elementos). El número de combinaciones que se pueden construir se puede calcular mediante la

43

Page 44: ESTADÍSTICA

nCr=

n !r ! (n−r ) !

fórmula:

nCRr=

(n+r−1 )!r ! (n−1 ) !

EJERCICIOS RESUELTOS DE COMBINATORIA

1. Un vendedor quiere visitar 5 ciudades (por ejemplo Albacete, Barcelona, Córdoba, Denia y Madrid). Si no quiere repetir ciudades, ¿cuántas rutas distintas puede elaborar si puede empezar y acabar en cualquiera de las ciudades?

El vendedor puede elegir la primera ciudad que visitará de entre las 5. Elegirá la segunda ciudad que visitará de entre las 4 restantes. Para la tercera ciudad tiene 3 opciones. Para la cuarta, 2. y para la última, 1.

Así que puede elaborar 5·4·3·2·1 = 120 rutas distintas.

Podemos utilizar también la fórmula de las permutaciones y decir que P=n !=5 !=120

2. ¿Cuántas permutaciones pueden formarse con las letras de la palabra BONDAD?

Hay 6!/2! Si se escribe en lugar de BOND’AD: BONDAD’. Todas las letras son distintas, luego hay 6! permutaciones, pero cada par de permutaciones: - - - D – D’, - - - D’- D coinciden, por lo tanto se tiene que dividir por 2 el número total de permutaciones

EJERCICIOS PROPUESTOS DE COMBINATORIA

1. ¿Cuántas cantidades de tres cifras se pueden formar con los dígitos 1, 2, 3 y 4 si no se permite la repetición? (R. 24)

2. ¿Cuántas cantidades de cuatro cifras se pueden formar con los dígitos 1, 2, 3 y 4 si se permite la repetición? (R. 256)

3. De entre 8 personas debemos formar un comité de cinco miembros. ¿Cuántas diferentes posibilidades existen para formar el comité? Solución: (R. 56)

4. ¿Cuántas cantidades de cuatro cifras se pueden formar con los dígitos 4, 5, 6, 7, 8 y 9 si no se permite la repetición? (R. 360)

44

Page 45: ESTADÍSTICA

5. ¿Cuántas cantidades de tres cifras se pueden formar con los dígitos 3, 4, 5 y 6 si se permite la repetición? (R. 64)

6. Un entrenador de baloncesto dispone de 12 jugadores. ¿Cuántos diferentes equipos de cinco jugadores puede formar? (R. 792)

7. De una clase de 20 niñas se escogerán 6 para ir a un paseo. ¿Cuántos posibles grupos de 6 se pueden formar? (R. 38760)

8. Se tienen 3 libros: uno de aritmética (A), uno de biología (B) y otro de cálculo (C), y se quiere ver de cuántas maneras se pueden ordenar en un estante. (R. 6)

9. Se tienen 7 libros y solo 3 espacios en una biblioteca, y se quiere calcular de cuántas maneras se pueden colocar 3 libros elegidos; entre los siete dados, suponiendo que no existan razones para preferir alguno. (R. 35).

10. Si en un colectivo hay 10 asientos vacíos. ¿En cuántas formas pueden sentarse 7 personas? (R.604800).

APROXIMACIÓN DE STIRLING A n!

Cuando n es grande, la evaluación directa de n! es difícil. En tal caso, se usa una fórmula aproximada debida a James Stirling:

n !≈√2πn nn e−n

Donde e = 2.71828… es la base natural de logaritmos.

DISTRIBUCIÓN BINOMIAL

Si p es la probabilidad de que ocurra un suceso en un solo intento (llamada probabilidad de éxito) y q= 1 – p es la probabilidad de que no ocurra en un solo intento (llamada probabilidad de fracaso), entonces la probabilidad de que el suceso ocurra exactamente X veces en N intentos (o sea, X éxitos y N – X fracasos) viene dada por:

p ( x )=¿ ( N ¿ )¿¿

¿¿

Donde X = 0, 1, 2,..., N; N! = N (N – 1)( N – 2)…¿ 1; y 0! = 1 por definición.

EJERCICIO 1.

La probabilidad de obtener exactamente 2 caras en 6 tiradas de una moneda es:

(6 ¿ ) ¿¿

¿¿

Usando la fórmula con N = 6, X = 2 y p = q = 12 .

45