22
ESTADÍSTICA ESTADÍSTICA UNIDIMENSIONAL Población (universo): cualquier conjunto de personas, objetos, animales, plantas, instituciones o entes en general que son portadores de una serie de características que nos interesa estudiar. Puede ser finita o infinita según el número de elementos que la componen. Muestra: todo subconjunto representativo de la población. Tamaño muestral = N. Atributo: característica poblacional cualitativa (no puede ser medida numéricamente) y dividida en modalidades. Por ejemplo: sexo (hombre, mujer), color, profesión, estado civil (soltero, casado, viudo), imagen pública (mala, regular, buena), etc. Variable: característica poblacional cuantitativa (puede tomar valores numéricos). Las variables pueden ser discretas (si toman valores puntuales finitos o infinitos) o continuas (si toman infinitos valores en intervalos). Por ejemplo: salarios, ventas, pesos, edades, etc. TABLA DE FRECUENCIAS Ejemplo: Las edades (X) de los 20 niños de una fiesta se distribuyen de la forma siguiente: 3 niños tienen 1 año, 4 niños tienen 2 años, 1 niño tiene 3 años, etc. Las 2 primeras columnas resumen los datos y, a partir de ellas, se calculan las siguientes. X (edad: variable discreta) n (frecuencia absoluta: nº de veces que aparece cada x en la muestra) N (frecuencia absoluta acumulada) f = n / N (frecuencia relativa) F (frecuencia relativa acumulada) 1 2 3 4 5 6 3 4 1 6 2 4 3 7 8 14 16 20 3/20 = 0’15 4/20 = 0’20 1/20 = 0’05 6/20 =0’30 2/20 = 0’10 4/20 = 0’20 3/20=0’15 7/20=0’35 8/20=0’40 14/20=0’70 16/20=0’80 20/20=1 N = 20 (tamaño muestral) 1 1

TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

Embed Size (px)

Citation preview

Page 1: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

ESTADÍSTICA UNIDIMENSIONAL

Población (universo): cualquier conjunto de personas, objetos, animales, plantas, instituciones o entes en general que son portadores de una serie de características que nos interesa estudiar. Puede ser finita o infinita según el número de elementos que la componen.

Muestra: todo subconjunto representativo de la población. Tamaño muestral = N.

Atributo: característica poblacional cualitativa (no puede ser medida numéricamente) y dividida en modalidades. Por ejemplo: sexo (hombre, mujer), color, profesión, estado civil (soltero, casado, viudo), imagen pública (mala, regular, buena), etc.

Variable: característica poblacional cuantitativa (puede tomar valores numéricos). Las variables pueden ser discretas (si toman valores puntuales finitos o infinitos) o continuas (si toman infinitos valores en intervalos). Por ejemplo: salarios, ventas, pesos, edades, etc.

TABLA DE FRECUENCIAS

Ejemplo:Las edades (X) de los 20 niños de una fiesta se distribuyen de la forma siguiente: 3 niños tienen 1 año, 4 niños tienen 2 años, 1 niño tiene 3 años, etc.Las 2 primeras columnas resumen los datos y, a partir de ellas, se calculan las siguientes.

X(edad: variable discreta)

n(frecuencia absoluta: nº de

veces que aparece cada x en la muestra)

↑N(frecuencia

absoluta acumulada)

f = n / N(frecuencia

relativa)

↑F(frecuencia

relativa acumulada)

123456

341624

378141620

3/20 = 0’154/20 = 0’201/20 = 0’056/20 =0’302/20 = 0’104/20 = 0’20

3/20=0’157/20=0’358/20=0’4014/20=0’7016/20=0’80

20/20=1

N = 20

(tamaño muestral)1

1

Page 2: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

MEDIDAS DE POSICIÓN: son valores importantes de la variable X.

1. Media (aritmética):N

nxX ∑ ⋅

= (es el valor medio de las x de la muestra)

2. Moda = Mo:

a) Variable discreta: La moda es el valor x con mayor frecuencia absoluta (n), es decir, el valor de x que aparece más veces en la muestra.

b) Variable continua:

Si los intervalos son iguales, es decir, tienen amplitud constante a:

ann

nAMo

ii

i ⋅+

+=+−

+

11

1

donde ( ]BA, es el intervalo modal (el de mayor frecuencia absoluta in ).

Si los intervalos son diferentes, es decir, tienen amplitud variable ai:

iii

i add

dAMo ⋅

++=

+−

+

11

1

donde ( ]BA, es el intervalo modal (el de mayor densidad de frecuencia id ).

3. Mediana = Me:

Para calcular la mediana los valores de x deben estar ordenados de menor a mayor (o viceversa).

a) Variable discreta: La Mediana es el valor de x que ocupa la posición central, es decir, tiene el 50% (N/2) de los valores a su izquierda y el otro 50% (N/2) a su derecha. Si N es impar, coincidirá con el valor central de las x de la muestra. Si N es par, se calculará la media de los dos valores centrales.

b) Variable continua: tanto en el caso de intervalos iguales como diferentes, se calcula de la misma forma (ver ejemplos).

4. Cuartiles: 321 ,, QMeQQ = (los cálculos siguen el mismo procedimiento que para la mediana).

a) Variable discreta: Los Cuartiles dividen la muestra en cuatro intervalos que contienen el 25% (N/4) de los valores de x.

b) Variable continua: tanto en el caso de intervalos iguales como diferentes, se calculan de la misma forma (ver ejemplos).

2

Page 3: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

MEDIDAS DE DISPERSIÓN:

Miden la dispersión de los valores de x de la muestra. Las varianzas y desviaciones pueden usarse para comparar la dispersión de dos variables sólo si éstas tienen la misma media aritmética (o la misma mediana).

minmaxxxRRANGO −=

( )22 2 X

N

nxX

SVARIANZA −∑ ⋅=

VARIANZAx

SSTANDARDTÍPICADESVIACIÓN +=)(

21-N

N 2

1, XS

NXSCORREGIDAVARIANZA ⋅=−

CORREGIDAVARIANZANX

SCORREGIDASTANDARDTÍPICADESVIACIÓN +=−1,)(

3

Page 4: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

CÁLCULOS para VARIABLE DISCRETA

X(DISCRETA)

n x . n x2 . n

123456

341624

1.3 = 32.4 = 83.1 = 34.6 = 245.2 = 106.4 = 24

12 .3 = 322 .4 = 1632 .1 = 942 .6 = 9652 .2 = 5062 .4 = 144

N = 20 72 318

( )

76,109,3 5154

3

09,32,94 19

20

1-N

N 25

4

715'194'2 4102

94'26'320

318 46

516 6'320

72

:dispersión de Medidas :posición de Medidas

1,3

221,1

2

222

2

minmax

=+==→=

=⋅=⋅==→=

=+===→=

=−=−⋅

==→=

=−=−===⋅

=

NX

XNX

X

X

SQN

SSQN

SQMeN

XN

nxSMon

xxRN

nxX

4

Page 5: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

Representaciones gráficas para VARIABLE DISCRETA:

DIAGRAMA DE BARRAS Y POLíGONO DE FRECUENCIAS

(las alturas de las barras pueden ser las frecuencias absolutas n, las relativas f o las acumuladas ↑N o ↑F )

5

X

n

21 3 4 5 6

1

2

3

4

5

6

Page 6: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

CÁLCULOS para VARIABLE CONTINUA(intervalos IGUALES)

Marca de clase o punto medio del intervalo ( ]BA, : 2

BAx

+=

X(CONTINUA:

en clases o intervalos iguales)

x(marca de clase = punto medio del

intervalo)

n x . n x2 . n

[ 0 , 10 )[ 10 , 20 )[ 20 , 30 )[ 30 , 40 )

5152535

2312

5.2 = 1015.3 = 4525.1 = 2535.2 = 70

52 .2 = 50152 .3 = 675252 .1 = 625352 .2 = 2450

N = 8 150 3800

( )

30)30,20[:364

3

8773'11 0714'14110)10,0[:124

0714'1414375'123 7

8

1-N

N 67'16 )20,10[:4

2

1102'11 4375'123 33'131021

110

4375'12375'188

3800 )20,10[:3

40040 75'188

150

:dispersión de Medidas :posición de Medidas

3

1,1

221,2

11

1

222

2

minmax

=→=

=+==→=

=⋅=⋅===→=

=+==⋅+

+=⋅+

+=

=−=−⋅

=→=

=−=−===⋅

=

+−

+

QcuartílicoIntervaloN

SQcuartílicoIntervaloN

SSQMeMedianoIntervaloN

Sann

nAMo

XN

nxSModalIntervalon

xxRN

nxX

NX

XNX

Xii

i

X

6

Page 7: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

Representaciones gráficas para VARIABLE CONTINUA con intervalos IGUALES:

HISTOGRAMA Y POLíGONO DE FRECUENCIAS

(las alturas de las barras pueden ser las frecuencias absolutas n, las relativas f o las acumuladas ↑N o ↑F )

7

X

n

100 20 30 40

1

2

3

Page 8: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

CÁLCULOS para VARIABLE CONTINUA(intervalos DIFERENTES)

X(CONTINUA:

en clases o intervalos diferentes)

x

(marca de clase = punto medio del intervalo)

n x . n x2 . n d = n / a(d = densidad de

frecuencia,a = amplitud de cada

intervalo)

[ 0 , 10 )[ 10 , 30 )[ 30 , 50 )[ 50 , 60 )

5204055

4352

5.4 = 2020.3 = 6040.5 = 20055.2 = 110

52 .4 = 100202 .3 = 1200402 .5 = 8000552 .2 = 6050

4/10 = 0’43/20 = 0’155/20 = 0’252/10 = 0’2

N = 14 390 15350(Sólo se usan para calcular la moda y

dibujar el histograma)

( ) ( )

44)50,30[:35'104

3

5757'18 0576'34575'8)10,0[:15'34

0576'3454106'320 13

14

1-N

N 30 )30,10[:7

2

9'17 4106'320101015'00

15'00

4106'3208571'2714

15350 )10,0[:4'0

60060 8571'2714

390

:dispersión de Medidas :posición de Medidas

3

1,1

221,2

11

1

222

2

minmax

=→=

=+==→=

=⋅=⋅===→=

=+==⋅+

+=⋅+

+=

=−=−⋅

=→=

=−=−===⋅

=

+−

+

QcuartílicoIntervaloN

SQcuartílicoIntervaloN

SSQMeMedianoIntervaloN

Sadd

dAMo

XN

nxSModalIntervalod

xxRN

nxX

NX

XNX

Xiii

i

X

8

Page 9: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

Representaciones gráficas para VARIABLE CONTINUA con intervalos DIFERENTES:

HISTOGRAMA Y POLíGONO DE FRECUENCIAS

(las alturas de las barras son las densidades de frecuencia d)

9

d

100 5030 60

0’1

0’2

0’3

0’4

X

20 40

Page 10: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

EJERCICIOS PROPUESTOS

1. Un opositor se ha sometido a la realización de varias pruebas. En cuatro pruebas ha obtenido la calificación 7, en tres la nota 8, en tres la nota 9 y en dos un 10. ¿Cuál será su calificación media?

Sol: 8,25

2. Encuentra la media, la moda, la mediana, la desviación típica y la varianza de la siguiente distribución:

x 1 2 3 4 5frecuencia absoluta 3 4 1 6 2

369,1;875,1;5,3;4;3: 2 ===== σσMeMoxsol

3. La tabla siguiente indica la edad de 40 socios de un club:

Edad 15 16 17 18 19Nº socios 5 8 2 20 5

a) Haz el diagrama de barras correspondiente.b) Calcula la media de las edades y la desviación típica.c) Calcula la moda y la mediana.d) ¿Cuál es la edad máxima del 25% de los socios más jóvenes? ¿Y la edad mínima del 25% de los socios mayores?

Sol:

1816)

1818)

27.161.13.17)

31

2

====

===

QQd

MeMoc

xb xx σσ

4. Se ha realizado una encuesta sobre opiniones políticas a un colectivo de 88 alumnos universitarios, obteniendo los siguientes resultados (0 = extrema derecha, 100 = extrema izquierda):

Puntuación Nº de universitarios[38-44)[44-50)[50-56)[56-62)[62-68)[68-74)[74-80)

7815251896

a) Dibuja el correspondiente histograma y el diagrama de frecuencias.b) Calcula la media, la moda, la mediana, la varianza y la desviación típica de esta variable estadística.c) ¿Cuál es la puntuación máxima del 25% de los alumnos más de derechas? ¿Y la puntuación mínima del 25% más de izquierdas?

10

Page 11: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

Sol:

67,658,52)

4,921,8936,5927,59136,59)

31

2

=======

QQc

MeMoxb xx σσ

5. Considera la siguiente tabla de frecuencias agrupadas:

Intervalo 3,5-6,5 6,5-9,5 9,5-12,5 12,5-15,5 15,5-18,5Frecuencia 3 5 9 6 2

Dibuja el correspondiente histograma y el polígono de frecuencias. Calcula la media y la desviación típica.

sol x x: , ; ,= =10 88 3 339σ

6. La distribución de edades del profesorado de una universidad viene dada por la tabla siguiente:

menos de 22 años

entre 22 y 30 años

entre 30 y 40 años

entre 40 y 50 años

entre 50 y 60 años

más de 60 años

4 206 172 110 28 8

Tomamos como marcas de clase las medias de cada intervalo. Para el primer intervalo tomamos como marca de clase 21 años. Para el último intervalo tomamos como marca de clase 64 años.

a) Dibuja el histograma de las edades y, a partir de lo que salga, haz alguna reflexión sobre la edad del profesorado de esta universidad.

b) Calcula la media y la desviación típica de esta distribución.c) Calcula la moda y la mediana.

Sol:

14,3317,29)

36,997,34)

====

MeMoc

xb xσ

7. Los resultados obtenidos al lanzar un dado de color rojo 200 veces están expresados en la siguiente tabla:

Nº puntos 1 2 3 4 5 6Repeticiones n1 32 35 33 n5 35

Determina los datos que faltan, sabiendo que la puntuación media es 3,6, y calcula la mediana y la moda.

sol n n M Me o: ; ; ;1 529 36 4 5= = = =

11

Page 12: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

8. Un profesor ha realizado 2 test a un grupo de 40 alumnos, obteniendo los siguientes resultados:- Para el primer test la media es 6 y la desviación típica es 1,5.- Para el segundo test la media es 4 y la desviación típica es 0,5.Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relación con el grupo, ¿en cuál de los dos test ha obtenido mejor puntuación? Justifica la respuesta.

Sol: Mejor en el segundo test.

9. Hemos revisado las notas del examen de Matemáticas de dos clases de 40 alumnos. En grupo A hemos obtenido una media de 5,2 y una desviación típica de 1. En el grupo B la media ha sido 5,4 y la desviación típica nos ha dado 3. En uno de los dos grupos ha habido 13 suspensos y 7 excelentes, mientras que en el otro hemos contado 4 suspensos y 2 excelentes. Razona cuál de estos resultados se corresponde con cada grupo.

AyB:sol

10. Al estudiar los resultados del examen del grupo A hemos comprobado que la media es 6 y la desviación típica es 1. En el examen del grupo B, la media también es 6, pero la desviación típica es 2. Analiza cómo ha ido el examen comparativamente en los grupos A y B.

sol : mejor en el grupo A.

12

Page 13: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

ESTADÍSTICA BIDIMENSIONAL (X, Y)

( ) ( )

( )

yx

xyxy

xy

YyXx

YX

SS

SrPEARSONDENCORRELACIÓDEECOEFICIENT

YXN

nyxSCOVARIANZA

SSSSesDesviacion

YN

nySX

N

nxSVarianzas

N

nyY

N

nxXMedias

⋅==

⋅−⋅⋅

==

==

−⋅

=−⋅

=

⋅=

⋅=

∑∑

∑∑

22

22

222

2

:

:

:

(En la mayoría de ejercicios las frecuencias absolutas valen n = 1)

.

)(

X) de depende (YXA RESPECTO Y DE REGRESIÓN DERECTA

2

−=

=+=

XbYa

pendienteS

Sb

abxy x

xy

La recta de regresión sirve para realizar estimaciones de los valores de y dados los valores de x.Dichas estimaciones sólo son fiables si la correlación entre las variables es suficientemente fuerte, de forma que la nube de puntos se ajuste bastante a la recta. Podemos representar gráficamente la recta de regresión en los mismos ejes que la nube de puntos.

13

Page 14: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

TIPOS DE CORRELACIÓN (DEPENDENCIA LINEAL) ENTRE LAS VARIABLES:

11 ≤≤− r

Si r = 1: correlación directa o positiva perfecta (los puntos de la nube están alineados sobre la recta de regresión, que es creciente).

Si r = -1: correlación inversa o negativa perfecta (los puntos de la nube están alineados sobre la recta de regresión, que es decreciente).

Si r = 0: la correlación entre las variables no existe, pero podría existir algún otro tipo de dependencia parabólica, exponencial, logarítmica, etc.

Consideramos que existe correlación suficientemente fuerte entre las variables cuando:

r > 0’75 ó r < -0’75.

+ fuerte + débil + fuerte

-1 - 0’75 0 0’75 1

14

Page 15: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

"DIAGRAMA DE DISPERSIÓN" O "NUBE DE PUNTOS"

(representamos cada par de valores (x, y) de la distribución en los ejes de coordenadas)

CORRELACIÓN POSITIVA (DIRECTA):

X ↑ ⇒ Y ↑ X ↓ ⇒ Y ↓

Sxy > 0 , r > 0 , b > 0

. ...

.

...

.

.

.

.

. .. .

CORRELACIÓN NEGATIVA (INVERSA):

X ↑ ⇒ Y ↓ X ↓ ⇒ Y ↑

Sxy < 0 , r < 0 , b < 0

.

. .. .

..

.

. .

. ..

.

.

.

.

.

CORRELACIÓN NULA:

.

.

.

..

...

.

..

.

.

.

.

.

..

. .

.

.

15

Page 16: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

EJEMPLO 1:

La tabla siguiente muestra el peso (en kg) y la estatura (en cm) de 9 personas con sobrepeso.

X Y x2 y2 x . y

726573627073686777

154152178137142165176161152

518442255329384449005329462444895929

237162310431684187692016427225309762592123104

110889880129948494994012045119681078711704

627 1417 43853 224663 98900

(Las frecuencias absolutas son todas n = 1)

( ) ( )

),(35'018'1337'4

04'20

04'20)44'15767'69(9

98900

18'1380'17337'411'19:

80'17344'1579

22466311'1967'69

9

43853:

44'1579

141767'69

9

627:

2222

débilpositivorNCORRELACIÓDEECOEFICIENT

SCOVARIANZA

SSesDesviacion

SSVarianzas

YXMedias

xy

xy

yx

YX

=⋅

==

=⋅−==

====

=−==−=

====

29'8405'1

29'8467'6905'144'157.

05'111'19

04'20

:XA RESPECTO Y DE REGRESIÓN DERECTA

2 +=

=⋅−=−=

===+= xy

XbYa

S

Sb

abxy x

xy

¿Cuál sería la estatura estimada de una persona que pesara 71 kg?

16

cmy 15984'15829'847105'1 ≈=+⋅=

Page 17: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

EJEMPLO 2:

La tabla de frecuencias conjuntas siguiente muestra los ingresos anuales X de una familia (en miles de euros) e Y el número de miembros de la familia aportadores de ingresos. La muestra contiene información de 100 familias.

X \ Y 1 2 3 frecuencia marginal de X12 18 0 0 1817 0 25 7 3225 0 30 16 4640 3 0 1 4

frecuencia marginal de Y 21 55 24 N = 100

También podría expresarse de la forma:

X ingresos

Ynº aportadores

nnº familias

x . n y . n x2 . n y2 . n x . y . n

12171725254040

1232313

18257301631

21642511975040012040

185021604833

259272252023187501000048001600

181006312014439

21685035715001200120120

N = 100 2070 203 46990 457 4363

( ) ( )

),(3731'06701'04351'6

609'1

609'1)03'27'20(100

4363

6701'04491'04351'641'41:

4491'003'2100

45741'417'20

100

46990:

03'2100

2037'20

100

2070:

2222

débilpositivorNCORRELACIÓDEECOEFICIENT

SCOVARIANZA

SSesDesviacion

SSVarianzas

YXMedias

xy

xy

yx

YX

=⋅

==

=⋅−==

====

=−==−=

====

2248'10389'0

2248'17'200389'003'2.

0389'041'41

609'1

:XA RESPECTO Y DE REGRESIÓN DERECTA

2 +=

=⋅−=−=

===+= xy

XbYa

S

Sb

abxy x

xy

17

Page 18: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

18

Page 19: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

EJERCICIOS

1. La media de las calificaciones de Lengua de unos estudiantes es 6,5 y la varianza 3, mientras que la media de las calificaciones de Física es 5,5 y la varianza 5. La covarianza de las variables X (notas de Lengua) e Y (notas de física) es 2,4. Calcula la recta de regresión de Y respecto X. ¿Qué nota de Física se esperaría de un estudiante que ha obtenido un 8 de Lengua?

Sol: 7,63,08,0 =+= yxy

2. La evolución del IPC y de la tasa de inflación en el primer semestre del año pasado fue:

MES ENERO FEBRERO MARZO ABRIL MAYO JUNIOIPC 0,7 1,1 1,7 2 1,9 1,9

Inflación 6 6 6,3 6,2 5,8 4,9

Se pide:a) La media del IPC y de la tasa de inflación.b) La desviación típica del IPC y de la tasa de inflación.c) Relaciona el coeficiente de correlación con la nube de puntos.

sol

a x y

b

c rx y

xy

:

) , ; ,

) , ; ,

) , ; ,

= == =

= − = − ≅

1 55 5 87

0 482 0 461

0 0533 0 24 0

σ σσ

3. En un experimento para estudiar la relación que hay entre la dosis de un medicamento y el tiempo de reacción de una persona estimulada ante una señal auditiva, se han recogido los siguientes datos:

dosis (mg) 1 3 4 7 9 12 13 14tiempo (s) 3,5 2,4 2,1 1,3 1,2 2,2 2,6 4,2

a) Haz una nube de puntos en el plano de coordenadas poniendo en las abscisas la dosis, y en las ordenadas, el tiempo. ¿Crees que el tiempo depende de la dosis?b) ¿Se puede ajustar la nube mediante una recta?

¿Tiene sentido calcular el coeficiente de correlación en este caso?¿Qué mide el coeficiente de correlación?

4. Unos datos recogidos durante los tres últimos años sobre la pluviosidad y la venta de paraguas en una ciudad indican lo siguiente:

año 1989 1990 1991lluvia en mm. 830 1050 760

número de paraguas vendidos

32427 34200 28642

a) Calcula las medias y las desviaciones estándar de las dos variables, y también el coeficiente de correlación. Escribe las fórmulas correspondientes.

19

Page 20: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

b) ¿Qué signo tiene la pendiente de la recta de regresión? ¿Podemos contestar sin tener que hacer cálculos? ¿Por qué?

sol a x y rx y: ) ; , ; , ; , ; ,= = = = =880 31756 3 123 56 2318 071 0 8793

σ σ

5. En unas pruebas de rendimiento físico y deportivo de unos estudiantes se observaron las pulsaciones por minuto en reposo y los tiempos invertidos en una carrera. La media de las pulsaciones fue 72 con una desviación estándar de 4, y la media de los tiempos, 14 minutos con una desviación estándar de 5. El coeficiente de correlación fue de 0,4. Estima, mediante una recta de regresión, el tiempo de un estudiante que tiene 76 pulsaciones por minuto.

Sol: 16225,0 =−= yxy

6. Cinco niñas de 2, 3, 5, 7 y 8 años pesan respectivamente 14, 20, 30, 42 y 44 Kg.a) Calcula la ecuación de la recta de regresión del peso sobre la edad.b) ¿Cuál sería el peso estimado de una niña de 6 años?

Sol: 2,35)42,5) =+= ybxya

7. En la tabla siguiente se indica la producción de automóviles de un país en millones de unidades; la variable X corresponde a los años y la variable Y, a la producción:

X 1980 1981 1982 1983 1984Y 70 74 75 78 85

Sabemos que la media de la variable X es 1982 y que la desviación estándar es 1,41; la media de la variable Y es 76,4 con una desviación estándar 5,00. Encuentra la ecuación de la recta de regresión de Y sobre X y utilízala para predecir la producción de automóviles que se puede esperar para 1993.

Sol: 02,11404,670242,38,6 =−== yxyxyσ

8. En la tabla siguiente tenemos los porcentajes de población rural de una comunidad:

año 1962 1968 1975 1982 1992% de pobl. 58 55 51 49 45

Llamamos X a los años e Y al porcentaje de población rural, y encontramos que la media de X vale 1975,8 con una desviación estándar de 10,51, y que la media de Y vale 51,6 con una desviación estándar de 4,54. a) Calcula la recta de regresión de Y sobre X en esta distribución. ¿Podríamos saber el signo

de la pendiente sin hacer cálculos?b) Estima, con la ayuda de la recta de regresión, el porcentaje de población rural que habrá

en el año 2000.

Sol: 19,41) 19,90143,048,47) =+−=−= ybxya xyσ

9. Una distribución bidimensional (xi, yi) donde xi corresponde a la altura de las mujeres e yi

corresponde a la altura de sus hijas, todas medidas en cm., tiene como recta de regresión y x= +0 72 4319, , .

a) ¿Qué significa que el coeficiente de correlación sea positivo?b) ¿Cuál será la altura estimada de la hija de una mujer que mida 160 cm.?

20

Page 21: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

sol b x y: ) ,= ⇒ =160 158 39

10. Para estudiar el efecto de un nuevo fertilizante, hemos asignado distintos niveles a cuatro campos similares y hemos recogido los datos de producción siguientes:

X ( fertilizante en Kg. ) 1 2 4 5Y ( producción en tm. ) 70 70 80 100

Sabemos que la media de X vale 3, con una desviación estándar de 1,58, y que la media de Y vale 80, con una desviación estándar de 12,24.a) Representa la nube de puntos y calcula el coeficiente de correlación.b) Utiliza la recta de regresión de Y sobre X para hacer una predicción de la producción en el caso que pongamos 3 Kg. de fertilizante.

8097,5801,7) 905,05,17) =+=== yxybra xyσ

11. Las alturas de cuatro chicas x i y las de sus respectivas madres y i son las siguientes:

x i 155 160 150 162y i 150 180 140 160

a) Representa los valores de la tabla con una nube de puntos.b) Tenemos x y x y= = = =1 5 6 7 5 1 5 7 5 4 6 5 1 4 7 9, ; , ; , ; ,σ σ . Calcula el coeficiente de

correlación r y la recta de regresión de Y sobre X.

Sol: 94,23551,279,0375,54) −=== xyrb xyσ

12. La tabla siguiente indica la evolución de la población con empleo respecto a la población activa de un país en los últimos años:

año 1962 1968 1975 1982 1992% de población activa 58 55 51 49 45

Si llamamos X a los años e Y al porcentaje de población con empleo, hemos calculado que la media de X vale 1975,8 y su desviación estándar vale 10,51; la media de Y vale 51,6 y su desviación estándar vale 4,54.a) Antes de hacer ningún cálculo, indica justificadamente lo que se pueda saber sobre el signo

de la pendiente de la recta de regresión de esta distribución. Calcula, a continuación, la recta de regresión.

b) ¿Cuál es el porcentaje de población ocupada que podemos prever con la recta de regresión para el año 1996?

Sol: %91,42)19,90143,048,47) bxya xy +−=−=σ

13. La evolución de la venta de televisores de un país en los últimos años se indica en la tabla siguiente, donde la variable X indica los años y la variable Y la venta de televisores, en miles de unidades:

X 1980 1981 1982 1983 1984Y 70 74 75 78 85

a) Calcula la media anual de televisores vendidos y su desviación estándar.

21

Page 22: TABLA o DISTRIBUCIÓN DE FRECUENCIAS · en clases o intervalos ... Dibuja el correspondiente histograma y el polígono de frecuencias. ... y la desviación típica de esta distribución

ESTADÍSTICA

b) Hemos calculado que la desviación estándar de la variable X es 1,41. Calcula la recta de regresión de Y sobre X y la venta de televisores prevista para el año 1993.

Sol: 04,670242,3 8,6 ) ,004,5 4,76 ) −==== xybYa xyy σσ

14. Durante su primer año de vida, han pesado a Marta cada mes. La siguiente tabla indica los correspondientes pesos:

Edad xi

(en meses)1 2 3 4 5 6 7 8 9 10 11 12

peso yi

(en kg)3,2 3,7 4,2 5,3 5,7 6,5 6,8 7,2 7,9 7,7 8 8,5

a) Calcula la media de los pesos y su desviación típica.b) Determina la ecuación de la recta de regresión de Y en X.

Sol: 04,349,08,5)72,1225,6) +==== xybYa xyy σσ

15. Disponemos de la tabla siguiente correspondiente a una distribución bidimensional:

xi 2 3 4 4 5 6 6 7 7 8 10 10yi 1 3 2 4 4 4 6 4 6 7 9 10

a) Sin hacer cálculos, justifica el signo que tendrá el coeficiente de correlación.b) Hemos calculado .,,,y,x xxy 452y 925 5 6 =σ=σ== Calcula la recta de regresión de y

sobre x.

Sol: 94,099,0)0) −=> xybra

16. La siguiente tabla representa los pesos y las alturas de 20 alumnos de COU:

nº alumnos 4 3 2 5 4 2peso 73 76 73 78 80 82altura 1,65 1,68 1,70 1,72 1,76 1,80

Se pide:a) ¿Cómo están correlacionados estos datos?b) ¿Cuál será la altura estimada para un alumno de este colectivo que pese 75 Kg?

Sol: 69,1002,05,9134,00636014,0)93,0) 22, ====+== yxybra yxyx σσσ

22