124
Universidad de Sevilla Dpto. Ecuaciones Diferenciales y An´alisis Num´ erico Res´ umeneste´oricos de la asignatura Matem´atica AplicadayEstad´ ıstica Grado en Farmacia Primer curso

Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Universidad de Sevilla

Dpto. Ecuaciones Diferenciales y Analisis Numerico

Resumenes teoricos de la asignatura

Matematica Aplicada y Estadıstica

Grado en Farmacia

Primer curso

Page 2: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

2

Page 3: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Indice general

1. Funciones, lımites, continuidad y derivabilidad 7

1.1. Numeros reales y nociones basicas sobre funciones . . . . . . . . . . . . . . . . 7

1.1.1. Conjuntos numericos. Conceptos de supremo, ınfimo, maximo y mınimo 7

1.1.2. Algunos conceptos sobre funciones. Composicion e inversa . . . . . . . . 10

1.2. Funciones elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3. Lımites de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.4. Continuidad de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

1.4.1. Discontinuidad de funciones. Clasificacion . . . . . . . . . . . . . . . . . 20

1.4.2. Propiedades de funciones continuas . . . . . . . . . . . . . . . . . . . . . 21

1.5. Derivadas: calculo, propiedades y aplicaciones . . . . . . . . . . . . . . . . . . . 22

1.5.1. Concepto de derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

1.5.2. Interpretacion geometrica de la derivada . . . . . . . . . . . . . . . . . . 24

1.5.3. Algebra de derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.5.4. Derivadas de las funciones elementales . . . . . . . . . . . . . . . . . . . 26

1.6. Aplicaciones de las derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.6.1. Calculo de extremos absolutos . . . . . . . . . . . . . . . . . . . . . . . 27

1.6.2. Monotonıa de la funcion . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.6.3. Regla de L’Hopital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.6.4. Concavidad y convexidad . . . . . . . . . . . . . . . . . . . . . . . . . . 32

1.6.5. Representacion Grafica de Funciones . . . . . . . . . . . . . . . . . . . . 35

2. Interpolacion polinomica 39

2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.2. Analisis previo (existencia y unicidad) . . . . . . . . . . . . . . . . . . . . . . . 39

2.3. Metodo de las Diferencias Divididas . . . . . . . . . . . . . . . . . . . . . . . . 40

3. La integral. Integracion numerica 43

3.1. Calculo de primitivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.2. Reglas de calculo de primitivas . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.2.1. Metodo de integracion por partes . . . . . . . . . . . . . . . . . . . . . . 46

3.2.2. Integracion de funciones racionales . . . . . . . . . . . . . . . . . . . . . 46

3.2.3. Metodo de sustitucion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.3. La integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3

Page 4: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

4 INDICE GENERAL

3.3.1. Propiedades de la integral definida . . . . . . . . . . . . . . . . . . . . . 51

3.4. Aplicaciones de la integral definida . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.4.1. Calculo de areas de superficies planas . . . . . . . . . . . . . . . . . . . 51

3.4.2. Cambio acumulativo o neto . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.4.3. Calculo de valores medios . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.5. Integracion numerica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4. Programacion lineal 59

4.1. Introduccion / motivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.2. Aplicaciones basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.3. Resolucion por el metodo geometrico . . . . . . . . . . . . . . . . . . . . . . . . 61

4.3.1. Analisis previo: Regiones factibles . . . . . . . . . . . . . . . . . . . . . 61

4.3.2. Metodo geometrico en regiones factibles acotadas . . . . . . . . . . . . . 63

4.3.3. Sobre la existencia de solucion y regiones factibles no acotadas . . . . . 63

5. Estadıstica descriptiva 65

5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2. Distribuciones estadısticas. Representaciones graficas . . . . . . . . . . . . . . . 65

5.2.1. Conceptos fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2.2. Tablas estadısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2.3. Representaciones graficas . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.3. Medidas de posicion y dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.3.1. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . 74

5.3.2. Medidas de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6. Variables estadısticas bidimensionales 81

6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

6.2. Tablas de doble entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

6.3. Relaciones entre las variables X e Y . . . . . . . . . . . . . . . . . . . . . . . . 83

7. Probabilidad. Distribuciones binomial y normal 89

7.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

7.2. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

7.3. Distribuciones discretas. La distribucion binomial . . . . . . . . . . . . . . . . . 91

7.4. Distribuciones continuas. La distribucion normal . . . . . . . . . . . . . . . . . 92

7.5. Calculo de probabilidades usando la tabla . . . . . . . . . . . . . . . . . . . . . 95

8. Teorıa de muestras y diseno de experimentos 97

8.1. Tipos de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

8.1.1. Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . 97

8.1.2. Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . 97

8.1.3. Muestreo aleatorio sistematico . . . . . . . . . . . . . . . . . . . . . . . 98

8.1.4. Muestreo por conglomerados y areas . . . . . . . . . . . . . . . . . . . . 98

8.2. Distribucion en el muestreo de la media . . . . . . . . . . . . . . . . . . . . . . 98

Page 5: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

INDICE GENERAL 5

8.3. Distribucion de la proporcion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1008.4. Distribucion en el muestreo de la diferencia de medias . . . . . . . . . . . . . . 1018.5. Ensayos clınicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

8.5.1. El grupo de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1028.5.2. Concepto de ensayo clınico. . . . . . . . . . . . . . . . . . . . . . . . . . 1028.5.3. Control del sesgo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1038.5.4. Disenos de un ensayo clınico . . . . . . . . . . . . . . . . . . . . . . . . . 1048.5.5. Metodos de asignacion aleatoria del tratamiento . . . . . . . . . . . . . 1058.5.6. Otros conceptos relacionados con el ensayo clınico . . . . . . . . . . . . 105

9. Inferencia estadıstica 1099.1. Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1099.2. Estimaciones de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1099.3. Estimacion puntual: parametro y estadıstico . . . . . . . . . . . . . . . . . . . . 1109.4. Propiedades de los estimadores puntuales . . . . . . . . . . . . . . . . . . . . . 1109.5. Estimacion por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1109.6. Intervalo de confianza para el parametro p de una distribucion binomial . . . . 1129.7. Intervalo de confianza para la media poblacional . . . . . . . . . . . . . . . . . 1139.8. Intervalo de confianza para la diferencia de medias. . . . . . . . . . . . . . . . . 1149.9. Tamano de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

10.Contraste de hipotesis 11710.1. Contraste de hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

10.1.1. Contrastes de hipotesis sobre la media de una distribucion . . . . . . . . 11910.2. Inferencia Estadıstica para la diferencia de dos muestras . . . . . . . . . . . . . 122

Page 6: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

6 INDICE GENERAL

Page 7: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 1

Funciones reales de variable real.Funciones elementales, lımites,continuidad, derivabilidad yaplicaciones

1.1. Numeros reales y nociones basicas sobre funciones

1.1.1. Conjuntos numericos. Conceptos de supremo, ınfimo, maximo y mıni-mo

Las necesidades sucesivas del hombre han obligado a modificar sus herramientas de tra-bajo para resolver problemas mas complejos. Ası, hay una evolucion en el desarrollo de losconjuntos numericos, siendo los mas frecuentes los siguientes.

Naturales N = 1, 2, 3, . . . (contar)imposibilidad de resolver p.ej. x + 7 = 0.

Enteros Z = N ∪ 0 ∪ −n : n ∈ N (N ⊂ Z)imposibilidad de resolver p.ej. 3x = 2.

Racionales Q = p

q: p ∈ Z, q ∈ N

(N ⊂ Z ⊂ Q) imposible resolver p.ej. x2 − 2 = 0.

Reales R = “clausura/completado” de Q

(N ⊂ Z ⊂ Q ⊂ R) recta real; axioma del supremo = Teor. de Cantor = Teor. de Bolzano

imposibilidad de resolver ecuaciones como x2 + 1 = 0.

Complejos C = a + bi : a, b ∈ R, i2 = −1(N ⊂ Z ⊂ Q ⊂ R ⊂ C) Toda ecuacion algebraica tiene solucion en C

7

Page 8: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

8 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

Operaciones y orden. Propiedades

De la Suma (+) N Z Q, R, C

Asociativa: a + (b + c) = (a + b) + c sı sı sıConmutativa: a + b = b + a sı sı sıEl. Neutro: a + 0 = 0 + a = a sı sıEl. Simetrico: a + (−a) = (−a) + a = 0 sı sı

Del Producto(·)Asociativa: a · (b · c) = (a · b) · c sı sı sıConmutativa: a · b = b · a sı sı sıEl. Neutro: a · 1 = 1 · a = a sı sı sıEl. Simetrico: a · a−1 = a−1 · a = 1 sı

Prop. distributiva:

a · (b + c) = a · b + a · c sı sı sıQ es un cuerpo ordenado(Q,+, ·) es un cuerpo conmutativo.Se define una relacion (≤) de orden: dados p, q,m, n ≥ 0, p

q ≤ mn ⇔ pn ≤ qm.

Propiedades:

Reflexiva: ∀a ∈ Q : a ≤ a.Antisimetrica: a ≤ b, b ≤ a ⇒ a = b.Transitiva: a ≤ b, b ≤ c ⇒ a ≤ c.Ademas, dicha relacion es total: ∀a, b ∈ Q, a ≤ b o b ≤ a.La relacion de orden es compatible con la suma y el producto:

a ≤ b ⇒ a + c ≤ b + c ∀a, b, c ∈ Q,

a ≤ b, c ≥ 0 ⇒ a · c ≤ b · c ∀a, b, c ∈ Q.

(Q,+, ·,≤) es un cuerpo ordenado. Podemos representarlos en un recta, PERO hay puntosen la recta que no se corresponden con ningun racional.

Teorema 1.1.√

2 6∈ Q, es decir, no existe ningun numero racional cuyo cuadrado sea 2.

Demostracion. Por Reduccion al Absurdo: supongamos que existe pq ∈ Q tal que

(pq

)2= 2 y

llegaremos a una contradiccion.Sin perdida de generalidad podemos suponer que p y q ∈ Z no tienen factores comunes.

Como p2

q2 = 2, se tiene p2 = 2q2, luego p2 es par. Ası tambien p es par (p = 2k) (si fuera

impar, p2 tambien lo serıa). Luego p2 = 4k2, con lo que q2 es par y q tambien.

Para “completar” la recta hasta llenarla debemos ampliar hasta los numeros reales. [masadelante veremos axiomas sobre su construccion: del supremo, y el Teorema de Bolzano.]

R es un cuerpo ordenado

Page 9: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.1. NUMEROS REALES Y NOCIONES BASICAS SOBRE FUNCIONES 9

En todo R se pueden definir operaciones suma (+) y producto (·) que extienden las defi-nidas antes, y una relacion de orden (≤) que tambien es total.

Dados a, b ∈ R, diremos quea ≥ b si b ≤ a.a < b si a ≤ b y a 6= b.a > b si b < a.

Numeros reales. Axioma del supremo

Definicion 1.2. Sea S ⊂ R. Se dice que:

a ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S.a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S.S esta acotado superiormente si tiene una cota superior.S esta acotado inferiormente si tiene una cota inferior.S esta acotado si tiene cotas superior e inferior.supremo de S (supS) la menor cota superior.ınfimo de S (ınfS) la mayor cota inferior.maximo de S (maxS) al supS si pertenece a S.mınimo de S (mınS) al ınfS si pertenece a S.

Axioma del supremo Todo subconjunto no vacıo de R acotado superiormente tiene unsupremo en R.

∅ 6= S ⊂ R, S acot. sup. ⇒ ∃sup S ∈ R.

ESTE AXIOMA NO SE CUMPLE EN Q

S = x ∈ Q : x2 < 2 ⊂ Q ⇒ sup S =√

2 6∈ Q.

(La prueba usa propiedades de densidad.)

Propiedades de R:

Propiedad (axioma) del ınfimo: todo subconjunto no vacıo de R acotado inferiormentetiene ınfimo.

∀x ∈ R, x > 0, ∃n ∈ N : x < n.

Propiedad arquimediana: ∀x > 0∀y ∈ R, ∃n ∈ N : y < nx. Una regla corta puedemedir distancias largas.

Densidad de los racionales:

∀x, y ∈ R, ∃q ∈ Q : x < q < y.

Entre dos numeros reales distintos siempre existe un racional, y en consecuencia, infinitosracionales.

Page 10: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

10 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

Densidad de los irracionales:

∀x, y ∈ R, ∃z ∈ R\Q : x < z < y.

Subconjuntos de R. Intervalos

[a, b] = x ∈ R : a ≤ x ≤ b intervalo cerrado.(a, b) = x ∈ R : a < x < b intervalo abierto.[a, b) = x ∈ R : a ≤ x < b semi-abierto semi-cerrado.(a, b] = x ∈ R : a < x ≤ b semi-abierto semi-cerrado.(−∞, b] = x ∈ R : x ≤ b intervalo no acotado.(−∞, b) = x ∈ R : x < b intervalo no acotado.[a,+∞) = x ∈ R : a ≤ x intervalo no acotado.(a,+∞) = x ∈ R : a < x intervalo no acotado.R = (−∞,+∞), R− = (−∞, 0], R+ = [0,+∞).

Funcion valor absoluto

|x| =

x si x ≥ 0,−x si x < 0,

x ∈ R.

Propiedades:

1. |x| ≥ 0 ∀x ∈ R.

2. |x| = 0 ⇔ x = 0.

3. |xy| = |x||y|, ∀x, y ∈ R.

4. | − x| = |x| ∀x ∈ R.

5. Desigualdad triangular: |x + y| ≤ |x| + |y| ∀x, y ∈ R.

6. |x| − |y| ≤∣∣|x| − |y|

∣∣ ≤ |x − y| ∀x, y ∈ R.

7. |x| ≤ a ⇔ −a ≤ x ≤ a ∀x ∈ R, a > 0.

8. |x − b| ≤ a ⇔ b − a ≤ x ≤ b + a ∀x, b ∈ R, a > 0.

9. |x| ≥ k ⇔ x ≥ k o x ≤ −k, ∀x ∈ R, k ≥ 0.

Las tres ultimas propiedades tambien son ciertas con < y > en vez de ≤ y ≥ .

1.1.2. Algunos conceptos sobre funciones. Composicion e inversa

Definicion 1.3. Se llama funcion (real de variable real) a toda aplicacion

f : R → R

x 7→ f(x)

que a cada numero x le hace corresponder otro valor f(x).

Page 11: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.1. NUMEROS REALES Y NOCIONES BASICAS SOBRE FUNCIONES 11

Definicion 1.4. Se llama dominio de una funcion f (lo denotaremos por Dom f) al conjuntode valores para los que esta bien definida f(x) :

Domf = x ∈ R : ∃f(x) ∈ R.

f : Domf ⊂ R → R : x 7→ f(x).

Habra ocasiones en que nos den una formula y debamos hallar el dominio en que es validaaplicarla:f(x) =

√x Domf = R+.

f(x) =1

xDomf = R\0.

Imagen o rango o recorrido de f ≡ valores que toma f :

Imf = f(x) : x ∈ Domf.

Sea f : Domf ⊂ R → R. Se dice que es:

Par si f(−x) = f(x) ∀x ∈ Domf.Impar si f(−x) = −f(x) ∀x ∈ Domf.Periodica si ∃T > 0 : f(x + T ) = f(x) ∀x ∈ Domf.(Representacion) Grafica de f a la representacion en ejes cartesianos del siguiente

conjunto de puntos del plano:

(x, f(x)) ∈ R2 : x ∈ Domf.

Antes incluso de describir las funciones elementales, debemos mostrar un procedimientoque ayudara, una vez tengamos definido un conjunto de funciones, a “combinarlas” para ge-nerar mas, e incluso definir otras que cumplan determinadas propiedades respecto de estascombinaciones. Este procedimiento es la composicion de funciones.

Definicion 1.5. Dadas dos funciones f : S ⊂ R → R, g : T ⊂ R → R tales que f(S) ⊂ T, sedefine la funcion compuesta g f : S ⊂ R → R : x 7→ (g f)(x) = g(f(x)).

Ejemplo 1.6. En general g f 6= f g. Sean f(x) = x2, g(x) = x + 1. g(f(x)) = x2 + 1,f(g(x)) = (x + 1)2.

Definicion 1.7. Llamamos funcion inversa o recıproca respecto de la composicion de unafuncion dada f : S → R y notamos f−1, a una funcion f−1 : f(S) → R tal que y ∈ f(S) 7→f−1(y) = x con f(x) = y.

Se cumple entonces que (f f−1)(x) = x ∀x ∈ S,(f−1 f)(y) = y ∀y ∈ f(S).Ademas, se obtiene la siguiente relacion de simetrıa entre las representaciones graficas de

una funcion y su inversa (ya que consiste en intercambiar los papeles de las variables x e y).Simetrıa respecto la bisectriz del primer cuadrante:

Page 12: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

12 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

-

6

x

y

y = xy = x2

y =√

x

Simetrıa respecto la bisectriz

1.2. Funciones elementales

Funciones polinomicas

p : R → R : x 7→ p(x) = a0 + a1x + a2x2 + . . . + anxn donde ai ∈ R i = 0, 1, 2, . . . , n, siendo

an 6= 0.

Domp = R

Caso n = 1. RectaSolo son necesarios dos valores

-

6

x

• a0

y

La recta y = a0 + a1x

Caso n = 2. La parabola p(x) = ax2 + bx + c (con a 6= 0)Puede tener hasta dos puntos de corte con el eje OX.

-

6

x

y

A

V

• B

V =(− b

2a , p(− b2a))

Page 13: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.2. FUNCIONES ELEMENTALES 13

A,B =−b ±

√b2 − 4ac

2a

Para grados superior a 2 debemos esperar a tener mas herramientas para conocer su re-presentacion grafica.

Para el estudio del signo de un polinomio, resultara muy util conocer procedimientos defactorizacion. Recordamos brevemente con ejemplos como se aplica la Regla de Ruffini paradividir (y eventualmente factorizar) un polinomio de grado cualquiera entre otro de gradouno.

Se toman los coeficientes del polinomio del numerador y el elemento opuesto (cambio designo) del coeficiente de grado cero del denominador y opera como en el ejemplo (se baja elprimer coeficiente, multiplica, se sube el resultado y se suma):

Ejemplo 1.8. Queremos calcular el cocientex3 − 3x2 − 7x − 8

x − 51 -3 -7 8

5 5 10 15

1 2 3 7

Observa los numeros obtenidos a traves de la operacion anterior. Salvo el ultimo (recua-drado), que es el resto, los demas, denotan los coeficientes de un polinomio un grado menor,o sea, 2:

Esto nos dice que

x3 − 3x2 − 7x − 8 = (x − 5)(x2 + 2x + 3) + 7

(compruebalo desarrollando la expresion de la derecha). Dicho de otro modo, si evaluamosp(5), siendo p(x) = x3 − 3x2 − 7x − 8, obtenemos p(5) = 7.

El caso interesante se produce cuando el resto es cero (en lugar de 7), eso dice que ciertonumero (en este caso habrıa sido 5) es un cero o raız del polinomio y, por tanto, que estepuede factorizarse como (x − 5) por otro polinomio de un grado menos.

Ejemplo 1.9. Sea q(x) = x4 + x3 − 7x2 + 4. Puedes comprobar que q(2) = 0, eso indicaque q(x) = (x − 2)r(x) con r(x) otro polinomio de grado 3. Para hallarlo desarrollamos porRuffini (ojo, hay que poner los coeficientes de todos los monomios, incluidos 0 por aquellosque no aparecen):

1 1 -7 0 4

2 2 6 -2 -4

1 3 -1 -2 0Comprueba, desarrollando el producto, que se tiene la siguiente igualdad:

x4 + x3 − 7x2 + 4 = (x − 2)(x3 + 3x2 − x − 2).

Page 14: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

14 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

Funciones racionales

f(x) =p(x)

q(x)con p y q funciones polinomicas.

Domf = x ∈ R : q(x) 6= 0 = R\x ∈ R : q(x) = 0.

Funcion exponencial

f(x) = ax, a ∈ R, a > 0, x ∈ R. Domf = R.

Se define/construye usando sucesivamente exponentes de N, Z y Q, y se extiende a todoR usando el axioma del supremo.

Propiedades:ar+s = aras, (ar)s = ar·s, (a · b)r = ar · br

Si x, y ∈ R, x < y :ax < ay cuando a > 1 (creciente).ax > ay cuando a < 1 (decreciente).

−6 −4 −2 0 2 4 6

0

5

10

15

20

25

30

35

40

45

50

x

2x

Funcion logarıtmica (a > 0, a 6= 1)

f : (0,+∞) → R : x 7→ f(x) = loga x

loga x = y ⇔ ay = x inversa exponencial.

Propiedades:loga 1 = 0, loga a = 1, loga(x · y) = loga x + loga y, loga(x

m) = m · loga x, logaxy = loga x −

loga y.

Page 15: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.2. FUNCIONES ELEMENTALES 15

a > 1 y 0 < x < y ⇒ loga x < loga y. (funcion creciente)a < 1 y 0 < x < y ⇒ loga x > loga y. (funcion decreciente)

0 1 2 3 4 5 6

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

x

log(x)

Funciones trigonometricas

f(x) = sen x. Domf = R, Imf = [−1, 1], 2π−periodica.

−6 −4 −2 0 2 4 6

−1

−0.5

0

0.5

1

x

sin(x)

f(x) = cos x. Domf = R, Imf = [−1, 1], 2π−periodica.

Page 16: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

16 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

−6 −4 −2 0 2 4 6

−1

−0.5

0

0.5

1

x

cos(x)

Teorema 1.10. (Pitagoras) En un triangulo rectangulo el cuadrado de la hipotenusa es iguala la suma de los cuadrados de los catetos: h2 = c2

1 + c22.

Si normalizamos: (sen x)2 + (cos x)2 = 1.

Funcion tangente:

f(x) = tg x =sen x

cos x.

Domf = R\π2 + kπ : k ∈ Z, Imf = R, π−periodica.

−6 −4 −2 0 2 4 6

−6

−4

−2

0

2

4

6

x

tan(x)

Sus respectivas funciones inversas (respecto de la division):

cosec x =1

sen x, sec x =

1

cos x, cotg x =

1

tg x.

Page 17: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.3. LIMITES DE FUNCIONES 17

Funciones inversas (respecto de la composicion):

arcsen x, arccos x, arctg x.

1.3. Lımites de funciones

Aunque se puede hacer para un subconjunto real cualquiera, para evitar introducir nocio-nes topologicas, en lo que sigue consideraremos funciones definidas sobre intervalos reales. Enlo que sigue, denotaremos S = (a, b) ⊂ R y S = [a, b].

Definicion 1.11. Sean f : S ⊂ R → R y x0 ∈ S. Decimos que l ∈ R es el lımite de f cuandox tiende a x0, y lo denotamos lım

x→x0

f(x) = l si

∀ε > 0 ∃δ : ∀x ∈ S con 0 < |x − x0| < δ ⇒ |f(x) − l| ≤ ε.

El lımite, si existe, es unico.

Ejemplo 1.12. f : R\0 → R : x 7→ xsenx. Se tiene que lımx→0

f(x) = 0 (basta tomar δ = ε).

Comprobar que ocurre lo mismo con la funcion

g(x) =

x si x ∈ Q,0 si x 6∈ Q.

Tambien se puede adaptar al caso en que la funcion “explota”

lımx→x0

f(x) = +∞ ⇔ ∀M > 0 ∃ δ > 0 : ∀x ∈ S con

0 < |x − x0| < δ ⇒ f(x) > M.

lımx→x0

f(x) = −∞ ⇔ ∀M > 0 ∃ δ > 0 : ∀x ∈ S con

0 < |x − x0| < δ ⇒ f(x) < −M.

Ejemplo 1.13. lımx→0

1

|x| = +∞.

Analogamente, el caso en que el lımite existe cuando x tiende a infinito:

lımx→+∞

f(x) = l ⇔ ∀ε > 0 ∃M > 0 : ∀x ∈ S con

M < x ⇒ |f(x) − l| < ε.

lımx→−∞

f(x) = l ⇔ ∀ε > 0 ∃M > 0 : ∀x ∈ S con

x < −M ⇒ |f(x) − l| < ε.

Ejemplo 1.14. lımx→+∞

1

x= lım

x→−∞1

x= 0.

Page 18: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

18 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

A veces no podemos asegurar la existencia de lımite en torno a un punto, pero sı estudiarlos lımites laterales (por la derecha e izquierda respectivamente):

lımx→x+

0

f(x) = l ⇔ ∀ε > 0 ∃δ : ∀x ∈ S con

0 < x − x0 < δ ⇒ |f(x) − l| ≤ ε.

lımx→x−

0

f(x) = l ⇔ ∀ε > 0 ∃δ : ∀x ∈ S con

0 < x0 − x < δ ⇒ |f(x) − l| ≤ ε.

Ejemplo 1.15. La funcion parte entera E : R → R verifica lımx→n+

E(x) = n pero lımx→n−

E(x) =

n − 1.

Teorema 1.16. Dada f : S ⊂ R → R se cumple que lımx→x0

f(x) existe y vale l ∈ R si y solo

si existen los lımites laterales lımx→x+

0

f(x) y lımx→x−

0

f(x) y tienen el mismo valor.

El resultado, leıdo de forma negativa, dice que si los lımites laterales no coinciden, noexiste lımite de la funcion en ese punto.

Teorema 1.17 (Fundamental del lımite). Sea f : S ⊂ R → R. Dado x0 ∈ S

lımx→x0

f(x) = l ⇔[

∀xn ⊂ Sxn 6= x0, xn → x0

⇒ f(xn) → l.

]

Ejemplo 1.18. Considerese f(x) = sen 1x , y las sucesiones xn = 1

nπ e yn = 12πn+π/2 . Se tiene

que f(xn) ≡ 0 y que f(yn) ≡ 1 luego 6 ∃ lımx→0

sen1

x.

Propiedades de lımites:

lımx→x0

f(x) = l < c ⇒ ∃δ > 0 : ∀x ∈ S

0 < |x − x0| < δ ⇒ f(x) < c.Analogamente con c < l.

lımx→x0

f(x) = l 6= 0 ⇒ ∃δ > 0 : ∀x ∈ S

0 < |x − x0| < δ ⇒ signof(x) = signo l.

lımx→x0

f(x) = l, lımx→x0

g(x) = l′,

∃δ > 0 : 0 < |x − x0| < δ ⇒ f(x) ≤ g(x)

⇒ l ≤ l′.

lımx→x0

f(x) = lımx→x0

g(x) = l, ∃δ > 0 :

0 < |x − x0|x∈S

<δ⇒g(x) ≤ h(x) ≤ f(x)

⇒ lım

x→x0

h(x) = l.

Page 19: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.4. CONTINUIDAD DE FUNCIONES 19

Teorema 1.19. Sean f, g : S ⊂ R → R tales que existen l, l′ ∈ R, y lımx→x0

f(x) = l, lımx→x0

g(x) =

l′. Entonces existen los siguientes lımites:lım

x→x0

[f(x) ± g(x)] = l ± l′,

lımx→x0

f(x) · g(x) = l · l′,

Si l′ 6= 0 lımx→x0

f(x)

g(x)=

l

l′.

Observacion 1.20 (Indeterminaciones). Cuando los valores l y l′ no son reales, sino +∞o −∞, nos encontraremos con problemas. Se trata de expresiones que no tienen a prioriun valor concreto (por ello las llamaremos indeterminaciones), sino que hay que hallarloexplıcitamente en cada caso. Expresiones indeterminadas que pueden aparecer son:

1∞, 0 · ∞, ∞−∞,∞∞ ,

0

0, ∞0, 00.

Algunas que podremos resolver en este mismo tema usando las propiedades precedentes son∞−∞ (por ejemplo sacando factor comun o multiplicando por el conjugado) o ∞

∞ (sera simplesi se trata de funciones racionales). Un dominio total de las indeterminaciones requerira he-rramientas del proximo tema de derivacion, como por ejemplo la Regla de L’Hopital.

1.4. Continuidad de funciones

Definicion 1.21. Sea f : S ⊂ R → R y x0 ∈ S. Se dice que f es continua en x0 cuando

∃ lımx→x0

f(x) = f(x0).

Esto equivale a decir que

∀ε > 0, ∃δ > 0 : |x − x0| < δ ⇒ |f(x) − f(x0)| < ε.

Igual que los lımites laterales, podemos hablar de continuidad por la derecha e izquierda enx0 :

∃ lımx→x+

0

f(x) = f(x0), ∃ lımx→x−

0

f(x) = f(x0).

f es continua en x0 ⇔ lo es a derecha e izquierda en x0.Dado A ⊂ S, se dice que f es continua en A si lo es en todo punto de A.Si A = [a, b], entendemos que continuidad en a (resp. b) es por la izquierda (resp. derecha).

Teorema 1.22. Dados f : S ⊂ R → R, x0 ∈ S, f es continua en x0 ⇔ ∀xn ⊂ S, xn →x0 ⇒ f(xn) → f(x0).

Ejemplo 1.23. f(x) = |x| es continua en todo R.

f(x) =

xsen 1

x si x 6= 0,0 si x = 0

es continua en todo R.

f(x) =

|x|x si x 6= 0,0 si x = 0

no es continua en x = 0.

Las funciones elementales vistas antes (polinomiales, racionales, exponenciales, logarıtmicasy trigonometricas) son continuas en sus dominios de definicion.

Page 20: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

20 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

Algebra de funciones continuas

Teorema 1.24. Sean f, g : S ⊂ R → R funciones continuas en x0 ∈ S. Entonces f ± g y f · gson continuas en x0. Si g(x0) 6= 0, tambien lo es f

g .

Teorema 1.25. Sean f : S ⊂ R → R, g : T ⊂ R → R tales que f(S) ⊂ T. Si f es continuaen x0 ∈ S y g es continua en f(x0), entonces la funcion compuesta g f es continua en x0.

1.4.1. Discontinuidad de funciones. Clasificacion

Definicion 1.26. Decimos que f es discontinua en x0 si no es continua en x0. Los posiblesmotivos:

x0 6∈Domf.

6 ∃ lımx→x0

f(x).

∃ lımx→x0

f(x) 6= f(x0).

La clasificacion de posibles discontinuidades es la siguiente.

a) Discontinuidad evitable: ∃ lımx→x0

f(x) (un valor finito) pero

6 ∃f(x0),lım

x→x0

f(x) 6= f(x0).

Dos ejemplos: f(x) =

|x| si x 6= 0,1 si x = 0.

g(x) =x2 − 1

x + 1.

b) Discontinuidad de salto (finito): ∃ lımx→x+

0

f(x) que notaremos f(x+0 ), y ∃ lım

x→x−

0

f(x) que

notaremos f(x−0 ) pero son distintos.

(Al valor f(x+0 ) − f(x−

0 ) se le llama salto de la funcion f en x0).

f(x) = sig(x)

1 si x > 0,0 si x = 0,

−1 si x < 0.

c) Discontinuidad de salto infinito: cuando alguno de los lımites laterales (o ambos) valen±∞.

Ejemplos: f(x) =1

x, g(x) =

1

|x| .

d) Discontinuidad esencial: 6 ∃ lımx→x0

f(x).

Por ejemplo, f(x) =

sen 1

x si x 6= 0,0 si x = 0.

Page 21: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.4. CONTINUIDAD DE FUNCIONES 21

1.4.2. Propiedades de funciones continuas

Sea f : S ⊂ R → R. Se dice que f esta acotada superiormente (inferiormente) si el conjunto

f(S) = f(x) : x ∈ S

esta acotado superiormente: ∃M : ∀x ∈ S, f(x) ≤ M.(inferiormente: ∃m : ∀x ∈ S, f(x) ≥ m.)Decimos que esta acotada si lo esta superior e inferiormente: ∃M > 0 : ∀x ∈ S, |f(x)| ≤

M.

Dado un subconjunto A ⊂ S, podemos considerar las propiedades de acotacion de f soloen el conjunto A.

Ejemplo 1.27. f(x) = |x| esta acotada inferiormente.g(x) =senx esta acotada.h(x) = −x2 esta acotada superiormente.j(x) = x3 no esta acotada ni superior ni inferiormente.k(x) = 1/x esta acotada en el intervalo [1, 2] pero no lo esta en (0, 1).

Ser continua sobre un intervalo abierto no asegura acotacion.

Teorema 1.28.• (continuidad implica acotacion local): f : (a, b) → R, f continua en x0 ⇒ ∃δ > 0 : f

acotada en (x0 − δ, x0 + δ).• Si a ∈Domf, y f es continua en a por la derecha, entonces ∃δ > 0 : f acotada en

[a, a + δ). (Resultado analogo para el extremo b).• (continuidad en intervalo cerrado y acotado sı implica acotacion) f continua en [a, b] ⇒

f acotada en [a, b].

Maximos y mınimos

Definicion 1.29. Sea f : S ⊂ R → R. Se dice que f tiene un maximo absoluto en c ∈ S(resp. mınimo) si f(x) ≤ f(c) para todo x ∈ S (resp. f(x) ≥ f(c)).

Se dice que tiene un maximo (resp. mınimo) relativo o local en c ∈ S cuando existe δ > 0tal que f(x) ≤ f(c) (resp. f(x) ≥ f(c)) para todo x ∈ (c − δ, c + δ).

En general hablamos de extremos para referirnos a maximos y mınimos.

Teorema 1.30.•[Weierstrass] Sea f : [a, b] → R continua. Entonces f alcanza maximo y mınimo abso-

lutos. (Nota: el resultado es falso si el intervalo de partida no es cerrado o no es acotado,incluso aunque f sea acotada.)

• [Bolzano] f : [a, b] → R continua y con signo distinto en los extremos f(a) y f(b),entonces ∃c ∈ (a, b) tal que f(c) = 0.

• [Darboux, valores intermedios] f : [a, b] → R continua. Entonces f alcanza todos losvalores comprendidos entre su maximo y su mınimo.

Page 22: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

22 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

Probar que todo polinomio de grado impar tiene al menos una raız real, y que su imagenes todo R

Probar que la ecuacion x−senx = 1 tiene al menos una raız real.

Funciones monotonas

Definicion 1.31. Sea f : S ⊂ R → R.

f creciente si ∀x, y ∈ S : x < y ⇒ f(x) ≤ f(y).

f decreciente si ∀x, y ∈ S : x < y ⇒ f(x) ≥ f(y).

f estrictamente creciente si ∀x, y ∈ S : x < y ⇒ f(x) < f(y).

f estrictamente decreciente si ∀x, y ∈ S : x < y ⇒ f(x) > f(y).

En general, decimos f monotona si cumple alguno de los casos anteriores.

El siguiente resultado se extiende de forma similar para funciones decrecientes.

Teorema 1.32. Sea f : [a, b] → R una funcion creciente. Entonces para todo c ∈ (a, b) severifica:

∃ lımx→c−

f(x) = f(c−), ∃ lımx→c+

f(x) = f(c+).

Ademas, se cumple que f(c−) ≤ f(c) ≤ f(c+).

Para los extremos del intervalo, se tiene f(a) ≤ f(a+) y f(b−) ≤ f(b).

Observacion 1.33.

Una funcion monotona solo puede tener discontinuidades de salto.

Una funcion f estrictamente monotona en su dominio de definicion admite a lo sumouna solucion de la ecuacion f(x) = 0.

Para las funciones continuas y monotonas estrictas, es posible construir la funcion in-versa respecto de la composicion, y es tambien continua y estrictamente monotona.

Como ejemplo podemos considerar la funcion f(x) : R+ → R+ : x 7→ f(x) = xn conn ∈ N.

1.5. Derivadas: calculo, propiedades y aplicaciones

En este tema comenzamos el estudio del calculo diferencial, una herramienta que nossera muy util tanto en la representacion grafica como en el calculo de optimos de una funciondada.

Page 23: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.5. DERIVADAS: CALCULO, PROPIEDADES Y APLICACIONES 23

1.5.1. Concepto de derivada

Definicion 1.34. Sea f : S ⊂ R → R, a ∈ (b, c) ⊆ S. Decimos que f es derivable en a siexiste:

lımx→a

f(x) − f(a)

x − a∈ R.

Dicho valor se denota como f ′(a), se llama derivada de f en a y tambien se puede escribircomo

lımh→0

f(a + h) − f(a)

h,

donde x − a = h.

Observacion 1.35. Para que la derivada exista tiene que existir el lımite, es decir, debenexistir los lımites laterales y coincidir.

Definicion 1.36. Una funcion f se dice derivable en A si lo es en todo punto a ∈ A.

Ejemplo 1.37. a) f(x) = x2 es derivable en a = 2 y su derivada vale f ′(2) = 4, ya que:

f ′(2) = lımh→0

f(2 + h) − f(2)

h= lım

h→0

(2 + h)2 − 22

h= lım

h→0

h2 + 4h

h= lım

h→0(h + 4) = 4.

b) f(x) = |x| no es derivable en a = 0, pues

f ′+(0) = lım

h→0+

|h| − |0|h

= lımh→0+

h

h= 1

pero

f ′−(0) = lım

h→0−

|h| − |0|h

= lımh→0−

−h

h= −1.

Luego existen las derivadas laterales, pero los lımites no coinciden. Entonces, la funcionvalor absoluto no es derivable en a = 0.

c) f(x) = x1/3 no es derivable en a = 0, ya que:

f ′(0) = lımh→0

h1/3 − 01/3

h= lım

h→0

1

h2/3= +∞

luego no se trata de un numero real. En este caso, se dice que la funcion tiene derivada+∞ en a = 0.

Definicion 1.38 (Funcion derivada). Sean f : S ⊂ R → R y T = x ∈ S/∃ f ′(x). Lafuncion:

x ∈ T 7→ f ′(x) ∈ R

se llama funcion derivada primera de f y se representa por f ′.Analogamente se pueden definir las derivadas sucesivas:

f ′′ = (f ′)′, f ′′′ = (f ′′)′, f iv) = (f ′′′)′, . . .

Page 24: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

24 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

1.5.2. Interpretacion geometrica de la derivada

Si f es derivable en a, f ′(a) es un numero real que coincide con la pendiente de la rectatangente a la curva y = f(x) en el punto (a, f(a)).

–1

0

1

2

3

4

0.5 1 1.5 2x

−−−− es la funcion y = x2

⋄ ⋄ ⋄ ⋄ es la tangente en el punto (1, 1), y = 2x − 1×××× es la recta normal en el punto (1, 1), y = (3 − x)/2

Definicion 1.39. Se define la recta de pendiente m que pasa por el punto (x0, y0) como:

y − y0 = m (x − x0)

Dos rectas de pendientes m y m, respectivamente, se dice que son perpendiculares cuandoforman un angulo de 90o. Entonces, se puede comprobar que la relacion entre sus pendienteses m = −1/m.

Definicion 1.40. Si f es derivable en a y f ′(a) 6= 0, entonces la pendiente de la recta tangenteen el punto (a, f(a)) es f ′(a), y la pendiente de la recta normal es − 1

f ′(a) .

y − f(a) = f ′(a) (x − a) es la recta tangente a y = f(x) en el punto (a, f(a)).

y − f(a) = − 1

f ′(a)(x − a) es la recta normal a y = f(x) en el punto (a, f(a)).

Observacion 1.41. Si f ′(a) = 0, entonces la recta tangente es horizontal. Si f ′(a) = ±∞,entonces la recta tangente es vertical.

Teorema 1.42. Si f es derivable en a, entonces f es continua en a.

Demostracion: Supongamos que f es derivable en a. Entonces, existe lımx→af(x)−f(a)

x−a =f ′(a). Para la continuidad de f en a, vemos que lımx→a f(x) = f(a). Notemos que si x 6= a,

f(x) − f(a) =f(x) − f(a)

x − a· (x − a), luego lımx→a f(x) − f(a) = f ′(a) · lım

x→a(x − a) = 0

Observacion 1.43. El recıproco no es cierto, es decir, una funcion continua en un punto notiene por que ser derivable en ese punto. Considerese el ejemplo f(x) = |x| en a = 0.

Page 25: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.5. DERIVADAS: CALCULO, PROPIEDADES Y APLICACIONES 25

1.5.3. Algebra de derivadas

Teorema 1.44. Sean f , g : S ⊂ R → R dos funciones derivables en a. Entonces, se verifica:

1. f ± g es derivable en a, siendo:

(f ± g)′(a) = f ′(a) ± g′(a)

2. Si λ ∈ R, entonces λ · f es derivable, siendo:

(λ · f)′(a) = λ · f ′(a)

3. f · g es derivable en a, siendo:

(f · g)′(a) = f ′(a) · g(a) + f(a) · g′(a)

4. Si g′(a) 6= 0,f

ges derivable en a, siendo:

(f

g

)′(a) =

f ′(a) · g(a) − f(a) · g′(a)

(g(a))2

Page 26: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

26 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

1.5.4. Derivadas de las funciones elementales

Derivadas de funciones elementales Regla de la cadena

Potencia(xn)′ = nxn−1 (f(x)n)′ = nf(x)n−1f ′(x)

Exponenciales

(ex)′ = ex(ef(x)

)′= ef(x)f ′(x)

(ax)′ = ax · (ln a)(af(x)

)′= (ln a)af(x)f ′(x)

Logarıtmicas

(ln x)′ =1

x, x > 0 (ln f(x))′ =

1

f(x)f ′(x)

(loga(x))′ =1

ln a

1

x(loga f(x))′ =

1

ln a

1

f(x)f ′(x)

Trigonometricas(senx)′ = cos x (senf(x))′ = f ′(x) cos f(x)

(cos x)′ = −senx (cos f(x))′ = −f ′(x) senf(x)

(tanx)′ = 1 + (tan x)2 =1

(cos x)2(tan f(x))′ = [1 + (tan f(x))2] f ′(x)

(cotanx)′ = −(1 + (cotanx)2) =−1

(senx)2(cotanf(x))′ = − [1 + (cotanf(x))2] f ′(x)

Inversas trigonometricas

(arcsenx)′ =1√

1 − x2, si |x| < 1 (arcsenf(x))′ =

f ′(x)√1 − f(x)2

(arccosx)′ =−1√1 − x2

, si |x| < 1 (arc cos f(x))′ =−f ′(x)√1 − f(x)2

(arctanx)′ =1

1 + x2(arctan f(x))′ =

f ′(x)

1 + f(x)2

(arccotanx)′ =−1

1 + x2(arccotanf(x))′ =

−f ′(x)

1 + (f(x))2

Page 27: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.6. APLICACIONES DE LAS DERIVADAS 27

Teorema 1.45 (Regla de la cadena). Sean f : S ⊂ R → R, g : T ⊂ R → R tales que

f(S) ⊂ T . Si f es derivable en a ∈ S y g es derivable en f(a) ∈ T , entonces g f es

derivable en a, y ademas,

(g f)′(a) = g′(f(a)) · f ′(a)

Ejercicio 1.46. Calcular la derivada de la funcion

y = (x3 + 2x + 3)4.

Observemos que si f(x) = x3 + 2x + 3 y g(x) = x4, la funcion y es la composicion g f .

1.6. Aplicaciones de las derivadas

1.6.1. Calculo de extremos absolutos

Teorema 1.47. Sea f : S ⊂ R → R, derivable en a ∈ S con f ′(a) > 0 (o +∞) (respectiva-mente, f ′(a) < 0 (o −∞)). Entonces, existe un intervalo (a−δ, a+δ) tal que ∀x ∈ (a−δ, a+δ),x 6= a se tiene:

f(x) < f(a) si x < a (respectivamente, f(x) > f(a))f(x) > f(a) si x > a (respectivamente, f(x) < f(a))

es decir, f es estrictamente creciente localmente en a ( o estrictamente decreciente localmenteen a).

Corolario 1.48 (Condicion necesaria de extremo). Si f : S ⊂ R → R es derivable ena ∈ (b, c) ⊂ S y f tiene un maximo o un mınimo relativo en x = a, entonces f ′(a) = 0.

Demostracion: Si f ′(a) > 0, entonces por el Teorema anterior f serıa localmente estric-tamente creciente en un intervalo (a − δ, a + δ). Luego no tendrıa ni maximo ni mınimo ena.

Si f ′(a) < 0, entonces por el Teorema anterior f serıa localmente estrictamente decrecienteen un intervalo (a − δ, a + δ). Luego no tendrıa ni maximo ni mınimo en a.

Luego, f ′(a) = 0.

Observacion 1.49. El recıproco no es cierto. Consideremos, por ejemplo, la funcion f(x) =x3, donde f ′(x) = 3x2, f ′(0) = 0. Pero f no tiene ni maximo ni mınimo en x = 0, siendo surepresentacion grafica:

Page 28: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

28 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

–1

–0.8

–0.6

–0.4

–0.2

0.2

0.4

0.6

0.8

1

–1 –0.8 –0.6 –0.4 –0.2 0.2 0.4 0.6 0.8 1x

Observacion 1.50. La condicion necesaria de extremo relativo nos proporciona un metodopara calcular los maximos y mınimos relativos de una funcion f . Sin embargo, no todos lospuntos de Dom(f) que verifican dicha condicion son extremos relativos de f .

Aplicacion: Busqueda de maximos y mınimos de una funcion continua.

Debemos distinguir entre intervalos acotados e intervalos no acotados:

1. Intervalos cerrados y acotados. Si f : [a, b] → R es una funcion continua, sabemosque ∃ max

x∈[a,b]f(x) y ∃ mın

x∈[a,b]f(x). Entonces, buscaremos dichos puntos entre los siguientes:

a) extremos del intervalo: a, b,

b) puntos x ∈ (a, b) en los que f no es derivable,

c) puntos x en los que f ′(x) = 0.

Se calculan las imagenes de estos puntos y en el (los) punto (puntos) con imagen mayor,f alcanza el valor maximo absoluto. En el (los) punto (puntos) con imagen menor, falcanza el valor mınimo absoluto.

Ejemplo 1.51. Estudio de los extremos de la funcion f : [0, 4] → R, definida por:

f(x) =

2x − x2 si x ∈ [0, 2],

x − 2 si x ∈ (2, 4],

cuya grafica es la siguiente:

Page 29: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.6. APLICACIONES DE LAS DERIVADAS 29

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

1 2 3 4x

Puede comprobarse que f es continua en [0, 4]. Estudiamos cada uno de los puntos:

a) Extremos del intervalo: 0, 4, donde f(0) = 0 , f(4) = 2 .

b) Puntos x en los que la funcion no es derivable: f es derivable en [0, 2) ∪ (2, 4].Veamos que ocurre en el punto x = 2.

f ′+(2) = lım

h→0+

f(2 + h) − f(2)

h= lım

h→0+

(2 + h) − 2 − 0

h= 1.

f ′−(2) = lım

h→0−

f(2 + h) − f(2)

h

= lımh→0−

2(2 + h) − (2 + h)2 − 0

h

= lımh→0−

−h2 − 2h

h= lım

h→0−(−h − 2) = −2.

Como f ′−(2) 6= f ′

+(2), entonces f no es derivable en x = 2. Luego calculamos

f(2) = 0 .

c) Puntos en los que x ∈ (0, 4) donde f ′(x) = 0.

f ′(x) =

2 − 2x si x ∈ (0, 2),

1 si x ∈ (2, 4).

Los puntos x ∈ (2, 4) no pueden tener derivada primera nula. Resolvemos la ecua-

cion 2 − 2x = 0 ⇒ x = 1 ∈ (0, 2). Luego calculamos f(1) = 1 .

Comparando las imagenes de los puntos calculados, obtenemos que el valor maximoabsoluto de f en [0, 4] es 2 y se alcanza en x = 4, y el valor mınimo absoluto def en [0, 4] es 0 y se alcanza en los puntos x = 0 y x = 2.

Page 30: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

30 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

2. Intervalos no acotados. Se requiere el estudio grafico de la funcion: estudio delım

x→+∞f(x), lım

x→−∞f(x), asıntotas, acotacion de f , etc.

Ejemplo 1.52. Estudio de la funcion f(x) = e−1/x en Dom(f) = R\0:

0.8

1

1.2

1.4

1.6

–100 –80 –60 –40 –20 0 20 40 60 80 100x

Se observa que no existen maximos absolutos de la funcion (ni supremos de f), puesla funcion no esta acotada superiormente. Tampoco existen mınimos absolutos de lafuncion, pero sı un ınfimo de f , que es el 0.

1.6.2. Monotonıa de la funcion

Teorema 1.53. Sea f : [a, b] → R continua en [a, b] y derivable en (a, b).

a) Si f ′(x) > 0 ∀x ∈ (a, b), entonces f es estrictamente creciente en (a, b).

b) Si f ′(x) < 0 ∀x ∈ (a, b), entonces f es estrictamente decreciente en (a, b).

Teorema 1.54. Sea f : [a, b] → R continua en [a, b]. Supongamos que f es derivable en (a, b)salvo quizas un punto c ∈ (a, b).

a) Si existe δ > 0 tal que (c − δ, c + δ) ⊂ (a, b) y f ′(x) > 0 ∀x ∈ (c − δ, c) y f ′(x) < 0∀x ∈ (c, c + δ), entonces f tiene un maximo relativo en c.

b) Si existe δ > 0 tal que (c − δ, c + δ) ⊂ (a, b) y f ′(x) < 0 ∀x ∈ (c − δ, c) y f ′(x) > 0∀x ∈ (c, c + δ), entonces f tiene un mınimo relativo en c.

Observacion 1.55. Este resultado se puede usar para determinar la existencia de extremosrelativos en puntos en los que la funcion no es derivable.

Page 31: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.6. APLICACIONES DE LAS DERIVADAS 31

1.6.3. Regla de L’Hopital

Teorema 1.56 (Regla de L’Hopital). Sean f y g dos funciones tales que:

i) lımx→a

f(x) = lımx→a

g(x) = 0,

ii) existe un entorno (a − δ, a + δ) del punto a en el que f ′ y g′ estan definidas,

iii) g′ no se anula en (a − δ, a + δ)\a.

Entonces, si ∃ lımx→a

f ′(x)

g′(x)= l (finito o infinito) tambien

existe lımx→a

f(x)

g(x)= l.

Observacion 1.57.

1. El Teorema es valido para x → a+ y x → a−. En esos casos, hay que aplicar el Teoremaen los entornos (a, a + δ) y (a − δ, a) respectivamente.

2. El Teorema es valido para x → ∞, x → +∞ y x → −∞. En estos casos, las hipotesisson que f ′ y g′ existan en |x| > M , x > M y x < −M , respectivamente; y que g′ no seanule en |x| > M , x > M y x < −M , respectivamente.

3. El Teorema es valido si lımx→a,∞

f(x) = ∞ y lımx→a,∞

g(x) = ∞.

4. Si lımx→a,∞

f(x) = 0 y lımx→a,∞

g(x) = ∞, entonces se puede intentar aplicar el Teorema de

L’Hopital al calculo de lımx→a,∞

f(x) · g(x) escribiendolo de la forma:

f(x) · g(x) =f(x)

1g(x)

o f(x) · g(x) =g(x)

1f(x)

.

5. Si lımx→a,∞

f(x) = ∞ = lımx→a,∞

g(x), entonces se puede usar el Teorema para hallar

lımx→a,∞

(f(x) − g(x)) = ”∞−∞”. Para ello, se escribe:

f(x) − g(x) =

1g(x) − 1

f(x)

1f(x)·g(x)

.

6. Para las indeterminaciones 00, ∞0, 1∞, se expresa f(x)g(x) = eg(x)·ln(f(x)) y se aplicaal exponente las observaciones anteriores.

7. En el caso en que lımx→a

f ′(x)

g′(x)tambien fuese indeterminado del tipo

0

0, se puede usar de

nuevo el Teorema de L’Hopital siempre que f ′ y g′ verifiquen las 3 hipotesis de dichoteorema.

Page 32: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

32 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

Ejemplo 1.58. Calcular los siguientes lımites:

1. lımx→2

x3 − 3x2 + 4

x2 − 4x + 4

lımx→2

x3 − 3x2 + 4

x2 − 4x + 4= “

(0

0

)” = lım

x→2

3x2 − 6x

2x − 4= lım

x→2

6x − 6

2= 3

2. lımx→+∞

x(arctgx − π

2)

lımx→+∞

x(arctgx − π

2) = “∞ · 0” = lım

x→+∞arctgx − π

21x

=“0”

0= lım

x→+∞

11+x2

− 1x2

= lımx→+∞

−x2

1 + x2= −1

Observacion 1.59. De la no existencia de lımf ′(x)

g′(x)no se implica nada sobre lım

f(x)

g(x).

1.6.4. Concavidad y convexidad

Definicion 1.60. Una funcion f definida en un intervalo (a, b) se dice convexa en (a, b) si∀x, y ∈ (a, b), x < y, el segmento que une los puntos (x, f(x)) e (y, f(y)) esta por encima dela grafica de la funcion entre esos dos puntos.

0

2

4

6

8

–3 –2 –1 1 2 3x

f es convexa en (−1, 2)

Si el segmento esta por debajo, se dice que f es concava en (a, b).

Page 33: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.6. APLICACIONES DE LAS DERIVADAS 33

–4

–2

0

2

4

–3 –2 –1 1 2 3x

f es concava en (−2, 1)

Observacion 1.61. Las funciones concavas y convexas no son necesariamente derivables.

Definicion 1.62. Una funcion derivable en un punto a se dice que es convexa (respectiva-mente concava) en a si existe un entorno de dicho punto en el que la curva se mantiene porencima (respectivamente, por debajo) de la recta tangente a ella en el punto x = a.

–6

–4

–2

0

2

4

6

8

–3 –2 –1 1 2 3x

f es convexa en (−2, 2)

Page 34: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

34 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

–4

–2

0

2

4

6

8

10

–3 –2 –1 1 2 3x

f es concava en (−2, 2)

Definicion 1.63. Decimos que f tiene un punto de inflexion en (a, f(a)) si f cambia enx = a de concava a convexa o de convexa a concava.

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2x

f pasa de concava a convexa en (1, 1)

Page 35: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.6. APLICACIONES DE LAS DERIVADAS 35

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2x

f pasa de convexa a concava en (1, 1)

1.6.5. Representacion Grafica de Funciones

En la representacion grafica de funciones, podemos seguir los siguientes pasos:

1. Dominio: Dom(f) = x ∈ R/ f(x) ∈ R.

2. Simetrıas: funciones pares e impares.

3. Periodicidad

4. Cortes con los ejes:

a) Corte con el eje OX, es decir, puntos donde f(x) = 0, y cuyas coordenadas son(x, 0).

b) Corte con el eje OY , es decir, es el punto de la forma (0, f(0)), si 0 ∈ Dom(f).

5. Regionamiento: con las abscisas donde la funcion se anula y aquellas donde la funcionno es continua se forman intervalos en los que la funcion existe y tiene signo constante(es decir, zonas donde es positiva y zonas donde es negativa).

6. Asıntotas:

a) Asıntotas horizontales: Son las rectas horizontales de la forma y = c, dondec = lım

x→±∞f(x).

Para conocer la posicion de la curva respecto de la asıntota horizontal, tenemosque estudiar el signo de la expresion lım

x→±∞f(x) − c:

Si lımx→±∞

f(x) − c

> 0, la curva esta sobre la asıntota

< 0, la curva esta debajo de la asıntota

Page 36: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

36 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

Para saber si la curva corta a la asıntota horizontal o no, tenemos que resolver laecuacion:

f(x) = c

b) Asıntotas verticales: Son las rectas verticales de la forma x = k, tales quelımx→k

f(x) = ±∞.

Generalmente, los puntos k son puntos que no pertenecen al dominio de la funcionf pero estan cercanos al dominio. Por ejemplo, si Dom(f) = (a, b), los puntos a yb son posibles valores k.

c) Asıntotas oblicuas: Son las rectas oblicuas de la forma y = mx + n, donde

m = lımx→±∞

f(x)

x∈ R

y n = lımx→±∞

(f(x) − mx) ∈ R.

Ahora bien, dependiendo del valor de m razonamos de la siguiente forma:

1) Si m = 0, se trata de una rama parabolica en la direccion del eje OX (asıntotahorizontal en y = 0), y no se calcula n.

2) Si m = ∞, se trata de una rama parabolica en la direccion del eje OY , y nose calcula n.

3) Si m ∈ R\0, entonces

Si n ∈ R, entonces y = mx + n es una asıntota oblicua.

Si n = ∞, entonces no hay asıntota oblicua (se trata de una rama paraboli-ca en la direccion de la recta y = mx).

Los puntos de corte de la curva con una asıntota oblicua de la forma y = mx + nse calculan resolviendo el sistema:

y = f(x)y = mx + n

7. Crecimiento y decrecimiento: Se estudian las zonas en las que la funcion es crecientey las zonas en las que es decreciente. Para ello, estudiamos:

los valores de x ∈ Dom(f) en los que f ′ se anula (si f ′(x) > 0 la funcion escreciente, y si f ′(x) < 0 la funcion es decreciente),

los puntos x ∈ Dom(f) para los que la derivada no existe.

Recordemos que si x = k /∈ Dom(f), entonces puede existir una asıntota vertical enx = k.

8. Maximos y mınimos: Con las herramientas estudiadas se buscan los puntos en losque se alcanzan los maximos y mınimos relativos de la funcion.

Page 37: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

1.6. APLICACIONES DE LAS DERIVADAS 37

9. Concavidad y convexidad: Como se vio anteriormente, se estudian las zonas en lasque la funcion es convexa (x ∈ Dom(f) tales que f ′′(x) > 0) y las zonas en las que esconcava (x ∈ Dom(f) tales que f ′′(x) < 0).

Observemos que las zonas de concavidad/convexidad pueden estar separadas por:

puntos x ∈ Dom(f) donde f ′′(x) = 0,

puntos x ∈ Dom(f) donde f ′′ no esta definida,

o puntos x /∈ Dom(f).

10. Puntos de inflexion: Son los puntos en los que la funcion pasa de concava a convexao de convexa a concava. Si f es 2 veces derivable en su dominio, entonces se encuentranentre los puntos que verifican que f ′′(x) = 0, PERO no todos los que verifican dichacondicion son puntos de inflexion.

Page 38: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

38 TEMA 1. FUNCIONES, LIMITES, CONTINUIDAD Y DERIVABILIDAD

Page 39: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 2

Interpolacion polinomica

2.1. Introduccion

Un problema que se presenta con frecuencia en las ciencias experimentales y en ingenierıaes tratar de construir, lo mas aproximado posible, una funcion de la que se conoce una seriede datos. Estos datos suelen ser fruto de las observaciones realizadas en un determinadoexperimento, de manera que se tienen los valores de la funcion en determinados puntos, perono se tiene una expresion de la funcion. El objetivo es determinar un polinomio que verifiqueestos datos y que ademas sea facil de construir. Se trata de tener un polinomio que “se parece”a la funcion desconocida. Por su sencillez y operatividad utilizaremos el metodo de diferenciasdivididas (o formula de interpolacion de Newton) para obtener dicho polinomio.

2.2. Analisis previo (existencia y unicidad)

Un problema de interpolacion polinomica puede enunciarse de la siguiente forma:Dado un conjunto de datos que son los valores de una funcion en determinados puntos xi,i = 0, 1, · · · , n, se quiere construir un polinomio de grado menor o igual que n que coincida conla funcion dada en los datos. Se tiene el siguiente resultado: Dada una serie de datos (xi, yi)con i = 0, . . . , n (con xi distintos entre si), ∃! p(x) polinomio de grado ≤ n que interpola dichosvalores, esto es, p(xi) = yi para todo i = 0, . . . , n. Al polinomio se le conoce como polinomiode interpolacion.El siguiente teorema afirma que ese polinomio que existe es unico.

Teorema 2.1 (Unicidad del polinomio de interpolacion). Si p(x) y q(x) son dos polinomiosde grado ≤ n tales que p(xi) = q(xi) para i = 0, 1, . . . , n con xi distintos entre si, entoncesp(x) = q(x) ∀x ∈ R.

39

Page 40: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

40 TEMA 2. INTERPOLACION POLINOMICA

2.3. Metodo de las Diferencias Divididas

Proposicion 2.2. Dados (xi, yi)i=0,...,n con los xi distintos entre si, el polinomio de inter-polacion de grado ≤ n que los interpola es:

p(x) = y0 + y01(x − x0) + y012(x − x0)(x − x1) + · · · + y01···n(x − x0)(x − x1) · · · (x − xn−1)

dondex0 y0

y01 = y1−y0

x1−x0

x1 y1 y012 = y12−y01

x2−x0

y12 = y2−y1

x2−x1y0123 = y123−y012

x3−x0· · ·

x2 y2 y123 = y23−y12

x3−x1

y23 = y3−y2

x3−x2

x3 y3...

......

......

Ejemplo 2.3. Hallar el polinomio de grado ≤ 3 que interpolaxi -2 -1 1 2

yi -5 1 1 7

Comenzamos calculando los coeficientes:

xi yi yij yijk yijkl

−2 −51−(−5)−1−(−2) = 6

−1 1 0−61−(−2) = −2

1−11−(−1) = 0 2−(−2)

2−(−2) = 1

1 1 6−02−(−1) = 2

7−12−1 = 6

2 7

Entonces, los coeficientes de la diagonal superior senalados en negrita nos permitenobtener el polinomio del siguiente modo:

p(x) = −5 + 6(x + 2) − 2(x + 2)(x + 1) + (x + 2)(x + 1)(x − 1).

Simplificamos y vemos que obtenemos el polinomio p(x) = x3 − x + 1.Ventaja: si hiciera falta introducir algun par de valores mas, se podrıa hacer sin problema yaprovechando los ya calculados (los xi no tienen porque estar ordenados).Ahora es claro el nombre que recibe el algoritmo.

Si los puntos x0, x1, . . . , xn estan uniformemente espaciados, es decir, son equidistantes,de manera que la distancia entre dos puntos consecutivos es siempre un mismo valor h,

Page 41: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

2.3. METODO DE LAS DIFERENCIAS DIVIDIDAS 41

entonces la formula anterior se simplifica y el polinomio de interpolacion se expresa ası:

p(x) = y0+∆f(x0)

h(x−x0)+

∆2f(x0)

2h2(x−x0)(x−x1)+· · ·+∆nf(x0)

n!hn(x−x0)(x−x1) · · · (x−xn−1),

siendo∆f(x0) = f(x1) − f(x0) ∆f(xj) = f(xj+1) − f(xj)

∆kf(x0) = ∆(∆k−1f(x0)) = ∆k−1f(x1)−∆k−1f(x0) ∆kf(xj) = ∆k−1f(xj+1)−∆k−1f(xj),

para k = 2, · · · , n y para j ≥ 1.

Ejemplo 2.4. Experimentalmente se ha observado que el crecimiento celular de un cultivomicrobiano viene dado segun la siguiente tabla, donde ti representa el tiempo transcurrido enhoras e yi el numero de celulas en el tiempo ti.

ti 0 2 4 6 8

yi 2.64 ×105 1.84×107 2.53×108 2.95×109 4.35×1010

Hallar el polinomio de interpolacion que da una aproximacion de la ecuacion que sigue elcrecimiento celular.

Page 42: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

42 TEMA 2. INTERPOLACION POLINOMICA

Page 43: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 3

La integral. Integracion numerica

Las integrales formalizan un concepto bastante sencillo e intuitivo, el de area (y volumenes,y longitudes entre otras aplicaciones). Los orıgenes del calculo de areas se pueden encontrar enel “metodo de exhaucion” desarrollado por los griegos hace mas de dos mil anos, pero fueronNewton y Leibnitz quienes le dieron el enfoque riguroso actual.

Se comprobara que los problemas del calculo integral y diferencial son inversos el uno delotro, y una sencilla regla (de Barrow) servira para dar respuesta a problemas como calcularun area concreta, obtener el cambio acumulativo de magnitudes y calcular promedios.

3.1. Calculo de primitivas

Definicion 3.1. Dadas f, F : D ⊂ R → R, decimos que F es una primitiva de la funcion fsi:

F ′(x) = f(x), ∀x ∈ D.

Esta claro que si F es una primitiva de f , F + C es tambien primitiva de f para cualquierC ∈ R.

Definicion 3.2. Al conjunto de todas las primitivas de f se le llama integral indefinidade f : ∫

f(x) dx = F (x) + C, ∀C ∈ R.

Propiedades:

1. Si k ∈ R, entonces

∫k f(x) dx = k

∫f(x) dx.

2.

∫(f(x) ± g(x)) dx =

∫f(x) dx ±

∫g(x) dx

43

Page 44: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

44 TEMA 3. LA INTEGRAL. INTEGRACION NUMERICA

3.2. Reglas de calculo de primitivas

Integrales inmediatas Integrales funciones compuestas

Tipo potencial∫xn dx =

xn+1

n + 1+ C, n 6= −1

∫f(x)n f ′(x) dx =

f(x)n+1

n + 1+ C, n 6= −1

Tipo logarıtmico∫1

xdx = ln |x| + C

∫f ′(x)

f(x)dx = ln |f(x)| + C

Tipo exponencial∫ex dx = ex + C

∫ef(x) f ′(x) dx = ef(x) + C

∫ax dx =

ax

ln a+ C

∫af(x) f ′(x) dx =

af(x)

ln a+ C

Tipo trigonometricas directas∫senx dx = −cosx + C

∫senf(x) f ′(x) dx = −cosf(x) + C

∫cosx dx = senx + C

∫cosf(x) f ′(x) dx = senf(x) + C

∫1

cos2xdx = tgx + C

∫1

cos2(f(x))f ′(x) dx = tg(f(x)) + C

∫1

sen2xdx = −cotgx + C

∫1

sen2(f(x))f ′(x) dx = −cotg(f(x)) + C

Tipo trigonometricas inversas∫dx

1 + x2= arctgx + C

∫f ′(x)

1 + f(x)2dx = arctg(f(x)) + C

∫dx√

1 − x2= arcsen x + C

∫f ′(x)√

1 − f(x)2dx = arcsen (f(x)) + C

Ejemplo 3.3 (Tipo potencial).

1.

∫ (5x3 +

2

x2− 3

√x2 + 5

)dx = 5

x4

4− 2

x− 3

5x5/3 + 5x + C.

2.

∫(3x + 5)2 dx =

(3x + 5)3

9+ C.

3.

∫sen4x cosx dx =

sen5x

5+ C.

Page 45: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

3.2. REGLAS DE CALCULO DE PRIMITIVAS 45

Ejemplo 3.4 (Tipo logarıtmico).

1.

∫1

5x + 3dx =

1

5ln |5x + 3| + C.

2.

∫tgx dx =

∫senx

cosxdx = − ln |cosx| + C.

Ejemplo 3.5 (Tipo exponencial).

1.

∫ex2

x dx =1

2ex2

+ C.

2.

∫cos(3x) 2sen(3x) dx =

1

3

2sen(3x)

ln 2+ C.

3.

∫6ln x

xdx =

6ln x

ln 6+ C.

Ejemplo 3.6 (Tipo trigonometricas directas).

1.

∫cos(mx) dx =

1

msen(mx) + C, m 6= 0.

2.

∫sen(lnx)

xdx = −cos(lnx) + C.

3.

∫x

cos2(x2)dx =

1

2tg(x2) + C.

Ejemplo 3.7 (Tipo trigonometricas inversas).

1. ∫5

2 + 3x2dx =

∫5/2

1 + 32x2

dx =5

2

∫1

1 + (√

32x)2

dx

=5√6

∫√

32

1 +(√

32 x)2 dx =

5√6arctg

(√3

2x

)+ C.

2. ∫ex

√4 − e2x

dx = 2

∫ ex

2

2√

1 − (ex

2 )2dx = arcsen

(ex

2

)+ C.

Page 46: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

46 TEMA 3. LA INTEGRAL. INTEGRACION NUMERICA

3.2.1. Metodo de integracion por partes

Consiste en aplicar la siguiente regla:∫

u dv = u v −∫

v du.

Veamos algunos ejemplos:∫

x ex dx =

u = x ⇒ du = dx

dv = ex dx ⇒ v = ex

= x ex −∫

ex dx = x ex − ex + C

= (x − 1) ex + C.

∫arctgx dx =

u = arctgx ⇒ du = dx

1+x2

dv = dx ⇒ v = x

= x arctgx −∫

x

1 + x2dx

= x arctgx − 12 ln |x2 + 1| + C.

3.2.2. Integracion de funciones racionales

Las funciones racionales son aquellas que se escriben de la forma f(x) =p(x)

q(x), donde p(x)

y q(x) son polinomios.

Si grado(p) < grado(q), podemos aplicar el metodo de descomposicion que presentamosa continuacion.

Si no, debemos efectuar la division de polinomios, y escribirlo como:

f(x) =p(x)

q(x)= c(x) +

r(x)

q(x),

donde c(x) es el polinomio cociente que resulta al hacer la division y r(x) es el polinomioresto de la division. Observemos que entonces grado(r) < grado(q).

El metodo: El primer paso es descomponer el denominador en factores simples. Sigrado(q) = n y todas las raıces son reales y simples, es decir,

q(x) = a0 (x − x1) (x − x2) . . . (x − xn),

se hace una descomposicion de la forma (con A1, . . . , An constantes reales):

p(x)

q(x)=

A1

x − x1+

A2

x − x2· · · + An

x − xn,

y se integra cada uno de los sumandos que aparecen.

Page 47: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

3.2. REGLAS DE CALCULO DE PRIMITIVAS 47

Ejemplo 3.8.

∫2x − 3

2x3 − x2 − xdx =

[dado que 2x3 − x2 − x = x (x − 1) (2x + 1)

]

=

∫ (A

x+

B

x − 1+

C

2x + 1

)

= 3 ln |x| − 1

3ln |x − 1| − 8

3ln |2x + 1| + C.

donde los coeficientes A, B y C se han calculado resolviendo:

2x − 3

2x3 − x2 − x=

A

x+

B

x − 1+

C

2x + 1

=A(x − 1)(2x + 1) + Bx(2x + 1) + Cx(x − 1)

x(x − 1)(2x + 1)

=x2(2A + 2B + C) + x(−A + B − C) − A

2x3 − x2 − x

para lo que se debe cumplir que:

0 = 2A + 2B + C2 = −A + B − C

−3 = −A⇒

A = 3

B = −1

3

C = −16

3

Tambien podemos dar valores convenientes a x para obtener un sistema de ecuaciones massimple para A, B y C.

Si hay alguna raız real multiple, de multiplicidad k, aparecen k sumandos asociadosa esa raız. Es decir, si en la descomposicion del polinomio del denominador, q(x), aparece

(x − x0)k, entonces descomponemos

p(x)

q(x)como:

A1

x − x0+

A2

(x − x0)2+

A3

(x − x0)3+ · · · + Ak

(x − x0)k

Page 48: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

48 TEMA 3. LA INTEGRAL. INTEGRACION NUMERICA

Ejemplo 3.9.

∫2x − 3

x3 − 3x2 + 3x − 1dx =

[dado que x3 − 3x2 + 3x − 1 = (x − 1)3

]

=

∫ (A

x − 1+

B

(x − 1)2+

C

(x − 1)3

)dx

=

∫ (0

x − 1+

2

(x − 1)2+

−1

(x − 1)3

)dx

= −21

(x − 1)+

1

2

1

(x − 1)2+ C

donde se ha resuelto:

2x − 3

x3 − 3x2 + 3x − 1=

A

x − 1+

B

(x − 1)2+

C

(x − 1)3

=Ax2 + x(−2A + B) + (A − B + C)

(x − 1)3

lo que implica que A = 0, B = 2 y C = −1.

Hay otras muchas combinaciones, como mezcla de raıces reales y complejas (simples y/omultiples). Nosotros solo trataremos aquı el caso anterior, y el caso en que la raız compleja

es imaginaria pura, es decir, del tipo1

a2 + x2, que ya sabemos es de tipo arcotangente.

3.2.3. Metodo de sustitucion

Consiste en hacer un cambio de variable que transforme la integral en otra que sepamoscalcular. No hay que olvidar, una vez resuelta, deshacer el cambio. Veamos algunos ejemplos:

∫ex

√4 − e2x

dx = (ex = t ⇒ ex dx = dt)

=

∫dt√

4 − t2=

∫dt

2√

1 − ( t2)2

= arcsen(

t2

)+ C = arcsen

(ex

2

)+ C.

Page 49: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

3.3. LA INTEGRAL DEFINIDA 49

∫ √x

3√

x + 1dx = (x = t6 ⇒ dx = 6 t5 dt)

= 6

∫t8

t2 + 1dt (dividimos)

= 6

∫(t6 − t4 + t2 − 1) dt + 6

∫dt

1 + t2

= 6

(t7

7− t5

5+

t3

3− t

)+ 6arctg(t) + C

= 6

(x

7

6

7− x

5

6

5+

x1

2

3− x

1

6

)+ 6arctg(x1/6) + C.

Cambios de variable importantes

1. senx = t:

En este caso

cosx dx = dt

cos2x = 1 − t2,

lo que implica que dx =dt

cosx=

dt√1 − t2

.

Por ejemplo, ∫sen3x

cosxdx =

∫t3√

1 − t2dt√

1 − t2=

∫t3

1 − t2dt

que se ha transformado en una integral de tipo racional.

Tambien podemos intentar el cambio cosx = t o tgx = t.

Observacion 3.10. Estos tres cambios no siempre funcionan, pero son faciles de hacer.

El cambio que mas habitualmente funciona es tg(

x2

)= t, pero los calculos son mas

complicados.

2. x = tn

Entonces dx = ntn−1 dt. Ver ejemplo anterior.

3.3. La integral definida

Un anticipo de las aplicaciones que nos permite introducir el concepto de esta seccion esel siguiente problema:

Sea f : [a, b] → R una funcion continua y positiva. Denotemos Af (c) al area contenidaentre la funcion, el eje OX, y las rectas x = a y x = c.

Page 50: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

50 TEMA 3. LA INTEGRAL. INTEGRACION NUMERICA

Veamos la relacion entre las funciones Af y f. Como la funcion f es continua en c, entonces,para cualquier h > 0 (pequeno), se tiene que Af (c + h)−Af (c) es aproximadamente f(c)h, olo que es lo mismo,

Af (c + h) − Af (c)

h∼ f(c).

Tomando ahora lımites cuando h → 0 en ambos miembros de la igualdad anterior (recordarla definicion de derivada), se tiene que

A′f (c) = f(c), es decir, Af es una primitiva de f.

La propiedad anterior nos lleva a considerar el siguiente concepto:

Definicion 3.11. Llamamos integral definida a una expresion del tipo∫ b

af(x) dx,

donde a < b. En caso de a > b, se considera:∫ b

af(x) dx = −

∫ a

bf(x) dx.

Observemos que solo se diferencia de las primitivas o integrales indefinidas en que aparecenlımites de integracion a, b.

Si dada la funcion f(x) conocemos una primitiva de esta, F (x), entonces se verifica laRegla de Barrow:

∫ b

af(x) dx = F (x)|ba = F (b) − F (a).

Observemos que

∫f(x) dx = F (x) + C, es decir, el valor de C no afecta a la aplicacion

de la Regla de Barrow.

Ejemplo 3.12.

∫ 2

1x2 dx =

x3

3

∣∣∣∣2

1

=8

3− 1

3=

7

3.

Page 51: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

3.4. APLICACIONES DE LA INTEGRAL DEFINIDA 51

3.3.1. Propiedades de la integral definida

1. La formula de integracion por partes para integrales definidas es:

∫ b

af(x) g′(x) dx = f(x) g(x)|ba −

∫ b

af ′(x) g(x) dx

2. Si k ∈ R, entonces

∫ b

ak f(x) dx = k

∫ b

af(x) dx.

3.

∫ b

a(f(x) ± g(x)) dx =

∫ b

af(x) dx ±

∫ b

ag(x) dx.

4. Si c ∈ [a, b], entonces:

∫ b

af(x) dx =

∫ c

af(x) dx +

∫ b

cf(x) dx.

5. Si f(x) ≥ 0, ∀x ∈ [a, b], entonces

∫ b

af(x) dx ≥ 0.

6. Si f(x) ≤ g(x) ∀x ∈ [a, b], entonces

∫ b

af(x) dx ≤

∫ b

ag(x) dx.

3.4. Aplicaciones de la integral definida

3.4.1. Calculo de areas de superficies planas

Queremos calcular el area A determinada por x = a, x = b, el eje OX e y = f(x). Gracias alanalisis heurıstico hecho en la Seccion 2.3 tenemos que

Si f(x) ≥ 0, entonces A =

∫ b

af(x) dx.

Si f(x) ≤ 0, entonces A = −∫ b

af(x) dx.

Si la funcion tiene cambios de signo en [a, b], hay que separar los intervalos donde f(x)tiene signo constante y aplicar lo anterior. Por ejemplo, si f(x) ≥ 0 en [a, c] y f(x) ≤ 0en [c, b], entonces:

A =

∫ c

af(x) dx −

∫ b

cf(x) dx.

Si queremos calcular el area determinada por x = a, x = b y las curvas y = f(x) e y = g(x),donde f(x) ≥ g(x), entonces:

A =

∫ b

a(f(x) − g(x)) dx.

Page 52: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

52 TEMA 3. LA INTEGRAL. INTEGRACION NUMERICA

En otro caso, hay que separar [a, b] en intervalos y se actua como antes en cada intervalo.Observes que todos los casos pueden escribirse de manera uniforme como

A =

∫ b

a|f(x) − g(x)| dx.

Ejemplo 3.13. Calcular el area encerrada por f(x) = x, g(x) = x2 en el intervalo (0, 1) yen el intervalo (0, 2).

0

1

2

3

4

5

6

0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4x

donde la lınea continua corresponde a y = x, y la lınea discontinua corresponde a y = x2.

El area en el intervalo (0, 1), donde f siempre esta por encima de g, es:

A =

∫ 1

0(x − x2) dx =

(x2

2− x3

3

)∣∣∣∣1

0

=1

2− 1

3=

1

6.

El area en el intervalo (0, 2), donde hay dos zonas diferenciadas, una en la que f esta sobreg y otra donde g esta sobre f , es:

A =

∫ 2

0|f(x) − g(x)| dx =

∫ 1

0(x − x2) dx +

∫ 2

1(x2 − x) dx

=1

6+

(x3

3− x2

2

)∣∣∣∣2

1

=1

6+

8

3− 2 −

(1

3− 1

2

)

=1

6+

8

3− 2 − 1

3+

1

2=

1 + 16 − 12 − 2 + 3

6= 1.

Ejemplo: Area del cırculo: La curva que define el contorno de un cırculo de centro(0, 0) y radio r es x2 + y2 = r2, luego y =

√r2 − x2.

Page 53: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

3.4. APLICACIONES DE LA INTEGRAL DEFINIDA 53

–1

–0.8

–0.6

–0.4

–0.20

0.2

0.4

0.6

0.8

1

y

–1–0.8 –0.4 0.2 0.4 0.6 0.8 1x

Gracias a la simetrıa de la figura, para calcular el area lo hacemos para x ∈ [0, r] y multipli-camos por 4:

A = 4

∫ r

0

√r2 − x2 dx = 4 r

∫ r

0

√1 −

(x

r

)2dx

haciendo el cambio de variable

x

r= sent

dx = r cost

= 4r2

∫ π/2

0cos2t dt

usando la formula trigonometrica cos2(t) =1 + cos(2t)

2

= 4r2

∫ π/2

0

(1 + cos(2t)

2

)dt = 4r2

(t

2+

sen(2t)

4

)∣∣∣∣π/2

0

= π r2.

3.4.2. Cambio acumulativo o neto

Vamos a ver como el calculo integral nos sirve para obtener el cambio acumulativo en eltamano de una poblacion o en la distancia recorrida por una partıcula, entre dos instantes detiempo.Pensemos en una poblacion cuyo tamano en el tiempo t viene representado por la funcionN(t) y que sabemos que su dinamica de crecimiento a lo largo del tiempo, viene dada por unafuncion conocida f(t). En terminos matematicos, estamos diciendo que

N ′(t) = f(t). (3.1)

Ademas, sabemos el tamano de la poblacion en el instante inicial, que sin perdida de generali-dad lo podemos suponer t = 0. Este valor es un dato conocido N0 y en terminos matematicos

Page 54: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

54 TEMA 3. LA INTEGRAL. INTEGRACION NUMERICA

se escribe ası N(0) = N0.El calculo integral es la herramienta matematica para obtener el cambio acumulativo o netoen el tamano de la poblacion entre los instantes 0 y t ya que de (3.1) se tiene que N es

una primitiva de f . Recordemos que

∫f(s)ds son las infinitas primitivas de f , es decir, una

primitiva sumandole cualquier constante, de modo que N(t) es una primitiva generica que se

escribe

∫ t

0f(s)ds mas una constante C,

N(t) =

∫ t

0f(s)ds + C.

Como N(0) = N0 se tiene, sustituyendo en la igualdad anterior t por 0, N0 = C. En definitiva,

N(t) =

∫ t

0f(s)ds + N0

de donde,

N(t) − N0 =

∫ t

0f(s)ds.

Esta expresion nos dice que el cambio neto de poblacion entre 0 y t es la integral

∫ t

0f(s)ds.

Ejemplo 3.14. Si el tamano de una poblacion en el instante t es N(t) y su ritmo de creci-miento viene dado por

N ′(t) = e−t,

con poblacion inicial N(0) = 100, calcular el cambio acumulativo del tamano de la poblacionentre t = 0 y t = 5. ¿Cual es su interpretacion geometrica? ¿Cual es el tamano de la poblacionen t = 5?

Solucion: Basta hacer la siguiente integral definida

N(5) − N(0) =

∫ 5

0e−tdt = 1 − e−5.

La interpretacion geometrica es que el cambio acumulativo entre 0 y 5 es el area comprendidapor la grafica de la funcion f(t) = e−t, el eje OX y las rectas t = 0 y t = 5.

De la misma forma podemos calcular el cambio acumulativo en la distancia recorridapor una partıcula que se mueve. Pensemos que el movimiento es en lınea recta, que en cadainstante de tiempo su posicion viene expresada por la funcion e(t) y que en el instante inicialla posicion es e0. Si conocemos la velocidad de la partıcula en cada instante, v(t), la relacionentre e(t) y v(t) viene dada por

e′(t) = v(t).

Page 55: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

3.4. APLICACIONES DE LA INTEGRAL DEFINIDA 55

Entonces, e(t) es una primitiva de v(t), por tanto, es una primitiva generica,

∫ t

0v(s)ds, mas

una constante C arbitraria,

e(t) =

∫ t

0v(s)ds + C.

Como e(0) = e0 se tiene que e(0) = C = e0, por tanto,

e(t) − e0 =

∫ t

0v(s)ds,

que es el cambio acumulativo de la distancia recorrida entre 0 y t.

3.4.3. Calculo de valores medios

La integral definida nos va a servir para calcular el valor medio o el promedio de unamagnitud. Por ejemplo, pensemos que se ha medido la concentracion de nitrogeno en el suelocada metro, en una seccion transversal de tundra humeda y se han obtenido los datos

Distancia (m) 1 2 3 4 5

Concentracion (g/m3) 589.3 602.7 618.5 667.2 641.2

Distancia (m) 6 7 8 9 10

Concentracion (g/m3) 658.3 672.8 661.2 652.3 669.8

Si llamamos c(x) a la concentracion a una distancia x del origen, la concentracion mediac es

c =1

10(c(1) + · · · + c(10))

Estamos hallando la concentracion media entre los puntos 1 y 10. Pero, si en lugar de tomarvalores cada metro lo hicieramos cada centımetro o cada milımetro, o en general, dividiendoel intervalo [0, 10] en n partes con n grande, obtendrıamos

c =1

n

n∑

k=1

c(xk) (3.2)

y cada parte tiene una longitud de 10−0n que denotaremos por h. Por tanto, h = 10

n y deaquı 1

n = 110h, que sustituyendolo en (3.2) da

c =1

10

n∑

k=1

c(xk)h.

Cuando n tiende a ser muy grande, matematicamente decimos que n tiende a infinito, la suman∑

k=1

c(xk)h se parece mucho a

∫ 10

0c(x)dx. Por tanto,

c =1

10

∫ 10

0c(x)dx,

Page 56: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

56 TEMA 3. LA INTEGRAL. INTEGRACION NUMERICA

es decir, la integral de c(x) en el intervalo [0, 10] dividida por la longitud de este intervalo. Aesto se le llama valor medio de c.La concentracion media entre a y b es

c =1

b − a

∫ b

ac(x)dx.

Ejercicio 3.15. La temperatura de una camara varıa en un periodo de 24 horas de la siguienteforma:

T (t) = 68 + sen(π

12t)

para 0 ≤ t ≤ 24.

1. Dibujar la temperatura T en funcion del tiempo.

2. Calcular la temperatura media.

3.5. Integracion numerica

Hay integrales que son imposibles de calcular de forma exacta, como

∫ 2

1e−x2

dx

porque no se puede obtener de forma explıcita una primitiva de e−x2

. Otras veces, no setiene una expresion de la funcion que se quiere integrar sino sque olo se conocen valores de lafuncion en ciertos puntos.En estas situaciones son necesarios metodos numericos que proporcionen una aproximacionde la integral.

La idea que subyace en el metodo que explicaremos a continuacion consiste en aproximarel integrando f(x) por una funcion mas sencilla, haciendo interpolacion, de manera que solosea necesario conocer los valores de f en determinados puntos. Ademas, la nueva funcion(interpoladora) se integrara de una manera muy simple porque sera un polinomio, y en nuestrocaso, un polinomio de grado 1. Por consiguiente, en este apartado deduciremos una formula

que nos da de manera aproximada el valor de

∫ b

af(x)dx.

En todo lo que sigue supondremos que el intervalo [a, b] se divide en n partes iguales, de modoque la longitud de cada subintervalo es h = b−a

n , y que f es una funcion continua en [a, b] dela que conocemos sus valores en los puntos x0, x1, . . . , xn, que se han obtenido de dividir elintervalo [a, b] en n partes, es decir, x0 = a, x1 = x0 + h, x2 = x1 + h,...,xn = b. Y conocemosf(x0), . . . , f(xn).En cada subintervalo [xi, xi+1] vamos a aproximar f(x) por el polinomio de interpolacion degrado menor o igual que 1 en [xi, xi+1], es decir,

pi(x) = f(xi) +f(xi+1) − f(xi)

h(x − xi).

Page 57: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

3.5. INTEGRACION NUMERICA 57

Figura 3.1: Aproximacion de integral por trapecios

Entonces,

∫ xi+1

xi

f(x)dx se aproxima por

∫ xi+1

xi

pi(x)dx.

∫ xi+1

xi

f(x)dx ∼∫ xi+1

xi

pi(x)dx = f(xi)h +f(xi+1) − f(xi)

2h =

f(xi+1) + f(xi)

2h.

Ahora expresamos la integral en [a, b] de f(x) como suma de integrales en los subintervalos[xi, xi+1] (por la propiedad que ya vimos de las integrales definidas) y sustituimos cada unade estas integrales por su aproximacion:

∫ b

af(x)dx =

n−1∑

i=0

∫ xi+1

xi

f(x)dx ∼

∼n−1∑

i=0

f(xi+1) + f(xi)

2h =

=h

2[f(a) + 2f(x1) + · · · + 2f(xn−1) + f(b)].

Es decir, h/2 por la suma de f en los dos extremos a y b y la suma del doble de f en lospuntos intermedios x1, · · · , xn−1. A esta formula se la conoce como formula de los trapecios

porque, si f fuese positiva,

∫ b

af(x)dx representarıa el area limitada por f entre a y b, y la

formula de los trapecios no es mas que la suma de las areas de todos los trapecios que seforman uniendo por rectas los puntos (xi, f(xi)), como muestra la figura.

El error cometido al aproximar la integral por la formula de los trapecios, denotada porTn, viene dado por la estimacion siguiente

∣∣∣∣∫ b

af(x)dx − Tn

∣∣∣∣ ≤ maxx∈[a,b]

|f ′′(x)|(b − a)3

12n2= max

x∈[a,b]|f ′′(x)|b − a

12h2.

La formula es exacta para polinomios de primer grado.

Page 58: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

58 TEMA 3. LA INTEGRAL. INTEGRACION NUMERICA

Con el mismo argumento de la interpolacion, se puede mejorar la formula de integracionusando polinomios de interpolacion de grado dos en lugar de grado uno. Se tiene ası la formulade Simpson para 3 puntos

∫ b

af(x)dx ∼ b − a

6[f(a) + 4f(x1) + f(b)] =

h

3[f(a) + 4f(x1) + f(b)],

si llamamos h = b−a2 , y la formula de Simpson generalizada para n puntos (n debe ser par)

∫ b

af(x)dx ∼ h

3[f(a) + 4(f(x1) + f(x3) + · · · + f(xn−1)) + 2(f(x2) + · · · + f(xn−2)) + f(b)]

El error cometido por la formula generalizada de Simpson, denotada por Sn, es ahora delorden de h4 ∣∣∣∣

∫ b

af(x)dx − Sn

∣∣∣∣ ≤ maxx∈[a,b]

|f IV )(x)| (b − a)5

2880(n4 )4

y la formula es exacta hasta polinomios de grado tres.

Page 59: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 4

Programacion lineal

Mientras que para funciones reales de variable real la derivacion ha permitido resolver elproblema de optimalidad en su conjunto, en este tema, la programacion lineal resuelve proble-mas de optimizacion en varias variables para funciones objetivos de un tipo muy particular:funciones lineales.

Existen multitud de aplicaciones relativas a la programacion lineal, y metodos de resolu-cion mucho mas complejos del unico que aquı describimos, que sera el metodo geometrico.Ilustraremos con ejemplos el tipo de marco que se puede recoger y tratar a traves de estemetodo.

4.1. Introduccion / motivacion

-La optimizacion en problemas reales depende en general de varias variables-Las tecnicas de diferenciabilidad siguen siendo validas (con una extension adecuada a variasvariables)-La tarea se simplifica si la expresion a optimizar (en adelante funcion objetivo) usa solocombinaciones lineales

f(x1, . . . , xn) = a1x1 + . . . + anxn,

donde los coeficientes ai ∈ R son conocidos.

Definicion 4.1. Los problemas de optimos para expresiones lineales donde las res-tricciones son desigualdades dadas a partir de mas expresiones lineales (inecuaciones)conforman la PROGRAMACION LINEAL.

Ejemplo 4.2. Un ejemplo de tal tipo de problemas es el siguiente:

Maximizar la funcion P (x, y) = 300x + 240ysujeta a las siguientes restricciones:

x ≥ 0y ≥ 0200x + 140y ≤ 78000

59

Page 60: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

60 TEMA 4. PROGRAMACION LINEAL

100x + 1601y ≤ 48000

Observacion 4.3. Nota historica: el suministro a Berlın durante el bloqueo de la guerra frıa(1948-49) se planifico usando programacion lineal.

4.2. Aplicaciones basicas

-Problema de la dieta: determinar cantidades a mezclar de diferentes alimentos para reci-bir la alimentacion necesaria a un coste mınimo

En una granja se da una dieta “para engordar” con una composicion mınima de 15 uni-dades de una sustancia A y otras 15 de una sustancia B. En el mercado solo se encuentrandos clases de compuestos: el tipo X con una composicion de una unidad de A y cinco de B, yel tipo Y, con una composicion de cinco unidades de A y una de B. El precio del tipo X es de10 euros y el del tipo Y es de 30 euros. Se pregunta: ¿Que cantidades se han de comprar decada tipo para cubrir las necesidades con un coste mınimo?

El planteamiento matematico es: Hallar x (latas del tipo X) e y (latas del tipo Y) queresuelven el problema

mınD

(10x + 30y)

siendo

D =

(x, y) ∈ R2

∣∣∣x ≥ 0, y ≥ 0,x + 5y ≥ 15,5x + y ≥ 15

.

-Problema del transporte: organizar reparto de mercancıas con coste mınimo de tiempo,dinero o riesgo

Para atender el suministro diario de gas a tres ciudades C1, C2 y C3 una empresa tiene

destinadas dos fabricas F1 y F2 que producen 20 y 30 m3 respectivamente. Las necesidades de

las tres ciudades son: 20, 18 y 12 m3 respectivamente. Si los costes de transporte por tonelada

de las industrias a las ciudades son, en cientos de euros, los indicados en la tabla adjunta,

planificar el reparto optimo para que dicho coste sea mınimo.

F1 4 3 1

F2 2 2 1

C1 C2 C3

-Problema de la ruta mas corta (o del viajante): ordenar etapas de un viaje con el proposi-to de minimizar el recorrido

Page 61: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

4.3. RESOLUCION POR EL METODO GEOMETRICO 61

-Otras variantes: maximizar (el siguiente ejemplo esta en la hoja de problemas)

En una confiterıa se dispone de 24 kg. de polvorones y 15 kg. de mantecados que se en-vasan en dos tipos de cajas de la siguiente forma: Caja 1: 200 g. de polvorones y 100 g. demantecados. Precio: 2,5 euros. Caja 2: 200 g. de polvorones y 300 g. de mantecados. Precio:4 euros.¿Cuantas cajas de cada tipo se tendran que preparar y vender para obtener el maximo deingresos?

4.3. Resolucion por el metodo geometrico

-Resolver problemas practicos de programacion lineal con dos variables independientes

[-Para mas variables, se puede usar el Metodo del Simplex. Esto no se vera en este curso.]

Usaremos el metodo geometrico, que implica dominar los conceptos de funcion objetivo,restricciones, region factible, rectas de nivel ası como la resolucion de sistemas deecuaciones e inecuaciones lineales.

4.3.1. Analisis previo: Regiones factibles

En los ejercicios de programacion lineal existe un “dominio” (analogo al de las funcionesreales de variable real) de puntos donde tiene sentido plantear/resolver el problema.

Inecuaciones lineales con dos incognitas son expresiones de la forma Ax+ By < C (o bien≤, >,≥). Los puntos que satisfacen la inecuacion forman un semiplano de R2.

La region factible estara determinada por un sistema de inecuaciones lineales.Geometricamente esto es la interseccion de los semiplanos que generan las solucionesde cada una de las inecuaciones por separado.

En lo que sigue manejaremos las desigualdades ≤ y ≥, por lo que la region sera cerrada,y cuando los haya, hablaremos de maximo y mınimo (si la region no es cerrada, en principiosolo hablarıamos de supremo e ınfimo).

Por ejemplo, consideramos:

D = (x, y) ∈ R2 | 0 ≤ x, 0 ≤ y, 3x + y ≤ 4, 2x + 3y ≤ 6.

Representamos primero las rectas y = 4 − 3x e y = 2 − 23x.

Page 62: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

62 TEMA 4. PROGRAMACION LINEAL

0 0.5 1 1.5 2 2.5 3 3.5 40

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

Ahora marcamos la interseccion de los semiplanos (region coloreada) que verifican todas lasdesigualdades que definen D.

0 0.5 1 1.5 2 2.5 3 3.5 40

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

Ahora consideramos la funcion objetivo, que debemos maximizar o minimizar dentro dela region factible. En estos problemas sera otra combinacion lineal de las variables x e y :c1x + c2y, pongamos por ejemplo x + y.

Las funciones

c1x + c2y = constante

son rectas, y todas son paralelas entre si cuando la constante cambia (dicha constante es elvalor de la funcion objetivo a lo largo de todos los puntos (x, y) de esa recta),

Dicha funcion, “trasladada paralelamente” sobre la region genera los valores posibles de laconstante. Ası, los valores mayores y menores se obtienen en los extremos, por ejemplo, elmaximo saldrıa de...

(Programacion lineal: Metodo geometrico)

Page 63: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

4.3. RESOLUCION POR EL METODO GEOMETRICO 63

0 0.5 1 1.5 2 2.5 3 3.5 40

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

4.3.2. Metodo geometrico en regiones factibles acotadas

Aunque no se haya sido muy preciso con la representacion grafica –no obstante se necesitahacer para confirmar que la region es acotada– se pueden sacar estas conclusiones:

el mayor y menor valor de la funcion objetivo se alcanzan en algunos de lospuntos “lımites” (llamados vertices) de la region factible.

Ası, los candidatos a extremos absolutos de la funcion objetivo son los vertices de esta.

Paso 1: calculamos los vertices Esto es, los puntos de la interseccion dos a dos de las“ecuaciones asociadas” d1x+d2y = d3 a las inecuaciones d1x+d2y < (>,≤,≥) d3 que definenel dominio (ojo: asegurarse que estan en la region factible).

En el caso de la region D del dibujo anterior se trata de los puntos (0, 0), (0, 2), (4/3, 0),(6/7, 10/7).

Paso 2: evaluar la funcion objetivo en dichos candidatos para obtener el maximo ymınimo (o supremo e ınfimo si es sobre puntos no incluidos en el dominio). La funcionf : D ⊂ R2 → R : (x, y) 7→ f(x, y) = x + y evaluada en los puntos anteriores es 0, 2, 4/3 y16/7.

Maximo de f : 16/7, se alcanza en (6/7, 10/7). Mınimo de f : 0, alcanzado en (0, 0) (ojo:no tiene porque alcanzarse en un unico punto: si se alcanza en dos vertices, por convexidad,se alcanza en toda una arista del polıgono que delimita la region).

4.3.3. Sobre la existencia de solucion y regiones factibles no acotadas

Igual que ocurrıa con funciones continuas de una variable, las funciones objetivo tratadasen este tema tienen maximo y mınimo si la region factible es cerrada y acotada.

Page 64: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

64 TEMA 4. PROGRAMACION LINEAL

O al menos tienen supremo e ınfimo si la region es acotada aunque no cerrada.Pero puede ocurrir que la region factible sea no acotada, en cuyo caso puede que el pro-

blema no tenga o bien maximo o bien mınimo (o supremo o ınfimo, como ya dijimos, sila region no es cerrada).

Ilustramos con un ejemplo las posibilidades: sea como antes la funcion f(x, y) = x + y,pero ahora considerada sobre la region factible:

E = (x, y) ∈ R2 | 0 ≤ x, 0 ≤ y, 3x + y ≥ 4, 2x + 3y ≥ 6.

Entonces, dados los problemas

mın(x,y)∈E

f(x, y), max(x,y)∈E

f(x, y),

el primero tiene solucion mientras que el segundo no posee solucion: f tiene mınimo sobre Epero no maximo, de hecho veremos que sup

Ef(x, y) = +∞.

Razonese la respuesta en ambos casos trazando rectas paralelas a x + y = 0.

Ahora se puede comprobar que, si bien lıneas que minimizan el valor constante= x + ytienen un “tope” pues van descendiendo y el ultimo punto factible es el (6/7, 10/7), en sentidoascendente (generando valores cada vez mayores constante= x + y) no tiene maximo finito:

0 0.5 1 1.5 2 2.5 3 3.5 40

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

Existen puntos (x, y) ∈ E tan grandes como queramos, haciendo, como anunciamos, quesupE

f(x, y) = +∞.

Page 65: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 5

Estadıstica descriptiva

5.1. Introduccion

En un curso general de Matematica Aplicada suele haber, por necesidades de sus recepto-res, un bloque de estadıstica. La estadıstica pretende extraer informacion relevante a partir deuna serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a vecesexisten relaciones entre los mismos, medidas caracterısticas que apuntan a cierta direccion, oque senalan cuanto se ha alejado la muestra de un valor central.

El objetivo de este y los siguientes temas es poder obtener este tipo de informacion detablas dadas.

5.2. Distribuciones estadısticas. Representaciones graficas

5.2.1. Conceptos fundamentales

La Estadıstica es el conjunto de metodos necesarios para recoger, clasificar, representar yresumir datos (Estadıstica Descriptiva), ası como de obtener consecuencias cientıficas a partirde estos datos (Inferencia Estadıstica).

Poblacion es el conjunto de todos los elementos observados al realizar un experimento.

Muestra es cualquier subconjunto de la poblacion.

Individuo es cada uno de los elementos de la poblacion.

Tamano de la muestra es el numero de elementos de la muestra.

Un caracter estadıstico es cualquier propiedad que permite clasificar a los individuosde una poblacion. Se clasifican en cualitativos y en cuantitativos.

Modalidad de un caracter es cada una de las diferentes situaciones que puede presentarun caracter. Estas en un mismo caracter son incompatibles. Por ejemplo, el caracter sexo,presenta dos modalidades: masculino y femenino.

Variable estadıstica es la correspondencia que a cada modalidad de un caracter cuan-titativo le asocia un numero real. Se clasifican en discretas (por ejemplo, el numero de hijasde una familia, el numero de obreros en una fabrica) y continuas (temperaturas registradasen un observatorio, la presion sanguınea de enfermos). Se suelen representar por X, Y o Z.

65

Page 66: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

66 TEMA 5. ESTADISTICA DESCRIPTIVA

Distribucion de frecuencias. Los datos recogidos se van a clasificar y representar enuna tabla en la que aparecen distintas frecuencias.

Sean N el tamano de la muestra, C el caracter a analizar presentando las modalidadesC1, C2, ..., Ck.

Sea ni la frecuencia absoluta de Ci, es decir, el numero de individuos que presentan lamodalidad Ci.

La frecuencia relativa de Ci es fi = ni

N .

El porcentaje relativo a 100 individuos de Ci es pi = 100fi.

Se verifica quek∑

i=1ni = N,

k∑i=1

fi = 1.

La frecuencia absoluta acumulada es Ni =i∑

j=1nj y la frecuencia relativa acumu-

lada Fi =i∑

j=1fj =

i∑j=1

Ni

N . Entonces Nk = N , Fk = 1.

El porcentaje relativo acumulado es Pi =i∑

j=1pj.

5.2.2. Tablas estadısticas

Muestra de tamano N para analizar un caracter cualitativo

Supongamos dada la siguiente tabla, donde las variables C1, C2, ..., Ck son posibles moda-lidades.

Modalidades F. abs. F. relativas Porcentajes

C1 n1 f1 100f1

C2 n2 f2 100f2...

......

...

Ck nk fk 100fk

Total N 1 100%

(5.1)

Ejemplo: Distribucion del color de los ojos en una muestra de 50 personas:

Modalidades F. abs. F. relativas Porcentajes

Azules 16 0′32 32%

Verdes 12 0′24 24%

Marrones 14 0′28 28%

Negros 8 0′16 16%

Total 50 1 100%

(5.2)

Page 67: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

5.2. DISTRIBUCIONES ESTADISTICAS. REPRESENTACIONES GRAFICAS 67

Tabla estadıstica para una variable discreta

En una muestra de tamano N se ordenan de menor a mayor los valores de la variable,x1 < x2 < ... < xk, y se anaden la frecuencias absolutas y relativas junto con los porcentajes.

Valores F. abs. F. relativas Porcentajes

x1 n1 f1 100f1

x2 n2 f2 100f2...

......

...

xk nk fk 100fk

Total N 1 100%

(5.3)

Se puede completar la tabla con las frecuencias acumuladas para facilitar posteriores calcu-los.

Ejemplo: Distribucion del numero de hijos en una muestra de 100 familias espanolas:

xi ni Ni fi Fi pi

0 14 14 0′14 0′14 14%

1 26 40 0′26 0′40 26%

2 30 70 0′30 0′70 30%

3 16 86 0′16 0′86 16%

≥ 4 14 100 0′14 1 14%

Total 100 1 100%

(5.4)

Tabla estadıstica para una variable continua

Los datos se agrupan en clases, que van a ser intervalos semiabiertos, [e0, e1), [e1, e2),· · ·, [ek−1, ek). Se considera que todos los individuos de una misma clase tienen el valor quesenala la marca de clase, siendo

ci =ei−1 + ei

2, i = 1, · · ·, k. (5.5)

La amplitud de la clase [ei−1, ei) es ai = ei − ei−1.

Ventaja: menor numero de calculos.

Desventaja: perdida de informacion.

Clases Marcas ni Ni fi Fi pi Pi

[e0, e1) c1 n1 N1 f1 F1 p1 P1

[e1, e2) c2 n2 N2 f2 F2 p2 P2...

......

......

......

...

[ek−1, ek) ck nk Nk fk Fk pk Pk

Total N 1 100%

(5.6)

Page 68: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

68 TEMA 5. ESTADISTICA DESCRIPTIVA

Ejemplo: Pesos en miligramos de 40 pastillas de ciertos medicamentos:

Peso [200, 210) [210, 215) [215, 220) [220, 230)

ni 3 10 14 13(5.7)

5.2.3. Representaciones graficas

Van a completar la informacion recogida en la tabla estadıstica.

Dependiendo de la naturaleza del caracter estudiado hay diferentes tipos de representa-ciones.

Graficas para caracteres cualitativos

Diagramas de barras. Sobre un sistema de ejes cartesianos en uno de los ejes serepresentan las distintas modalidades y en el otro los valores de la frecuencia. Sobre cadamodalidad se levantan rectangulos de la misma base y altura proporcional (normalmenteigual) a la frecuencia.

Ejemplo. Distribucion del estado civil de 150 personas:

Estado Solt. Cas. V. Div. Rel. No declara

Fr.abs. 20 78 15 26 7 4(5.8)

Page 69: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

5.2. DISTRIBUCIONES ESTADISTICAS. REPRESENTACIONES GRAFICAS 69

Diagramas de sectores. Se traza una circunferencia de radio arbitrario y se divide sucırculo en sectores. Cada sector se asocia a una modalidad siendo el angulo correspon-diente de cada sector proporcional a la frecuencia de cada modalidad.

Pictogramas. Cada modalidad se representa por una figura no geometrica de tamanoproporcional a su frecuencia, o bien se toma un dibujo como modelo y se repite unnumero de veces proporcional a la frecuencia de la modalidad correspondiente1.

1Tomado de la pagina web: http://www.me.gov.ve/SegundaEtapa/Glosario/matematica.htm

Page 70: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

70 TEMA 5. ESTADISTICA DESCRIPTIVA

Graficas para caracteres cuantitativos

Variable discreta

Diagramas de barras. Cuando la variable es discreta y toma pocos valores, el graficoadecuado es el diagrama de barras o rectangulos. Se construye de la misma forma que paralos caracteres cualitativos pero ahora sobre el eje X se situan los valores de la variable.

Uniendo los extremos superiores de las barras o los puntos medios de los lados superioresde los rectangulos se obtiene el polıgono de frecuencias simples.

Ejemplo: Distribucion del numero de hijos en una muestra de 100 familias espanolas:

xi ni fi

0 14 0′141 26 0′262 30 0′303 16 0′16

≥ 4 14 0′14

(5.9)

El diagrama de barras es el siguiente:

Los polıgonos de frecuencias simples para ni y fi (para ser precisos, y dado que cualquiercolumna proporcional es valida en estas representaciones, se aclara que polıgono de frecuenciasse esta construyendo: absolutas, relativas o porcentuales) vienen dados simplemente por:

Page 71: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

5.2. DISTRIBUCIONES ESTADISTICAS. REPRESENTACIONES GRAFICAS 71

Variable continua

Histogramas. Como los datos usados en este caso proceden de una variable continua, semantiene el tamano real de la base de cada modalidad para no generar graficas equıvocas.Precisamente por ello serıa igualmente tendencioso poner una altura proporcional a la fre-cuencia absoluta o cualquier otra (un intervalo con ni grande puede deberse simplemente aser demasiado grande). De modo que sobre cada intervalo de clase se levanta un rectangulode area igual o proporcional a la frecuencia del correspondiente intervalo. Esto implicaque leer meramente las alturas en un histograma es incorrecto, la informacion esta codificadaen las areas.

Si las amplitudes son iguales, entonces las alturas se toman iguales a las frecuencias.

Amplitudes diferentes: En la clase [ei−1, ei), considerando area igual a la frecuencia absolu-ta (tambien valdrıa cualquier otra columna proporcional: la relativa o la porcentual), tenemoshi = ni

ai, donde hi es la altura del rectangulo correspondiente a esa clase, y ai la amplitud.

Ejemplo: Tabla, histograma y polıgono de frecuencias acumuladas en las calificacionesde 200 alumnos:

Notas ni pi hi

[0, 3) 48 24% 8

[3, 5) 69 34′5% 17′25[5, 7) 55 27′5% 13′75[7, 9) 20 10% 5

[9, 10) 8 4% 4

(5.10)

Page 72: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

72 TEMA 5. ESTADISTICA DESCRIPTIVA

Uniendo los puntos medios de los lados superiores de los rectangulos se obtiene el polıgonode frecuencias simples enmarcado en el histograma: para ser precisos, y dado quecualquier columna proporcional es valida en estas representaciones, se aclara que polıgono defrecuencias se esta construyendo (absolutas, relativas o porcentuales), en este caso el de losporcentajes relativos.

Polıgono de frecuencias acumuladas. En el eje X se representan los extremos delas clases. A e0 se le asigna ordenada 0 y a cada extremo derecho de las clases se le asignacomo ordenada la frecuencia acumulada (absoluta, relativa o porcentual) de dicha marca.La poligonal que une dichos puntos es el polıgono de frecuencias acumuladas. El hecho detomar ahora la poligonal de los extremos a la derecha de los rectangulos es que, suponiendouniformemente distribuido el numero de individuos en cada clase, dicha poligonal deberıareflejar al final de cada intervalo el total de individuos en el contenido.

Page 73: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

5.3. MEDIDAS DE POSICION Y DISPERSION 73

Aplicacion: supuesto conocido el polıgono de frecuencias acumuladas y fijado un valorx0 de la variable, la ordenada correspondiente, que se obtiene por interpolacion lineal, es elporcentaje acumulado de individuos de la muestra para los que la variable es menor o igualque x0.

Ejemplo: Peso en kg de 100 personas:

Peso [20, 40) [40, 60) [60, 80) [80, 100)

Pi 10 59 91 100(5.11)

Porcentaje de individuos cuyo peso es menor o igual que 69: como 69 ∈ [60, 80), se calculala recta que pasa por (60, 59) y (80, 91) y se sustituye la abscisa por 69:

y = 59 +91 − 59

80 − 60(69 − 60) = 73′4%. (5.12)

5.3. Medidas de posicion y dispersion

Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores quesintetizan la informacion. Estudiaremos dos grandes secciones:

Medidas de tendencia central o de posicion: situacion de los valores alrededor delos cuales fluctuan los demas.

Page 74: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

74 TEMA 5. ESTADISTICA DESCRIPTIVA

Medidas de dispersion: grado de desviacion de los datos respecto de las medidas detendencia central.

Acabaremos este resumen con el proceso de tipificacion de una variable aleatoria.

5.3.1. Medidas de tendencia central

Estudiaremos la media aritmetica y la mediana.

Media aritmetica

Se suele representar por x, aunque tambien por µ e incluso abusando de la notacionprobabilista EX (esperanza de la variable X). Es el valor de tendencia central de mayorinteres.

Caso discreto

Sea X una variable discreta que toma los valores x1, x2, · · ·, xk con frecuencias absolutasn1, n2, · · ·, nk resp. La media aritmetica de X viene dada por

x =

k∑i=1

xini

N=

k∑

i=1

xifi. (5.13)

Ejemplo. Calificaciones de 20 alumnos en Matematicas:

xi ni Ni Pi

2 3 3 15

4 6 9 45

5 5 14 70

6 3 17 85

8 1 18 90

10 2 20 100

(5.14)

La nota media es x = 2·3+4·6+5·5+6·3+8·1+10·220 = 5′05.

Propiedades

1) La suma de todas las desviaciones a la media es cero:k∑

i=1(xi − x)ni = 0.

2) Si X toma los valores x1, x2, . . . , xk, e Y los valores yi = xi + c, i = 1, 2, . . . , k, c ∈ R,entonces y = x + c.

3) Si X toma los valores x1, x2, . . . , xk, e Y los valores yi = cxi, i = 1, 2, . . . , k, c ∈ R,entonces y = cx.

Page 75: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

5.3. MEDIDAS DE POSICION Y DISPERSION 75

Aplicacion: si X toma los valores x1, x2, . . . , xk, y Z los valores zi = xi−cd , i = 1, 2, . . . , k,

con c, d ∈ R, d 6= 0, entonces z = x−cd , lo cual facilita a veces los calculos cambiando de

variable. Por ejemplo, se quiere calcular el diametro medio de 100 embolos cuyas medidas enmm son:

(xi) 153′7 153′8 153′9 154′0 154′1 154′2 154′3ni 10 15 19 21 14 13 8

(5.15)

Definimos Z = X−1540′1 cuya distribucion de frecuencias es

Diametro (zi) −3 −2 −1 0 1 2 3

ni 10 15 19 21 14 13 8(5.16)

La media de Z es z = −0′15, luego x = 0′1z + 154 = 153′985.

Caso continuo

Si la variable aleatoria es continua, para simplificar se calculara la media aritmetica deuna variable discreta cuyos valores son las marcas de clase de cada uno de los intervalos y lasfrecuencias absolutas las de cada clase. Con ello se pierde precision, porque solo se tendra encuenta el numero de valores que esta dentro de un intervalo de clase pero no la forma en laque estan repartidos.

Ventajas de la media aritmetica:

- Contiene toda la informacion de los datos de la distribucion, por lo que es representativa.

- Siempre puede ser determinada, es facil de calcular y admite operaciones aritmeticas.

Desventaja: presenta una gran sensibilidad a valores extremos.

Percentiles. Caso particular: la mediana

Se suponen los valores de la variable ordenados en orden creciente. Si n ∈ N, con 1 ≤ n ≤100, el percentil de rango n es el valor de la variable estad’ıstica que deja por debajo de elal n % de los valores y al resto por encima. La mediana es el percentil de rango 50 (dividea la muestra en dos partes iguales; al menos la mitad de la muestra cumple estar por debajodel valor destacado).

Estudiaremos el valor de la variable correspondiente a un percentil dado; y dado un valorde la variable calcularemos el percentil correspondiente.

Page 76: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

76 TEMA 5. ESTADISTICA DESCRIPTIVA

Caso discreto

Se realiza en primer lugar la tabla de frecuencias porcentuales acumuladas (f.p.a.).

a) Si el porcentaje n no figura en la columna de f.p.a. se toma como percentil de rango nel primer valor de la variable cuya f.p.a. sobrepasa a n.

b) Si el porcentaje n coincide con la f.p.a. de algun valor xi, se toma como percentil derango n el valor xi+xi+1

2 .

Ejemplo. Consideramos de nuevo la tabla dada en la pagina 74 sobre las calificaciones de20 alumnos en Matematicas.

La mediana es 5, el percentil de rango 84 es 6, mientras que el percentil de rango 85 es6+82 = 7.

Caso continuo

Se construye el polıgono de frecuencias porcentuales acumuladas (no debe construirsesobre el histograma, sino solo, pues las alturas deben reflejar el porcentaje correspondienteindependientemente de la amplitud de cada clase). La abscisa correspondiente a la ordenadan es el percentil de rango n. El calculo se hace por interpolacion suponiendo que todos losindividuos de un intervalo de clase estan distribuidos homogeneamente.

Ejemplo. Peso en kg de 100 personas:

Peso [20, 40) [40, 60) [60, 80) [80, 100)

Pi 10 59 91 100(5.17)

10

59

91100

Pi

20 40 60 80 100peso

Page 77: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

5.3. MEDIDAS DE POSICION Y DISPERSION 77

Recuerdese que la recta que pasa por los puntos (x0, y0) y (x1, y1) viene dada, por ejemplo,como y − y0 = y1−y0

x1−x0(x − x0).

En este caso la mediana esta en el intervalo [40, 60). Es aquel x tal que

50 − 10 =59 − 10

60 − 40(x − 40) ⇒ x = 41′6. (5.18)

El percentil de rango 91 es 80.

5.3.2. Medidas de dispersion

La dispersion de una distribucion es la mayor o menor separacion de sus datos respectode una de las caracterısticas de tendencia central, pretendiendo medir la representatividad dedicha caracterıstica.

Ejemplo. Calificaciones de 28 alumnos:

Fısica 3 9

ni 14 14

Biologıa 3 6 9

ni 5 6 7(5.19)

La calificacion media en ambas asignaturas es de 6 puntos, pero ¿donde es mas represen-tativa?

Estudiaremos

el recorrido,

la desviacion media,

la varianza,

la desviacion tıpica y

el coeficiente de variacion de Pearson.

Recorrido

Viene definido como

R = max(xi) − min(xi). (5.20)

Proporciona una primera informacion de la variabilidad de la distribucion, pero es insufi-ciente ya que si la variable toma un valor muy alto o muy bajo en relacion con el resto, puedeinducir a engano (de nuevo, como ocurrıa con la media, es muy sensible a valores extremos).

Page 78: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

78 TEMA 5. ESTADISTICA DESCRIPTIVA

Desviacion media

Dada una caracterıstica de tendencia central C, los valores |xi − C| representan la des-viacion a C. Estas cantidades definen una variable estadıstica que se usa como medida dedispersion. En concreto, la desviacion media es la media aritmetica de las desviaciones a lamedia:

Dx =

k∑i=1

|xi − x|ni

N. (5.21)

Problema: los valores absolutos no son muy adecuados para realizar calculos y posterioresestudios.

Varianza

Se define como la media aritmetica de los cuadrados de las desviaciones a la media:

s2X =

k∑i=1

(xi − x)2ni

N. (5.22)

Si la varianza es nula, todos los valores de la variable coinciden con la media, es decir,dispersion nula. Cuanto mas alejadas esten las observaciones de la media, mayor sera la va-rianza. A veces tambien aparece (por ejemplo en muchas calculadoras) expresada como σ2

n.

Propiedades: Sea X una variable, c, d ∈ R, d 6= 0.

1) Si Y = dX, entonces s2Y = d2s2

X .

2) Si Y = X + c, entonces s2Y = s2

X .

Teorema 5.1 (de Konig). la varianza es la diferencia entre la media de los cuadrados y elcuadrado de la media, es decir,

k∑i=1

(xi − x)2ni

N=

k∑i=1

xi2ni

N− x2 (5.23)

Problema: como todas las desviaciones estan elevadas al cuadrado, la unidad de medidade la varianza viene dada en cuadrados de las unidades de los datos originales.

Desviacion tıpica

Se define como la raız cuadrada positiva de la varianza:

sX =

k∑i=1

(xi − x)2ni

N

1/2

. (5.24)

Page 79: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

5.3. MEDIDAS DE POSICION Y DISPERSION 79

Esto aparece representado en muchas calculadoras como σn.

Propiedades: Sea X una variable, c, d ∈ R, d 6= 0.

1) Si Y = dX, entonces sY = dsX .

2) Si Y = X + c, entonces sY = sX .

3) Usando de nuevo el Teorema de Konig:

sX =

k∑i=1

xi2ni

N− x2

1/2

(5.25)

Ejemplo. Calificaciones de 20 alumnos en Matematicas:

xi ni (xi − x)2 (xi − x)2ni x2i x2

i ni

2 3 9’3025 27’9075 4 12

6 6 1’1025 6’6150 16 96

5 5 0’0025 0’0125 25 125

6 3 0’9025 2’7075 36 108

8 1 8’7025 8’7025 64 64

10 2 24’5025 49’0050 100 200

Total 20 94’95 605

(5.26)

Sabemos que x = 5′05.

Usando la definicion, s2X =

k∑i=1

(xi−x)2ni

N = 94′9520 = 4′7475, y sX = 2′1788.

Usando el Teorema de Konig, s2X =

k∑i=1

xi2ni

N − x2 = 60520 − (5′05)2 = 4′7475.

Coeficiente de variacion de Pearson

A veces hay que comparar las dispersiones de dos distribuciones expresadas en distintasunidades. Es por ello que estudiamos una medida relativa de la variabilidad de la distribucionmediante un numero abstracto independiente de las unidades de medida de las variables. Elcoeficiente de variacion de Pearson es

CV =sX

x. (5.27)

Multiplicandolo por cien permite usar el lenguaje de porcentajes. Cuanto mayor sea CVmenor sera la representatividad de la media. Su valor mınimo es cero, cuando sX = 0, en cuyocaso, obviamente, no hay dispersion.

Page 80: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

80 TEMA 5. ESTADISTICA DESCRIPTIVA

Tipificacion de la variable

En ocasiones interesa deducir el valor relativo de un dato respecto al grupo que pertenece,usando para ello la media y desviacion tıpica del grupo.

Ejemplo. Se quiere asignar un puesto de trabajo entre dos candidatos. La plaza la consigueel que obtenga mejor calificacion en una prueba que ambos realizaron en sus ciudades de proce-dencia. El candidato A obtuvo 55 puntos sobre 80, el candidato B 7 sobre 10 puntos. Son cono-cidas las medias y las desviaciones tıpicas de ambas pruebas: xA = 45, sA = 12; xB = 6, sB = 2.

¿Quien consigue entonces el puesto de trabajo? O dicho mas generalmente: ¿como com-parar datos de dos muestras distintas asociadas a un mismo tipo de estudio? Se hace unreescalamiento, denominado tipificacion.

Se llama tipificacion de la variable X, que toma los valores x1, x2, . . . , xk, a la trans-formacion

zi =xi − x

sX. (5.28)

A la variable Z que toma los valores z1, z2, . . . , zk, se le llama variable tipificada.

Gracias a las propiedades de la media y desviacion tıpica, la variable tipificada tiene medianula y desviacion tıpica uno (y ahora sı podemos compararlas).

Notamos ZA y ZB a dos nuevas variables estadısticas, las tipificaciones de las calificacioneshabidas en las respectivas ciudades. Ası, las notas de ambos individuos “tipificadas” son:

zA =xA − xA

sA= 0′83; zB =

xB − xB

sB= 0′5. (5.29)

Estos valores ahora sı son comparables, y elegimos el valor mayor, es decir, el candidato de laciudad A como el mas apto.

Page 81: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 6

Variables estadısticasbidimensionales

6.1. Introduccion

Los individuos de una poblacion pueden ser clasificados atendiendo a dos caracteres si-multaneamente. Por ejemplo, pulso y temperatura de los enfermos de un hospital, producciony venta de una fabrica, etc.

El objetivo de este tema sera mostrar algunos resultados sobre el estudio de la relacionentre dos caracterısticas dadas en el mismo problema y como diagnosticar posibles valoresesperados (cabe decir que al contrario que la interpolacion dada en el primer bloque de laasignatura, ahora se usaran tecnicas de aproximacion).

Consideremos una muestra de N individuos, que clasificamos atendiendo a dos caracteresX e Y, que presentan, respectivamente, las modalidades x1, x2, . . . , xp e y1, y2, . . . , yq. Por nij

representamos al numero de individuos que presenta la modalidad xi de X y la modalidadyj de Y. Es decir, nij es la frecuencia absoluta del par (xi, yj). Y fij =

nij

N es la frecuenciarelativa. Entonces

p∑

i=1

q∑

j=1

nij = N,

p∑

i=1

q∑

j=1

fij = 1. (6.1)

Representando los pares (xi, yj) se obtiene un conjunto de puntos en el plano llamadodiagrama de dispersion o nube de puntos. Nuestro objetivo en este tema es analizar,dada una nube de puntos, si existe una relacion lineal entre las dos caracterısticas estudiadas.

6.2. Tablas de doble entrada

Mediante ellas vamos a representar las variables bidimensionales. En la primera columnase colocan las modalidades de X y en la primera fila las de Y . La interseccion de la fila dondeesta xi con la columna donde esta yj corresponde a nij.

81

Page 82: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

82 TEMA 6. VARIABLES ESTADISTICAS BIDIMENSIONALES

X\Y y1 · · · yj · · · yq Total

x1 n11 · · · n1j · · · n1q n1·...

......

...

xi ni1 · · · nij · · · niq ni·...

......

...

xp np1 · · · npj · · · npq np·Total n·1 · · · n·j · · · n·q

(6.2)

ni· =q∑

j=1nij es la frecuencia absoluta marginal de X, y n·j =

p∑i=1

nij es la frecuencia

absoluta marginal de Y.

Se verifica que

p∑

i=1

ni· = N,

q∑

j=1

n·j = N. (6.3)

Se pueden definir las medias, varianzas y desviaciones tıpicas marginales de X e Y, pero enla practica vamos a simplificar los calculos pues toda tabla de doble entrada va a poderseescribir como una tabla simple.

Veamoslo con el ejemplo siguiente: estudiamos el numero de toneladas de sandıas y demelones producidos en 50 granjas. X es el numero de toneladas de sandias e Y el numero detoneladas de melones. La tabla de doble entrada

X\Y 0 1 2 3 4 5 6 Total

0 2 0 4 3 1 0 0 10

1 3 0 9 0 0 3 0 15

2 0 6 0 6 0 0 1 13

3 1 4 0 0 2 1 0 8

4 0 0 2 0 1 0 0 3

5 0 0 0 1 0 0 0 1

Total 6 10 15 10 4 4 1 50

(6.4)

Page 83: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

6.3. RELACIONES ENTRE LAS VARIABLES X E Y 83

la convertimos en una tabla simple (donde cambiamos los subındices)

xi yi ni

0 0 2

0 2 4

0 3 3

0 4 1

1 0 3

1 2 9

1 5 3

2 1 6

2 3 6

2 6 1

3 0 1

3 1 4

3 4 2

3 5 1

4 2 2

4 4 1

5 3 1

(6.5)

En la tabla de doble entrada se puede calcular, por ejemplo,

x =0 · 10 + 1 · 15 + 2 · 13 + 3 · 8 + 4 · 3 + 5 · 1

50= 1′64,

s2X =

∑ki=1 xi

2ni·N

− x2 = 1′55. (6.6)

6.3. Relaciones entre las variables X e Y

1- El primer indicador del grado de relacion entre las variables va a ser la covarianza ovarianza conjunta de las variables X e Y .

La covarianza de la variable bidimensional (X,Y ), es decir, la que toma los valores(x1, y1), (x2, y2), . . . , (xk, yk) con frecuencias absolutas n1, n2, . . . , nk es

sXY =

k∑i=1

(xi − x)(yi − y)ni

N=

k∑i=1

xiyini

N− xy. (6.7)

Page 84: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

84 TEMA 6. VARIABLES ESTADISTICAS BIDIMENSIONALES

(Esta ultima igualdad se comprueba simplemente desarrollando el producto previo.)

2- Curva de regresion. Buscamos una curva y = f(x) cuya grafica se adapte lo masposible a la nube de puntos, de manera que conocido el valor de una de las variables podamosobtener un valor aproximado de la otra mediante esta curva. Ası podemos encontrar regresionlineal, parabolica, exponencial, etc.

Vamos principalmente a analizar la regresion lineal, es decir, el caso de la recta que mascerca pase de los puntos dados (esto se hace midiendo y minimizando la distancia, encierto sentido, de la recta a la nube de puntos; segun que se minimice se pueden obtenerdistintas rectas).

La recta de regresion de Y sobre X y la de X sobre Y son, respectivamente,

y − y =sXY

s2X

(x − x), x − x =sXY

s2Y

(y − y). (6.8)

Ejemplo. Las calificaciones en Matematicas (X) y Quımica (Y ) de 15 alumnos de Far-macia son

X 8 8 6 6 7 8 5 6 7 7 8 7 8 6 8Y 4 6 3 5 4 6 4 4 6 4 5 7 6 5 6

(6.9)

Graficamente vemos su distribucion:

4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 92

3

4

5

6

7

8

Nos planteamos el siguiente problema: mediante la recta de regresion de Y sobre X,determinar la nota que tendra un alumno en Quımica que tiene un 8 en Matematicas.

Page 85: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

6.3. RELACIONES ENTRE LAS VARIABLES X E Y 85

Calculamos para ello las medias, varianzas y covarianza de las variables:

x = 7; s2X = 0′93; y = 5; s2

Y = 1′2; sXY = 0′53. (6.10)

La recta de regresion de Y sobre X es

y − 5 =0′530′93

(x − 7) ⇒ y = 0′57x + 1′01. (6.11)

4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 92

3

4

5

6

7

8

Esta recta, que minimiza la distancia (en el sentido de mınimos cuadrados) de la nubede puntos a ella mas que cualquier otra recta, sirve para “aventurar” aproximaciones devalores buscados esten o no en los datos iniciales.

Por ejemplo, la nota “mas esperada” por esta vıa en Quımica para un alumno con un 8en Matematicas sera 0′57 · 8 + 1′01 = 5′57.

Tambien podemos, por ejemplo, plantearnos la regresion exponencial. Se trata de hallarla curva exponencial de la forma y = cax, con a ∈ (0, 1)∪ (1,∞), que pase mas cerca delos puntos que forman la nube de puntos.

Para calcular dicha curva tenemos entonces que hallar las constantes c y a. La idea estransformar la curva exponencial en una recta tomando logaritmos, es decir,

y = cax ⇒ log y = log(cax) = log c + x log a

Page 86: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

86 TEMA 6. VARIABLES ESTADISTICAS BIDIMENSIONALES

con lo que si hacemos el cambio de variables z = log y, entonces z = (log a)x + log c, esdecir, lo que tendremos que calcular es la recta de regresion para las variables (x, z) ydespues deshacer el cambio (tomando exponenciales) para finalmente obtener los valoresde a y c.Ejemplo. El ingreso de ventas, en billones de dolares, de una determinada marca deordenadores viene dada por la siguiente tabla, donde t representa anos medidos desdeel ano 2000:

t 0 2 4 7y 3 4 11 25

(6.12)

Obtener la curva exponencial de regresion que mejor se ajuste a los datos anteriores.

Para ello, consideramos la tabla siguiente

t 0 2 4 7z 0.4771 0.6020 1.0413 1.3979

(6.13)

donde z esta representando el logaritmo de x (en este ejemplo se esta usando el logaritmoen base diez).

Calculando la recta de regresion lineal correspondiente a la tabla anterior, obtenemosz = 0,13907x + 0,42765, con lo que entonces

c = 100,42765 = 2,677, a = 100,13907 = 1,3774

y ası la curva de regresion exponencial que se ajusta a los datos dados es y = 2,677(1,3774)x.

3- La correlacion es la teorıa que analiza el grado de intensidad de la relacion entre lasdos variables. Diremos

Correlacion positiva si la curva de regresion es creciente.

Correlacion negativa si la curva de regresion es decreciente.

Correlacion nula si no existe ninguna relacion entre las variables (variables incorreladas).

Correlacion de tipo funcional cuando todos los puntos de la nube de puntos pertenecena la curva de regresion.

Supongamos que la regresion es lineal. Analizamos como ındice de la correlacion entre lasvariables X e Y el coeficiente de correlacion lineal de Pearson:

r =sXY

sXsY. (6.14)

Se puede probar que −1 ≤ r ≤ 1. Ademas:

Si r = 0, entonces las rectas de regresion son y = y, x = x, es decir, paralelas alos ejes, no habiendo ningun tipo de dependencia entre ellas. Corresponde a variablesincorreladas.

Page 87: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

6.3. RELACIONES ENTRE LAS VARIABLES X E Y 87

Si |r| = 1, ambas rectas de regresion son iguales y hay regresion de tipo funcional entrelas variables.

Si −1 < r < 0, la correlacion es negativa siendo mayor la intensidad cuanto mas seaproxima r a −1.

Si 0 < r < 1, la correlacion es positiva siendo mayor la intensidad cuanto mas seaproxima r a 1.

Ejemplo. En el ejemplo anterior, r = sXY

sXsY= 0′53

0′97,1·1 = 0′5, por tanto, la correlacion espositiva pero no muy fuerte, y de ahı que la prediccion realizada no es muy fiable.

Page 88: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

88 TEMA 6. VARIABLES ESTADISTICAS BIDIMENSIONALES

Page 89: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 7

Probabilidad. Distribucionesbinomial y normal

7.1. Introduccion

En este tema trataremos algunas cuestiones basicas sobre Probabilidad. Tanto la Pro-babilidad como la Estadıstica son dos campos de las Matematicas que proporcionan utilesherramientas para el estudio de las ciencias de la vida. Muchos fenomenos de la naturaleza noson deterministas, es decir, conllevan una aleatoriedad. La teorıa de la Probabilidad estudialas leyes que modelan esa aleatoriedad mientras que la teorıa estadıstica analiza los datos con-cretos obtenidos de los experimentos; ambas son las caras de una misma moneda que debenconocerse para entender mejor la realidad que se estudia en su conjunto.

Los primeros investigadores de la probabilidad de sucesos, sobre todo aplicada a los juegosde azar, fueron los franceses Pierre Fermat (1601-1665) y Blaise Pascal (1623-1662).

El nombre de azar proviene de los juegos de dados, donde aparecıa pintada la flor deazahar y estaba asociada a la buena suerte, significaba una buena partida. Incluso el nombrede suceso aleatorio, es decir, suceso del cual es imposible predecir el resultado, proviene dellatın “aleas”que significa dado. Sin embargo, ya un siglo antes Galileo estudio problemassencillos como porque es mejor apostar a sacar un 10 que a sacar un 9 en una tirada de tresdados. Antes que Galileo tambien se dedico al estudio de estos problemas Cardano, quienincluso escribio un libro sobre los juegos de dados en el que llega a explicar como hacertrampas para ganar.

La introduccion de Pascal y Fermat en este tema vino de la amistad de Pascal con unjugador profesional, conocido como Caballero de Mere, quien propuso a Pascal una serie deproblemas sobre distintas situaciones en las apuestas de dados. Pascal enviaba los problemas aFermat, con quien le unıa una buena amistad y ası mantuvieron una continua correspondenciasobre ideas y metodos. Pierre Simon Laplace (1749-1827) construyo la formulacion definitivade la teorıa general de la probabilidad. Laplace definio el calculo de probabilidades como “elsentido comun expresado con numeros”.

Este tema consta de las siguientes secciones:

1. Probabilidad.

89

Page 90: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

90 TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL

2. Distribuciones discretas. La distribucion binomial.

3. Distribuciones continuas. La distribucion normal.

7.2. Probabilidad

Llamamos experimento a cualquier proceso que genera un conjunto de datos. Un expe-rimento se dice aleatorio cuando se puede repetir en las mismas condiciones, sus posiblesresultados son conocidos previamente y el resultado de cada prueba depende del azar. Unexperimento se dice determinista cuando al repetirlo en las mismas condiciones, producesiempre el mismo resultado.

Son experimentos aleatorios

- -El lanzamiento de un dado.

- -El lanzamiento de una moneda.

- -La extraccion de un naipe de la baraja.

- -El tiempo de espera de una persona en la parada del autobus.

- -El numero de hijos de una pareja, el sexo del mayor, su estatura o el numero de anos quevivira.

- -El numero de veces que hay que lanzar una moneda hasta que salga cara.

El espacio muestral, que se denota por Ω, es el conjunto de todos los posibles resultadosde un experimento aleatorio. Cualquier subconjunto del espacio muestral se denomina suceso.Se llama suceso elemental al constituido por un solo punto del espacio muestral.

Example En el lanzamiento del dado una vez, Ω1, 2, 3, 4, 5, 6. Un suceso elemental es,por ejemplo, “que salga el 4”, es decir, A = 4. Un suceso no elemental es “que salga unnumero impar”, que se representara como B = 1, 3, 5.

Un espacio muestral puede ser discreto (formado por puntos sueltos) o continuo. Los es-pacios discretos pueden tener un numero finito o infinito de valores. Algunos ejemplos,

- -Lanzamiento de un dado, Ω = 1, 2, 3, 4, 5, 6.

- -Lanzamiento de una moneda, Ω = C,X.

Page 91: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

7.3. DISTRIBUCIONES DISCRETAS. LA DISTRIBUCION BINOMIAL 91

- -Numero de veces que hay que lanzar una moneda hasta que salga cara, Ω = 1, 2, ..., n, ....

- -Tiempo de espera de una persona en la parada del autobus, Ω = [0, 40] (si la frecuenciadel autobus es de 40 minutos).

La teorıa de la probabilidad se ocupa de medir la posibilidad de que ocurra un suceso,hasta que punto se puede esperar que ocurra un suceso. La definicion de probabilidad es:

Definicion 7.1. Se llama probabilidad a una regla que asocia a cada suceso, A, del espacio desucesos, un numero, que representamos por P (A) y llamamos probabilidad de A y que cumplelos siguientes axiomas:

1. P (A) ≥ 0 cualquiera que sea A.

2. P (Ω) = 1.

3. Si A y B son dos sucesos disjuntos (es decir, incompatibles), entonces

P (A ∪ B) = P (A) + P (B).

La probabilidad es un ejemplo de los que se llama una variable aleatoria.

Definicion 7.2. Se llama variable aleatoria a toda regla que asocia a cada elemento de unespacio muestral, Ω, un numero real.

Ejemplo. Al lanzar tres veces una moneda, donde

Ω = (CCC), (CCX), (CXC), (XCC), (CXX), (XCX), (XXC), (XXX),

se puede considerar la variable aleatoria Z que indique “el numero de caras que salen”. Ası,por ejemplo,

Z(CCC) = 3, Z(CXC) = 2, Z(XXC) = 1, Z(XXX) = 0

Las variables aleatorias pueden ser discretas y continuas. A cada una de ellas y los ejemplosmas relevantes dedicamos las siguientes preguntas.

7.3. Distribuciones discretas. La distribucion binomial

Una variable aleatoria se llama discreta cuando solo puede tomar ciertos valores enteros.El ejemplo mas importante de este tipo de variable es el siguiente.

Supongamos que un experimento aleatorio con las siguientes caracterısticas.

1. En cada prueba del experimento solo son posibles dos resultados a los que se suele llamarexito y fracaso.

Page 92: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

92 TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL

2. El resultado obtenido en cada prueba es independiente de los resultados anteriores.

3. La probabilidad del exito es constante, esto es, no varıa de una prueba a otra. Serepresenta por p.

Se dice que este experimento sigue el modelo de la distribucion binomial. A la variablealeatoria que expresa el numero de exitos obtenidos en cada prueba, se la llama variablealeatoria binomial y se la representa por B(n, p), siendo n y p los parametros de dichadistribucion.

7.4. Distribuciones continuas. La distribucion normal

Una variable aleatoria se llama continua cuando puede tomar todos los valores posiblesdentro de un cierto intervalo de la recta real. En este caso, no tiene sentido hablar de laprobabilidad de que tome un valor concreto, porque es 0; en cambio tiene interes conocer laprobabilidad correspondiente a un intervalo.

A una variable aleatoria continua, X, que toma los valores x, se puede asociar una funcion,f(x), con las siguientes propiedades:

1. f(x) ≥ 0 en todo su dominio de definicion.

2. El area encerrada bajo la grafica de f(x) es la unidad.

Entonces, f(x) se llama la funcion de densidad de la variable X. Con esta funcion, sedeterminan las probabilidades de la manera siguiente: la probabilidad de que la variable Xtome los valores comprendidos entre a y b es el area limitada por la curva y = f(x), el eje OXy las rectas verticales x = a y x = b. Si a = −∞ y/o b = +∞, la extension es evidente.

El ejemplo mas importante de variable aleatoria continua es la llamada distribucionnormal, llamada ası porque en un tiempo se creyo que describıa el comportamiento “nor-mal”de los fenomenos. En todo caso, describe multitud de fenomenos en biologıa, pedagogıa,psicologıa,.., y esto es ası por varios motivos:

1. En gran numero de situaciones hay una fuerte influencia a eliminar por igual a lo que sedesvıan en analoga medida de la media, sea esta desviacion por arriba o sea por debajo.

2. Se observa que muchos fenomenos son sumas de efectos parciales independientes, queestos efectos parciales pueden estar sesgados, pero que la suma sı se ajusta a una dis-tribucion simetrica que va disminuyendo de forma regular al alejarse de la normal. Porejemplo, en el peso de las personas de una poblacion, influye la componente genetica, elclima, la alimentacion,..; algunas de estas influencias puede no distribuirse normalmente,pero sı lo hace el peso. Este hecho fue justificado matematicamente en un importan-te teorema llamado Teorema Central del Lımite, que nos dice que si se suman unnumero grande de variables aleatorias independientes, identicamente distribuidas conmedia y varianza finitas, entonces tras un cambio de variable adecuado, la distribucionde la variable resultante es aproximadamente, la normal.

Page 93: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

7.4. DISTRIBUCIONES CONTINUAS. LA DISTRIBUCION NORMAL 93

La distribucon continua mas importante es la normal, porque es la que aparece mas frecuen-temente. Su funcon de densidad tiene esta forma

Definicion 7.3. La funcion de densidad de una variable aleatoria, X, con distribucion normalde parametros µ y σ, que denotaremos N(µ, σ) es

f(x) =1

σ√

2πe−

1

2(x−µ

σ)2 −∞ < x < +∞.

El parametro µ es la media y el parametro σ2 es la varianza.

Definicion 7.4. Se llama funcion de distribucion de la distribucion normal N(µ, σ) a lafuncion definida por

F (x) =

∫ x

−∞f(s) ds, −∞ < x < +∞.

Puede observarse que la funcion f(x) es una funcion de densidad, esto es,

f(x) ≥ 0,1

σ√

∫ +∞

−∞e−

1

2(x−µ

σ)2 dx = 1,

y que tiene ademas las siguientes propiedades:

1. Es simetrica respecto de la recta x = µ.

2. El maximo esta en x = µ.

3. La funcion tiene dos puntos de inflexion en x = µ − σ y x = µ + σ.

Page 94: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

94 TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL

Por lo que se ha dicho antes

P (a ≤ X ≤ b) = F (b) − F (a) =1

σ√

∫ b

ae−

1

2(x−µ

σ)2 dx,

pero esta integral solo puede aproximarse numericamente.

Existe una tabla que contiene los valores de estas integrales, de la que hablamos en laSeccion siguiente, para la normal N(0,1). Para el caso general de una variable normal X demedia µ y desviacion tıpica σ, se hace el cambio de variable

Z =X − µ

σ,

que es ya una variable normal estandar. Ası

F (x) = P (X ≤ x) = P (σZ + µ ≤ x) = P (Z ≤ x − µ

σ),

que se puede obtener mediante la tabla siguiente:

Page 95: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

7.5. CALCULO DE PROBABILIDADES USANDO LA TABLA 95

7.5. Calculo de probabilidades usando la tabla

Ejemplos:

1. P (Z ≤ 1,43)

2. P (Z ≤ −1,34)

3. P (1,18 ≤ Z ≤ 1,56)

Page 96: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

96 TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL

4. P (−1,65 ≤ Z ≤ −1,24)

5. P (−0,18 ≤ Z ≤ 1,73)

6. P (Z ≤ k) = 0,75

7. P (Z ≤ k) = 0,35

Page 97: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 8

Teorıa de muestras y diseno deexperimentos

Como ya se dijo en el tema de Estadıstica Descriptiva, cuando realizamos un experimentoobservamos un conjunto de elementos que llamamos poblacion. Estos elementos pueden serpersonas, esparragos, chinchetas, animales, etc.

Con la Estadıstica se pretende estudiar alguna caracterıstica de la poblacion ahorrandotiempo y dinero, por lo que se elige una parte de la poblacion, a la que hemos llamadomuestra, sobre la que se realiza el estudio para posteriormente inferir estos resultados sobretoda la poblacion. El proceso mediante el cual se extrae una muestra de una poblacion dellama muestreo.

Para que el estudio sea fiable, la muestra tendra que ser realmente representativa de lapoblacion. Por ejemplo, ultimamente se utiliza con mucha frecuencia la realizacion de sondeosde opinion llamando por telefono. Esta claro que este tipo de muestreo da mas oportunidadesa aquellas personas que tienen mas de un telefono. Una muestra como esta obtenida por unprocedimiento que no contempla que todos los individuos de la poblacion tengan la mismaoportunidad de ser elegidos se denomina muestra sesgada. Las conclusiones obtenidas apartir de ella son poco fiables.

8.1. Tipos de muestreo

8.1.1. Muestreo aleatorio simple

En el muestreo aleatorio simple todos los elementos de la poblacion tienen la mismaprobabilidad de ser elegidos para formar parte de la muestra.

Ejemplo: Para realizar una encuesta sobre la intencion de voto en una ciudad se elige, alazar, una muestra formada por 1000 personas.

8.1.2. Muestreo aleatorio estratificado

En el muestreo aleatorio estratificado la poblacion se divide en grupos homogeneosque llamamos estratos, y, posteriormente, se extrae una muestra aleatoria simple de cada

97

Page 98: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

98 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

estrato.

Ejemplo: En una ciudad de sabe que el 60% son mujeres y el 40% hombres. Se quiererealizar una encuesta sobre la intencion de voto escogiendo una muestra de 1000 personas.Para ello, previamente se divide la poblacion en dos estratos: mujeres y hombres, y luego, seextrae de cada estrato una muestra proporcional, es decir, en este caso, 600 mujeres y 400hombres.

8.1.3. Muestreo aleatorio sistematico

En el muestreo aleatorio sistematico se selecciona al azar un elemento de la poblacion,y a partir de el, se seleccionan de k en k los siguientes elementos.

Ejemplo: En una carretera se va a hacer un control de alcoholemia. Se elige al azar alconductor de un vehıculo y se le hace pasar el control, a continuacion, se seleccionan de 50 en50 los siguientes conductores (aquı se ha elegido k = 50).

8.1.4. Muestreo por conglomerados y areas

En el muestreo por conglomerados y areas se divide la poblacion en secciones o con-glomerados. Se eligen luego al azar algunas de estas secciones y se toman todos los elementosde las secciones elegidas para formar la muestra.

Ejemplo: Para realizar una encuesta entre los alcaldes de Espana, se consideran las pro-vincias de Espana. Se eligen al azar algunas provincias y la muestra estara formada por todoslos alcaldes de las provincias elegidas (claramente en este ejemplo las secciones son todas lasprovincias de Espana).

8.2. Distribucion en el muestreo de la media

Consideremos el siguiente ejemplo: los fabricantes de envasado de esparragos desean saberla longitud media de los esparragos. La longitud media la representaremos por µ y por σ ladesviacion tıpica.

Con el fin de hacernos una idea de como puede ser µ, elegimos una muestra aleatoriaformada por 40 esparragos, y se obtiene que:

La longitud media muestral es x1 = 17,3 cm,

La desviacion tıpica muestral es s1 = 0,8 cm.

Si elegimos otras muestras de tamano 40 y calculamos sus medias y desviaciones tıpicas,obtendremos: x2, x3, ·, ·, ·, xn y s2, s3, ·, ·, ·, sn.

Los distintos valores de xi dan lugar a una variable aleatoria que representamos por X.La distribucion de X se llama distribucion de las medias muestrales o distribucion enel muestreo de la media. Se puede demostrar que:

Teorema 8.1. La variable aleatoria X tiene media µ, desviacion tıpica σ√n, y cuando n es

grande (n ≥ 30), se aproxima a la normal correspondiente.

Page 99: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

8.2. DISTRIBUCION EN EL MUESTREO DE LA MEDIA 99

Observacion 8.2. Cuando σ es desconocida y n ≥ 30, sustituiremos σ por la denominadadesviacion tıpica muestral, que esta situacion viene dada por

s =

√∑ni=1(xi − µ)2

n − 1(8.1)

Ejemplo: Se supone que la distribucion de la temperatura del cuerpo humano tiene demedia 37 grados y de desviacion tıpica 0,85 grados. Se elige una muestra de 105 personas.Hallar las siguientes probabilidades:

1. Que la media sea superior o igual a 36,9.

2. Que la media este comprendida entre 36,5 y 37,5.

En este caso, la distribucion de la media muestral es

N

(µ,

σ√n

)= N

(37,

0,85√105

)= N(37, 0,083).

Entonces:

1.

P (X ≤ 36,9) = P

(Z ≤ 36,9 − 37

0,083

)= P (Z ≤ −1,2) = 1−P (Z ≤ 1,2) = 1−0,8849 = 0,115.

2.

P (36,5 ≤ X ≤ 37,5) = P (36,5 − 36,9

0,083≤ Z ≤ 37,5 − 36,9

0,083) = P (−4,82 ≤ Z ≤ 7,23) = 1.

Ejemplo: El cociente intelectual (CI) de unos universitarios se distribuye normalmentecon media 100 y desviacion tıpica 11.

1. Se elige una persona al azar. Hallar la probabilidad de que su CI este entre 100 y 103.

2. Se elige al azar una muestra de 25 de los universitarios. Encontrar la probabilidad deque la media de sus CI este entre 100 y 103.

1. La distribucion de partida es N(100, 11).

P (100 ≤ X ≤ 103) = P

(100 − 100

11≤ Z ≤ 103 − 100

11

)= P (0 ≤ Z ≤ 0,27) = 0,1064.

Page 100: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

100 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

2. La distribucion de la media muestral, como procede de una poblacion de partida normal,es normal cualquiera que sea el valor de n.

Los parametros de esta distribucion son:

µ = 100,σ√n

=11√25

= 2,2.

Por tanto, X ∈ N(100, 2,2), y entonces,

P (100 ≤ X ≤ 103) = P (100 − 100

2,2≤ Z ≤ 103 − 100

2,2) = P (0 ≤ Z ≤ 1,36) = 0,4131.

8.3. Distribucion de la proporcion

Consideremos el siguiente ejemplo: los fabricantes de una determinada marca de chinchetasquieren saber cuantas salen defectuosas. Sea p la proporcion de chinchetas buenas, es decir,las que no presentan defectos.

Ya que no se conoce p, la idea es aproximar su valor de alguna manera. Para ello, setoma una muestra aleatoria de 100 chinchetas y se observa que 86 de ellas estan bien. Alvalor 86/100 lo llamamos p, que nos es el valor de p, pero sı da una idea de la proporcion dechinchetas buenas en la muestra elegida. Evidentemente, al considerar otras muestras de 100chinchetas el valor de p cambiara.

Sin embargo, los distintos valores de p dan lugar a una variable aleatoria que representamospor P y que llamaremos estadıstico. La distribucion de P se llama distribucion muestralo distribucion en el muestreo de la proporcion. Se puede demostrar que:

Teorema 8.3. La variable aleatoria P tiene media p, desviacion tıpica

√p(1 − p)

n, y cuando

n es grande se aproxima a la normal correspondiente, siempre que p no se acerque ni a 0 nia 1.

Ejemplo: Se sabe que un nuevo farmaco ha curado al 85% de los enfermos a los que seles ha aplicado. Calcular la distribucion en el muestreo de la proporcion de enfermos curadospara muestras de tamano 30, 100 y 1000 personas.

La proporcion de enfermos curados es p = 85, ası que en todos los casos µ = 0,85.Discutamos el valor de la desviacion tıpica y la distribucion muestral segun el valor n en cadamuestra:

1. n = 30. Entonces σ =√

0,85 0,1530 = 0,065, y la distribucion muestral sigue la ley

N(0,85; 0, 065).

2. n = 100. En este caso, σ = 0,036, y la distribucion muestral sigue la ley N(0,85; 0, 036).

3. n = 100. En este caso, σ = 0,011, y la distribucion muestral sigue la ley N(0,85; 0, 011).

Page 101: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

8.4. DISTRIBUCION EN EL MUESTREO DE LA DIFERENCIA DE MEDIAS 101

8.4. Distribucion en el muestreo de la diferencia de medias

Consideremos el siguiente ejemplo: supongamos que los esparragos de La Rioja tienende media µ1 y desviacion tıpica σ1, y que los esparragos de Aranjuez tienen de media µ2 ydesviacion tıpica σ2.

Tomamos una muestra de tamano n1 de esparragos de La Rioja y una muestra de tamanon2 de esparragos de Aranjuez. Sean x1 y x2 sus longitudes medias respectivas.

Si elegimos otras medias de tamanos n1 y n2 respectivamente, y calculamos sus medias ylas diferencias de las medias, obtenemos:

x′1 − x′

2, x′′1 − x′′

2, x′′′1 − x′′′

2 , · · ·Estos valores dan lugar a una variable aleatoria que representaremos por X1 − X2. La

distribucion de X1 − X2 se llama distribucion en el muestreo de la diferencia de lasmedias. Se puede demostrar que:

Teorema 8.4. La variable aleatoria X1−X2 tiene media µ1−µ2, desviacion tıpica

√σ2

1

n1+

σ22

n2,

y cuando n es grande se aproxima a la normal correspondiente.

Observacion 8.5. Cuando las desviaciones tıpicas son desconocidas y las muestras son gran-des, sustituiremos σ1 y σ2 por s1 y s2 respectivamente.

Ejemplo: Escojamos al azar una muestra de 40 hombres, los cuales tienen un salariomedio de 914 euros y desviacion tıpica 42 euros. Tambien se escoge al azar una muestrade 30 mujeres que tienen salario medio 883 euros y desviacion tıpica 30 euros. ?’Cual es laprobabilidad de que la diferencia de los sueldos medios sea mayor que 36 euros?

Para la muestra de hombres tenemos x1 = 914, σ1 = 42 y n1 = 40.Para la muestra de mujeres tenemos x2 = 883, σ2 = 30 y n2 = 30.Entonces, X1 − X2 sigue una distribucion

N

(914 − 883,

√422

40+

302

30

)= N(31, 8,61).

Por tanto, tipificando la variable,

P (X1−X2 > 36) = P (Z1−Z2 >36 − 31

8,61) = P (Z1−Z2 > 0,58) = 1−P (Z1−Z2 ≤ 0,58) = 1−0,719 = 0,281.

8.5. Ensayos clınicos

El objetivo que persigue un ensayo clınico es planificar las experiencias de modo que,de ocurrir la significacion, ella solo pueda deberse al tratamiento aplicado a cada grupo deindividuos y no a cualquier otra caracterıstica no controlada. Esto conlleva que los grupos deindividuos que forman parte de las dos muestras han de ser comparables en todo lo relevanteexcepto en el tratamiento aplicado a cada uno de ellos.

Page 102: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

102 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

La palabra tratamiento debe ser entendida en sentido amplio.

Ejemplo: Si se compara un grupo de madres gestantes con otro de madres no gestantes,la gestacion sera considerada un tratamiento.

8.5.1. El grupo de control.

Son frecuentes ciertos razonamientos tendentes a probar la importancia de un determi-nado agente respecto a una cierta enfermedad o accidente. Por ejemplo, puede afirmarseque el alcohol predispone a un accidente de automovil, puesto que el 10% de los conducto-res accidentados habıan consumido alcohol. Esta afirmacion es cierta, pero no por la razonque se esgrime: resulta evidente que los conductores accidentados habran tomado leche enel desayuno, tendran hermanos o llevaran dinero en el bolsillo y, sin embargo, nadie senalatales variables como responsables del accidente. Lo que llevara a ratificar la conclusion inicialsera la comparacion de los porcentajes de los individuos que han tomado bebidas alcoholicasen un grupo de accidentados y en otro de no accidentados.

Se hace, por tanto, necesaria la existencia de un grupo de control de individuos que,tomados de la poblacion general que no sufre accidentes, permita la comparacion de dichosporcentajes.

De modo general, la investigacion medica es, por naturaleza, comparativa. El problemade estudio debe implicar al menos dos grupos: un grupo de pacientes tratados con ciertotratamiento (por ejemplo, tener un accidente) ha de ser comparado con otro grupo de pacientesno tratados llamado grupo de control (lo que no tienen accidente). Eventualmente, puedehaber ademas uno o mas grupos de pacientes tratados con otro/s tratamiento/s (nuevo oestandar).

8.5.2. Concepto de ensayo clınico.

Segun Meinert (1986): “Un ensayo clınico es un diseno experimentalmente planificadopara verificar la eficacia de un tratamiento en humanos a traves de la comparacion de losresultados obtenidos en dos grupos de pacientes que reciben uno el tratamiento problemay el otro un tratamiento alternativo (nuevo o clasico) o ningun tratamiento, ambos grupostomados, tratados y seguidos durante igual periodo de tiempo y obtenidos por la particion alazar en dos grupos de un grupo inicial unico”. El segundo grupo es el grupo de control.

Las caracterısticas que en la definicion aparecen sobre un ensayo clınico son las siguientes:

se realizan con humanos (no con animales),

ambos grupos son seguidos durante igual periodo de tiempo (si el grupo de control constade individuos diagnosticados y tratados con anterioridad al estudio actual (controleshistoricos) no son validos),

particion al azar del grupo unico en los dos grupos, lo que implica que el tratamientoha de estar controlado (a cada individuo de la muestra inicial se le debe poder asignarun tratamiento u otro a voluntad del investigador).

Page 103: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

8.5. ENSAYOS CLINICOS 103

8.5.3. Control del sesgo

En un ensayo clınico los dos grupos deben ser comparables en todas sus caracterısticas ex-cepto en el tratamiento recibido. Por lo complejo del ser humano, esto no es facil de conseguir.Las diferencias observadas entre los dos grupos pueden deberse a las siguientes razones:

a) azar en la toma de muestras: lo controla la estadıstica,

b) diferencias entre los individuos distintas del tratamiento y previas a su aplicacion: locontrola el diseno de ensayo,

c) diferencias en la evaluacion y manipulacion de los grupos: lo controla el tipo de ensayo,

d) diferencias en los efectos de los dos tratamientos: es el objetivo del ensayo.

Control del sesgo ocurrido por la aplicacion de los tratamientos: tipos de ensayosclınicos.

Para evitar que las diferencias obtenidas en el tratamiento se deban al “rito” y no altratamiento en sı, a ambos grupos se le deben aplicar las mismas tecnicas fısicas. En estecaso, el grupo de control pasa a llamarse grupo placebo, por aplicarse un tratamientoplacebo (ficticio). Esta tecnica debe complementarse con la tecnica de simple ciego en laque el paciente no sabe si recibe el tratamiento efectivo o el placebo. Tambien se puede usar latecnica de doble ciego, en la que ni el paciente ni el investigador conocen que enfermos sontratados con uno u otro tratamiento. Existe tambien la tecnica de triple ciego (en la que niel paciente, ni el investigador, ni el comite que monitoriza el estudio conocen el tratamiento),pero es bastante complicada de aplicar.

Senalar tambien que, para evitar que la significacion sea debida a distinta pericia en laaplicacion de los tratamiento, los dos tratamientos han de ser aplicados por el mismo equipoy con un similar entrenamiento en ambos.

De ese modo, podemos distinguir los siguientes tipos de ensayo:

a) con grupo control

b) con grupo placebo

c) tecnica de simple ciego

d) tecnica de doble ciego

e) tecnica de triple ciego

Control del sesgo ocurrido por la seleccion de los individuos: seleccion de lasmuestras.

Los estudios clınicos han de ser:

Page 104: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

104 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

a) el ensayo ha de ser experimental o controlado (el investigador decide acerca deque tratamiento debe recibir cada paciente), evitando los estudios observacionales (elinvestigador no tiene control sobre el tratamiento a aplicar, por ejemplo, cuando unospacientes se prestan a ser grupo de tratamiento o grupo de control dependiendo de susmiedos, antecedentes medicos, experiencias, etc.),

b) el ensayo ha de ser concurrente, es decir, realizado en el mismo periodo de tiempo.Los controles historicos presentan problemas ya que la enfermedad varıa con el tiem-po (especialmente las infecciosas) y los criterios de seleccion de los pacientes tambien(evolucion de las tecnicas de diagnostico, tratamientos mas especializados,...).

c) el ensayo ha de ser aleatorizado, es decir, la asignacion del tratamiento se hace por unmecanismo de sorteo. En cualquier caso, debe incluirse la ficha tecnica de las muestrasutilizadas, incluyendo toda la informacion pertinente sobre la distribucion en cada mues-tra de todos los posibles factores de riesgo, especialmente la edad y el sexo. Convienesenalar que la asignacion aleatoria (proceso mediante el cual se asignan individuos alos grupos que son sometidos a tratamiento en un determinado ensayo) es diferente dela seleccion aleatoria (proceso mediante el cual se se selecciona al azar una muestrade individuos a partir de una poblacion). Los ensayos clınicos rara vez imponen unaseleccion al azar, ya que lo que hace el investigador es aceptar los pacientes disponiblespara el estudio (siempre y cuando cumplan los requisitos de inclusion en el mismo).

8.5.4. Disenos de un ensayo clınico

Tan importante como un adecuado tratamiento es una correcta planificacion de laexperiencia a realizar. Existen varios modos de planificar un ensayo clınico (tambien validospara el diseno de experimentos en general):

a) en muestras independientes (cada individuo recibe un unico tratamiento) o apa-readas (cada individuo recibe los dos tratamientos).

b) disenos cruzados (en muestras apareadas): la mitad de los individuos reciben lostratamientos en un orden y la otra mitad en el orden contrario.

c) disenos estratificados: es un metodo a medio camino entre las muestras independien-tes y las apareadas. Se aparea parcialmente en base a una estratificacion de uno o masfactores de riesgo (edad, sexo, etc.).

Por ejemplo: Cuando la variable es cualitativa (sexo), hay dos estratos (varon y hem-bra). Cuando la variable es cuantitativa (edad) los estratos se consiguen por una agru-pacion por clases (jovenes, adultos, ancianos,...)

d) disenos factoriales: los individuos reciben combinaciones de tratamientos (puedenrecibir los dos tratamientos, uno o ninguno).

Page 105: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

8.5. ENSAYOS CLINICOS 105

e) disenos secuenciales: los individuos van entrando uno a uno en la experiencia y concada entrada se realiza un test para decidir si se toma una decision o un nuevo individuo.Los disenos no secuenciales saben de antemano el tamano del ensayo o se van incluyendoalternativamente individuos en el ensayo hasta que alguna circunstancia ajena a laefectividad de los tratamientos en los individuos ya tratados le aconseja detenerlo (coste,tiempo,..).

8.5.5. Metodos de asignacion aleatoria del tratamiento

La aleatorizacion debe realizarse con una tabla de numeros aleatorios. Si p es la probabili-dad de asignar el tratamiento A a un individuo (B es el otro tratamiento), el proceso consisteen tomar un grupo de numeros de la tabla, convertirlos en decimales y asignar A si el numeroresultante es menos o igual que p (si la muestra es apareada, es que el individuo empiezarecibiendo el tratamiento A).

Consideramos n1 la cantidad de individuos que reciben el tratamiento A y n2 la cantidadde individuos que reciben el tratamiento B, con N = n1 + n2. La aleatorizacion puede ser:

a) con asignacion igual (n1 = n2) o desigual (n1 6= n2), siendo r = n1/N la razon deasignacion.

b) con asignacion fija (no adaptativa) o adaptativa: segun la probabilidad p seaconstante o no a lo largo del proceso de asignacion.

c) con asignacion adaptativa a la baselina (antes de la aplicacion del tratamien-to) o a la respuesta: segun p varıe en funcion de factores medidos antes o despues dela aplicacion del tratamiento.

d) estratificada o no estratificada: segun el tipo de diseno de base.

8.5.6. Otros conceptos relacionados con el ensayo clınico

El ensayo clınico ideal.

Es aquel que es aleatorizado a doble ciego con diseno cruzado.

Medida de la respuesta

Para determinar la eficacia relativa de los tratamientos a comparar es crucial decidirque tipo de resultado va a medirse. La medida de la respuesta al tratamiento puede ser unsuceso clınico (curacion, muerte, mejorıa manifiesta,...) o una medida indirecta (resultadonumerico de un test psicologico, cambio en la presion sanguınea, nivel de lıpidos en suero,...),y debe tener las siguientes caracterısticas deseables:

ser facil de diagnosticar,

Page 106: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

106 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

estar libre de errores de medida,

poder ser observada con independencia del tratamiento,

tener relevancia clınica,

ser elegida antes de comenzar la recoleccion de datos.

Tamano de la muestra

Depende del diseno estadıstico utilizado, del tipo de respuesta medida (cualitativa o cuanti-tativa), de la distribucion estadıstica de la respuesta, de si se desea probar que los tratamientosson distintos o si son iguales, de la razon de asignacion, de si el test es de una cola o de dos, delerror α del test, de la mınima diferencia δ importante que se desea detectar entre los valoresde los parametros que son objeto de test en las dos poblaciones,...

Duracion del ensayo

Depende del tiempo requerido hasta observar la respuesta, del tamano de las muestras ydel numero de centros participantes.

Etica de los ensayos clınicos

Son eticamente admisibles por ser el unico mecanismo cientıfico valido para probar laeficacia de un tratamiento. Requieren del consentimiento informativo del paciente.

Los ensayos clınicos en la legislacion espanola.

La legislacion espanola (BOE del 13/05/1993) entiende por tal a toda evaluacion experi-mental de una sustancia o medicamento en el ser humano. Los divide en cuatro tipo (segunsus objetivos):

De Fase I: estudios, generalmente en individuos sanos, para evaluar preliminarmente elefecto, seguridad y dosificacion del producto.

De Fase II: estudios en enfermos para evaluar la eficacia del producto y ampliar lainformacion sobre su seguridad y dosificacion.

De Fase III: estudios, en un grupo representativo de enfermos, para evaluar la eficacia yseguridad del tratamiento frente a otros alternativos y en condiciones de uso habituales.

De Fase IV: estudios con medicamentos ya comercializados para valorar nuevos aspectosde los mismos.

Page 107: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Bibliografıa

[1] A. Martın Andres y J. de D. Luna del Castillo. Bioestadıstica para las Ciencias de la

Salud. Ed. Norma S. A., 1994.

107

Page 108: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

108 BIBLIOGRAFIA

Page 109: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 9

Inferencia estadıstica

9.1. Intervalos de confianza

Para estudiar alguna caracterıstica de la poblacion serıa necesario sondear a todos y cadauno de sus individuos. Evidentemente, eso es imposible, pero aun ası se intentan dar respuestasaproximadas. Una forma es extraer una muestra aleatoria que nos permita inferir que va aocurrir. Es decir, inferir informacion basandonos en la informacion contenida en una muestra.

La inferencia estadıstica es el conjunto de metodos que permiten obtener una conclusionacerca de una poblacion a traves de la informacion proporcionada por una muestra. Cuandola informacion deseada de la poblacion es el valor de alguno de sus parametros, la tecnica autilizar es la estimacion.

Ya que el conocimiento de la poblacion lo va a proporcionar la muestra, es logico que lamisma no se deba tomar de un modo arbitrario, sino que debe representar adecuadamente atoda la poblacion. Si la muestra no es representativa, nada de lo que se concluya a partir de ellasera valido para la poblacion de interes, sino que lo sera para la subpoblacion que representa(que no es el objetivo del estudio). Ası, para determinar el nivel medio de colesterol de todoslos que viven en Espana, la muestra no puede tomarse solo de personas de edad avanzada(pues el nivel de colesterol varıa con la edad), ni en base a individuos de una sola region(pues la alimentacion varıa con las regiones), ni en base a los individuos que acuden a unhospital (pues logicamente en su mayorıa estaran enfermos), etc. Para que la muestra searepresentativa de la poblacion es preciso que:

Todos los individuos de la poblacion tengan la misma probabilidad de ser seleccionadose incluidos en la muestra.

La seleccion de un individuo no influya para nada en la seleccion o no de otro individuocualquiera.

Con estas condiciones se asegura la representatividad de toda la poblacion.

9.2. Estimaciones de parametros

Hay dos tipos basicos de estimaciones:

109

Page 110: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

110 TEMA 9. INFERENCIA ESTADISTICA

Estimaciones Puntuales: se estima el parametro desconocido con un solo valor, quedandosin especificar como de buena es tal aproximacion.

Estimaciones por intervalos: se persigue dar un intervalo de valores, alguno de los cualeses el verdadero valor del parametro desconocido, con una cierta seguridad de que laafirmacion sea verdadera.

9.3. Estimacion puntual: parametro y estadıstico

Distinguimos entonces entre poblacion (conjunto de todos y cada uno de los individuos)y muestra (conjunto formado por algunos individuos elegidos de forma “aleatoria”). Cuandoqueramos estudiar una caracterıstica de la poblacion, como sera imposible, en realidadestudiaremos una caracterıstica de la muestra.

El valor numerico que describe una caracterıstica de la poblacion es un parametro. Elvalor numerico que describe una caracterıstica de la muestra es un estadıstico.

Trabajamos entonces con estadısticos.

Un estimador puntual es el estadıstico que se usa para estimar un parametro pobla-cional. Es una variable aleatoria en el muestreo que tiene su correspondiente distribucionmuestral. Una estimacion puntual es el valor numerico que toma el estimador puntual parauna muestra determinada.

9.4. Propiedades de los estimadores puntuales

Citaremos dos propiedades que pueden poseer o no los estimadores:

El estimador se llama insesgado cuando su media coincide con el valor del parametroque se va a calcular y se llama sesgado en caso contrario.

El estimador se dice que es tanto mas eficiente cuanto menor sea su varianza, y tantomas no eficiente cuanto mayor sea su varianza.

Ejemplo: Cuando n es muy grande, se toma como estimador de la media poblacionalµ la media muestral x, y de la varianza poblacional la cuasivarianza muestral. Estos dosestimadores son insesgados y eficientes.

9.5. Estimacion por intervalos

En lugar de una estimacion puntual para obtener una aproximacion de un valor quequeremos estimar, parece mas interesante obtener un intervalo dentro del cual haya una ciertaconfianza de que se encuentre el valor del parametro que queremos estimar.

Por ejemplo, suponiendo que un paciente concurre a varios analistas a efectuarse el mismoanalisis y estos le informan, por ejemplo,: A1=85 mg/dl; A2=75 mg/dl; A3=90 mg/dl. Elpaciente podrıa desconfiar de estos valores por la diversidad de los resultados obtenidos, asimple vista le parecerıan diferentes. Por su parte, el medico que encargo el trabajo podrıa

Page 111: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

9.5. ESTIMACION POR INTERVALOS 111

mandar a hacer de nuevo el analisis. Muy diferente hubiese sido la situacion si en sus informeshubieran usado intervalos como: A1 (85 ± 15) mg/dl; A2 (75 ± 4) mg/dl y A3 (90 ± 20)mg/dl. En este caso hay coincidencia entre los tres informes, A1 dice entre 70 y 100, A2 diceentre 71 y 79 y A3 dice entre 70 y 110. Hay una zona donde los tres coinciden, cosa imposiblede ver si se hubieran usado estimadores puntuales.

Por su parte, en la industria farmaceutica, lo normal es trabajar con lımites superiorese inferiores en las composiciones quımicas de los medicamentos, tanto para el proceso pro-ductivo, como para su posterior control de calidad. La idea es siempre informar o establecerla probabilidad de que el verdadero valor caiga dentro del intervalo informado. Por tanto, laforma mas prudente de informar es utilizando intervalos.

Describimos entonces los siguientes conceptos asociados:

1. Intervalo de confianza: intervalo que contiene el valor del parametro con una ciertaprobabilidad.

2. Nivel de confianza o coeficiente de confianza: se denota por 1−α. Es la probabilidad deque el valor del parametro este dentro del intervalo de confianza.

3. Margen de error: es la amplitud del intervalo de confianza.

4. Nivel de significacion o riesgo: α. Es la diferencia entre la certeza y el nivel de confianzadeseado.

5. Valores crıticos: Son los valores de la abscisa que limitan el intervalo de confianza.

El tipo de intervalo que se quiere determinar depende de la situacion en concreto quequeramos resolver:

Si la variable X representa el nivel de glucosa en sangre, lo que nos interesa es conocer unlımite superior del parametro que nos permita decidir si un individuo es o no diabetico,es decir, en este caso buscamos un intervalo de la forma (−∞, b).

Si lo que se considera es el numero de espermatozoides por mm3, interesa buscar unlımite inferior por debajo del cual el individuo sera considerado esteril, es decir, elintervalo se escribe (a,+∞).

Si estamos considerando la concentracion de potasio en plasma, es vital conocer tanto ellımite inferior como uno superior fuera de los cuales el individuo corre peligro. Aquıı elintervalo es (a, b).

En los dos primeros casos se llaman intervalos de un cola y en el tercer caso se denomina inter-valo de dos colas. El coeficiente Zα toma distintos valores segun se este calculando intervalosde una o dos colas.

Page 112: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

112 TEMA 9. INFERENCIA ESTADISTICA

En la siguiente tabla presentamos los valores crıticos, Zα o Zα/2, para los porcentajes mashabituales en el caso de una y dos colas.

N. de confianza N. de significacion Coef. Zα una cola Coef. Zα/2 dos colas

99’95% 0’0005 3’29 3’89

99’90% 0’0010 3’09 3’29

99’50% 0’0050 2’58 3’09

99’00% 0’0100 2’33 2’58

97’50% 0’0250 1’96 2’33

95’00% 0’0500 1’65 1’96

9.6. Intervalo de confianza para el parametro p de una distri-bucion binomial

Supongamos que una poblacion sigue una distribucion binomial con parametro p desco-nocido, que se pretende estimar mediante un intervalo de dos colas con un nivel de confianza1−α. Para ello escogemos una muestra aleatoria de tamano n en el que hay x exitos, de modoque el estimador es

p =x

n.

Entonces, p es una variable aleatoria que sigue una N

(p,

√p(1 − p)

n

).

Si n es grande (np > 5 y n(1−p) > 5), entonces el intervalo de confianza para el parametrop viene dado por

IC =

(p − Zα/2 ·

√p(1 − p)

n, p − Zα/2 ·

√p(1 − p)

n

)

Aplicacion: Se desea hacer un estudio de mercado sobre el nivel de aceptacion de untipo de desodorante. Para ello se toma una muestra aleatoria de 60 personas de las cuales

Page 113: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

9.7. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL 113

45 son asiduas usuarias del mismo. Hallar un intervalo de confianza al nivel del 99% para laproporcion de usuarios del citado desodorante en una comarca muy poblada.

9.7. Intervalo de confianza para la media poblacional

Supongamos que la poblacion de partida sigue una distribucion normal N(µ, σ) y quequeremos estimar el parametro µ mediante un intervalo de dos colas con un nivel de confianza1− α. Para ello escogemos una muestra aleatoria de tamano n y media muestral x. Entonces

X es una variable aleatoria que sigue una N

(µ,

σ√n

).

1. Caso en el que se conoce la varianza.

IC =

(x − Zα/2 ·

σ√n

, x + Zα/2 ·σ√n

)

2. Caso en el que no se conoce la varianza y n es grande (n ≥ 30).

IC =

(x − Zα/2 ·

s√n

, x + Zα/2 ·s√n

),

siendo s2 la cuasivarianza muestral. Recordemos que s2 = s2 nn−1 , siendo s2 la varianza

de la muestra.

Aplicacion : Suponiendo que a un paciente se le extrae una muestra de sangre y al sueroobtenido se lo fracciona en 50 alıcuotas, luego a cada una se le determina la creatinina, ycon los valores medidos se obtienen un promedio de 10 mg/dl y una cuasi-desviacion tıpicamuestral de 2’2 mg/dl. Estimar un intervalo de confianza al 95% para el valor medio real.

En este caso podemos decir que la variable aleatoria correspondiente a la media sigue unadistribucion Normal de media 10 y desviacion 2′2/

√50. Por tanto el intervalo de confianza es

(10 − Zα/2

2′2√50

, 10 + Zα/22′2√50

)

En la figura siguiente vemos el intervalo de confianza que hemos calculado. Para esteintervalo calculamos el area que encierra la funcion de distribucion de Gauss obteniendo unarea de 0.9480 lo cual es una buena aproximacion, ya que querıamos que el intervalo deconfianza fuera al 95%. (Solucion: (9’39, 10’60).)

Page 114: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

114 TEMA 9. INFERENCIA ESTADISTICA

9.8. Intervalo de confianza para la diferencia de medias.

Supongamos que tenemos dos poblaciones que siguen N(µ1, σ1) y N(µ2, σ2), respectiva-mente. De cada una de ellas, elegimos una muestra de tamano n1 y n2 respectivamente, y demedias x1 y x2 respectivamente.

1. Caso en el que se conocen las varianzas σ1 y σ2.

IC =

x1 − x2 − Zα/2 ·

√σ2

1

n1+

σ22

n2, x1 − x2 + Zα/2 ·

√σ2

1

n1+

σ22

n2

2. Caso en el que no se conocen las varianzas y n1 y n2 son grandes (n1, n2 ≥ 30).

IC =

x1 − x2 − Zα/2 ·

√s21

n1+

s22

n2, x1 − x2 + Zα/2 ·

√s21

n1+

s22

n2

,

siendo s1 y s2 las cuasivarianzas de cada muestra.

Aplicacion: Se tomaron 200 muestras aleatorias de presion sistolica a ninos cuyos padresson hipertensos, obteniendose una media de 107 mmHg y una desviacion tıpica de 7 mmHg.Luego se tomaron 100 muestras de ninos cuyos padres tiene la presion sanguınea normal, yse obtuvo una media de 98 mmHg con una desviacion tıpica de 6 mmHg. Obtener los lımitesde confianza del 95% a la diferencia de medias. (Solucion (7’4755,10’5245)).

9.9. Tamano de la muestra.

Un procedimiento para aumentar la confianza es aumentar el tamano de la muestra. Portanto, lo logico es preguntarse sobre el tamano de la muestra para tener una confianza deter-minada.

Page 115: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

9.9. TAMANO DE LA MUESTRA. 115

El error maximo E viene dado por el radio del intervalo de confianza en cada caso. Por

ejemplo, en el caso de la media, es E = Zα/2 ·σ√n

. Por tanto, despejando obtenemos que el

tamano mınimo de la muestra deber ser:

n =

(Zα/2 σ

E

)2

.

Page 116: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

116 TEMA 9. INFERENCIA ESTADISTICA

Page 117: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

Tema 10

Contraste de hipotesis

10.1. Contraste de hipotesis

Un problema que se presenta frecuentemente en la investigacion cientıfica es el de tenerque decidir a partir de los datos aportados por un experimento sobre la validez o no de unplanteamiento previamente establecido.

Para ello, el investigador necesita establecer un postulado, (Hipotesis nula), denotada porH0, que deseamos contrastar. Ante este postulado inicial, plantea otro alternativo, (Hipotesisalternativa), denotada por H1, y realiza una prueba o experiencia con una muestra repre-sentativa de la poblacion. La hipotesis nula se mantendra a menos que los datos indiquenlo contrario: la hipotesis nula nunca se considera probada, pero puede ser rechazada por losdatos, en cuyo caso se acepta la hipotesis alternativa.

A la vista del resultado de la prueba, el investigador tiene que decidir si acepta la hipotesisnula o, por el contrario, la rechaza, asumiendo en su lugar la hipotesis alternativa. Por muypoderosa que sean las razones que le inclinen en uno u otro sentido, el investigador debe tenersiempre claro que, a no ser que examine toda la poblacion, no hay certeza de que su decisionsea correcta, puesto que siempre existe la posibilidad de cometer un error.

Hay que resaltar que, para apoyar una nueva teorıa, el metodo mas adecuado consiste enencontrar razones para el rechazo de la teorıa en uso. Por tanto, el interes debe centrarse enencontrar razones poderosas para rechazar la hipotesis nula.

Los elementos que tiene un contraste de hipotesis son los siguientes:

1. El nivel de significacion del contraste. Es un numero, α, que se elige a voluntad delinvestigador para construir el contraste de tal modo que la probabilidad de cometer elerror de aceptar H0 cuando en realidad es falsa, no sea superior a α. Debe fijarse antesde tomar la muestra sobre la que se realizara dicho contraste.

2. El estadıstico de contraste. Es un estadıstico o funcion de la muestra que extrae de lamisma la informacion mas adecuada para discernir cual de las dos hipotesis, H0 o H1,es mas verosımil. Debe conocerse la distribucion del estadıstico de contraste cuando H0

es cierta.

117

Page 118: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

118 TEMA 10. CONTRASTE DE HIPOTESIS

3. La region crıtica y la region de aceptacion de un contraste. Con un nivel de significaciondado, se divide el conjunto de valores que puede tomar el estadıstico de contraste entodas las posibles muestras de tamano dado, n, en dos regiones complementarias. Unase llama la region crıtica y es el conjunto de valores del estadıstico de contraste paralos que se rechaza la hipotesis nula y se acepta la hipotesis alternativa; la otra se llamala region de aceptacion y es el conjunto de valores del estadıstico de contraste para losque no hay evidencia muestral suficiente para rechazar la hipotesis nula, sin que esoimplique que se acepte la misma.La region crıtica esta limitada por uno o dos valores crıticos que se determinan de talmodo que la probabilidad de que el valor del estadıstico de contraste que se obtenga dela muestra elegida este en la region crıtica, no sea mayor que el nivel de significacion.

Indicamos a continuacion las formulas de los estadısticos de contraste en algunos casos.Para muestras grandes (n ≥ 30), se puede aplicar el teorema central del lımite y se obtienen:

1. El estadıstico de contraste para la media de una ley Normal de desviacion tıpica σ.Suponiendo cualquiera de los tres casos siguientes:

a) H0 : µ = µ0 frente a H1 : µ 6= µ0 (contraste bilateral),

b) H0 : µ ≤ µ0 frente a H1 : µ > µ0 (contraste unilateral por la derecha),

c) H0 : µ ≥ µ0 frente a H1 : µ < µ0 (contraste unilateral por la izquierda),

el estadıstico de contraste es

Z =X − µ0

σ/√

n,

que sigue la ley N(0,1) si H0 es cierta. En esta formula, X es la media muestral.

2. El estadıstico de contraste para la proporcion. En cualquiera de los tres casos siguientes

a) H0 : p = p0 frente a H1 : p 6= p0 (contraste bilateral),

b) H0 : p ≤ p0 frente a H1 : p > p0 (contraste unilateral por la derecha),

c) H0 : p ≥ p0 frente a H1 : p < p0 (contraste unilateral por la izquierda),

si la muestra es grande (n ≥ 30), el estadıstico de contraste es

Z =p − p0√p0q0/n

,

donde p es la proporcion de exitos observados en la muestra y q0 = 1 − p0.

3. El estadıstico de contraste para la diferencia de medias. Supongamos que tenemos dosvariables aleatorias que siguen las distribuciones N(µ1, σ1) y N(µ2, σ2), y que en lapoblacion tomamos dos muestras independientes de tamanos respectivos n1 y n2 y cuyasmedias son respectivamente X1 y X2. Si suponemos

H0 : µ1 = µ2 frente a H1 : µ1 6= µ2

Page 119: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

10.1. CONTRASTE DE HIPOTESIS 119

(contraste bilateral), el estadıstico de contraste es

Z =X1 − X2√σ2

1

n1+

σ22

n2

Para muestras pequenas de tamano n < 30, se puede incrementar la eficacia del testreemplazando la distribucion Normal para la determinacion de las regiones de aceptacion ycrıtica por la llamada distribucion t con n−1 grados de libertad, introducida por W.S. Gosset,que uso una pluma de marca Student, lo que le dio nombre a la distribucion.

Esta distribucion tiene la misma forma que la Normal, simetrica respecto del origen,acampanada, con media nula, pero mas aplastada. Por ello, los valores bajo los que se encierrauna determinada area son mayores y las regiones de aceptacion para un determinado nivel designificacion son mayores tambien.

10.1.1. Contrastes de hipotesis sobre la media de una distribucion

Como ya ocurriera en el caso de estimacion de intervalos de confianza podemos encontrar-nos en dos casos, segun la desviacion tıpica sea o no conocida. Supongamos primeramente quela conocemos.

Vamos a tomar un ejemplo sencillo que nos va a permitir ilustrar las distintas situacionesy los conceptos que intervienen en un contraste de hipotesis.

Ejemplo: Un fabricante de baterıas recibe la oferta de la patente de un nuevo proceso defabricacion, que le permitira mejorar notablemente la vida media de las mismas y, por tanto,su calidad. El fabricante es conocedor de la vida media de las baterıas que produce su empresa,es mas, sabe que sigue una distribucion normal de media µ = 4950 horas y desviacion tıpicaσ = 350 horas.

Para decidir si el nuevo proceso de produccion supone una mejorıa en la calidad, ha dis-puesto de una muestra de 100 de las nuevas baterıas que, una vez probadas, han dado unaduracion media de 5025 horas.

Por lo tanto, el problema que se le plantea al fabricante es el de averiguar si el valor de5025 horas puede ser debido unicamente al error propio del muestreo, en cuyo caso no sepodrıa concluir que la vida media de las baterıas en el nuevo proceso es diferente de la que seobtiene con el proceso tradicional, o bien, si el resultado de 5025 horas es suficiente garantıapara invertir en la patente que le ofrecen.

Planteamiento del problema como contraste de hipotesis.I-Establecimiento de la hipotesis nula y alternativaPartimos de la hipotesis de que la vida media de la poblacion de baterıas con el nuevo

proceso no varıa. Esta hipotesis corresponde a la hipotesis nula y se denota por H0. Enterminos estadısticos, se formula como sigue:

H0 ≡ µ = 4950

Aceptar esta hipotesis supone admitir que la muestra, cuya media es igual a 5025, es unamuestra que procede de una poblacion de media 4950, de forma que la diferencia entre el valorestimado 5025 y el valor del parametro es debida al error del muestreo.

Page 120: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

120 TEMA 10. CONTRASTE DE HIPOTESIS

Frente a esta hipotesis, se plantea la hipotesis alternativa que denotamos por H1, que eneste caso va a ser

H1 ≡ µ 6= 4950.

El significado de esta alternativa supone admitir que la diferencia entre el valor del esti-mador y el valor del parametro no se debe a un error de muestreo, sino que la hipotesis nulano es correcta. En otras palabras, si la hipotesis nula fuera correcta, se habrıa producido unsuceso suficientemente improbable como para rechazar dicha hipotesis, lo cual supone admitirque la muestra seleccionada pertenece a otra poblacion con una media distinta de 4950.

II-Decisiones posiblesFijadas las hipotesis nula y alternativa, al fabricante de baterıas se le ofrecen las siguientes

opciones:

Aceptar la hipotesis nula H0:

Entonces puede suceder que:

1. La vida media de la nueva produccion sea 4950. Al aceptar la hipotesis, el fabricantehabra procedido correctamente.

2. La vida media de la nueva produccion no sea 4950. Aceptando la hipotesis H0,el fabricante habra cometido un error (error de tipo II), que ocasiona perdidasque suponen la inversion en una nueva patente mas el coste de adaptacion de lamaquinaria, etc.

Rechazar la hipotesis nula H0: Esto equivale a aceptar la hipotesis alternativa H1.Ahora puede suceder que:

1. La vida media de la nueva produccion sea 4950. Rechazando H0, se habrıa cometidoun error (error de tipo I), pues favorece a la competencia, que tendrıa la posibilidadde adquirir la patente.

2. La media de la nueva produccion no sea 4950. La decision es acertada, suponiendouna situacion de ventaja en el mercado.

En siguiente cuadro recoge las distintas alternativas y los posibles resultados:

Situacion RealH0 es cierta H1 es cierta

Decision del Acepta H0 Decision correcta Error de tipo IIfabricante Rechaza H0 Error de tipo I Decision correcta

III-Nivel de significacionEl problema se centra ahora en averiguar cuando se puede afirmar que el suceso obtener un

valor de la media muestral de 5025 siendo la media de la poblacion µ = 4950 es suficientementeimprobable

Page 121: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

10.1. CONTRASTE DE HIPOTESIS 121

Se utilizan diferentes criterios para medir cuando un suceso es suficientemente improbable,dependiendo de la importancia que se quiera dar al riesgo de cometer un error de tipo I. Sesuelen establecer tres valores, que corresponden al nivel de significacion α y que correspon-den al valor de la probabilidad por debajo del cual un suceso se considera suficientementeimprobable:

1. α = 0,005 y se dice que el resultado ha sido muy significativo.

2. α = 0,05 y se dice que el resultado ha sido significativo.

3. α = 0,01 y se dice que el resultado ha sido casi significativo

El nivel de significacion especifica, por tanto, la probabilidad de cometer un error de tipoI (rechazar la hipotesis nula, siendo cierta). Este nivel se fija previamente, teniendo en cuenta,en el momento de fijarlo, que cuando disminuye la probabilidad de cometer un error de tipoI, aumenta la probabilidad de cometer un error de tipo II.

Recordemos que el criterio estadıstico que ha llevado a tomar esta decision no garantizaque dicha decision sea correcta, ya que una garantıa total solo se tendrıa si se pudieran probartodas la baterıas que se van a producir.

Vamos a utilizar un nivel de significacion α = 0,05, con lo que, si se ha de rechazar lahipotesis nula, el resultado sera significativo.

Las areas de rechazo de la hipotesis nula corresponden a las dos colas que podemos ver enla figura 29.

Figura 29: Colas o areas de rechazo.

El area de cada cola es α/2 y union de ambas regiones es lo que hemos llamado area derechazo, o region crıtica.

Cuando el valor del estadıstico de contraste se encuentre en la region crıtica o area derechazo, entonces la decision sera rechazar la hipotesis nula. Para conocer si este valor esta enla region crıtica o en la region de aceptacion, seguimos el siguiente procedimiento:

Page 122: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

122 TEMA 10. CONTRASTE DE HIPOTESIS

1.- Determinamos parametros: Aceptar la hipotesis H0 nos dirıa que tenemos una muestrade 100 baterıas donde la media sigue una normal de media 4950 y desviacion 350.

2.- Dado el nivel de significacion, determinamos el nivel de confianza. En nuestro caso95%.

3.- Calculamos ahora la region de aceptacion; en este caso obtenemos: (-1’96, 1’96).

4.- Solo tenemos que comprobar ahora si el estadıstico de contraste para la media esta o noen este intervalo, ya que el area de rechazo o la region crıtica esta limitada por estos valores.En este ejemplo

Z =5025 − 4950

350/√

100= 2′14

no pertenece al intervalo de confianza y en consecuencia la decision adecuada es la de rechazarla hipotesis nula.

El fabricante de baterıas, a la vista del resultado, considerarıa que ha tenido lugar unsuceso suficientemente improbable, por lo que se rechazarıa la hipotesis nula, adoptando elnuevo proceso de produccion, lo que se expresa diciendo que el contraste es significativo alnivel del 5%

En el caso de que no conozcamos la desviacion tıpica, necesitamos tener los datos experi-mentales para hacer una estimacion de la desviacion tıpica y a partir de ahı procedemos comoen el caso anterior.

Consideremos la misma situacion anterior pero en este caso de lo que disponemos es deuna muestra de 20 baterıas elaboradas segun el nuevo proceso de produccion, que han sidoprobadas, dando unos perıodos de duracion en horas de:

4917 4948 5082 5105 4865 5068 4935 5090 5045 50805136 5084 4909 4935 5120 4936 5014 5125 4933 5088

Con estos valores en primer lugar se calcula una estimacion puntual para la nueva mediay una estimacion puntual para la desviacion tıpica, y a partir de ahı podemos hacer todo elproceso.

Aquı planteamos otro ejemplo: Un laboratorio farmaceutico ha elaborado un farmaco enforma de comprimidos cuyo peso esta distribuido normalmente con una desviacion tıpica de0.12 mg. Se sabe que una dosis de comprimido cuyo peso media sea superior a 0.60 mg,produce efectos muy perjudiciales. Por este motivo, el hospital comprueba el peso medio deuna partida de 150 comprimidos, que resulta ser de 0.64 mg. Hacer un contraste de hipotesiscon un nivel de significacion del 0.05 para averiguar si es posible administrar la medicacion alenfermo sin riesgo.

10.2. Inferencia Estadıstica para la diferencia de dos muestras

El contraste de la diferencia de medias de dos poblaciones es un problema muy frecuenteen todas las areas que se sirven de la estadıstica como instrumento de trabajo. Por ejemplo,podemos estar interesado en averiguar la diferencia en la presion sistolica de ninos que tienenpadres hipertensos con ninos cuyos padres tienen una presion normal, o determinar si ciertofarmaco sigue siendo efectivo, etc.

Page 123: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

10.2. INFERENCIA ESTADISTICA PARA LA DIFERENCIA DE DOS MUESTRAS 123

En todos los casos, hay un modelo comun de trabajo, que consiste en seleccionar dosmuestras, una formada por individuos de la poblacion en los que se va a ensayar la nuevaexperiencia, por lo que recibe el nombre de grupo experimental y otra segunda muestra a laque se le aplica un metodo clasico y que se utiliza para contrastar los resultados, por lo quese llama grupo de contraste.

Veamos el siguiente ejemplo:

Se tomaron 200 muestras aleatorias de presion sistolica a ninos cuyos padres son hiper-tensos, obteniendose una media de 107 mmHg y una desviacion tıpica de 7 mmHg. Luegose tomaron 100 muestras de ninos cuyos padres tiene la presion sanguınea normal, y se ob-tuvo una media de 98 mmHg con una desviacion tıpica de 6 mmHg. Obtener los lımites deconfianza del 95% a la diferencia de medias. (Solucion (7’4755,10’5245)).

La finalidad es este caso es comprobar si la diferencia entre los resultados de las mediasmuestrales es un reflejo de una situacion real en las poblaciones o se trata de una diferenciadebida al azar.

Los datos del ejemplo anterior son:

G. experimental G. de contraste

Media 107 98

Desviacion 7 6

Tamano Muestral 200 100

Queremos conocer si la diferencia entre las medias de ambas muestras es motivo suficientepara afirmar que las medias de las respectivas poblaciones son tambien diferentes y, portanto, lo son las propias poblaciones, o bien, su dicha diferencia se debe unicamente al errorque introduce el azar al seleccionar cada muestra.

Nuestro interes se centra en discernir si la diferencia µ1 − µ2 entre las medias de las dospoblaciones, que se suponen distribuidas normalmente, es igual a cero, o lo que es igual, siµ1 = µ2. Luego la hipotesis nula y la alternativa para un contraste bilateral o test pareadosson:

H0 ≡ µ1 = µ2

H1 ≡ µ1 6= µ2

Vamos a determinar en primer lugar el estadıstico de contraste que, en este caso, es

Z =X1 − X2√σ2

1

n1+

σ22

n2

=107 − 98√49

200+

36

100

= 11,57

Page 124: Resu´menes te´oricos de la asignaturaa ∈ R es cota superior de S cuando x ≤ a ∀x ∈ S. a ∈ R es cota inferior de S cuando a ≤ x ∀x ∈ S. S esta´ acotado superiormente

124 TEMA 10. CONTRASTE DE HIPOTESIS

Como en otros casos, la region de aceptacion es el intervalo (-1.96, 1.96). Claramente, elestadıstico de contraste cae en la region crıtica por lo que hay evidencias para rechazar lahipotesis nula y admitir que la diferencia de medias no se debe al azar, sino que es real y quese debe admitir que el hecho de que los padres sean hipertensos influye en la presion sistolicade sus hijos.