369
UNIVERSIDAD DE GRANADA Departamento de Didáctica de la Matemática Significados institucionales y personales del teorema central del límite en la enseñanza de estadística en ingeniería TESIS DOCTORAL Hugo Alejandro Alvarado Martínez GRANADA, 2007

Significados del Teorema Central del Limite en la Enseñanza de la

Embed Size (px)

Citation preview

Page 1: Significados del Teorema Central del Limite en la Enseñanza de la

UNIVERSIDAD DE GRANADA

Departamento de Didáctica de la Matemática

Significados institucionales y personales

del teorema central del límite en la

enseñanza de estadística en ingeniería

TESIS DOCTORAL

Hugo Alejandro Alvarado Martínez

GRANADA, 2007

Page 2: Significados del Teorema Central del Limite en la Enseñanza de la

ÍNDICE

Página

INTRODUCCIÓN 1

CAPÍTULO 1. PROBLEMA DE INVESTIGACIÓN, SU

CONTEXTUALIZACIÓN Y RELEVANCIA 5

1.1. Introducción 5

1.2. El contexto institucional. La formación estadística de los ingenieros 5

1.2.1. Introducción 5

1.2.2. Perspectiva internacional 6

1.2.3. Acreditación 7

1.2.4. Caracterizaciones generales de la carrera de ingeniería con

base científica 8

1.2.5. Formación estadística de ingenieros 9

1.2.6. Contexto de innovación pedagógica en la Universidad

Católica de la Santísima Concepción 11

1.3. El teorema central del límite y su interés en estadística 12

1.3.1. Interés en estadística 12

1.3.2. Importancia del teorema central del límite en la ingeniería

y otras áreas 14

1.4. Delimitación del problema de investigación 16

1.5. Objetivos del trabajo de investigación 17

1.6. Hipótesis del estudio 20

1.7. Metodología del estudio 22

1.7.1. Introducción 22

1.7.2. Metodología del análisis de texto 23

1.7.3. Metodología de la experimentación y observación

del proceso de estudio 25

1.7.4. Metodología de la evaluación del aprendizaje 27

Page 3: Significados del Teorema Central del Limite en la Enseñanza de la

CAPÍTULO 2. FUNDAMENTOS DEL ESTUDIO 31

2.1. Introducción 31

2.2. Marco teórico 32

2.2.1. Introducción 32

2.2.2. Significado institucional y significado personal de un

objeto matemático 34

2.2.3. Objetos intervinientes y emergentes de los sistemas de

Prácticas 36

2.2.4. Relaciones entre objetos: funciones semióticas y sus tipos 39

2.2.5. Evaluación de la comprensión 40

2.2.6. Criterios de idoneidad de un proceso de estudio 41

2.3. El teorema central del límite. Evolución histórica de su

significado en estadística 42

2.3.1. Introducción 42

2.3.2. Ideas precursoras. Aproximación de la distribución

binomial por la normal 43

2.3.3. Distribución de la suma de variables aleatorias discretas

idénticamente distribuidas con media y varianzas finitas 46

2.3.4. Suma de variables no idénticamente distribuidas y

variables continuas 48

2.3.5. Distribuciones con rango infinito 51

2.3.6. Estudio de condiciones necesarias y suficientes para el teorema 54

2.3.7. Uso actual del teorema central del límite en estadística 56

2.3.8. Conclusiones del estudio histórico 60

CAPÍTULO 3. INVESTIGACIONES PREVIAS SOBRE EL TEOREMA

CENTRAL DEL LÍMITE 65

3.1. Introducción 65

3.2. Investigaciones sobre enseñanza y aprendizaje del teorema

central del límite 65

3.2.1. Comprensión del teorema central del límite 65

3.2.2. Comprensión de las distribuciones muestrales 68

3.2.3. Diseño de enseñanza del teorema central del límite

con recurso didáctico del ordenador 76

Page 4: Significados del Teorema Central del Limite en la Enseñanza de la

3.2.4. Comprensión de la distribución normal 81

3.3. Conclusiones del estudio de las investigaciones previas 83

CAPÍTULO 4. SIGNIFICADO INSTITUCIONAL DE REFERENCIA 85

4.1. Introducción 85

4.2. Muestra de textos de libros universitarios seleccionados 86

4.3. Campos de problemas 86

4.4. Lenguaje 106

4.5. Procedimientos 111

4.6. Enunciados diferenciados del teorema 117

4.7. Propiedades 121

4.8. Argumentos 131

4.9. Conclusiones sobre el análisis de los textos 137

CAPÍTULO 5. DISEÑO DE UN PROCESO DE ESTUDIO DEL TEOREMA

CENTRAL DEL LÍMITE PARA INGENIEROS 139

5.1. Introducción 139

5.2. Descripción general del proceso de estudio 140

5.3. Configuraciones epistémicas 144

5.4. Análisis de la primera lección 146

5.4.1. Elementos de significado y configuraciones epistémicas 146

5.4.2. Trayectoria didáctica 148

5.5. Análisis de la segunda lección 161

5.5.1. Elementos de significado y configuraciones epistémicas 161

5.5.2. Trayectoria didáctica 163

5.6. Análisis de la tercera lección 172

5.6.1. Elementos de significado y configuraciones epistémicas 172

5.6.2. Trayectoria didáctica 174

5.7. Conclusiones sobre el significado institucional pretendido del

teorema central del límite 184

CAPÍTULO 6. SIGNIFICADOS IMPLEMENTADOS DEL TEOREMA

CENTRAL DEL LÍMITE 189

6.1. Introducción 189

Page 5: Significados del Teorema Central del Limite en la Enseñanza de la

6.2. Observación de la primera lección 190

6.2.1. Análisis de actividades desarrolladas en el aula 190

6.2.2. Análisis de ejercicios realizados por los alumnos fuera de clase 193

6.2.3. Significado institucional implementado en la primera lección 206

6.3. Observación de la segunda lección 207

6.3.1. Análisis de actividades desarrolladas en el aula 208

6.3.2. Análisis de ejercicios realizados por los alumnos fuera de clase 216

6.3.3. Significado institucional implementado en la segunda lección 233

6.4. Observación de la tercera lección 234

6.4.1. Análisis de actividades desarrolladas en el aula 234

6.4.2. Análisis de ejercicios realizados por los alumnos fuera de clase 242

6.4.3. Significado institucional implementado en la tercera lección 246

6.5. Conclusiones sobre el significado implementado del teorema

central del límite 247

CAPÍTULO 7. SIGNIFICADO PERSONAL DE LOS ESTUDIANTES SOBRE EL

TEOREMA CENTRAL DEL LÍMITE AL FINALIZAR EL PROCESO DE ESTUDIO 251

7.1. Introducción 251

7.2. Objetivos e instrumentos de evaluación 252

7.2.1. Objetivos 252

7.2.2. Proceso de construcción 252

7.3. Análisis a priori del significado evaluado 253

7.4. Resultados en el cuestionario 268

7.4.1. Respuestas a cada ítem 269

7.4.2. Resultados globales 281

7.5. Resultados en problemas abiertos 286

7.5.1. Resultados en el problema 1 287

7.5.2. Resultados en el problema 2 298

7.6. Resultados de la prueba de ensayo 309

7.7. Resumen de resultados en las tres pruebas abiertas 323

Page 6: Significados del Teorema Central del Limite en la Enseñanza de la

7.8. Conclusiones sobre el significado personal de los estudiantes 326

7.8.1. Concordancias entre significado personal y significado

implementado 326

7.8.2. Diferencias entre significado personal y significado

implementado 328

7.9. Conclusiones sobre la idoneidad del proceso de estudio 330

CAPÍTULO 8. CONCLUSIONES 337

8.1. Introducción 337

8.2. Conclusiones en relación a los objetivos 337

8.3. Conclusiones en relación a las hipótesis 344

8.4. Principales aportaciones de la investigación 348

8.5. Implicaciones para la enseñanza del teorema central del límite

en un curso de estadística universitaria 349

8.6. Perspectivas futuras de investigación 349

REFERENCIAS 351

Page 7: Significados del Teorema Central del Limite en la Enseñanza de la
Page 8: Significados del Teorema Central del Limite en la Enseñanza de la

1

INTRODUCCIÓN

El teorema central del límite es uno de los fundamentales en estadística y estudia

el comportamiento de la suma de variables aleatorias, cuando crece el número de

sumandos, asegurando su convergencia hacia una distribución normal en condiciones

muy generales. Este teorema, del cual existen diferentes versiones que se han ido

desarrollando a lo largo de la historia, tiene una gran aplicación en inferencia

estadística, pues muchos parámetros de diferentes distribuciones de probabilidad (como

la media, momentos, coeficiente de correlación, proporción) pueden expresarse en

función de una suma de variables. Permite también aproximar muchas distribuciones de

uso frecuente: binomial, Poisson, chi cuadrado, t-student, gamma, etc., cuando sus

parámetros crecen y el cálculo se hace difícil. Por otro lado, la suma de variables

aleatorias aparece en forma natural en muchas aplicaciones de procesos de simulación

de la ingeniería: determinación de masa forestal, carga soportada por una estructura,

tiempo de espera de servicios, etc.

Todo ello hace explicar por qué muchos métodos estadísticos requieren la

condición de normalidad para su correcta aplicación y, en consecuencia, este teorema es

una componente importante de la formación estadística de los ingenieros, ya que por

otro lado, su enseñanza plantea interrogantes importantes al profesor. El teorema se

apoya y relaciona entre sí con otros conceptos y procedimientos básicos en estadística,

como los de variable aleatoria y sus transformaciones, distribución muestral,

convergencia, momentos, simetría, tipificación, cálculo de probabilidades, etc., algunos

de los cuales podrían plantear problemas de aprendizaje.

En este trabajo se aborda la problemática de la enseñanza y aprendizaje del

teorema central del límite en los estudios de ingeniería, particularmente en Chile.

Utilizando el enfoque ontosemiótico desarrollado por Godino (Godino y Batanero,

1994, 1998a, 2003; Godino, 2002a; Godino, Contreras y Font, 2006; Godino, Batanero

y Font, 2007; Godino, Bencomo, Font y Wilhelmi, 2007) es posible acercarse a este

teorema general y universal, desde una diversidad de puntos de vista.

Page 9: Significados del Teorema Central del Limite en la Enseñanza de la

Introducción

2

En el Capítulo 1 se contextualiza la investigación, presentando la problemática

de las carreras de ingeniería, y haciendo especial mención a establecer el perfil de

competencias de un ingeniero, que permitirá determinar las habilidades y destrezas en la

formación estadística de los ingenieros. También se analiza la importancia del teorema

central del límite en estadística y la problemática didáctica que implica su enseñanza a

alumnos de ingeniería.

El Capítulo 2 presenta los fundamentos de esta investigación. Después de

presentar un resumen del marco teórico utilizado, se analiza la evolución histórica,

identificando los campos de problemas que dan origen al teorema, lo que será la base

para el posterior estudio del significado de referencia del mismo.

En el Capítulo 3 se describe las investigaciones relacionadas con la enseñanza y

aprendizaje del teorema central del límite y otros temas relacionados, centrándose

principalmente en la comprensión de la distribución normal y sus propiedades, la de las

distribuciones muestrales y el efecto de la enseñanza basada en ordenador sobre el

aprendizaje de las distribuciones muestrales.

El Capítulo 4 explica el significado institucional de referencia del teorema

central del límite, que servirá de base para el diseño de un proceso de estudio y la

interpretación de las respuestas de los alumnos a algunas de las tareas planteadas a lo

largo del mismo y en la fase de evaluación. Este significado se identifica a partir del

análisis de contenido de una muestra de libros de texto de estadística, utilizados para la

enseñanza de ingenieros en Chile. Para formar la muestra, se seleccionan textos de

probabilidad y estadística con distintos enfoques que incluyen el teorema. A

continuación, se identifican los elementos de significados más relevantes en la

formación del ingeniero.

En el Capítulo 5 se analiza el diseño de un proceso de estudio sobre el teorema

central del límite, dirigido a la formación de ingenieros. A partir del significado

institucional de referencia se han seleccionado los elementos de significado,

organizándolos en un proceso de estudio, que los contextualiza en ejemplos

relacionados con la ingeniería y los secuencia en orden de dificultad progresiva en base

al tiempo disponible. Se tuvo en cuenta tres posibles tipos de configuraciones

epistémicas: manipulativa, algebraica y computacional, que se alternan a lo largo del

proceso y permiten introducir significados complementarios del teorema central del

límite. Con ello se describe el significado institucional pretendido.

Finalizado el diseño del proceso de estudio, se llevó a cabo la observación de su

Page 10: Significados del Teorema Central del Limite en la Enseñanza de la

Introducción

3

desarrollo formando parte de un curso de estadística en la Universidad Católica de la

Santísima Concepción de Chile, donde participaron 134 estudiantes.

En el Capítulo 6, se analiza la observación realizada de algunos episodios del

proceso de estudio en cada una de las tres lecciones de que se compone. El análisis

incluye una muestra de las actividades desarrolladas colectivamente en la clase y de las

tareas realizadas individualmente por los alumnos, así como de las pruebas de

evaluación llevadas a cabo al finalizar cada una de las lecciones. La finalidad es

describir el significado institucional implementado.

En el Capítulo 7 se describe la evaluación final del aprendizaje llevada a cabo a

partir de un cuestionario con ítems de opciones múltiples y verdadero/falso, dos

problemas abiertos y un proyecto de aplicación a la ingeniería. Ello permite describir el

significado personal de los estudiantes al finalizar el proceso de estudio y compararlo

con el significado institucional implementado. Asimismo, permite valorar la idoneidad

didáctica (cognitiva, epistémica, mediacional y emocional) del proceso de estudio. La

tesis finaliza con el Capítulo de conclusiones y referencias.

Esta tesis realiza diversas aportaciones al campo de la educación estadística y en

concreto a la investigación sobre enseñanza y aprendizaje del teorema central del límite

que se pueden reseñar de la siguiente forma:

El análisis histórico y de libros de texto permite describir con detalle el significado

de referencia del teorema central del límite en un curso estándar de ingeniería, y

mostrar la diversidad posible de significados de dicho objeto matemático.

El proceso de estudio implementado, es en si mismo novedoso, al incorporar

actividades no habituales, como las basadas en la simulación de experimentos

aleatorios con materiales manipulativos y ordenador, así como del estudio de las

condiciones para la convergencia. Dicho proceso permite conectar, asimismo la

aproximación de varias distribuciones clásicas a la normal con el teorema central del

límite, ampliando el significado de dicho teorema, respecto a lo que es habitual en

los libros de texto de ingeniería.

El análisis del aprendizaje de los estudiantes, amplía notablemente los estudios

realizados sobre la comprensión del teorema central del límite, al abarcar una serie

de propiedades no consideradas en las investigaciones previas (como corrección de

continuidad, condiciones de la convergencia, efecto de los parámetros). También se

aborda la capacidad de reconocimiento de los campos de problemas, uso correcto de

Page 11: Significados del Teorema Central del Limite en la Enseñanza de la

Introducción

4

procedimientos, lenguaje y capacidad de argumentación, que no han sido

consideradas con anterioridad.

Incluso con las limitaciones razonables de todo estudio didáctico, pensamos que

los resultados suponen un avance en la didáctica de la inferencia estadística. Es de

esperar que otros trabajos posteriores puedan continuar la línea iniciada en esta

Memoria.

Page 12: Significados del Teorema Central del Limite en la Enseñanza de la

5

CAPÍTULO 1.

PROBLEMA DE INVESTIGACIÓN, SU

CONTEXTUALIZACIÓN Y RELEVANCIA

1.1. INTRODUCCIÓN

Como se ha indicado en la introducción, el problema de investigación se centra

en la enseñanza del teorema central del límite en las carreras de ingeniería y de

ingeniería civil. Aunque los resultados serían aplicables en general a estudiantes de

ingeniería, los alumnos que forman parte de la muestra cursan sus estudios en la

Universidad Católica de la Santísima Concepción de Chile.

Con objeto de contextualizar el problema, comienza este capítulo presentando la

problemática de las carreras de ingeniería, haciendo especial mención a la situación en

Chile, aunque dentro de una perspectiva internacional. Se hace especial referencia a la

problemática de la acreditación; que conlleva a establecer el perfil de competencias de

un ingeniero y por tanto, ayudará a determinar las habilidades y destrezas en la

formación estadística de los ingenieros. Seguidamente se analiza la importancia del

teorema central del límite en estadística y la problemática didáctica que implica su

enseñanza a estos alumnos.

Todo ello servirá para delimitar la investigación y describir sus objetivos

generales y específicos. Finaliza este capítulo haciendo un resumen de las fases que

componen la investigación empírica y las principales características de la metodología

empleada en cada una de ellas.

1.2. EL CONTEXTO INSTITUCIONAL. LA FORMACIÓN ESTADÍSTICA DE

LOS INGENIEROS

1.2.1. INTRODUCCIÓN

Según la Acreditation Board for Engineering and Technology (1997) de EE.UU.,

Page 13: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

6

Ingeniería es la profesión en la cual el conocimiento de las ciencias naturales y

matemáticas, obtenido por estudio, experiencia y práctica, es aplicado con criterio al

desarrollo de formas de emplear, económicamente, los materiales y fuerzas de la

naturaleza para el beneficio de la humanidad.

El Consejo Superior de Educación de Chile define las Ciencias de la Ingeniería

como el conjunto creciente de disciplinas basadas en las Matemáticas y las Ciencias

Naturales, que se orientan hacia las prácticas creativas del diseño en ingeniería y que

sientan las bases de las materias que diferencian la especialidad. Ellas comprenden el

desarrollo de técnicas matemáticas o numéricas, la modelación, la simulación y otras

técnicas experimentales con énfasis en la identificación y solución de problemas

prácticos en ingeniería. Incluyen temas como resistencia de materiales, mecánica de

fluidos, termodinámica, circuitos eléctricos y electrónicos, ciencias de los materiales,

informática, mecánica de suelos, control automático, aerodinámica, fenómenos de

transferencia, pudiendo comprender también estudios sobre el medio ambiente u otros

propios de una determinada disciplina o especialidad.

La acreditación de carreras de ingeniería en Chile ha puesto en evidencia la

existencia de numerosas especialidades que no llegan a alcanzar los estándares

internacionales, lo que establece un contexto de análisis y evaluación. Esta situación se

deriva, particularmente, de las formas como se ha utilizado el concepto de “ingeniería”

en el país. Para tratar de mejorar la situación, la CNAP (Comisión Nacional de

Acreditación de Pregrado) hizo una convocatoria en 2001, para analizar la acreditación

de las carreras de Ingeniería Civil en todas sus especialidades. Esto conlleva a garantizar

las competencias específicas necesarias que han de adquirir los futuros profesionales

ingenieros.

1.2.2. PERSPECTIVA INTERNACIONAL

Existen carreras de ingeniería desarrolladas bajo sistemas de acreditación

internacionales, en especial la Acreditation Board for Engineering Technology (ABET,

EE.UU.), Canadian Council of Profesional Engineers (CEAB, Canadá), Consejo de

Acreditación de la Enseñanza de la Ingeniería (CACEI, México) y países de la alianza

del cono sur (MERCOSUR), presionados por los tratados de libre comercio, que han

establecido criterios estándares de acreditación de carreras de ingeniería que

corresponden a dos objetivos distintos:

Page 14: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

7

a. Carreras de base científica, que fluctúan entre 4 y 5 años (6 años en pocos casos,

Chile entre ellos), orientadas al diseño, gestión y producción.

b. Carreras con base científica limitada y fuerte componente tecnológico que fluctúan

entre 3 y 4 años, orientadas a la supervisión y producción.

La primera orientación tiene fuerte base científica, basada en el cálculo

matemático de varias variables, ecuaciones diferenciales y física. La segunda es de tipo

más tecnológico, con una base científica más orientada a las aplicaciones tecnológicas,

supervisión y control. En algunos casos la base matemática de esta carrera llega al nivel

de Álgebra Superior (ABET, 1997; Instituto de Ingenieros, 2002). Dos ejemplos bien

conocidos de esta situación son los casos de Inglaterra, donde coexisten los Chartered

Engineers (base científica) y los Incorporated Engineers (base tecnológica), y de

Estados Unidos, donde coexisten los grados de Bachelor of Science in Engineering y

Bachelor of Engineering Technology. Veinte años atrás el paralelo chileno era muy

cercano, con los Ingenieros Civiles e Ingenieros de Ejecución.

1.2.3. ACREDITACION

La acreditación permite la regulación de la educación superior que busca

asegurar la calidad y pertinencia de la oferta educativa. Le corresponde, por lo tanto,

establecer criterios orientadores que integren tanto los intereses del país y de los

postulantes, como el derecho de las instituciones a ejercer su autonomía. Considerando

como un importante referente la perspectiva internacional, la cual será cada vez más

relevante en la práctica, a medida que Chile asuma compromisos comerciales con países

desarrollados, la CNAP ha considerado la acreditación de los dos tipos de ingenierías

citadas anteriormente (CNAP, 2003):

Ingenierías con base científica, que otorgan una Licenciatura en Ciencias de la

Ingeniería y conducen a un título profesional de Ingeniero Civil o uno

esencialmente equivalente (actualmente hay 30 ingenierías civiles).

Ingenierías con base tecnológica, que conducen a un título de Ingeniero en un área

de especialidad o de Ingeniero de Ejecución, y que pueden otorgar una Licenciatura

en la especialización correspondiente al título (actualmente hay 51 especialidades

de ingenierías y 57 de ejecución).

Page 15: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

8

La CNAP define las expectativas que, respecto de los principales rubros de

análisis, deben satisfacer las carreras de ingeniería, en el marco de sus propias

competencias y de la misión y de las orientaciones generales de la institución a la que

pertenecen, que se concretan en un perfil profesional y una estructura curricular

particular. Estos criterios se describen a continuación para las carreras con base

científica, donde se interesa este estudio.

1.2.4. CARACTERIZACIONES GENERALES DE LA CARRERA DE INGENIERÍA CON BASE

CIENTÍFICA

La carrera de ingeniería con base científica (CNAP, 2003), conduce al título

profesional de Ingeniero Civil o uno esencialmente equivalente, y al grado académico

de licenciado en Ciencias de la Ingeniería. Esta carrera debe contar con una fuerte base

científica y orientarse al diseño, gestión y producción. La carrera debe garantizar que

los profesionales que titula:

Han adquirido las competencias necesarias para aplicar un cuerpo distintivo de

conocimientos científicos, matemáticos y tecnológicos en un contexto empresarial,

tomando en consideración las restricciones impuestas por las finanzas, la

legislación, la ética y las personas.

Tengan capacidad de innovación, creatividad y habilidad específica, centrada en el

diseño, gestión y producción de proyectos de desarrollo, procesos de producción y

procedimientos de operación y mantenimiento en áreas de infraestructura, bienes y

servicios para la industria y la comunidad, en diversos ámbitos de la ingeniería.

Cuentan con las competencias necesarias para prever el comportamiento de un

diseño o los resultados de un programa, y para evaluar costos y beneficios de las

actividades propuestas.

Son capaces de desarrollar las competencias necesarias para una educación

permanente y continua, incluyendo estudios de postítulo y postgrado.

La ingeniería de base científica, que en Chile otorga el grado de licenciado en

Ciencias de la Ingeniería, incluye las carreras de Ingeniería Civil (6 años) y de algunas

carreras de Ingeniería de 5 años. En el caso de las carreras tecnológicas también existen

sistemas de acreditación (ABET es uno), pero está menos desarrollado el intercambio

internacional. Las capacidades o competencias esperadas han sido publicadas por

Page 16: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

9

agencias acreditadoras (FEANI, Federation Euroeenne D`Associations Nationales

D`Ingenieurs) o cuerpos profesionales para la carrera de base científica.

Las reuniones internacionales recientes en torno al tema de reconocimiento

mutuo de títulos de Ingeniería y de Sistemas de Acreditación revelan una notable

concordancia conceptual en los estándares, que se refieren esencialmente a las carreras

homólogas de base científica. Los países que han desarrollado sistemas de acreditación

en ingeniería han expresado la importancia de los aspectos esenciales en la

caracterización de una carrera de ingeniería, que inciden directamente en la capacidad

industrial y su sostenibilidad en el tiempo, con las correspondientes implicancias en la

economía y competitividad nacionales.

Es por ello altamente improbable que en Chile se acrediten como tales carreras

de ingeniería que no se ajusten a las características internacionalmente reconocidas.

Entre otros factores, juegan un papel importante los compromisos internacionales que

Chile ha contraído en materia de reconocimiento de estudios. En particular deben citarse

los acuerdos mercosur y Chile-Canadá, los cuales implican explícitamente procesos de

acreditación de carreras de ingeniería con criterios comparables.

1.2.5. FORMACIÓN ESTADÍSTICA DE INGENIEROS

El Instituto de Ingenieros de Chile destaca la importancia de la estadística, como

base esencial de conocimientos en ingeniería, puesto que sus aplicaciones llevan a

modelos matemáticos necesarios para el diseño, control y optimización. Históricamente

los programas de estadística han sido realizados por especialistas, siendo fuertemente

técnicos y ligados al conocimiento matemático. Hoy en día, la tendencia es a tener un

currículo cada vez menos técnico y cada vez más práctico.

La importancia de la estadística para el aumento de la calidad en la industria ha

sido subrayada (Montgomery y Runger, 1996). Muchas compañías se han dado cuenta

de que la baja calidad de un producto tiene un efecto muy pronunciado en la

productividad global de la compañía, su posición competitiva y, finalmente, en la

rentabilidad de la empresa. La estadística es un elemento decisivo en el incremento de la

calidad, ya que las técnicas estadísticas pueden emplearse para describir y comprender

la variabilidad en los procesos industriales, que es el resultado de cambios en las

condiciones bajo las que se llevan a cabo estos procesos. También en las Conferencias

Internacionales sobre Enseñanza de la Estadística (ICOTS) se han organizado sesiones

especiales sobre la formación estadística de los ingenieros (e.g., Mac Gillivray, 2000a y

Page 17: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

10

b; Martín, 2006; Romeu, 2006).

En muchas Facultades de Ingeniería, la asignatura de estadística es de carácter

mínimo dentro del plan de estudios, y suele estar ubicado en el segundo año. Los

contenidos mínimos de un curso tradicional en ingeniería son: Estadística descriptiva

univariada, estadística descriptiva bivariada, distribuciones muestrales, estimación

puntual de parámetros, estimación por intervalos de parámetros, pruebas de hipótesis,

elementos de muestreo, regresión lineal múltiple. A pesar de que la estadística en estas

carreras se fundamenta en una sólida base matemática, el interés es complementarla con

la estadística aplicada, que se puede dividir en tres campos de estudio, como sugiere

Moore (1995):

1. El análisis de datos se ocupa de los métodos y las ideas necesarias para organizar y

describir datos utilizando gráficos, resúmenes estadísticos y descripciones

matemáticas más elaboradas. La revolución informática ha devuelto de nuevo el

análisis de datos al centro de la estadística aplicada.

2. La obtención de datos proporciona métodos para obtener datos que permiten dar

respuestas claras a preguntas concretas. Los conceptos básicos sobre cómo obtener

muestras y diseñar experimentos son quizás las ideas estadísticas que han tenido una

mayor influencia.

3. La inferencia estadística va más allá de los datos disponibles para obtener

conclusiones sobre un universo más amplio. La inferencia estadística no sólo

obtiene conclusiones, sino que acompaña estas conclusiones con una afirmación

sobre su fiabilidad. En general, se discuten los razonamientos utilizados en la

inferencia estadística, presentándose cómo se utiliza en la práctica en algunas

situaciones sencillas y más complejas.

Otro dato de interés son los bajos resultados globales en las evaluaciones de la

asignatura, lo que implica que la estadística es un tópico difícil para los alumnos. En la

Tabla 1.2.5.1, se presentan los resultados académicos en la asignatura de Estadística de

los estudiantes de las cinco especialidades de la Facultad de Ingeniería de la

Universidad Católica de la Santísima Concepción. Se observa en seis años el bajo

porcentaje de alumnos que aprueban la asignatura (Calificación final) y es más

preocupante la calificación parcial donde se evalúa el tema de las distribuciones

muestrales (Prueba parcial). Sin embargo, el segundo semestre de 2005, período donde

Page 18: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

11

se implementó la propuesta del diseño del teorema central del límite, se aprecia un

aumento de aprobación de alumnos y una pequeña mejora en la prueba de contenidos

donde se presentó el objeto de estudio.

Tabla 1.2.5.1. Porcentaje de estudiantes aprobados en la asignatura de Estadística

Año Calificación final Prueba Parcial 2001(1) 29 2001(2) 60 2002(2) 52 272003(1) 46 2003(2) 35 132004(1) 37 252004(2) 30 282005(1) 34 352005(2) 58 462006(1) 35 242006(2) 41 50

(1) Primer semestre; (2) Segundo semestre

Actualmente existen altos grados de deserción estudiantil y reprobación de los

alumnos de Ingeniería y un no despreciable grado de desmotivación de los estudiantes.

Una posible causa (estudio realizado en proyectos internos) es que el objetivo en los

cursos ha sido que los alumnos adquieran conocimientos, pero no necesariamente

potenciar habilidades, análisis crítico y actitudes que permitan fortalecer su futuro

profesional.

1.2.6. CONTEXTO DE INNOVACIÓN PEDAGÓGICA EN LA UNIVERSIDAD CATÓLICA DE

LA SANTÍSIMA CONCEPCIÓN

En asignaturas de Probabilidad y Estadística para ingenieros las sesiones de

clase se han desarrollado sólo en el aula, presentando a los estudiantes actividades de

ejercicios y problemas con desarrollo algebraico y demostraciones de propiedades

deducidas de teoremas y corolarios. Algunas razones para seguir esta metodología es no

contar con un programa de estadística licenciado para los estudiantes y también la

tradición de los profesores. De acuerdo a la experiencia docente, se observa que existen

diferencias en los estudiantes de ingeniería con respecto al ritmo de aprendizaje y que

muchos no muestran un trabajo sistemático de estudio clase a clase.

Una de las perspectivas del Plan Estratégico de la Facultad de Ingeniería de la

Universidad Católica de la Santísima Concepción (en adelante UCSC) es la Perspectiva

del aprendizaje, o conjunto de objetivos tendientes a lograr las competencias,

Page 19: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

12

habilidades y tecnologías necesarias para el desarrollo y crecimiento futuro de la

Facultad.

Dentro de esta perspectiva y de uno de los lineamientos estratégicos

institucionales, la investigación y su conexión con la docencia, se sitúa este trabajo que

continuará otros proyectos internos de investigación y de docencia, en particular los

proyectos DIN 05/1997 “Caracterización del estudiante de ingeniería en relación al

rendimiento académico”, DIN 05/2001 “Diseño y aplicación de una metodología

innovadora de aprendizaje en Ciencias Básicas a partir de variables causales de

rendimiento académico” y FAD 08/2000 “Desarrollo de propuesta metodológica de

organización académica y administrativa para ingeniería marítimo portuaria”, algunos

de cuyos resultados se han publicado en Alvarado y cols. (2000, 2003) y Parra y cols.

(2001). En esta investigación se intenta llevar a cabo:

a. Acciones para potenciar en los estudiantes las habilidades y destrezas de acuerdo a

los requerimientos de las especialidades. Para ello, y en base al marco teórico se

diseñará un proceso de estudio del teorema central del límite, acorde a las carreras

de ingeniería y sus necesidades actuales.

b. Acciones para mejorar la metodología de enseñanza-aprendizaje de acuerdo a las

competencias de egreso. Para ello se identificarán metodologías afines a las

características de los alumnos y las competencias de egreso deseadas.

La población de interés en el presente trabajo, son los alumnos de segundo año

universitario de la Universidad Católica de la Santísima Concepción que cursan una

asignatura de estadística en la Facultad de Ingeniería (Ingeniería en: Acuicultura,

Marítimo Portuario, Informática, Industrial y Civil). También es posible que los

resultados sean aplicables a otros estudiantes de ingeniería que tengan una base

matemática similar al inicio del estudio del teorema central del límite.

1.3. EL TEOREMA CENTRAL DEL LÍMITE Y SU INTERÉS EN

ESTADÍSTICA

1.3.1. INTERÉS EN ESTADÍSTICA

Un objeto de creciente preocupación en la Educación Matemática es investigar

acerca del significado, comprensión y aplicación de conceptos estocásticos en todos los

Page 20: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

13

niveles educacionales. En el caso particular de la enseñanza de la estadística en la

universidad, uno de los problemas didácticos principales es la enseñanza de la

inferencia (Moore, 1997; Artigue, Batanero y Kent, 2007). La investigación en

psicología se ha interesado desde hace años por la comprensión de la inferencia y ha

mostrado, por un lado, el uso e interpretación incorrectamente generalizado del

contraste de hipótesis por los investigadores y profesionales (Morrison y Henkel, 1970;

Harlow, Mulaik y Steiger, 1997; Batanero, 2000; Batanero y Díaz, 2006). Por otro lado,

incluso en las situaciones de la vida diaria, se hacen frecuentes errores en la toma de

decisiones bajo incertidumbre y no se mejora con la formación estadística (Kahneman,

Slovic y Tversky, 1982).

Uno de los resultados más notables de la teoría estadística es el teorema central

del límite, estudiado por varios matemáticos destacados, que fue establecido por

primera vez en 1738 por Abraham De Moivre, bajo condiciones muy restringidas. A

principios del siglo XIX Laplace lo formuló de manera más general; pero no fue hasta

1901 cuando el eminente probabilista de San Petersburgo, A. M. Liapounov (1857-

1918) lo estableció finalmente en condiciones muy generales y proporcionó una

demostración completa y rigurosa, empleando herramientas matemáticas mucho más

sofisticadas.

El nombre de “teorema central” fue acuñado por George Polya en 1920, para

subrayar que de todos los teoremas de distribuciones límite, éste es justamente el más

importante. En términos generales, este teorema explica por qué la distribución normal

aparece con tanta frecuencia en fenómenos biológicos, físicos, astronómicos, químicos,

ingenieriles, etc., al establecer que (Wisniewski y Velasco, 2001, pp. 211) “La suma de

un gran número de variables aleatorias independientes tiende a seguir de manera asintótica

una distribución normal, siempre que determinadas condiciones queden satisfechas".

Intuitivamente, nos indica que al tomar una muestra aleatoria de tamaño

suficientemente elevado, la distribución de la media de dicha muestra- y de otros

estadísticos, tales como la proporción o la mediana- puede aproximarse mediante una

distribución normal, cuya media (valor esperado) precisamente coincide con el valor del

parámetro que tratamos de estimar.

Mediante el teorema central del límite podemos obtener distribuciones

aproximadas (asintóticas) de otras distribuciones tales como la binomial, Poisson, chi

cuadrado, etc., mediante la consideración de la suma de variables aleatorias, ya que el

Page 21: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

14

teorema se cumple, independientemente de la distribución de partida de la población. Se

verá con más detalle en la evolución histórica de su significado institucional en

estadística, Sección 2.3.

Desde el punto de vista didáctico en este teorema se reúnen elementos diversos

cuya comprensión debe adquirir el estudiante antes de abordarlo, tales como: variable

aleatoria, distribución normal, muestra aleatoria, estadístico, distribuciones muestrales,

etc., lo que hace rico y complejo su estudio. Muchos alumnos tienen dificultad con el

cálculo de probabilidades o incluso con el análisis matemático y, sin embargo, es

necesario que adquieran comprensión y competencia en las diferentes distribuciones de

probabilidad y en las nociones básicas de muestreo, ya que las dificultades de

comprensión de estos conceptos influyen en los errores de aplicación de los

procedimientos inferenciales, tales como la estimación por intervalos o los contrastes de

hipótesis (Vallecillos, 1996, 1999). Por lo tanto tenemos que buscar medios didácticos

que los hagan asequibles a los alumnos.

La comprensión del teorema central del límite y su implicación sobre las

distribuciones muestrales es un tema en el que se han descrito dificultades por parte de

los estudiantes quienes no perciben el efecto del tamaño de la muestra en la variabilidad

(Méndez, 1991; Rubin, Bruce y Tenney, 1991) o no comprenden que la esperanza

matemática de las distribuciones muestrales depende del valor del parámetro

desconocido en la población (Vallecillos, 1996, 1999). Por otro lado, el uso de la

tecnología no siempre produce una comprensión efectiva de las distribuciones

muestrales (delMas, Garfield y Chance, 1998, 1999).

1.3.2. IMPORTANCIA DEL TEOREMA CENTRAL DEL LÍMITE EN LA INGENIERÍA Y

OTRAS ÁREAS

En muchas situaciones prácticas de la ingeniería, las ciencias exactas y la

economía, se considera que una variable aleatoria representa la suma de un número

considerable de variables aleatorias independientes (cuyas distribuciones particulares

pueden ser arbitrarias o incluso desconocidas). Pero, gracias a este teorema, se acepta

que la variable aleatoria que resulta de sumar todas estas variables se aproxima

mediante la distribución normal. A modo de ejemplo se citan los siguientes (Wisniewski

y Velasco, 2001):

a. Imagínese el caso del consumo de energía eléctrica por cada familia. Es evidente

Page 22: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

15

que la mayoría de las familias consumen electricidad de manera desordenada y

aleatoria. Así, para cada familia k, puede haber una variable aleatoria kX que rija el

consumo particular de energía eléctrica, con su distribución de probabilidad y

parámetros (media y varianza) respectivos. Distintas familias pueden consumir

energía eléctrica de modo muy diferente y con diferentes distribuciones de

probabilidad. Sin embargo, gracias al teorema central del límite, se puede asegurar

que la cantidad total de energía eléctrica consumida en una ciudad o una zona de

esta, producto de la suma total de las contribuciones individuales de numerosas

familias, puede aproximarse mediante una distribución normal. Lo mismo ocurre en

otras situaciones como el consumo de agua o gas doméstico.

b. Pequeñas partículas de polvo suspendidas en un líquido que está en reposo son

objeto de movimientos aparentemente aleatorios (movimiento browniano, cuya ley

fue estudiada por Albert Einstein). El movimiento browniano es, en realidad, el

resultado final de numerosos bombardeos de las moléculas del líquido (tan pequeñas

que son invisibles aun bajo potentes microscopios), y cada molécula contribuye

“con su grano de arena” a la suma resultante final del movimiento aleatorio de una

partícula de polvo suspendida, que es la resultante vectorial de todas las

contribuciones individuales de los desplazamientos aleatorios de cada molécula.

c. Cabe señalar, que una característica de los errores de medición, cuando una cantidad

es la suma de un gran número de contribuciones pequeñas, consiste en que la

contribución individual de cada término es despreciable, y la probabilidad de que

cualquier error en una medición individual pueda afectar a la suma resultante es

prácticamente cero. El impacto que pueda tener el teorema central del límite en las

ciencias de ingeniería, se basa precisamente en las distribuciones de probabilidad

asociadas a la medición de datos ingenieriles, como por ejemplo: tiempo de falla,

tasas de falla, proporciones de defectuosos, flujos eléctricos, resistencia de

materiales, ancho de banda para comunicaciones, diámetros de árboles, oscilaciones

de temperaturas de operación, etc.

Por otro lado, la mayor parte del uso moderno de la estadística en la ciencia y la

ingeniería, se dirige más hacia la inferencia que a la descripción, en que la mayoría de

las aplicaciones de la estadística, los datos disponibles consisten en una muestra. En la

inferencia estadística lo que se desea hacer es tomar una decisión acerca de una

población determinada. En particular, la comprensión de la unidad de distribuciones

Page 23: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

16

muestrales, en que está presente el teorema central del límite, es fundamental en los

procedimientos inferenciales de estimación puntual de parámetros, estimación por

intervalos de confianza y la prueba de hipótesis. Por ejemplo, si en un lote de 5000

circuitos integrados contienen exactamente 50 circuitos defectuosos, al seleccionar una

muestra de 100 dispositivos se espera un 1% de circuitos defectuosos, pero esta cantidad

puede ser cero, dos o cinco por ciento, dependiendo de los dispositivos específicos

contenidos en la muestra. Es así, como el proceso de muestreo

-elemento importante en el teorema central del límite- introduce cierta variabilidad en

los resultados observados en el sentido en que la proporción de unidades defectuosas

puede cambiar de la proporción real de éstas.

1.4. DELIMITACIÓN DEL PROBLEMA DE INVESTIGACIÓN

Las anteriores consideraciones conducen a mostrar interés por realizar una

investigación específica sobre la enseñanza del teorema central del límite a ingenieros,

en el contexto chileno. Una vez contextualizado este estudio, se procedió a delimitarlo y

organizarlo en cuatro etapas, que son las empleadas por Tauber (2001) en su estudio

sobre la distribución normal:

Etapa 1. Análisis epistémico: El fin de esta fase es fijar el significado institucional de

referencia, que es la base del diseño de la secuencia didáctica. Este trabajo se centrará

en la descripción del significado histórico del teorema central del límite y el que se

presenta del teorema en los libros de estadística para ingenieros.

Etapa 2. Selección de elementos de significados y diseño de una secuencia de

enseñanza: Se trata de seleccionar a partir del significado de referencia unos campos

específicos de problemas, así como el resto de elementos de significado, además de

unas configuraciones didácticas para abordarlos. También se fijarán los contextos

particulares de aplicación, relacionados con áreas de interés para el alumno. Todo ello

se secuenciará y enlazará convenientemente para producir un proceso del estudio del

teorema central del límite que tenga en cuenta los estudiantes y el contexto en que se

produce la enseñanza y en su caso, la forma en que se resuelven.

Etapa 3. Determinación del significado institucional implementado: Por medio de las

observaciones de las sesiones de clase en estadística en relación al tema del teorema

Page 24: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

17

central del límite, se describe la enseñanza tal y como es llevada a cabo. Asimismo se

observan algunos posibles conflictos semióticos que los alumnos ponen de manifiesto

en el transcurso de la enseñanza.

Etapa 4. Evaluación del proceso de aprendizaje y significado personal de los alumnos:

Se caracterizan los elementos de significado puestos en juego por los alumnos, por

medio del análisis de sus soluciones escritas a un cuestionario y algunos problemas y

proyecto abierto, para describir el significado personal logrado y evaluar la comprensión

de los alumnos sobre el teorema central del límite.

En síntesis, este trabajo permitirá avanzar desde un contexto de enseñanza -

considerando criterios de idoneidad y la caracterización de la comprensión mostrada por

estudiantes de ingeniería- a la planificación de un proceso de enseñanza-aprendizaje

para el teorema central del límite. En lo que sigue se describen los objetivos de la

investigación.

1.5. OBJETIVOS DEL TRABAJO DE INVESTIGACIÓN

Como se ha indicado, en esta memoria, se presentará un estudio sistemático del

significado institucional pretendido e implementado sobre el teorema central del límite

en un curso dirigido a estudiantes de ingeniería de segundo año que cursan Estadística.

Asimismo se valora el significado personal adquirido por los estudiantes en un proceso

de estudio y se determinan los criterios de idoneidad didáctica de dicho proceso.

El estudio se ha basado en el enfoque ontosemiótico desarrollado por Godino

(Godino y Batanero, 1994, 1998a; Godino, 2002a; Godino, Contreras y Font, 2006;

Godino, Batanero y Font, 2007; Godino, Bencomo, Font y Wilhelmi, 2007) y parte del

análisis previo de la evolución histórica del significado del teorema central del límite y

de las investigaciones realizadas sobre este tema. En síntesis, este trabajo da continuidad

a las investigaciones realizadas en la Universidad de Granada, en la línea de la

educación estadística. Dentro del marco teórico citado los objetivos general y

específicos son los siguientes:

Objetivo General

Diseñar y evaluar un proceso de estudio dirigido sobre el teorema central del

límite a estudiantes de ingeniería que tenga en cuenta la evolución histórica del

Page 25: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

18

teorema, el contexto educativo, tipos de estudiantes y el marco teórico en que se basa la

investigación.

Objetivos Específicos

Este objetivo general se descompone en los siguientes objetivos específicos:

O1. Realizar un análisis epistemológico de la evolución histórica del teorema

central del límite desde el punto de vista de su significado, identificando los diversos

campos de problemas abordados, así como las diversas formulaciones (enunciados) del

mismo.

Este objetivo se desarrolla en el Capítulo 2 (Sección 2.3), donde se hace un

análisis de la evolución histórica del teorema central del límite. Se comienza

discutiendo los primeros campos de problemas, que parten de problemas prácticos, por

ejemplo, la necesidad de Laplace por aproximar la distribución de la suma de errores y

la búsqueda de aproximaciones para la distribución binomial. Se sigue con el

razonamiento de Laplace, y el primer enunciado del teorema central del límite. A

continuación se describen los progresivos campos de problemas y contribución de

diferentes autores que tratan de generalizarlo y estudiar sus condiciones de validez y

aplicaciones.

O2. Describir el significado que se presenta del teorema central del límite en los

libros de estadística para ingenieros, identificando los campos de problemas, lenguaje,

procedimientos, enunciados, propiedades y argumentos usualmente utilizados en la

enseñanza a ingenieros en una muestra representativa de libros de texto destinados a

estos estudiantes.

En relación con este objetivo, en el Capítulo 4 se ha desarrollado un análisis de

la aparición de los diferentes elementos de significados presentes en los 16 libros de

textos específicos analizados. Se han identificado las diferentes categorías de los

elementos de significado más comunes del teorema central del límite. Así también, se

muestra la complejidad del teorema y sus múltiples conceptos relacionados, por medio

de variados ejemplos y de las muchas definiciones y propiedades presentes en los

textos.

O3. Seleccionar los elementos de significados más adecuados a la construcción de

Page 26: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

19

la propuesta didáctica, contextualizándolos en unos campos específicos de problemas

con aplicación a la ingeniería y definiendo las configuraciones didácticas adecuadas

para abordar su enseñanza. Secuenciar y organizar estos elementos y configuraciones

en un proceso de estudio viable para la enseñanza del teorema central del límite a

ingenieros y analizar esta propuesta con objeto de determinar el significado de

referencia pretendido en el proceso de estudio.

La propuesta didáctica construida se analiza en el Capítulo 5. En dicha propuesta

se conjugaron varios factores, como la incorporación de las tres configuraciones

epistémicas (manipulativa, algebraica y computacional), el tiempo estimado de

ejecución de las lecciones, las exigencias del programa de la asignatura de estadística

para ingenieros y de los conceptos previos requeridos que deben tenerse en cuenta. Con

ello se determina el significado institucional de referencia pretendido.

O4. Experimentar el proceso de estudio, observación del mismo y llevar a cabo

una primera evaluación de su idoneidad, para los fines pretendidos.

El proceso de estudio diseñado se experimentó dentro de un curso de estadística

dirigido a ingenieros en su segundo año de estudios. Participaron en el estudio 134

estudiantes que habían seguido previamente un curso de Cálculo de Probabilidades,

organizado en dos grupos. En el Capítulo 6 se hace una descripción resumida del

proceso de observación de la experiencia de enseñanza, con un análisis más

pormenorizado de algunas de las actividades llevadas a cabo, así como de evaluaciones

parciales del aprendizaje realizadas al finalizar cada una de las tres lecciones. Como

resultado se proporciona una descripción del significado institucional realmente

implementado y se describen algunos de los conflictos semióticos observados, así como

la forma en que fueron resueltos en el aula.

O5. Evaluar el significado personal de los estudiantes al finalizar el proceso de

estudio y compararlo con el significado institucional implementado.

En el Capítulo 7 se describen los resultados de varias evaluaciones llevadas a

cabo con diferentes instrumentos, algunas de las cuáles sólo se realizan sobre una parte

de los alumnos. Los instrumentos incluyen un cuestionario de opciones múltiples con

justificación de algunas preguntas, dos problemas abiertos y un proyecto abierto de

aplicación.

Page 27: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

20

Los resultados de la evaluación sirven para analizar el aprendizaje logrado por

los estudiantes en diversos elementos de significado del teorema y analizar las

concordancias y diferencias entre el significado personal logrado y el significado

institucional implementado. También permite dar una valoración de la idoneidad

didáctica del proceso de estudio implementado.

1.6. HIPÓTESIS DEL ESTUDIO

Una vez planteado un problema de investigación, los métodos para tratar de

obtener respuestas al mismo dependerán de las ideas previas del investigador sobre lo

que espera encontrar. Por tanto, se hace necesario exponer las hipótesis del trabajo y

cómo han sido generadas a lo largo de la investigación.

En esta investigación se tomará el término hipótesis en el sentido que le atribuye

Bunge (1985), quien denomina hipótesis factual a las proposiciones que se refieren a

hechos no sujetos hasta el momento a experiencia y corregibles a la vista del nuevo

conocimiento. Para el autor, esta hipótesis va más allá de la evidencia (datos) que trata

de explicar para utilizarlos como evidencia en favor o en contra de las hipótesis. Otra

característica es que las hipótesis no pueden quedar establecidas por una experiencia:

los datos no pueden validar sino sólo refutar las hipótesis.

Refiriendo al autor se seguirán tres condiciones para formular las hipótesis: 1)

Tienen que ser formalmente correctas y no vacías semánticamente; 2) Deben estar

fundadas en el conocimiento previo o al menos ser compatibles con el cuerpo de

conocimiento científico sobre el problema; 3) Deben ser empíricamente contrastables

mediante los datos empíricos controlados por técnicas y teorías científicas.

Siguiendo estos supuestos, la investigación parte de una serie de hipótesis, en un

principio definidas de forma difusa y que han ido configurándose y perfilándose a lo

largo del trabajo. A continuación se describen estas hipótesis, que deben entenderse en

el sentido de expectativas iniciales sobre los resultados del trabajo.

La lectura de los antecedentes de este trabajo, así como los resultados de otros

trabajos planteados dentro del mismo marco teórico por otros profesores (en particular

Tauber, 2001 y Cobo, 2003) indicaban la complejidad de los conceptos estadísticos. Las

primeras hipótesis, que se plantean a continuación, aluden a que esta complejidad se

presentaría en el significado institucional (histórico, de referencia, pretendido e

implementado) sobre el teorema central del límite.

Page 28: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

21

H1: El significado del teorema central del límite tiene un carácter complejo, debido

a la multiplicidad de elementos y su interrelación, y ha ido surgiendo lentamente a

lo largo de la historia en un proceso complejo. Diversos campos de problemas

dieron lugar a enunciados diferenciados del teorema.

H2: Asimismo, es complejo el significado del teorema central del límite presentado

en los textos de estadística dirigido a ingenieros y se encontrarán una variedad de

enfoques y aproximaciones. En relación a los campos de problemas, se

evidenciarán nuevos campos de aplicación y faltarán los campos más complejos.

Las herramientas para resolver los problemas serán de menor complejidad que las

usadas en el estudio histórico, lo que conllevará una menor rigurosidad en las

demostraciones del teorema.

H3: La introducción de tres configuraciones epistémicas (manipulativa,

computacional y algebraica) permitirá introducir elementos originales en el

significado de referencia pretendido en la investigación. En particular la

introducción del ordenador permitirá variación en los campos de problemas,

lenguaje y modos de argumentación.

Estas hipótesis se justifican también por los resultados similares que sobre otros

conceptos estadísticos y probabilísticos han sido obtenidos por Ortiz (1999) y Sánchez-

Cobo (1999) en sus estudios sobre los libros de texto. Para tratar de analizarlas se llevó

a cabo el estudio histórico (Capítulo 2) y de libros de texto (Capítulo 4).

Aunque se esperaba que tanto a lo largo de la enseñanza, como al finalizar la

misma, los alumnos mostrasen una comprensión razonable de los diversos elementos de

significado introducidos en la enseñanza, se suponía esperar también una variabilidad,

tanto en alumnos como en contenidos comprendidos. Es decir, debido a la complejidad

del significado institucional del teorema central del límite, se pensaba que esta

complejidad se reflejaría en los significados personales de los estudiantes sobre el tema.

Además, aunque algunos autores (Méndez, 1991; delMas, Garfiel y Chance,

1999) han descrito dificultades específicas sobre el teorema central del límite, se partió

del supuesto básico de que la rica variedad de los significados personales no ha sido

suficientemente explorada en las investigaciones previas. A continuación se plantean

estas ideas sobre el significado personal de los estudiantes en forma de hipótesis.

Page 29: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

22

H4: A lo largo de la enseñanza surgirán conflictos semióticos, algunos de los cuáles

se harán explícitos a través de las preguntas de los estudiantes en clase o de las

respuestas a actividades escritas. La gama de dificultades y conflictos planteados

ampliará los resultados de las investigaciones previas sobre el teorema central del

límite.

H5: Se espera también que una parte importante de estas dificultades y conflictos

quede superada al finalizar la enseñanza y que los estudiantes usen correctamente

un gran abanico de elementos de significado del teorema central del límite en sus

respuestas a las tareas de evaluación, incluso en el caso en que no lleguen a una

respuesta totalmente correcta.

H6: Analizada la multidimensionalidad de las respuestas de los alumnos al

cuestionario, se espera describir tipologías de estudiantes que correspondan a

significados personales diferenciados sobre el teorema central del límite.

Para tratar de analizar estas hipótesis se llevó a cabo una experimentación del

proceso de estudio, que se describe con detalle en el Capítulo 6. Asimismo se ha llevado

a cabo una evaluación final del aprendizaje a partir de diversos instrumentos. Las

técnicas de análisis de estos datos incluyen métodos cualitativos y cuantitativos,

univariantes y multivariantes.

Finalmente, en el capítulo de conclusiones se vuelve sobre todas estas hipótesis

para realizar una discusión de las mismas, en vista de los datos recogidos, y para ver en

qué medida estos datos las apoyan o contradicen.

1.7. METODOLOGÍA DEL ESTUDIO

1.7.1. INTRODUCCIÓN

Puesto que la parte empírica de la investigación consta de diversas fases, la

metodología se adapta a los objetivos específicos de cada una de ellas, a objeto de

describir los distintos significados institucionales y personales del teorema central del

límite en una institución particular, así como valorar los criterios de idoneidad del

proceso de estudio implementado.

Page 30: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

23

1.7.2. METODOLOGÍA DEL ANÁLISIS DE TEXTOS

En esta fase de la investigación (Capítulo 4) y en correspondencia con los

objetivos planteados, se seleccionarán los textos y capítulos relacionados directamente

con el teorema, para luego realizar un análisis de contenido.

Como indica Weber (1985), el análisis de contenido es un tipo de medición

aplicado a un texto, que se basa en la idea de que las unidades del texto pueden

clasificarse en un número reducido de categorías. Sirve para efectuar inferencias

mediante la identificación sistemática y objetiva de las características especificas de un

texto (Ghiglione y Matalón, 1991). Su objeto final es la búsqueda del significado, cuya

percepción depende de la existencia de las señales y de las características de los

significantes: "Es un proceso complejo, seguramente el que más esfuerzo intelectual

requiere de entre todas las técnicas de análisis de datos y es uno de los pocos campos

de los comprendidos en las etapas finales del proceso de investigación en la que el

investigador desempeña un papel individual y creativo" (Fox, 1981, pp. 704).

Gil Flores (1994), señala que el dato es inseparable del proceso que lo registra y

del modo en que se comunica, ya que el investigador no puede captar la realidad, sino lo

que registra son las elaboraciones que hace de la misma. En el análisis de datos

cualitativos intervienen la elaboración conceptual y el lenguaje en que se expresa la

información, que es el resultado del modo en el que el investigador se acerca al

problema e interacciona con el objeto de su estudio. En este caso, el acercamiento es

desde el marco teórico, tratando de delimitar el significado de referencia para la

investigación.

El análisis de contenido comienza por elegir la unidad de contenido a analizar.

Luego se elaboran un conjunto de categorías, junto con un fundamento lógico que sirva

para asignar las unidades a estas categorías (Fox, 1981; Weber, 1985). El proceso de

análisis será inductivo, revisando en forma continua los capítulos relacionados con el

tema, hasta llegar a establecer los resultados finales.

Teniendo en cuenta los objetivos planteados, se considera que al analizar el

teorema central del límite en una muestra amplia y representativa de textos de

estadística universitaria, esta arrojará una visión aproximada de lo que los alumnos

reciben en la educación universitaria. Varios investigadores en la línea de didáctica de la

probabilidad y estadística señalan la importancia de este recurso didáctico. Por ejemplo,

según Ortiz (1996, 1999) un libro de texto se considera como un segundo nivel de

transposición didáctica, después del primer nivel que lo constituirán los currículos y

Page 31: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

24

programas oficiales. Si en un texto aparece un significado sesgado, éste puede llegar a

transmitirse a los alumnos, debiendo el profesor que los usa mantener una permanente

vigilancia epistemológica sobre el contenido de los libros de texto. En Ortiz y cols.

(2000) se muestran ejemplos de estos problemas en relación a la enseñanza de la

probabilidad.

Tauber (2001) realizó una descripción del significado institucional de la

distribución normal en los libros de texto universitarios, en el momento en que la

incorporación del ordenador hace plantear una revisión de los textos. Su estudio,

mediante el análisis de textos, muestra la complejidad sistémica de un concepto,

trabajando sólo dos campos de problemas definidos en el significado de referencia.

Cobo (2003) describió los elementos de significado de las medidas de posición

central en libros de textos de educación secundaria. Analizó una muestra de 22 libros

que incluyen el tema, considerando 14 textos de 3º curso de E.S.O. y 8 libros de 4º

curso de E.S.O. El análisis epistémico del tema, revela su complejidad, tanto en lo que

respecta a la media, como a la mediana y la moda, en virtud de la gran cantidad y

variedad de elementos de significado que intervienen, incluso en el nivel elemental, lo

que implica que su estudio sea más complejo de lo que pueda parecer a simple vista.

La riqueza de esta metodología de análisis de textos, es que constituye una base

para determinar la correspondencia entre el significado de un concepto estadístico

entregado por el profesor y la comprensión del significado del concepto por parte del

alumno. Lo anterior, lleva a realizar el análisis que se presenta en éste, que sigue el

marco teórico y la pauta de Ortiz (1999), Tauber (2001) y Cobo (2003).

Para el análisis de los libros de texto, se seleccionarán aquellos capítulos en los

que se trata el teorema central del límite, específicamente concerniente a las

distribuciones muestrales, en los cuales están también los elementos previos de la

comprensión del teorema. Los pasos a seguir en el análisis de contenido son los

siguientes:

Determinar los textos de estadística universitaria a analizar;

Seleccionar los capítulos, mediante una lectura detallada de los que tratan el tema,

clasificando y agrupando las diferentes definiciones, propiedades, representaciones

y justificaciones prototípicas;

Determinar los elementos de significados, a partir del análisis epistémico

presentado en el Capítulo 2, como guía para establecer el significado del teorema

Page 32: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

25

que se da en la institución universitaria;

Elaborar tablas comparativas que recogen los elementos de significados en los

distintos textos seleccionados;

Análisis comparativo de contenido, entre lo que los autores de los libros

seleccionados consideran más adecuado para este nivel educativo y el análisis del

significado de referencia realizado en el Capítulo 2;

Presentación de conclusiones, mediante el análisis descriptivo de la información

obtenida.

En relación a la muestra de textos seleccionada se podrá obtener una visión

general del contenido del teorema, que los autores consideran más adecuado para la

enseñanza universitaria. El análisis se llevará a cabo con libros de texto universitario,

que incluyen en unos de sus capítulos contenidos relativos al teorema central del límite.

Los libros a analizar se presentan en la Sección 4.2 y se han considerados aquellos

textos conocidos y utilizados entre los docentes universitarios y que aparecen en la

bibliografía del programa de curso de probabilidad y estadística. Algunos libros son

nuevos, de menor difusión, pero con un enfoque novedoso, que permitirán enriquecer el

estudio del significado del teorema.

1.7.3. METODOLOGÍA DE LA EXPERIMENTACIÓN Y OBSERVACIÓN DEL PROCESO DE

ESTUDIO

Durante el segundo semestre del curso 2005 se llevó a cabo una experimentación

del proceso de estudio que fue observado y posteriormente analizado. La metodología

de esta parte de la investigación se encuadra en los métodos cualitativos y más

particularmente en la observación participante, puesto que el investigador convive con

los individuos que estudia y refleja sus actividades e interacciones en notas de campo

que toma durante o inmediatamente después de los hechos (Goetz y Lecompte, 1988).

En esta experiencia hubo dos grupos de estudiantes. En uno de los grupos el

investigador participó como observador; otro investigador participó como profesor y en

el segundo al contrario. Los dos grupos fueron enseñados con el mismo material y

método, proponiéndose las mismas actividades. La evaluación final se realizó en forma

conjunta.

Page 33: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

26

Población y muestra

La población de interés en nuestro trabajo, son los alumnos de ingeniería, y en

particular en Chile. Son alumnos con un conocimiento variado de estadística, que han

realizado un curso previo de Cálculo de Probabilidades, así como cursos de Cálculo y

Álgebra y conocen el uso de algunas aplicaciones informáticas, como la hoja Excel, etc.

Los grupos que participan en la investigación son 134 alumnos de la asignatura

Estadística (sigla MAT 2203) en el curso del segundo semestre 2005 en la UCSC de

Chile. Esta asignatura corresponde a un ramo de carácter mínimo y tiene como

prerrequisito el curso de Probabilidades. Por tanto, los alumnos poseen conocimiento

aceptable de cálculo de probabilidades de sucesos, variables aleatorias y de las

distribuciones clásicas de probabilidades. Debe tenerse en cuenta que las carreras de

Ingeniería en Acuicultura y Marítimo Portuario presentan características socio

económicas y calificaciones de ingreso a la universidad bajo el promedio de las otras

carreras de ingeniería.

Junto a los señalado, conviene hacer explícito el reconocimiento y

agradecimiento a todos los alumnos participantes por su colaboración e interés, así

como por la buena voluntad para completar las actividades propuestas.

Instrumentos

Diario de observación. Corresponde al método de observación (Fox, 1981) donde

los datos pueden tomarse directamente porque son accesibles al investigador el cual fue

elaborado durante el desarrollo de la secuencia de enseñanza. El objetivo principal de

realizar un diario de observación fue describir la enseñanza, tal como fue llevada a cabo,

lo que permitió luego, comparar entre el significado institucional local previsto y el

efectivamente observado, además de tomar nota de las dificultades planteadas por los

alumnos, para poder interpretar mejor los datos recogidos por escrito de las actividades.

No se usó guión estructurado de observación, pero al realizar las observaciones, se

tuvieron en cuenta algunas de las recomendaciones dadas por Bisquerra (1989). Por

ejemplo, se realizaron los registros en el campo e inmediatamente después de cada

clase, se revisaron las notas de observación y agregó cualquier hecho que hubiera

pasado inadvertido. Las notas de campo se tomaron lo más completas que fue posible,

con el fin de cubrir todo lo que sucedía en la clase.

La observación se centró en recolectar todas las preguntas y dudas planteadas

Page 34: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

27

por los alumnos tanto en el aula, como por el foro de la plataforma virtual, con el fin de

detectar los elementos de significado que presentaban mayores dificultades. También, se

detalló la manera en que se fue desarrollando cada clase, para poder comparar luego con

lo que se tenía previsto y de esta manera poder determinar qué elementos de significado

se habían trabajado, cuáles se habían dejado de lado o cuáles presentaron más

dificultades.

Informes escritos de actividades. Al tratar de evaluar el significado personal de un

alumno o de un grupo de alumnos, se ha de tener en cuenta que es un constructo

inobservable, por lo que sus características deben ser inferidas de sus respuestas. Según

Dane (1990) la medición se refiere al caso en que, por medio de las preguntas

planteadas a los alumnos, se pretende obtener una estimación de conocimientos y

capacidades de los sujetos, que no son accesibles por simple observación.

Como complemento de la observación de clases, se seleccionaron tres tipos de

actividades para ser resueltas por los alumnos con papel y lápiz y el ordenador. El

objetivo de recoger los informes escritos de diversas tareas era identificar los elementos

de significado que los alumnos aplicaban en la resolución para poder luego comparar

con el significado institucional local previsto y observado.

Las tareas teóricas y prácticas tenían el carácter de muestras de trabajo, según la

terminología de Fox (1981), debido a que para resolverlas se requiere de una

combinación de destrezas y conceptos que se necesitan para actuar en una situación

determinada. La combinación de destrezas requeridas incluye el conocimiento

estadístico y la capacidad argumentativa. Según este autor, la tarea debe ser un prototipo

de una situación real, que en nuestro caso correspondería a la situación de análisis de

datos a que estos alumnos pueden enfrentarse en su futura vida profesional.

Los datos del diario de observación se analizan cualitativamente, en forma

narrativa. Los datos de las tareas escritas se analizan primero cualitativamente para

categorizar las respuestas y luego se presentan los resultados globales en tablas de

frecuencias.

1.7.4. METODOLOGÍA DE LA EVALUACIÓN DEL APRENDIZAJE

Muestra participante e instrumentos

La evaluación del aprendizaje se hace sobre la misma muestra de alumnos,

Page 35: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 1

28

aunque no todos ellos responden a los diversos instrumentos, que son los siguientes:

1. Un cuestionario, el cual se implementa para analizar la comprensión de los

elementos de significado del teorema central del límite y permite recoger en dos

sesiones, datos relativos a una variedad de conocimientos de los alumnos, aunque

con carácter más superficial. Es una prueba de tipo objetivo, ya que para cada

pregunta podemos determinar si la respuesta es correcta o no. Participan en el

mismo 134 alumnos. El instrumento construido se encuadra dentro de la teoría

psicométrica de maestría de dominio (Martínez Arias, 1995), ya que podemos

considerar que la puntuación total en la prueba está relacionada con el grado de

maestría o habilidad de los sujetos en un dominio dado de conocimientos, en este

caso, sobre el teorema.

2. Dos problemas abiertos (participan 134 y 106 estudiantes respectivamente) y un

proyecto personal libre de aplicación del teorema central del límite (participan 83

estudiantes). Se trata de pruebas de ensayo con la que se evalúa un nivel de

comprensión de datos de alto nivel (lectura más allá de los datos en la terminología

de Curcio, 1989), y capacidad de argumentación de los alumnos. La tarea propuesta

en el proyecto es totalmente abierta, también tiene el carácter de muestra de trabajo.

Análisis de datos

El análisis de datos del cuestionario se realiza por diversos métodos. Una vez

aplicado este instrumento, se presentan las tablas de frecuencia de resultados a los

diferentes ítems, así como el estudio de las puntuaciones parciales y globales en el total

del cuestionario.

Se realiza también un análisis cluster de estos mismos ítems con el fin de

observar las agrupaciones de respuestas correctas/incorrectas en los diversos ítems

(Afifi y Azen, 1980; Afifi y Clark, 1990; Peña, 2002). De ello se deduce la interrelación

entre una serie de elementos de significado, que en líneas generales ha coincidido con lo

esperado a nivel teórico. Asimismo, el análisis cluster de sujetos sirve para describir tres

tipologías de estudiantes que se identifican como configuraciones cognitivas específicas

en relación al significado personal sobre el teorema central del límite.

En relación con los dos problemas abiertos y el proyecto de aplicación, como

primer paso se ha realizado un análisis a priori categorizando los elementos de

significado previstos institucionalmente. Los datos obtenidos luego de aplicar la prueba

se han sometido a un proceso de varios pasos:

Page 36: Significados del Teorema Central del Limite en la Enseñanza de la

Problema de investigación

29

Se efectuó una primera lectura de los informes entregados por los alumnos,

realizándose a partir de ella y del análisis previo, la definición de diversas variables

estadísticas, que corresponden a los elementos de significado, que potencialmente

era posible aplicar en cada pregunta.

Se codificaron los datos de acuerdo a tres categorías para cada una de las variables:

elemento aplicado en forma correcta, incorrecta y no aplicado.

A partir de las tablas de datos obtenidas, se presentan tablas de frecuencias de los

distintos elementos aplicados correcta e incorrectamente por el total de alumnos,

discriminando los elementos de significado utilizados. Por medio de un estudio

descriptivo, y del estudio de las diferencias entre el número de elementos (correcta e

incorrectamente aplicados), se realizó la comparación entre el significado

institucional local previsto y el personal construido por los alumnos del grupo.

Page 37: Significados del Teorema Central del Limite en la Enseñanza de la

30

Page 38: Significados del Teorema Central del Limite en la Enseñanza de la

31

CAPÍTULO 2.

FUNDAMENTOS DEL ESTUDIO

2.1. INTRODUCCIÓN

En el Capítulo 1 se ha presentado la problemática internacional de acreditación

de las carreras de ingeniería. Dentro de este contexto, el propósito a largo plazo es

determinar qué competencias se favorecen en la enseñanza del teorema central del

límite, así como también analizar la problemática didáctica de la comprensión del

teorema en estudiantes universitarios.

Una de las ideas más aceptadas en la Educación Matemática es que los

estudiantes deberían comprender las matemáticas. Al respecto, Sierpinska y Lerman

(1996) se cuestionan: ¿Cómo enseñar de modo que los estudiantes comprendan?, ¿Qué

es lo que no comprenden exactamente?, ¿Qué comprenden y cómo?

Godino (2002b) ayuda a discernir algunas características de las nociones

cognitivas de competencia entendida como “saber hacer” y comprensión que implica

saber qué hacer y por qué. Para dicho autor, la expresión “A es competente para realizar

la tarea T”, indica que el sujeto A domina o es capaz de aplicar correctamente la técnica

t que resuelve o permite hacer bien la tarea T. En esas circunstancias, se dice que el

sujeto tiene una capacidad o competencia específica, o también que “conoce cómo

hacer” la tarea. En cambio, la expresión, “A comprende la técnica t que permite realizar

la tarea T” indica que A conoce por qué dicha técnica es adecuada, su ámbito de validez

y las relaciones con otras técnicas. Ambas nociones se complementan mutuamente; la

competencia atiende al componente práctico, mientras que la comprensión al

componente teórico del conocimiento.

Siguiendo estas ideas en este capítulo se presentan los fundamentos de esta

investigación. La perspectiva didáctica que se empleará está basada en el modelo

teórico denominado “enfoque ontosemiótico” propuesto por Godino y sus colaboradores

(Godino, 1999a y b, Godino y Batanero, 1994; Godino, 2002a; Godino, Batanero y Roa,

Page 39: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

32

2005). Este enfoque teórico proporciona una perspectiva pragmática-antropológica

sobre el conocimiento matemático y propone tres dimensiones en el análisis de la

enseñanza y el aprendizaje de las matemáticas: epistemológica, cognitiva e

instruccional. Cada una de ellas se aborda con herramientas agrupadas en tres modelos

teóricos: teoría de los significados institucionales y personales de los objetos

matemáticos (Godino y Batanero, 1994, 1998a), teoría de las funciones semióticas

(Godino, 2002a; Godino y Batanero, 2003; Godino, Batanero y Roa, 2005) y teoría de

las configuraciones didácticas (Godino, Contreras y Font, 2006; Godino Batanero y

Font, 2007).

Para complementar los fundamentos del estudio, en segundo lugar se usará el

marco teórico ya presentado para analizar la evolución histórica del teorema central del

límite, a partir de los problemas que lo originaron, con el fin de identificar las

dificultades surgidas hasta llegar a la etapa actual. La finalidad es mostrar que la

expresión “teorema central del límite” puede tener distinto significado para diferentes

personas o instituciones. Se mostrarán algunos problemas prácticos y luego teóricos que

han llevado al enunciado del teorema central del límite, la identificación de los

conceptos y propiedades relacionados con él y a la definición del lenguaje,

procedimientos y argumentos necesitados en la resolución de problemas.

2.2. MARCO TEÓRICO

2.2.1. INTRODUCCIÓN

El enfoque onto-semiótico toma los siguientes supuestos como base:

Las matemáticas constituyen un quehacer humano, que se orienta a dar respuesta a

ciertas situaciones problemáticas internas o externas a la propia matemática. Los

objetos matemáticos (conceptos, procedimientos, teorías, etc.), surgen de esta

actividad y evolucionan progresivamente.

Las matemáticas se pueden ver como un lenguaje simbólico en el que se expresan

las situaciones problemas y sus soluciones. Los sistemas de símbolos dados por la

cultura no sólo tienen una función comunicativa, sino un papel instrumental que

modifican al propio sujeto que los utiliza como mediadores.

La matemática es también un sistema conceptual lógicamente organizado. La

organización lógica de los conceptos, los teoremas y las propiedades también

Page 40: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

33

explica el gran número de problemas implicados en el aprendizaje de las

matemáticas. Un sistema no se reduce a la suma de componentes aislados, porque

lo que constituye un sistema son precisamente las interrelaciones entre sus

componentes (Godino y Batanero, 1998b).

Una de las características de este modelo es que problematiza la naturaleza de un

objeto matemático. Se parte del supuesto de que una misma expresión matemática

designa entidades diversas. Esta modelización tiene en cuenta, entre otros, los siguientes

supuestos:

Diversidad de objetos puestos en juego en la actividad matemática, tanto en el

plano de la expresión como en el contenido;

Variedad de actos y procesos de interpretación;

Múltiples contextos y circunstancias espacio-temporales y psicosociales que

determinan y relativizan estos procesos.

Considerando la idea de Chevallard (1991), para definir el objeto como un

emergente de un sistema de praxemas u objetos materiales ligados a las prácticas, los

autores presentan el objeto matemático como un emergente de un sistema de prácticas.

Se parte de la situación-problema como noción primitiva, considerándola como

cualquier circunstancia en la que debe realizar actividades de matematización que

incluye, según Freudenthal (1991) lo siguiente:

Construir o buscar soluciones que no son inmediatamente accesibles;

Inventar una simbolización adecuada para representar la situación y las soluciones

encontradas, y para comunicar estas soluciones a otras personas;

Justificar las soluciones propuestas (validar o argumentar);

Generalizar la solución a otros contextos, situaciones-problemas y procedimientos.

Cuando una clase de situaciones-problemas comparten soluciones, procesos,

etc., se considera que están agrupadas en un campo de problemas. El sujeto se enfrenta

a un problema y trata de resolverlo, para luego comunicar su solución a otras personas,

validar y generalizar la solución a otros contextos y problemas, de este modo está

Page 41: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

34

realizando distintos tipos de prácticas. A partir de las nociones primitivas de situación-

problema, campo de problemas y práctica, y con el fin de estudiar los procesos

cognitivos y didácticos, se desarrollan las nociones derivadas de prácticas significativas

y el significado de un objeto, para las cuales se postulan dos dimensiones

interdependientes, una personal y otra institucional. De acuerdo con los autores, una

práctica es significativa para una persona o para una institución, si cumple una función

para resolver el problema, comunicar, validar o entender su solución. Las prácticas

significativas están orientadas a un objetivo que implican una situación-problema, un

contexto institucional, una persona y las herramientas semióticas que mediatizan la

acción (Godino y Batanero, 1994).

2.2.2. SIGNIFICADO INSTITUCIONAL Y SIGNIFICADO PERSONAL DE UN OBJETO

MATEMÁTICO

Una institución está constituida por las personas involucradas en una misma

clase de situaciones problemáticas. Puesto que se comparte la misma problemática, las

prácticas sociales son compartidas, y suelen tener rasgos específicos, generalmente

condicionados por los instrumentos disponibles en la misma, sus reglas y modos de

funcionamiento, por lo que están ligadas a la institución, a cuya caracterización

contribuyen.

Particularmente, esta investigación se centrará en los campos de problemas

asociados al teorema central del límite, como por ejemplo, encontrar la distribución en

el muestreo de la media y de la proporción muestral para muestras de tamaño grande,

así como su uso en la construcción de los intervalos de confianza y contrastes de

hipótesis. Prácticas características de los problemas descritos serían realizar

transformaciones algebraicas con las variables que intervienen o calcular la probabilidad

que la media muestral tome un valor determinado en un intervalo dado, para muestras

grandes. Algunas de ellas sólo son realizadas por probabilistas, estadísticos

profesionales y otras pueden ser realizadas también por los alumnos.

Al considerar una institución escolar, como la educación universitaria, el

significado construido por un estudiante particular sobre el teorema central del límite,

en un momento del proceso de aprendizaje puede no corresponder exactamente al

significado del objeto en la institución dada, por lo que conviene distinguir entre

significado institucional y significado personal de un objeto matemático.

Page 42: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

35

El significado institucional de un objeto matemático, es el compartido dentro de

una institución.

El significado personal es el que el alumno tiene inicialmente o es adquirido a lo

largo del proceso de estudio.

El objeto matemático se presenta como un ente abstracto que emerge del sistema

de prácticas significativas, ligadas a la resolución de cierto campo de problemas

matemáticos. Este proceso es progresivo a lo largo del tiempo, hasta que en

determinado momento el objeto matemático es reconocido como tal por la institución.

Luego sufre transformaciones progresivas según se va ampliando el campo de

problemas asociado. Este proceso de construcción de los objetos en la ciencia tiene su

paralelismo en el aprendizaje del sujeto. El aprendizaje es progresivo a lo largo de la

vida del sujeto, como consecuencia de la experiencia y enseñanza recibida, y los objetos

construidos son los constituyentes del conocimiento subjetivo.

Figura 2.2.2.1. Tipos de significados institucionales y personales

SIGNIFICADOSPERSONALES

Global

Declarado

Logrado

SIGNIFICADOS

INSTITUCIONALES

Referencia l

Pretendido

Implementado

Evaluado

Partic ipac ión

Apropiac ión

Enseñanza

Aprendizaje

La relatividad socioepistémica y cognitiva de los significados, entendidos como

sistemas de prácticas, y su uso en el análisis didáctico lleva a introducir la tipología

básica de significados que se resume en la Figura 2.2.2.1 (Godino, 2002a, pp. 141). En

la parte central de la figura se indican las relaciones entre enseñanza y aprendizaje, que

implica el acoplamiento progresivo entre los significados personales e institucionales.

Asimismo, la enseñanza implica la participación del estudiante en la comunidad de

Page 43: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

36

prácticas que soporta los significados institucionales y el aprendizaje, en última

instancia, supone la apropiación por el estudiante de dichos significados.

En resumen, para los distintos objetos matemáticos se debe tener en cuenta las

dimensiones epistemológica (institucional) y la cognitiva (personal). En particular, en

este trabajo diferenciamos el significado institucional de referencia, que será definido a

partir del análisis de libros de texto en el Capítulo 4, el significado institucional

pretendido (descrito a partir del análisis del proceso de estudio diseñado en el Capítulo

5) y el implementado (que se deduce de la observación de la enseñanza en el Capítulo

6). Respecto al significado personal, se podrá diferenciar en el Capítulo 7 entre el

evaluado (parte del significado que se evalúa con los diferentes instrumentos de

evaluación), declarado (deducido de las respuestas de los estudiantes a estos

instrumentos y logrado (la parte del significado personal que está de acuerdo con el

significado institucional implementado). Asimismo, se describirán las diferencias entre

el significado institucional implementado y el significado personal de los estudiantes, es

decir el conjunto de conflictos y dificultades manifestados por los mismos en el proceso

de evaluación.

La diferenciación de significado institucional y personal de un objeto

matemático permite establecer un punto de vista más completo la problemática del

diseño de situaciones didácticas y la evaluación de los conocimientos del sujeto. Según

Godino (1996b), la comprensión personal de un objeto es, en este modelo, la

“apropiación” del significado institucional de dicho objeto.

Los procesos de instrucción matemática tienen como principal objetivo, para

este autor, el acoplamiento progresivo entre significados personales e institucionales. El

sujeto debe apropiarse de los sistemas de prácticas compartidas en el seno de las

instituciones de las que es miembro, pero también la institución tiene que adaptarse a las

posibilidades cognitivas e intereses de sus miembros potenciales.

2.2.3. OBJETOS INTERVINIENTES Y EMERGENTES DE LOS SISTEMAS DE PRÁCTICAS

En las prácticas matemáticas intervienen objetos matemáticos que evocamos al

hacer matemáticas y que son representados en forma escrita, oral, gráfica o incluso por

gestos. También de los sistemas de prácticas matemáticas emergen nuevos objetos que

dan cuenta de su organización y estructura. Los objetos emergentes son “objetos

institucionales” si los sistemas de prácticas son compartidos en el seno de una

Page 44: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

37

institución, y “personales” si corresponden a una persona1.

Los autores proponen la siguiente tipología de objetos matemáticos primarios,

que denominan “elementos del significado” (entendiendo aquí el significado en el

sentido sistémico-pragmático) y que a su vez se organizan en sistemas conceptuales,

teorías, etc.

Situaciones-problemas: Situaciones fenomenológicas que originan actividades

matemáticas (situaciones-problemas, aplicaciones) de donde surge el objeto; a

veces las podemos categorizar en “tipos” o “campos” de problema. Por ejemplo,

para el teorema central del límite serían situaciones problemas la “búsqueda de una

aproximación a la distribución binomial cuando n es grande” o “determinación de

la distribución de la suma o la media de variables aleatorias”.

Lenguaje: Representaciones materiales utilizadas en la actividad matemática. Las

notaciones, gráficos, palabras y otras representaciones del objeto que se pueden

usar para referirnos a él. El lenguaje es esencial en la teoría del aprendizaje debido

a su función comunicativa e instrumental, que modifica el propio sujeto que los

utiliza como mediadores.

Procedimientos: Modos de actuar ante situaciones o tareas (algoritmos,

operaciones, reglas de cálculo). Cuando un sujeto se enfrenta a un problema y trata

de resolverlo, o comunicar la solución a otras personas, validar y generalizar la

solución a otros contextos y problemas, etc., realiza distintos tipos de acciones que

se llegan a algoritmizar.

Conceptos- definición: (introducidos mediante definiciones o descripciones, por

ejemplo: media, distribución muestral, ...). En caso que aborda este trabajo, y

puesto que el objeto a estudiar es un teorema, se considerarán sus diversos

enunciados en esta categoría, ya que se dan las descripciones del objeto. Se podría

también incluir en esta categoría las definiciones de objetos ligados al teorema,

como “distribución muestral”, “muestra”, etc. Pero, por limitar la investigación,

ésta no se centra específicamente en ellas, aunque es posible en un momento dado

referirse a alguno.

Proposiciones: Se tratarán específicamente en este trabajo las propiedades

1 En la idea de “objetos personales” los autores incluyen las concepciones, esquemas, representaciones internas, etc.

Page 45: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

38

asociadas al teorema central del límite y objetos relacionados, que no se limitan a

descripciones de dichos objetos sino los ponen en relación. Aparte del propio

teorema (que se ha incluido en la categoría anterior), aparecerán propiedades tales

como las referidas a la media o varianza de la suma de variables aleatorias o la

corrección de continuidad.

Argumentos: Finalmente, todas estas acciones y objetos se ligan entre sí mediante

argumentos o razonamientos que se usan para comprobar las soluciones de los

problemas o explicar a otro la solución. La forma usual de demostración en

matemáticas es la deductiva, que es la más extendida en los libros universitarios.

Este tipo de argumentación se completa o sustituye por otras como la búsqueda de

contraejemplos, generalización, análisis y síntesis, simulaciones con ordenador,

demostraciones, etc.

El modelo descrito es recursivo, ya que, según el nivel de análisis, cada unidad

primaria puede estar compuesta por entidades de los restantes tipos. En este caso, el

“objeto” de estudio es una proposición (el teorema central del límite), pero de todos

modos pone en juego problemas, lenguaje, propiedades, procedimientos, enunciados y

propiedades.

Configuraciones de objetos

Los seis tipos de entidades primarias descritos anteriormente están relacionados

entre sí formando configuraciones, que Godino, Contreras y Font (2006) definen como

redes de objetos intervinientes y emergentes de los sistemas de prácticas. Estas

configuraciones pueden ser epistémicas (redes de objetos institucionales) o cognitivas

(redes de objetos personales).

La constitución de estos objetos y configuraciones, tanto en su faceta personal

como institucional, tiene lugar a lo largo del tiempo mediante “secuencias de prácticas”

que los autores intepretan como procesos matemáticos. La progresiva formación de los

objetos lingüísticos, problemas, definiciones, proposiciones, procedimientos y

argumentos tiene lugar mediante los respectivos procesos matemáticos de

comunicación, problematización, definición, enunciación, elaboración de

procedimientos y argumentación.

En este trabajo se describirán tres configuraciones epistémicas utilizadas en la

enseñanza para facilitar la comprensión de los estudiantes: manipulativa, computacional

Page 46: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

39

y algebraica, que se diferenciarán especialmente por las herramientas (procedimientos y

lenguajes) proporcionadas para resolver los problemas y que originan el uso de

conceptos y propiedades específicas. También se mostrarán -aunque de un modo

somero- configuraciones cognitivas diferenciadas en cuanto a los elementos de

significado comprendidos por grupos de estudiantes como resultado de la evaluación

(Capítulo 7).

2.2.4. RELACIONES ENTRE OBJETOS: FUNCIONES SEMIÓTICAS Y SUS TIPOS

Los problemas, acciones, lenguaje, definiciones, propiedades y argumentos no

aparecen aislados en la actividad matemática, sino que se ponen en relación durante la

misma. Para describir esta interacción Godino y Batanero (1998b) utilizan la noción de

función de signo (dependencia entre un texto y sus componentes y entre estos

componentes entre sí) y se refieren a la idea de función semiótica, que pone en juego

tres componentes:

Un plano de expresión (objeto inicial, considerado frecuentemente como el signo);

Un plano de contenido (objeto final, considerado como el significado del signo,

esto es, lo representado, lo que se quiere decir, a lo que se refiere un interlocutor);

Un criterio o regla de correspondencia, esto es, un código interpretativo que

relaciona los planos de expresión y contenido.

Con la función semiótica los autores quieren describir las correspondencias entre

un antecedente (expresión, representante) y un consecuente (contenido, representado),

establecidas por un sujeto (persona o institución) de acuerdo con un cierto criterio de

correspondencia durante la actividad matemática. Los cinco tipos de entidades

considerados pueden desempeñar el papel de expresión o de contenido en las funciones

semióticas. Las funciones semióticas y la ontología matemática introducida en el marco

teórico descrito, tienen en cuenta la naturaleza relacional de las matemáticas y

generalizan la noción de representación, que no queda asumido en exclusividad por el

lenguaje.

Con frecuencia las funciones semióticas vienen dadas por uno de sus tres

componentes, quedando los otros dos implícitos. El signo por tanto, no explicita la

correspondencia entre expresión y contenido, sino que alguien debe hacer una posible

interpretación. Cuando la interpretación que hace un alumno no está de acuerdo con lo

Page 47: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

40

esperado desde la institución de enseñanza, se produce un conflicto semiótico que

explica muchas de las dificultades y errores observados en el aprendizaje.

Las relaciones de dependencia entre expresión y contenido pueden ser de tipo

representacional (un objeto se pone en lugar de otro para un cierto propósito),

instrumental (un objeto usa a otro u otros como instrumento), y estructural (dos o más

objetos componen un sistema del que emergen nuevos objetos). Además, es preciso

distinguir entre significados elementales o sistémicos, definiéndolos de la siguiente

manera:

Significado elemental: El contenido de la función semiótica, es un objeto preciso,

determinable sin ambigüedad en las circunstancias espacio-temporales fijadas.

Significados sistémicos: Cuando el contenido de la función semiótica es un sistema

de prácticas (Godino y Batanero, 1994; 1998a). Este significado sistémico de un

objeto matemático se concibe como una entidad compuesta y organizada (sistema),

tiene un carácter teórico y trata de explicar la complejidad de los procesos

didácticos, pero no puede ser descrito en su totalidad.

2.2.5. EVALUACIÓN DE LA COMPRENSIÓN

Godino (1996a) sugiere que para analizar la comprensión es preciso responder a

dos preguntas: qué comprender, y cómo lograr la comprensión. Su modelo de la

comprensión tiene dos ejes: uno descriptivo, que indica los aspectos o componentes de

los objetos a comprender, y otro procesual que indica las fases o niveles necesarios en

el logro de la “buena” comprensión. Esta investigación se centrará principalmente en el

eje descriptivo.

Godino (1996b) también recuerda que la comprensión personal es inobservable

(sería un constructo, en términos psicológicos) mientras que el significado, como

conjunto de prácticas, es por lo menos potencialmente observable. El autor concibe la

evaluación como el estudio de la correspondencia entre los significados personales e

institucionales. La evaluación de la comprensión de un sujeto tiene que ser relativizada

a los contextos institucionales. Una institución dirá que un sujeto “comprende” el

significado de un objeto si dicho sujeto es capaz de realizar las distintas prácticas que

configuran el significado de dicho objeto institucional, además de fundamentarlas y

reflexionar sobre el proceso seguido.

Cuando se quiere caracterizar el significado de un objeto en una institución o

Page 48: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

41

para una persona, las prácticas observables son los indicadores empíricos que nos

permiten esta caracterización. Por lo tanto, en esta investigación y siguiendo el marco

teórico, se infiere la comprensión personal de los alumnos participantes sobre el

teorema central del límite mediante el análisis de las respuestas (entendidas como

prácticas), realizadas por la persona en la resolución de tareas problemáticas o ítems de

evaluación propuestas.

2.2.6. CRITERIOS DE IDONEIDAD DE UN PROCESO DE ESTUDIO

Además de estudiar con detalle la comprensión adquirida por los estudiantes

sobre los diferentes elementos de significado incluidos en el proceso de estudio, este

trabajo se interesa por analizar el punto hasta el cuál el proceso de instrucción ha sido

eficaz. Para ello se analizarán los criterios de idoneidad propuestos por Godino,

Contreras y Font (2006).

Idoneidad epistémica: Se refiere al grado de representatividad de los significados

institucionales implementados (o previstos), respecto de unos significados de

referencia. Incluye también las conexiones o apertura hacia otras configuraciones

epistémicas que constituyen la trayectoria correspondiente. Valoraremos este tipo de

idoneidad, comparando el significado institucional implementado en el proceso de

estudio, con el significado institucional de referencia.

Idoneidad cognitiva: Expresa el grado de proximidad de los significados

implementados con respecto a los significados personales iniciales de los

estudiantes, o de manera equivalente, la medida en que el "material de aprendizaje"

esté en la zona de desarrollo potencial de los alumnos. Se valorará comparando el

significado personal evaluado en los alumnos con el significado institucional

implementado.

Idoneidad semiótica: Tiene en cuenta las posibilidades que ofrece una configuración

didáctica para identificar conflictos semióticos potenciales y de resolverlos mediante

la negociación de significados. Se puede deducir del análisis de la observación del

proceso de estudio y del punto hasta el cuál se resuelven los conflictos semióticos

presentados.

Idoneidad mediacional: Es el grado de disponibilidad de los recursos materiales y

temporales necesarios para el desarrollo de la actividad (Godino, Contreras y Font,

2006). Para aumentar esta idoneidad el proceso de estudio incorpora tres

Page 49: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

42

configuraciones epistémicas: manipulativa, computacional y algebraica, para

facilitar la comprensión progresiva y generalización del teorema. También se pone a

disposición de los estudiantes el software @risk, materiales manipulativos y una

plataforma de ayuda al estudio.

Idoneidad emocional: Describe el grado de implicación (interés, motivación) de los

alumnos en el proceso de estudio. La idoneidad emocional está relacionada tanto

con factores que dependen de la institución como con factores que dependen

básicamente del alumno y de su historia escolar previa. Se aumentará

contextualizando el proceso de estudio en situaciones del área de la ingeniería y se

evaluará mediante una encuesta de opinión al finalizar el proceso.

2.3. EL TEOREMA CENTRAL DEL LÍMITE. EVOLUCIÓN HISTÓRICA DE

SU SIGNIFICADO EN ESTADÍSTICA

2.3.1. INTRODUCCIÓN

De acuerdo al marco teórico de este trabajo, el significado de un objeto

matemático no es único ni estable en el tiempo. En la actualidad conocemos como

teorema (o teoremas) central del límite a una serie de resultados acerca del

comportamiento de la distribución de la suma (o media) de variables aleatorias, cuya

expresión más conocida es la siguiente:

Sean ,...,...,, 21 nXXX variables aleatorias independientes e idénticamente distribuidas

con media finita y varianza 20 , entonces, ncuando

1,01 Nn

nXaprox

n

i

i

o equivalentemente 1,0Nn

X aprox .

Aunque intuitivamente se puede comprender este teorema señalando que la

media de una muestra de tamaño adecuado sigue aproximadamente una distribución

normal, independientemente de la distribución original de la variable en la población,

aun cuando no se ha llegado a esta comprensión intuitiva de una manera sencilla. Por

otro lado, ni la demostración matemática del teorema central del límite es simple, a

pesar de su utilidad y su uso generalizado en todas las aplicaciones de la estadística

matemática, este uso es correcto.

En esta sección se inicia el estudio de la evolución histórica del teorema central

Page 50: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

43

del límite a partir de los problemas que lo originaron y desde su primera forma simple a

su formato actual, el cual servirá para identificar diferentes significados institucionales

del teorema a lo largo de su desarrollo. Primeramente, se examinarán los inicios del

teorema cuando la teoría de la probabilidad todavía no había sido considerada parte de

la matemática rigurosa y se mostrarán las dificultades surgidas hasta llegar a la etapa

actual.

Por consiguiente, se continuará la evolución del teorema a partir de los

diferentes campos de problemas que lo originaron y las prácticas matemáticas que

llevaron a la solución de los mismos, así como la contribución de diferentes

matemáticos a su historia, que finaliza con la solución dada por Lévy, Feller y Cramer

en el año 1930. La finalidad es identificar los diferentes campos de problemas,

procedimientos y otros elementos que permitan mostrar la evolución del significado del

teorema y comprender las dificultades posteriores en el aprendizaje de los alumnos.

Las notaciones que se ocuparán en adelante para un mejor seguimiento en las

demostraciones del teorema son las siguientes:

,..., 21 XX : variables aleatorias (v.a.);

v. a. i.i.d. : v. a. independientes e idénticamente distribuidas;n

i

in XS1

: suma de n variables aleatorias;

n

i

in

1

22 : suma de n varianzas, donde iX tiene varianza 2i ;

itXeEt)( : función característica de X;

),(~ pnBX : la v.a. X tiene distribución binomial de parámetros n y p;

N( , ) : distribución normal de media y desviación típica ;

)0( nSP : probabilidad que la suma de n variables aleatorias sea cero;

0)( iXE : la esperanza o media de la v. a. iX es cero;

)( k

iXE : el momento de orden k de la v. a. iX está acotado.

2.3.2. IDEAS PRECURSORAS. APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL POR

LA NORMAL

Distintos autores han encontrado fórmulas de cálculo para la distribución

binomial y otras distribuciones discretas, en las que intervienen los términos factoriales.

Un problema es que, al aumentar el valor de n, estos términos crecen muy rápidamente,

por lo que el cálculo de las probabilidades de los valores de la variable en la

Page 51: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

44

distribuciones exactas es demasiado laborioso, incluso hoy día2. Mucho antes de la

aparición de los ordenadores, este problema llevó a distintos matemáticos a tratar de

encontrar valores aproximados de estas probabilidades para valores de n grandes y a

estudiar las condiciones en que estas aproximaciones podrían utilizarse con un error

acotado. Estos estudios inician el interés hacia los teoremas de límite y dan origen al

primer campo de problemas relacionados con el mismo:

CP1: ¿En qué condiciones y mediante qué funciones o distribuciones de probabilidad

puede aproximarse la distribución binomial, cuando aumentamos progresivamente el

valor de n (tamaño de una muestra)?

Según Xiuyu (2003) la mayor contribución de De Moivre (1667-1754) en el

desarrollo histórico del teorema central del límite es lo que llamamos hoy la

aproximación a la distribución binomial por la normal. De Moivre primero publicó

comentarios sobre este tópico en 1730 en su “Miscellanea Analytica”. Los resultados

finales aparecieron en su “Doctrine of Chances” (1733), donde mostró (en notación

moderna) que:

Sea ),(~ pnBX , xnx ppx

nxP )1()( , entonces, para valores grandes de n, X

sigue una distribución aproximadamente normal ),(N de media pn y

desviación típica npq ; es decir la variable x np

Znpq

sigue una

distribución normal N (0,1).

De Moivre investigó los límites de la distribución binomial cuando el número de

ensayos aumenta, encontrando una relación con la función 2

X

e . Además, intentó

determinar, para valores grandes del número de ensayos n, la probabilidad de ocurrencia

del valor central 2

n de una distribución binomial, aproximándola a la expresión

nnk 2

1

)(

2 . Stirling descubrió que k es igual a 2 . Hoy se sabe que la probabilidad del

valor modal de la distribución binomial para dos acontecimientos igualmente probables,

2 Aunque los ordenadores permitan hacer los cálculos en poco tiempo, el error puede llegar a ser grande, debido al número de operaciones y el error cometido en cada una de ellas por truncamiento.

Page 52: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

45

es decir 2

1p , está dado en forma factorial y coincide con el encontrado por De

Moivre: La probabilidad de 2nx éxitos en xn 2 ensayos es xxx

x22

1

!!

)!2( . Esto se

deduce, primero, aplicando la ley de los grandes números (Teorema de Bernoulli) a la

frecuencia relativa de éxito nX , que converge a la probabilidad de éxito p, cuando

aumente al número n de repeticiones; y reemplazando en la fórmula de la distribución

Binomial xn 2 y 2

1p . De Moivre encontró el papel que desempeña la función e

X 2

como límite de la distribución, en principio no la relacionó con la distribución normal

eX 2/2

)21( , pero en la segunda edición de su libro introdujo la distribución normal

como límite de la binomial.

Figura 2.3.2.1. Distribuciones de probabilidad binomial para diversos valores de sus parámetros

En el proceso de estudio se mostrará esta aproximación intuitivamente a los

alumnos con figuras similares a la Figura 2.3.2.1, donde se presenta cómo la forma de la

distribución binomial bin(n,p) para distintos valores de sus parámetros n y p se

aproxima a la función de densidad normal. Por ejemplo, en la Figura 2.3.2.1 se

muestran valores para p = 0,3 con n = 4, 8, 24 y para p = 0,1 con n = 4, 8 y 50. Se

puede justificar visualmente una primera intuición de la aproximación de De Moivre,

aunque persiste el problema de cómo una distribución continua puede aproximar otra

discreta y ello llevará a introducir la corrección de continuidad.

Page 53: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

46

2.3.3. DISTRIBUCIÓN DE LA SUMA DE VARIABLES ALEATORIAS DISCRETAS

IDÉNTICAMENTE DISTRIBUIDAS CON MEDIA Y VARIANZAS FINITAS

Debido a que la distribución binomial puede considerarse como la suma de

variables aleatorias idénticamente distribuidas (la binomial B (n,p) es la suma de n

variables aleatorias binomiales B (1, p) o variables de Bernoulli), la demostración que la

distribución binomial se aproximaba mediante la distribución normal, es un caso

particular de lo que sería posteriormente el teorema central del limite y llevó a varios

matemáticos a tratar de generalizar este resultado para otros tipos de distribuciones

llegando a un nuevo campo de problemas:

CP2: Encontrar la distribución de la suma de variables aleatorias discretas

independientes e idénticamente distribuidas (o de la media de variables aleatorias

independientes e idénticamente distribuidas).

Este campo era diferente del anterior y tenía una aplicación práctica inmediata

pues, conocida la distribución de la media muestral, sería posible obtener estimaciones

y realizar contrastes de hipótesis sobre la media poblacional. El interés de estas

aplicaciones explica el número de matemáticos que se interesaron por la distribución de

la media o de la suma. Un primer caso de este problema sería aquél en que las variables

fueran uniformes discretas (CP2.1).

El trabajo probabilístico de Laplace sobre la suma de variables aleatorias jugó un

rol importante en el desarrollo del teorema desde un comienzo. Ya en uno de sus

primeros artículos de 1776, estuvo trabajando en calcular distribuciones de probabilidad

de la suma de ángulos de inclinación de meteoros. Afrontó el problema de la desviación

entre la media aritmética de los datos (obtenido con errores observacionales) y los

valores teóricos, suponiendo que todos estos ángulos distribuidos aleatoriamente siguen

una distribución rectangular entre 0º y 90º. Puesto que la distribución de la media es

equivalente a la de la suma (excepto un factor constante, que es el valor n por el que se

divide), el problema se centró en hallar la distribución de la suma de los datos, todos los

cuales tienen la misma distribución y son independientes. Debido a la considerable

elevación de cuerpos celestiales, no fue capaz de representar un cálculo exacto y así

necesitó de una aproximación (Fisher, 2000). Fue en el proceso de encontrarla, que

Laplace eventualmente, vino a formular otra versión del teorema central del límite.

Antes de 1810, la distribución de la media aritmética había sido estudiada por

Page 54: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

47

muchas distribuciones de rango finito, con resultados de fórmulas complicadas por

ejemplo, para una variable aleatoria discreta uniformemente distribuida entre los enteros

–a y a, se obtuvo una suma de números combinatorios bastante compleja (véase Xiuyu,

2003, pp. 5). Fue necesario buscar aproximaciones más simples, que son cubiertas por

el teorema central del límite de Laplace. Laplace logró su primer resultado en 1785,

calculando una aproximación para )0( nSP ( nS es la suma de los n posibles errores), y

llegando a la siguiente aproximación:

)1(2

30

anaSP n

CP2.2: Distribución de la suma de variables aleatorias discretas independientes e

idénticamente distribuidas en el caso general.

Laplace generalizó posteriormente, en el año 1809, el trabajo de De Moivre

referido a la distribución binomial a la suma de variables aleatorias discretas

idénticamente distribuidas con media y varianza finita. En 1810 publicó una memoria,

donde estableció y probó más formalmente la siguiente versión del teorema central del

límite:

Sea X una variable aleatoria valorada entera que toma valores enteros

,..., 0,...a a con probabilidad a

xxXP

2)( , entonces para una muestra

n grande, la suma n

i

in XS1

está distribuida aproximadamente en forma

normal N( , ) de media n y desviación típica n siendo , la media y

desviación típica de la distribución de partida.

Laplace dio una demostración “rigurosa” para el caso discreto del teorema

central del límite usando la función característica ( )t = itXeE que se desarrolla en

serie de potencias hasta el segundo término e invierte para hallar a qué distribución

corresponde (técnica de la probabilidad inversa). La idea principal de la demostración

de Laplace para una distribución discreta arbitraria puede encontrarse en Fisher (2000).

Sea la probabilidad nP S n x para x menor que n , siendo la media

Page 55: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

48

de la distribución de partida. Despreciando los términos de orden superiores a dos,

obtiene lo siguiente: nP S n x =2

2

1exp

22

x

nn. Esto significa que

nS n se aproxima asintóticamente a la distribución normal ,0 nN . Laplace

intentó argumentar dos generalizaciones, no logrando demostraciones rigurosas:

Debido a que la distribución límite es independiente de a (sólo depende de a a través

de la media y la varianza), el resultado es válido también para una distribución

discreta con rango infinito, en el caso de que existan los momentos finitos

(Podemos considerar este otro caso particular del campo de problemas CP2.3).

Probó que los resultados también se cumplen para variables aleatorias con

distribución continua y acotada. Se considerará esta argumentación como un nuevo

campo de problemas (CP4) ya que se introducen nuevos conceptos como el de

variable continua, función de densidad, etc. y se utilizan nuevas herramientas, como

la integral. Primero, Laplace estudió la variable aleatoria discreta X que toma

valores enteros muy grandes ba ,...,0,..., ; con la probabilidad )( xXP dada

anteriormente, consideró la función de densidad de la variable continua de la forma

ba

xxf )( , y la integral de esta función la trató como una suma.

Gauss derivó en 1809 la función de densidad normal 21

( ) xf x e en su

trabajo “Teoría motus corporum celestium”. Su descubrimiento estuvo abierto a muchas

críticas, sin embargo tuvo un impacto grande en Laplace. Stigler (1986) sugiere que no

hay indicios que Laplace haya pensado en que esta función pudiese representar una

función de densidad para una distribución de probabilidad, y debe haber encontrado el

resultado en el trabajo de Gauss en 1810.

2.3.4. SUMA DE VARIABLES NO IDÉNTICAMENTE DISTRIBUIDAS Y VARIABLES

CONTINUAS

Contribución de Poisson

De todos los que aportaron al teorema central del límite en el siglo XIX, la

contribución de Siméon Denis Poisson en dos artículos (publicados en1824 y 1829) fue

Page 56: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

49

la de mayor influencia entre los autores posteriores a Laplace. Tratando de probar que

todos los procedimientos en el mundo físico están gobernados por leyes matemáticas

claras, intentó suministrar un análisis matemático más exacto al teorema de Laplace. La

contribución de Poisson al teorema central del límite fue doble (Fisher, 2000):

Mejoró y generalizó la demostración de Laplace. Comienza estableciendo una

demostración del teorema para variables independientes distribuidas idénticamente;

primero para una suma de éstas y luego para una combinación lineal de ellas. Luego

generalizó su demostración a la suma de variables aleatorias con distribuciones

diferentes; este es otro paso nuevo (CP3). Tratando de probar esta generalización, en

su demostración considera las variables continuas, las que dan origen a otro campo

de problemas (CP4), cuyo bosquejo de demostración se describe a continuación.

Discutió la validez del teorema central del límite, principalmente dando algunos

contraejemplos. De este modo inicia un nuevo campo de problemas, esta vez

estrictamente matemático que consistirá en encontrar condiciones suficientes y

necesarias para la validez del teorema central del límite (CP6).

En su artículo de 1824, Poisson da una demostración más rigurosa del teorema

central del límite para variables continuas (de este modo introduce el concepto de

variable aleatoria continua). Se describe resultados generales (Mether, 2003) de la

última parte del artículo de Poisson. Para una variable aleatoria X , que toma valores en

el intervalo [a,b] con función de densidad continua ( )if x , la versión de Poisson del

teorema central del límite puede ser resumida de la siguiente forma:

Sean 1,..., nX X variables aleatorias independientes con funciones de densidad

que se anulan fuera del intervalo [a, b]. Si la función característica está

acotada para valores entre 0 y 1, entonces 1 ... nX X se distribuye

aproximadamente como una normal ( , )N , siendo )( iXE y

)(2iXE . Esta aproximación es mejor cuando n es grande y los valores del

intervalo donde se calcula la aproximación se aproximan a la media (Fisher,

2000).

Page 57: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

50

Poisson concibió el teorema central del límite como una herramienta en el

cálculo de probabilidades clásicas, más que como un teorema matemático en sí mismo.

En consecuencia, Poisson no formuló explícitamente condiciones de validez para el

teorema. Parece claro desde el análisis de su demostración y de los ejemplos que utiliza,

que él asumió que las varianzas de las componentes de la suma están acotadas para que

la varianza de la suma sea de orden n. Aunque no indica explícitamente esta idea, sin

embargo, discutió unos pocos contraejemplos donde el teorema central del límite no se

cumple, ni tampoco la condición. Uno de estos ejemplos es la llamada variable

distribuida Cauchy donde la densidad de probabilidad toma la siguiente forma:

21

1)(

xxf que no puede aproximarse mediante una distribución normal.

Contribución de Dirichlet y Bessel

Dirichlet y Bessel siguieron principalmente los pasos de las demostraciones de

Laplace y Poisson, pero introdujeron el llamado “factor de continuidad” en la

demostración, para establecer el resultado de Poisson para valores arbitrarios de n.

Siguieron caminos diferentes para lograr la demostración, pero la regla era la misma.

Bessel además hizo notar que Poisson usó el mismo factor de continuidad, aunque en

una forma ligeramente diferente, cuando estableció la fórmula para n=1.

CP5: Encontrar estimaciones para el error cometido en las aproximaciones de las

sumas de variables aleatorias mediante la distribución normal.

Dirichlet fue el primero en intentar estimar el error de la aproximación, aunque

no fue muy afortunado y su técnica fue diferente de la moderna. Dirichlet había

estimado anteriormente los errores para otras aproximaciones no probabilísticas, y

mostró que estas mismas técnicas pueden ser aplicadas para la teoría de probabilidad tan

bien como lo habían sido para la matemática pura.

Contribución de Cauchy

Cauchy fue uno de los primeros matemáticos que consideró seriamente la teoría

de probabilidad como matemática pura. Contribuyó en diferentes campos de la

matemática, y también encontró un nuevo camino para probar el teorema central del

límite. Primero estableció una cota superior para la diferencia entre el valor exacto y la

Page 58: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

51

aproximación y luego especificó condiciones para que esta cota tienda a cero.

Cauchy en su demostración usó la función característica para variables

independientes e idénticamente distribuidas nXXX ,...,, 21 con función de densidad

simétrica y rango finito. Siguió la línea de la demostración de Poisson, pero consideró la

distribución de la función n

iii xw

1 que aproxima asintóticamente a la distribución normal

de media cero y varianza n

iiw

1

2 , bajo la condición que la función lineal sea el mejor

estimador lineal insesgado de un parámetro, es decir, 11

n

iiw . Así, Cauchy encontró una

cota superior y específica condiciones para esta cota cuando tiende a cero. (Hald, 1998).

2.3.5. DISTRIBUCIONES CON RANGO INFINITO

Con la demostración de Cauchy finalizó el primer período (1810-1853) de

desarrollo del teorema central del límite. La demostración presentada en este período

fue insatisfactoria en tres aspectos (Hald, 1998):

El teorema no fue probado para distribuciones de rango infinito.

No se explicitaron las condiciones, en términos de los momentos, bajo el cual el

teorema se cumple.

La razón de convergencia para el teorema no fue estudiada.

Estos problemas fueron resueltos por matemáticos rusos, entre 1870 y 1910. Dos

soluciones fueron dadas por Chebyshev y Markov, usando el “método de los

momentos” y por Liapounov, usando la función característica. La demostración de

Liapounov es considerada como la primera demostración “rigurosa”. En lo sucesivo, el

tema se centrará en lo que sigue en los probabilistas Chebyshev, Markov y Liapounov,

reconocidos en el grupo de la escuela de San Petersburgo por ser los que más han

contribuido al teorema central del límite; aunque otros matemáticos rusos como

Nekrosov y Sleshinsky se implicaron en el trabajo con el mismo problema (Seneta,

1984).

Contribución de Chebyshev y Markov

El artículo de Chebyshev en 1887, usualmente es considerado el comienzo de la

demostración rigurosa del teorema central del límite. En él estableció lo siguiente

Page 59: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

52

(Seneta, 1984):

Sean 1 2 3, , ,...,X X X variables aleatorias independientes con densidad de

probabilidad dada. Si

i) iXE i 0)( , la media de estas variables es cero y

ii) ( ) , 2k

iE X C i k los momentos de orden superior a dos están

acotados; entonces cuando n la distribución de la suma es

aproximadamente normal N(µ, ), siendo n

iiX

1 y )(

1

2n

iiXVar .

En su demostración, la cual es incompleta, Chebyshev usó el “método de los

momentos”, cuyos inicios fueron desarrollados por el autor citado. Este método fue mas

tarde simplificado y completado por Markov, quien también completó la demostración

de Chebyshev del teorema central del límite. En 1898, después de la demostración de

Chebyshev, Markov estableció que se necesitaba añadir una condición para que el

teorema fuese correcto. Primero, propuso la condición de que la suma de varianzas esté

uniformemente acotada en el origen. Después reemplazó la condición anterior por la de

que las esperanzas 2nE X estén acotadas cuando n tiende a infinito. Después de la

demostración de Liapounov del teorema usando la función característica en 1901,

Markov trabajó para lograr el mismo nivel de generalidad con el método de los

momentos. Finalmente lo logró en 1913 cuando presentó un artículo que dio una

demostración rigurosa del teorema central del límite bajo la condición de Liapounov y

usando el método de los momentos.

Teorema de Liapounov

Liapounov, un estudiante de Chebyshev, como Markov, con los cuales integra la

escuela de San Petersburgo, consiguió introducir demostraciones rigurosas en la teoría

de probabilidad. En su demostración del teorema central del límite, no siguió a

Chebyshev y Markov en el uso del método de los momentos, sino que como Laplace

usó la función característica. La demostración de Liapounov, publicada en 1901, es

considerada la primera demostración completa del teorema, en la forma siguiente

(Uspensky, 1937):

Page 60: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

53

Sea nXXX ,...,, 21 variables aleatorias independientes con las siguientes

propiedades:

iXE i 0)( y 2, kiXEk

i , entonces usando el teorema de

continuidad y unicidad de la función característica concluyó que la distribución

de la suma es aproximadamente normal.

En su demostración, usa un lema fundamental que es la clave a la simplicidad y

rigurosidad de su demostración:

Sea nS una variable que depende del entero n, con media o y varianza 1. Si la

función característica de la variable nS converge uniformemente a la función

característica de la distribución normal en algún intervalo finito, entonces la

función distribución de la variable nS tiende uniformemente a la distribución

normal.

Liapounov no separó explícitamente este lema fundamental de su demostración,

en la que está contenido implícitamente. Algunos otros que contribuyeron al teorema

central del límite como Linderberg y Lévy, usaron este lema en su mejora del teorema

(Uspensky,1937).

En este sentido es posible observar que en el período comentado se trabajó el

teorema bajo el supuesto sólo de variables independientes, a diferencia del primer

período cuyo supuesto eran variables aleatorias independientes e idénticamente

distribuidas. Una aplicación de la demostración del teorema dada por Liapounov al caso

de variables independientes e idénticamente distribuidas es la siguiente:

Sean 1 2 3, , ,...,X X X variables aleatorias independientes e idénticamente

distribuidas con media finita y varianza 20 , entonces

1,0Nn

nSn cuando n .

La demostración de este teorema utiliza la función característica y la expansión

de Taylor (Ver Xiuyu, 2003, pp. 14, Parzen, 1987, pp. 474). También ver Meyer, 1992,

Page 61: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

54

pp. 333, donde se demuestra mediante la función generadora de momentos.

2.3.6. ESTUDIO DE CONDICIONES NECESARIAS Y SUFICIENTES PARA EL

TEOREMA (CP6)

El tercer y último capítulo en la historia del teorema central del límite de 1920 a

1937, comienza con la demostración de Linderberg y las demostraciones de Lévy y

Feller que añadieron condiciones necesarias al teorema.

La Condición de Linderberg

El 1922, Linderberg publicó una demostración elemental del teorema central del

límite que se aplica a vectores aleatorios. Su demostración fue la base de los trabajos de

Lévy y Feller sobre el mismo problema. El teorema es el siguiente (Cam, 1986):

Teorema (Condición de Linderberg)

Sean iX variables aleatorias independientes con esperanza 0)( iXE y varianza

2i finitas. Si los momentos de tercer orden están acotados, entonces la

distribución de la suma se aproxima a la distribución normal.

La condición anterior es llamada generalmente condición de Linderberg y su

formulación matemática se puede ver en textos de teoría de la probabilidad (Shiryayev

(1984, pp.326, Loève 1976, pp. 274). En textos de probabilidad moderna, este teorema

es presentado usando la función característica, aunque Linderberg no la usó. En su

demostración, encontró una cota para el )()(sup xxFX , donde )(x es la

distribución de probabilidad normal, en términos del tercer momento. El método de

demostración de Linderberg se olvidó en toda la primera mitad del siglo XX. Trotter en

un artículo publicado en 1959 hizo muy popular el método de Linderberg, pero cuando

el teorema límite comenzó a ser ampliado para espacios de dimensión infinita, la fuerza

del método de Liderberg fue finalmente reconocida. Actualmente, la condición de

Linderberg es usada en muchos casos donde la convergencia a la distribución normal es

considerada con variables distribuidas no idénticamente. La fuerza del método de

Linderberg está basada principalmente en dos puntos:

1. Puede ser aplicado en un contexto muy general.

Page 62: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

55

2. Considera la razón de convergencia en el teorema límite.

Cabe señalar que el método de Linderberg no dio un orden óptimo de la razón de

convergencia, para variables reales independientes e idénticamente distribuida con

tercer momento finito para el orden n (Paulauskas, 1999). Linderberg dio una

demostración rigurosa para la condición suficiente del teorema central del límite, sin

embargo, no probó la condición necesaria del teorema. También, Poisson muestra,

alrededor del año 1824, que la aproximación a la distribución normal no siempre se

cumple para variables independientes arbitrarias. Esta carencia fue particularmente

remediada por Lévy y Feller en 1935 y 1937.

Teorema de Feller

Feller en un artículo publicado en 1935 entrega las condiciones necesarias y

suficientes para el teorema central del límite, pero el resultado es algo limitado. Feller

consideró en la convergencia normal de la suma, una secuencia infinita iX de variables

aleatorias independientes, y usó los segundos momentos finitos para cambiar orígenes y

escala de valores de las sumas consecutivas de la forma )(1

nin

cXa

, a fin de evitar

que tomen valores infinitos. Luego dio las condiciones de restricción para cada variable

nk ax que tiende a cero en probabilidad. Así Feller da, en ese sentido, una solución más

amplia al teorema, pero desde que puso esta restricción y porque sólo trató la suma de

normales, no puede ser considerada la solución final. Este teorema de Feller es

frecuentemente llamado el “Teorema de Linderberg-Feller”, al usar la condición de

Linderberg. La demostración puede verse en Shiryayev (1984, pp. 332) y está basada en

la estimación de las colas de las varianzas en términos del comportamiento de la función

característica en el origen.

Contribución de Lévy

Lévy probó la condición de Linderberg en 1925 usando la función característica

(Cam, 1986), tratando en primer lugar el caso de segundos momentos infinitos y

primeros momentos finitos o infinitos (CP2.3, que Laplace intento argumentar sin

éxito). Publicó algunos artículos relacionados con el teorema central del límite entre los

años 1925 y 1930, usando principalmente la función característica en su demostración.

A partir de 1930, evitó usar la función característica y en su artículo de 1935,

Page 63: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

56

presentado sólo unos pocos meses después del de Feller3, estableció algunas ideas

relacionadas con el teorema central del límite (Cam, 1986):

Dio las condiciones necesarias y suficientes para la convergencia de sumas de

variables aleatorias independientes e idénticamente distribuidas normales a la

distribución normal.

También dio las condiciones necesarias y suficientes para el caso general de sumas

de variables aleatorias independientes.

Por último, intentó dar las condiciones necesarias y suficientes para sumas de

variables aleatorias dependientes, que aparecen en los procesos estocásticos tipo

martingalas. Consideramos este caso el último campo de problemas (CP7) en la

historia del teorema central del límite.

Lévy tuvo algunos problemas con la demostración del teorema central del límite

para el caso de martingalas, que no fue completamente satisfactoria. Su demostración de

la condición necesaria y suficiente para el caso general de variables independientes fue

correcta, pero se basó en un lema hipotético, que no había sido probado todavía (como

la demostración de Feller) y es el siguiente:

“Si la suma S = X + Y de dos variables aleatorias independientes (X e Y)

tiene una distribución normal, entonces también lo son X e Y”

El año siguiente 1936, Cramer probó el lema (como un teorema), por lo que, con

la ayuda de este teorema se muestra la validez del uso de sumas normales y de los

teoremas de Lévy y Feller donde generalmente se aplica. En 1937, Feller y Lévy

refinaron la demostración, después de usar el resultado de Crámer. El teorema central

del límite fue así probado con las condiciones necesarias y suficientes (Cam, 1986) y se

cierra el capítulo final de esta historia.

2.3.7. USO ACTUAL DEL TEOREMA CENTRAL DEL LÍMITE EN ESTADÍSTICA

Desde el punto de vista de las aplicaciones de la teoría de probabilidades, dos

son los principales casos en que se usa el teorema central del límite: i) las variables

3 A pesar que el artículo trató el mismo problema, ambos autores negaron tener algún contacto previo.

Page 64: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

57

aleatorias son independientes e idénticamente distribuidas y ii) las variables aleatorias

son independientes, pero no están idénticamente distribuidas (Parzen, 1987).

Hemos visto que la validez del teorema central del límite en condiciones

bastante generales de las variables aleatorias fue conjetura de Laplace y Gauss a

principios del siglo XIX. Sin embargo, las primeras condiciones satisfactorias de

cumplimiento, apoyadas por una demostración rigurosa no llegan a alcancarse hasta

Lyapounov en 1901. En las décadas de 1920 y 1930 se utilizó el método de funciones

características para extender el teorema en varias direcciones y obtener condiciones

necesarias y suficientes bastante generales de su validez, en el caso en que las variables

aleatorias son independientes.

En años más recientes, continúa el estudio de este teorema, que sigue

inquietando a los matemáticos en su generalización, produciendo trabajos acerca de la

extensión del teorema al caso de variables aleatorias dependientes (Ver Loève, 1976,

para el estudio definitivo del teorema y sus extensiones).

Aplicaciones en inferencia estadística

Es claro que las distribuciones muestrales forman el puente entre la probabilidad

y la inferencia ya que se utilizan para obtener información acerca de la distribución de

un estadístico (Vallecillos, 1996). Un resultado principal según Devore (2001) es el

teorema central del límite, que es la base para muchos procedimientos inferenciales

donde aparecen grandes tamaños de muestra.

En la inferencia estadística uno de los elementos importantes de estudio es la

elección del tamaño adecuado de una muestra aleatoria de una población de interés.

Además, el tamaño muestral es uno de los supuestos básicos en el análisis inferencial.

Cuando la muestra no es lo suficientemente grande y además proviene de una

distribución no-normal, es habitual emplear métodos inferenciales, como los no

paramétricos o métodos exactos para las distribuciones de probabilidades clásicas. En el

caso, en que para un tamaño de muestra suficientemente grande, aplicamos el teorema

central del límite y se asume en una prueba una hipótesis para la media poblacional que

el estimador de la media se distribuye normalmente.

Distintos temas de inferencia estadística, como pueden ser la estimación puntual,

estimación por intervalos y las pruebas de hipótesis, hacen uso del teorema central del

límite y su importancia es destacada en los campos de problemas obtenidos en la

Sección 4.3, de donde surge la necesidad de uso del teorema. A continuación se ilustra

Page 65: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

58

una aplicación típica del teorema central del límite en inferencia, para determinar

valores razonables de la media poblacional; mediante el siguiente ejemplo obtenido de

Walpole y cols. (1999, pp. 218). Sin el formalismo de las pruebas de hipótesis, se

muestra la implicancia del teorema en los principios y la lógica que se utilizan en las

pruebas de hipótesis. Este elemento es importante en la toma de decisión para los

ingenieros.

______________________________________________________________________ Un importante proceso de fabricación produce partes de componentes cilíndricos para la industria automotriz. Es importante que el proceso produzca partes que tengan una media de 5 milímetros. El ingeniero involucrado hace la conjetura de que la media de la población es de 5,0 milímetros. Se lleva a cabo un experimento en el que 100 partes elaboradas por el proceso se seleccionan al azar y se mide el diámetro de cada una de ellas. Se sabe que la desviación estándar de la población es 1,0 . El

experimento indica un diámetro promedio de la muestra 027,5X mm. Esta información de la muestra ¿parece apoyar o refutar la conjetura del ingeniero? _____________________________________________________________________________________

Si los datos apoyan o no la conjetura, depende de la probabilidad de que los

datos similares a los que se obtuvieron en este experimento ( 027,5X ) puedan ocurrir

con facilidad cuando de hecho 0,5 . Es decir, ¿qué tan probable es que se pueda

obtener 027,5X con n =100 si la media de la población es 0,5 ? Si la probabilidad

es bastante baja, se puede argumentar que los datos no apoyan la conjetura de que

0,5 .

En otras palabras, la pregunta concreta es, si 0,5 , ¿Cuál es la probabilidad de

que X se desvíe a lo más en 0,027? En lenguaje simbólico, se pide calcular la

probabilidad siguiente 027,05XP . Como no se conoce la distribución inicial y el

tamaño muestral es grande, se recurre al teorema central del límite estandarizando X . Si

la conjetura 0,5 es cierta, )1,0(~1001,0

5N

X . Así, el cálculo de la probabilidad nos

queda 7,21001,0

52

XP = 007,0)0035,0(27,22 ZP . Como conclusión, con apoyo

del teorema central del límite, es posible señalar que este experimento con 027,5X no

proporciona evidencia que apoye la conjetura de que 0,5 .

Aplicaciones en ingeniería

Son múltiples las investigaciones experimentales en distintas áreas de la

ingeniería que implican el empleo de datos experimentales y muestras aleatorias para

Page 66: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

59

inferir el valor de un parámetro de una población que caracteriza un fenómeno de

interés. Variados ejemplos de aplicación del teorema central del límite en el ámbito de

la ingeniería, son dados en la Sección 1.3.2 de la importancia del teorema en ingeniería

y otras áreas y en la Sección 4.3 referidos a los campos de problemas. Por ejemplo, en

las ciencias forestales las funciones de densidad han sido ampliamente usadas para

modelar la distribución de los diámetros de una superficie en un bosque o rodal. Se han

desarrollado muchas aproximaciones para el desarrollo de dichos modelos, siendo las

distribuciones Normal y de Weibull las más utilizadas (Reinolds y cols., 1988). En esta

área son varias las aplicaciones del teorema central del límite:

1. Una de las más importantes es aquella para el desarrollo de los inventarios

forestales, los cuales consisten en un muestreo de una superficie de un bosque, para

poder determinar estimadores de los totales poblacionales sobre variables de interés

para el manejo del bosque. Estas variables son generalmente estimadores de

volúmenes, las cuales reflejan el valor económico del bosque. Habitualmente en los

inventarios, la unidad muestral está definida como una parcela de una superficie

determinada, en la cual se encuentra un número mínimo de árboles, cantidad que

debe ser lo suficientemente grande para que se cumpla el teorema central del límite

(alrededor de 40).

2. Otra aplicación importante es la referida a los ensayos experimentales instalados

dentro de un bosque debido a que también necesitan un número mínimo de árboles

dentro de cada réplica para que se cumpla el teorema central del límite.

Carrasco (2002) estudió el problema para determinar los tamaños muestrales

mínimos en la aplicación del teorema central del límite, para poblaciones forestales que

poseen distintas características de edad, manejo y condición edafoclimática. En su

trabajo, describió un proceso de simulación seleccionando un rango de combinaciones

de parámetros de la distribución de Weibull, para obtener los tamaños de muestra

mínimo con el objetivo de realizar inferencias adecuadas con el menor número de

muestras posibles a obtener de una población forestal. Los resultados generales de este

estudio revelaron que no es necesario una muestra lo suficientemente grande (mayor de

30) para que se cumpla el teorema. Por lo tanto, el tamaño de muestra dependerá de la

estructura del bosque y su relación con el parámetro de forma c de la distribución de

Weibull. Además, cuando los valores de c son cercanos a 3,6 la distribución de Weibull

Page 67: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

60

es similar en su forma a una distribución normal. Otros resultados son dados también

para el caso de los bosques coetáneos:

a. Cuando el bosque se encuentre recién establecido, el tamaño de muestra necesario

para la correcta aplicación del teorema central del límite, puede ser tan pequeña

como n = 5;

b. Cuando el bosque se encuentre en la fase de cierre de copas el tamaño de muestra

mínimo deberá ser de n =10;

c. Cuando el bosque se encuentre bajo la condición de cosecha, el tamaño de muestra

mínimo deberá ser de n =20;

d. Para los bosques heteroetáneos el tamaño de muestra mínimo necesario para la

aplicación del teorema central del límite deberá ser superior a n = 60, un número

mayor dependerá de la parametrización de la distribución de Weibull.

Aplicando estos resultados al uso de los inventarios forestales, los costos de

estos pueden ser reducidos debido a que las unidades muestrales pueden ser de menor

tamaño. En otro caso, se puede aumentar el número de unidades muestrales lo cual trae

consigo una mejor estimación del total poblacional.

2.3.8. CONCLUSIONES DEL ESTUDIO HISTÓRICO

El presente estudio ha mostrado cómo el teorema central del límite es uno de los

más importantes en estadística matemática y teoría de la probabilidad, a través del

interés mostrado por numerosos matemáticos célebres. La aplicación más conocida del

teorema establece que si se cumplen algunas condiciones, entonces la distribución de la

media aritmética de un número de variables aleatorias independientes se aproxima a la

distribución normal según el número de variables crece indefinidamente. Es decir, no es

necesario conocer la distribución actual de las variables. A medida que crece el número

de variables, la suma de éstas pueden ser tratadas como una distribución normal. En la

Tabla 2.3.8.1 se presenta un resumen cronológico de la evolución del teorema central

del límite.

Page 68: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

61

Tabla 2.3.8.1. Desarrollo histórico del teorema central del límite

Fechas Campo de problema Herramientas Enunciados del teorema y propiedades

1713

1733

CP1: Aproximación de ciertas distribuciones (e.g. binomial) para valores grandes de sus parámetros.

Paso al límite

Predesarrollo

Teorema de Bernoulli (De Moivre)

1785

1809

CP2: Suma de v.a. discretas independientes e idénticamente distribuidas.

CP2.1: v.a. uniforme discreta.

CP2.2: v.a. discretas i.i.d., media y varianza acotadas.

Función característica (Laplace)

Desarrollo en serie

E4: teorema para v.a.i.i.d. discretas, caso uniforme (Laplace)

E4: teorema para v.a.i.i.d. discretas, caso de media y varianza acotadas (Laplace)

Densidad normal (Inicio de teoría de los errores por Gauss y Laplace)

1824

1853

CP3: Suma v.a. discretas independientes no idénticamente distribuidas.

CP4: Suma v.a. continuas.

Variable aleatoria

Factor de discontinuidad de Dirichlet (Bessel)

Función característica y teorema de la función inversa (Cauchy)

E5: teorema en forma general. Caso v.a. i. no i.d. (Poisson)

Caso v.a. continuas i.i.d. con densidad simétrica y rango finito (Cauchy)

1887

1898

1901

1913

Función característica (Liapounov)

Método de los momentos (Markov)

E5: teorema en forma general. Variables aleatorias con rango infinito

Comienzo de la demostración rigurosa (Chebychev)

Condición necesaria para el teorema de Chebyshev (Markov)

Condición de Liapounov (Liapounov, Markov)

1922

1925

1935

1936

1937

CP5: Estimaciones del error de aproximación.

CP6: Condiciones de validez del teorema.

CP7: Suma de variables aleatorias dependientes.

CP2.3: Teorema para v.a. con rango infinito.

Condiciones necesarias y suficientes.

Teorema aplicado al espacio de Hilbert (Linderberg)

Condición de Linderberg (Lindeberg, Lévy)

Teorema para v.a. con rango infinito (Lévy)

Condición necesaria y suficiente del teorema con resultado limitado (Feller)

Lema de Feller (Feller, Cramer)

Refinamiento de demostración (Feller- Lévy)

Se ha seguido de cerca la historia del teorema central del límite, identificando

Page 69: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 2

62

diferentes campos de problemas, que se pueden resumir de la forma siguiente:

CP1: Aproximación de la distribución binomial para valores grandes de n

CP2: Distribución de la suma de variables aleatorias discretas idénticamente

distribuidas

CP2.1: Variables con distribución uniforme discreta

CP2.2: Variables discretas acotadas

CP2.3: Variables discretas no acotadas

CP3: Distribución de la suma de variables aleatorias no idénticamente distribuidas

CP4: Distribución de la suma de variables aleatorias continuas

CP4.1: Variables acotadas

CP4.2: Variables con momentos acotados

CP5: Estimación del error de aproximación en el teorema central del límite

CP6: Búsqueda de condiciones necesarias y suficientes para el teorema central del

límite

CP7: Distribución de la suma de variables aleatorias dependientes.

En la Tabla 2.3.8.1, la primera columna muestra la evolución histórica de los

campos de problemas. Se comienza discutiendo los primeros campos de problemas que

parten de problemas prácticos por ejemplo, la necesidad de Laplace por aproximar la

distribución de la suma de errores y la búsqueda de aproximaciones para la suma de

variables aleatorias. Siguiendo así el razonamiento de Laplace, quién fue el primero en

descubrir el teorema central del límite. Después muchos otros matemáticos

contribuyeron al teorema, tratando de generalizarlo y originando campos de problemas

cada vez más abstractos y ligados al método deductivo, propio de la matemática.

Poisson dio ejemplos de distribuciones que no pueden ser aproximadas por el

teorema central del límite y como estableció una demostración más rigurosa para el caso

continuo. Además, Dirichlet y Bessel probaron eventualmente el teorema de Poisson, y

Cauchy define la primera cota superior para la diferencia entre la distribución de la

suma y la distribución normal. Tras de esta primera etapa, los matemáticos rusos

mostraron la primera demostración rigurosa del teorema. Primero Chebyshev y Markov

con el método de los momentos, después Liapounov propuso la condición de Liapounov

y usó la función característica en su demostración. Luego de los rusos, fue Linderberg

quien dio la palabra final con relación a la condición suficiente de la propuesta de la

Page 70: Significados del Teorema Central del Limite en la Enseñanza de la

Fundamento del estudio

63

condición de Linderberg. No obstante, el caso no fue cerrado, Linderberg no probó la

condición necesaria del teorema. Finalmente Feller y Lévy probaron la condición

necesaria para el teorema que fue rigurosamente mostrada por Cramer, llegándose así a

la forma en la que el teorema central del límite permanece hoy. La condición de

Linderberg ha sido mejorada un poco (Cam, 1986) y el teorema central del límite ha

dado las condiciones necesarias y suficientes para varias variables dependientes, pero

los principios básicos de Linderberg, Lévy y Feller aún son usados.

Se tratará de relacionar estos resultados con la enseñanza actual del tema,

analizando cuáles de los anteriores campos de problemas se presentan en los libros

destinados a la formación de los ingenieros y si se trata de los primitivos campos

ligados a las aplicaciones o, por el contrario, se presentará el teorema de una forma

puramente matemática y descontextualizada. El objeto de interés es ver también si el

orden de introducción es paralelo al desarrollo histórico y si las herramientas utilizadas

en la resolución son nuevas (relativas a las usadas históricamente).

La segunda columna muestra algunas de las herramientas matemáticas

(procedimientos y conceptos previos) empleadas para la demostración del teorema, la

mayor parte de las cuáles no están al alcance de los estudiantes. Es por ello que un

objetivo del diseño de este proceso de estudio será encontrar otras herramientas que

permitan trabajar con el teorema central del límite a nivel de aplicación. Este trabajo no

tendrá el nivel de formalidad que muestra el estudio histórico, pero permitirá a los

estudiantes un grado de comprensión suficiente para las aplicaciones. Para

determinarlas se partirá del estudio de libros de texto, que se describe en el Capítulo 4 y

que mostrará la forma en que diferentes profesores abordan la enseñanza del teorema a

ingenieros.

La última columna de la tabla muestra los resultados de los trabajos en relación

al teorema central del límite, que consisten en sus diferentes enunciados, condiciones de

validez y algunas propiedades relacionadas. Todos ellos serán también cotejados con el

estudio de los libros de texto, para con ello, tomar decisiones sobre el significado

institucional de referencia que servirá de base en el diseño del proceso de estudio.

Page 71: Significados del Teorema Central del Limite en la Enseñanza de la

64

Page 72: Significados del Teorema Central del Limite en la Enseñanza de la

65

CAPÍTULO 3.

INVESTIGACIONES PREVIAS SOBRE EL

TEOREMA CENTRAL DEL LÍMITE

3.1. INTRODUCCIÓN

En este capítulo se describirán las investigaciones relacionadas con la enseñanza

y aprendizaje del teorema central del límite, usadas como marco de referencia para

basar este trabajo. En lo que sigue se examinan y clasifican estos estudios, que han

analizado los elementos importantes del teorema o su uso en inferencia estadística,

centrándose principalmente en la comprensión de la distribución normal y sus

propiedades, de las distribuciones muestrales y del efecto de la enseñanza basada en

ordenador sobre dicha comprensión.

Este trabajo se ubica dentro del campo de investigación en Didáctica de la

Matemática, específicamente en la línea de investigación de didáctica de la probabilidad

y estadística. Los fundamentos para esta investigación han sido proporcionados por las

investigaciones sobre enseñanza de la inferencia estadística de Vallecillos (1994), Behar

(2001), Gallardo (2001), Moreno (2003), Olivo (2006), Olivo y cols. (2006) y

principalmente de Tauber (2001), de la que esta investigación es continuación.

3.2. INVESTIGACIONES SOBRE ENSEÑANZA Y APRENDIZAJE DEL

TEOREMA CENTRAL DEL LÍMITE

3.2.1. COMPRENSIÓN DEL TEOREMA CENTRAL DEL LÍMITE

EL teorema central del límite es uno de los teoremas estadísticos más

importantes, pero son escasas las investigaciones específicas sobre su enseñanza,

aunque muchos autores han publicado sugerencias didácticas para facilitar su

comprensión por ejemplo, usando simulaciones o gráficos (e.g., Stent y McAlevey,

1990; Glencross, 1988).

Page 73: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

66

En relación con la comprensión del teorema central del límite y los diversos

conceptos y procedimientos implícitos en él, Méndez (1991) lleva a cabo una

investigación con expertos y alumnos noveles. Su estudio tiene como propósito extraer

datos fenomenológicos para representar las creencias que los sujetos tienen sobre los

aspectos fundamentales del teorema, clasificar los errores más comunes y observar el

alcance de las creencias de los alumnos reflejadas en la representación experta.

En primer lugar, realiza un análisis de 10 libros de estadística básica e identifica

cuatro propiedades básicas que deben entenderse para poder lograr una comprensión

sólida del teorema, que resume de la siguiente forma:

1. La media de la distribución muestral es igual a la media de la población, e igual a la

media de una muestra cuando el tamaño de la muestra tiende al infinito;

2. La varianza de la distribución muestral es menor que la de la población (cuando

n>1);

3. La forma de la distribución muestral tiende a ser acampanada a medida que se

incrementa el tamaño muestral y es aproximadamente normal, independientemente

de la forma de la distribución en la población;

4. La forma de la distribución muestral crece en altura y decrece en dispersión a

medida que el tamaño muestral crece.

A partir de textos escritos por expertos matemáticos, representó el conjunto de

conocimientos implícito en el teorema central del límite por medio de un mapa

conceptual, utilizando las cuatro propiedades anteriores como base de un modelo mental

de especialistas sobre el teorema. Este modelo lo usó para tener un marco a partir del

cual investigar la comprensión del teorema, definiendo dos niveles de comprensión:

El primer nivel está definido por las habilidades y conocimientos requeridos para

resolver los ejercicios presentados en los libros de texto;

El segundo nivel representa aspectos adicionales de conocimiento que generalmente

no están incluidos en los libros de texto.

Estos dos niveles de comprensión se obtuvieron como resultado del análisis

realizado a las respuestas de dos tests que el investigador entregó a los dos grupos

seleccionados. Cada uno de los tests tenía la finalidad de elicitar razonamientos en

Page 74: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

67

relación con conceptos que requieren diferentes niveles de interpretación. El test I, era

un cuestionario con ítems de elección múltiple, con problemas clásicos extraídos de los

libros de texto analizados previamente. El test II, presentaba 23 situaciones diferentes

que estaban destinadas a explicitar el conocimiento declarativo y procedimental,

diversas representaciones, diversas formas de abstracción y creencias de los

participantes. Como segunda fase de la investigación se realizaron entrevistas clínicas a

un grupo de alumnos que resolvieron los tests.

En el estudio se tomaron tres grupos de sujetos, según si eran principiantes,

(separando los que tenían algún estudio previo de estadística y los que no lo tenían), o si

eran expertos (estudiantes de doctorados en estadística y economía). El objetivo general

de la investigación era observar cómo los sujetos comprenden o no el teorema central

del límite, y en particular observar la comprensión de los cuatro puntos básicos

descritos.

Los estudiantes que estaban realizando estudios de doctorado mostraron

relativamente, una buena comprensión del teorema y de sus elementos implícitos, pero

tal comprensión era excesivamente formal. Carecían de capacidad de expresión intuitiva

y además, sus explicaciones eran correctas superficialmente, pero no mostraban una

comprensión profunda. Generalmente intentaban dar explicaciones a sus respuestas

basándose en los axiomas de probabilidad.

En general, ninguno de los grupos presentó demasiado conocimiento del uso del

vocabulario técnico y además, los estudiantes de doctorado presentaban falta de

conocimiento en la utilización de expresiones cualitativas. No se encontraron

demasiadas diferencias en los otros dos grupos de estudiantes, quienes en su mayoría,

usaban los datos disponibles sin tener en cuenta la población de la que provenían y sin

considerar el tamaño de la muestra.

Tomando como base estas conclusiones, el autor recomienda que en un curso

introductorio de estadística se tenga en cuenta la naturaleza de los materiales de

aprendizaje, los conceptos y los procedimientos que se quieren enseñar. Esta

investigación proporciona tres modelos de estudiantes típicos que debieran tenerse en

cuenta a la hora de diseñar un curso.

Recomienda la utilización de datos para ayudar a los alumnos a observar los

aspectos principales del teorema central del límite, así como la utilización de material

manipulable como por ejemplo, simulación por medio del lanzamiento de dados, para

crear representaciones de los procesos muestrales y de la distribución muestral de la

Page 75: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

68

media. También sugiere el uso del ordenador para realizar simulaciones en las que el

tamaño de muestra sea muy grande. Destaca la importancia de que el profesor sea

consciente de los diversos niveles de comprensión que puedan adquirir sus alumnos.

Aconseja además, que se propicie la comprensión intuitiva antes de conducir a los

alumnos a un pensamiento más formal.

Afirma que los libros de texto generalmente se centran en el uso cuantitativo de

los conceptos, sin considerar los aspectos cualitativos, lo que lleva a los alumnos a

utilizar un lenguaje formal pero sin tener una comprensión profunda del concepto.

3.2.2. COMPRENSIÓN DE LAS DISTRIBUCIONES MUESTRALES

En un curso introductorio de estadística, el estudio de las distribuciones

muestrales se reduce a la distribución de la media, proporción y otros estadísticos, para

el caso asintótico. Es decir, este estudio es generalmente una aplicación directa del

teorema central del límite. En lo que sigue se analizan algunas investigaciones

relacionadas con el tema.

Variabilidad y representatividad muestral

Como indica Moses (1992), la idea central de la inferencia es que una muestra

proporciona "alguna" información sobre la población y de este modo aumenta el

conocimiento sobre la misma. El autor indica que la inferencia estadística es una

colección de métodos para aprender de la experiencia y su comprensión requiere el

equilibrio adecuado entre dos ideas aparentemente antagónicas: la representatividad

muestral y la variabilidad muestral. La representatividad implica que la muestra tendrá

a menudo características similares a las de la población, si ha sido elegida con las

precauciones adecuadas. La variabilidad indica el hecho de que no todas las muestras

son iguales entre sí.

La heurística de la representatividad descrita por Kahneman, Slovic y Tversky

(1982), consiste en tener en cuenta sólo uno de estos dos componentes, calculando la

probabilidad de un suceso sólo sobre la base de la representatividad del mismo respecto

a la población de la que proviene. No se tiene en cuenta el tamaño de la muestra y la

variabilidad del muestreo, produciéndose una confianza indebida en las pequeñas

muestras. Estos autores hablan de la existencia de una "ley de los pequeños números",

consistente en creer que las pequeñas muestras serían representativas en todas sus

características estadísticas de las poblaciones de donde proceden. Este error puede tener

Page 76: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

69

importantes consecuencias de cara a la investigación experimental, ya que los

científicos que creen en la "ley de los pequeños números" sobreestiman la potencia de

sus métodos estadísticos, subestiman la amplitud de sus intervalos de confianza y tienen

unas expectativas injustificadas en la replicabilidad de experimentos realizados con

pequeñas muestras. Esta heurística ha sido comprobada en muy diversos tipos de

estudiantes (Sedlmeier y Gigerenzer, 1997).

Con objeto de estudiar las concepciones de los estudiantes sobre variabilidad y

representatividad muestral Rubin, Bruce y Tenney (1991) entrevistaron a doce

estudiantes del equivalente al último curso de Bachillerato que nunca habían recibido

ningún curso sobre estadística. En la entrevista se preguntaban seis cuestiones abiertas

sobre muestreo e inferencia estadística.

Encontraron que los estudiantes investigados, al construir una distribución

muestral, estaban influenciados por la idea de la representatividad de la muestra. Las

entrevistas evidencian que en la clase de matemáticas se subraya la representatividad

muestral e induce en los estudiantes una concepción en la cual la muestra representativa,

es la única que se obtiene si se muestrea correctamente o al menos en la mayoría de las

ocasiones. Los estudiantes entrevistados subestimaron la frecuencia de valores

muestrales cerca de la cola de la distribución y sobrestimaron la frecuencia de la

muestra modal. En unas situaciones las respuestas estaban guiadas por la

representatividad mientras que en otras el concepto de variabilidad muestral era más

fuerte. El tamaño de la muestra no parece operar apropiadamente para separar las dos

ideas. En definitiva, los estudiantes tenían modelos inconsistentes de la relación entre

muestras y población, incluso en problemas simples sobre distribuciones binomiales.

Niveles de razonamiento sobre inferencia

Moreno y Vallecillos (2001) y Moreno (2003) analizan la comprensión de la

idea de muestra en estudiantes de secundaria, describiendo un modelo de niveles de

comprensión, basado en la taxonomía SOLO, extendiendo y completando el trabajo de

Watson y Moritz (2000) sobre muestreo. Definen cuatro niveles de razonamiento en

relación a la inferencia, diferenciando en cada nivel el uso de los conceptos de

población y muestra, proceso inferencial, tamaño de la muestra y tipos de muestreo. Un

resumen del esquema de razonamiento en inferencia estadística (Vallecillos y Moreno,

2002) se presenta a continuación en la Tabla 3.2.2.1:

Page 77: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

70

Tabla 3.2.2.1. Esquema de Razonamiento en Inferencia Estadística (ERIE)

Constructos N1: Idiosincrásico N2: De transición N3: Cuantitativo N4: Analítico Población y muestra

(PM)

Conceptos de población y muestra usuales. No identifica la población y ni la muestra. Confunde población y muestra

Concepto de población estadística Población se identifica de tipo discreta Identifica población o muestra en contexto concreto

Concepto de población estadística Población de tipo discreta/continua Identifica población y muestra sólo en ciertos contextos

Concepto de población estadística Concepto de espacio muestral Identifica completamente población y muestra y su relación

Proceso de inferencia

(PI)

Criterio subjetivo Concepción previa

Criterio subjetivo y/o numérico con errores. Concepción determinista

Criterio numérico informal. Concepción identidad

Criterio numérico y expresión formal Concepción correcta

Tamaño de la muestra

(TAM)

No reconoce características de variabilidad muestral Indiferencia ante el tamaño de la muestra

Importancia de la variabilidad muestral Interés en el tamaño muestral en algunos contextos

Reconoce la influencia del tamaño de la muestra en la estimación Relaciona el tamaño de la muestra con la estimación en contextos numéricos

Valora la sensibilidad del tamaño de la muestra Relaciona el tamaño de la muestra con la estimación en todos los contextos

Tipos de muestreo

(TIM)

Concepto de muestreo No encuentra diferencias entre los tipos de muestreo aleatorios No reconoce las fuentes de sesgo

Métodos de muestreo aleatorios Diferentes tipos de muestreo Indican posibilidad de sesgos

Tipos de muestreo aleatorio Diferentes tipos de muestreo aleatorio Reconoce posibilidad de sesgos

Métodos de muestreo y estimación Reconoce distintos métodos adecuados Valoran sensibilidad en el sesgo

En este marco, para caracterizar y evaluar el razonamiento en inferencia

estadística elemental definen un primer nivel preestructural llamado idiosincrásico, en

el cual el pensamiento estadístico inferencial del aprendiz se centra en aspectos

irrelevantes al identificar y relacionar la población con la muestra estudiada, realizar

una inferencia estadística, identificar los sesgos introducidos por determinados procesos

de muestreo o valorar la importancia del tamaño de la muestra. El estudiante emplea el

modo de representación icónico mostrando un pensamiento intuitivo.

El segundo nivel de transición se caracteriza porque el alumno aborda la tarea

centrándose en sólo un aspecto relevante de ella. Las respuestas se sitúan en el modo de

representación icónico y el simbólico concreto y se espera que la respuesta del alumno

incluya algún principio estadístico que utilizará para formular su conclusión. El

estudiante empleará alguna característica estadística para identificar la población y la

muestra estudiada, realizar una inferencia estadística, justificar la influencia del tamaño

de la muestra, identificar distintos tipos de muestreo y reconocer sesgos en los

diferentes muestreos.

Page 78: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

71

A este nivel uniestructural, sigue el nivel cuantitativo donde los alumnos

exhibirán las características del nivel multiestructural, empleando en la tarea

generalmente el modo simbólico concreto y para centrase en varios de sus aspectos

relevantes. Esto no significa que integren los diferentes aspectos empleados para la

resolución de la tarea.

Por último, en el cuarto nivel denominado analítico, las respuestas de los

alumnos manifestarán las características del nivel relacional y funcionarían

consistentemente en el modo simbólico concreto. Es decir, se esperarían respuestas que

integren distintas partes o distintos aspectos entre sí de manera que el conjunto tenga

una estructura coherente y con significado. La respuesta del alumno en este nivel

sugerirá que identifica adecuadamente la población y la muestra objeto de estudio,

justificará y reconocerá la influencia del tamaño de la muestra al realizar una inferencia

estadística, diferenciará muestreos aleatorios de los no aleatorios y reconocerá los

sesgos introducidos por estos.

En esta investigación, cuya población objetivo serán estudiantes universitarios

con base de cálculo diferencial y cálculo de probabilidades, se considerarán los

constructos de población / muestra y tamaño de la muestra en las distribuciones

muestrales estando los estudiantes situados en los niveles de transición, cuantitativo y

principalmente analítico. Así se ampliará el estudio de la inferencia estadística; donde la

variabilidad de la suma o promedio de variables aleatorias se describe por la dispersión

de su distribución de muestreo y estando determinada no tan solo por el tamaño de la

muestra, sino además por la población de origen y la sensibilidad de sus parámetros.

Previo a la formalización del teorema, se utilizará la simulación para explorar la

variabilidad de muestras estadísticas de una distribución de probabilidades. Se

entenderá la población como un número finito de posibles resultados para alguna

característica medible de interés y la población de estudio al conjunto de todos los entes

a los cuales se pueden aplicar las conclusiones obtenidas de la estimación. Los

instrumentos de evaluación que se aplicarán, permitirán caracterizar las dificultades que

podrían establecerse acerca de parámetro y estadístico, valorar la naturaleza de la

población, las habilidades previas de cuantificar la incertidumbre en las variables

aleatorias y el estudio aproximado de las distribuciones muestrales de estadísticos

clásicos.

Page 79: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

72

Comprensión del efecto del tamaño de la muestra sobre la variabilidad de la

distribución muestral

Well, Pollatsek y Boyce (1990) realizaron una investigación con estudiantes de

psicología sobre la comprensión de las distribuciones de la media en el muestreo, cuyo

fin era identificar las razones que conducen a utilizar la heurística de la

representatividad y los diversos juicios que realizan los sujetos al justificar sus

respuestas. Puesto que la distribución de la media es asintóticamente normal, la

comprensión de las distribuciones en el muestreo está también relacionada con la de la

distribución normal; elementos importantes en la comprensión del teorema central del

límite.

Dicha investigación estuvo compuesta de varios experimentos en los que

recogieron datos con cuestionarios, recibiendo instrucción sólo en el tercero. En el

primero se comparó el rendimiento de un mismo grupo de sujetos en relación con dos

versiones de enunciados de problemas, cada una de las cuales presentaba dos variantes:

una relacionada con el grado de exactitud con el que la población es representada por la

distribución de las medias muestrales y la otra, en la que se debía realizar una

estimación del porcentaje de que un determinado valor promedio sea mayor que X (X es

un determinado valor para cada problema), es decir, en este caso se utilizaba la cola

superior de la distribución muestral que es una distribución normal.

En el segundo experimento se presentó a los sujetos un mismo enunciado con

tres versiones relacionadas con la estimación de porcentajes en una sola cola de la

distribución muestral, en las dos colas y en el intervalo central. Además de seleccionar

la respuesta correcta como en los dos experimentos anteriores, se pidió a los sujetos que

expresaran las razones de su elección. La construcción de estos problemas se basó en las

respuestas dadas por los alumnos en el primer experimento. Los resultados obtenidos

para la estimación de porcentajes en el centro de la distribución fue mucho mejor que

para las otras versiones, lo cual condujo a los investigadores a intentar obtener más

información al respecto. En consecuencia, quitaron la versión relacionada con la

exactitud y agregaron una versión relacionada con la estimación de porcentajes en

ambas colas de la distribución (tercer experimento).

En el último experimento se adoptó una estrategia distinta, dándoles a los sujetos

una breve instrucción sobre el concepto de distribuciones muestrales y pidiéndoles

luego que explicaran sus razonamientos. Se pasó un pretest, en el que se le entregaba al

sujeto una hoja con el enunciado de uno de los problemas. Una vez que el sujeto lo

Page 80: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

73

resolvía, el entrevistador hacía una breve explicación en relación con la diferencia entre

distribución muestral y poblacional, por último, el sujeto podía experimentar con el

ordenador para luego expresar sus conclusiones. Los sujetos implicados fueron 114

estudiantes en el primer experimento, 151 estudiantes en el segundo, 120 estudiantes en

el tercero y 27 sujetos del departamento de Psicología en el último.

Se concluye que los sujetos utilizan información del tamaño muestral en forma

más apropiada cuando se les pregunta sobre la exactitud de las medias muestrales o

sobre la región central de la distribución muestral que cuando se les pide información

sobre las colas de las distribuciones muestrales. Esto sugiere que la variable más

importante que influye en el éxito de la tarea es la similitud entre la media muestral y

poblacional. En general, los sujetos parecen comprender que los promedios de muestras

más grandes se acercan más a la media de la población, pero no comprenden las

implicaciones de esto sobre la variabilidad de la media muestral. Esto sigue

aconteciendo aún después de haberlos instruidos al respecto e incluso después de que

los mismos sujetos han podido experimentar realizando simulaciones con ordenador.

Comprensión intuitiva del concepto de distribución muestral

Con un enfoque diferente Saldanha y Thompson (2002) y Saldanha (2004)

analizan las concepciones espontáneas de los estudiantes de secundaria sobre las

distribuciones muestrales. Para ello se basan en experimentos realizados con el software

probability simulator, que simula la extracción de secuencias de bolas de colores

(blancas y negras).

Los investigadores piden en primer lugar, que los estudiantes extraigan muestras

de 10 bolas de una población (la proporción de bolas blancas y negras es desconocida) y

observen la variabilidad de la proporción en las diferentes muestras (por ejemplo,

extrayendo 5 ó 10 muestras). Al comienzo del experimento la proporción de bolas

blancas y negras en la población desconocida es ½; pero, debido a la fluctuación del

muestreo, la proporción en la muestra puede variar. Los investigadores analizan si los

estudiantes consideran o no inusual (raro) ciertos valores de la proporción muestral,

bajo la hipótesis de equiprobabilidad en la composición de la población.

Posteriores experimentos tienen como fin que el alumno pase de considerar la

proporción en una sola muestra, a considerar la proporción como variable aleatoria en

las muestras y luego, el conjunto de proporciones muestrales como una distribución

muestral. Se analizan las concepciones de los estudiantes y se observa como construyen

Page 81: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

74

la idea de distribución muestral y conciben una distribución hipotética (como debieran

ser estas distribuciones muestrales) en caso de equiprobabilidad. La última fase es tratar

de hacer una inferencia sobre la composición de una nueva población, cuando se obtiene

una distribución muestral empírica y no se conoce la composición de la población.

Aunque muchos alumnos llegan a concebir que hay por ejemplo, “mayoría de blancas”

si la distribución muestral es muy sesgada hacia las blancas, en algunos casos se

observa una concepción multiplicativa que impide a los estudiantes razonar desde la

distribución muestral al parámetro en la población.

Diversos niveles de concreción de un concepto en el estudio de la inferencia

Un problema relacionado con la comprensión de la idea de distribución y en

general de la inferencia, son según Schuyten (1991), los diversos niveles de concreción

de un mismo concepto que se necesitan usar cuando se introduce el estudio de la

inferencia estadística. Esta investigadora obtiene sus conclusiones a partir de su

experiencia docente en cursos introductorios de estadística en psicología y educación,

más que en una investigación planeada.

El alumno, en estadística descriptiva usa como unidad de análisis el sujeto (un

elemento de la población). La media X se refiere a una muestra de tales elementos y es

un valor numérico constante, puesto que no se quiere extender los resultados más allá de

dicha muestra.

En inferencia, se introduce la media teórica o esperanza matemática de la

población concreta, y la media X de la muestra particular con la que se está trabajando,

ya no se considera un único valor sino una variable aleatoria, un caso particular de otra

población: la población de todas las posibles medias de todas las posibles muestras de

tamaño dado que podríamos extraer de la población de interés. Por ello se considera la

media de la muestra como un estadístico y la media de la población como un

parámetro.

Al considerar la población de todas las medias, se cambia también la unidad de

análisis, que ya no es el sujeto sino la muestra de tamaño dado. Se estudia la

distribución muestral de todas estas medias, distribución que a su vez tiene una media o

esperanza matemática: )(XE . Para el alumno diferenciar entre estos tres niveles de

medias y las dos unidades de análisis supone una gran dificultad conceptual.

En su investigación Schuyten (1991) encuentra también la dificultad del uso de

Page 82: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

75

un lenguaje formal, que no todos los estudiantes son capaces de comprender,

constituyendo las fórmulas, en algunas oportunidades, un obstáculo insalvable para la

comprensión de los conceptos estadísticos.

Los estudiantes no diferencian, en ocasiones, el conocimiento declarativo de un

concepto del conocimiento procedimental, por lo que no comprenden que haya diversas

fórmulas o procedimientos de cálculo para algunos estadísticos, como es el caso de la

mediana. El uso de las tablas estadísticas, como las tablas de la distribución normal es

también complicado, y en esta investigación alrededor de la cuarta parte de los

estudiantes mostraron dificultades en su manejo. Los estudiantes no llegan a concebir la

tabla como una función que puede ser usada en dos sentidos; directo para obtener una

probabilidad dado un número e inverso o para obtener un número dada la probabilidad.

El papel de las distribuciones muestrales en el contraste de hipótesis

Han sido varios los autores que han tratado de analizar los errores en la

comprensión del contraste estadístico de hipótesis y se han centrado preferentemente en

las dificultades sobre la interpretación del nivel de significación. Estos trabajos que se

describen en Vallecillos (1994, 1996, 1998, 1999), Batanero (2000, 2006), Behar (2001)

y Thomson, Saldaña y Liu (2004) han dado razones de tipo psicológico para la

explicación de tales errores. También García (2002, 2007) y Díaz y de la Fuente (2004).

Utilizando el marco teórico sobre el significado de los objetos matemáticos

(Godino y Batanero, 1994), la investigación de Vallecillos (1994) realiza un estudio

epistemológico y matemático del contraste de hipótesis, relacionándolo con la

problemática de la inducción en las ciencias empíricas y analizando hasta qué punto la

inferencia estadística proporciona una solución a esta problemática. De este análisis

teórico determina una serie de elementos de significado sobre el contraste estadístico de

hipótesis, mostrando la complejidad conceptual del tema y la multitud de conceptos que

el alumno debe integrar para lograr una comprensión completa del mismo. Uno de estos

elementos es el de distribución muestral del estadístico.

Para realizar el estudio se confecciona un cuestionario de evaluación del

significado personal construido por estudiantes del curso introductorio de estadística al

finalizar el mismo. Después de varias muestras piloto se pasó el cuestionario a una

muestra de 436 estudiantes universitarios de la Universidad de Granada en diversas

especialidades. El cuestionario contiene ítems de opciones múltiples, ítems en los cuales

el alumno debe justificar una respuesta, y problemas abiertos. El análisis cualitativo y

Page 83: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

76

cuantitativo de las respuestas, incluyendo métodos multivariantes, como análisis

factorial y análisis clúster, permitió determinar diferentes componentes en el significado

que los alumnos atribuyen al contraste de hipótesis.

El trabajo se complementa con entrevistas clínicas a un grupo reducido de

alumnos. Como consecuencia, se describen concepciones erróneas respecto al nivel de

significación, hipótesis y la lógica global del proceso (Vallecillos, 1995). También se

estudian las relaciones entre el conocimiento conceptual y el conocimiento

procedimental de los estudiantes. Los errores detectados aparecen en todas las muestras

de estudiantes, incluidos alumnos que cursan la licenciatura de matemáticas.

Uno de los factores determinados por Vallecillos se refiere a las relaciones entre

el parámetro y el estadístico de contraste. Sobre este factor se observa la falta de

comprensión de la variabilidad del estadístico en el muestreo y la confusión entre

estadístico y parámetro. Así mismo se observa una falta de comprensión del papel que

juega la distribución del estadístico en la determinación del nivel de significación y las

regiones críticas y de aceptación.

En conclusión, observa las siguientes dificultades de comprensión en las

distribuciones muestrales que se conectan con el tema de la distribución normal y por

ende del teorema central del límite:

Dificultad de comprensión del efecto del tamaño de la muestra sobre la variabilidad

de las distribuciones asintóticas en el muestreo;

Confusión entre estadístico y parámetro, lo que sugiere que los alumnos tienen

dificultad en diferenciar entre los datos empíricos y el modelo que se usa para

describirlos.

3.2.3. DISEÑO DE ENSEÑANZA DEL TEOREMA CENTRAL DEL LÍMITE CON RECURSO

DIDÁCTICO DEL ORDENADOR

En la investigación de Lipson (1997), se trabajan las distribuciones muestrales

con dos grupos de alumnos, uno de los cuales usa el programa Minitab y el otro un

paquete diseñado por Rubin, llamado Sampling Laboratory.

Los estudiantes que participaron en esta investigación provenían de distintos

cursos y algunos ya habían realizado cursos previos de estadística. La experiencia se

llevó a cabo en tres sesiones de una hora. En la primera clase, de tipo tradicional, se

introdujo las distribuciones en el muestreo, a partir de un ejercicio de muestreo

Page 84: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

77

utilizando una caja con bolas blancas y rojas, obteniendo luego el histograma

correspondiente. Luego, se dividió en forma aleatoria a los alumnos en los dos grupos

que usarían cada programa. En las dos clases siguientes los alumnos debían realizar

simulaciones con el ordenador para analizar distribuciones muestrales de diferentes

tamaños de muestra y luego debían responder a determinadas cuestiones.

Al finalizar la clase introductoria, el investigador pidió a los estudiantes que

realizaran un mapa conceptual basado en los siguientes términos: medidas de posición

central, constante, distribución, estimación, distribución normal, población, parámetro

poblacional, proporción de la población, muestra, distribución muestral, proporción

muestral, estadístico muestral, variabilidad muestral, forma, dispersión y variable.

Podían utilizar estos términos o agregar o quitar los que les parecieran. Al finalizar las

sesiones con el ordenador se les pidió que revisaran sus mapas y si los consideraban

pertinentes que los modificaran.

Para realizar el análisis de los mapas se clasificaron diversas proposiciones

identificadas por expertos en el área, y luego se compararon las proposiciones

observadas en ambos mapas conceptuales de tal manera que esto permitía observar si

había habido evolución en el aprendizaje después del trabajo con el ordenador. No se

encontraron grandes diferencias entre los estudiantes que habían trabajado con distintos

programas, aunque los resultados mostraron que las actividades de simulación con el

ordenador estaban asociadas con un desarrollo en la comprensión de muchos

estudiantes. El análisis de los mapas conceptuales permitió al investigador observar que

cada alumno construía un mapa conceptual exclusivo lo cual coincide con la teoría de

que la comprensión es construida por el estudiante sobre la base de su propia estructura

cognitiva, y no sólo con lo que haya recibido del profesor.

En delMas, Garfield, y Chance (1998) y Chance, Garfield y delMas (1999) se

analiza el efecto de la simulación por ordenador en el desarrollo de la comprensión de

las distribuciones muestrales. En la primera de estas investigaciones se plantea un

modelo de evaluación basado en diversas teorías de procesamiento de información,

teorías pedagógicas y diversas investigaciones relacionadas con el razonamiento

estadístico. Dicho marco o modelo de evaluación / instrucción consta de los siguientes

componentes:

Page 85: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

78

Un pretest que evalúa el conocimiento previo requerido y las intuiciones que pueden

afectar las interacciones de los estudiantes con la actividad planteada. Los resultados

del pretest son usados como la base de discusiones con los estudiantes para clarificar

concepciones erróneas que pueden interferir con el aprendizaje de la actividad;

Un listado de objetivos de evaluación final que especifican el aprendizaje deseado y

son usados para desarrollar la actividad de aprendizaje;

Ítems de autoevaluación involucrados en las actividades de aprendizaje, mediante

los que los estudiantes realizan y evalúan sus predicciones, para promover cambios

conceptuales;

Un postest de resultados deseados que evalúan los tipos correctos de razonamiento

conceptual o los errores;

Un postest que consta de ítems que podrían ser incluidos en un examen final del

curso para evaluar la retención a largo plazo.

Los autores han realizado una investigación en la que trabajan con el

micromundo Sampling distributions, diseñado específicamente para trabajar las

distribuciones muestrales y una actividad basada en el modelo descrito, con el fin de

evaluar la efectividad de las actividades planteadas por los investigadores. Las

cuestiones básicas de esta investigación son: Identificar los problemas de aprendizaje,

diseñar una técnica instruccional para mejorarlas, determinar si es o no efectiva y

extraer consecuencias para continuar la investigación.

La experiencia se llevó a cabo en tres fases o versiones, en cada una de las

cuales se iban modificando las actividades o el software para tratar de mejorar la

comprensión de los estudiantes sobre las distribuciones muestrales. En la primera

versión se instruyó a los estudiantes sobre cómo crear una distribución muestral por

medio del programa, de esta manera realizaron varias simulaciones para distintos

tamaños de muestras y luego se les pidió estudiar las siguientes cuestiones:

Relación entre tamaño muestral y dispersión de la distribución muestral;

Determinar a partir de qué tamaño muestral los estadísticos de la distribución

comienzan a estabilizarse;

Analizar si los estadísticos obtenidos son buenos estimadores de los parámetros de

la población;

Page 86: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

79

Estudiar si el comportamiento de los estadísticos de la distribución muestral,

concuerda con lo previsto por el teorema central del límite.

Estas actividades son realizadas con poblaciones normales u otras con diversas

formas, como U, asimétrica o uniforme. Las preguntas y actividades están organizadas

de tal forma que dirijan la atención de los estudiantes hacia diversos puntos del teorema

central del límite y que permitan evaluar sus hipótesis acerca del comportamiento de las

distribuciones muestrales. Esta primera versión se administró a 79 estudiantes de un

curso introductorio de estadística en una universidad privada y 22 estudiantes que

habían tomado un curso previo de estadística básica.

Los instrumentos utilizados en esta primera versión fueron un pretest al iniciar la

actividad con el ordenador y un post test al finalizarla. Cada test constaba de cinco

problemas, en cada uno de los cuales se presentaba el gráfico de una distribución

correspondiente a una población y cinco histogramas adicionales que representaban

posibles distribuciones de medias muestrales para muestras aleatorias de una población

particular. Estas cinco distribuciones muestrales representaban una distribución normal,

una distribución asimétrica positiva y otra negativa, una distribución simétrica bimodal

o trimodal y dos distribuciones irregulares. Los estudiantes debían seleccionar en cada

problema cuál era el histograma que representaba a la distribución muestral

correspondiente a la población, además de responder a otras preguntas. Los histogramas

de las posibles distribuciones muestrales fueron diseñados de tal manera que los

estudiantes pudieran mostrar diversos tipos de razonamientos correctos o erróneos. Las

cuestiones realizadas en la actividad se obtuvieron de la fase piloto de la investigación.

Los resultados de la primera versión mostraron un cambio positivo del pretest al

post test, pero un número significativo de alumnos parecía no comprender las

implicaciones básicas del teorema central del límite. En consecuencia, los

investigadores decidieron mejorar el software y realizar una segunda experiencia, en la

que los estudiantes realizaron sus propias predicciones y las evaluaron usando el

programa. De esta forma el pretest de la primera versión formó parte de la actividad con

el ordenador. En la nueva actividad se hizo más énfasis en las comparaciones de la

forma y la dispersión que en los parámetros y estadísticos, requiriendo que los

estudiantes realizaran una comparación directa de sus predicciones en el pretest con las

distribuciones muestrales producidas por medio del programa.

Page 87: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

80

En esta segunda versión participaron 149 estudiantes, 32 de los cuales asistían a

una universidad privada, 94 habían tomado un curso introductorio de estadística y 13

habían tomado un curso en la Escuela de Educación. 141 dieron respuestas a todos los

ítems del prestest y postest. Los investigadores concluyeron que había evidencia de

diferentes tipos de razonamiento, en las respuestas de los alumnos clasificándolos de la

siguiente forma:

“Razonamiento correcto”: cuando los estudiantes eligen los dos histogramas

correctos para el problema planteado;

“Buen razonamiento”: cuando los estudiantes eligen para el mayor tamaño de

muestra un histograma que se asemeja a la distribución normal y con menor

variabilidad que el histograma elegido para el menor tamaño de muestra;

“Razonamiento de mayor a menor”: cuando los estudiantes eligen un histograma

con menos variabilidad para el mayor tamaño de muestra o un histograma con una

variabilidad similar a la de la población, o ambos histogramas tienen la forma de la

población;

“Razonamiento de menor a mayor”: cuando los estudiantes eligen un histograma de

variabilidad menor para el mayor tamaño muestral, es decir, cuando esperan que la

distribución muestral más semejante a la población es la que tiene un menor tamaño

muestral.

En una tercera versión del software se incluía un programa que permitiera

visualizar la distribución y los estadísticos para cada muestra. Se modificó la actividad

para potenciar este nuevo elemento del programa, de tal manera que la actividad de la

segunda versión requería aproximadamente de una hora para su resolución y en la

tercera versión se necesitaban dos horas.

La tercera versión fue administrada en un estudio piloto como parte del curso

introductorio de estadística en la Universidad del Pacífico, a 31 estudiantes y en la

Universidad de Minnessota a 24 estudiantes. En este caso, en el pretest se incluyeron

cuestiones relacionadas con los conceptos que los investigadores consideraban como

prerrequisitos para comprender las distribuciones muestrales tales como, lectura de

gráficos, medidas de posición, variabilidad e identificación de formas comunes de

distribuciones.

Page 88: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

81

Como conclusiones generales, los autores destacan que la presentación de

información en grandes cantidades no siempre conduce a una buena comprensión de las

distribuciones muestrales, y que se debe confrontar a los estudiantes con sus

concepciones erróneas para promover un mejor aprendizaje. Concluyen además que los

estudiantes aprenden mejor cuando las actividades están estructuradas de tal manera que

los ayude a evaluar la diferencia entre sus propias creencias sobre el azar y los

resultados empíricos. Todas estas conclusiones las han publicado en los trabajos citados

y otros posteriores (Chance, delMas y Garfield, 2004; delMas, Garfield y Chance, 2004,

Garfield, delMas y Chance, 2004).

En resumen, los investigadores que han diseñado cursos para estudiar el efecto

de la enseñanza basada en ordenador de las distribuciones muestrales han concluido

que:

a. No hay grandes diferencias en el aprendizaje de los alumnos que han usado

diferentes programas. Esta conclusión permite usar en el trabajo futuro de

intervención en el aula el paquete estadístico @RISK, que está a disposición de los

alumnos en el laboratorio de informática de la UCSC;

b. La simulación, en general, mejoró la comprensión de los estudiantes. Este resultado

sugiere que es interesante usar la simulación como uno de los recursos didácticos

dentro del curso futuro de intervención;

c. Sin embargo, el ordenador añade nueva información en el aprendizaje y esto

requiere un costo y esfuerzo añadido por parte de los estudiantes. Será necesario en

consecuencia, evaluar el trabajo de los alumnos, tanto con métodos convencionales

(cuestionarios) como con una prueba de ensayo en la que deben mostrar su

capacidad de uso del ordenador.

3.2.4. COMPRENSIÓN DE LA DISTRIBUCIÓN NORMAL

En la revisión de investigaciones, existen muy pocas centradas en el estudio

específico de la distribución normal. Una excepción es la investigación de Tauber

(2001), quien aborda el estudio de la distribución normal desde una perspectiva

didáctica, basado principalmente en un modelo propuesto por Godino (1999a), que

presenta tres dimensiones: epistemológica, semiótica-cognitiva e instruccional, cada una

de las cuales se apoyan respectivamente en la teoría de los significados institucionales y

Page 89: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

82

personales de los objetos matemáticos (Godino y Batanero, 1994, 1998a), teoría de las

funciones semióticas (Godino, 1998) y teoría de las trayectorias didácticas (Godino,

1999b).

Este trabajo constituye uno de los antecedentes básicos de la investigación, en el

sentido de que el teorema central del límite explica el uso generalizado de la

distribución normal, comparte el mismo marco teórico y se interesa también por la

comprensión de los alumnos universitarios sobre una de las proposiciones básicas en

inferencia estadística (Los resultados han sido publicados en Batanero, Tauber y Meyer,

1999; Batanero, Tauber y Sánchez, 2001 y 2004 y Tauber, Batanero y Sánchez, 2005).

Las investigaciones del tema, según Tauber (2001), sugieren que son muchos los

elementos del significado de la distribución normal que no han recibido todavía

atención por parte de los investigadores y que se requiere un estudio sistemático de la

problemática específica de la distribución normal tanto desde el punto de vista

epistémico (análisis del concepto y su presentación en textos y en secuencias de

enseñanza) como cognitivo (comprensión de los estudiantes, dificultades y errores).

El trabajo de Tauber (2001) es novedoso al abordar un estudio sistemático de la

distribución normal, desde el punto de vista de la enseñanza y del aprendizaje. A

continuación, se señalan las aportaciones del estudio:

1. Respecto a la enseñanza, una primera aportación es la descripción del significado

institucional del tema en los libros de texto universitarios, sobre todo en un

momento en que la incorporación del ordenador hace necesario plantear una

revisión de los textos. El análisis puede servir de base para la construcción de

secuencias de enseñanza o instrumentos de evaluación.

2. En segundo lugar, la autora diseñó una secuencia de enseñanza basada en el uso de

ordenadores, no limitándose a seleccionar los elementos del significado institucional

de referencia, sino también formulando problemas más realistas, incorporando los

recursos gráficos y de cálculo que posibilita el ordenador y entremezclando

actividades tradicionales, tales como exposición del profesor o resolución de

problemas con papel y lápiz con otras basadas exclusivamente en el uso del

ordenador. Esta secuencia de enseñanza puede ser útil para los profesores de los

cursos universitarios de estadística y ser la base para el diseño de otras secuencias

sobre contenidos estadísticos diferentes.

Page 90: Significados del Teorema Central del Limite en la Enseñanza de la

Investigaciones previas

83

3. El análisis de la diferencia entre la secuencia diseñada y el significado institucional

de referencia, así como el análisis de la secuencia de enseñanza tal como fue

observada, proporciona también una información valiosa a los profesores, al

permitirles prever las dificultades y posibilidades inducidas por la decisión de

incorporar un ordenador en sus clases, así como al proporcionarles información

sobre formas plausibles de trabajo con este recurso didáctico.

4. Se describen dificultades y errores en un tema en que la investigación previa es

prácticamente inexistente. Asimismo, se describen las diferencias en la evaluación

de dos tipos de alumnos: aquellos que tienen conocimientos previos de estadística,

adquiridos en la educación secundaria o en cursos anteriores a la universidad y los

que no los tienen. Esto es también importante al implementar objetivos realistas de

aprendizaje para los dos tipos de alumnos.

3.3 CONCLUSIONES DEL ESTUDIO DE LAS INVESTIGACIONES PREVIAS

En este capítulo se han descrito y clasificado las investigaciones relacionadas

con la enseñanza del teorema central del límite y sus consecuencias, para elaborar el

marco de referencia en el cual basar este trabajo. Se destacan para finalizar algunos

puntos que tendremos presentes en el mismo.

Primero, las investigaciones previas han sido realizadas en un curso

introductorio de estadística con estudiantes de psicología, economía y matemática,

generalmente con estudiantes que no han tenido un curso previo de estadística en la

universidad. En este contexto, se analizarán los errores en la comprensión del teorema

central del límite en una asignatura de carácter mínimo, con estudiantes de ingeniería

que tienen base sólida en matemática y de probabilidades.

Segundo, son escasas las investigaciones específicas sobre la enseñanza del

teorema central del límite. Además, en las existentes, se ha analizado la comprensión

de los alumnos tan sólo en elementos muy aislados del teorema, en particular, las

dificultades de comprensión del efecto del tamaño muestral y la confusión entre los

conceptos media muestral y población v/s parámetro y estadístico.

Por otro lado, Tauber (2001) en su estudio sobre la distribución normal, señala

algunas limitaciones del mismo que apoyan la necesidad de la investigación que ahora

se presentan:

Page 91: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 3

84

a. El estudio de Tauber se hizo en una asignatura de libre configuración, en la cual los

alumnos participantes tienen unas actitudes positivas hacia la materia, reforzadas

por la novedad que para ellos supone el uso de la tecnología, que saben importante

para su formación;

b. No se ha avanzado en el uso de la distribución normal para la inferencia, por

ejemplo en el trabajo con distribuciones muestrales o en contraste de hipótesis que

es un tema abierto y que se intentará analizar en este trabajo.

En sus conclusiones Tauber realiza las siguientes sugerencias sobre futuras

investigaciones, que se tratarán de seguir en este trabajo:

a. Estudio de la comprensión de la distribución normal dentro de la inferencia. Tauber

solamente trabajó con dos de los campos de problemas definidos en el significado

de referencia y no tuvo en cuenta los campos de problema específicos del teorema

central del límite. En consecuencia, se continuará su trabajo estudiando el

significado del teorema central del límite en campos de problemas asociados con las

distribuciones muestrales, incluyendo su aplicación a la construcción de intervalos

de confianza y determinación del tamaño de la muestra.

b. Analizar el proceso de aprendizaje y el significado personal individual en relación

al teorema central del límite. La evaluación llevada a cabo por Tauber se ha

efectuado a partir del análisis de las respuestas escritas de los alumnos a tareas

realizadas en clase y en las evaluaciones finales con un cuestionario y una prueba de

ensayo. Se pretende en este trabajo seguir la metodología de Tauber centrándonos

en el teorema central del límite para complementar la información obtenida por la

autora.

En resumen, la revisión de estas investigaciones permitirá abordar el estudio del

aprendizaje del teorema central del límite en un proceso específico de estudio, desde un

punto global y didáctico. Se compararán los resultados obtenidos con los de las

investigaciones descritas y se señalarán las dificultades específicas en la comprensión

del teorema. Finalmente se llevará a cabo un análisis de la idoneidad del proceso de

estudio implementado.

Page 92: Significados del Teorema Central del Limite en la Enseñanza de la

85

CAPÍTULO 4.

SIGNIFICADO INSTITUCIONAL DE REFERENCIA

4.1. INTRODUCCIÓN

Una vez introducidos los fundamentos del trabajo, se pasará a la primera etapa

de la parte experimental del mismo, que se centra en el análisis del significado que del

teorema central del límite se presenta en una muestra de libros universitarios. Con ello

se continúa con el segundo objetivo específico, siguiendo la metodología y filosofía de

análisis de otros trabajos desarrollados en el grupo de investigación, en particular por

Ortiz (1999), Sánchez-Cobo (1999), Tauber (2001), Cobo (2003) y Estepa y Moya

(2007). Todos ellos señalan la importancia del libro de texto como recurso didáctico.

Como se ha indicado anteriormente, este capítulo será la base del posterior

diseño del estudio sobre el teorema central del límite dirigido a ingenieros. Además,

servirá para establecer el significado institucional de referencia del teorema en esta

investigación ya que, según el marco teórico, el significado de un concepto matemático

puede variar en distintas instituciones y por otro lado, tampoco el significado en una

institución escolar, como por ejemplo, la enseñanza universitaria, tiene que

corresponder exactamente con el atribuido por la de los matemáticos profesionales.

El objetivo de este capítulo es en consecuencia, describir el significado

institucional de referencia del teorema central del límite, que servirá de pauta para

diseñar el proceso de estudio, construcción de los instrumentos de evaluación y la

interpretación de las respuestas de los alumnos en los sucesivos capítulos. En primer

lugar, se selecciona una muestra amplia con distintos enfoques de textos de probabilidad

y estadística dirigidos a ingenieros que incluyen el teorema. A continuación, se analiza

el contenido del capítulo o capítulos relacionados con el teorema central del límite,

clasificando los elementos de significados diferenciados y poniendo algunos ejemplos

que ayuden al lector a comprender esta clasificación. Por último, se organiza la

información en tablas para realizar una síntesis del significado del teorema central del

Page 93: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

86

límite en los distintos textos analizados.

4.2. MUESTRA DE TEXTOS DE LIBROS UNIVERSITARIOS

SELECCIONADOS

Se sigue los pasos en el análisis de contenido del teorema, descrito en la Sección

1.7.2 de metodología del análisis de texto y se describe el significado del teorema de

acuerdo al marco teórico. Se considerarán variados textos formales e introductorios de

probabilidad y estadística, adecuados a la enseñanza de ingenieros, a objeto de contar

con un espectro amplio del significado en cuestión. Así, el significado construido del

teorema para esta investigación será el producto del análisis del conjunto de los

contenidos en dichos libros, que engloba a todos ellos.

Los libros consultados se presentan en la Tabla 4.2.1 y se pueden clasificar en:

) Textos de estadística aplicada a la ingeniería; ) textos de probabilidad y estadística

matemática; ) textos clásicos de probabilidad y estadística, por tener varias ediciones

del libro y prestigio del autor; ) textos de estadística aplicada moderna, con un enfoque

distinto a los demás; ) textos de estadística aplicada con énfasis en los ejercicios y

problemas.

El análisis específico en los distintos elementos de significado del teorema, se

llevará a cabo con 16 textos que están marcados con un código [N] en la Tabla 4.2.1,

debido a que son los más consultados por los estudiantes de ingeniería y no requieren de

un nivel avanzado de conocimiento en matemática; se advertirá que algunos campos de

problemas del cual surge la idea del teorema central del límite no están al alcance de

estudiantes de pregrado. Además, se han considerados textos de cada categoría de

clasificación.

4.3. CAMPOS DE PROBLEMAS

En primer lugar se analizará los campos diferenciados de problemas cuya

resolución hace surgir la idea del teorema central del límite, partiendo del estudio

histórico previo de la Sección 2.3. Estos campos de problemas llevan a la emergencia de

los objetos matemáticos, como entidades culturales socialmente compartidas; ya que los

problemas matemáticos y sus soluciones son compartidos en el seno de instituciones o

colectivos específicos implicados en el estudio de dichos problemas. A continuación, se

analizará la presencia en los libros de texto de los campos de problemas analizados en la

Sección 2.3. Se referirá indistintamente a la distribución de la suma o la media de

Page 94: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

87

variables aleatorias, pues son equivalentes salvo una constante.

Tabla 4.2.1. Libros de textos incluidos en el análisis

Nº Título Autores Editorial Edición1 Introduction to the theory of statistics A. Mood, F. Graybill , D. Boes Mc Graw Hill 1974 2 Introducción a la teoría de la probabilidad

y la inferenciaW. Feller Limusa 1975

3 Probabilidade: um curso em nível intermediário

B. James Euclides. Impa 1981

[4] Estadística para ciencias e ingeniería J. Kennedy, A. Neville Harla 19825 Probabilidad e inferencia estadística J. Kalbfleisch AC, Madrid 1984 6 Tratamiento estadístico de datos L. Lebart, A. Morineau, Fénelon Marcombo,Boixareu 1985

[7] Teoría moderna de probabilidades y sus aplicaciones

E. Parzen Limusa 1987

[8] Probabilidad y estadística M. De Groot Addison-Wesley 1988 9 Estadística J. Freund, R. Smith Prentice Hall 1989

[10] Probabilidad y aplicaciones estadística P. Meyer Addison-Wesley 1992 [11] Probabilidad y estadística G. Canavos Mc Graw Hill 1992 [12] Probabilidad y estadística para ingenieros I. Miller, J. Freund, R. Johnson Prentice Hall 1992 [13] Probabilidad y estadística para ingenieros R. Scheaffer, J. McClave Grupo Editorial

Iberoamericano 1993

14 Ejercicios y problemas de cálculo de probabilidades

J. Montero, L. Pardo, D. Morales, V. Quesada

Díaz de Santos 1993

[15] Estadística matemática con aplicaciones W. Mendenhall, D. Wackerly, R. Scheaffer

Grupo Edit Iberoame

1994

16 Introducción a la teoría de la probabilidad y la inferencia estadística

A. Durand, S. Ipiña Rueda 1994

[17] Estadística. Modelos y métodos D. Peña Alianza U. 1995 18 Estadística aplicada básica D. S. Moore Antoni Bosch 1995

[19] Probabilidad y estadística aplicadas a la ingeniería

D. Montgomery, G. Runger Mc Graw Hill 1996

20 Workshop statistics. Discovery with data A. Rossman Springer 1996[21] Probabilidad y estadística para ingeniería

y ciencias W. Mendenhall, T. Sincich Prentice Hall 1997

22 Estadística para ingenieros R. Ardanuy, Q. Martín Hespérides 1998 [23] Probabilidad y estadística para ingenieros R. Walpole, R. Myers, S. Myers Prentice Hall,

Pearson1999

24 Problemas de probabilidades y estadística C. Cuadras EUB, Barcelona 1999 25 elements of Large-Sample Theory E. L. Lehmann Springer 1999

[26] Probabilidad y estadística para ingeniería y ciencias

G. Velasco, P. Wisniewski Thompson 2001

[27] Probabilidad y estadística para ingeniería y ciencias

J. Devore Thompson 2001

[28] Problemario de probabilidad P. Wisniewski, G. Velasco Thompson 2001 [29] Estadística elemental R. Johnson, P. Kuby Thompson 2004

CP1: Obtener una aproximación de la distribución binomial para valores grandes de n

Respecto a este campo se ha encontrado la aproximación de la distribución

binomial para valores grandes de n por la normal, conocido como aproximación de De

Moivre-Laplace. Producto de esta tendencia asintótica surge el teorema central del

límite, así como su generalización y formalización (Ver sección 2.3.2). Según

Page 95: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

88

Mendenhall y Sincich (1997) una condición necesaria para aplicar esta aproximación,

establece que tanto npqnp 2 como npqnp 2 han de variar entre 0 y n. Esta

condición se satisfará si np 4 y también nq 4. Cabe aclarar, que en estos casos siempre

procede aplicar corrección de continuidad, toda vez que la binomial es una variable

aleatoria discreta, mientras que la normal es continua.

Un ejercicio típico de este campo es estimar el número de éxitos en n ensayos

del experimento aleatorio. Por ejemplo, se lanza una moneda al aire 300 veces, si sale

cara le damos el valor 1 y si sale sello el valor 0. Cada lanzamiento es una variable

independiente que se distribuye según el modelo de Bernoulli, con media 0,5 y varianza

0,25. Empleando la aproximación normal a la distribución binomial, podemos encontrar

la probabilidad de obtener menos de 104 o más de 160 caras. La solución consiste en

obtener la esperanza y varianza de la nueva variable suma de estas 300 variables

independientes y calcular la probabilidad mediante la normal tipificada. Se presenta otro

ejemplo situado en el área de la ingeniería:

_____________________________________________________________________________Supóngase que un sistema está formado por 100 componentes cada una de las cuales tiene una confiabilidad igual a 0,95. (Es decir, la probabilidad de que la componente funcione correctamente durante un tiempo específico es igual a 0,95). Si esas componentes funcionan independientemente una de otra, y si el sistema completo funciona correctamente cuando al menos funcionan 80 componentes, ¿cuál es la confiabilidad del sistema? (Meyer, 1992, pp. 331).

Con el propósito de guiar los análisis de este capítulo y mostrar la complejidad

del teorema, así como sus contextos de aplicación, se presenta a continuación una de las

soluciones clásicas al problema anterior. Esto servirá para introducir algunos de los

elementos de significado del teorema central del límite de el marco teórico, que se

analizarán con más detalle en las secciones siguientes.

a) Definamos las variables aleatorias ntecorrectamefuncionanoicomponentea0

t tiempoelenntecorrectamefuncionaicomponentela1

lX i

Tenemos que las variables se distribuyen Bernoulli Xi ~ B(p = 0,95) donde p: proporción de componentes que funcionan correctamente en un tiempo específico;

b) Consideremos una muestra aleatoria 100,......,21, XXX y definamos la nueva variable aleatoria Sn: número

de componentes que funcionan correctamente en el sistema. Es decir, 100

1i

in XS ;

c) Calculemos la esperanza y varianza de la variable de interés y apliquemos sus propiedades,

9595,01000)()()( pnXEXESE iin

75,405,095,0100)1()()()( ppnXVarXVarSVar iin . Así, la desviación estándar es

Page 96: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

89

18,275,4nS ;

d) La pregunta se traduce en lenguaje simbólico. Es decir, se pide calcular ?)10080( nSP

e) Como el tamaño de la muestra n = 100 es grande, aplicamos el teorema central del límite, obteniendo:

npqnpNSn , Luego procedemos al cálculo, usando la corrección de continuidad:

994,0)1,7()52,2(18,2

955,100

18,2

95

18,2

955,795,1005,79)10080( n

nn

SPSPSP ;

f) Por la tanto, la probabilidad que funcione el sistema es de un 99,4%.

CP2: Determinar la distribución de la suma de variables aleatorias discretas

idénticamente distribuidas

El gran interés de este campo de problemas reside en el hecho que la tendencia

hacia la distribución normal aparece cualquiera que sea la distribución común de las

variables aleatorias. Como sugieren Lebart, Morineau y Fénelon (1985), si un fenómeno

aleatorio es el resultado de la adición de múltiples causas aleatorias, independientes y

del mismo orden de importancia, hay que esperar ver aparecer una distribución normal.

Esto explica y justifica el uso predominante de la distribución normal en estadística.

En esta clase de problemas se aproxima el modelo de la distribución normal a

distribuciones de probabilidades clásicas discretas para ciertos valores de sus

parámetros. En relación con la evolución histórica del teorema, en este campo se

distingue tres subcampos, que se analiza a continuación.

CP2.1: Variables con distribución uniforme discreta

La distribución de medias muestrales establece la relación entre la media y la

desviación estándar poblacionales, y la media y la desviación estándar de las medias

muestrales. La distribución exacta no siempre es útil, ya que la media de una muestra

pequeña se distribuye normalmente sólo cuando las muestras se extraen de una

población normal, pero que no tendrán una distribución normal cuando la población

muestreada sea uniforme, esté sesgada o siga una distribución no normal.

El teorema central del límite proporciona información adicional muy importante

describiendo por completo la distribución muestral asintótica de la media muestral.

Además de dar su valor central (media), y medida de dispersión (desviación estándar),

se añade una indicación de cómo está distribuida. En otras palabras, incluso si la

población muestreada no es normal, la distribución muestral de la media se comporta

normalmente bajo ciertas condiciones, como se observa en el siguiente ejemplo:

Page 97: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

90

Considérese una población que consta de cinco enteros igualmente probables: 1, 2, 3, 4 y 5. Se estudiará una porción de la distribución muestral de las medias muestrales cuando se eligen aleatoriamente 30 muestras de tamaño 5. Comprobar la veracidad de los tres hechos específicos sobre la distribución muestral de medias muestrales: a) la media de la distribución muestral es igual a la media de la población, b) el error estándar de la media para la distribución muestral es igual a la desviación estándar de la población dividida entre la raíz cuadrada del tamaño de la muestra, c) la distribución de la media muestral será aproximadamente distribuida normalmente. (Johnson y Kuby, 2004, pp. 278). _________________________________________________________________________________________________________

En este ejemplo, se ilustra como surge la idea del teorema central del límite

cuando la población tiene una distribución uniforme. La distribución de probabilidad

teórica de la cual se extraen las muestras es P(X=x)=0,2, para x=1,2,3,4,5 y la forma de

la distribución es rectangular.

CP2.2: Variables discretas acotadas

Este campo es mas general que el campo CP1 dado anteriormente, y la

distribución binomial sería un caso particular. A continuación se ilustra un ejercicio

típico de variables discretas acotadas con distribución dada y que no es clásica:

La variable aleatoria X, que representa el número de cerezas en una empanada, tiene la siguiente distribución de probabilidad:

x 4 5 6 7 P ( X = x ) 0,2 0,4 0,3 0,1

Encuentre la probabilidad de que el número promedio de cerezas en 36 empanadas sea menor que 5,5. (Walpole, Myers y Myers, 1999, pp. 223). _________________________________________________________________________________________________________

CP2.3: Variables discretas no acotadas

Un caso particular de este campo es la obtención de distribuciones en el

muestreo de la media de poblaciones con distribución discretas no acotadas. El siguiente

ejemplo se refiere a la distribución de Poisson, que, aunque en la práctica está acotada,

no lo está teóricamente:

Semillas frutales. Unos biólogos especialistas en botánica aseguran que el número de semillas por limón, en cierta variedad de limones agrios de Veracruz, sigue una distribución de Poisson con parámetros µ=5. Determinar la probabilidad de que el número promedio de semillas por limón sea menor a 5,5 en una muestra aleatoria de n = 125 limones de dicha variedad. (Wisniewski y Velasco, 2001, pp. 231). ______________________________________________________________________

CP3: Establecer la distribución de la suma de variables aleatorias independientes no

idénticamente distribuidas

El teorema central del límite clásico se refiere al caso en que las v.a. son i.i.d.

Page 98: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

91

Este campo provee una extensión a la suma de v.a. independientes que no

necesariamente son idénticamente distribuida (ver Sección 2.3.4). En términos

informales, podemos enunciarlo como sigue:

Sea 1 2n nS X X X , donde nXXX ,...,, 21 son variables aleatorias

independientes (cuyas distribuciones de probabilidad pueden ser arbitrarias o incluso

desconocidas). Suponga que los respectivos valores esperados y varianzas de tales

variables aleatorias iX son iiXE )( , 2)( iiXVar . Entonces, con ciertas

condiciones generales (los iX individualmente contribuyen con una cantidad

despreciable a la varianza de la suma de todos los términos), la variable aleatoria nZ

tiene una distribución de probabilidad que se aproxima asintóticamente a la distribución

normal estándar conforme n tiende a infinito.

2222

21

2211

i

in

n

nnn

SXXXZ .

El campo anterior CP2, otorga una formulación más restringida del teorema

central del límite (ver sección 2.3.3) y establece que si las variables aleatorias están

igualmente distribuidas, y tienen, por consiguiente, una misma media y una misma

varianza, entonces la variable aleatoria definida por n

nSZ n

n tiene una distribución

de probabilidad que se aproxima asintóticamente a las distribución normal estándar. Se

presenta un ejemplo de comportamiento asintótico de la suma nS , para una sucesión de

variables aleatorias no idénticamente distribuidas:

Sean ,..., 21 XX variables aleatorias independientes, nnUX n ,~ . Mostrar de dos formas que

n

nn SES converge a la distribución normal estándar, verificando las condiciones de Linderberg y

Liapounov. (James, 1981, pp. 267). ______________________________________________________________________

CP4: Determinar la distribución de la suma de variables aleatorias continuas

idénticamente distribuidas

En este caso se considera la obtención de distribuciones en el muestreo de la

media de poblaciones no normales, con distribuciones continuas conocidas.

Como caso particular de los campos anteriores, el teorema central del límite es

conocido, más que por la distribución de la suma de variables aleatorias (ver Sección

Page 99: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

92

2.3.4), por la aplicación en la distribución de muestras de la media aritmética muestral.

En el campo CP3 anterior, si hacemos n

S

n

XXXX nn21 entonces

n

X

n

nXnZn

/ . Por lo tanto, esta forma restringida y más utilizada del teorema

central del límite en las aplicaciones diversas de los textos de libros, establece que:

Si nXXX ,...,, 21 son n variables aleatorias independientes igualmente distribuidas

(muestra aleatoria), cada una de ellas con media µ y varianza 2 , entonces la v. a.

n

XZn se aproxima a la distribución normal, conforme n crece.

A continuación, se presentan dos ejemplos de este campo por su frecuencia de

uso en las aplicaciones en los textos y por introducir el concepto de variable continua; el

primero es matemático y típico en los libros, y el segundo muestra una extensión del

campo CP2.1 al caso de variables con distribución uniforme continua y corresponde a

un ejemplo de física (electricidad y magnetismo) para distribuciones originales

conocidas de variables independientes e idénticamente distribuidas:

1. Suponga que cierta variable aleatoria continua X tiene una función de densidad de probabilidad dada por:

casootroen0

1x1-si2

3)(

2xxf

. Suponga que se extraen muestras de tamaño n = 15 valores, al

azar, de dicha variable aleatoria. Para una de tales muestras, denotamos por X a la media aritmética

muestral. Naturalmente, diferentes muestras elegidas darán distintos valores de este promedio aritmético

X , por lo que a su vez, X se considera una variable aleatoria. Estimar el valor de 15,003,0 XP .

(Wisniewski y Velasco, 2001, pp. 230).

2. Se tienen n voltajes nVVV ,...,, 21 que se reciben en una especie de concentrador (sumador), de tal

suerte que V= Vi es la suma de los voltajes recibidos en ese punto. Cada voltaje Vi es una variable aleatoria distribuida uniforme en el intervalo [0,10]. Luego, E(Vi)=5 volts y Var(Vi)=100/12. Si n = 20, podemos calcular la probabilidad de que el voltaje total de entrada sobrepase los 105 volts. (Meyer, 1992, pp. 337) _____________________________________________________________________________

En general, la enseñanza de la probabilidad y estadística en los textos

universitarios, y más aún en la matemática, presenta los conceptos, primero la

definición, propiedades y su aplicación en problemas matemáticos como el ejemplo 1

anterior. En este trabajo se cuestionará esta forma de enseñanza confrontándola con el

aprendizaje situado, es decir, partiremos mediante una situación problemática

Page 100: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

93

mostrando la necesidad de utilizar herramientas estadísticas para su análisis y correcta

toma de decisiones.

CP5: Estimar el error de aproximación en el teorema central del límite

En los procesos de inferencia se utiliza la media de una muestra (que es un

estimador insesgado), para calcular la media de una población, y nuestra confianza en la

estimación se expresa mediante la adición de un enunciado de probabilidad que nos

revela el tamaño del error. El estudio del error de estimación en la aplicación del

teorema central del límite tuvo como precedentes dos ideas muy importantes:

a. La primera es el teorema de Chebyshev, que ayuda a comprender como la varianza

mide la variabilidad respecto al valor esperado de una variable aleatoria. Si se

conoce la distribución de probabilidades de una v.a. X se puede calcular la E(X) y

Var(X), si existen. Sin embargo el recíproco no es verdadero, pero si se puede dar

una cota superior (o inferior) para calcular probabilidades. (Ver definición formal en

Meyer, 1992, pp. 186). En los textos, por ejemplo Freund y Smith (1989), se

refieren al teorema de Chebyshev como: la probabilidad de que una variable

aleatoria tome un valor contenido en k desviaciones estándar de la media es cuando

menos 211 k .

b. Una segunda idea es la Ley de los Grandes Números, considerado como el primer

teorema fundamental de la teoría de probabilidad. El comportamiento de la media

muestral es similar al de la probabilidad. Después de muchas repeticiones, la

proporción de resultados que toman un valor determinado se acerca a la

probabilidad de este valor, y el promedio de los resultados se acerca a la media

poblacional (Moore, 1995). Con la ayuda de la desigualdad de Chebyshev se puede

obtener otra forma de la ley de los grandes números; al considerar una muestra

aleatoria y sea nk , podemos escribir n

XP2

2

1 . Cuando n el

lado derecho de la desigualdad se aproxima a uno; en el sentido en el cual el

promedio aritmético “converge” a E(X). En otras palabras, si se utiliza la media de

una muestra elegida al azar para determinar la media de la población de la cual

provino, se puede afirmar con una probabilidad de cuando menos 211 k que

nuestro error será menor que k desviaciones estándar de la media muestral.

Page 101: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

94

Por lo tanto la ley de los grandes números establece que la media observada X

de un número grande de observaciones tiene que estar cerca de la media µ de la

población. El teorema central del límite señala que, con una n grande, la distribución de

X es aproximadamente normal, de media µ y desviación típica n . Se presenta el

siguiente ejemplo:

El decano de una universidad desea estimar cuántos puntos se puede esperar que obtengan los aspirantes que se someten a un examen de ingreso. Si utiliza una muestra aleatoria de 100 aspirantes y supone que la desviación estándar es 20 puntos, ¿qué puede aseverar acerca de la probabilidad de que su error sea menor que tres puntos si emplea a) el teorema de Chebyshev; b) el teorema central del límite? (Freund y Smith, 1989, pp. 312).

CP6: Encontrar condiciones necesarias y suficientes para el teorema central del límite

Este campo de problema es fundamentalmente de estadística matemática y está

relacionado con el tercer capítulo en la historia del teorema, Sección 2.3.6. Conceptos

formales, como convergencia en probabilidad de una sucesión de variables aleatorias,

ley de los grandes números, teoremas y corolarios de Linderberg, Feller y Levy,

desempeñan un papel importante en la identificación de este campo. Es claro que para

una muestra aleatoria de tamaño grande, se cumple que la suma converge a la

distribución normal, es decir, n

nSZ n

n ~ N(0,1). James (1981) recuerda que la Ley

de los Grandes Números nos dice que la media muestral converge en probabilidad a µ, o

que la diferencia X tiende a cero, mientras que el teorema central del límite dice

que esta diferencia multiplicada por la raíz cuadrada de n y dividida por la desviación

estándar, converge en distribución a una normal.

En términos formales, la ley débil de los grandes números dice que la variable

“media” nX converge en probabilidad hacia la variable degenerada (constante) µ. En

notación matemática, se dice que una sucesión de variables (Xn) definidas en el mismo

espacio , converge en probabilidad hacia una variable X si para todo 0 :

1lim XXP nn

(Lebart, 1985, pp. 61). (Ver otras definiciones formales de los

conceptos en James, 1981; Lebart y cols., 1985 y Parzen, 1987).

James (1981) hace referencia a las condiciones generales para validar el

teorema; señala que el teorema central del límite de Linderberg considera variables

aleatorias independientes, y se cumple la convergencia normal si se satisface la

condición de Linderberg; es decir, da condiciones generales para validar la

convergencia. El teorema central del límite de Liapounov es útil cuando las variables

Page 102: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

95

poseen momentos finitos de orden mayor que 2. Afirma este teorema que la

convergencia se cumple si la suma de dos momentos centrados absolutos de orden 2

es asintóticamente pequeña en relación a la desviación estándar 2n . Linderberg da

una condición necesaria para justificar el teorema central del límite. El recíproco, o

condición suficiente, de este teorema se debe a Feller, quien demostró que si se tienen

variables aleatorias independientes con varianzas finitas, con al menos una varianza

mayor que cero y si el máximo del cuociente de varianzas poblacionales y muestrales

tiende a cero cuando n es grande, entonces la condición de Linderberg es consecuencia

de la convergencia normal. A continuación se presenta un ejemplo de este relacionado

con este campo:

Se nU una sucesión de variables aleatorias independientes, cada una distribuida uniformemente en el

intervalo de 0 a . Sea nA un sucesión de constantes positivas. Establezca condiciones bajo las cuales

la sucesión nnn UAX cos obedezca el teorema central del límite. (Parzen, 1987, pp. 477).

______________________________________________________________________

CP7: Obtener la distribución de la suma de variables aleatorias dependientes

Los campos anteriores no son los más generales; el teorema central del límite se

cumple para la suma de variables sin que tengan la misma distribución, y más aún

veremos en este campo el caso del teorema para variables no independientes. El

supuesto de independencia facilita el encontrar distribuciones multivariantes, ya que las

distribuciones conjunta de v.a. son obtenidas a partir del producto de las distribuciones

marginales de un modelo dado. El supuesto de dependencia frecuentemente no es

apropiado, se considera un hecho más casual y presenta una dificultad de especificar

modelos en más de dos variables.

La literatura apropiada que trabaja con este supuesto de dependencia se puede

obtener en los procesos estocásticos y series de tiempo, y requiere de conocimientos

avanzados en matemáticas. Lehmann (1999, pp. 108-112) ilustra algunos ejemplos

puramente matemáticos, referidos con el número de sucesiones estacionarias, en

particular para m-variables dependientes, para procesos autorregresivos de primer orden

y cadenas de Markov en dos estados. Uno de estos ejemplos, se ilustran a continuación

de proceso autorregresivo de primer orden estacionario, en la cual para establecer la

normalidad requiere la demostración de dos hechos: normalidad asintótica y que la

varianza de la distribución límite corresponde al límite de la varianza de la variable

normal.

Page 103: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

96

Proceso autorregresivo de primer orden estacionario. Se definen sucesivamente las variables

,...2,1,1,11 iUXX iii donde las variables independientes 20,0NU i .

Vemos que U ki111

kiik

ik

ki UUXX . Además, la varianza de las

variables satisface lo siguiente 20

21 ii XVarXVar . Si la sucesión de las variables es

estacionaria, debemos tener ,...2,11 iXVarXVar ii y por tanto 220

2 1 , donde 2 es la varianza común de las Xi . Suponga que la sucesión comienza con un 1X el cual es normal

2,N . Entonces, ésta es la distribución para todos los Xi , y por tanto la sucesión es estacionaria.

(Lehmann, 1999, pp. 109). ______________________________________________________________________

Nuevos campos de problemas

Además de los campos de problemas identificados en el estudio histórico, se ha

encontrado nuevos tipos de problemas más aplicados que se describe a continuación. Su

solución no lleva directamente al teorema, sino a uno de los problemas anteriores, es

decir, a la búsqueda de una distribución que aproxime la suma de variables aleatorias y

en este sentido, los consideramos como campos de problemas indirectos.

CP8: Obtener el tamaño adecuado de una muestra aleatoria de poblaciones

desconocidas

Un usuario prudente de los métodos estadísticos nunca planifica la obtención de

los datos sin planear, al mismo tiempo, la inferencia. Si obtiene suficientes

observaciones puede conseguir a la vez un nivel de confianza elevado y un error de

estimación pequeño, pero en la práctica la obtención de observaciones cuesta tiempo y

dinero. Puede ocurrir que el tamaño de la muestra ideal sea inviable por razones

económicas (Moore, 1995). Este campo de problemas es uno de los más importantes en

la aplicación del teorema central del límite en campos de la ingeniería. A continuación

se presenta un ejemplo, sin un contexto de la variable en estudio.

Se desconoce la distribución de probabilidad de cierta variable aleatoria X y el valor de su media (µ); no obstante, existen motivos para asegurar que la desviación típica de X es aproximadamente =3. ¿De qué tamaño debe ser una muestra aleatoria de valores de X para tener una confianza mínima de 95% de que la discrepancia entre la media muestral y la media verdadera de la población será menor a 0,3? (Wisniewski y Velasco, 2001, pp. 231). ______________________________________________________________________

Page 104: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

97

CP9: Obtener la distribución de la suma de los logaritmos de variables aleatoria

independientes

Una consecuencia del teorema central del límite es que si un efecto es el

producto de muchas causas, cada una de poca importancia respecto a las demás e

independientes, de manera que nn XXXP 21 , entonces el logaritmo de nP seguirá

una distribución normal. Se denomina distribución lognormal a la de una variable cuyo

logaritmo se distribuye normalmente. Así, nPX ln tendrá distribución normal de media

2exp

2

y varianza 2122

eee . Observe que la variable X puede escribirse

n

i

in XXXX

11 lnln . Como la transformación logarítmica es monótona, los

percentiles de X serán los logaritmos de los percentiles de nP . Peña (1995) señala que la

distribución lognormal es esencialmente útil para comparar distribuciones asimétricas

con variabilidad muy distinta, y esta distribución aparece con frecuencia al estudiar

rentas de familias, consumo de electricidad por empresas, ventas en euros, etc. Kennedy

y Neville (1982) mencionan su aplicación en pruebas de fatiga; la variación en el

número de ciclos en que ciertas piezas metálicas resisten antes de fallar es tal, que los

logaritmos de las duraciones se distribuyen de manera normal.

La necesidad de transformación puede surgir del método de medición que se

siga. Sabemos que nP no puede ser negativo, dado que no se define el logaritmo de un

número negativo; sin embargo el uso de la distribución lognormal se explica porque el

comportamiento de algunas variables es descrito satisfactoriamente por esta

distribución, por ejemplo en eventos hidrológicos, como son el flujo de agua diario, la

lluvia o la descarga fluvial, a la distribución de pequeños tamaños de partículas, a la

resistencia de algunos materiales, o a la duración o vida. Este campo se ilustra en el

siguiente ejemplo aplicado a la resistencia al suelo:

Suponga que la media “verdadera” de la resistencia al esfuerzo cortante de un suelo en particular es X .

Valiéndose de un número de muestras de suelo n, se mide la resistencia al esfuerzo cortante X. El valor

medio X se desviará del valor verdadero X . La subestructura se diseña sobre la base de una resistencia

reducida dada por LXd donde L es un factor de seguridad. Si se da por hecho que se dispone de un

método correcto para el análisis de la estabilidad del suelo, la probabilidad de que se registre una falla se

expresa mediante 0L

XP X . Dado que la variable X no puede tener valores negativos,

calcular la probabilidad anterior mediante la distribución lognormal. (Kennedy y Neville, 1982, pp. 151).

Page 105: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

98

Muy pocos textos tratan este campo de aplicación del teorema central del límite.

Devore (2001) lo presenta como proposición:

“Sea nXXX ,...,, 21 una muestra aleatoria de una distribución para la que sólo

valores positivos son posibles 10iXP . Entonces, si n es suficientemente

grande, el producto nn XXXP 21 tiene aproximadamente una distribución

lognormal”.

Además, menciona un ejemplo de aplicación: el proceso de daño en el flujo

plástico y propagación de grietas es un proceso multiplicativo, así que variables tales

como el porcentaje de alargamiento y resistencia a la ruptura tienen distribuciones

aproximadamente lognormales.

CP10: Obtener la distribución de diferencias de medias muestrales en dos poblaciones

Las principales características de la distribución de la diferencia 21 XX entre

las medias muestrales de dos muestras aleatorias simples independientes son:

La media de 21 XX es 21 . Es decir, la diferencia de las medias muestrales es

un estimador insesgado de la diferencia de las medias poblacionales;

La varianza de la diferencia es la suma de las varianzas de 1X y 2X , que es

2

22

1

21

nn ;

Si las dos distribuciones poblacionales son normales, entonces la distribución de

21 XX también es normal.

Estas características se pueden deducir de forma matemática utilizando los

teoremas de probabilidad, o se pueden poner de manifiesto mediante simulaciones. Las

pruebas de significación y los intervalos de confianza, para la diferencia entre las

medias 1 y 2 de dos poblaciones, parten de la diferencia 21 XX entre las dos medias

muestrales. Con distribuciones no normales, el teorema central del límite garantiza que

los procedimientos de cálculo son aproximadamente correctos cuando las muestras son

grandes (Moore, 1995). Una aplicación de este campo indirecto es el siguiente:

Page 106: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

99

______________________________________________________________________

Un grupo de médicos veterinarios han elaborado una dieta con un costo más barato que la que actualmente se usa para las vacas productoras de leche, asegurando que el promedio de litros de leche será el mismo. Los administradores de una planta productora de leche desean verificar la afirmación establecida por el grupo de médicos, para lo cual, seleccionan dos muestras aleatorias independientes de n= 30 vacas cada una y aplican a cada una de ellas la nueva fórmula y a la otra muestra, la fórmula que actualmente se utiliza. Calculan el promedio de litros de leche producidos en cada muestra y si la

diferencia de las medias 21 XX (donde 1X es para la nueva fórmula y 2X es para la fórmula actual)

es mayor que –1,23, aceptarán la nueva fórmula, ¿cuál es la probabilidad de que rechacen la nueva fórmula siendo que el grupo de médicos tiene razón? Considere que las desviaciones estándar de ambas poblaciones son iguales a 5. (Castillo, 1990, pp. 205). ______________________________________________________________________

En los textos analizados hay muy pocos ejemplos de este campo. Un ejemplo

guiado a la obtención de la distribución y cálculo de probabilidades de la diferencia de

medias muestrales de la resistencia esperada a la tensión del acero, se puede ver en

Devore (2001, pp. 240).

CP11: Determinar la distribución de funciones de variables aleatorias

Se ha visto que Xn tiene aproximadamente una distribución normal

estándar cuando n es elevada, bajo determinadas condiciones generales. Esta noción de

normalidad asintótica podemos ampliarla a una clase grande de funciones de X ; de

funciones de cualquier variable aleatoria asintóticamente normal. El resultado es válido

debido a las propiedades de los desarrollos de las series de Taylor, que se explican

brevemente en Scheaffer y Mc Clave (1993, pp. 248).

Suponga que X es una medida estadística basada en una muestra aleatoria de

tamaño n que procede de una población con promedio µ y varianza finita 2 . Además,

suponga que se desea conocer el comportamiento de una función de X , por ejemplo

Xg , donde )(xg es una función de valor real tal que su derivada )´(xg existe en las

cercanías de µ y es distinta de cero. Se puede escribir RXggXg )`()(

donde R es el residuo de la serie de Taylor. Multiplicando por n en muchos casos

Rn tiende a cero cuando aumenta n, y se llega a la expresión )´(

)(

g

gXgn que

converge a la distribución normal al aumentar n.

Meyer (1992) señala que este resultado es de mucha importancia en muchas

aplicaciones para sostener a lo menos un argumento heurístico, intuitivo. Así, para un n

suficientemente grande y bajo condiciones muy generales de la función g, concluimos

Page 107: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

100

que la distribución de Xg es aproximadamente normal de media )(g y varianza

n

g 22)´( . A continuación, se presenta un ejemplo en el área de física:

La corriente I en un circuito eléctrico se relaciona con la tensión E y la resistencia R mediante la ley de Ohm, I = E / R . Suponga que para circuitos de determinado tipo, E es constante, pero que la resistencia Rvaría ligeramente de circuito a circuito. Se mide la resistencia en forma independiente en n circuitos, y se

obtienen los resultados nXX ,....,1 . Si )( iXE y 2)( iXV , donde i=1,2,...,n , hallar la distribución

aproximada de XE , que es el cálculo aproximado de la corriente promedio. Scheaffer y McClave

(1993, pp. 248). ______________________________________________________________________

CP12: Estimar por intervalos de confianza la media y otros parámetros para muestras

grandes

La estimación por intervalos calcula estimadores puntuales insesgados para

parámetros tales como µ, p, µ1- µ2, p1- p2 con base en una muestra aleatoria, bajo

algunos supuestos. La condición para estimar la media µ usando una desviación

estándar conocida o estimada es que la distribución muestral de X sea normal.

La información necesaria para asegurar este supuesto es que: 1) La distribución

muestral de medias muestrales, X , está distribuida alrededor de una media igual a µ

con un error estándar de n/ ; y 2) Si la distribución muestreada aleatoriamente no se

distribuye de manera normal, entonces X está distribuida normalmente para tamaños

de muestra suficientemente grandes.

No existe ninguna regla que defina “suficientemente grande”; el tamaño de

muestra suficientemente grande varía bastante según la distribución de la población. La

regla sencilla que se mencionan en muchos textos es considerar una muestra

suficientemente grande cuando n 30. Para Devore (2001) n > 40 será suficiente para

justificar el uso de este intervalo. Es algo más conservador que la regla sencilla para el

teorema, por la variabilidad agregada que se introduce al usar s por .

Según Johnson y Kuby (2004) señalan que el teorema central del límite puede

aplicarse a muestras pequeñas (por ejemplo, n=15 o mayor), cuando los datos

proporcionan una fuerte indicación de una distribución unimodal que sea

aproximadamente simétrica. Si hay evidencia de algún sesgamiento presente en los

datos, entonces el tamaño de la muestra debe ser mucho mayor (quizás n 50). Si los

datos proporcionan evidencia de una distribución extremadamente sesgada o en forma

de J, es posible que el teorema no sea válido. La inspección de varias representaciones

Page 108: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

101

gráficas de los datos muestrales debe conducir a una indicación del tipo de distribución

que tiene la población.

La proposición que requiere el uso del teorema central del límite dice: si n es

suficientemente grande, la variable estandarizada ns

XZn tiene aproximadamente

una distribución normal estándar. Esto nos lleva a determinar

n

sZX

n

sZX )2/1(,)2/1( el intervalo de confianza aproximado para ,

considerando un tamaño de muestra adecuado y nivel de confianza de 100(1- )%. Esta

fórmula es válida, independiente de la forma de la distribución en la población.

En términos generales, se puede decir que un intervalo de confianza 1- para la

estimación de un parámetro se encuentra usando la fórmula )2/1(Z ,

donde es el error estándar del parámetro , e indica cuál es la magnitud esperada del

error debida a la variabilidad en la obtención aleatoria de los datos. A continuación, se

presenta un ejemplo de intervalo de confianza aproximado para la diferencia de

proporciones poblacionales:

Dos marcas de refrigeradores, A y B, tienen (ambas) una garantía de un año. En una muestra aleatoria de 50 refrigeradores de la marca A, 12 se descompusieron antes de terminar el período de garantía. Una muestra aleatoria de 60 refrigeradores de la marca B reveló también 12 descomposturas durante el período de garantía. Estimar la diferencia real entre las proporciones de fallas (p1 – p2), durante el período de garantía, con un coeficiente de confianza de 0,98. (Mendenhall, Wackerly y Scheaffer, 1994, pp. 336) ______________________________________________________________________

CP13: Establecer pruebas de hipótesis de la media y otros parámetros para muestras

grandes

En muchas situaciones de la vida diaria tomamos decisiones, que siguen el

mismo patrón básico: se ponderan las alternativas; luego, con base en las convicciones y

preferencias personales, y cual sea la evidencia disponible, se llega a una decisión y se

emprende la acción idónea. La prueba de hipótesis sigue casi el mismo proceso, excepto

que implica información estadística.

Por ejemplo, en la evaluación de las técnicas de enseñanza la hipótesis es que un

profesor mejora el desempeño de un alumno (calificación obtenida en el examen) a

través de influir sobre la probabilidad percibida esfuerzo-recompensa del estudiante. Un

instructor logra lo anterior al asignar tareas (técnicas de enseñanza) que forman parte de

Page 109: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

102

la calificación del estudiante y son percibidas por éste como un medio para mejorar su

calificación en el curso. El estudiante está motivado para incrementar su esfuerzo a fin

de completar estas tareas, que también deben mejorar su entendimiento sobre el material

presentado en el curso. El resultado final esperado es obtener mejores calificaciones en

el examen. La hipótesis a analizar es ¿las técnicas de enseñanza tienen un efecto

significativo sobre los puntajes de examen de los estudiantes?

La prueba de hipótesis (llamada también contraste de hipótesis, dócima de

hipótesis) es un procedimiento bien organizado, que se aplica para tomar decisiones.

Como en la estimación de intervalos, en las pruebas de hipótesis se puede trabajar con

distintos estadísticos y con diversos tipos de distribuciones, pero en nuestro estudio

analizaremos el caso para muestras grandes donde la distribución en el muestreo de

muchos estadísticos son aproximadamente normales. El procedimiento para una prueba

de hipótesis de un parámetro es el siguiente:

1. El planteamiento: describir el parámetro poblacional de interés y establecer las

hipótesis nula y alternativa;

2. Especificar los criterios de prueba: comprobar los supuestos (la distribución

muestral del estadístico se comporta de manera normal, el tamaño de muestra es

suficientemente grande). Identificar la distribución de probabilidad y el estadístico

de prueba adecuado y determinar el nivel de significación ;

3. Recolectar la información muestral y calcular el valor del estadístico;

4. Calcular el valor-p para el estadístico de prueba y determinar si es menor o no que

;

5. Determinar los resultados: plantear la decisión sobre la hipótesis nula y escribir una

conclusión sobre la hipótesis nula.

El supuesto para pruebas de hipótesis sobre la media poblacional µ usando una

desviación estándar conocida o aproximada, es que la distribución muestral de X tenga

una distribución normal. Al igual que el caso de intervalos de confianza, la información

necesaria para asegurar que se cumpla este supuesto está contenida en la distribución

muestral de las medias muestrales con media y error estándar dada anteriormente y se

distribuye normalmente cuando el tamaño de la muestra es suficientemente grande.

El siguiente ejemplo ilustra una aplicación muy importante del teorema central

Page 110: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

103

del límite en la determinación de valores razonables de la media de la población µ. Para

responder si el experimento proporciona evidencia que apoye la conjetura que µ=5, se

calcula la probabilidad de que datos similares a los que se obtuvieron en la muestra

puedan ocurrir con facilidad cuando de hecho µ=5. El teorema surge en cuestiones

como ¿Qué tan probable es que se pueda obtener 027,5X con n = 100 si la media de la

población es µ=5?, en otras palabras, si la media µ es 5, ¿cuál es la probabilidad de que

X se desvíe a lo más en 0,027 milímetros?

Un importante proceso de fabricación produce partes de componentes cilíndricos para la industria automotriz. Es importante que el proceso produzca partes que tengan una media de 5 milímetros. El ingeniero involucrado hace la conjetura de que la media de la población es de 5,0 milímetros. Se lleva a cabo un experimento en el que 100 partes elaboradas por el proceso se seleccionan al azar y se mide el diámetro de cada una de ellas. Se sabe que la desviación estándar de la población es 1,0 . El

experimento indica un diámetro promedio de la muestra 027,5X milímetros. ¿Esta información de la muestra parece apoyar o refutar la conjetura del ingeniero? (Walpole, Myers y Myers, 1999, pp. 218) ______________________________________________________________________

Conclusiones sobre los campos de problemas presentados

En la Tabla 4.3.1 se muestra un resumen de los campos de problemas

relacionados con el teorema central del límite presentes en los libros de textos

analizados. Se puede ver en la tabla, los campos de problemas comunes en todos los

libros son el de aproximación de ciertas distribuciones (CP1) y la distribución de la

suma de v.a. continuas (CP4). Por otro lado, hay algunos campos de problemas que son

inexistentes en la mayoría de los libros, por su carácter teórico; por ejemplo, sólo el

texto Parzen (1987) presenta un ejercicio para la suma de v.a. dependientes (CP7), en

dos libros se presenta el campo CP3 para la distribución de v.a.i. no idénticamente

distribuida y en tres textos el campo de problema de condiciones necesarias y

suficientes del teorema central del límite (CP6).

Desde el punto de vista histórico del teorema central del límite, los campos de

problemas (CP1 a CP7) han dado origen al desarrollo teórico del teorema aportando al

análisis de la inferencia estadística clásica. Se observa en los libros de estadística

matemática ([7],[8],[10] y [15]) que están presentes en promedio seis de los nueve

campos y que la tendencia en el tiempo es a presentar menos problemas de este tipo. A

diferencia de los libros de los años 80 y 90, que muestran ejercicios de error de

estimación y determinación de tamaños muestrales, los libros de textos modernos y

aplicados enfatizan problemas a variables discretas acotadas (CP2.1 y CP2.2). En

general los textos de estadística aplicada a la ingeniería carecen de la mayoría de estos

Page 111: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

104

campos de problemas. De los ocho textos de ingeniería, sólo uno muestra problemas

con la distribución de Poisson; modelo que es de importancia para los ingenieros y que

es comprensible por los alumnos debido a que han tenido un curso previo de

probabilidades.

En el caso de los campos de problemas indirectos (CP8 a CP13) se observa que

los campos de problemas referidos a los intervalos de confianza (CP12) y pruebas de

hipótesis (CP13) son los más presentes en los textos, con 13 y 11 respectivamente. Son

pocos los libros con ejemplos que traten el campo de problemas CP11 para la

distribución de funciones de v.a., Scheaffer y McClave (1993) lo plantean como una

sección en el capítulo de distribuciones muestrales, y Meyer (1992) lo mencionan

resumidamente. Además, sólo dos libros presentan un problema para la suma de los

logaritmos (CP9), siendo el menos frecuente en los textos analizados. La evolución de

estos nuevos campos de problemas en los textos ha ido creciendo, ya que están

presentes hoy en día en la mayoría de los textos de estadística para ingenieros, aunque

no expresados de forma clara en los ejercicios.

Tabla 4.3.1. Campos de problemas que presentan los libros seleccionados

Textos [4] [7] [8] [10] [11] [12] [13] [15] [17] [19] [21] [23] [26] [27] [28] [29]

CP1: Aproximación de la distribución binomial

CP2.1: Distribución suma v.a. discretas uniforme CP2.2: Distribución suma v.a. discretas acotadas CP2.3: Distribución suma v.a. discretas no acotadas

CP3: Distribución suma v.a no idénticamente distribuidas CP4: Distribución de la suma de variables aleatorias continuas

CP5: Estimación del error de aproximación CP6: Condiciones necesarias y suficientes CP7: Distribución de la suma de v. a. aleatorias dependientes CP8: Tamaño adecuado de una muestra aleatoria de poblaciones desconocidas

CP9: Distribución de la suma de logaritmos CP10: Distribución de diferencias de medias muestrales CP11: Distribuciones de funciones de variables aleatorias CP12: Estimación por intervalos de confianza CP13: Pruebas de hipótesis para muestras grandes

En relación a los textos de estadística para ingenieros, los libros que presentan

Page 112: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

105

más campos de problemas son el de Devore (2001) número [27] con 9 campos y los

libros [23] y [13] con 8 campos de los 15 definidos. Los libros que consideramos

clásicos [11] y [17] prácticamente son muy débiles en mostrar ejercicios que involucren

la idea del teorema central del límite. El texto de estadística matemática [15] de

Mendenhall, Wackerly y Scheaffer (1994) es el que tiene mayor número de campos de

problemas, con 10. Los libros de textos con un enfoque moderno y aplicado [28] y [29],

no presentan los campos de problemas indirectos y en los campos históricos dan más

importancia a las variables discretas. Además, los libros modernos carecen de

fundamento matemático y trabajan más la parte de simulación a partir de una

distribución binomial y uniforme discreta, y generando números aleatorios a partir de

variables aleatorias con distribución uniforme continua mediante el uso del ordenador.

Aunque es propio para los ingenieros la aplicación en el uso adecuado de

herramientas estadísticas para la toma de decisiones, los textos de probabilidad y

estadística analizados en esta área priorizan los campos de problemas indirectos. Sin

embargo, sería adecuado presentar una variedad de ejemplos de aplicación que

consideren también los campos de problemas históricos, con mayor rigor matemático

que ayudará a la comprensión del teorema central del límite. Si se quiere que los

alumnos aprecien la utilidad y alcance de este teorema, sería necesario mostrar

diferentes campos de problemas situados a la profesión. Prácticamente en los libros de

textos analizados no hay ejemplos y ejercicios en el contexto de la ingeniería en

acuicultura y pesca, ingeniería marítimo portuario e ingeniería informática.

En general, los libros de textos muestran muchos ejercicios de aplicación del

teorema central del límite para variables con distribución continua, en particular a la

distribución exponencial y uniforme, y por otro lado carecen de problemas de urnas, de

lanzamientos de dados o monedas, que permitan un primer acercamiento tangible del

teorema. Además, falta rigurosidad en los ejemplos resueltos de los libros, pues son

poco claros en mencionar que se está utilizando el teorema en el desarrollo del ejercicio,

es más, no usan el término “aproximado”.

Finalmente, se observa en la mayoría de los libros que a lo más presentan un

ejercicio en cada campo de problemas, a excepción de los campos CP1 y CP4, lo que

implica que el estudiante no va a valorar estos campos de problemas que pueden ser de

mucha relevancia en su profesión por ejemplo, el determinar tamaños de muestras

adecuados en el área industrial, usando el teorema central del límite como herramienta

estadística. El interés de esta investigación es trabajar en el aula con estudiantes de

Page 113: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

106

ingeniería presentándoles, en vez de ejercicios puntuales y descontextualizado,

problemáticas reales en las distintas área de la ingeniería con variadas situaciones de los

campos de problemas definidos del teorema, enfrentados a la resolución de problemas

de razonamiento estadístico, que involucre el uso del ordenador en la simulación y un

proceso metodológico en el análisis de la información con un nivel ligeramente más

matemático en las distribuciones de probabilidades.

4.4. LENGUAJE

El segundo elemento de significado analizado son las palabras, notaciones y

todas las representaciones materiales del objeto abstracto y sirven para describir los

enunciados y propiedades, así como para las situaciones-problemas, sus datos y

procedimientos.

Desde el marco teórico cualquiera de los tipos de elementos considerados puede

representar a otro en el trabajo matemático, es decir, cualquiera de los tipos de

elementos puede jugar el papel de representaciones en función de los objetos abstractos

o de las situaciones en las que intervienen, existiendo una correspondencia semiótica

entre el objeto representante y el objeto representado. En todo caso interesa analizar

específicamente el lenguaje y representaciones materiales utilizadas en relación al

teorema central del límite. Se puede diferenciar tres tipos, siguiendo a Ortiz (1999).

Términos y expresiones verbales

Un primer tipo son las palabras y frases que usamos para describir los conceptos,

sus operaciones y transformaciones. Se encuentran algunas expresiones tales como

teorema del límite, leyes de los grandes números y términos verbales relacionados con

el teorema central del límite como variable aleatoria, distribución normal, muestra

aleatoria, estadístico, distribución muestral, error de estimación.

Considerando que el profesor debe tener en cuenta el vocabulario y asegurar su

comprensión por parte de los alumnos, siguiendo a Ortiz (1999), se diferencian tres

categorías de palabras usadas en la enseñanza de las matemáticas:

1. Palabras específicas de las matemáticas que, normalmente, no forman parte del

lenguaje cotidiano;

2. Palabras que aparecen en las matemáticas y en el lenguaje ordinario, aunque no

siempre con el mismo significado en los dos contextos;

Page 114: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

107

3. Palabras que tienen significados iguales o muy próximos en ambos contextos.

En estas categorías se podría incluir un gran número de expresiones asociadas al

tema, debido a los diversos elementos relacionados con el teorema central del límite. En

particular, Tauber (2001, pp. 148) muestra los múltiples elementos de significado

específico relacionados con la distribución normal, y Méndez (1991, pp. 82) presenta un

mapa conceptual de los elementos que están involucrados con el teorema. Además, la

categoría con mayor número de palabras y frases es la de palabras específicas ya que el

teorema es un objeto puramente matemático, que ha sido analizado a lo largo de la

historia con un nivel avanzado de conocimiento matemático y últimamente por

simulación.

Tabla 4.4.1. Categorías de términos asociados al teorema y a los conceptos en los cuales se apoya

Palabras específicas matemáticas Palabras condistinto significado

Palabrascon igual

significadoTeorema centraldel limite

Conceptosrelacionados

Distribución límite, teorema, teorema central del límite, aproximación, distribución asintótica en el muestreo, convergencia en ley, convergencia de sucesiones de v.a., error de estimación, suma de v.a.i., idénticamente distribuida, no i.d., variable transformada, simulación con uso del ordenador, demostración por f.g.m., función característica.

Distribución normal, binomial, estándar, tipificada, estimación de la media, demostración matemática, propiedades estadísticas, transformación algebraica en la distribución normal, distribución de probabilidad, muestra aleatoria, variables aleatorias discretas y continuas, acotadas y no acotadas, variables dependientes, parámetro, estadístico, cálculo de probabilidades de variables y estadísticos, desigualdad de Chebyshev, ley de los grandes números, varianza, error estándar de la media, desviación típica muestral y poblacional, ajuste al histograma, curva de distribución, tablas de distribución normal estándar, campana de Gauss, Distribución Gaussiana, distribuciones clásicas, distribución de diferencias de medias muestrales, función de una variable aleatoria, estimación por intervalos, contraste de hipótesis, estimador máximo verosímil, estimador por los momentos, errores aleatorios.

Suficientemente grande, simulación manipulable, contraejemplo, muestra grande, generalización, bajo ciertas condiciones

Modelo,confiabilidad, valor medio, valor esperado, promedio, datos, dispersión, simetría, tamaño de, observacionesindependientes,población,muestreo, con y sin reemplazo, infinito, representacióngráfica de datos, análisis,demostración informal.

Central,muestra, casoparticular,

Fórmula, variación,observa-ciones,proporción,finito.

El interés es considerar en la enseñanza los elementos del lenguaje que

conducirán a la comprensión del teorema central del límite, tener presente aquellos que

afectan el aprendizaje del teorema y los que no son entendidos por los estudiantes. En la

Tabla 4.4.1 se presentan los términos y expresiones de las tres categorías asociadas a los

Page 115: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

108

elementos específicos del teorema y a los que se refieren a los conceptos relacionados.

Notaciones y símbolos

Las notaciones simbólicas son un elemento característico del lenguaje

matemático y no sólo se emplean para representar los conceptos sino para realizar

operaciones con los mismos y constituyen una forma abreviada y precisa para denotar

conceptos o proposiciones. El simbolismo juega un papel fundamental, porque permite

trabajar a un alto nivel de complejidad. La potencialidad de algunos símbolos para

trabajar dualmente, evocando bien un proceso de cálculo de un resultado, o un objeto

que puede manejarse en un ámbito superior es particularmente adecuado para reducir el

esfuerzo cognitivo. Por todo ello, se deduce la importancia del símbolo en el

aprendizaje, encontrando las siguientes expresiones simbólicas del teorema central del

límite en los dos puntos siguientes:

a. Expresiones usadas en la formulación del teorema, que son las siguientes: Para la

muestra aleatoria nXXX ,......,21, , suma de n variables aleatorias n

i

in XS1

,

distribución muestral de la media de la muestra nNX 2, para n

suficientemente grande, fórmula de estandarización de la media muestral ns

x 0 ,

representación para muestras grandes de un intervalo de confianza para la media

nSZx )21( , el momento de orden k de la v. a. iX está acotado

)( k

iXE . Otras notaciones directas del teorema son dadas en las Secciones 4.6 y

4.8.

b. Expresiones usadas al describir conceptos relacionados: estadístico de la media de la

muestra n

xxX i)( , función de probabilidad conjunta de las observaciones

muestrales n

iiXn xfxxxf

121 )(),....,,( , esperanza de la suma de v.a. )()( in XESE ,

varianza de la suma de v.a. )()( in XVarSVar , distribución normal de media y

desviación típica es N( , ), función característica de X es dada por

itXeEt)( . Otras notaciones relacionadas con el teorema son dadas en la Sección

4.7.

Page 116: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

109

Representaciones gráficas

Además del lenguaje y los símbolos, encontramos con frecuencia

representaciones de tipo diverso. Uno de los elementos característicos de la estadística

son los gráficos. En la mayoría de los textos es común ver el histograma como primer

acercamiento al teorema. En particular, el texto Johnson y Kuby (2004) muestra varias

representaciones de distribuciones. Se ha encontrado los siguientes tipos:

a. Al enunciar el teorema encontramos histogramas para representar la distribución

empírica de las medias muestrales y gráficos de control de medias para representar

que la distribución de las medias muestrales estará más próxima a una distribución

normal que las mediciones individuales. Moore (1995) señala que los gráficos de

control son importantes en la industria y sirven para ilustrar el uso de las

distribuciones muestrales en inferencia estadística.

b. Al describir conceptos relacionados hemos hallado gráficos de barras para ilustrar

la distribución de probabilidad teórica de la población, distribución de frecuencias

relativas asimétricas, distribuciones poblacionales Uniforme, en forma de J, en

forma de U y normal, distribución muestral de la media aritmética para distintos

tamaños de muestras.

Simulaciones

Heitele (1975) señala que uno de los principios base de la simulación de

fenómenos aleatorios es la posibilidad de estudiar las propiedades de un fenómeno

aleatorio sustituyéndolo por otro isomorfo. El interés de la simulación en la enseñanza

de la estadística y de la probabilidad es destacada entre otros por Fischbein (1975),

Biehler (1991, 1997), Estepa (1993) y Batanero (2001) señalando que la simulación

permite poner en manos del alumno un nuevo instrumento que hace posible la

exploración y el descubrimiento de conceptos y principios que de otro modo serían

mucho más abstractos, contribuyendo a la mejora de la intuición probabilística.

Por otro lado hay que tener ciertas precauciones. Countinho (2001) plantea que

no es sencillo la actividad de simulación, observando diferentes dificultades de los

alumnos al proponerles situaciones con modelos de urnas; tales como, dificultad de

manejo de software, resistencia al usar la simulación y la aproximación experimental,

dificultad en aceptar datos de simulaciones que no han recogido personalmente y

dificultad en diferenciar la estimación de la probabilidad que proporciona la simulación

Page 117: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

110

del verdadero valor teórico de la probabilidad.

Godino (1998) justifica el uso de materiales en la medida que haga posible el

planteamiento de problemas significativos, dentro de situaciones didácticas con

oportunidad de indagar posibles soluciones, expresar dichas soluciones y razonar su

validez. En particular, el empleo de la simulación es especialmente útil en la enseñanza

de las distribuciones en el muestreo. Godino (1995) manifiesta que al realizar muestreos

repetidos con el ordenador, los puntos esenciales en estas distribuciones son reconocer

que el estimador es una variable aleatoria, que se puede conocer el tipo de distribución

que sigue el parámetro, y que el valor esperado de un estimador insesgado se acercará al

del parámetro en la población.

Lipson (1994) nos dice que la idea de distribución en el muestreo es compleja y

su comprensión no puede disociarse de la comprensión del proceso de muestreo que es

dinámico, depende de la población, el tipo de muestras extraídas, el estadístico que se

calcule a partir de estas muestras y su distribución. Se destaca el trabajo que están

realizando delMas, Garfield y Chance (1999, 2004) y Chance delMas, Garfield (2004)

en desarrollar actividades de simulación en las distribuciones muestrales, para mejorar

el razonamiento estadístico de los estudiantes.

En los textos Rossman (1996), Mendenhall y Sincich (1997), Johnson y Kuby

(2004) se proponen ejercicios para generar muestras aleatorias de observaciones de

diversas distribuciones de probabilidad, usando los paquetes de software estadístico

MINITAB, SAS y planilla electrónica EXCEL. En este proceso de estudio se quiere

confrontar a los alumnos con problemas cuya solución requiera el uso de los elementos

relacionados con nuestro teorema central del límite. Se puede mencionar las siguientes

representaciones simuladas de interés: a) Simulación con material manipulable: para

muestras pequeñas se utiliza el aparato de Galton, así como los dispositivos de los dados

y bolas extraídas de urnas mediante las anotaciones del experimento con lápiz y papel;

b) Simulación con el ordenador para muestras grandes.

Los programas estadísticos actuales ofrecen simulaciones variadas de

representaciones gráficas como numéricas para muestras grandes, además de superponer

distribuciones de probabilidades. Sin embargo, la simulación en las distribuciones

muestrales mediante distintos materiales (material manipulable, software estadístico,

ordenador, libros, representaciones gráficas) de apoyo a descubrir y comprender

conceptos básicos del teorema central del límite es todo un desafío para los docentes e

investigadores en la enseñanza y aprendizaje del tema.

Page 118: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

111

Conclusiones sobre el lenguaje y representaciones presentes en los textos

analizados

En la Tabla 4.4.2 se presenta un resumen de las expresiones y representaciones

del teorema. Debido a la diversidad de expresiones del teorema central del límite y los

conceptos relacionados con el teorema, hemos considerados solamente los términos

específicos del teorema, encontrando que son los textos de estadística matemática los

que la presentan, además de un texto para ingenieros, Scheaffer y McClave (1993).

Observamos además que estas expresiones tienden a no ser considerados en los nuevos

textos y ediciones. El lenguaje más común para referirse al teorema es a través de los

símbolos, presente en todos los textos a excepción de Johnson y Kuby (2004).

Tabla 4.4.2. Lenguaje y representaciones del teorema presente en los textos

Textos [4] [7] [8] [10] [11] [12] [13] [15] [17] [19] [21] [23] [26] [27] [28] [29]

Términos Símbolos

Gráficos

Simulación

En relación a las representaciones gráficas es escasa su presencia en los textos

analizados, ya que la mayoría se limita a los histogramas de la distribución binomial. Se

destaca el texto de Johnson y Kuby (2004) que muestra gráficos para distintos tamaños

de muestras en varias distribuciones no clásicas. De igual forma, llama la atención que

el lenguaje menos utilizado en los libros sea la simulación, parece que aún no

considerado de relevancia por los autores modernos como apoyo didáctico a la

comprensión del teorema. De los ocho textos de estadística para ingenieros sólo tres la

presentan. Además, se encuentra que sólo los textos Johnson y Kuby (2004) y Devore

(2001) intentan conducir al alumno de la simulación manual a la simulación con uso del

ordenador, transferencia de secuencia didáctica del teorema que consideramos

importante.

4.5. PROCEDIMIENTOS

Los procedimientos y algoritmos son las técnicas específicas o estrategias

realizadas para la resolución de problemas. Las situaciones-problemas relacionadas con

el teorema se puede resolver utilizando las siguientes técnicas:

Page 119: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

112

AP1: Cálculo algebraico y transformación de variables aleatorias

El procedimiento general de resolución de problemas presente en la mayor parte

de los libros es el siguiente: entender el problema, reconocer la distribución inicial de la

población, obtener la distribución en el muestreo de la variable aleatoria,

estandarización normal de la variable aleatoria, calcular la probabilidad pedida mediante

la normal estándar, interpretación. A continuación se describe dos casos típicos en los

libros:

El primero es el cálculo algebraico de la suma de variables aleatorias. Dos son

las distribuciones discretas más utilizadas por los autores, la distribución binomial y la

de Poisson. Se reproduce un ejemplo cuya solución comienza definiendo la variable nS

“número de árboles que mueren en la muestra de tamaño 250”, como suma de variables

Bernoulli de parámetro p = 0,2; que es la proporción de árboles que mueren por el

producto químico. Se estima la probabilidad pedida )60( nSP mediante el teorema

central del límite (n es suficientemente grande), determinando la esperanza y varianza

de la variable suma, que son respectivamente 50 y 40. Al estandarizar la variable suma,

usando la corrección de continuidad, se recurre a la tabla de la distribución normal

estándar para obtener el valor crítico; en este caso de forma indirecta. Así, la

probabilidad de que mueran al menos 60 árboles es de un 5,7%. Este campo de

problemas permite al alumno en forma concreta comparar esta aproximación con el

cálculo de probabilidad de la variable suma en forma exacta, mediante el modelo de la

distribución binomial de parámetros n = 250 y p = 0,2.

_____________________________________________________________________________Las compañías eléctricas podan los árboles que crecen cerca de sus líneas para evitar cortes eléctricos debidos a la caída de árboles durante las tormentas. La aplicación de un producto químico para retrasar el crecimiento de los árboles es más barato que podar los árboles, pero estos productos matan algunos de los árboles. Suponga que un producto químico de este tipo matará el 20% de los arces. La compañía eléctrica prueba este producto con una muestra aleatoria de 250 arces. a) ¿Cuál es la media y la desviación estándar del número de árboles de la muestra que mueren? b) ¿Cuál es la probabilidad de que mueran al menos 60 árboles (el 24% de la muestra)? Moore (1995, pp. 327)

El segundo caso es el cálculo algebraico de la media muestral de variables

aleatorias. Este caso es el más típico y presente en todos los libros de textos analizados.

Las situaciones planteadas no son explícitas en la aplicación del teorema central del

límite, en cuanto a separar el procedimiento de cálculo primero para la suma de

variables aleatorias y luego para la media aritmética. Esto puede ser una dificultad de

Page 120: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

113

aprendizaje del tema en los alumnos. El siguiente ejemplo de aplicación en esta práctica

típica consiste en calcular la probabilidad 58XP .

_____________________________________________________________________________Los resultados de las pruebas finales de todos los alumnos del último año de las preparatorias de cierto estado tienen una media de 60 y una varianza de 64. Una generación específica de cierta preparatoria de n= 100 alumnos tuvo una media de 58. ¿Puede afirmarse que esta preparatoria sea inferior? (Calcular la probabilidad de que la media muestral sea a lo más 58 cuando n = 100). Mendenhall, Wackerly y Scheaffer (1994, pp. 299).

AP2: Tipificación / destipificación del cálculo de probabilidades para obtener una

muestra aleatoria de tamaño adecuado

La resolución de problemas de tipificación o su inversa es importante en el

trabajo con la distribución normal. En el siguiente ejemplo, que se observa en varios

textos, se desea determinar que tan grande debe tomarse una muestra, dada un error de

estimación entre los parámetros poblacionales y muestrales y con cierta probabilidad.

La hipótesis de trabajo en términos probabilísticos es 95,03,0XP . El desarrollo

de esta expresión conduce a encontrar un tamaño de muestra adecuado. Para ello, se

estandariza el error de estimación del parámetro )(Xn a la normal tipificada, por

el teorema central del límite. Mediante la tabla normal y despejando la incógnita n, se

concluye que se necesitan 43 observaciones para que la media de la muestra tenga

probabilidad del 95% de estar dentro de 0,3 onzas de la media de la población. Moore

(1995, pp. 70) plantea un ejemplo en esta situación utilizando la tabla de la distribución

normal.

Se ha observado durante mucho tiempo que una máquina determinada para llenar botellas, tiene una

varianza en las cantidades de llenado aproximadamente de 12 onza. Sin embargo el promedio de las onzas de llenado depende de un ajuste que puede cambiar de día a día, o de operador a operador.

¿Cuántas observaciones se deben efectuar en la muestra para que X quede a menos de 0,3 onzas de

con una probabilidad de 0,95? Scheaffer y Mc Clave (1993, pp. 236).

AP3: Cálculo de probabilidades referidas al teorema con calculadora, tablas de

distribución o programa de ordenador

Para muestras de tamaño grande es útil el cálculo de probabilidades mediante

simulación con el ordenador, en la cual obtener una muestra de tamaño n en una

población es equivalente a sacar una bola (la muestra de tamaño n) de una población

(todas las muestras de tamaño n de la población de referencia), y obtener de tal muestra

el estadístico que queremos calcular. Creemos que uno de los enfoques actuales de la

Page 121: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

114

estadística debe ser la interpretación de los resultados de salidas de paquetes estadísticos

con el ordenador, utilizando datos reales y situaciones de interés del educando. La

mayor parte de los paquetes de software de estadística para ordenadores cuenta con

algoritmos integrados para generar muestras aleatorias de observaciones de diversas

distribuciones de probabilidad.

De los textos analizados sólo dos libros plantean problemas con ordenador, con

ejercicios e instrucciones anotadas. Mendenhall y Sincich (1997) presentan ejercicios

del tema con uso de paquetes estadísticos SAS y MINITAB (pp. 333). Johnson y Kuby

(2004) además proponen ejercicios utilizando MINITAB, EXCEL y la calculadora TI-

83 (ver comandos en las páginas 252 para generar n datos aleatorios de una distribución

normal dado su media y desviación estándar y en la página 50 para elaborar un

histograma). A continuación, se muestra un ejemplo en que se requieren los siguientes

comandos de Minitab para su resolución: Normal Random data, Mean Row Statistics y

Histogram. Esta práctica permite al estudiante ver si el teorema central del límite puede

comprobarse empíricamente, es decir, si se cumple cuando la distribución muestral se

forma con las medias muestrales que resultan de un muestreo aleatorio.

_____________________________________________________________________________MINITAB. a) Use una computadora para elegir aleatoriamente 200 muestras de tamaño 24 de una población normal con media 20 y desviación estándar 4,5; b) Encuentre la media muestral para cada una de las 200 muestras; c) Use las 200 muestras para elaborar un histograma, encuentre la media de las medias muestrales y encuentre su desviación estándar; d) Compare los resultados de c) con las

descripciones del teorema central del límite ( X

, nX

, para n suficientemente grande la

distribución de las medias muestrales se vuelve aproximadamente normal); e) ¿Qué efecto tiene el incremento del tamaño de la muestra de 6 a 24?, ¿Qué efecto tiene el incremento de 100 muestras a 200 muestras? Johnson y Kuby (2004, pp. 289).

AP4: Cálculo de probabilidades referidas al teorema a partir de simulación con

materiales manipulables

Se considera que un primer acercamiento del estudiante al teorema central del

límite, debiera ser a través de la simulación manual con tamaños de muestras pequeños,

con lápiz y papel, de manera que adquiera el procedimiento de trabajo de la aplicación

del teorema central del límite. Luego, se pueden diseñar ejercicios para ser resueltos con

ayuda de un ordenador. Por ejemplo, para generar muestras de tamaño 3, podemos

tomar tres tarjetas idénticas numeradas 5, 7 y 9; las colocamos dentro de una bolsa y

extraemos la muestra aplicando el criterio de reemplazo entre cada extracción. O bien,

podemos usar un dado, de modo que 5 esté representado por 1 y 2; 7 por 3 y 4; y 9 por 5

Page 122: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

115

y 6. Otra opción es la de extraer las muestras usando la tabla de números aleatorios.

Se presenta un ejemplo de cálculo de la distribución muestral teórica, Figura

4.5.1, tomado de Johnson y Kuby (2004, pp. 284). El procedimiento de resolución es: a)

Considerar todas las muestras posibles de tamaño 2 que pueden extraerse de una

población que contiene los números 2, 4 y 6; b) Representar la distribución de la

población; c) Calcular la media µ y desviación estándar ; d) Enumerar todas las

muestras posibles de tamaño 2 y calcular la medias de estas muestras; e) Obtener la

distribución de probabilidad de estas medias y calcular la media y el error estándar;

f) Dibujar el histograma de la distribución muestral. Así, se demuestran las siguientes

propiedades:

1. la media X

de la distribución muestral es igual a la media µ de la población, con

valor 4,0;

2. El error estándar de la media para la distribución muestral es igual a la desviación

estándar de la población dividida por la raíz cuadrada del tamaño de la muestra

15,1263,1nX

;

3. La distribución se comporta, aproximadamente, de manera normal.

Figura 4.5.1. Ejemplo de simulación con pequeñas muestras

Page 123: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

116

Conclusiones sobre los procedimientos presentados

Se observa en la Tabla 4.5.1, que la estrategia más común para resolver los

problemas es el cálculo algebraico de la suma o media de v.a., presente en todos los

textos analizados. Por el contrario, la técnica menos empleada en los libros es la

tipificación o su inversa. Se considera que debería estar presente este procedimiento en

muchos textos, ya que le exige al alumno habilidad en la operatoria algebraica y

dominio del teorema como etapa inicial en el aprendizaje del teorema central del límite

y sus elementos relacionados como por ejemplo el error de estimación.

Tabla 4.5.1. Procedimientos que presentan los libros seleccionados

Textos [4] [7] [8] [10] [11] [12] [13] [15] [17] [19] [21] [23] [26] [27] [28] [29]

AP1: Cálculo algebraico y transformación de variables aleatorias

AP2: Tipificación/ destipificación AP3: Cálculo de probabilidades con calculadora, tablas estadísticas u ordenador AP4: Cálculo de probabilidades a partir de simulación

Con los libros y textos nuevos, la simulación se hace presente cada vez más

como técnica específica de presentar el teorema, pero no con la misma fuerza

innovadora que tiene la tecnología. De los textos considerados, sólo Mendenhall y

Sincich (1997) y Johnson y Kuby (2004) enfatizan la importancia de las aplicaciones

del teorema central del límite para muestras grandes, a través del planteamiento de

problemas con el ordenador. Se encuentra esta técnica en cinco de ocho libros de

ingeniería, pero llama la atención que sólo en tres de ellos con apoyo del ordenador.

De los 16 libros hay cuatro que presentan tan solo un algoritmo de resolución de

problemas al estudiante, lo que consideramos que puede ser preocupante en la

comprensión del teorema. En general, los textos de matemáticas carecen de simulación.

Destacamos los textos para ingenieros, Scheaffer y Mc Clave (1993) y Devore (2001)

que presentan tres de los cuatro algoritmos de aplicación del teorema, así también el

texto moderno de Johnson y Kuby (2004).

En la enseñanza del teorema, se planteará una secuencia didáctica en el

aprendizaje del teorema, partiendo con situaciones problema tangibles para el alumno

con muestras pequeñas, desarrollo de la operatoria algebraica con el nivel matemático

acorde a los requerimientos de un ingeniero, distinguiendo el cálculo de probabilidades

Page 124: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

117

para variables transformadas de la suma y la media aritmética. Se considerará el

enfoque actual del razonamiento estadístico con el uso de las nuevas tecnologías en la

interpretación gráfica de variables con el ordenador.

4.6. ENUNCIADOS DIFERENCIADOS DEL TEOREMA

Se encuentran diversos tipos de presentaciones para el teorema, ya sea general o

formal que enfatizan diferentes aspectos del significado de los conceptos o se remiten a

diferentes formas de aplicación. En primer lugar se clasifica los enunciados según se

haga referencia a la convergencia en probabilidad o simplemente a la convergencia

funcional ordinaria, encontrando dos casos diferenciados.

E1: Enunciado del teorema mediante la convergencia de sucesiones de variables

aleatorias

Se presenta el teorema de manera formal y rigurosa con un nivel de matemática

avanzada. Damos el siguiente ejemplo dado por Cuadras (1999, pp. 189) para variables

aleatorias independientes no idénticamente distribuidas:

_____________________________________________________________________________Si en una sucesión de v.a. independientes de medias E(Xi) = µi y varianzas Var(Xi) =

2i , entonces, en

ciertas condiciones generales, la variable suma, reducida: )1,0(2

NS LEYENCONVERGE

i

in

La comprensión de este enunciado, que indica que la suma de v.a. tiende a

distribuirse según una normal reducida, cuando n , requiere que el estudiante esté

familiarizado con los conceptos de convergencia en probabilidad, sucesiones de

variables, límite y error de estimación. Además se puede encontrar diversos matices.

Por ejemplo, Lebart, Morineau y Fénelon (1985) introducen la siguiente definición:

Se dice que una sucesión de variables nX , definidas en el mismo espacio ,

converge en probabilidad hacia una variable X, si para todo 0 :

1XXPLim nn

.

Otro tipo de convergencia es la de convergencia en ley, que implica la

convergencia funcional de la función de distribución:

Page 125: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

118

Se dice que la sucesión nX converge en ley hacia la variable X, si la función

de distribución )(xFnX converge hacia la función de distribución )(xFX .

Cabe señalar, que se puede demostrar que la convergencia en probabilidad

implica la convergencia en ley.

E2: Enunciado del teorema como límite ordinario de una sucesión de funciones

Otra manera formal de enunciar el teorema central del límite es por medio de

límites funcionales. Se reproduce la formulación del teorema por Kalbfleisch (1984, pp.

189) en términos de límite de funciones de la suma de n variables aleatorias

independientes, discretas o continuas con igual media y varianza. En este caso la

convergencia tiene un matiz determinista, mientras que en el anterior es aleatoria (en

probabilidad).

_____________________________________________________________________________Denotemos por nf la función densidad de probabilidad de la suma nS , o la altura del histograma de nS

en el caso discreto. El teorema central del límite afirma que, para todo número real z,

2/exp2

1)( 2zzfLim n

n.

_____________________________________________________________________

Debemos observar que en lugar de expresar el teorema a través de la función

densidad de probabilidad, se puede definir con la función de distribución acumulada de

la normal, como lo expresa Lebart y cols. (1985, pp. 56):

Se verifica que la distribución de nS , de variables aleatorias independientes e

idénticamente distribuidas, tiende a hacia la ley de Laplace-Gauss:

x

Sn

dzzxFLimn

2/exp2

1)( 2 .

Otra clasificación es según la generalidad con que se presente el teorema y así se

obtienen los casos siguientes:

E3: Enunciado del teorema para la suma de variables aleatorias independientes no

idénticamente distribuidas

Page 126: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

119

Si una v.a. puede representarse como una suma de n variables aleatorias

independientes cualesquiera, entonces esta suma para un n suficientemente grande está

distribuida aproximadamente normal.

_____________________________________________________________________

Sea nXXX ,.......,, 21 ,... una sucesión de variables aleatorias independientes con E(Xi) = µi y

Var(Xi) = 2i , i=1,2,.... Sea nn XXXS 21 . Luego bajo ciertas condiciones generales

ni i

n

iin

n

S

Z

12

1 tiene aproximadamente la distribución N (0 , 1). (Meyer, 1992, pp. 332).

E4: Enunciado del teorema para la suma de variables aleatorias independientes

idénticamente distribuidas

Esta presentación más restringida del teorema es la más común en los libros,

pero en la mayoría se presenta para la media muestral más que la suma. A continuación

se ilustra un ejemplo para el caso de la suma:

____________________________________________________________________________Si se extrae una muestra aleatoria de n observaciones de una población con una media finita µ y una varianza finita 2, entonces, si n es lo bastante grande, la distribución de muestreo de la suma in XS

se puede aproximar con una función de densidad normal cuya media es nµ y varianza n 2. (Mendenhall y Sincich, 1997, pp. 315)

E5: Enunciado del teorema de forma general

Son varios los textos aplicado a la ingeniería que introducen el tema sin

formulación matemática. Hoy en día es más conocido el teorema de manera general

para el estimador de medias muestrales. Moore (1995, pp. 304) presenta el siguiente

enunciado:

_____________________________________________________________________________Obtén una muestra aleatoria simple de tamaño n de cualquier población de media µ y desviación típica

finita . Cuando n es grande, la distribución de la media muestral X se aproxima mucho a la

distribución normal ),( nN con media µ y desviación típica n .

E6: Enunciado intuitivo del teorema

Una forma de presentar el teorema es a través de la manipulación con objetos

didácticos concretos de un experimento. Montgomery y Runger (1996, pp. 302)

introducen el teorema mostrando gráficamente que la aproximación normal para X

Page 127: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

120

depende del tamaño n de la muestra, mediante el lanzamientos de varios dados: a)

primero muestra la distribución al lanzar un dado, cuyas probabilidades son iguales 1/6

para todos los valores obtenidos, 1,2,3,4,5 o 6; b) Luego presenta los gráficos de la

distribución del puntaje promedio obtenidos cuando se lanzan dos, tres, cinco y diez

dados respectivamente. Se hace notar que, si la población (caras de un dado) está

relativamente lejos de ser normal, la distribución de los promedios queda aproximada,

de manera razonablemente buena, por la distribución normal, incluso para tamaños de

muestra tan pequeños como cinco. En particular, para muestras pequeñas, el teorema

central del límite funciona donde la población sea continua, unimodal y simétrica.

Conclusiones sobre los enunciados presentadas

Observamos en la Tabla 4.6.1 que el enunciado presente en la mayoría de los

textos es la correspondiente a la suma de v.a.i. idénticamente distribuidas (E4). Los

enunciados menos encontrados en los libros son los de mayor rigor matemático (E1 y

E2), seguido del enunciado del teorema central del límite para v.a.i. no idénticamente

distribuida. La tendencia de los textos actuales es hacia la presentación intuitiva del

teorema, contrario a los libros más antiguo que lo introducen de manera formal el

teorema.

Tabla 4.6.1. Enunciados que presentan los libros seleccionados

Textos [4] [7] [8] [10] [11] [12] [13] [15] [17] [19] [21] [23] [26] [27] [28] [29E1: Mediante convergencia de sucesiones de v.a. E2: Como límite ordinario de una sucesión de funciones

E3: Para la suma de variables independientes no idénticamente distribuidas

E4: Para la suma de variables independientes idénticamente distribuidas

E5: Enunciado de forma general

E6: Enunciado intuitivo del teorema

El texto Wisniewsky y Velasco (2001) presenta cuatro enunciados, y los clásicos

como Canavos (1992) y Peña (1995) dan sólo algunos de los seis. El texto de Johnson y

Kuby (2004) prioriza sólo la presentación del teorema de forma general y mediante la

simulación. Por el contrario, son los textos de estadística matemáticas los que presentan

Page 128: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

121

más formas de introducir el teorema central del límite, por ejemplo en el libro de De

Groot (1988) encontramos cinco enunciados del teorema, con nivel avanzado en

matemática y de forma general. Por último observamos en los textos que los enunciados

E4 a E6 no son precisos y claros, lo hacen por medio de un ejercicio planteado.

4.7. PROPIEDADES

Tauber (2001) en su estudio de la distribución normal clasificó las propiedades

en: Propiedades geométricas: aquellas que se derivan del análisis de la gráfica de la

función de densidad; propiedades estadísticas: aquellas que relacionan la distribución

normal con la predicción de valores y el cálculo de probabilidades; y propiedades

algebraicas: aquellas donde la función densidad es considerada como función

algebraica. A continuación se presentan las propiedades encontradas que son de tres

tipos:

1. Propiedades de la distribución de la suma o media de variables aleatorias que

interviene en el teorema central del límite;

2. Propiedades de ciertas distribuciones para valores grandes de sus parámetros (se

trata de aplicaciones concretas del teorema central del límite);

3. Propiedades de la distribución normal, que se deduce al aplicarlo. Para este caso

sólo presentamos un resumen, puesto que fueron analizadas por Tauber (2001).

Propiedades de la distribución de la suma de variables que interviene en el

teorema

Las propiedades que a continuación se dan, de alguna manera ponen en

correspondencia diferentes elementos del teorema central del límite. La mayoría están

clasificadas en propiedades estadísticas debido a que el teorema está inserto en la

unidad de las distribuciones muestrales que tiene como base la teoría y cálculo de

probabilidades. Las propiedades que realizan transformaciones son consideradas

algebraicas (P5 y P6).

P1: La media de la distribución aproximada de una suma de variables aleatorias es la

suma de las medias

Considere las v.a. nXXX ,.......,, 21 con valores medios n,......,1 , respectivamente,

y varianzas 221 ,...., n respectivamente, además de n constantes numéricas naa ,......,1 . Si

Page 129: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

122

las v.a. iX son o no independientes, se cumple que la media de la combinación lineal de

las iX es la suma de la medias. Esto es,

nnnnii aaaXEaXEaXaE 221111 )()( . En forma general, esto conduce

a la ley débil de los grandes números que dice que para una sucesión de v.a., la variable

media nX converge en probabilidad hacia la variable degenerada (constante) (Lebart

y cols., 1985).

P2: La varianza de la distribución aproximada de la suma de variables aleatorias es la

suma de las varianzas

Continuando el caso anterior, si nXXX ,.......,, 21 son independientes se cumple

que: 2221

21

1

2

1)( nn

n

ii

n

iii aaXVaXaVar

i. En el caso para nXXX ,.......,, 21

cualesquiera se tiene: ji

n

i

n

jjinn XXCovaaXaXaVar ,

1 111 . (Devore, 2001). En el

caso en que la muestra proceda de una población con media y varianza 2 y como

combinación lineal consideramos la media muestral X , se tiene que la varianza de la

media muestral es n

XVar2

, además de XE (Ardanuy y Martín, 1998). La

relación de este caso con la distribución normal es la siguiente: si la población de

partida es normal ),( 2N resultará que X tendrá también una distribución normal

),( 2 nN . Para el caso en que la población madre no sea normal, enunciada en P3, la

distribución muestral de X se aproxima a una normal ),( 2 nN para tamaños de

muestra 30n (criterio de tipo práctico).

P3: La media aritmética de una muestra aleatoria de tamaño suficientemente grande

sigue una distribución aproximadamente normal

Esta propiedad está presente en todos los textos analizados, para definir el

teorema central del límite. Son pocos los libros que primero definen el teorema para la

suma y luego para el promedio de la muestra. Canavos (1992, pp. 230) lo plantea en

lenguaje simbólico y verbal:

Sean nXXX ,.......,, 21 n variables aleatorias independientes e igualmente

Page 130: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

123

distribuidas con una distribución de probabilidad no especificada, y que tienen

media )( iXE y 2)( iXVar finita. El promedio muestral

)(1

1 nn XXn

X tiende a una distribución normal con media y varianza

n2 .

Ardanuy y Martín (1998) observan que a veces se obtiene la muestra por medio

de un muestreo sin reposición de una población con N unidades estadísticas (muestreo

en una población finita). En este caso las n variables aleatorias serán dependientes y su

media muestral tiene el siguiente valor esperado y varianza: XE y

)1(

)(),(

2)(

1 2

21

2 N

nN

nXXCov

nXVar

nXVar

jiji

n

ii , donde N es el tamaño de la

población y n el tamaño de la muestra. Para muestras grandes se tiene que X es

aproximadamente normal con esa media y varianza. Aquí nuevamente observamos que

el valor esperado de X es independiente de N y n y además que para N , la

expresión )1()( NnN tiende a 1 y, por lo tanto, la varianza de la media muestral X

será aproximadamente n2 . En la práctica suele considerarse buena esta aproximación

cuando la fracción de muestreo n/N es menor de un 10%.

P4: La aproximación mejora con el número de sumandos

Si bien la distribución límite de la suma in XS de v.a. no depende de las

distribuciones de las iX , la rapidez con la que la suma se aproxima a la normal depende

en gran medida de la forma de dichas distribuciones. Kalbfleisch (1984) dice que si son

simétricas, la aproximación a la normal es bastante buena para valores muy pequeños de

n. Sin embargo, si las distribuciones de las iX son muy asimétricas, n tiene que ser a

veces muy grande para obtener una aproximación satisfactoria. Algunos ejemplos

gráficos son presentados en Johnson y Kuby (2004, pp. 265,267,286 y 287) de

aproximación a la normal para distintos tamaños de muestra de la media muestral en las

distribuciones binomial, uniforme, en forma de J, de U y normal. También, Devore

(2001, pp. 226) ilustra un ejemplo de simulación para una distribución lognormal

poblacional sesgada, observando la aproximación a la normal para distintos tamaños de

muestra. Otros ejemplos para estudiar el comportamiento del tamaño de muestra son

dados en Mendenhall y Sincich (1997, pp. 302 a 310).

Page 131: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

124

P5: Las transformaciones lineales de variables aleatorias también siguen una

distribución asintótica normal

Caso 1: La distribución aproximada de la media muestral es presentada en el

teorema como variable transformada a la normal estándar, siendo la expresión más

común en los libros. Por ejemplo Velasco y Wisniewski (2001, pp. 218) hacen la

siguiente definición del teorema:

Si nXXX ,.......,, 21 constituyen una muestra aleatoria de una población infinita

que tiene la media , la varianza 2 , entonces la distribución límite de

n

XZ

n cuando n , es la distribución normal tipificada.

Caso 2: El caso anterior se puede ampliar a una clase grande de funciones de X

o de funciones de cualquier variable aleatoria asintóticamente normal. Scheaffer y

McClave (1993) lo presenta en la forma:

Mediante el uso de las propiedades de los desarrollos de las series de Taylor,

podemos conocer el comportamiento de una función de X , )(Xf , donde )(xf

es una función de valor real tal que su derivada existe cerca de y es distinta

de cero. La variable transformada Z tiene una función de distribución que

converge a las distribución normal estándar cuando n , )(

)()(`g

gXgnZ

P6: Las medias muestrales en dos poblaciones sigue una distribución aproximadamente

normal

Si tomamos muestras aleatorias independientes de tamaño 1n y 2n extraídas a

partir de poblaciones con medias 1 y 2 y varianzas 21 y 2

2 , respectivamente,

entonces la distribución muestral para la diferencia de medias 21 XX es

aproximadamente normal, con media y varianza dada por: 21 y 2221

21 nn .

(Ardanuy y Martín 1998, pp. 129).

Page 132: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

125

P7: Aproximación de una distribución discreta por una continua

Sea nS la variable aleatoria “número de aciertos” en n experiencias de Bernoulli;

si iX es una variable de Bernoulli, la variable n

iin XS

1 sigue una ley binomial, con

npSE n )( y )1()( pnpSVar n . Pongamos: )1( pnp

npSZ n

n . Cuando n tiende a infinito,

la función distribución de nS tiende a la )1(, pnpnpN . (Lebart y cols., 1985). En

Estadística se utiliza la transformación “arco seno” 4/3

)8/3(

n

XsenarcY que transforma

la variable X con distribución ),( pnB en una variable Y aproximadamente normal

npsenarcN 41, .

P8: Aproximación de algunas distribuciones clásicas a la distribución normal

Distribución Poisson: Para grande, la distribución Poisson )( se aproxima

a la distribución normal ,N . La suma de v.a. independientes con distribución de

Poisson es también poisson de parámetro la suma de parámetros y esta aproximación es

aceptable para 5 y mejora a medida que aumenta . En estadística se utiliza

también la transformación “raíz cuadrada” 8

3XY que convierte la variable X con

distribución )( en una variable Y con distribución normal aproximada 41,N .

Distribución Gamma: Como la distribución gamma ),(G , siendo entero, es

la distribución de la suma de variables aleatorias independientes, con distribución

exponencial de parámetro , la distribución gamma se puede considerar

aproximadamente normal 2,N . La aproximación es suficiente para 15 .

Distribución Uniforme: Sea X v.a. con distribución uniforme en el intervalo (-

1,+1). Si nXXX ,.......,, 21 son v.a. independientes con la misma distribución que X,

entonces la v.a. in XS tiene media 0 y varianza n/3. Luego la v.a. 3n

SZ n tiene

aproximadamente una distribución normal estándar N(0,1). Esta distribución se utiliza

para generar números aleatorios con distribución N(0,1). Es suficiente tomar n = 12

(Cuadras, 1999).

Distribución Log-Normal: La v.a. X sigue una distribución logarítmico-normal

),,( 2baLN de parámetros una constante a, eb y 2 , si la variable transformada

Page 133: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

126

)log( aXY sigue la distribución normal ),( 2N . Cuadras (1999) señala que bajo

ciertas condiciones de regularidad, si nXXX ,.......,, 21 son v.a. independientes, la

distribución de la v.a. producto nn XXXP 21 puede aproximarse a una log-normal si

n es grande, independientemente de la distribución de cada iX . Es decir, nP se

distribuye aproximada a una )1(,222 22 eebebaN .

P9: Los errores aleatorios siguen una distribución asintótica normal

Lo errores llamados aleatorios, que se presentan en observaciones astronómicas,

pesadas de balanzas, etc., y en general en la mayoría de las medidas con algún aparato,

son la suma de un número elevado de errores elementales independientes: corrientes de

aire, vibraciones, error de apreciación, etc. (Meyer, 1992) (Ver el campo de problema

(CP5) de estimación del error de aproximación en el teorema central del límite, en la

cual se comentó de los estimadores insesgado, la desigualdad de Chebyshev y la ley de

los grandes números en el estudio de los errores).

Una pregunta de interés es ¿En qué condiciones podremos identificar un valor

observado de una v.a. X con su media E(X)? Parzen (1987) señala que para que haya

una probabilidad alta de que el porcentaje de error de X como estimador de E(X) sea

pequeño, es suficiente que la razón de señal a ruido XXE )( sea grande. ¿Cuán grande

debe ser la medida de la razón de señal a ruido de X para que su valor observado x sea

buena estimación de su media? Una respuesta es considerar 20)( XXE si se aplica la

aproximación de la distribución normal.

P10: Los estimadores de máxima verosimilitud tienen distribución asintótica normal

Si en una distribución conocida se desconocen los valores que toma el

parámetro, el problema estadístico consiste en estimar dicho valor a través de la

información entregada por una muestra. En el estudio de las propiedades de un buen

estimador se percibe que mientras menor es la varianza de un estimador incrementa la

probabilidad de obtener estimaciones más próximas al verdadero valor del parámetro

que se estima. Luego, mientras más pequeña es su varianza, mayor es la eficiencia del

estimador.

El método de máxima verosimilitud es un procedimiento para obtener

estimadores de parámetros poblacionales. Esta técnica aplicable a una amplia gama de

problemas dispone de buenas propiedades como la de ser asintóticamente insesgado,

Page 134: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

127

consistente e invariante. En particular, una propiedad muy importante se refiere a la

distribución de probabilidad del estimador por ser consistente: Al aumentar el tamaño

muestral, su distribución de probabilidad converge a una normal, con media y

varianza igual a la cota de Cramer-Rao en un sentido límite, por lo que es

asintóticamente eficiente.

Notemos que un estimador insesgado es el más eficiente de todos los

estimadores insesgados si su varianza satisface la Cota Inferior de la Desigualdad de

Cramer – Rao CCRxf

nE

V2

),(ln

1)( . Así, el estimador máximo

verosímil tiene distribución asintótica normal ),( 0 CCRN siendo 0 el verdadero valor

del parámetro . (Ver propiedades de estos estimadores en Peña, 1995, pp. 245).

P11: Los estimadores de los momentos tienen distribución asintótica normal

El método de los momentos es una técnica para la obtención de estimadores de

los parámetros de una distribución. El procedimiento es sencillo y consiste en igualar

momentos poblacionales respecto al origen a los correspondientes momentos

muestrales, formando tantas ecuaciones como parámetros poblacionales se pretender

estimar. Una propiedad de los estimadores del método de los momentos, al aplicar el

teorema central del límite al momento n

i

ki

kn

Xm

1 de orden k respecto al origen, es que

al ser una m.a. simple, como promedio de v.a. independientes e igualmente distribuidas:

km tiene una distribución límite normal, con media igual al correspondiente momento

poblacional )( kk XE y varianza n/)( 2

12 (Novales, 1997).

P12: Corrección de continuidad

En la mayoría de los textos de estadística para ingenieros la corrección de

continuidad la introducen al usar la aproximación normal a la distribución binomial, que

puede mejorarse si lo que se desea es aproximar probabilidades para una variable

aleatoria discreta a partir del intervalo de probabilidades de una variable aleatoria

continua. Es decir, si X es una v.a. binomial con parámetros n y p, y sea Z una v.a.

normal estándar, entonces

Page 135: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

128

P(a X b) = npq

npbZ

npq

npaP

5,05,0 .

Se utiliza siempre que una variable aleatoria discreta se aproxima mediante una

variable aleatoria continua. Johnson y Kuby (2004) describen esta propiedad para

calcular la probabilidad que x=4 de una v.a. X con distribución binomial de parámetros

n=14 y p=0,5, indicando que para tener una aproximación adecuada es necesario

considerar la suma y resta de 0,5 al valor de x, denominado factor de corrección por

continuidad. La probabilidad exacta de 0,061 y la probabilidad normal de 0,0594 están

razonablemente próximas en valor. Una representación gráfica de esta situación es dada

a continuación:

Figura 4.7.1. Aproximación normal a la distribución binomial

Propiedades de la distribución normal que se deduce del teorema

Tauber (2001, pp. 139 a 144) encontró las siguientes propiedades:

Propiedades geométricas:

1. La distribución normal es simétrica respecto de su eje vertical donde tiene la media;

2. La moda, que es el punto sobre el eje horizontal donde la curva tiene su máximo,

ocurre en x (media);

3. La media, mediana y moda en las distribuciones simétricas coinciden en un mismo

punto, por tanto son iguales en las distribuciones normales;

4. Concavidad y convexidad;

5. El eje de las abscisas es una asíntota de la función de densidad.

Page 136: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

129

Propiedades estadísticas:

6. Probabilidades dadas por área parciales bajo la curva normal;

7. Probabilidades dadas por el área total;

8. Distribución de casos en relación con la desviación típica.

Propiedades algebraicas:

9. Las transformaciones lineales de variables normales también siguen una distribución

normal.

Conclusiones sobre l as propiedades presentadas

De los textos analizados, se observa en la Tabla 4.7.1, que las propiedades más

frecuentes en los textos son la corrección de continuidad (P12), las transformaciones

lineales de la media muestral que se aproximan a una normal (P5), la aproximación de

una distribución discreta por una continua (P7) y la media aritmética se aproxima a una

distribución normal (P3). La propiedad para estimadores de los momentos (P11) sólo es

encontrada en el texto de Velasco y Wisniewski (2001). También es escasa la presencia

en los textos de las propiedades referida a los errores (P9) y estimadores de máxima

verosimilitud (P10). Además, la mitad de los textos consultados, inicia el teorema

central del límite con el cálculo algebraico de las propiedades de la suma y varianza de

v.a. (P1 y P2), lo que implica que en la otra mitad de los libros queda por cuenta del

estudiante esta operatoria.

Los textos de estadística matemática son los que más propiedades tienen, siendo

Meyer (1992) el mayor con nueve de las doce propiedades. Lo siguen los textos clásicos

que también trabajan las propiedades algebraicas. Los libros para ingenieros presentan 5

a 6 propiedades no considerando las propiedades matemáticas P8 a P11. Los textos

Miller y cols. (1992) y Montgomery y Runger (1996) son muy limitados en propiedades

presentando tan sólo la propiedad de la transformación lineal. Al igual los textos con

enfoque moderno son deficitarios en propiedades. En general, los libros carecen en

presentar y profundizar el teorema central del límite mediante las propiedades, de las

cuales las aproximaciones de distribuciones clásicas son importantes para estudiantes de

ingeniería en la aplicación de las ciencias de la ingeniería. Por ejemplo, Devore (2001)

señala esta propiedad de aproximar la distribución Poisson como un ejercicio planteado

de la sección del capítulo y Mendenhall Wackerly y Scheaffer (1994) lo presenta

mediante un ejemplo concreto sin definirlo.

Page 137: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

130

Tabla 4.7.1. Propiedades que presentan los libros seleccionados

Textos [4] [7] [8] [10] [11] [12] [13] [15] [17] [19] [21] [23] [26] [27] [28] [29]

P1: Media de la distribución de la suma de variables aleatorias P2: Varianza de la distribución de la suma de variables aleatorias P3: Media aritmética sigue una distribución aproximadamente normal

P4: La aproximación mejora con el número de sumandos

P5: Transformaciones lineales de v.a.

P6: Medias muestrales en dos poblaciones siguen aproximación normal P7: Aproximación de una distribución discreta por una continua

P8: Aproximación de distribuciones clásicas a la distribución normal

P9: Errores aleatorios con aprox. normal P10: Estimadores de máxima verosimilitud con distribución asintótica normal P11: Estimadores de momentos con distribución asintótica normal

P12: Corrección de continuidad

Observamos en los textos que las propiedades P6 y P7 no son definidas en forma

precisa y clara, por ejemplo en el libro Scheaffer y Mc Clave (1993) la propiedad P6 la

presenta como un ejercicio planteado dentro de un listado de ejercicios. La corrección

de continuidad (P12) está presente en todos los textos pero con diferente intensidad; el

texto de De Groot (1998) desarrolla la aproximación de una distribución discreta por

una distribución continua como método estándar para mejorar la calidad de la

aproximación y luego grafica la aproximación de un histograma, otros libros sólo

aplican la propiedad en un ejemplo de aproximación a la binomial y otros como

Scheaffer y McClave (1993) lo indican en un ejemplo sin denominación de corrección

de continuidad, así como Montgomery y Runger (1996) lo plantean como ejercicio de la

sección de aproximación normal a las distribuciones binomial y poisson.

De los 16 textos analizados, la mitad presenta el tema específico del teorema

central del límite y a continuación como caso especial la aproximación de la binomial

por la normal. En textos como Canavos (1992) y Miller, freund y Johnson (1992)

presentan primero en un capítulo de distribuciones la binomial y su forma aproximada,

y en otro capítulo posterior el teorema central del límite. Se cuestionará en la

metodología de enseñanza del teorema si es conveniente presentar el tema al estudiante,

partiendo con el caso particular del estudio de la distribución binomial para muestras

Page 138: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

131

grandes, seguido del caso general para cualquier distribución, como lo enfoca Meyer

(1992).

4.8. ARGUMENTOS

Todos los enunciados, propiedades, problemas y algoritmos se ligan entre sí

mediante argumentos o razonamientos que se usan para comprobar las soluciones de los

problemas o demostrar las propiedades y relaciones. A continuación, se muestra los

tipos de argumentos relacionados con el teorema.

A1: Demostraciones formales algebraicas y/ o deductivas

Un primer argumento para validar el teorema central del límite y sus

propiedades es por medio de las demostraciones matemáticas, que considera fórmulas y

propiedades de los elementos previos relacionados con el teorema (propio de la

matemática) de forma lógico deductivo.

Caso 1: Demostración por la función generadora de momentos

La demostración clásica del teorema central del límite se presenta para el caso de

la suma de v.a.i.i.d. en el cual existe la función generadora de momentos (fgm) para las

variables aleatorias en la muestra, y requiere revisar los conceptos básicos de la fgm y

de convergencia en series. La podemos ver en Mendenhall, Wackerly y Scheaffer

(1994, pp. 302), Meyer (1992, pp. 333), Durand e Ipiña (1994, pp. 191), Canavos (1992

pp. 248) El bosquejo de la demostración es la siguiente:

Sea M la fgm de las v.a. iX . Como son independientes la fgm de la suma nS de

v.a. está dada por nS tMtM

n)()( , y puesto que nnSZ nn )( es una función lineal

de nS , tenemos que la fgm de nS está dada por n

tnZ

n

tMetM

n)()( )/( . Aplicando

logaritmo natural se tiene )(ln)(lnn

tMn

ntM

nZ ……..(1).

La idea de la demostración consiste en investigar )(tMnZ para grandes valores de

n. Desarrollemos M(t) en una serie de Maclaurin:

Rt

tRtM

tMtM2

)(1

2

)0()0(1)(

2222´´` , en donde R es el término del

Page 139: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

132

resto. Luego (1) queda Rn

t

n

tn

ntM

nZ 2

222

2

)(1ln)(ln . Obtenemos así,

usando el desarrollo de Maclaurin para ln(1+x) =32

32 xxx y para n

suficientemente grande, que:

2

2

222

2

222

2

)(

2

1

2

)()(ln R

n

t

n

tR

n

t

n

tn

ntM

nZ .

Sin dar todos los detalles de pasos algebraicos, queremos investigar la expresión

)(ln tMnZ cuando n . Cualquier término que tiene una potencia positiva de n en el

denominador tenderá a cero cuando n . Después, se encuentra que

2)(ln 2ttMLímnZ

n. Luego, tenemos 22

)( tZ

netMLím

n. Esta es la fgm de la variable

aleatoria con distribución N(0,1). Debido a la propiedad de unicidad de la fgm podemos

concluir que la v.a. nZ converge en distribución (cuando n ) a la distribución

N(0,1).

Aunque esta demostración no es completamente rigurosa, da la idea de la

deducción de este importante teorema y su complejidad.

Caso 2: Demostración por la función característica

Parzen (1987, pp. 475) y Lebart, Morineau y Fénelon (1985, pp. 60) presentan la

validación de este teorema fundamental mediante el uso de la noción de función

característica. A continuación se describe los elementos y las principales etapas de la

demostración a través de las cinco propiedades de la función característica:

Se puede expresar la función característica )(t de una variable Z como

)(2

)(1)( 22

ZEt

ZitEeEt itX . Consideremos la sucesión iX de v.a. y sea la

variable aleatoria nXZ ii )( tiene media nula, varianza igual a 1/n, y los

momentos de orden superior tienden a 0 más rápidamente que 1/n. Su función

característica se escribe )1

(02

1)(2

nn

tt , donde 0(1/n) designa la suma de términos que

tienden a 0 más rápidamente que 1/n. La variable nZ , es la suma de n variables

independientes iZ : )(1

XnZZn

iin . Luego la función característica de nZ será:

Page 140: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

133

n

nn

nn

ttt

10

21)()(

2

. Por consiguiente: 22

1log)(22 t

n

tntLog n . Esto es, la

función característica de nZ tiende hacia 2exp 2t , función característica de la ley de

Laplace-Gauss centrada y reducida N(0,1).

Observe que el seguimiento de esta argumentación del teorema requiere de

conocimientos de matemáticas avanzadas. La función característica de X es la esperanza

matemática de la variable compleja sentXitXitX cos)exp( . Esta función )(t

(aplicación de los reales en los complejos) es conocida como “transformada de Fourier”

de la medida de probabilidad. Se expresa como una serie cuyos coeficientes no

conocidos son los momentos de la variable aleatoria. Así, una v.a. viene caracterizada

por el conjunto de sus momentos si estos existen, y si la serie precedente converge.

A2: Presentación del teorema como caso especial de un resultado general

En varios textos, el tema parte con la aproximación normal a la distribución

binomial, cuya variable se puede representar como la suma de variables aleatorias

independientes Bernoulli.

Meyer (1992, pp. 327) lo presenta mediante un ejemplo, de un proceso de

fabricación de lavadoras con un 5% de defectuosas. Se pregunta, al inspeccionar 100

lavadoras, la probabilidad de que menos de 4 sean defectuosas. El valor exacto es difícil

de calcular directamente. El autor considera la aproximación para n grande, usando la

fórmula de Stirling que establece la siguiente aproximación para un n grande:

2/12~! nn nen . Al usar esta fórmula para los diversos factoriales que aparecen en la

distribución binomial se demuestra la aproximación normal a la distribución binomial,

de gran importancia teórica y práctica. Una demostración matemática que no pretende

ser rigurosa lo presenta Lebart y cols. (1985, pp. 54), utilizando la aproximación de

Stirling. Parzen (1987, pp. 470) da una argumentación vía la función característica de la

normalidad asintótica de variables aleatorias binomiales.

A3: Simulaciones manipulables de distribuciones en el muestreo

Aunque una demostración matemática establece la validez del teorema, puede

que no contribuya mucho a la idea intuitiva del resultado. Otra forma de validar el

teorema es que mediante la simulación manipulable de distribuciones en el muestreo de

estadísticos se generaliza las conclusiones de la experiencia, es decir, a partir de una

Page 141: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

134

población sencilla se realiza una simulación con lápiz y papel de la elección de la

muestra aleatoria de distintos tamaños de esta población. Meyer (1992, pp. 335)

presenta el siguiente ejemplo orientado más numéricamente:

_____________________________________________________________________________Considere una urna que contiene tres clases de objetos identificados como 0, 1 y 2. Suponiendo que hay 20 ceros, 30 unos y 50 dos. Se saca un artículo al azar y se anota su valor, digamos 1X . Suponiendo que

1X tiene la distribución siguiente

25,0

13,0

02,0

)( 1

x

x

x

xXP . Suponga que el artículo escogido primero se

sustituye y luego se escoge un segundo artículo y se anota su valor, 2X . Considere la v.a.

2)( 212 XXZ con distribución: )( 2 zZP 0,04 , 0,12 , 0,29 , 0,30 , 0,25 con valores de la v.a. z

respectivamente 0 , 1/2 , 1 , 3/2 , 2. Finalmente, supongamos que después de que el segundo artículo ha sido también reemplazado, se escoge un tercer artículo y se anota su valor 3X . Considerar la v.a.

3)( 3213 XXXZ y su distribución:

3z 0 1/3 2/3 1 4/3 5/3 2

)( 33 zZP 0,008 0,036 0,114 0,207 0,285 0,225 0,125

La distribución de forma de campana para tres variables ya muestran signos de normalidad.

En este ejemplo, el estudiante debe continuar agregando una observación más y

luego encontrar la distribución de probabilidades del promedio de las cuatro

observaciones obtenidas. Se advierte que el ejemplo no demuestra nada, sin embargo

representa una ilustración numérica de los resultados expuestos en los argumentos

matemáticos anteriores.

A4: Simulación gráfica con ordenador del teorema central del límite

Una forma moderna de ilustrar y argumentar el teorema central del límite

consiste en realizar simulaciones con el ordenador aumentando progresivamente el

tamaño muestral. Se representan para los distintos tamaños de muestras los histogramas

correspondientes y se observan, a medida que va creciendo el tamaño de la muestra,

como la distribución muestral de los estadísticos se aproxima a una distribución normal,

aún cuando no lo es la distribución de partida. Este tipo de representación es la forma

más intuitiva de proporcionar una justificación del teorema.

Ejemplos son dados por Johnson y Kuby (2004, pp. 265 y 267) mediante

representaciones gráficas de histogramas para diferentes valores de los parámetros n y p

de la binomial. También Kalbfleisch (1984, pp. 190) considera nXX ,...,1 variables

aleatorias uniforme U(0,1) independientes. La variable tipificada de la variable suma

Page 142: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

135

será entonces 12

)2/(

n

nSZ n

n . La función densidad de probabilidad de nZ para valores

pequeños de n se puede obtener por métodos de cambio de variables. Por ejemplo, para

n=2, la f.d.p. de 2Z es:

6z06)6(

066)6()(2

paraz

zparazzf .

A continuación, compara, mediante tres figuras, la f.d.p. exacta de nZ con la

f.d.p. de la distribución normal tipificada de una suma de n variables aleatorias

independientes, para n = 1,2,3. Este ejercicio sugiere un método para generar con un

ordenador observaciones de una distribución normal. Es decir, se puede usar un

generador de números aleatorios para obtener n valores nxx ,...,1 de una U(0,1) y después

calcular nZ .

A5: Comprobación de ejemplos y contraejemplos, sin pretensión de generalizar

Algunos textos utilizan distribuciones clásicas, por ejemplo binomial o Poisson,

para verificar la exactitud de aproximación. Peña (1995, pp. 154) sugiere el siguiente

ejemplo:

______________________________________________________________________En un proceso de fabricación de películas fotográficas aparecen por término medio 1 defecto por cada 20 metros de película. Si la distribución de defectos es Poisson calcular la probabilidad de 6 defectos en un rollo de 200 metros de película (a) directamente; (b) utilizando la aproximación normal. _____________________________________________________________________________

En este ejercicio el estudiante calcula primero dicha probabilidad en forma

exacta usando el modelo de Poisson. Tenemos que el parámetro 20/1 metro, luego

en 200 metros 1020200 defectos/200 m. Así 0630,0!6

10)6(

610eXP . Usando la

normal y la corrección de continuidad obtenemos:

0557,010

105,6

10

105,5)6( ZPXP .

Aquí el estudiante observa la buena aproximación de la Poisson por la normal,

para n grande y 5 . Otro ejemplo puede verse en Wisniewski y Velasco (2001, pp.

214), al lanzar una moneda 300 veces. Se pide la probabilidad de obtener entre 155 y

Page 143: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

136

165 águilas, empleando la aproximación normal a la distribución binomial. Se observa

el valor exacto, por ordenador, de 0,265047, y en forma aproximada con valor de

0,2648; lo que significa que la aproximación resultó excelente.

A6: Obtener una conclusión o tomar una decisión en base al teorema central del límite

La aplicación de las propiedades del teorema central del límite y sus enunciados

en el procedimiento de resolución de un problema conduce a obtener una solución

cuantitativa. Luego, de acuerdo al contexto de la ingeniería, es necesario interpretar la

probabilidad aproximada para la toma de decisión. En general, en los textos hay

bastantes ejemplos y ejercicios propuestos acerca de la aplicación del teorema

comparando el valor aproximado de la probabilidad con distribución normal y el valor

exacto de una determinada distribución de probabilidad. Sin embargo, a pesar que los

ejemplos son con enunciado a una situación específica sólo llegan a obtener el cálculo

de la probabilidad sin la interpretación correspondiente. Este tipo de argumentación lo

usaremos en los problemas abiertos y de la prueba de ensayo (secciones 7.5 y 7.6),

pidiendo una conclusión a partir de las probabilidades de que la media muestral se

encuentre en un rango de valores o mediante la interpretación gráfica de la

aproximación a distribuciones de probabilidades.

Conclusiones sobre los argumentos presentados

En la Tabla 4.8.1 se resumen los tipos de argumentos encontrados. La forma de

demostrar más reiterativo en los textos es mediante la comprobación de ejemplos,

comparando para ciertos valores la distribución de origen con la normal, pero casi todos

los textos muestran como distribución inicial a la binomial. Parzen (1987) es el único

que propone la distribución de Cauchy, como contraejemplo.

Tabla 4.8.1. Argumentos que presentan los libros seleccionados

Textos [4] [7] [8] [10] [11] [12] [13] [15] [17] [19] [21] [23] [26] [27] [28] [29]

A1: Demostraciones formales algebraicas y/ o deductivas

A2: Caso especial de un resultado general A3: Simulaciones manipulables A4: Simulación gráfica con ordenador

A5: Comprobar ejemplos y contraejemplos

Pocos libros de textos no utilizan la simulación con el ordenador o a través de

Page 144: Significados del Teorema Central del Limite en la Enseñanza de la

Significado institucional de referencia

137

dispositivos manipulables, son cinco los textos que muestran como argumento el

teorema central del límite en muestras grandes con apoyo del ordenador. Se considerará

importante trabajar como primera experiencia con el teorema, problemas con

dispositivos de los dados y monedas.

Se observa que con el tiempo las demostraciones algebraicas del teorema tienden

a desaparecer en los textos. Los textos de estadística matemática son los más completo

en las demostraciones aunque no trabajan la simulación como elemento validativo. En

particular Meyer (1992) presenta cuatro de los cinco argumentos encontrados, y Parzen

(1987) es el único que demuestra el teorema con la función característica. El texto

moderno de Johnson y Kuby (2004) y tres textos para ingenieros sólo presentan

argumentos vía la simulación. El texto de problemario de Velasco y Wisniewski (2001)

junto con cuatro textos para ingenieros son muy débiles en la rigurosidad del teorema,

mostrando tan sólo la comprobación de ejemplos como único argumento.

En general, las demostraciones formales están ausentes en los textos, esto se ve

reflejado en los libros para ingenieros, en que ninguno de los ocho presenta las

demostraciones deductivas como argumento del teorema central del límite. Al parecer

las demostraciones del teorema central del límite está más allá del propósito de estos

textos, dejándolo para cursos más avanzados. Walpole, Myers y Myers (1999) plantea la

demostración como un ejercicio propuesto.

Aún así, observamos en los textos que no enfatizan la comprobación empírica

mostrando por ejemplo el comportamiento de la distribución mediante una tabla para

distintos valores de n, sino que sólo lo hacen en forma directa para un valor

determinado, como lo hace el texto Peña (1995).

4.9. CONCLUSIONES SOBRE EL ANÁLISIS DE LOS TEXTOS

En este capítulo se ha cumplido con el objetivo específico 2, Sección 1.5,

consistente en describir el significado del teorema central del límite en una muestra de

libros de texto adecuados para la enseñanza a ingenieros. Para ello se ha identificado los

campos de problemas, lenguaje, procedimientos, enunciados, argumentos y

propiedades, presentados en los 16 libros de textos específicos analizados. Así también,

se ha mostrado la complejidad del teorema y sus múltiples conceptos relacionados, por

medio de variados ejemplos presentes en los textos.

En particular, se destaca a los símbolos como lenguaje más típico usados por los

autores en sus textos, y señalamos nuestra preocupación que no consideren importante

Page 145: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 4

138

las representaciones gráficas y simulaciones, medios didácticos relevantes en el

aprendizaje del teorema central del límite.

En cuanto a los procedimientos de resolución de problemas, los textos son

débiles en mostrar varios algoritmos, inclinándose por el cálculo algebraico o la

simulación. Respecto a los enunciados se observa en los textos que han predominando,

en un comienzo el rigor matemático y actualmente la forma general del teorema. Por

otro lado, en las propiedades se nota la riqueza del teorema y sus aplicaciones, siendo

las de mayor presencia en los textos la corrección de continuidad y la aproximación de

la media aritmética a la distribución normal. Al igual que en las propiedades, el rigor

matemático también está ausente en los argumentos en gran parte de los textos. Ello se

explica por la dificultad de las demostraciones deductiva, basadas en la función

generadora de momentos u otros conceptos avanzados. También explica que se obtuvo

el contraejemplo como elemento validativo más recurrente por los autores, percibiendo

una tendencia de la demostración algebraica a desaparecer en los textos.

Con respecto a los libros de textos para ingenieros se puede mencionar algunas

debilidades en presentar el teorema, que también están presentes en otros textos. Los

ejemplos y situaciones no son presentados en forma clara en cuanto a mencionar que se

está aplicando el teorema central del límite, no se explicita la argumentación, como la

que hemos presentado en la sección 4.3 del CP1. Además no se diferencia la aplicación

del teorema para la suma de v.a. y la media aritmética, no se enfatiza problemas reales

de la ingeniería con salida de software estadístico, acorde a la tendencia de la enseñanza

de la estadística. Por último, los textos prácticamente no tratan las propiedades

matemáticas del teorema central del límite en tópicos tan importante de la inferencia

estadística como son los métodos de estimación, errores de estimación y aplicaciones a

las distribuciones de probabilidades clásicas.

En el proceso de estudio dirigido a favorecer la comprensión del teorema por

parte de los alumnos, sería necesario presentar una variedad de contextos de aplicación

al contexto de la ingeniería, trabajar las situaciones que tienen fuerte presencia en el

entorno ingenieril con la simulación, así también las propiedades que utilizarán en su

trabajo profesional.

En consecuencia, de este significado de referencia del teorema obtenido, se

seleccionará en la propuesta de enseñanza las categorías de los elementos que se

adecuen a los requerimientos de perfiles y competencias de un ingeniero.

Page 146: Significados del Teorema Central del Limite en la Enseñanza de la

139

CAPÍTULO 5.

DISEÑO DE UN PROCESO DE ESTUDIO

DEL TEOREMA CENTRAL DEL LÍMITE PARA

INGENIEROS

5.1. INTRODUCCIÓN

En este capítulo se analiza el diseño de un proceso de estudio sobre el teorema

central del límite, dirigido a la formación de ingenieros. A partir del significado

institucional de referencia (Capítulo 4), se han seleccionado los elementos de

significados del teorema más adecuados a la construcción de la propuesta didáctica,

organizándolos en un proceso de estudio pretendido, que contextualiza los diferentes

elementos de significados en ejemplos relacionados con la ingeniería y los secuencia en

orden de dificultad progresiva en base al tiempo disponible.

Se tuvo asimismo en cuenta, tres posibles tipos de configuraciones epistémicas:

manipulativa, algebraica y computacional, que se alternan a lo largo del proceso y

permiten introducir significados complementarios del teorema central del límite. Con

todo ello se determina el significado de referencia planificado para la instrucción. En la

línea actual de la docencia universitaria, se incorporan recursos computacionales a la

acción didáctica; en este caso la hoja Excel y el programa estadístico @risk, que se

usarán en algunas de las actividades. El @risk (http://www.palisade.com) es un

programa auxiliar para el análisis y la simulación de riesgo en Microsoft Excel y será

utilizado para simular distribuciones de probabilidades en el estudio de algunas

situaciones de riesgo en la ingeniería.

En lo que sigue, se analiza la secuencia didáctica y configuraciones

planificadas, lo que permitirá dar una primera evaluación de la idoneidad epistémica

(adecuación entre significado institucional implementado y significado de referencia),

Page 147: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

140

criterio propuesto por Godino, Contreras y Font (2006) para el análisis de procesos

didácticos.

5.2. DESCRIPCIÓN GENERAL DEL PROCESO DE ESTUDIO

La experiencia de enseñanza del teorema central del límite se llevaría a cabo en

el curso de estadística para ingenieros (alumnos de segundo y tercer año), que es

obligatorio en el área de Ciencias Básicas y que tiene como prerrequisito el curso de

Probabilidades que se cursa a comienzo del segundo año. Por tanto los alumnos

potenciales tendrían conocimiento de estadística descriptiva, calculo de probabilidades,

variables aleatorias, distribuciones de probabilidades clásicas y distribuciones

bivariadas, además de haber trabajado previamente con Excel.

La enseñanza se aplicaría en el segundo semestre académico en los meses de

Octubre-Noviembre, momento que corresponde ver el capítulo de las distribuciones

muestrales. Se prevé una recogida de datos periódica, durante el proceso de estudio y

otra final en Diciembre.

Cabe señalar que en la planificación de la enseñanza del teorema central del

límite se diseñó una lección donde se introdujeron conceptos previos necesarios. Esta

lección introductoria es la correspondiente a distribución de los estimadores de

poblaciones con distribución normal en una y dos muestras. En dicha lección se parte

con conceptos básicos: muestreo estadístico, población, muestra, la estimación puntual

de parámetros: muestra aleatoria, estimadores, propiedades de los estimadores, métodos

de estimación. Se continúa con la distribución muestral de la media muestral en

poblaciones normales y el estudio de la proximidad al parámetro que estima, calculo del

tamaño de muestra necesario para obtener una estimación con precisión dada y

probabilidad fija. A continuación, se incluye la obtención de intervalos de confianza

para el parámetro. Por último, se definen las distribuciones de probabilidades chi-

cuadrado, t-Student y F de Fisher.

Estructuración

El proceso de estudio se organiza en tres lecciones, cada una de las cuales se

divide en varias sesiones y se contextualiza en torno a uno de los campos de problemas

originales determinados en el estudio histórico y, más específicamente, en una

aplicación en la ingeniería. El orden es creciente de complejidad y sigue el desarrollo

Page 148: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

141

histórico del teorema central del límite, donde este teorema se va ampliando, según la

naturaleza de las variables aleatorias consideradas. Estas lecciones son las siguientes:

1. Aproximación de la distribución binomial. Se propone a los estudiantes el estudio de

la confiabilidad de un sistema compuesto por un número grande de componentes

individuales, lo que plantea la aproximación de la distribución binomial b(n, p) para

valores grandes de n. Un experimento con materiales manipulables sirve para

deducir una aproximación intuitiva a la distribución normal, que posteriormente es

justificada por el profesor en el aula. Aceptada la aproximación y la corrección de

continuidad, se aplican los conocimientos adquiridos a otros problemas sobre

control de producción, diseño de experimentos y pruebas de hipótesis.

2. Distribución de la suma de variables aleatorias discretas. Puesto que la distribución

binomial es la suma de n variables aleatorias independientes e idénticamente

distribuidas, se trata de extender la aproximación binomial a la normal a la suma de

otros tipos de variables aleatorias discretas e independientes, mediante una actividad

de laboratorio con ayuda del software y applets de Internet. Las aplicaciones de los

nuevos conocimientos incluirán aproximación de la distribución de Poisson por la

normal en estudios de tráfico, consumo y control de calidad.

3. Distribución de la suma de variables aleatorias continuas. Se estudia a

continuación la extensión del teorema central del límite a variables aleatorias

continuas independientes e idénticamente distribuidas. La situación introductoria

consiste en determinar el voltaje total en un condensador de diferentes líneas

eléctricas. Las aplicaciones de la nueva versión del teorema involucran el estudio de

la aproximación normal a las distribuciones de Weibull y exponencial en problemas

de atención a clientes y costo de reparación. Finalmente, se presenta una

formulación general del teorema y se discuten las condiciones de validez con los

estudiantes.

Las lecciones y sesiones incluyen actividades y ejercicios. Las actividades se

resuelven colectivamente en la clase; los ejercicios los resuelven los alumnos

individuamente en casa, y los alumnos entregan posteriormente la solución al profesor.

Page 149: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

142

Funciones docentes y discentes

A lo largo del proceso de estudio los estudiantes, definirán un problema de su

elección que se pueda resolver utilizando el teorema central del límite, llevarán a cabo

un plan de diseño muestral, administrarán la información, recogerán y explorarán datos,

plantearán hipótesis, y finalmente comunicarán al resto de la clase los resultados y

conclusiones. También compararán de forma visual los datos empíricos con el modelo

teórico de la distribución normal, y formalizarán progresivamente el teorema, llegando

hasta su aplicación mediante diversos procedimientos. Los alumnos intentarán resolver,

individualmente y en grupos de dos, las actividades planteadas, dirigidas a descubrir

algunas propiedades del teorema central del límite y la necesidad de su uso en

situaciones del campo de la ingeniería. Los alumnos completarán ejercicios de refuerzo

al término de cada lección y al final del semestre académico. También deberán leer el

material escrito dispuesto en la plataforma.

El profesor resumirá el material escrito previamente leído por los alumnos,

destacará los conceptos importantes mostrando su necesidad. Presentará algunas

actividades a partir de conjuntos de datos que se puedan analizar usando el ordenador.

Conducirá al grupo a la solución correcta de las actividades de cálculo e interpretación

de aplicaciones a la ingeniería.

Para el apoyo a la gestión administrativa del curso, se utilizará la plataforma de

entorno virtual de aprendizaje EV@ de la Dirección de Docencia de la universidad,

donde el profesor pondrá material escrito de las lecciones según avance de las mismas.

Por este medio, ofrecerá a los alumnos apuntes de clases, applets de estadística,

ejercicios, actividades, foro de discusión de contenidos y resultados de las evaluaciones.

También podrá hacer algunas encuestas a los alumnos generando variables de interés

para ellos y ofrecer el conjunto de datos para trabajo posterior del alumno. Pondrá

también en la plataforma un demo del programa @risk describiendo los pasos para

construcción de histogramas y generación de matrices de números aleatorios. Se

destinará una tarde de asesoría para consultas de los estudiantes y una semana a consulta

vía correo electrónico y EV@.

Temporalización

El tiempo dedicado a la enseñanza del teorema central del límite comprendería

11 sesiones formales de desarrollo de contenidos de 80 minutos en el aula (cuatro

semanas) y cuatro en el laboratorio de computación. Se llevarían a cabo cuatro sesiones

Page 150: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

143

por semana, tres de ellas en el aula tradicional y una en el laboratorio de informática.

Las sesiones de aula estarían apoyadas con cañón multimedia, note book y el pizarrón.

En el laboratorio se utilizaría el paquete estadístico @risk del programa Excel, además

de la planilla Excel y procesador de texto Word para los informes de algunas

actividades o ejercicios. En la Tabla 5.2.1 se recoge la estructura de las sesiones con

actividades que se desarrollarán en el aula y los ejercicios fuera de clase.

Tabla 5.2.1. Temporalización

Martes Miércoles Jueves Viernes LECCIÓN 1: Aproximación de la distribución Binomial

Sesión1: Actividades 1.1, 1.2 y 1.3.Plantear Ejercicio 1.1

Sesión 2: Teorema Laplace-De Moivre. Actividades 1.4, 1.5. Plantear Ejercicios 1.2, 1.3 y 1.4.

Sesión 3: Enunciado 1 del teorema. Actividad 1.6. Corrección continuidad. Actividades 1.7 y 1.8.

Sesión 4: Actividades 1.9, 1.10 y 1.11.

Sesión 5: Actividad 1.12. Plantear Ejercicios 1.5 y 1.6. Consultas de Excel en el laboratorio por la tarde

Planteamiento y resolución de Simulación del Ejercicio 1.7 (Laboratorio de computación con Excel)

Planteamiento y resolución algebraica del Ejercicio 1.8

LECCIÓN 2: Distribución de la suma de variables aleatorias Discretas Sesión 6:

Actividades 2.1 y 2.2 Enunciado 2 del teorema Plantear Ejercicios 2.1 y 2.2.

Sesión 7: Solución Ejercicio 2.1 Plantear Ejercicio 2.3 Actividades 2.3, 2.4 y 2.5

Sesión 8: Plantear Ejercicio 2.4 Actividad 2.6 Plantear Ejercicios 2.5 y 2.6.

Planteamiento y resolución algebraica del Ejercicio 2.7.

LECCIÓN 3: Distribución de la suma de variables aleatorias Continuas Sesión 9: Enunciado 3 del teorema Actividades 3.1 y 3.2 Plantear Ejercicios 3.1 Gráficas T, F y Gamma

Sesión 10: Actividad 3.3 Plantear ejercicios 3.2 y 3.3Actividad 3.4 Plantear ejercicios 3.4 y 3.5

Sesión 11: Actividad 3.5 Plantear Ejercicio 3.6 Enunciado 4 del teorema Plantear Ejercicios 3.7 y 3.8

Planteamiento y resolución algebraica del Ejercicio 3.9

Examen parcial: Cuestionario escrito de las tres lecciones

Examen práctico: Informe de aplicación a la ingeniería

Examen final: Prueba Global de desarrollo y Cuestionario

Page 151: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

144

5.3. CONFIGURACIONES EPISTÉMICAS

Godino, Contreras y Font (2006) han introducido los criterios de idoneidad, con

el propósito de describir, analizar y explicar fenómenos específicos ligados a los

procesos de instrucción matemática. En nuestro estudio sería interesante utilizar la

noción de idoneidad epistémica (adecuación entre significado institucional

implementado y significado de referencia), cognitiva (adecuación entre significado

implementado y significado personal logrado por los estudiantes) e instruccional

(adecuación del proceso de estudio para detectar conflictos semióticos, así como al

tiempo y contexto del estudio).

Los autores definen la configuración epistémica, como al sistema de objetos y

funciones semióticas que se establecen entre ellos relativos a la resolución de una

situación-problema. En este trabajo interesa ampliar esta noción, introduciendo también

la relatividad al conjunto de recursos que el estudiante tiene para la resolución del

problema. De este modo diferenciaremos tres tipos de configuraciones epistémicas:

manipulativa, algebraica y computacional (Figuras 5.3.1 a 5.3.3), que suponen un

significado muy diferenciado, incluso para un mismo problema.

En la configuración manipulativa el estudiante trabaja con dispositivos

manipulativos (dados, fichas,...), papel-lápiz o calculadora, sin utilizar notación o

cálculo algebraico. Aparecen objetos matemáticos específicos como experimento

aleatorio y estadístico, variable estadística, su distribución y momentos, y el tipo de

demostración preferente es el estudio de ejemplos y contraejemplos. Los

procedimientos son empíricos y gráficos y el lenguaje se reduce a expresiones

verbales y gráficas en papel y lápiz.

La configuración algebraica se caracteriza por el lenguaje simbólico y la

demostración deductiva, así como el recurso a elementos de álgebra y análisis. Los

procedimientos serían analíticos y algebraicos, además de incorporar el uso de las

tablas de distribuciones para calcular probabilidades. Como conceptos, además, las

variables aleatorias, sus distribuciones y momentos, aparecen la idea de

convergencia, momentos, tipificación, etc. Las demostraciones son preferiblemente

deductivas.

La configuración computacional amplía notablemente el lenguaje, sobre todo el

número y variedad de representaciones gráficas dinámicas además del lenguaje

icónico, incorpora como procedimiento la simulación y permite trabajar con las

Page 152: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

145

variables estadísticas y aleatorias simultáneamente. No posibilita el lenguaje

algebraico ni la demostración deductiva. El argumento preferible es inductivo,

estudio de ejemplos, contraejemplos y la generalización. Aparecen algunos

conceptos como aproximación y bondad de ajuste.

Figura 5.3.1. Configuración epistémica manipulativa

Figura 5.3.2. Configuración epistémica algebraica

Page 153: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

146

Figura 5.3.3. Configuración epistémica computacional

Una vez diseñada la estructura global del proceso de estudio, se seleccionarán los

elementos de significados del teorema central del límite que se incluirán en cada

lección, siguiendo las investigaciones de Tauber (2001), Alvarado (2004a, b y c),

Alvarado y Batanero (2004a y b; 2005a y b; 2006a y b) y Batanero (2003), así como en

las descritas en el Capítulo 3. Estos elementos se han identificado en el estudio histórico

y el análisis de libros de texto, y que están resumidas en las Tablas 5.4.1.1, 5.5.1.1 y

5.6.1.1. A continuación se analizan las actividades de cada una de las tres lecciones.

5.4 ANÁLISIS DE LA PRIMERA LECCIÓN

5.4.1. ELEMENTOS DE SIGNIFICADO Y CONFIGURACIONES EPISTÉMICAS

Esta primera lección titulada “Distribución asintótica en la distribución

binomial” se trabajan principalmente tres campos de problemas, CP1: Obtener una

aproximación de la distribución binomial para valores grandes de n; CP8: Obtener el

tamaño adecuado de una muestra aleatoria en poblaciones de distribución desconocida y

Page 154: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

147

CP12: Estimar por intervalos de confianza la media y otros parámetros para muestras

grandes, así como los diferentes algoritmos recogidos en la Tabla 5.4.1.1. Se trataría de

llegar a un enunciado de forma general del teorema (E5), así como un enunciado

intuitivo por medio de dispositivos didácticos (E6). Se pretende que el alumno llegue a

las siguientes propiedades: P1: La media de la distribución aproximada de una suma de

variables aleatorias es la suma de las medias; P2: La varianza de la distribución

aproximada de la suma de variables aleatorias es la suma de las varianzas; P3: La media

aritmética de una muestra aleatoria de tamaño suficientemente grande sigue una

distribución aproximadamente normal; P4: La aproximación mejora con el número de

sumandos; y P7: Aproximación de una distribución discreta por una continua.

Tabla 5.4.1.1. Planificación de la Lección 1

Sesión Acción didáctica Objetivo de la acción didáctica Elementos de significado

Configuración epistémica

Actividad 1.1 Motivar la aproximación de la Binomial

CP1 Algebraica

Sección 1.2 Introducción histórica y primera formulación de Laplace-De Moivre

E5, P7 Algebraica

1

Actividad 1.2 y 1.3

Justificación y aplicación para pruebas de aleatoriedad

AP4, P1, P2, E6, A3

Manipulativa

Ejercicio 1.1 Estudiar condiciones para la aproximación

AP4, P1, P2, P4, E6, A3

Manipulativa

2 Actividad 1.4 y 1.5

Estudiar condiciones para la aproximación algebraicamente

E6, AP1, AP2, AP3, P1, P2, P4, A5

Manipulativa Algebraica

Ejercicio 1.2 Estudio gráfico de la aproximación binomial

E6, P4, AP3 A2, P7

Computacional

Ejercicio 1.3 Aplicación y simulación (con Applet) E6, P4, AP3 A2, P7

Computacional

Ejercicio 1.4 Estudio gráfico de convergencia en función de n y p (en Excel)

E6, P4 Computacional

3 Actividad 1.6 y 1.7

Aplicación a ingeniería de forma algebraica

AP1, AP2, AP3, E4, P1, P2, P12

Algebraico

Sec.1.3 Corrección de continuidad P12, P7 Algebraico Actividad 1.8 Solución aproximada de la Actividad

1.1CP1, AP1, AP2, AP3, P1, P2, P4, P7, P12, A2

Algebraico

4 Actividad 1.9, 1.10 y 1.11

Aplicación teorema, estimar intervalos de confianza para p

CP12, P3, P10 Algebraico

Sec 1.4 Transformar la suma de v.a estándar en proporción estándar

AP1 Algebraico

5 Actividad 1.12 Ejercicio 1.5,1.6

Aplicación teorema, determinar tamaños de muestras

CP8, AP1, AP2 Algebraico

Fuera Ejercicio 1.7 Aplicación en ingeniería mediante simulación con Excel para verificar el teorema de Laplace-De Moivre.

CP1, E6, A2, A4, A5, A6, P1, P4, P7, P12.

Computacional

de clase

Ejercicio 1.8 Aplicación en ingeniería del teorema y de la corrección de continuidad.

CP1, CP8, AP1, AP2, AP3, E5, A1, A2, A5, P1, P2, P12, P7

Algebraico

Page 155: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

148

No se detalla los elementos de lenguaje pues en todas las lecciones se usan todos

ellos. Respecto a las argumentaciones usaremos principalmente las A2 (caso especial de

un resultado general) y A5 (comprobación de ejemplos y contraejemplos). Se describe

en la Tabla 5.4.1.1 las configuraciones epistémicas realizadas en las actividades

didácticas según los elementos de significados pretendidos.

5.4.2. TRAYECTORIA DIDÁCTICA

Se planifican e implementan cinco sesiones de aula de esta lección que

analizamos a continuación.

Desarrollo de la Sesión 1.

Se comenzaría planteando la actividad 1.1 que motivaría la introducción del

tema.

Actividad 1.1. Un sistema está formado por 100 componentes cada una de las cuales tiene una confiabilidad igual a 0,95. (Es decir, la probabilidad de que la componente funcione correctamente durante un tiempo específico es igual a 0,95). Si esas componentes funcionan independientemente una de otra, y si el sistema completo funciona correctamente cuando al menos funcionan 80 componentes, ¿Cuál es la confiabilidad del sistema?

El profesor comenzaría preguntado a los alumnos qué elementos destacarían en

esta actividad y cómo la desarrollarían. Se espera que la mayoría de los estudiantes

definan la variable aleatoria “número de componentes que funcionan correctamente en

el sistema” con distribución binomial de parámetros n=100 ensayos y probabilidad de

que funcione una componente cualquiera p=0,95. Luego se espera que escriban en

lenguaje simbólico 10080 nSP y traten de calcular la probabilidad.

Una vez que los alumnos comprueben que el valor es demasiado grande para las

tablas que ellos poseen, el profesor introducirá la idea de aproximación mediante las

cuestiones: ¿Son muchos términos en la suma?, ¿Los términos son difíciles de calcular?,

¿Podríamos usar otra distribución de probabilidades para aproximar el cálculo de la

probabilidad pedida? La solución completa se dejará como actividad 1.8.

A continuación, el profesor describiría la solución histórica al problema

(ocurrida hacia 1713). Al aumentar el valor de n en la distribución binomial ,B n p

cuya expresión matemática es xnxpp

x

nxXP 1)( para valores x = 0,1,2,3,...,n,

Page 156: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

149

los términos crecen muy rápidamente, por lo que el cálculo de las probabilidades de los

valores de la variable en las distribuciones exactas es demasiado laborioso. Este

problema llevó a distintos matemáticos a tratar de encontrar valores aproximados de

estas probabilidades para valores de n grandes y a estudiar las condiciones en que estas

aproximaciones podrían utilizarse. Abraham de Moivre (1667-1754) sugirió el uso de la

función exp(-x2) como límite de la distribución, pero no la relacionó con la distribución

normal eX 2/2

)21( .

Se indicaría al alumno que esta problemática es un caso particular de un

resultado general; el teorema central del límite, y que nuestro interés en los temas

siguientes es conducirlos a su generalización y formalización. La interrogante general

que lleva a analizar los teoremas de límite es la siguiente: ¿En qué condiciones y

mediante qué funciones o distribuciones de probabilidad pueden aproximarse la suma

de otras distribuciones por la distribución normal, cuando aumentamos

progresivamente el número de sumandos? El profesor destacaría la importancia práctica

en ingeniería, en estudios de la masa forestal, producción, cargas en estructuras, etc., y

que permite usar la distribución normal tabulada para calcular probabilidades que

provienen de la suma de diferentes distribuciones.

Finalizada esta introducción se propondrían dos actividades orientadas a un

primer acercamiento al estudio del comportamiento de la suma de variables aleatorias

discretas, a través de la simulación manual.

Actividad 1.2. Simulación con fichas. Una caja contiene 4 fichas de las cuales 2 fichas son verdes. Simule la extracción de m muestras de tamaño n; formando las matrices nxm (tamaño muestralxnúmero

de réplicas), (n, m) = (4,5), (10,1), (10,10) y (30,10). Para cada caso: a. Construya una tabla de frecuencias del número de fichas verdes por muestra obtenidas. b. Represente los datos en un gráfico de barras y comente sus características. c. Compare la media y varianza del experimento con la media y varianza teórica. d. Obtenga las tres medidas de tendencia central y comente.

Por ejemplo para el caso (n, m) = (4,5), el alumno escribiría en una plantilla

cuadriculada de 4 filas y 5 columnas los resultados del experimento y anotaría 1 en caso

de obtener el color verde y 0 en caso contrario. Esta práctica, conduciría a formular

variables aleatorias Bernoulli “obtener una ficha verde”, con probabilidad de éxito p=

0,5. A partir de la matriz de unos y ceros, se construiría la distribución de frecuencias

del número de fichas verdes observadas en cada muestra, que corresponde a una

Page 157: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

150

distribución binomial de parámetros B(4,0,5). Después, se le pediría al alumno

comparar los promedios de las distribuciones empírica y teórica.

La actividad 1.3 es similar a la anterior, con la diferencia que el dispositivo

usado son las monedas, pero se mantiene la probabilidad de éxito p=0,5. La otra

novedad es que se pide ahora que se tabule y muestre la distribución de frecuencias y su

gráfica en la planilla Excel, además de pedir el cálculo de probabilidades de la suma de

un determinado número de caras.

Actividad 1.3. (Adaptada de Batanero, 2001). 61 alumnos de estadística realizaron el experimento de anotar una secuencia inventada de posibles resultados al lanzar 20 veces una moneda. Se obtuvo el siguiente número de caras en los alumnos:

Números de caras por persona: 12 10 10 9 10 10 11 11 11 9 10 11 11 8 11 10 10 11 12 10 10 10 10 11 10 10 11 9 11 11 10 12 9 10 9 10 10 12 10 9 9 10 11 10 10 10 9 11 10 9 9 10 10 10 10 11 8 11 9 10 9

a. Represente gráficamente, con la planilla Excel, la distribución de frecuencias de caras y comente. Primero construya la tabla de distribución de frecuencias.

b. Los alumnos obtuvieron un total de 617 caras en los 1220 lanzamientos. Determine la frecuencia estimada de obtener a lo más 617 caras en el total de lanzamientos de una moneda correcta.

c. Obtenga y compare la media del experimento realizado con la media teórica de la distribución de probabilidad.

d. ¿Tienen buena intuición sobre el lanzamiento de monedas?

Se propondría para la siguiente sesión (5 días más tarde) un ejercicio para

realizar en grupo de tres personas y enviar vía la plataforma EV@. El fin del ejercicio

es acostumbrarle a trabajar en equipo, utilizar la planilla Excel y la plataforma virtual.

En este caso la probabilidad de éxito p cambia a 1/6.

Ejercicio 1.1. Simulación con dados. Suponga que gana si obtiene un “6” al lanzar un dado legal. Simule las posibilidades de ganar en los siguientes casos de varios lanzamientos del dado ( n, m) = (4,5), (10,10) y (30,10). a. Compare sus resultados con el experimento realizado en la actividad 1.2. b. Calcule el valor exacto de la probabilidad pedida en la actividad 1.1.c. Calcule, en la actividad 1.2, la probabilidad exacta de obtener a lo más 2 fichas verdes al extraer 10

veces una ficha con reemplazo de la caja.

d. Calcule la probabilidad P(9 X 11) en la actividad 1.3. Interprete lo que se quiere medir y

represéntelo por un gráfico.

Desarrollo de la Sesión 2.

La sesión comenzaría haciendo notar a los alumnos que en las actividades

anteriores la gráfica de la distribución binomial toma una forma de campana cuando n

crece. También que la media de la distribución normal es np y la varianza npq. Otra

gráfica en forma de campana es la de la función de densidad de la distribución normal.

Page 158: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

151

Se les preguntaría si creen posible aproximar una distribución binomial B(n,p) por una

normal N(np, npq), aunque la distribución binomial sea discreta y la normal continua.

Se dejaría para más adelante la justificación del uso de la corrección de continuidad. Se

continuaría con el primer enunciado del teorema central del límite, introducido por

Laplace:

Teorema de Laplace-De Moivre: Consideremos una variable aleatoria X con distribución binomial

B(n,p). Para valores grandes de n, X sigue una distribución aproximadamente normal N(µ ) de media

µ=np y desviación estándar npq ; es decir, la misma media y desviación estándar que la Binomial.

Luego, la variable npq

npxZ sigue una distribución normal N (0,1).

El enunciado formaliza un caso de aproximación particular (distribución

binomial). Se comentaría la regla empírica consistente en que la aproximación de la

binomial a la normal será buena cuando np y nq son ambos mayores que 5 y p y q no

son demasiado pequeños (p,q>0,05). La sensibilidad de los parámetros de la

distribución binomial para su aproximación a la Normal se analizaría en los ejercicios

1.2 y 1.3 mediante el ordenador. Se plantearía la actividad 1.4 que muestra una

aplicación a la producción de artículos defectuosos de una máquina.

Actividad 1.4. El departamento de finanzas de una empresa ha detectado un porcentaje importante de artículos con algún tipo de fallas producidas por sus máquinas; encontrando que de cada dos artículos seleccionado uno resultó con fallas. Se muestrearon cinco máquinas obteniendo los siguientes artículos defectuosos, denotados por D:

M1 D B B B D D B D B B M2 B D B B D D B D B D M3 B D D B B B D B B D M4 B B D B B D B B D B M5 B B D B D D B D B B

a. ¿Qué porcentaje de artículos defectuosos piensas que debiera obtenerse del total antes de realizar el muestreo?

b. Determine la frecuencia relativa de artículos defectuosos obtenidos en el muestreo y comente. c. Calcule la probabilidad aproximada, dada por el teorema de Laplace-De Moivre, de obtener un total de

más de 30 artículos defectuosos de los 50 artículos muestreados. Comente.

A partir de la información muestreada, los alumnos realizarían el cálculo

algebraico de la probabilidad de la suma de v.a. (total de artículos defectuosos) de forma

exacta y aproximada, aplicando el teorema anterior. Se trabajaría con la configuración

manipulativa a unas primeras situaciones de aplicación del teorema con lápiz, papel y

calculadora en poblaciones y muestras pequeñas, donde la aproximación es muy mala,

para hacerle consciente de la importancia del tamaño de la muestra. La idea es conducir

Page 159: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

152

al alumno del estudio descriptivo de un conjunto de datos, al cálculo de probabilidades

para los estimadores de parámetros de posición y de variación.

La actividad 1.5 analiza otra aplicación a un proceso de fabricación,

considerando la probabilidad de defecto p=0,5 fija. En los apartados a y b se muestra

mediante la configuración algebraica, que la aproximación es débil para muestras

pequeñas (n=5), comparando los valores teóricos y aproximados de las probabilidades

pedidas. En los apartados c y d, se pretende hacer ver a los alumnos la mejora de la

aproximación para muestras más grande como 60 y 1800. El apartado c guía al

educando a descubrir que la aproximación mejora en intervalos de valores cerca de la

media np.

Actividad 1.5. Un fabricante de dispositivos semiconductores toma muestras aleatorias de chips y los prueba; cada chip es clasificado como defectuoso o no defectuoso. Sea Xi =0 si el chip no es defectuoso y Xi =1 si el chip es defectuoso. Suponga que ambos sucesos tienen igual probabilidad. a. Si el fabricante prueba 5 chips, determine la probabilidad aproximada, mediante el teorema de

Laplace-De Moivre, de obtener a lo más un chip defectuoso, a lo más dos chips defectuosos. b. Compare los dos resultados anteriores con las probabilidades exactas de la distribución Binomial.

Utiliza la calculadora o la tabla de la distribución Binomial. ¿Es buena la aproximación? c. Si el fabricante toma una muestra aleatoria de 60 chips, estime la probabilidad de obtener entre 5 y 15

chips defectuosos; entre 25 y 35; entre 50 y 60; de obtener a lo más un chip defectuoso; a lo más dos chips defectuosos. ¿Qué observas?

d. Calcule la probabilidad, mediante el teorema de Laplace-De Moivre, de obtener un total superior a 950 chips defectuosos; si se analizan 30 cajas de 60 chips cada uno.

La segunda sesión finaliza explicando algunos ejercicios que tendrán que

desarrollar los alumnos fuera de clase, que pone a prueba los conocimientos adquiridos

sobre la aproximación de la distribución binomial y la forma de aplicarla con recursos

de applet disponible en Internet, con apoyo de Excel y la plataforma ev@ para entregar

la solución ya sea individual o en grupo. Se darían varios días para el desarrollo de los

tres ejercicios que se presentan a continuación.

Se deja como un segundo ejercicio, la generalización del enunciado de la

actividad 1.2 al experimento consistente en extraer n veces una ficha con reemplazo y

determinar la probabilidad aproximada, de obtener a lo más x fichas verdes. Se dará

algunos días a los estudiantes para enviar individualmente por la plataforma sus

comentarios.

Page 160: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

153

Ejercicio 1.2. En el caso de la aproximación de Laplace-DeMoivre podemos utilizar un software estadístico para representar gráficamente la distribución B (n,p) para distintos valores de sus parámetros n y p. La figura siguiente muestra valores para p = 0,3 con n = 4, 8, 24 y para p = 0,1 con n = 4, 8 y 50.

¿Qué observa de las gráficas para los distintos valores de los parámetros?

El ejercicio 1.2 presenta una tercera solución aproximada al estudio de la

aproximación binomial por medio de una configuración computacional: Cálculo

aproximado de probabilidades para la suma de v.a. con uso del ordenador,

representando gráficamente la distribución binomial para distintos valores de sus

parámetros y distintas formas de simetría. El ejercicio sería reforzado con el siguiente

ejercicio individual, utilizando recursos en Internet, en que los alumnos podrán

interactuar la distribución binomial cualquiera sean los parámetros n y p.

Ejercicio 1.3. Revise el applet disponible sobre el Teorema de Laplace-DeMoivre en la página de la Universidad de Cali, Colombia http://www.unalmed.edu.co/~estadist/binomial/binomial.htm y simule para distintos valores de los parámetros la distribución binomial. Envíe sus comentarios al foro.

El siguiente ejercicio plantearía la aplicación del teorema e Laplace-De Moivre

con apoyo de Excel. Se darían 6 días para entregar la solución que sería enviada

también por EV@ en grupos de dos estudiantes.

Ejercicio 1.4. Muestre el resultado del teorema de Laplace-De Moivre numéricamente con apoyo de Excel y considerando una variable de contexto profesional, por ejemplo: a) Analice el porcentaje de artículos defectuosos en el proceso de control de calidad, b) Analice de satisfacción de un producto en el mercado. Estime la proporción de personas a favor de una ley del suelo, etc. Para ello, el análisis consiste en: a. Considere una distribución original Uniforme U(0,1) y genere los siguientes casos para n tamaños

muestrales con sus m réplicas respectivas: (n,m) = (10,10) , (20,20), (30,30). b. Analice para los distintos tamaños muestrales seleccionado la distribución de la suma de variables

aleatorias Bernoulli. c. Construya y analice el histograma de frecuencias relativas, box plot o diagrama steam and leaf. d. Sugiera algunas preguntas y resuelva.

Page 161: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

154

Junto con este ejercicio 1.4 se levanta en la plataforma un Demo básico de

programación con Excel, generando números aleatorios y mostrando los comandos de

simulación de la distribución de la suma de variables aleatorias de valores Bernoulli.

Desarrollo de la Sesión 3.

Se trata de introducir el cálculo aproximado de probabilidades para la suma de

variables aleatorias de forma algebraica, es decir, presentar un segundo enunciado del

teorema central del límite más elaborado. Se plantearían actividades en un contexto de

la ingeniería y se introduciría la corrección de continuidad (P12).

Se comenzaría recordando que la distribución binomial b(n,p) se puede

representar como la suma de variables aleatorias independientes Bernoulli b(1,p), y se

preguntaría si el teorema de Laplace-De Moivre se cumple de forma más general, para

la suma de variables aleatorias independientes idénticamente distribuidas. Una vez

explorada las ideas de los estudiantes, se pasaría a enunciar el teorema central del límite

que corresponde al campo de problemas CP1 y al enunciado del teorema E4:

Enunciado 1 del Teorema Central del Límite: Sea Sn la variable aleatoria “número de aciertos” en n

experiencias de Bernoulli; si Xi es una variable de Bernoulli, la variable n

iin XS

1 sigue una ley

binomial, con E(Sn)=np y Var (Sn)=np (1-p). Pongamos: )1( pnp

npSZ n

n . Cuando n tiende a infinito,

la función distribución de Sn tiende a la N (np, np(1-p)).

A continuación se presentaría una actividad en el área de ingeniería

(supervivencia), que se ha de resolver mediante el cálculo algebraico de la suma de v.a.

Actividad 1.6. En terreno arenoso se plantaron 50 arbolitos de cierto tipo y otros 50 en otra área con terreno arcilloso. Sea X = número de árboles plantados en terreno arenoso que sobreviven 1 año e Y = número de árboles plantados en terreno arcilloso que sobreviven 1 año. Si la probabilidad de que un árbol plantado en terreno arenoso sobreviva 1 año es 0,7 y la probabilidad de que sobreviva 1 año en

terreno arcillos es 0,6, calcule una aproximación a P(-5 X-Y 5).

El alumno debe aplicar el enunciado E4 del teorema central del límite, primero

definiendo las v.a. 50

11

iiXS (número de árboles en terreno arenoso que sobreviven 1

año), y 50

12

iiXS (número de árboles que sobreviven 1 año en terreno arcilloso). S1 y S2

son definidas con distribución binomial de esperanzas 35 y 30 y varianzas 10,5 y 12

Page 162: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

155

respectivamente, obtenidas mediante las propiedades P1 y P2 (media y varianza de la

suma de v.a). Ambas v.a. son aproximadas por la distribución normal; por tanto su

diferencia es también de distribución normal, de parámetros S1-S2 ~ N(5, 22,5).

Estandarizando (AP2), llegamos a la distribución )1,0(~5,22

5)( 21 NSS

Z .

Se pediría a los estudiantes deducir que E(S1-S2)=E (S1)-(S2)=35-30=5 y

Var(S1-S2)=Var (S1)+Var(S2)=10,5+12=22,5. Calculando la probabilidad con ayuda de

tablas y efectuando cálculo algebraico (AP1, AP3) llegarían a

)11,2()0(5,22

55

5,22

55521 ZZ FFZPSSP =0,5-0,0174=0,4826 .

Posteriormente se estaría en condiciones de incorporar el concepto de corrección

de continuidad (P12), preguntándoles si les cuesta pensar que se aproxima el histograma

de probabilidad de una v.a. discreta X mediante una función de densidad de

probabilidad continua f. Se haría notar que la probabilidad de un suceso relativo a X se

puede interpretar como un área bajo el histograma, y se la puede aproximar entonces

por el área correspondiente subtendida por f. La Figura 5.4.2.1 muestra el cálculo de

)( bXP , donde b es uno de los valores de X, que corresponde al centro de un

rectángulo del histograma de base h.

Figura 5.4.2.1. Aproximación normal a una distribución discreta

Intuitivamente, se haría ver que el área del histograma es aproximadamente igual

al área en la función densidad normal, pero la base del rectángulo está centrada en el

valor entero, por lo que se debe admitir que los valores de los extremos del intervalo se

extienden en media unidad para obtener así la aproximación binomial, llegando a la

siguiente expresión

2/F)()()2/(

hbdxxfbXPhb

Page 163: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

156

Se explicaría que el término h/2 se denomina corrección de continuidad (P12),

debiendo utilizarse siempre que una v.a. discreta se aproxima a una v.a. continua. Para

ejercitar la aplicación de esta propiedad, seguiría la siguiente aplicación en ecología:

Actividad 1.7. Las compañías eléctricas podan los árboles que crecen cerca de sus líneas para evitar cortes eléctricos debidos a la caída de árboles durante las tormentas. La aplicación de un producto químico para retrasar el crecimiento de los árboles es más barato que podar los árboles, pero estos productos matan algunos de los árboles. Suponga que un producto químico de este tipo matará el 20% de los arces. La compañía eléctrica prueba este producto con una muestra aleatoria de 250 arces. a. ¿Cuál es la media y la desviación estándar del número de árboles que mueren en la muestra? b. ¿Cuál es la probabilidad de que mueran más de 60 árboles (el 24% de la muestra)?

Se espera que el estudiante defina la variable Sn “número de árboles que mueren

en la muestra de tamaño 250”, como una suma de variables Bernoulli de parámetro

p=0.2 (aplicando el enunciado E4); que es la proporción de árboles que mueren por el

producto químico. Han de estimar la probabilidad pedida P(Sn >60) mediante el teorema

central del límite (n es suficientemente grande), lo que requiere determinar la esperanza

y varianza de la variable suma (P1 y P2), respectivamente 50 y 40. Al estandarizar

(AP2) la variable suma y usando la corrección de continuidad (P12), se recurre a la

tabla de la distribución normal estándar para obtener el valor crítico (AP3); en este caso

de forma indirecta. Así, la probabilidad de que mueran al menos 60 árboles es de un

0,49. Se sugeriría a continuación, comparar esta aproximación con el cálculo de

probabilidad en forma exacta, mediante la distribución Binomial de parámetros n = 250

y p = 0,2.

Esta clase terminaría con la actividad 1.8, proponiendo también al estudiante

resolver la actividad 1.1, planteada en la lección inicial, mediante una probabilidad

aproximada.

Actividad 1.8. Un sistema está formado por 100 componentes cada una de las cuales tiene una confiabilidad igual a 0,95. (Es decir, la probabilidad de que la componente funcione correctamente durante un tiempo específico es igual a 0,95). Si esas componentes funcionan independientemente una de otra, y si el sistema completo funciona correctamente cuando al menos funcionan 80 componentes, ¿Cuál es la confiabilidad del sistema?

El alumno debería aplicar las propiedades anteriores. Se pediría calcular

(80 100)nP S . Para dar una solución aproximada, calcularía la esperanza y varianza

de la variable de interés.

E(Sn)=E( Xi)= E(Xi) = n×p = 100×0,95 = 95 ;

Var(Sn)=Var( Xi)= Var(Xi) = n×p×(1-p) = 100×0,95×0,05 = 4,75.

Page 164: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

157

La desviación estándar de esta variable es 18,275,4nS . Como el tamaño de

la muestra n=100 es grande, aplicaría el teorema central del límite, obteniendo:

npqnpNSn ,~ Luego procedería al cálculo, usando la corrección de continuidad (P12):

994,0)1,7()52,2(18,2

955,100

18,2

95

18,2

955,795,1005,79)10080( n

nn

SPSPSP

Por tanto, el sistema funcionaría el 99,4% de las veces. Por último, se dejaría

como práctica aplicar la corrección de continuidad en la actividad 1.6 y comparar los

resultados.

Desarrollo de la Sesión 4.

La cuarta sesión de aula estaría orientada a mostrar aplicaciones del teorema

central del límite, enlazando de forma natural con la obtención de la distribución

muestral y la estimación de parámetros por intervalos de confianza. La primera

aplicación sería la estimación por intervalos de confianza de la proporción p de la

distribución binomial. Se partiría señalando que para los percentiles z1 y z2 fijos cuando

n es grande, la aproximación ),(~ npqnpNSn permite calcular la probabilidad

aproximada que la suma de v.a. se encuentre en un cierto intervalo,

1221 zFzFnpqznpSnpqznpP ZZn

A continuación, se plantearía la siguiente actividad comentando que en 104

lanzamientos de una moneda, la probabilidad de que el número de caras se desvíe de la

media 5.000 en más de 100 caras es menor de 0,0455:

Actividad 1.9. Compruebe que la probabilidad de que Sn esté dentro de los límites np ± 2 npq

es alrededor de FZ(2) - FZ(-2) = 0,9545; para np ± 3 npq la probabilidad es aproximadamente 0,9973.

Se continuaría relacionando la suma con la proporción en la estandarización

normal, obteniendo el mismo intervalo anterior ahora como promedio.

Page 165: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

158

Observación: Sea p la proporción de elementos de una población que poseen un atributo determinado. Si p̂ es el estimador puntual máximo verosímil y consistente del parámetro en una muestra grande de

tamaño n, por el teorema central del límite, establecemos que, si nSp n /ˆ entonces ),(~ˆn

pqpNp .

Luego

n

qp

pp

pnp

npSZ n

nˆˆ

ˆ

)1(. De igual forma podemos calcular la probabilidad que

la proporción de elementos con cierto atributo se encuentre entre dos valores límites, es decir,

1221 /ˆ/ zFzFnpqzppnpqzpP ZZ

Se propondría la actividad 1.10 para aplicar esta propiedad en un estudio sobre

planes de pensiones.

Actividad 1.10. Una organización muy grande desea estimar a través de un intervalo de confianza que porción de sus empleados prefieren planificar sus propios beneficios de retiro en lugar de seguir un plan patrocinado por la compañía, para ello tomó una muestra aleatoria de 75 empleados, encontrando que 30 de ellos están interesados en seguir sus propios planes de retiro. a. Encuentre un intervalo aproximado de 99% de confianza para la proporción verdadera de empleados

que desean seguir sus propios planes de retiro. b. Si el verdadero valor en parte a) de p = 0,3, ¿Consideraría usted que la porción de empleados que

prefieren planificar sus propios beneficios de retiro es mayor?

Se espera el siguiente procedimiento de resolución para el apartado a) Definir p:

proporción de empleados que prefieren planificar sus propios beneficios de retiro.

Según la muestra ˆ 0, 40, (0,995) 2,58p Z . Aplicar el intervalo siguiente para un

tamaño de muestra grande:

n

ppZpp

n

ppZp

)ˆ1(ˆ)2/1(ˆ

)ˆ1(ˆ)2/1(ˆ

Un intervalo aproximado del 99% de confianza usando la información anterior,

debe dar el siguiente resultado (0,250 ; 0,546). En el apartado b) la respuesta es no, pues

el intervalo contiene a 0,3.

Otra actividad de mayor complejidad que implica la construcción de intervalo de

confianza de la diferencia de proporciones en dos muestras, se presentaría a

continuación.

Actividad 1.11. Construya un intervalo de confianza para la diferencia entre dos proporciones p1-p2

.

En conjunto con los alumnos se desarrollaría una solución de forma simbólica:

Para n1 y n2 relativamente grandes, se tiene por el teorema central del límite que:

Page 166: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

159

2

2222

1

1111 ,~ˆ,,~ˆ

n

qppNp

n

qppNp Entonces, )1,0(~

)ˆ1(ˆ)ˆ1(ˆ

)()ˆˆ(

2

22

1

11

2121 N

n

pp

n

pp

ppppZ

En este último estadístico las proporciones muestrales en el denominador p1 y p2 han

sido estimados por sus respectivos estimadores de máxima verosimilitud (P10). Dado

que los valores de n1 y n2 son grandes las aproximaciones siguen siendo válidas.

Por lo tanto, un intervalo de confianza aproximado del %1100 para p1- p2 es:

2

22

1

1121

2

22

1

1121

ˆˆˆˆ)2/1(ˆˆ,

ˆˆˆˆ)2/1(ˆˆ

n

qp

n

qpZpp

n

qp

n

qpZpp

donde 21 ˆˆ pyp son los estimadores máximo verosímiles de p1 y p2 respectivamente

(P10).

Desarrollo de la Sesión 5.

Se trabajarían los campos de problemas CP8 y CP12. Se prevé una segunda

aplicación del teorema central del límite consistente en determinar el tamaño adecuado

de muestra aleatoria para estimar el parámetro de una población binomial con una

precisión dada, en el contexto de estimar la proporción de fumadores. Se lleva al

alumno a descubrir que el número de unidades en la muestra depende de la precisión

con la cual se quiere estimar el parámetro de interés p, de la varianza de la población y

del valor del coeficiente de confianza utilizado para efectuar la estimación mediante un

intervalo. La variable a considerar es cualitativa y se estima la proporción de elementos

que tienen la característica indicada por dicha variable mediante el estimador p̂ . El

error absoluto de estimación es ppe ˆ .

Como el intervalo de confianza 1- es n

ppZpp

)1()2/1(ˆ se obtiene una

fórmula de cálculo de tamaño adecuado mínimo, )1()2/1(

2

ppe

Zn . Para guiar a

los estudiantes en la comprensión y aplicación se entregaría la actividad siguiente:

Actividad 1.12. Muestreo. Una fracción desconocida p de una población está compuesta por fumadores, y vamos a utilizar el muestreo aleatorio con reemplazo para determinar p. Se quiere encontrar p con un error no mayor de 0,005. a. ¿Cuán grande debe ser el tamaño n de la muestra? b. ¿Cuán grande debe ser el tamaño n de la muestra si se quiere un error a lo más 0,01?

Page 167: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

160

Este ejercicio guiaría al alumno a descubrir que la determinación del tamaño

muestral está condicionada al error muestral. Se conduciría al alumno a discutir la

siguiente secuencia de algoritmo de solución:

Sea p̂ la fracción de fumadores de la muestra. Es claro que ningún tamaño de

muestra puede garantizar de manera absoluta que 005,0ˆ pp . A lo más podemos

considerar muy improbable un error que exceda de la cota asignada de 0,005. Con este

propósito, se establecería un nivel de confianza arbitraria 1- digamos 0,95, y elegiría

una n tan grande que el evento 005,0ˆ pp tenga probabilidad > 1- .

Dado que Sn= pnˆ puede interpretarse como el número de éxitos en n ensayos,

tenemos que 1)005,0()005,0ˆ( nnpSPppP n . Con apoyo de la aproximación

normal y observando sus valores en la tabla, sería necesario elegir una n tan grande que

)2/1(005,0

Zpq

n ó )2/1(40000 2Zqpn .

En esto interviene la probabilidad desconocida p pero, en cualquier

circunstancia, tenemos que 4/1pq y, en consecuencia, será suficiente un tamaño de

muestra )2/1(10000 2Zn . En el nivel de confianza 1- = 0,95, encontramos que

96,1)2/1(Z , por lo que un tamaño muestral de n = 40000 es, desde luego,

suficiente. En la parte b) Si solamente se requiere una precisión 0,01 sería suficiente un

tamaño muestral de 10000 (con el mismo nivel de confianza).

Finalmente, se dejarían dos ejercicios de aplicación acerca de control de calidad

y de satisfacción de un producto.

Ejercicio 1.5. Para estimar la proporción de artículos defectuosos en una fábrica, el departamento de control de calidad quiere una estimación que difiera de la verdadera proporción en menos de 0,05 con probabilidad al menos 0,95. Determine el tamaño de muestra necesario para el nivel de precisión requerido. Solución: Si p = 0,5 se tiene n = 385; si p = 0,2 el tamaño de muestra es sólo 246.

Ejercicio 1.6. En una encuesta sobre la satisfacción del producto del salmón en latas, 320 de un total de 400 personas entrevistadas se pronunciaron a favor por este producto. a. Establezca un intervalo aproximado de confianza del 95% para estimar la proporción de personas

que están a favor de la venta de las latas de salmón. b. Se desea estimar la proporción p, de error máximo de 3% con un nivel de confianza de 99%. ¿Qué

tamaño de muestra se requiere para asegurar esta precisión? c. ¿Con qué nivel de confianza puede afirmarse que la proporción de personas que están a favor del

producto está entre 77% y 83%?

Page 168: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

161

Una vez terminado los contenidos de la lección 1 en el aula, a modo de regular el

aprendizaje parcial de esta lección, se plantearían dos ejercicios a resolver por los

estudiantes, uno a desarrollar en el laboratorio de computación y otro en la sala de

clases, en un tiempo de 50 minutos cada uno.

Ejercicio 1.7. Riesgo individual

Introducción: Cuatro hombres adultos en Concepción toman una póliza de seguro automotriz por un año, en una Sucursal de una gran Empresa Aseguradora en Chile. Los valores posibles de reclamo del seguro de los clientes es {0,1,2,3,4}, con probabilidad de que reclame un cliente de 5,0)Pr( nreclamacióp .La función de probabilidad del número de reclamos de los cuatro clientes es:

x 0 1 2 3 4 p(x) 0,0625 0,25 0,375 0,25 0,0625

Si calculamos la media y la varianza obtenemos 2 y 1 respectivamente.La Empresa Aseguradora lo ha contratado a usted para que analice el riesgo individual de reclamos de sus clientes, considerando una muestra de 20 Sucursales seleccionadas al azar en el país. a. Con apoyo de Excel, simular el número de reclamos, con un número grande de 50 clientes que

solicitan un seguro automotriz en cada Sucursal seleccionada. Obtener la distribución de frecuencias de los reclamos en las 20 Sucursales.

b. Represente por un histograma la distribución muestral del total de reclamos en las Sucursales, para verificar el Teorema de Laplace-DeMoivre. Comente las características del histograma dadas por el teorema.

c. Compare el valor teórico esperado con su correspondiente valor empírico. d. ¿Es rentable para la Empresa los seguros automotriz que ofrece a sus clientes?

El siguiente ejercicio 1.8 de accidentes industriales, tiene por objeto determinar

la valoración que los estudiantes hacen de las propiedades del teorema central del límite

en un ejercicio algebraico. La solución prevista y resultados serán analizados en la

sección 6.2.2.

Ejercicio 1.8. Accidentes Industriales. Un ingeniero ha comprobado que 45 de los 150 accidentes industriales en su planta, en los últimos cinco años, se deben a que los empleados no siguen las instrucciones. a. Determine la probabilidad aproximada de que de 84 nuevos posibles accidentes, entre 20 y 30 se

deban a negligencia de los empleados. b. Compare con el valor exacto de la probabilidad anterior, determinada mediante la probabilidad

binomial, que es 0,81023. c. Calcule la probabilidad aproximada de obtener, en una muestra aleatoria de 120 accidentes

industriales, más de un 35% que se deban a negligencia de los empleados. d. Calcule el tamaño de muestra necesario para que la estimación difiera de la verdadera probabilidad

en menos de 4,5% con probabilidad al menos 0,96.

5.5. ANÁLISIS DE LA SEGUNDA LECCIÓN

5.5.1. ELEMENTOS DE SIGNIFICADO Y CONFIGURACIONES EPISTÉMICAS

En la segunda lección titulada “Distribución asintótica de la suma de variables

aleatorias discretas”, se presentaría una extensión del teorema central del límite para el

Page 169: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

162

caso de variables discretas acotadas y no acotadas. Se recogerían los campos de

problemas (Tabla 5.5.1.1) CP2: Determinar la distribución de la suma de variables

aleatorias discretas idénticamente distribuidas y CP12: Estimar por intervalos de

confianza la media y otros parámetros para muestras grandes. Los procedimientos

previstos son AP1: Cálculo algebraico y transformación de variables aleatorias; AP2:

Tipificación/destipificación y AP3: Cálculo de probabilidades referidas al teorema con

calculadora, tablas de distribución o programa de ordenador.

Tabla 5.5.1.1. Planificación de la segunda lección

Sesión Acción didáctica

Objetivo de la acción didáctica Elementos de significado

Configuración epistémica

Actividad 2.1 Motivar la aproximación de la Poisson CP2, AP1, AP2, AP3 P1, P3, P12

Algebraica

Actividad 2.2 Aplicar el teorema a la distribución de la media muestral de la distribución Uniforme

E4, P1, P2, P3, P8, AP1, A2, A5

Algebraica

6

Sección 2.2 Segunda formulación del teorema P4, E4 Algebraica Ejercicio 2.1 Obtener la distribución de la media muestral

de variables discretas acotadas AP1, AP3, E4, P1, P2, P8, A2

Algebraica

Ejercicio 2.2 Estudiar la distribución de los puntajes medios de lanzamientos de varios dados

P3, P4, P8, A3 Algebraica

7 Actividad 2.3 Aproximar la distribución Hipergeométrica a la Normal

AP1, AP2, AP3, E4, P1, P2, P8, P12, A2

Algebraica

Ejercicio 2.3 Estudiar la forma de la distribución de media muestral de v.a. discreta acotada

AP1, E4, P4, A5 Algebraica

Actividad 2.4 Aplicar algebraicamente el teorema a la distribución Poisson Corrección de continuidad

E4, AP1, AP2, AP3, P1, P2, P8, P12, A5

Algebraico

Actividad 2.5 Error de aproximación mediante cálculo de probabilidades por intervalos

AP1, AP3, E4, P8 Algebraico

8 Ejercicio 2.4 Estudiar gráficamente la distribución Poisson en función de los parámetros

E6, P8, A4 Computacional

Actividad 2.6 Aplicar el teorema, estimar intervalos de confianza para el parámetro de la Poisson

CP12, AP1, AP2, AP3, E4, P10, A1

Algebraico

Ejercicio 2.5 Aplicar algebraicamente a la ingeniería la aproximación de la dist. Hipergeométrica

AP3, P3, P8, P12, A2 Algebraico

Ejercicios 2.6 Aplicar algebraicamente la aproximación de la dist. Poisson a la ingeniería

AP3, P8, P12, A2 Algebraico

Fuera de clase

Ejercicio 2.7 Aplicar a la ingeniería el teorema CP2, AP1, AP2, AP3, E4, P1, P2, A1, A6

Algebraico

Trataríamos de avanzar en el enunciado del teorema, de forma intuitiva (E6) y

general (E5) a enunciarlo para la suma de variables aleatorias independientes

idénticamente distribuidas (E4). Pretendemos que el alumno aplique las siguientes

propiedades: P1: La media de la distribución aproximada de una suma de variables

aleatorias es la suma de las medias; P2: La varianza de la distribución aproximada de la

suma de variables aleatorias es la suma de las varianzas; P3: La media aritmética de una

muestra aleatoria de tamaño suficientemente grande sigue aproximadamente una

Page 170: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

163

distribución normal; P4: La aproximación mejora con el número de sumandos; P8:

Aproximación de algunas distribuciones clásicas a la distribución normal; P10: Los

estimadores de máxima verosimilitud tienen distribución asintótica normal; y P12:

Corrección de continuidad.

Los elementos de lenguaje a establecer son las expresiones verbales, notaciones

simbólicas y representaciones gráficas de barra y función de probabilidad. Por último

intentaríamos que los alumnos desarrollen tres formas de argumentaciones, partiendo

del caso particular de una distribución discreta uniforme de un resultado general (A2);

comprobación de ejemplos y contraejemplos (A5); y generalizaremos las conclusiones

de experimentos manipulables (A3) situadas en la lección 1.

5.5.2. TRAYECTORIA DIDÁCTICA

Se planificarían e implementarían tres sesiones de aula de esta lección que

analizamos a continuación.

Desarrollo de la Sesión 6.

La clase comenzaría explicando a los alumnos que en este tema aproximaremos

el modelo de la distribución normal a distribuciones de probabilidades clásicas discretas

(CP2), como la distribución uniforme discreta y la Poisson, para ciertos valores de sus

parámetros. Distinguiremos tres casos de análisis: variables provenientes de poblaciones

con distribución uniforme discreta, variables discretas acotadas y variables discretas no

acotadas. La primera actividad 2.1 que motiva la introducción de la lección 2, se refiere

al tiempo de llegadas de llamadas de teléfonos, modelado por una distribución de

Poisson.

Actividad 2.1. A una central de teléfonos llegan llamadas al ritmo medio de 3 por minuto. Determinar la probabilidad de que lleguen al menos 200 llamadas en un periodo de una hora. ¿Cómo desarrollarías esta actividad?

Se espera que la mayoría de estudiantes aplique los conocimientos adquiridos

del curso previo de probabilidades para determinar el valor. Para ello debieran definir la

variable aleatoria X: “número de llamadas recibidas por una central en 60 minutos” con

distribución Poisson de media 180, cuya expresión simbólica es

)180603(~ tPX calculando el promedio , de llamadas que recibe la central

durante 60 minutos (P1). Se pide utilizar el modelo Poisson para calcular la

Page 171: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

164

probabilidad 200

180

!

180)200(

x

x

x

eXP . Como el cálculo con calculadora o tablas

estadísticas es laborioso, los estudiantes podrían intentar ampliar el enunciado del

teorema central del límite conocido para la distribución binomial para este caso de la

Poisson. Esta segunda solución aproximada considera una aproximación al cálculo de la

probabilidad mediante la distribución normal.

La esperanza y la varianza de la distribución Poisson es 180. Utilizando la

corrección de continuidad (P12) y estandarizando (AP2) se obtiene:

)180

1805,199()200( ZPXP =1-FZ(1,45)=1-0,9264=0,0736. A continuación, el profesor

enunciaría una nueva versión del teorema central del límite, según Linderberg y Lévy:

Enunciado 2 del teorema central del límite (Linderberg-Lévy): Sea una muestra aleatoria simple de

tamaño n de cualquier población de media y desviación típica finita . Cuando n es grande, la

distribución de la media muestral X se aproxima la distribución normal ),(2

nN con media y

desviación estándar n .

Se indicaría al alumno que este enunciado es general, y podría aplicarse a

variables aleatorias discretas, incluyendo la aproximación binomial y Poisson. Se

recordaría al alumnado que las observaciones de una muestra aleatoria son variables

aleatorias independientes e idénticamente distribuidas. Se continuaría con el estudio de

la distribución de la suma de variables uniforme discreta.

Definición: Una variable aleatoria sigue la distribución uniforme discreta entre los valores a y b con a<b, notándose UD(a,b), si tiene la siguiente distribución de probabilidades

...0

,1,....,1,1

1

coe

bbaaxabxXP

Su media es 2

)(ba

XE y su varianza 12

11)(

2ab

XV

Formulada la distribución uniforme, se propondría la actividad 2.2, enfrentando

al estudiante a la aplicación algebraica del teorema central del límite y la representación

gráfica de la distribución muestral de la media de una variable aleatoria de distribución

conocida. Si bien el tamaño de la muestra es pequeño, el objetivo es trabajar los

cálculos con lápiz y papel en un tiempo de 30 minutos y observar la convergencia

rápida para esta distribución particular.

Page 172: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

165

Actividad 2.2. Un producto se vende en el mercado con la misma frecuencia, en tres tamaños 2, 4 y 6. a. Determine la distribución de probabilidad de la variable tamaño del producto. b. Elabore un diagrama de barras para representar su distribución.

c. Calcule la media y la desviación estándar d. Enumere todas las muestras aleatorias de tamaño 2 con reemplazo que pueden comprarse de este

producto, y calcular las medias de las muestras obtenidas. e. Obtenga la distribución de probabilidad de estas medias. f. Calcule la media y desviación estándar de las medias muestrales. Comparar con las teóricas. g. Dibuje un histograma de la distribución muestral de medias muestrales. Comentar. h. Indique tres hechos importantes obtenidos en la resolución del problema.

Esta actividad analiza una distribución discreta, P(x) = 1/3, de valores x = 2, 4,

6. En b) y g) los alumnos compararían gráficamente la distribución original con la

distribución muestral de la media muestral (P3). En apartado c) se calcularían los

valores poblacionales de media y desviación estándar, que son respectivamente =4,

63,10,466,18 2 . La obtención en d) de las nueve muestras posibles de tamaño 2,

permite hallar la distribución para la media muestral en e) y los estimadores de los dos

parámetros, 0,4X

, y 15,10,433,17 2X

. Las representaciones gráficas son las

siguientes:

A continuación, se propondría a los estudiantes resolver el ejercicio 2.1 y

entregarlos para la próxima sesión.

Ejercicio 2.1. Un jabón para lavavajillas de cierta marca se vende en tres tamaños: de 25, 40 y 65 onzas. Veinte por ciento de los compradores seleccionan la caja de 25 onzas, 50% la de 40 onzas y 30% la caja de 65 onzas. Sean X1 y X2 los tamaños de caja seleccionados por dos compradores independientes. a. Escriba la distribución de los tamaños de jabones. Comenta sobre la naturaleza de la variable.

b. Determine la distribución de muestreo de X , calcule )(XE y compárela con .

También se propone pensar el ejercicio 2.2

Page 173: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

166

Ejercicio 2.2. a. Escriba la distribución de probabilidad de los puntos obtenidos al lanzar un dado.b. Verifique (y comente) que la distribución del promedio de puntos cuando se lanzan dos, es la

siguiente: xi 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 ni 1 2 3 4 5 6 5 4 3 2 1 c. Determine la distribución del promedio de puntos cuando se lanzan tres y cinco dados

respectivamente. Presente y comente los gráficos de las distribuciones encontradas.

Desarrollo de la Sesión 7.

La sesión comenzaría resolviendo el ejercicio 2.1, donde se requiere la

distribución de la variable X: tamaño en onzas del jabón, discreta acotada, y es la

siguiente:

Tamaño del jabón 25 40 65

Probabilidad 0,20 0,50 0,30

Para determinar la distribución de muestreo de X , se obtendrían las muestras

posibles obtenidas por dos compradores que son: (25,25), (25,40), (40,25), (40,40),

(25,65), (65,25), (40,65), (65,40), (65,65). Se calcularían los promedios respectivos: 25,

32,5, 32,5, 40, 45, 45, 52,5, 52,5, 65, y las probabilidades de cada valor del promedio:

04,02,0)25,25(25 2pXP ; 12,03,02,02)25,65()65,25(45 ppXP ; etc.

Así, el alumno obtendría la distribución de la media muestral (P3).

iX 25 32.5 40 45 52.5 65

pi 0,04 0,2 0,25 0,12 0,3 0,09

Calcularían el promedio de la media muestral )(XE que coincide con la media

de la distribución inicial y cuyo valor es 44,5. Se dejaría como ejercicio la

representación gráfica de la distribución obtenida en apartado b) y determinar la

distribución de muestreo de la varianza muestral S2, calculando )( 2SE y comparando

con 2 . Además, se pediría enunciar verbalmente la aplicación del teorema central del

límite a este ejercicio.

A modo de refuerzo, se dejaría el ejercicio 2.3, que será retomado en la sesión 8;

y corresponde a un problema de producción. Su objetivo es estudiar algebraicamente y

gráficamente la forma de la distribución de media muestral o suma de variables

aleatorias discretas acotadas.

Page 174: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

167

Ejercicio 2.3. Una máquina produce artículos con cierto tipo de defecto, identificados como 0, 1 y 2. Suponiendo que en una partida hay 20 artículos sin defecto, 30 con un defecto y 50 con dos defectos, se

saca un artículo al azar y se anota su valor, X1. La distribución de X1 será

25,0

13,0

02,0

)( 1x

x

x

xXP

Suponga que el artículo escogido primero se devuelve a la partida y luego se escoge un segundo artículo y

se anota su valor, X2 . Considere la v.a. 2X =(X1 + X2)/2 como el promedio de una muestra aleatoria de

tamaño 2, con distribución: P( 2X = 2x )= 0,04 , 0,12 , 0,29 , 0,30 , 0,25 y valores de la v.a. 2X

respectivamente 0 , 1/2 , 1 , 3/2 , 2. Suponga que después de que el segundo artículo ha sido también devuelto a la partida, se escoge un tercer

artículo y se anota su valor, X3. Determine la distribución de probabilidad de la v.a. 3X =(X1 +X2+X3)/3

a. Realice el experimento de obtener un cuarto artículo siendo devuelto el tercero a la partida. Obtenga la distribución de probabilidades del promedio de los cuatro artículos extraídos.

b. En un gráfico dibuje las distribuciones de 1X , 2X , 3X y 4X (Utilice Excel y/o lápiz y papel). ¿Qué puede comentar sobre la forma de la distribución de los resultados de esta ilustración numérica? En el

mismo gráfico, trace en línea discontinua como sería la distribución de 5X .c. Si en vez de la media muestral, se analiza la suma de variables aleatorias discretas, S1 ; S2=X1+X2 ;

S3=X1+X2+X3 , etc. Fundamente si la distribución de la suma y el promedio serán similares. d. Enuncie al menos una pregunta de acuerdo al problema, sobre el cálculo de probabilidad, donde

tenga que aplicar el teorema central del límite y resuelva.

Se esperaría que los estudiantes continúen el experimento de obtener la

distribución de probabilidades del promedio o de la suma de variables aleatorias

discretas, como se representa a continuación:

Page 175: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

168

A continuación se plantearía otra aplicación del teorema central del límite para

el caso de la distribución hipergeométrica (P8), recordando primero este modelo:

Supongamos que se extraen n bolas, al azar y sin reemplazamiento, de una urna

que contiene a bolas blancas y b bolas negras; sea X el número de bolas blancas

contenidas en la muestra resultante. Se dice que X tiene una distribución

hipergeométrica, con función de probabilidad

n

ba

xn

b

x

a

xf )( , ),(,.....3,2,1,0 namínRX

En el caso de que n es grande y que nba , esta distribución puede ser

aproximada por una distribución normal, con media y varianza: =np;

12

ba

nbanpq . Para valores dados de n y a+b, la aproximación es más precisa se

cuando p=(a/(a+b)) es próximo a 0,5 (a/b 1).

Luego, se presentaría la siguiente actividad de aplicación en el caso de

votaciones:

Actividad 2.3. La candidata presidencial de Chile Michel Bachelett obtiene un 48% de los N

encuestados, de forma permanente por varios meses, previo a las elecciones. Pensando en los resultados definitivos de diciembre 2005 respecto a los votos de los tres candidatos, ¿Cuál es la probabilidad de que sea ganadora en un sondeo de 200 votos en un determinado distrito?, ¿Tendremos una primera presidenta mujer de Chile, en la primera vuelta electoral? Nota: La proporción p de votos a favor de M. Bachelett varía de un mes a otro pero con tendencia al 48% y además los tamaños de muestras pueden ser distintos.

El procedimiento de solución requiere definir la variable X: “número de votos

que obtiene de los 200” y reconocer que X tiene una distribución hipergeométrica de

parámetros n = 200, a = pN y b = (1-p)N, donde p = 0,48 y calcular la media y varianza

respectiva, =np=96;1

20092,49

12

N

N

ba

nbanpq (P1, P2).

Si N>>200, la varianza está próxima a 49,92 y la distribución de X es

aproximadamente N(96, 49,92). En términos simbólicos, la probabilidad de que la

candidata obtenga más de la mitad de los votos es:

2611,07389,01)6369,0(192,49

965,1001)100( FFXP Z .

Page 176: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

169

Se dejaría como ejercicio calcular y comentar el valor de la probabilidad sin usar la

corrección de continuidad (P12) y comparar el resultado inicial con la aproximación

binomial a la distribución hipergeométrica de la probabilidad calculada (P8).

Se continuaría con la distribución de la suma de variables discretas no acotadas,

se presenta a los alumnos la aplicación del teorema central del límite a la distribución de

Poisson (P8), es muy recurrida en ingeniería y planteando algunos ejercicios de tipo

algebraico. En la siguiente sesión se presentaría algunas gráficas de la distribución

Poisson para varios valores de sus parámetros.

Actividad 2.4. En un proceso de fabricación de películas fotográficas aparecen por término medio 1 defecto por cada 20 metros de película. Si la distribución de defectos es Poisson, calcule la probabilidad de 6 defectos en un rollo de 200 metros de película (a) directamente; (b) utilizando la aproximación normal.

Primero se debe calcular la probabilidad en forma exacta usando el modelo de

Poisson; tenemos que el parámetro =1/20 metros, lo que conduce a que en 200 metros

=200/20 =10 defectos en 200 metros. Así 0630,0!6

10)6(

610eXP . Una solución

aproximada usando la distribución normal y la corrección de continuidad (P12), se

obtiene con 0557,010

105,6

10

105,5)6( ZPXP . Se observa la buena

aproximación de la distribución de Poisson por la normal, para n grande y >5.

Desarrollado el ejercicio, se establecería la aproximación de la distribución de

Poisson:

“Sean nXXX ,....,, 21 variables aleatorias de Poisson independientes, de media

común . Por el teorema central del límite (E4) la distribución de n

iin XS

1 es

aproximadamente normal N(n n ) para n suficientemente grande”.

La siguiente actividad relacionaría las distribuciones Poisson, binomial y

normal; para n grande y p pequeño, la distribución binomial b(n,p) se aproxima a la

distribución de Poisson P( =np), siendo el error pequeño si npq es grande. Para

pequeña, solamente puede usarse la aproximación de Poisson, pero si es grande,

podemos utilizar cualquiera de las aproximaciones normal o de Poisson.

Page 177: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

170

Actividad 2.5. La distribución de Poisson con µ=100 asigna al conjunto de enteros a, a+1,a+2…,b la probabilidad )()1()()( bXPaXPaXPbXaP . Esta distribución puede considerarse como aproximación a la binomial con n = 100.000.000 y p = 10-6 .Luego, 100npq y nos aproximamos a la binomial mediante la normal, al menos para valores próximos

al término central 100, podemos usar la aproximación normal para la Poisson. Compruebe que 10/)5,100(10/)5,99()( aFbFbXaP

Seguidamente, se pediría a los alumnos que calculen varias probabilidades en las

dos distribuciones que muestre el grado de aproximación, como la tabla siguiente

Probabilidades Valores exactos Aproximación Normal 9085 X

9590 X

10595 X

11090 X

115110 X

120115 X

0,113840,184850,417630,706520,107380,05323

0,110490,179500,417680,706280,110490,05335

Desarrollo de la Sesión 8.

La tercera sesión comenzaría planteando a los alumnos el ejercicio 2.4. Se les

pediría que envíen sus comentarios por el foro de la plataforma, acerca del estudio

gráfico de la distribución Poisson en función de su parámetro.

Ejercicio 2.4. Comente, por el foro, la forma de la distribución Poisson para distintos valores de sus

parámetros.

Page 178: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

171

La siguiente actividad está orientada a mostrar una aplicación del teorema

central del límite a la estimación de parámetros por medio de intervalos de confianza

(CP12). Se procedería a la construcción intervalos de confianza de la media de la

distribución Poisson (CP12) a partir de su estimador de máxima verosimilitud (P10).

Actividad 2.6. Supongamos que la v.a. X tiene una distribución Poisson de parámetro . Considere una muestra aleatoria de tamaño n.

a. Pruebe que el estimador de máxima verosimilitud del parámetro es X .

b. Determine un intervalo de confianza aproximado del 95% para .

Esperamos que los alumnos verifiquen que la distribución muestral de la media

es de la forma n

NX ,~ (una consecuencia de CP2) y posteriormente escriban su

forma estándar )1,0(~ Nn

X (AP2). De esta forma, pueden determinar los percentiles

tales que 1)21()21( Zn

XZP (AP3). Despejando el parámetro

(AP1) deben llegar a obtener la siguiente expresión:

(1 2) (1 2) ,

Z ZX X X X

n n

En el tiempo que quedaría de la clase, se atenderían consultas del ejercicio 2.3 y

enseguida el profesor pasaría a plantear y dar indicaciones de resolución de dos nuevos

ejercicios propuestos sobre acuicultura y transporte.

Ejercicio 2.5. Una caja de una empresa contiene 600 merluzas y otra de 500 salmones. El departamento de control de calidad desea seleccionar una muestra aleatoria de 36 pescados. ¿Cuál es la probabilidad aproximada de que se puedan extraer al menos 15 salmones?

Ejercicio 2.6. El número de infracciones por estacionamiento en cierta ciudad sugiere una distribución

de Poisson con parámetro = 50. ¿Cuál es la probabilidad aproximada de que: a. ¿Entre 35 y 70 infracciones se despachen en un día en particular? b. ¿El número total de infracciones expedidas durante una semana de 5 días esté entre 225 y 275?

Al igual que la lección 1, una vez terminado los contenidos de la lección 2 se les

plantearían a los alumnos resolver, en un tiempo de 50 minutos, un ejercicio algebraico

de caso de muestras provenientes de una variable aleatoria discreta acotada. La solución

prevista y resultados serán analizados en la sección 6.3.2.

Page 179: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

172

Ejercicio 2.7. Sea X el número de paquetes que envía por correo un cliente seleccionado al azar, en cierta oficina de envíos. Suponga que la distribución de X es como sigue:

x 1 2 3 4 P ( X1 = x) 0,4 0,3 0,2 0,1

a. Considere una muestra aleatoria de tamaño n = 2 (dos clientes) y sea X el número medio muestral de paquetes enviados. Obtenga la distribución de probabilidad de X .

b. Calcule, para n = 2, la probabilidad P( X 2,5).c. Si se selecciona una muestra aleatoria de tamaño n=3, ¿Cuál es la probabilidad de que el total de

paquetes enviado por los tres clientes sea exactamente de 4 paquetes? d. Encuentre la probabilidad aproximada de que el número promedio de paquetes en 36 clientes sea

menos de 2,5 paquetes.

5.6. ANÁLISIS DE LA TERCERA LECCIÓN

5.6.1. ELEMENTOS DE SIGNIFICADO Y CONFIGURACIONES EPISTÉMICAS

La tercera lección titulada “Distribución asintótica de la suma de variables

aleatorias continuas”, presenta el teorema central del límite para el caso de variables

continuas (CP4). Se trabajarían principalmente dos campos de problemas, CP4:

Determinar la distribución de la suma de variables aleatorias continuas idénticamente

distribuidas y CP8: Obtener el tamaño adecuado de una muestra aleatoria de

poblaciones desconocidas. Otros dos son planteados como ejercicios, CP10: Obtener la

distribución de diferencias de medias muestrales en dos poblaciones y CP12: Estimar

por intervalos de confianza la media y otros parámetros para muestras grandes.

Se usarían procedimientos algebraicos (AP1) con apoyo de calculadora y

ordenador en el cálculo de probabilidades (AP3). Esta última lección reúne las diversas

expresiones verbales y simbólicas y representaciones gráficas simuladas del teorema;

así como intentamos finalizar con el enunciado formal del teorema como límite de

funciones (E2), partiendo del caso particular de suma de v.a. independientes e

idénticamente distribuidas (E4). Las propiedades que nos proponemos que los alumnos

apliquen son las siguientes: P1: La media de la distribución aproximada de una suma de

variables aleatorias es la suma de las medias; P2: La varianza de la distribución

aproximada de la suma de variables aleatorias es la suma de las varianzas; P3: La media

aritmética de una muestra aleatoria de tamaño suficientemente grande sigue una

distribución aproximadamente normal; P4: La aproximación mejora con el número de

sumandos; P8: Aproximación de algunas distribuciones clásicas a la distribución normal

y P10: Los estimadores de máxima verosimilitud tienen distribución asintótica normal.

Page 180: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

173

Tabla 5.6.1.1. Planificación de la tercera lección

Sesión Acción Didáctica

Objetivo de la acción didáctica Elementos de significado

Configuración epistémica

Actividad 3.1 Motivar la aproximación de la distribución Uniforme continua

CP4, AP1, AP2, AP3, E4, P1, P2, P8, A2

Algebraica

Sección 3.1 Tercera formulación del teorema CP4, E4 Algebraica

9

Actividad 3.2 Distribución de la suma de v.a.i.i.d. con distribución U(0,1)

AP1, AP2, P1, P2, P4, P8, A2, A3, A4

Algebraica Computacional

Ejercicio 3.1 Aplicación del teorema a la distribución U(-1,1)

AP1, AP2, P1, P2, P4, P8, A3, A4

Algebraica Computacional

Sección 3.2 Simulación gráfica para distintos valores de los parámetros de las distribuciones de Fisher y Chi-cuadrado

AP1, P4, P8, A2 Computacional

Sección 3.3 Distribuciones clásicas de probabilidades: propiedades de la distribución Gamma

E4, P8 Computacional

10 Actividad 3.3 Aproximación de la distribución Exponencial a la normal

AP1, AP3, P1, P2, P3, P8, A2, E4

Algebraica

Ejercicio 3.2 Aplicación algebraica del teorema a la suma de v.a. exponencial

AP2, P1, P2, P8, A2

Algebraica

Ejercicio 3.3 Aplicación algebraica del teorema a la distribución Gamma

AP1, AP3, P1, P2, P4, P8, A1

Algebraica

Actividad 3.4 Aplicación algebraica del teorema a la suma de v.a. con distribución desconocida

AP1, AP3, P1, P2, P3, A1

Algebraica

Ejercicios 3.4 y 3.5

Aplicación del teorema a las distribuciones T, F y Gamma mediante simulación gráfica con el ordenador

P4, P8, A2, A4 Computacional

11 Actividad 3.5 Aplicación algebraica del teorema a la determinación de tamaños de muestra

CP8, AP1, AP2, AP3

Algebraico

Ejercicio 3.6 Aplicación algebraica del teorema a la diferencia de medias muestrales

CP10, AP1, AP3, P1, P2

Algebraico

Sección 3.4 Cuarta formulación del teorema y demostración algebraica

CP4, E2, A1 Algebraico

Ejercicios 3.7 Aplicación del teorema a la media muestral de v.a. desconocidas

CP4, AP1, AP3, P1, P2, P3, A1

Algebraico

Ejercicios 3.8 Aplicación del teorema a determinar el tamaño muestral en intervalos de confianza

CP8, AP2, AP3 Algebraico

Sección 3.5 Demo del programa @risk usando la binomial

P4, P7, A4, E4 Computacional

Fuera de calse

Ejercicio 3.9 Aplicación en ingeniería del teorema a la distribución uniforme.

CP4, CP8, AP1, AP2, AP3, E5, P1, P2, P8, A1, A6

Algebraico

Respecto a las argumentaciones usaríamos las A2: Caso especial de un resultado

general y A1: Demostración formal algebraica. Se describe en la Tabla 5.6.1.1 las

configuraciones epistémicas que se usarían en las actividades y elementos de

Page 181: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

174

significados pretendidos. No mencionaremos los elementos de lenguaje ya que están

siempre presentes.

5.6.2. TRAYECTORIA DIDÁCTICA

Desarrollo de la Sesión 9.

Se explicaría a los estudiantes que esta última parte trata de la aproximación

asintótica de la suma de variables aleatorias continuas, de gran interés en la ingeniería,

debido a que en muchas aplicaciones intervienen variables de esta naturaleza, por

ejemplo la distribución de Weibull y exponencial. Comenzaríamos con la distribución

uniforme continua, seguida de la aproximación de distribuciones clásicas en inferencia y

concluyendo con el enunciado formal del teorema con su demostración algebraica.

En primer lugar, el profesor enunciaría una tercera versión del teorema central

del límite, para la suma de variables aleatorias independientes idénticamente

distribuidas (E4). Esta formulación más restringida del teorema es común en los libros,

pero en la mayoría se presenta para la media muestral, mientras nosotros presentaríamos

el caso de la suma:

Enunciado 3 del teorema central del límite: Si se extrae una muestra aleatoria de n observaciones de

una población con una media finita y una varianza finita 2, entonces, si n es lo bastante grande, la distribución de muestreo de la suma in XS se puede aproximar con una función de densidad normal

cuya media es n y varianza n 2.

Se explicaría a los estudiantes que ahora nos aproximaremos a la distribución de

la suma de variables continuas. Partiríamos recordando la distribución uniforme

continua.

Definición: Sea X una v.a continua que toma todos los valores en el intervalo (a, b) con - <a < b< , diremos que X está uniformemente distribuida si la función de densidad de X es constante x (a , b) .

La f.d.p. de una v.a X ~ U (a,b) está dada por: ...0

1)(

coe

bxaabxf

Además, IE(X) = 2

ba ; V(X) = 12

)( 2ab

A continuación, se plantearía la actividad 3.1, referido a un problema de

electricidad y magnetismo, modelado por una distribución uniforme continua.

Page 182: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

175

Actividad 3.1. Se tienen n voltajes V1 , V2 ,.., Vn que se reciben en un concentrador, de tal suerte que n

i

iVV

1

es la suma de los voltajes en ese punto. Cada voltaje Vi es una variable aleatoria distribuida

uniformemente en el intervalo [0,10]. Considerando n = 20, calcule la probabilidad de que el voltaje total de entrada sobrepase los 105 volts.

El profesor ofrecería 25 minutos para intentar resolver la situación, calculando el

valor exacto y aproximado de la probabilidad pedida. Los alumnos debieran dejar

expresado en forma simbólica la probabilidad que corresponde haciendo notar la

dificultad de los cálculos, y generalizando los resultados de la lección 2 dar una

solución aproximada. El profesor daría la solución en la siguiente sesión.

Luego, una segunda actividad es presentada, que es un caso particular de la

distribución uniforme para ciertos valores de sus parámetros.

Actividad 3.2. Sean X1, X2,...Xn variables aleatorias U(0,1) independientes. La n

iin XS

1 tiene una

media de n/2 y varianza de n/12. Compruebe que la variable aleatoria estandarizada 12/

2/*

n

nSS n

n

tiene, por el teorema central del límite, una distribución aproximadamente normal estándar para n

grande.

Esta actividad, en relación a este modelo de probabilidad uniforme de

parámetros U(a=0 ,b=1) propone al estudiante dar una solución algebraica para el caso

de la suma de dos v.a. X1+X2 . El profesor comentaría que la función densidad de

probabilidad exacta de *nS para valores pequeños de n se podría obtener por métodos de

cambio de variables. Por ejemplo, la f.d.p. de *2S es:

606/6

066/6)(

zparaz

zparazzfz

Luego se mostraría a los alumnos que en la siguiente figura podemos comparar

la f.d.p. exacta de *nS con la f.d.p. de la distribución normal, para n = 1,2,3. Se haría

notar la concordancia que es buena incluso para valores de n tan pequeños como 3. Se

dejaría por parte del alumno indagar fuera de clase y con apoyo del computador, obtener

la distribución de *nS para n >3. Se usarían los argumentos A3: Simulaciones

manipulables de distribuciones en el muestreo y A4: Simulación gráfica con ordenador

del teorema central del límite.

Page 183: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

176

Se propondría el ejercicio 3.1, que motivaría el uso del ordenador para visualizar

la convergencia de esta suma de v.a. que proviene de poblaciones uniforme con los

mismos parámetros.

Ejercicio 3.1. Sea X v.a. continua con distribución uniforme en el intervalo (-1,+1). Si X1, X2,...Xn son v.a. independientes con la misma distribución que X, entonces la v.a. in XS tiene media 0 y

varianza n/3. Analice con el computador que la v.a. 3n

SZ n tiene aproximadamente una distribución

normal estándar N(0,1). ¿Para que n es suficiente una buena aproximación? Observe que esta distribución se utiliza para generar números aleatorios con distribución N(0,1).

Tanto en la actividad 3.2 como en el ejercicio 3.1 se enfatizaría la pregunta

¿Cómo lo desarrollarías, si trabajas con la suma y no el promedio; o al revés? El

profesor recurriría a responder de forma simbólica la aproximación normal de la suma y

media con sus respectivos parámetros de acuerdo a la distribución de origen, por

ejemplo:

Para la actividad 3.2: Si )1,0(~ UX 12

,2~

nnNXS

TCL

nin

Para el ejercicio 3.1: Si )1,1(~ UX3

,0~n

NXS in

Seguidamente se haría una extensión del teorema central del límite a otras

distribuciones de probabilidades clásicas: t-Student, chi-cuadrado y F de Fisher. Estas

distribuciones (Ver Figura 5.6.2.1) están tabuladas y se utilizan bastante en estadística.

Page 184: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

177

Figura 5.6.2.1. Distribuciones Chi cuadrado y de Fisher

La sesión terminaría introduciendo que la distribución gamma también puede

aproximarse por la distribución normal. Para ello, se recordaría la función gamma de

parámetro como 0

y1 dyey)( , donde se verifica que !1)( , y se

pasaría a su definición.

Definición: Una v. a. continua X con f. d. p. x

1X eX

)(

1)x(f ; x > 0

se dice que tiene una distribución gamma con parámetros y . Además, una v. a. X ~ gamma ( , ) tiene por: media y varianza 2

Luego, se presentaría una gráfica de la función densidad gamma para varios

valores de sus parámetros, haciendo notar tanto en su representación gráfica (Figura

5.6.2.2) como en las propiedades la derivación de otras distribuciones de probabilidades

ya descritas y la variación del comportamiento de la distribución.

Figura 5.6.2.2. Distribución Gamma

Además, se recordarían las siguientes propiedades:

Page 185: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

178

a. Si =1, =1/ , >0, se obtiene la distribución exponencial de parámetro .

b. Si =r (entero), =1/ se obtiene la distribución Erlang (r, ) que nos da la distribución

del tiempo necesario para observar r – éxitos. Su f.d.p. es de la forma:

!1r

ex)x(f

x1rr

y de media y varianza respectivas ( ) /E X r , V(X) = r / 2

c. Si =n/2, n natural y =2 se obtiene la distribución chi cuadrado con n grados de

libertad (que es su parámetro). Su f.d.p. es la siguiente:

0;

22

n)(~

2/

21

2

)( xex

xfXn

xn

n

Además, E(X) = n y V(X) = 2 n.

Desarrollo de la Sesión 10.

La sesión comenzaría resolviendo la actividad 3.1. En el caso del cálculo del

valor exacto, el voltaje total equivale a la suma de los 20 voltajes de entrada, y por tanto

se pide la probabilidad 10520

1iiVP . Como las variables de voltaje son uniforme en

[0,10], es complicado encontrar la función densidad de probabilidad conjunta exacta

para la suma de los 20 voltajes, y más aún la probabilidad

201105

20120

1,...,),...,(105 dxdxxxfVP

ii .

Ello conduce a intentar una solución aproximada con justificación en el teorema

central del límite (E4):

Si n = 20 la esperanza y varianza de cada voltaje son 5 y 25/3 respectivamente.

Para el voltaje total de entrada anotamos 20

120

iiVS y tenemos 100)(

20

1iiVE y

3/500)(20

1iiVVar (P1, P2). La variable aleatoria estandarizada (AP2)

3500

1002020

* SS

tiene, por el teorema central del límite (CP4), una distribución aproximadamente normal

estándar para n grande. Calcularíamos la probabilidad

2020 20

1 20

( ) 105 100105

500 3i

i

S E SP V P

S=P( Z > 0,387)=1-0,6517=0,342.

Page 186: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

179

Dejaríamos al estudiante decidir si n = 20 voltajes son suficientes para tener una

buena aproximación del teorema. A continuación, se destacaría la distribución

exponencial. Se recordaría que en el proceso de Poisson los eventos ocurren al azar

independientemente y a una tasa uniforme por unidad de tiempo, definiendo la v.a. Y

como número de eventos en el intervalo (0,t . Si estamos interesados en X que es el

tiempo que transcurre hasta que el primer evento ocurre, entonces X es la llamada v. a.

exponencial con parámetro y entonces se tiene:

X~ ( ) 0x

0x0)( xX

exf

Además, se tiene que E(X) =

0

xte dx =

1 , Var(x) =

2

1

Seguidamente, se propondría a los alumnos resolver la siguiente actividad,

otorgando 20 minutos.

Actividad 3.3. Los tiempos que tarda un cajero en procesar el pedido de cada persona son variables aleatorias independientes con distribución exponencial y una media de 1,5 minutos. ¿Cuál es la probabilidad aproximada de que se puedan procesar los pedidos de 100 personas en menos de 2 horas?

Luego el profesor daría la solución: Tenemos /15,1)(XE , donde 3/2 .

Entonces la v.a. )3/2exp(~X , y además la varianza es 4/9/1)( 2XV .

Considerando una muestra aleatoria de 100 personas X1,X2,...,X100 anotamos

2,1120 XPXP i . Utilizando el teorema central del límite para n=100,

)1,0(~20/3

5,1

100

4/9,5,1~

2

NX

nNX .

Así, la probabilidad pedida sería 02275,0)2(20/3

5,12,1ZPZP .

Se dejaría la siguiente interrogante: Suponga que los tiempos que tarda un cajero

en procesar el pedido de cada persona son variables aleatorias independientes de

población desconocida, con una media de 1,5 minutos y una desviación estándar de 1

minuto. ¿Cuál es la probabilidad aproximada de que se puedan procesar los pedidos de

100 personas en menos de 2 horas?

Continuaríamos reforzando el teorema central del límite planteando dos

ejercicios; una a la distribución exponencial utilizando el procedimiento de operación

Page 187: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

180

inversa a la tipificación (AP2), en una muestra pequeña de tamaño 50, y otra aplicación

de aproximación a la distribución gamma.

Ejercicio 3.2. Un supervisor de una fábrica está interesado en presupuestar los costos semanales de reparación para cierto tipo de máquina. Los registros de años previos indican que este costo de reparación tiene una distribución exponencial con una media de 20 para cada máquina observada. Sean X1, X2,...X50 los costos de reparación para cincuenta de estas máquinas durante la próxima semana.

Determine un número c tal que 05,050

1

cXP

i

i , suponiendo que las máquinas operan

independientemente.

Ejercicio 3.3. Suponga que la distribución del tiempo X (en horas) utilizados por estudiantes de cierta universidad en sus proyectos de graduación es gamma con parámetros =50 y =2. Debido a que es grande, se puede demostrar que X tiene aproximadamente una distribución normal. Utilice este hecho para calcular la probabilidad de que un estudiante seleccionado al azar pase a lo sumo 125 horas en el proyecto de graduación. ¿Cómo sería la gráfica de la distribución gamma ( =50, =2) ?

La actividad siguiente que desarrollaría el profesor en conjunto con los alumnos

sería una aplicación del teorema central del límite para el caso de distribución

desconocida, donde se destacaría que no importa cuál sea distribución de probabilidad

de la variable el teorema asegura que los pesos de las cajas que contienen ligas se deben

distribuir de manera aproximadamente normal.

Actividad 3.4. La compañía Valmar fabrica ligas de hule del número 18 y las empaca en paquetes de 200 ligas cada uno. El peso de una liga individual es una variable aleatoria con distribución desconocida, pero se ha calculado que la media es de aproximadamente ½ gramo, con una desviación estándar de 1/100 de gramo. Cada 50 paquetes de ligas se empacan luego en una caja de cartón. Las cajas son transportadas hacia almacenes de todo el país para su comercialización. Use el teorema central del límite para determinar el porcentaje de cajas cuyo contenido neto es de más de 5010 gramos (tome en cuenta sólo el peso de las ligas que contiene).

La resolución del problema requiere que se defina la variable aleatoria

Y=X1+X2+...+X10000 donde las variables aleatorias independientes representan el peso

exacto de las ligas que contiene la caja. Tenemos 50005,010000y gramos;

10001,01000022i . Entonces, de acuerdo con el teorema central del límite se

tiene, 158655,0)1(1)00,1()10

50005010()5010( ZPZPYP

y el 15,87% aproximadamente de las cajas pesan más de 5010 gramos.

A objeto de reforzar los conceptos anteriores se dejarían dos ejercicios para que

estudien el comportamiento distribucional de algunas funciones densidades de

Page 188: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

181

probabilidades, de gran utilidad en inferencia estadística, mediante el programa

estadístico @risk de Excel.

Ejercicio 3.4. Por medio del programa @risk, grafique distintos valores de los parámetros las distribuciones de probabilidades chi-cuadrado, de Fisher y t-Student.

Ejercicio 3.5. Como la distribución gamma G( , ), siendo entero, es la distribución de la suma de variables aleatorias independientes, con distribución exponencial de parámetro , la distribución gamma

se puede considerar aproximadamente normal 2,N . Verifique en el laboratorio que la

aproximación es suficiente para 15

Desarrollo de la Sesión 11.

La tercera y última sesión de aula estaría enfocada a mostrar aplicaciones del

teorema en la determinación de tamaños de muestra adecuados (CP8) y reforzaría con

ejercicios la estimación de la distribución de diferencias de medias muestrales en dos

poblaciones (CP10).

Se plantearía la actividad 3.5, haciendo notar que el número de unidades que se

deben seleccionar de una población, en un muestreo aleatorio simple depende de la

precisión o error absoluto de estimación con la cual se quiere estimar el parámetro de

interés, de la varianza de la población y del valor del coeficiente de confianza utilizado

para efectuar la estimación mediante un intervalo.

Aquí, la variable es cuantitativa y se estima el valor medio poblacional µ de una muestra

de tamaño n. Se recordaría que el error absoluto de estimación o precisión de la

estimación tiene por expresión Xe . Si la población de donde se saca la muestra es

normal y la varianza es conocida de la expresión del intervalo de confianza se obtiene

nZX )2/1( . Sustituyendo el primer miembro y considerando el mayor error:

2)2/1(

)2/1(e

Zn

nZe . Luego, si es conocida se fijan e y 1- y

se determina el valor del tamaño de muestra n. Si es desconocida se debe efectuar un

estudio exploratorio y obtener su estimador S con un tamaño de muestra razonable /n .

Así, 2

1 )2/1(/

e

Stn n

Actividad 3.5. Represente por µ el verdadero pH de un compuesto químico. Se hará una secuencia de ncálculos independientes de pH muestrales. Suponga que cada muestra de pH es una variable aleatoria con valor esperado µ y desviación estándar 0,1. ¿Cuántos cálculos se necesitan si deseamos saber la

Page 189: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

182

probabilidad de que el promedio de la muestra esté dentro de 0,02 del verdadero pH y sea por lo menos de 0,95? ¿Qué teorema justifica este cálculo de probabilidades?

En esta actividad, la variable pH es continua y se quiere estimar el tamaño

adecuado de muestra para estimar la media poblacional de pH de un compuesto

químico. Considerando un error de precisión de la estimación de 0,02 = Xe , la

desviación estándar poblacional = 0,1 y una confianza de 1- = 0,95, que equivale al

percentil Z (0,975) = 1,96 , podemos calcular el tamaño mínimo dado por la expresión

9704,9602,0

1,096,1)2/1(22

e

Zn

Seguiríamos con un ejercicio de aplicación del teorema central del límite en el

estudio de las diferencias de medias muestrales en dos poblaciones (CP10).

Ejercicio 3.6. Un grupo de veterinarios han elaborado una dieta más barata para las vacas productoras de leche, asegurando que el promedio de litros de leche será el mismo. Los administradores de una planta productora de leche desean verificar la afirmación establecida por el grupo de médicos, para lo cual, seleccionan dos muestras aleatorias independientes de n = 30 vacas cada una y aplican a una de ellas la nueva fórmula y a la otra la anterior. Calculan el promedio de litros de leche producidos en cada muestra

y si la diferencia de las medias 21 XX (donde 1X es para la nueva fórmula y 2X es para la fórmula actual) es mayor que –1,23, aceptarán la nueva fórmula, ¿Cuál es la probabilidad de que rechacen la nueva fórmula si el grupo de médicos tiene razón? Considere que las desviaciones estándar de ambas poblaciones son iguales a 5.

En este momento se estaría en condiciones de mostrar una formulación más

avanzada del teorema central del límite como límite de una sucesión de funciones (E2).

Se presentaría la demostración clásica para el caso de la suma de v.a. i.i.d. mediante la

función generadora de momentos (fgm). Esto requeriría revisar los conceptos de fgm y

convergencia en series estudiados anteriormente. Este enunciado y su demostración

estaría disponible para los estudiantes en la plataforma.

Enunciado 4 del teorema central del límite: Denotemos por fn la función densidad de probabilidad de la suma Sn, o la altura del histograma de Sn en el caso discreto. El teorema central del límite afirma que, para todo número real z,

)2/exp(2

1)( 2zzfLim n

n

Demostración mediante la función generadora de momentos

Page 190: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

183

Sea M la fgm de las v.a. iX . Al ser las variables independientes la fgm de la

suma Sn será nS tMtM

n)()( , y puesto que nnSZ nn )( es una función lineal de Sn

la fgm de Sn está dada por n

tnZ

n

tMetM

n)()( )/( .

Aplicando logaritmos )(ln)(lnn

tMn

ntM

nZ . La idea de la

demostración consiste en investigar )(tMnZ para grandes valores de n. Desarrollemos

M(t) en una serie de Maclaurin: Rt

tRtM

tMtM2

)(1

2

)0()0(1)(

2222´´` ,

Luego, Rn

t

n

tn

ntM

nZ 2

222

2

)(1ln)(ln .

Sin dar todos los detalles de pasos algebraicos, queremos investigar la expresión

)(ln tMnZ cuando n . Después de unos cálculos algebraicos muy directo

encontramos que 2)(ln 2ttMLímnZ

n. Luego tenemos 22

)( tZ

netMLím

n. Esta es la fgm de

la variable distribución N(0,1) y debido a la unicidad de la fgm podemos concluir que la

v.a. nZ converge en distribución (cuando n ) a la distribución N(0,1).

Finalmente, dejaríamos algunos ejercicios de aplicación a medicina (CP4) y a

calcular el tamaño de la muestra (CP8) para reforzar los conceptos tratados.

Ejercicio 3.7. Los científicos que han estudiado el aparato circulatorio humano saben que la cantidad de oxígeno que entra a los pulmones es una variable aleatoria X cuya distribución de probabilidad no está bien establecida, pero que tiene una media de µ=54,03 ml. por minuto y por kilogramo de peso corporal, con una desviación típica de =5,8 (en las mismas unidades). Si se toma una muestra aleatoria de n = 47

individuos y X es la media muestral de la cantidad de oxígeno procesada en la sangre (en las unidades

referidas), calcular 453,54761,52 XP .

Ejercicio 3.8. Se desconoce la distribución de probabilidad de cierta variable aleatoria X y el valor de su media µ; no obstante, existen motivos para asegurar que la desviación típica de X es aproximadamente.

=3 ¿De qué tamaño debe ser una muestra aleatoria de valores de X para tener una confianza mínima de 95% de que la discrepancia entre la media muestral y la media verdadera de la población será menor a 0,3?

Finalizados los contenidos de la Lección 3 en el aula, en los siguientes días se

les plantearían a los alumnos resolver, en un tiempo de 40 minutos, un ejercicio

algebraico de caso continuo de la distribución uniforme. La solución prevista y

resultados será analizada en la sección 6.4.2.

Page 191: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

184

Ejercicio 3.9. Al sumar números, un computador aproxima cada número al entero más próximo. Supongamos todos los errores de aproximación son independientes y distribuidos uniformemente entre (-0,5 , 0,5). a. Si se suman 1500 números, ¿Cuál es la probabilidad de que la magnitud del error total exceda de

15?b. ¿Cuántos números pueden sumarse juntos a fin de que la magnitud del error total sea menor que 10,

con probabilidad 0,90?

5.7. CONCLUSIONES SOBRE EL SIGNIFICADO INSTITUCIONAL

PRETENDIDO DEL TEOREMA CENTRAL DEL LÍMITE

Se presenta un resumen en la Tabla 5.7.1 de los elementos de significado

previstos en el proceso de estudio previsto sobre teorema central del límite. En este

diseño hubo que conjugar varios factores que contribuyen y afectan el proceso de

estudio de dicho teorema, como la incorporación de las tres configuraciones epistémicas

(manipulativa, algebraica y computacional), el tiempo estimado de ejecución de las

lecciones, las exigencias del programa de la asignatura de estadística para ingenieros y

de los conceptos previos requerido que deben tenerse.

A lo largo de este capítulo se ha analizado el proceso con sus ejercicios y

actividades, resaltando los elementos del significado institucional pretendido, que

posteriormente se comparará con los significados implementados y adquiridos por los

estudiantes estableciendo el grado de correspondencia de apropiación de los elementos

importantes del teorema central del límite de acuerdo a los objetivos propuestos. De los

tipos de elementos de significados del teorema central del límite, resumidos en la Tabla

5.7.1, se destaca lo siguiente:

De los trece Campos de Problemas identificados en el estudio de significado

institucional de referencia (Capítulos 2 y 4), se ha restringido el curso a los campos

CP1, CP2, CP4, CP8, CP10 y CP12, que se consideran asequibles y suficientes para

los estudiantes.

La riqueza del Lenguaje y variadas representaciones asociadas al teorema

(expresiones verbales, simbólicas y gráficas) están presentes en cada una de las

lecciones, siendo las representaciones más utilizadas la gráfica de barras y el

histograma y la función densidad de probabilidad normal, tanto con lápiz y papel,

como dinámicas con apoyo del ordenador para la simulación, estudio de la

Page 192: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

185

aproximación de distribuciones de probabilidades y estudio de efecto de los

parámetros en la forma de las distribuciones.

Tabla 5.7.1. Elementos de significado del teorema previstos en el proceso de estudio

Tipo de elementos

Elementos de significado Lec. 1

Lec. 2

Lec. 3

Campos de problemas

CP1: Aproximación de la distribución binomial CP2: Determinar la distribución de la suma de variables aleatorias discretas idénticamente distribuidas CP4: Determinar la distribución de la suma de variables aleatorias continuas idénticamente distribuidas CP8: Obtener el tamaño adecuado de una muestra aleatoria de poblaciones desconocidas CP10: Obtener la distribución de diferencias de medias muestrales CP12: Estimar por intervalos de confianza la media y otros parámetros para muestras grandes

X

X

X

X

X

X

X

X

Lenguaje Términos y expresiones verbales Notaciones y símbolos Representaciones gráficas Simulaciones

XXXX

XXX

XXX

Procedimiento AP1: Cálculo algebraico y transformación de variables aleatorias AP2: Tipificación / Destipificación AP3: Cálculo de probabilidades con calculadora u ordenador AP4: Cálculo de probabilidades a partir de materiales manuales

XXXX

XXX

XXX

Enunciados E2: El teorema como límite ordinario de una sucesión de funciones E4: El teorema para la suma de variables aleatorias independientes idénticamente distribuidas E5: Enunciado del teorema de forma general E6: Enunciado intuitivo del teorema

X

XX

X

XX

X

X

X

Propiedades P1: La media de la distribución aproximada de una suma de variables aleatorias es la suma de las medias P2: la varianza de la distribución aproximada de la suma de variables aleatorias es la suma de las varianzas P3: La media aritmética de una muestra aleatoria de tamaño suficientemente grande sigue una distribución aproximada normal P4: La aproximación mejora con el número de sumandos P7: Aproximación de una distribución discreta por una continua P8: Aproximación de algunas distribuciones clásicas a la distribución normal P10: Los estimadores de máxima verosimilitud tienen distribución asintótica normal P12: Corrección de continuidad

X

X

X

XX

X

X

X

X

X

XXX

X

X

X

X

X

XXX

Argumentos A1: Demostraciones formales algebraicas y/ o deductivas A2: Presentación del teorema como caso especial de un resultado general A3: Simulaciones manipulables de distribuciones en el muestreo A4: Simulación gráfica con ordenador del teorema A5: Comprobación de ejemplos y contraejemplos, sin pretensión de generalizar A6: Obtener conclusión o tomar decisión en base al teorema

XX

XXX

X

XX

XXX

X

XX

XX

X

Page 193: Significados del Teorema Central del Limite en la Enseñanza de la

Capítulo 5

186

Todos los Procedimientos identificados en el estudio del significado de referencia se

presentan en el proceso de estudio: transformación algebraica de variables

aleatorias, cálculo de probabilidades con calculadora, tablas estadísticas u

ordenador, tipificación y destipificación, experimentación con dispositivos

manipulables. La propuesta de enseñanza pone diferencias con el significado

institucional de referencias ya que estamos introduciendo en forma gradual

diferentes algoritmos de resolución de problemas de donde surge utilizar el teorema

central del límite, del cálculo frecuencial de probabilidades con calculadora

situamos el aprendizaje por parte del alumno en la exploración gráfica de la

distribución muestral de estimadores mediante la comparación visual de los

parámetros de una distribución de probabilidades. Esto implica el manejo de

software, en nuestro caso el programa @risk, así como el manejo del procesador de

texto Word y la planilla electrónica Excel que deben utilizar en la experimentación e

informe de las tareas acordadas.

En cuanto a los Enunciados del teorema descrito en el Capítulo 4, de los seis se han

considerado de forma gradual cuatro conforme al tipo de alumnos de la asignatura;

comenzando a través de dispositivos didácticos, enunciado intuitivo del teorema,

avanzando para la suma de variables aleatorias independientes idénticamente

distribuidas, hasta su enunciado analítico como límite de una sucesión de funciones.

Se han considerado asimismo siete de las Propiedades determinadas, que son P1,

P2, P3, P4, P7, P8 y P10, incorporando también la propiedad P12: corrección de

continuidad para las dos primeras lecciones.

Los elementos de significados anteriores se relacionan de alguna manera por medio

de diversos tipos de Argumentos: de la simple comprobación de ejemplos a la

generalización de las conclusiones de experimentos tanto manipulables como de

simulación con el ordenador. La propuesta pone énfasis en la argumentación de la

aplicación del teorema central del límite más que el cálculo de probabilidad exacta y

aproximada de distribuciones de probabilidad.

En resumen, esta enumeración muestra una razonable idoneidad epistémica, en

cuanto que, aunque el significado institucional pretendido es más limitado que el de

referencia, contempla los elementos de significado más importantes del teorema y es

adaptado al tiempo disponible y conocimientos previos de los estudiantes (idoneidad

Page 194: Significados del Teorema Central del Limite en la Enseñanza de la

Diseño del proceso de estudio

187

cognitiva). Se hace un uso de diversos recursos didácticos (a través de las

configuraciones epistémicas), que junto a los momentos previstos de evaluación a lo

largo del proceso de estudio contribuye a su idoneidad didáctica. Finalmente, puesto

que los campos de problemas se contextualizan en aplicaciones en el área de ingeniería

como agentes motivadores de su rol profesional la propuesta tiene una idoneidad

afectiva. Por supuesto estos tipos de idoneidad son previstos a priori y habrá que

contrastarlo con la implementación efectiva y aprendizaje de los estudiantes para

analizar la idoneidad final del proceso de estudio.

Page 195: Significados del Teorema Central del Limite en la Enseñanza de la

188

Page 196: Significados del Teorema Central del Limite en la Enseñanza de la

189

CAPÍTULO 6.

SIGNIFICADOS IMPLEMENTADOS DEL

TEOREMA CENTRAL DEL LÍMITE

6.1. INTRODUCCIÓN

Finalizado el diseño del proceso de estudio, se llevó a cabo la observación de su

desarrollo, formando parte de un curso de estadística en la Universidad Católica de la

Santísima Concepción de Chile. La población objetivo de la investigación consistió en

los estudiantes de ingeniería, en general, y, en particular, en Chile. La muestra

participante estuvo formada por 134 alumnos de la Universidad citada, perteneciente a

cinco especialidades (Acuicultura, Marítimo Portuario, Informática, Industrial y Civil),

todos ellos habiendo aprobado previamente un curso de Cálculo de Probabilidades. Los

134 alumnos se asignaron en forma aleatoria en dos secciones de 60 y 74 alumnos que

fueron enseñados con el mismo material y actividades descritas en el Capítulo 5.

Durante la enseñanza se realizó una observación participante del curso. El

investigador participó en una de las secciones y la otra clase fue impartida por uno de

sus colegas y registrándose por otro colega, en un diario de observación, las principales

intervenciones de los estudiantes. Se recogieron también las respuestas escritas a

algunas de las actividades y ejercicios propuestos en clase y a través de la plataforma.

Asimismo, al finalizar cada una de las tres lecciones se realizó una evaluación parcial,

para hacer un seguimiento del aprendizaje de los estudiantes.

En este capítulo se analiza algunos episodios del proceso de observación,

utilizando el enfoque ontosemiótico del conocimiento y la instrucción matemática

(Godino, Batanero y Font, 2007). En cada una de las tres lecciones se analiza

únicamente una muestra de las actividades desarrolladas colectivamente en la clase y de

los ejercicios realizadas individualmente por los alumnos, pues la cantidad de

Page 197: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

190

información recogida ha sido muy abundante y el análisis es suficiente para nuestros

objetivos.

El análisis se llevará a cabo mediante diferente metodología, todas ellas basadas

en un estudio cualitativo previo de las respuestas de los estudiantes y su categorización,

utilizando un proceso inductivo y cíclico, conforme a la metodología cualitativa (Gil,

1994). Se presentará un informe exhaustivo de las categorías de respuestas obtenidas,

con sus correspondientes tablas de frecuencia en algunas actividades o ejercicios. Para

el resto, se presenta las categorías de análisis, con ejemplo de las respuestas.

Asimismo, se analiza una breve prueba de evaluación llevada a cabo al finalizar

cada una de las lecciones, la cual se examinará exhaustivamente para obtener los

elementos de significado aplicados por los estudiantes en cada paso de la evaluación.

Como resumen de toda esta información se presentan tablas de los elementos de

significado personal que hemos podido constatar, que se han puesto en juego en el

transcurso del tema, a través de los diferentes instrumentos de recogida de datos. La

finalidad es describir el significado institucional implementado para comparar con el

significado institucional previsto y comprobar si se cumplen las expectativas sobre los

diversos tipos de idoneidad didáctica expuestos en el Capítulo 5.

6.2. OBSERVACIÓN DE LA PRIMERA LECCIÓN

6.2.1. ANÁLISIS DE ACTIVIDADES DESARROLLADAS EN EL AULA

Actividad 1.1

Un sistema está formado por 100 componentes cada una de las cuales tiene una confiabilidad igual a 0,95.(Es decir, la probabilidad de que la componente funcione correctamente durante un tiempo específico es igual a 0,95). Si esas componentes funcionan independientemente una de otra, y si el sistema completo funciona correctamente cuando al menos funcionan 80 componentes, ¿Cuál es la confiabilidad del sistema?, ¿Qué aspectos destacarías en este problema?

La primera sesión comienza preguntando el profesor a los estudiantes cómo

desarrollarían la actividad 1.1, con los conocimientos previos del curso de

probabilidades. Se dio a los alumnos un tiempo de 25 minutos para responder en una

hoja con el enunciado. En primer lugar, se pidió a los alumnos destacar elementos del

problema, obteniéndose las respuestas de la Tabla 6.2.1.1.

Page 198: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

191

Tabla 6.2.1.1. Elementos destacados por los estudiantes (n=103) en la Actividad 1.1

Elementos Frecuencia Las variables son independientes 34La probabilidad es alta 15 No se da la media y la varianza 5Las componentes del sistema se distribuye normalmente 12 Las componentes son variables aleatorias Bernoulli 2 No se dice cómo se distribuye el tiempo 2Confiabilidad de las componentes 1-alpha = 0,95 3No contestaron o no responden incorrectamente 30

La más común de las respuestas fue la independencia de las componentes, con

frecuencia relativa de 33%, seguido de asociar la característica de estudio con la

distribución normal, 11,7%. Pocos reconocieron que el sistema se puede modelar por la

distribución binomial, es decir, pocos llegaron por sí mismos al campo de problemas

CP1, pues les resultó difícil pensar en los elementos del sistema como variables

aleatorias con probabilidad de éxito y fracaso (distribución Bernoulli). En algunos casos

suponen que faltan datos (no se dice cómo están distribuidas el tiempo que dura la

componente). En la Tabla 6.2.1.2 se muestran las soluciones. No llegaron a la solución

correcta (tampoco se pretendía) mediante la calculadora, aunque algunos alumnos

calcularon la probabilidad puntual en el valor 80 del recorrido.

Tabla 6.2.1.2. Respuestas de los estudiantes (n=103) a la Actividad 1.1

Desarrollo de la actividad Frecuencia Define correctamente la variable aleatoria 10 Identifica la distribución binomial 38Calcula correctamente n 100 Calcula correctamente p 22 Escribe en lenguaje simbólico )80(XP 9

Calcula la probabilidad en un punto 81044,8)80(XP11

No responden 43

Errores frecuentes fueron: a) Relacionar el valor 80 con la media muestral o la

proporción p=80/100=0,8; b) Plantear una solución mediante la distribución Poisson,

exponencial u otra; c) Aplicar la regla de tres simple para encontrar la fiabilidad,

obteniendo como solución un 76% de confiabilidad, mediante aplicación incorrecta de

la regla de tres. Una última pregunta fue por qué no era fácil llegar a la solución,

esperando se indicase el gran número de sumandos. Un 21,3% argumentan que faltan

datos de la media y la varianza (no llegan a aplicar las propiedades P1 y P2 media y

varianza de una suma); falta de tiempo o de la información sobre la distribución de la

suma. Algunos alumnos calcularon la probabilidad mediante la distribución normal,

Page 199: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

192

posiblemente recordaban el resultado de cursos previos, con lo que usan un enunciado

intuitivo del teorema (E6) dejando expresado una posible solución al desconocer la

media y varianza, aunque expresan la tipificación (AP2) 801)80( ZPXP . En

general la mayoría de los alumnos usa transformación de variables algebraicas (AP1).

Actividad 1.2

Simulación con fichas. Una caja contiene 4 fichas de las cuales 2 fichas son verdes. Simule la extracción de m muestras de tamaño n; formando las matrices nxm (tamaño muestralxnúmero de réplicas), (n, m) = (4,5), (10,1), (10,10) y (30,10). Para cada caso: a) Construya una tabla de frecuencias del número de fichas verdes por muestra obtenidas; b) Represente los datos en un gráfico de barras y comente sus características; c) Compare la media y varianza del experimento con la media y varianza teórica; d) Obtenga las tres medidas de tendencia central y comente.

La actividad 1.2 es una actividad experimental de simulación con fichas, en el

mismo campo de problemas CP1, orientada a llegar a un enunciado intuitivo del

teorema a partir de dispositivos didácticos (E6), y se realizó colectivamente en el aula.

Se seleccionaron al azar 10 alumnos, sacando cada uno una ficha de la bolsa que

contiene 2 de color verde de un total de 4. Cada alumno repitió el experimento 10 veces;

se anota en el pizarrón la matriz de orden 10×10, de valores 0 y 1 en las celdas.

A continuación los estudiantes sumaron por columna el total de “1”, pensada

como una distribución binomial de parámetros n=10 y p= ½. Se construyó así una

distribución de frecuencias en clases individuales del número de fichas verdes obtenidas

en las 10 extracciones. Luego, los estudiantes dibujaron un gráfico de barras, con eje X

los valores del recorrido 0,1,2,3,4,5,6,7,8,9,10, y el eje Y las frecuencias absolutas de

“1” en cada muestra. Se comparó la media teórica con su valor experimental

correspondiente.

La actividad resultó muy sencilla, y sirvió de introducción a otras y los ejercicios

para realizar individualmente fuera de clase. Además de los elementos citados se

ejercitaron el cálculo algebraico y transformación de variables aleatorias (AP1), cálculo

de probabilidades a partir de materiales manuales (AP4); la media de la distribución

aproximada de una suma de variables aleatorias es la suma de las medias (P1); la

varianza de la distribución aproximada de la suma de variables aleatorias es la suma de

las varianzas (P2).

Page 200: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

193

6.2.2. ANÁLISIS DE EJERCICIOS REALIZADOS POR LOS ALUMNOS FUERA DE CLASE

A continuación se analizan algunos de los ejercicios realizados por los

estudiantes fuera de la clase y se comentan brevemente los tipos de respuestas obtenidas

en las actividades.

Ejercicio 1.1

Simulación con dados. Suponga que gana si obtiene un “6” al lanzar un dado legal. Simule las posibilidades de ganar en los siguientes casos de varios lanzamientos del dado (n, m) = (4,5), (10,10) y (30,10). a. Compare sus resultados con el experimento realizado en la actividad 1.2.

Se recogieron a través de la plataforma 47 respuestas al ejercicio 1.1 elaboradas

cada una en grupos de dos o tres alumnos. A continuación, se describe el procedimiento

común de análisis que utilizaron la mayoría de los grupos en los objetos matemáticos

utilizados.

Comenzaron introduciendo una notación algebraica para designar la variable y

modelaron el experimento por medio de una sucesión de variables aleatorias. Luego,

reconocieron el modelo Bernoulli para la variable identificando el parámetro p:

“Sea Xi: Un alumno que extrae la cara número 6 del lanzamiento de un dado.

X i =1, si se obtiene el número “6” y 0, en otro caso

El parámetro p = P(E) = P(obt. el “6”) = 1/6 ; entonces Xi ~ Bernoulli (p=1/6)”

Tabla 6.2.2.1. Distribución de frecuencia al Ejercicio 1.1

Tabla de experimento con dados para (30,10) Tabla de distribución de frecuencias

X1 0 0 0 1 0 0 0 0 0 0 X16 0 0 0 0 1 0 0 1 0 0 X2 0 0 0 0 1 0 0 0 0 0 X17 0 0 0 0 1 0 1 0 0 1 X3 0 0 1 0 0 0 0 0 0 0 X18 0 0 0 0 0 0 0 0 0 0 X4 0 0 0 0 0 0 0 0 0 0 X19 0 1 0 1 0 0 0 0 1 0 X5 0 1 0 1 0 1 0 0 0 0 X20 1 0 0 0 0 0 1 0 0 0 X6 0 0 0 0 0 0 0 0 0 0 X21 0 1 0 0 0 0 1 0 0 0 X7 1 0 0 1 0 0 0 0 0 0 X22 0 0 0 0 0 0 1 0 0 0 X8 0 0 0 0 0 1 0 1 0 0 X23 1 0 0 0 0 1 0 0 0 0 X9 1 0 1 0 0 0 0 0 1 0 X24 0 0 0 0 1 0 0 0 0 0 X10 0 0 0 0 0 1 0 1 0 0 X25 0 0 0 0 0 1 0 0 0 0 X11 1 1 0 1 0 0 0 0 0 1 X26 0 0 0 0 0 0 0 0 0 0 X12 0 0 0 1 0 0 0 0 0 0 X27 0 0 0 0 1 0 0 0 1 0 X13 0 0 0 0 0 1 1 0 0 0 X28 0 0 1 0 0 0 0 0 0 0 X14 0 1 0 1 0 0 0 0 0 0 X29 1 0 0 0 0 0 1 0 1 0 X15 0 0 0 0 1 1 0 0 0 0 X30 1 0 0 0 1 0 0 0 0 0 7 5 3 7 7 7 6 3 4 2

obt. el “6” ni Ni fi Fi

2 1 1 0,1 0,1 3 2 3 0,2 0,3 4 1 4 0,1 0,4 5 1 5 0,1 0,5 6 1 6 0,1 0,6 7 4 10 0,4 1,0

La mayoría de los estudiantes simularon los experimentos para los tamaños de

Page 201: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

194

muestra pedidos mediante una representación matricial, y llegaron a definir la variable

aleatoria suma de los resultados para el cálculo algebraico y transformación de variables

aleatorias (AP1). En la Tabla 6.2.2.1 se muestra el experimento de uno de los grupos

con la distribución de frecuencias.

Observamos que se comprueban ejemplos y contraejemplos sin pretensión de

generalizar (A5), se modelizan los experimentos por medio de variables aleatorias

Bernouilli, que posteriormente se suman (AP1). La siguiente figura corresponde a la

representación gráfica de la distribución de frecuencias de la Tabla 6.2.2.1 mediante el

gráfico de barras.

Figura 6.2.2.1. Gráfico de barras con número de dados obtenidos en (30,10) al Ejercicio 1.1

Además, los estudiantes compararon los resultados del experimento de los dados

con la simulación de las fichas de la actividad 1.2. Para el experimento de las fichas,

ahora con apoyo de Excel, los alumnos siguieron el algoritmo anterior con lenguaje

simbólico donde modelizaron la extracción de una ficha verde de la caja mediante el

modelo Bernoulli X i ~ B(p=1/2), y simularon para distintos tamaños de muestra

pedidos; obteniendo una representación matricial, generando el cálculo algebraico de

variables aleatorias (AP1) y comprobaron los distintos experimentos sin pretensión de

generalizar (A5).

En cuanto a comentar las gráficas con los distintos dispositivos didácticos, en el

segundo apartado, las respuestas fueron muy similares, incluyendo gráficas semejantes a

la Figura 6.2.2.2, en que los alumnos comparan en una misma escala las distribuciones

binomiales obtenidas en el ejercicio 1.1 y la actividad 1.2. Las diferencias encontradas

por los estudiantes en las dos situaciones fueron diferencia en el valor de los

parámetros:

“Con mucha más frecuencia encontré valores positivos en las fichas que en los dados, esto es

lógico, ya que la probabilidad de acierto en las fichas era de ½, en cambio en los dados era tan

solo de 1/6”.

Page 202: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

195

Figura 6.2.2.2. Gráfica presentada en el Ejercicio 1.1

La principal semejanza fue el comportamiento de la distribución observada al

aumentar el tamaño de las muestras, en unos casos se reduce a la convergencia de la

media:

“En ambos experimentos, pude observar que a medida que uno tomaba más muestras, existía

una menor diferencia entre la esperanza de la distribución y la media de la muestra, lo que lleva

a pensar de que realmente entre mayor sea la muestra, quizás más cerca de la verdadera media

nos podremos encontrar. Esto quizás se debe a que, entre mayor sea la muestra, existirá un

menor grado de error. Por ejemplo, si lanzo dos veces la moneda y en ambas ocasiones obtengo

sello, la probabilidad de que salga cara sería 0, lo cual sería realmente falso, no así si lanzo 100

veces una moneda, ya que en este caso es más probable que obtenga un número similar entre

caras y sellos, lo mismo se cumple con el dado”.

El ejemplo en particular también sugiere la comprensión que la aproximación

mejora con el número de sumandos (P4). Otros estudiantes muestran una comprensión

gradual del enunciado intuitivo del teorema central del límite (E6):

”En este experimento al tener una muestra muy grande, los datos de las dos actividades

concuerdan en parte con la gráfica, ya que la mayor cantidad de información está contenida

cerca de la media que también se aleja de las medias anteriores. También, la varianza de la

distribución de frecuencias para la ficha verde muestra un gran desplazamiento, esto debido a

que existen datos atípicos”.

En el tercer apartado los estudiantes deben comparar los respectivos parámetros

de las simulaciones con las fichas y los dados de las distribuciones teóricas y

observadas. En general, los distintos grupos de alumnos reconocieron implícitamente la

Page 203: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

196

distribución binomial identificando los parámetros n y p y utilizaron los conceptos de

parámetro, estimador, media y varianza (teórica y experimental) como se muestra en la

siguiente tabla:

Tabla 6.2.2.2. Análisis semiótico de una respuesta al Ejercicio 1.1

(n,m) m muestras de tamaño n Parámetros y estimadores

Simulación con fichas Simulación con dados

(4,5) Media teórica Media experimental

E( Xi) = n×p = 4 × 1/2 = 2 E(exp) = Xi×ni/N = (2+4+3)/5 =1,8

0,6671

(4,5) Varianza teórica Varianza experemental

V( Xi) = n×p×q = 1 V(exp) = (Xi-E( Xi))2-ni/ (N-1) = 0,7

0,551

(10,10) Media teórica M. experimental

5 4,8

1,6671,8

(10,10) Varianza teórica V. experimental

2,52,178

1,3891,734

(30,10) Media teórica Media experimental

1514,9

55,1

(30,10) Varianza teórica V. experimental

7,54,767

4,1673,878

Los estudiantes identificaron el modelo binomial (CP1), calcularon la media de

la distribución aproximada de la suma de variables aleatorias mediante la suma de las

medias (P1), la varianza de la distribución aproximada de la suma de variables

aleatorias es la suma de las varianzas (P2) y calcularon algebraicamente la suma de

variables aleatorias (AP1).

Ejercicio 1.2

En el caso de la aproximación de Laplace-DeMoivre podemos utilizar un software estadístico para representar gráficamente la distribución B (n,p) para distintos valores de sus parámetros n y p. La figura siguiente muestra valores para p = 0,3 con n = 4, 8, 24 y para p = 0,1 con n = 4, 8 y 50. ¿Qué observas de las gráficas para los distintos valores de los parámetros?

Una vez definido el teorema de Laplace-De Moivre, en la sesión 2, se pidió a los

alumnos comentar la aproximación de la distribución binomial (CP1) a partir de unas

salidas gráficas de ordenador para diferentes valores de sus parámetros. Se recogieron

Page 204: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

197

91 respuestas individuales, que corresponden a las categorías que se recogen a

continuación, junto con sus ejemplos.

Algunos estudiantes llegaron a un enunciado intuitivo del teorema central del

límite (E6) para este caso particular. Es la respuesta más frecuente, mediante

argumentación gráfica (A4) sugiriendo que la gráfica de la distribución binomial toma

forma de la distribución normal cuando n crece y se cumple el teorema de L-D (A5:

Comprobación de ejemplos y contraejemplos, sin pretensión de generalizar):

“A medida que aumenta n, para distintos valores de p mejora la similitud de las gráficas de las

distribuciones binomiales a las gráficas de la distribución normal estándar; y si observamos

más detenidamente, se produce un desplazamiento hacia la derecha de la distribución binomial

a medida que aumenta n. Para lograr corregir este desplazamiento y lograr una mejor

aproximación de la distribución binomial a la normal, se aplica el teorema de Laplace-

DeMoivre”, “Cuando mayor sea el valor n mejor será la aproximación” y “Cuando n aumenta,

la longitud de las barras disminuye, lógicamente, porque la suma de las longitudes de todas las

barras debe ser uno, mientras que el área bajo la función de densidad, definida sobre una

variable aleatoria continua, de la distribución normal estándar, también debe ser uno”.

Tres estudiantes han usado sus conocimientos previos de estadística descriptiva

sobre la simetría y sus propiedades:

“Mientras más cercanas sean las medidas de tendencias central (media, mediana, moda), la

gráfica de la distribución tomará forma simétrica, lo que implica que a medida de que crece n la

aproximación de la distribución binomial a la normal va a ser mejor”,

“En la gráfica de la distribución p = 0,3 y n = 4 los datos se encuentran dispersos, tiene un

sesgo positivo, por lo tanto no se observa una distribución simétrica. Distribución p = 0,3 y n =

8: Podemos observar que los datos están a una menor distancia, la gráfica va adquiriendo

forma de campana o simétrica, por lo tanto la mediana, la moda y el promedio son similares.

Distribución p = 0,1 y n = 50: Los valores están considerablemente a una menor distancia en

comparación con los otros gráficos, sus sesgo es 0 tiene un distribución simétrica; un gráfica en

forma de campana, con una media, moda y mediana iguales. Su coeficiente de curtosis es igual

a 3 por lo tanto su distribución es mesocúrtica”.

En otros casos se añade la aplicación de la regla empírica dada en la sesión 2

sobre condiciones para la bondad de ajuste:

“Esto se puede analizar con la regla empírica que dice: “la aproximación de la distribución

Page 205: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

198

binomial a la normal será buena cuando “np” y “nq” son ambos mayores de 5 y que “p” y “q”

no son demasiado pequeños o sea “pq > 0,05”. Entonces para el:

Gráfico (p = 0,3, n = 4) : np = 1,2, nq = 2,8, pq = 0,21

Gráfico (p = 0,3, n = 8) : np = 2,4, nq = 5,6, pq = 0,21

Gráfico (p = 0,3, n = 24) : np = 7,2, nq = 16,8, pq = 0,21 (mejor aproximación)

Gráfico (p = 0,1, n = 4) : np = 0,4, nq = 3,6, pq = 0,09

Gráfico (p = 0,1, n = 8) : np = 0,8, nq = 7,2, pq = 0,09

Gráfico (p = 0,1, n = 50) : np = 0,5, nq = 45, pq = 0,09”.

Algunos estudiantes realizan los cálculos de probabilidades teórica y aproximada

(AP3), lo que implica también la tipificación (AP2):

“En estas gráficas podemos apreciar claramente que la distribución b(3;0,3), b(4;0,1), b(8;0,1),

no están bien aproximadas por Laplace-De Moivre, ya que “m” (nº de ensayos de la

distribución) es pequeño y no se alcanza a formar la curva normal representativa”.

Consideremos un ejemplo: Si X ~b(4;0,3) entonces )2(XP =0,3483 34,83%. Ahora, si

aproximamos la distribución binomial por Laplace-De Moivre obtenemos: )2(XP =0,1867

18.67%. En este ejemplo, la probabilidad obtenida a través de Laplace es bastante más

distante que su verdadero valor, y todo esto lo podemos deducir directamente de la gráfica de la

distribución. Para b(8;0,3) la aproximación a través de Laplace llega a ser un poco mas

cercana ya que tiene un mayor nº de ensayos, y podemos apreciar en la gráfica una cierta

aproximación a la curva normal. P(X 2)=0,74 y si )68,1;4,2(~ NX , P(X 2)=0,62”.

El estudiante comenta y calcula correctamente el resto de los ejemplos. Otro

estudiante llega a proponer una hipótesis con respecto al parámetro p, que cuando es

más cercana a 0,5 la distribución de probabilidad será menos sesgada, es decir llega a

hacer una generalización de experimentos o casos particulares (A3):

“Estamos tratando con una distribución binomial de parámetros (n,p). Se observa claramente,

que en los primeros 3 gráficos, al aumentar el tamaño de la muestra y mantener p=0,3 el gráfico

presenta una aproximación a la distribución normal, más rápida de lo que se presenta en los 3

gráficos siguientes, ya que la probabilidad es muy pequeña p=0,1. Además, se sabe que el error

de la aproximación normal será pequeño si npq es grande. Hipótesis: La aproximación será

buena cuando n sea grande y el p sea cercano a 0,5”.

Encontramos también reflexiones sobre la relación entre dispersión y

desplazamiento de la gráfica:

“Cuando menor es el valor de n, mayor es la dispersión de la distribución muestral alrededor

Page 206: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

199

del valor medio”, “Cuando p es pequeña, la distribución binomial está sesgada hacia la

derecha” y “En reducidas cuentas a menor probabilidad se necesitará un tamaño de n mucho

más grande para que la curva tome un comportamiento simétrico”.

Un alumno menciona la idea de convergencia en distribución es decir, llega a

una formalización del teorema mayor que la prevista en la enseñanza (E4):

“Al usar el teorema de Laplace-De Moive para aproximar la distribución binomial con p = 0,3

se puede ver que al aumentar el n, rápidamente la distribución se aproxima a una distribución

normal. Cada vez que aumenta el n, las clases aumentan y las frecuencias disminuyen. Al

contrario, al revisar la aproximación con un p = 0,1 y un n pequeño (p = 4), la distribución es

sesgada a la derecha, y necesitamos un valor de n bastante grande para que la gráfica tome

forma de una distribución normal”.

En esta actividad se esperaba que los estudiantes observasen de los gráficos, que

a medida que n va siendo más grande, el gráfico se asemeja cada vez más a una

distribución normal. Ahora cuando p es muy pequeño (p= 0,1) se necesita un n más

grande aún para conseguir una buena convergencia. En general los estudiantes llegaron

a estas propiedades, aunque se manifestaron dos concepciones erradas. La primera

consiste en tener sólo en cuenta el tamaño de muestra adecuada, sugiriendo una buena

aproximación si n es mayor que 30:

“La pregunta es cuando podemos aproximar la distribución binomial a una distribución normal,

la respuesta es con n grande o mayor a 30, porque de no ser así se nos hace difícil encontrar los

valores en las tablas”. “Cuando el n es pequeño (n<30) la gráfica es sesgada”.

Esta concepción podría deberse a una interpretación errónea de la regla incluida

en algunos libros de texto de estadística para ingenieros, como por ejemplo Devore

(2001, pp. 232), quien menciona la regla empírica: “Si n>30, se puede usar el teorema

del límite central”. Un segundo error es pensar que la aproximación mejora aumentando

el parámetro p. Esto no es así, ya que en la distribución binomial, el óptimo es

considerar p=0,5, y en valores cercanos a 1 la convergencia es lenta:

“Para un mismo tamaño de muestra, si la probabilidad es mayor, la distribución binomial se

aproxima mejor a la distribución normal” y “A medida que aumentamos el número de

observaciones, los gráficos se acercan más a una distribución normal. Mientras más grande sea

el valor de p, más rápido se verá en la gráfica su parecido a una distribución normal”.

Page 207: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

200

Ejercicio 1.3

Revise el applet disponible sobre el Teorema de Laplace-DeMoivre en la página de la Universidad de Cali, Colombia http://www.unalmed.edu.co/~estadist/binomial/binomial.htm y simule para distintos valores de los parámetros la distribución binomial. Envíe sus comentarios al foro.

En este ejercicio, los alumnos pueden interactuar con la distribución binomial,

cualquiera sean los parámetros n y p, por medio de un applet. Esperábamos que los

estudiantes verificaran la regla empírica de la aproximación binomial por la normal para

distintos valores de sus parámetros. Los n ensayos mínimos para cumplir la regla que

np >5, nq>5 y p,q no pequeños se alcanza según el parámetro p vienen dado en la Tabla

6.2.2.3.

Tabla 6.2.2.3. Tamaño mínimo de n, para asegurar la convergencia, en función de p

p 0,01 0,05 0,1 0,2 0,3 0,4 0,5

n 500 100 50 25 17 13 10

Podemos categorizar las respuestas en varios casos, el más frecuente de los

cuáles fue apuntar al desplazamiento de la distribución, indicando que, cuando p toma

valores extremos, los datos tienen un mayor sesgo y también se refirieron al

apuntamiento de la gráfica. Un caso es el siguiente (el alumno del ejemplo comenta y

realiza cálculos similares para el resto de las gráficas):

“Para n=10, p=0,3 vemos un gráfico que no es simétrico y es sesgado a la derecha. Para sus

últimos valores sus probabilidades son muy pequeñas, y la mayor probabilidad será la de 3

(P (x=3) =0,2668). Para p=0,2 no es simétrico, y también posee un sesgo hacia la derecha. Esto

significa que tiene un sesgo positivo y sus probabilidades desde 6,7,8,9,10 son muy pequeñas,

pero la máxima probabilidad que se puede alcanzar es cuando P(x=2)=0,2013”.

Muchos de los alumnos constataron simultáneamente el efecto gráfico de

desplazamiento y simetría de la distribución binomial al ir fijando la probabilidad de

éxito p y variando el tamaño de la muestra n y viceversa, fijando n y dando distintos

valores a p. Estas afirmaciones fueron acompañadas con gráficas similares a la Figura

6.2.2.3 en varios casos. Por ejemplo:

“Luego de evaluar algunos valores en el applet, concluimos que para los valores p menores que

0,5 la distribución es sesgada a la derecha (sesgo positivo) y para p cercano a 0,5 el valor de la

Page 208: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

201

distribución se muestra con sesgo igual a 0. Esto es, porque cuando la distribución es simétrica,

mejor será la aproximación a la distribución normal. Para p > 0,5 la gráfica presenta un sesgo

negativo. También observamos que variando el valor del éxito, la distribución se mueve hacia

los extremos del eje; si la probabilidad de éxito es baja la distribución tiende hacia la izquierda,

en cambio si aumentamos la probabilidad de éxito la distribución tiende hacia la derecha”.

A veces encontramos la comprobación de la convergencia rápida cuando el

parámetro p es igual a ½ y cualquier valor de n (entre más grande mejor):

“Siempre que p= 0,5 en una distribución binomial, la curva será simétrica, sin importar qué tan

grande o pequeño sea el valor de n. Mientras más cercana esté p de 0,5 y mayor sea el número

de observaciones, n, menos sesgada será la distribución. Se puede apreciar en la actividad de

los gráficos que a medida que aumenta n mejora el parecido de las gráficas de barras de las

distribuciones binomiales (discretas) a la gráfica de la distribución normal estándar (continua),

pero con el inconveniente de que se produce un desplazamiento hacia la derecha de la

distribución binomial a medida que aumenta n, pero sigue siendo una buena aproximación”.

Figura 6.2.2.3. Gráficas producidas en el Ejercicio 1.3

Al igual que el ejercicio 1.2, varias respuestas indicaron que la aproximación es

buena utilizando la regla empírica. También usaron el conocimiento previo que tienen

de estadística descriptiva, ver la simetría en relación a las medidas de tendencia central:

“Se consideró una muestra de tamaño n =30 y la probabilidad de p = 0,4 veces ganadas, luego

se calculó la probabilidad: P(X 15) = 0,1754. Luego la probabilidad de tener 15 o más veces

Page 209: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

202

ganadas es del 17,54%. El gráfico muestra claramente que la distribución binomial se aproximó

a una normal, pues se tomó un n grande. Por otra parte, se puede ver que la regla empírica se

cumple perfectamente pues n× p = 30×0,4 = 12 ; n×q = 30×0,6 = 18, ambos casos son mayores

de 5 y (p×q) =0,24 es mayor que 0,05 por ende p y q no son demasiados pequeños por lo que

cumpliéndose la regla empírica nos indica que la aproximación a la normal es buena”.

Figura 6.2.2.4. Ejemplo de uso de ideas sobre simetría en el Ejercicio 1.3

Si p<0,5 simetría a la derecha Si p=0,5 se tiene una simetría Si p>0,5 simetría a la izquierda. En este caso tenemos a la moda, mediana y después a la media

Tenemos a la moda mediana y media en el centro

En este caso tenemos a la media, mediana y después a la moda

Entre los errores detectados al realizar este ejercicio encontramos en varias

respuestas confusión entre tipos de sesgo, que también fue encontrado en la

investigación de Tauber (2001):

“Después de evaluar distintos n para diferentes valores de p podemos concluir que cuando

aumentamos el n nuestra distribución se aproximará cada vez más a la normal con los datos

más agrupados en torno a la media (con colas menos pesadas y si el parámetro p es cercano a

0 la distribución de probabilidades será sesgada hacia la izquierda, si es cercano a 1 será

sesgada hacia la derecha y entre más próximo a 0,5 será menos sesgada”.

La escala del eje de la abscisa (recorrido de la v.a. binomial) asociada al applet

distorsiona la variación de la distribución binomial, y no muestra el aumento de la

varianza, a medida que aumentamos el número de ensayos, lo cual ocasiona errores. En

el ejemplo a continuación se confunde también el parámetro n de número de ensayos

con el tamaño de la muestra y la varianza teórica con la varianza muestral:

“Para una distribución binomial, el programa muestra las distribuciones esperadas, así con

una probabilidad p=0,4, constante y variando el p=5, 20, 50, 100, a medida que el n es mayor,

la gráfica de la función se vuelve cada vez más simétrica, con una menor desviación estándar, la

cual hace que la gráfica sea cada vez mas simétrica y puntiaguda” y ” Al observar estos

gráficos se puede tomar en cuenta que al aumentar el tamaño de la muestra se produce un

aumento en la concentración de los datos alrededor de la media muestral, produciendo que la

Page 210: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

203

varianza muestral disminuya (por esto la gráfica se ve cada ves más angosta en el centro)”.

A continuación, como último ejercicio para evaluar el aprendizaje parcial de la

primera lección, se analiza las respuestas de los alumnos en la situación-problema de

Accidentes industriales mediante resolución algebraica en un tiempo de 50 minutos

aproximadamente.

Ejercicio 1.8

Accidentes industriales. Un ingeniero ha comprobado que 45 de los 150 accidentes industriales en su planta, en los últimos cinco años, se deben a que los empleados no siguen las instrucciones. a) Determine la probabilidad aproximada de que de 84 nuevos posibles accidentes, entre 20 y 30 se

deban a negligencia de los empleados. b) Compare con el valor exacto de la probabilidad anterior, determinada mediante la probabilidad

Binomial, que es 0,81023. c) Calcule la probabilidad aproximada de obtener, en una muestra aleatoria de 120 accidentes

industriales, más de un 35% que se deban a negligencia de los empleados. d) Calcule el tamaño de muestra necesario para que la estimación difiera de la verdadera probabilidad

en menos de 4,5% con probabilidad al menos 0,96.

En el apartado a) el algoritmo de análisis pretendido por los estudiantes es el que

sigue:

1. Definir la variable aleatoria en estudio in XS : número de empleados que no

siguen las instrucciones en la muestra de 84 accidentes e identificar la distribución

de probabilidad (binomial), determinando los parámetros n y p: proporción de

empleados que no siguen las instrucciones. Tenemos )30.0,84(~ pnbinXS in .

Estos serían requisitos previos (RP) no directamente relacionados con el teorema

central del límite. También supone el uso del cálculo algebraico y transformación de

variables aleatorias (AP1).

2. Asociarle a la v.a. in XS la distribución aproximada de la normal, debido a que la

muestra de tamaño n es grande, determinando la esperanza y varianza de la variable.

Supone el reconocimiento del campo de problemas de la aproximación de la

distribución binomial (CP1), así como la aplicación de las propiedades que la media

de la distribución aproximada de una suma de variables aleatorias es la suma de las

medias (P1) y la varianza de la distribución aproximada de la suma de variables

aleatorias es la suma de las varianzas (P2). El cálculo de la probabilidad aproximada

considera )64.17,2.25(),(),(~ 2 NnpqnpNnnNX i .

Page 211: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

204

3. Transformar la v.a. in XS en una distribución aproximada normal estándar

(implica AP1: Cálculo algebraico y transformación de variables aleatorias y AP2:

Tipificación y operación inversa a la tipificación); aplicar la corrección de

continuidad (P12) en el cálculo de la probabilidad (AP3) y calcular la probabilidad

estimada:

3020 iXP64,17

2,255,30

64,17

2,255,19ZP = P(Z 1,26) - P(Z -1,36) = 0,809

En el apartado b) se pretende que el alumno compare los valores del cálculo

aproximado y exacto de las probabilidades de la suma de variables aleatorias in XS

(A5); justificando el teorema para valores grandes de los tamaños muestrales (E5) y la

convergencia rápida de la aproximación para valores de p cercano a ½ (P7). En el

apartado c) los objetivos son los siguientes:

1. Reconocer el estimador de la proporción p como el promedio muestral (RP); obtener

la distribución aproximada del estimador de la proporción p (P10); justificar el

teorema mediante demostración algebraica (A1) que la distribución aproximada es

la normal; determinar la esperanza (P1) y varianza (P2) del estimador p̂ . Es decir,

considerar la muestra de 1202n accidentes industriales en la planta; y aplicando el

teorema central del límite, sustituir )2.25,36(S ~2

120

1NX

ii .

2. Estandarizar el estimador p̂ (AP2) y calcular la probabilidad pedida (AP3). El

procedimiento de análisis pretendido por los estudiantes en la resolución es el

siguiente (A1):

35,0ˆ 2pP00175,0

3,035,0ˆ 2

npq

ppP = 1- P(Z 1,19) = 1 - 0,8829 = 0,1171

Por último la parte d) pide expresar el error e = 0,045 y el nivel de confianza de

1- = 0,96. Se pide estimar el tamaño muestral adecuado (CP8), mediante la expresión:

qpe

Zn

2)2/1(7,03,0

045,0

055,22

438.

Si se utiliza p = 1/2 el tamaño necesario aumenta a 522.

Page 212: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

205

Tabla 6.2.2.4. Frecuencias de elementos de significados del Ejercicio 1.8 (n = 123)

Apartado Pasos correctos en la resolución del problema n % a RP: Identificar la distribución de probabilidad binomial 116 94,3 RP: Determinar los parámetros n y p de la distribución binomial 108 87,8

AP1: Calcular algebraicamente y transformar in XS 103 83,7

AP2: Tipificar la v.a. in XS en una normal estándar

CP1: Aproximar in XS a la distribución normal

10355

83,744,7

P1: La media de Sn es la suma de las medias 55 44,7 P2: La varianza de Sn es la suma de las varianzas P12: Corrección de continuidad

5521

44,717,1

b A5: Comprobar ejemplos y contraejemplos 94 76,4 E5: Enunciar el teorema de forma general 31 25,2 P7: Aproximar una distribución discreta por una continua 1 0,8

c P1: La media de la dist. aprox. de p̂ es la suma de las medias 81 65,9

P2: La varianza de la dist. aprox. de p̂ es la suma de las varianzas

AP2: Tipificar el estimador p̂

8178

65,963,4

AP3: Calcular probabilidades con calculadora 74 60,2 RP: Reconocer el estimador p como el promedio muestral 34 27,6 P10: Los estimadores de máxima verosimilitud tienen distribución

distribución asintótica normal 31 25,2

A1: Demostración formal algebraica y/o deductivas 17 13,8

d RP: Reconocer y expresar el error en valores de 0 a 1 92 74,8 CP8: Obtener el tamaño adecuado de una muestra aleatoria 82 66,7 RP: Identificar el valor de p 78 63,4

En la Tabla 6.2.2.4 se presenta los resultados, donde vemos que, aunque los

alumnos definen la variable suma y 116 estudiantes llegan a identificar la distribución

binomial y calcular la probabilidad pedida, expresando la probabilidad a calcular en el

apartado a), se producen algunos errores en la identificación de n y p. La mayor parte de

los estudiantes es capaz de tipificar la variable para pasar a la distribución normal, pero

muchos confunden la fórmula de la media o varianza, por lo que sólo 55 llegan a la

aproximación normal correcta y de ellos muy pocos (21) aplican la corrección de

continuidad correctamente. Los principales errores al aplicar la corrección de

continuidad fueron sumar el valor 0,5 (en vez de restar) o viceversa, sumar un valor 1

(en lugar de 0,5) o bien no usar la corrección.

En el apartado b) 94 estudiantes comparan los valores aproximado 0,8092 y

exacto 0,8102 de la probabilidad, indicando correctamente su buena aproximación,

aunque sólo 31 de ellos comentan que la excelente aproximación se debe al valor grande

Page 213: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

206

de la muestra (84) y sólo uno comenta la influencia del parámetro p= 0,3 no alejado de

½ . En el apartado c) 81 estudiantes determinan correctamente la media y varianza de la

distribución muestral de la proporción y 78 llegan a estandarizar correctamente, de los

cuáles 74 calculan la probabilidad pedida. De ellos, pero sólo 31 hacen referencia

explícita a la distribución normal aproximada de la proporción y 17 de ellos justifican

explícitamente el uso del teorema central del límite; en otros casos los alumnos calculan

correctamente los parámetros y tipifican, aunque no hacen referencia al teorema. Un

grupo de alumnos explícitamente hace referencia a la proporción como promedio,

mientras el resto deduce directamente la distribución a partir de una transformación de

la binomial.

Por último en d) 82 estudiantes encuentran el tamaño de muestra adecuado,

mediante la fórmula correspondiente aunque unos pocos no identifican el valor p, sino

usan el valor ½ (caso más desfavorable).

6.2.3. SIGNIFICADO INSTITUCIONAL IMPLEMENTADO EN LA PRIMERA LECCIÓN

En la Tabla 6.2.3.1 se detalla los diversos elementos de significados que se ha

podido identificar en las respuestas de los alumnos, a las actividades, ejercicios y

evaluación analizadas.

La comprensión fue bastante alta, en general, en las actividades de

experimentación de las distribuciones muestrales de muestras pequeñas y grandes. Ello

los acerca a ir construyendo el significado del teorema central del límite en este caso

particular de la distribución binomial; sobre todo debido a las nuevas experiencias de

trabajo con materiales manipulativos, seguido del uso de Excel y la interacción

dinámica con applet. Se destaca en el estudio de la distribución empírica dos conceptos

que resultaron sencillos: simulación y efecto de los parámetros sobre la aproximación.

Así también, consideramos que se ha reforzado el modelo de la distribución binomial

entendida como suma de variables aleatorias Bernoulli y se le ha dado sentido mediante

una aplicación a la ingeniería.

Page 214: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

207

Tabla 6.2.3.1. Elementos de significados personales observados en las respuestas

de los alumnos a las actividades y ejercicios

Tipo de elementos

Elementos de significado A1.1 A1.2 E1.1 E1.2 E1.3 E1.8

Campos de problemas

CP1: Obtener una aproximación de la distribución binomial para valores grandes de nCP8: Obtener el tamaño adecuado de una muestra aleatoria de poblaciones desconocidas

X X X X X X

X

Lenguaje Términos y expresiones verbales Notaciones y símbolos Representaciones gráficas Simulaciones

XXX

X

XX

XXX

XXX

XXXX

XXX

procedimiento AP1: Cálculo algebraico y transformación de variables aleatorias AP2: Tipificación / Destipificación AP3: Cálculo de probabilidades con calculadora u ordenador AP4: Cálculo de probabilidades a partir de materiales manuales

X

X

X

X

X X

XX

X

XX

X

XX

Enunciados E5: Enunciado del teorema de forma general E6: Enunciado intuitivo del teorema X X X X

XX

XX

Propiedades P1: La media de la distribución aprox. de una suma de variables aleatorias es la suma de las medias P2: La varianza de la distribución aprox. de la suma de variables aleatorias es la suma de las varianzas P3: La media aritmética de una m.a. de tamaño grande sigue una dist. Aprox. normal P4: La aproximación mejora con el número de sumandos P7: Aproximación de la distribución discreta por una continua P10: Los estimadores de máxima verosimilitud tienen distribución asintótica normal P12: Corrección de continuidad.

X

X

X

X

X

X X

X

X

X

X

X

X

X

X

X

X

XArgumentos A1: Demostraciones algebraicas y/o deductivas

A2: Presentación del teorema como caso especial de un resultado general A3: Simulaciones manipulables de distribuciones en el muestreo A4: Simulación gráfica con ordenador del teorema A5: Comprobación de ejemplos y contraejemplos, sin pretensión de generalizar

X

XX

X

X

X

XX

X

X

XX

XX

X

6.3. OBSERVACIÓN DE LA SEGUNDA LECCIÓN

La lección 2 estuvo dedicada a la extensión del teorema al caso de variables

discretas, donde la distribución binomial, estudiada en la lección 1 es un caso particular.

La primera clase de esta lección comenzó con una pregunta del profesor, ¿El recorrido

de una variable aleatoria con distribución binomial, es finito?, a la que una respuesta

inmediata de un alumno fue: “No, porque es una muestra aleatoria de cero a n y n

puede tomar cualquier valor”. Hubo que aclarar, pues al parecer más de un alumno aún

no diferenciaba los valores de la distribución binomial (acotada), una vez fijado n, con

Page 215: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

208

los infinitos posibles valores de n. El objetivo de esta pregunta fue introducir la

distribución Poisson de valores discretos, pero no acotada.

6.3.1. ANÁLISIS DE ACTIVIDADES DESARROLLADAS EN EL AULA

Actividad 2.1

A una central de teléfonos llegan llamadas al ritmo medio de 3 por minuto. Determinar la probabilidad de que lleguen al menos 200 llamadas en un periodo de una hora. ¿Cómo desarrollarías esta actividad?

La actividad 2.1 presenta una situación inicial introductoria a la aproximación de

la distribución de Poisson (CP2). El profesor pide a los alumnos que calculen el valor

exacto y valor aproximado, teniendo presente los conocimientos previos del curso de

probabilidades y el proceso de estudio de la lección 1. En primer lugar, en un tiempo de

15 minutos, se pidió a un grupo de alumnos que escriban en una hoja la solución exacta

con procedimiento o indiquen por qué no han llegado a la solución. Se obtuvo las

siguientes frecuencias de respuestas en la Tabla 6.3.1.1.

Tabla 6.3.1.1. Respuestas de los estudiantes en la Actividad 1 (n =33)

Aciertos Errores Definir la variable como número de llamadas en 1 hora 27 (81,8) Identificar la variable con la distribución Poisson 27 (81,8) 6 (18,2) Reconocer el parámetro de media como 180 29 (87,9) 4 (12,1) Aplicar procedimiento algebraico usando calculadora (AP1) 29 (87,9) Justificar con procedimiento algebraico (A1) 8 (24,2) 17 (51,5) Justificar en palabras 10 (30,3)

La mayoría de los alumnos definieron la variable aleatoria X: “número de

llamadas recibidas por una central en 60 minutos”, seguido de asociar la característica

de estudio con la distribución Poisson, cuya expresión simbólica es

)180603(~ tPX . También, un 87,9% de estudiantes calculó el promedio

=180, de llamadas que recibe la central durante 60 minutos (P1). De los alumnos,

hubo un 87,9% que utilizó el procedimiento algebraico del modelo Poisson para intentar

calcular la probabilidad 200

180

!

180)200(

x

x

x

eXP , de los cuales un 24,2% llegó a la

siguiente solución con uso de calculadora, de P(X 200) = 1- 0,925 = 0,075.

Otros alumnos (30,3%), argumentaron en palabras la dificultad de calcular

demasiadas probabilidades. Un caso es el siguiente: “Es difícil calcular la probabilidad

Page 216: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

209

exacta porque la suma es muy grande”, o “no se puede sacar porque n es grande y su

desarrollo largo”.

Los errores presentados en esta parte fueron los siguientes: Un 18,6% de los

alumnos no relacionaron la variable con la distribución Poisson, si no más bien la

identificaron con la distribución exponencial; 12,1% calcularon mal el parámetro de

media, con resultado E(X) = 3, que es la media de una variable aleatoria Poisson en un

tiempo t = 3 ; de los alumnos que realizaron procedimiento algebraico, un 51,5% no

llegaron a una solución algebraica correcta, en que consideraron la variable como

continua y calcularon la probabilidad como un área (usaron integral) o calcularon la

probabilidad en el punto x = 200.

A continuación, en otros 15 minutos, el profesor les propuso a los estudiantes

una ampliación del enunciado del teorema central del límite, en que determinarán la

probabilidad anterior en forma aproximada, mediante la distribución normal. Se

recogieron las siguientes frecuencias de uso elementos de significado del teorema de

esta situación en la Tabla 6.3.1.2.

Tabla 6.3.1.2. Respuestas en forma aproximada de la Actividad 1 (n =33)

Aciertos Errores Determinar la media de la suma de variables aleatorias Poisson (P1) 31 (93,9) 2 (6,1) Determinar la varianza de la suma de variables aleatorias Poisson (P2) 31 (93,9) 2 (6,1) Aplicar la corrección de continuidad (P12) 2 (6,1) Aproximar distribuciones clásicas a la distribución normal (P8) 5 (15,2) Calcular algebraicamente las variables aleatorias (AP1) 33 (100,0) Tipificar algebraicamente (AP2) 27 (81,8) 6 (18,2) Calcular probabilidad del teorema con calculadora y tablas (AP3) 33 (100,0) Demostración algebraica (A1) 25 (75,8) 8 (24,2)

Respondieron de forma correcta un 94% al cálculo de la esperanza y la varianza

de la suma de variables aleatorias con distribución Poisson, cuyo valor es 180. A

excepción de dos alumnos, ninguno utilizó la corrección de continuidad (P12), que

junto con estandarizar (AP2) debiera obtenerse el siguiente resultado: P(X 200)

=P(Z (199,5-180)/ 180 )= 1- )45,1(ZF =1-0,9264 = 0,0736. Sin embargo, todos realizaron

el cálculo algebraico y con uso correcto de la calculadora y la tabla estadística de la

distribución normal, de los cuales un 81,8% tipificó bien. Un 15,2% describió la

condición de tener un n grande y mayor que 30 para obtener una aproximación de la

distribución Poisson por la distribución normal (en lo que sigue de esta lección se

estudiaría la influencia del parámetro de media en la calidad de la aproximación) y un

Page 217: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

210

75,8% validó la aproximación con el desarrollo algebraico correcto de la probabilidad.

La mayoría obtuvo un valor de 0,0681 en el cálculo aproximado al no aplicar la

propiedad de corrección de continuidad.

Un ejemplo de alumno con dificultad se muestra a continuación, en que se

confunde el valor de la variable con la tasa de tiempo x/t en lugar de t, y que conlleva

a error de cálculo de la media y varianza de la suma de variables y a obtener un valor

incorrecto de 0,3156:

Un 18,2% de estudiantes obtuvo errores en la tipificación de la variable suma,

por ejemplo al colocar la varianza en lugar de la desviación estándar en el denominador

de la estandarización, obteniendo una probabilidad de 0,4512. Por último, un 24,2% no

llegó a la solución correcta de la probabilidad por una de las dificultades mencionadas

anteriormente.

Una vez terminada la actividad el profesor les pidió a los estudiantes que la

comentaran y compararan con las actividades de la lección 1. Algunos comentarios se

relacionaron con las nuevas formas de solucionar probabilidades:

“La diferencia es que cambia el procedimiento al cambiar las palabras exacta y aproximada, y

que se desarrolla por el teorema central del límite, aproximación normal”, “Se diferencian por

la distribución de la población de origen” y “la diferencia está en la dificultad matemática que

presenta la distribución Poisson en comparación con la distribución normal”.

Las principales dificultades observadas en algunos alumnos en el cálculo de la

probabilidad aproximada, se refiere a la corrección de continuidad (P12). No

entendieron, por ejemplo: ¿Por qué se resta 0,5 en vez de sumar 0,5 a P(X 200)?

Otras preguntas puntuales se refirieron a la distribución de la variable: ¿Es discreto?,

¿Comienza de cero el recorrido de la variable aleatoria Poisson?, y a la posibilidad de

Page 218: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

211

aproximación de una distribución discreta: ¿Toda distribución discreta se puede

aproximar a una normal?, ¿Hasta cuando una aproximación es buena? (P4 y P8).

Actividad 2.2

Un producto se vende en el mercado con la misma frecuencia, en tres tamaños 2, 4 y 6. a. Determine la distribución de probabilidad de la variable tamaño del producto. b. Elabore un diagrama de barras para representar su distribución.

c. Calcule la media y la desviación estándar .d. Enumere todas las muestras aleatorias de tamaño 2 con reemplazo que pueden comprarse de este

producto, y calcular las medias de las muestras obtenidas. e. Obtenga la distribución de probabilidad de estas medias. f. Calcule la media y desviación estándar de las medias muestrales. Comparar con las teóricas. g. Dibuje un histograma de la distribución muestral de medias muestrales. Comentar. h. Indique tres hechos importantes obtenidos en la resolución del problema.

La actividad 2.2 plantea un nuevo problema de aproximación de suma de

variables discretas (CP2) que se refiere a la aproximación gráfica de una distribución

discreta acotada por la distribución normal (P8). A la pregunta del profesor sobre cómo

definir la variable aleatoria en el apartado a) se registraron tres tipos de respuestas:

“frecuencia de ventas”,” frecuencia de tamaños” y “tamaño de producto”, es decir,

algunos alumnos confundieron los valores de la variable en estudio “tamaño de un

producto que se puede comprar en el mercado”, con la frecuencia absoluta en las otras

dos respuestas.

A continuación, el profesor pregunta sobre el recorrido de la variable, con la

finalidad de diferenciar el ejemplo con la distribución uniforme discreta de parámetros 2

y 6. Un problema es que el recorrido de los tamaños del producto son 2, 4 y 6, en lugar

de valores consecutivos x = a, a+1, a+2,…,b, por lo que la función de probabilidad y la

esperanza matemática no puede ser calculada por la distribución uniforme discreta. El

uso incorrecto de la fórmula condujo a algunos estudiantes a obtener UD(2,6) con

función de probabilidad P(X=x)= 1/ (6-2+1) = 1/5 , que no corresponde a P(X=x)= 1/3.

Hubo dos respuestas que asociaron la variable con la distribución binomial de

parámetros B(n=3, p=1/3), lo que condujo a seguir el procedimiento de forma

equivocada.

En el cálculo de la esperanza matemática en el apartado c) algunos consideraron

la expresión de la media aritmética para datos no agrupados, es decir, xi /n = (2+4+6)/3

= 4. Uno de los errores fue calcular la media por medio de la distribución binomial

np=3(1/3)=1. Si bien al calcular la esperanza matemática utilizando la distribución

uniforme se obtiene 4=(2+6)/2 que coincide con la respuesta correcta )()( xxpXE , el

Page 219: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

212

procedimiento correcto de cálculo es mediante la distribución de probabilidades dada en

la Tabla 6.3.1.3.

Tabla 6.3.1.3. Distribución de la v.a. tamaños del producto

x 2 4 6

p(x) xp(x)

1/3 1/3 1/3 2/3 4/3 6/3

1,04,0

La varianza poblacional fue obtenida por la mayoría mediante la definición de

varianza de una variable aleatoria discreta, 2= x2p(x) – E

2(X)=56/3 – 16 = 8/3, y cuya

desviación estándar es 1,63. Los errores de cálculo presentado fue considerar sólo la

primera parte de la fórmula de la varianza. Un resumen de resultados de esta actividad

por un grupo de alumnos se muestra en la siguiente tabla.

Tabla 6.3.1.4. Frecuencias (porcentajes) de respuestas de la Actividad 2.2 (n =28)

Aciertos Errores Definir la variable tamaño del producto 11 (39,3) 6 (24,4) Obtener la distribución de probabilidad poblacional 26 (92,9) 2 (7,1) Dibujar gráficos de barra e histograma 27 (96,4) 1 (3,6) Obtener la media y varianza poblacionales 24 (85,7) 4 (14,3) Determinar la distribución de la media muestral de tamaño 2 26 (92,9) 2 (7,1) Determinar la media del promedio de la muestra (P1) 24 (85,7) 3 (10,7) Determinar la varianza de la media muestral (P2) 21 (75,0) 5 (17,9) Indicar hechos importantes en la solución de la actividad 14 (50,0)

La mayoría de los alumnos obtuvo las nueve muestras posibles de tamaño 2, con

algunas excepciones; al escribir 16 casos pensando en el recorrido de la distribución

binomial {0,1,2,3} o también mostrar 21 casos formando muestras de tamaño 3 con

valores de los tamaños de la población {2,4,6}. Luego, para responder el apartado e), el

profesor pregunta por la probabilidad de obtener 2 . Algunos alumnos encuentran el

valor correcto 1/9 indicando que el número de muestras es 9. Esto se observa en la

distribución de la media muestral, Tabla 6.3.1.5, como fue sugerida por una alumna “la

frecuencia ni se puede obtener o utilizar y así calcular la probabilidad ”.

Una respuesta errónea fue “1/3, al mirar la distribución inicial de la uniforme”;

que muestra una confusión entre la distribución poblacional y la distribución muestral

del promedio, error señalado por Schuyten (1991). También, se anotó la respuesta

incorrecta “1/5, porque 5 es el recorrido”; aquí se aplicó equiprobabilidad, mirando que

hay cinco valores del recorrido de la media muestral, no teniendo en cuenta las

Page 220: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

213

diferentes probabilidades de los valores.

Tabla 6.3.1.5. Distribución de la media muestral de tamaños del producto

X )(xp )(xpx

23456

1/9 2/9 2/9 6/9 3/9 12/9 2/9 10/9 1/9 6/9 1.0 4.0

Alrededor de un 80% respondió correctamente el apartado f) acerca de la media

y varianza muestrales, utilizando el operador de la variable aleatoria para la media

muestral. El valor esperado de la media muestral de tamaño 2 lo obtuvieron de la Tabla

6.3.1.5. Otra forma de calcularlo fue a través de la distribución de frecuencias de

variables en clases individuales, como se muestra en el ejemplo a continuación:

Los únicos errores fueron de cálculo en el resultado para la media y la varianza

muestral, al utilizar incorrectamente parte de la fórmula, igual que en la varianza

poblacional (Propiedades P1 y P2). También, varios alumnos verificaron una propiedad

previa a las lecciones del teorema; en una muestra aleatoria con cierta distribución, “la

varianza muestral es igual a la varianza poblacional dividida por el tamaño de la

muestra” (Ver proposición en Devore, 2001, pp. 229). Un caso presentado por un

alumno es el siguiente:

En b) y g) los alumnos comparan gráficamente la distribución original con la

distribución muestral de la media muestral. Algunas respuestas en el apartado b)

relacionado con la gráfica de barras fueron las siguientes:

Page 221: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

214

“La característica que presenta este determinado producto en el mercado, permite visualizar

que es constante la venta en sus tres tamaños” y “Los tamaños del producto tienen la misma

probabilidad”.

Un error fue presentar un histograma para la variable discreta. En la gráfica de la

distribución muestral registramos respuestas comunes, indicando que la distribución

tiene una forma simétrica, por lo que se parece a una distribución normal:

“Se puede ver que se distribuye en forma simétrica igual que la normal”, “La distribución es

simétrica, tiene forma de campana” y “El histograma nos indica que se distribuye simétrica y

homogénea”.

Por último, lo que más destacaron acerca de esta actividad, en el apartado h),

está relacionada con tres hechos: la simetría del dibujo de la distribución de la media

muestral, la igualdad de las medias poblacionales y muestrales y la disminución de la

desviación muestral (segunda propiedad básica para comprender el teorema, según

Méndez, 1991):

“La forma del gráfico se asemeja a una campana”, “La distribución encontrada puede

aproximarse a una distribución normal”, “La media que tiene mayor probabilidad de ser

comprado es la de 4 con una probabilidad de 1/3 y las de menor chance son las de tamaños 2 y

6”, “Las medias son iguales, sin embargo la variación de la media muestral disminuye, posee

menor desviación estándar” y “No me había percatado en la gran variación que presenta la

desviación, siendo menor la de la media muestral”.

También hicieron referencia a la proposición de las varianzas, comentando que

aunque las medias de la población coincide con la media del promedio no ocurre lo

mismo con las varianzas: “la variación poblacional es el doble de la variación

muestral”, “la varianza muestral es la mitad de la varianza poblacional”. Un caso es el

siguiente:

Page 222: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

215

Otros comentarios no relacionados con las propiedades anteriores fueron: no

diferenciar las varianzas obtenidas, error en una propiedad de buen estimador, donde se

confunde la definición de insesgamiento de un estimador con la variable aleatoria

original, en lugar del parámetro, y mezclar los conceptos de esperanza y probabilidad:

“La media con la media muestral son exactamente iguales y la desviación estándar con la de la

media muestral son muy parecidas”, “La esperanza de la media muestral es igual a la

esperanza poblacional, por lo tanto el estimador es insesgado” y “Hay una igualdad entre la

probabilidad muestral y la poblacional”.

Actividad 2.3

La candidata presidencial de Chile Michel Bachelett obtiene un 48% de los N encuestados, de forma permanente por varios meses, previo a las elecciones. Pensando en los resultados definitivos de diciembre 2005 respecto a los votos de los tres candidatos, ¿Cuál es la probabilidad de que sea ganadora en un sondeo de 200 votos en un determinado distrito?, ¿Tendremos una primera presidenta mujer de Chile, en la primera vuelta electora? Nota: La proporción p de votos a favor de M. Bachelett varía de un mes a otro pero con tendencia al 48% y además los tamaños de muestras pueden ser distintos.

La actividad 2.3 corresponde a la aproximación de la distribución

Hipergeométrica a la normal (P8) en encuestas de preferencias presidenciales. El

procedimiento de solución requiere definir la variable X: “número de votos que obtiene

de los 200” y reconocer que X tiene una distribución hipergeométrica de parámetros

n = 200, a= pN y b= (1-p)N, donde p=0,48 y calcular la media y varianza respectiva,

=np=96;1

20092,49

12

N

N

ba

nbanpq (P1, P2). Se utiliza también la

corrección de continuidad (P12) y se compara el resultado inicial con la aproximación

binomial a la hipergeométrica de la probabilidad calculada (P8).

Destacamos dos errores durante el proceso de solución en el aula. El primero de

ellos hace referencia a la varianza del estimador en la estandarización (AP2). La

consulta en relación a que la distribución de la variable X es aproximadamente

N(96, 49,92), con P(X >100) 1 -92,49

965,100ZF fue: ¿No se divide

2 por n?.

Esta pregunta muestra que el alumno aún no establece la discrepancia de

estandarización normal de la variable X con la estandarización de la media muestral X ,

es decir, en términos simbólicos no diferencia:

Page 223: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

216

XZNX ),(~ 2 ó

n

XZNX *),(~ 2

Otra dificultad tuvo que ver con el recorrido de la variable discreta: ¿Por qué se

comenzó calculando la probabilidad en 101? Esto se explica por ser la desigualdad

mayor estricto )101()100( XPXP , y hay que aclarar que puede conducir a error

la corrección de continuidad, sumando o restando 0,5 al valor 101.

6.3.2. ANÁLISIS DE EJERCICIOS REALIZADOS POR LOS ALUMNOS FUERA DE CLASE

Ejercicio 2.1

Un jabón para lavavajillas de cierta marca se vende en tres tamaños: de 25, 40 y 65 onzas. Veinte por ciento de los compradores seleccionan la caja de 25 onzas, 50% la de 40 onzas y 30% la caja de 65 onzas. Sean X1 y X2 los tamaños de caja seleccionados por dos compradores independientes. a. Escriba la distribución de los tamaños de jabones. Comenta sobre la naturaleza de la variable.

b. Determine la distribución de muestreo de X , calcule )(XE y compárela con .

El ejercicio fue realizado por dos grupos: uno de 33 alumnos resolvieron los

apartados a) y b). Los resultados han indicado que este problema no fue fácil de

resolver, quizás por el poco tiempo asignado y aún tener presente la lección 1. En la

parte a) de los 28 alumnos que intentaron describir la distribución, 20 la asociaron con

la distribución binomial, definiendo tres variables con probabilidades de éxito p

respectiva de 0,2, 0,5 y 0,3 y número de ensayos n según los tamaños de jabones; cuatro

alumnos relacionaron la información con la distribución hipergeométrica, cuatro con la

distribución geométrica y cinco anotaron que no sabían como resolverlo. Un caso de

plantear las variables como binomial es el siguiente:

“Sean Xi: Jabón de lavavajillas de tamaño i, donde i =25,40,65. Además, Xi ~B(p) con

probabilidades respectivas de 0,2, 0,5 y 0,3. Para el número de jabones de tamaño i se tiene que

Xi = Si = Xi ~ Bin (ni , pi) y entonces podemos aproximarlo por Si N(ni pi , ni pi qi)”.

El apartado b) sólo cuatro respondieron, y de forma equivocada, que la media

muestral es aproximada por la distribución normal. Fueron 22 alumnos que calcularon

la esperanza de la media muestral, donde no se presentaron respuestas correctas debido

a que partieron considerando erradamente la población de origen. Por ejemplo, los que

utilizaron la distribución geométrica obtuvieron una media de 1/p = 1 / 0,2 = 5; una

media de 2 para los que utilizaron la distribución binomial: E( X )=E( X 1) + E( X 2) +

Page 224: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

217

E( X 3) = n1p1+ n2p2+ n3p3 = 2(0,2)+2(0,5)+2(0,3)=2. Aquí se confunde la muestra de

tamaño 2 con el número de ensayos.

También se registró una media de 0,66 al escribir n =3 en el denominador de la

media aritmética de la suma de tres variables, donde cada Xi tiene distribución binomial

(n=2, pi), es decir: E( X )= 1/n [E(X1)+E(X2)+E(X3)] = 1/3(0,4+1+0,6). Dos alumnos

mostraron tener error algebraico en la esperanza de la media muestral (P1), al escribir

E( X )=E( X 1)+E( X 2).

Otro grupo de 28 estudiantes desarrollaron la situación, dos días después, cuyos

resultados se presentan en la Tabla 6.3.2.1.

Tabla 6.3.2.1. Frecuencias de elementos de significados aplicados en el Ejercicio 2.1 (n = 28)

Ap. Procedimiento utilizado por los alumnos y elementos implicados Frec. a Determinar la distribución de probabilidad de variable discreta 26 Expresar que la variable es discreta acotada 23 Expresar equivocadamente que la variable tiene distribución uniforme discreta 19 Dibujar un gráfico de barras de la distribución de variable acotada 25 Calcular la media teórica o poblacional 25 Calcular la varianza poblacional 25

b Enumerar las muestras posibles de tamaño 2 24 Obtener las medias aritméticas de cada muestra 24 Determinar la distribución de muestreo de la media muestral 9 Calcular la media empírica de la media muestral 20 Calcular la varianza empírica de la media muestral 20 Dibujar un gráfico de barras de la distribución de la media muestral 12 Comprobar que la varianza muestral es menor que la varianza poblacional 7 Comprobar que la media teórica y experimental coinciden 3

El algoritmo que emplearon los alumnos fue primero caracterizar la distribución

de probabilidad con una representación gráfica y obtener los parámetros de media y

varianza poblacional de la distribución. Fue alta la frecuencia de respuestas correctas en

esta primera parte del ejercicio. Casi la totalidad del grupo determinó la distribución de

probabilidades de valores 25, 40 y 65 para el recorrido y probabilidades respectivas 0,2,

0,5 y 0,3.

Un caso incorrecto que se registró fue asignar igual probabilidad de 1/3 a cada

valor del recorrido, considerando equivocadamente una distribución discreta constante.

Page 225: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

218

La mayoría definió la variable X: tamaño del jabón para lavavajillas (en onzas),

clasificándola como variable discreta, pero sólo 8 escribieron que era acotada. Además,

llamó la atención que si bien describieron correctamente la distribución, hubo 19

alumnos que la asociaron con la distribución uniforme discreta y uno con la distribución

binomial. Un caso se muestra a continuación:

Fueron 25 estudiantes los que mostraron una representación gráfica de barras

correcta de la distribución. Hubo un error en una gráfica, al colocar de frecuencia

relativa de 0,33 al determinar y plantear la variable con distribución uniforme discreta.

Un 89% de los alumnos obtuvo la esperanza de la variable con valor de 44,5 mediante

la definición de esperanza matemática en variables discretas, de igual forma la varianza

de valor 212,25 (P1, P2).

Fueron 24 alumnos (85,7%) los que describieron las nueve muestras posibles de

tamaño dos (x1,x2), así también determinaron los valores de media aritmética en cada

una de las muestras. Sin embargo, sólo 9 alumnos encontraron la distribución muestral

de la media muestral (A3). Un caso es el siguiente:

Hubo un alto porcentaje de alumnos, 60,7%, que no determinaron correctamente

la distribución muestral, al creer que las probabilidades correspondientes a los valores

de la media muestral son obtenidas de la frecuencia de casos favorables sobre el total de

las nueve muestras de tamaño dos, fallando en conocimientos previos. Uno de los 17

casos se presenta a continuación:

Page 226: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

219

La aplicación correcta de las propiedades de la esperanza y varianza de la media

muestral (P1 y P2) por medio de su definición fue de 20 alumnos (71,4%), pero de ellos

sólo nueve obtuvieron los valores correctos de 44,5 y 106,125 respectivamente. Los

otros alumnos obtuvieron valores de media 43,33 y varianza 136,38 al emplear mal la

calculadora o equivocarse en las probabilidades de la distribución. Las representaciones

gráficas de la distribución de la media muestral fueron observadas en 8 alumnos:

Los que construyeron la gráfica con error en las probabilidades concluyeron por

ejemplo que “con este histograma podemos ver que la distribución no se parece a una

distribución normal o simétrica” o que “el tamaño de la muestra es pequeña y no nos

da una buena aproximación simétrica”.

Por otro lado, 7 estudiantes indicaron la propiedad 2 de Méndez (1991) acerca

de la comparación de las varianzas teórica y empírica de la media de la muestra:

“La varianza de la media muestral V( X ) es menor que la varianza poblacional V(X)= 2, y

además en este caso la varianza poblacional es el doble que la varianza de la media muestral

2/2 = 212,25/2 = 106,125 =2x ”.

Respecto a la comparación de medias teórica y empírica (A5), sólo 6 alumnos

escribieron la coincidencia en los valores. Por último, no se obtuvo respuesta de los

alumnos en formular una pregunta de cálculo de probabilidad de la media aritmética

aplicando el teorema.

Ejercicio 2.3

Una máquina produce artículos con cierto tipo de defecto, identificados como 0, 1 y 2. Suponiendo que en una partida hay 20 artículos sin defecto, 30 con un defecto y 50 con dos defectos, se saca un artículo al

Page 227: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

220

azar y se anota su valor, X1. La distribución de X1 será

25,0

13,0

02,0

)( 1x

x

x

xXP

Suponga que el artículo escogido primero se devuelve a la partida y luego se escoge un segundo artículo y

se anota su valor, X2 . Considere la v.a. 2X =(X1 + X2)/2 como el promedio de una muestra aleatoria de

tamaño 2, con distribución: P( 2X = 2x )= 0,04 , 0,12 , 0,29 , 0,30 , 0,25 y valores de la v.a. 2X

respectivamente 0 , 1/2 , 1 , 3/2 , 2.

Suponga que después de que el segundo artículo ha sido también devuelto a la partida, se escoge un tercer

artículo y se anota su valor, X3. Determine la distribución de probabilidad de la v.a. 3X =(X1 +X2+X3)/3

a. Realice el experimento de obtener un cuarto artículo siendo devuelto el tercero a la partida. Obtenga la distribución de probabilidades del promedio de los cuatro artículos extraídos.

b. En un gráfico dibuje las distribuciones de 1X , 2X , 3X y 4X (Utilice Excel y/o lápiz y papel). ¿Qué puede comentar sobre la forma de la distribución de los resultados de esta ilustración numérica? En el

mismo gráfico, trace en línea discontinua como sería la distribución de 5X .c. Si en vez de la media muestral, se analiza la suma de variables aleatorias discretas, S1 ; S2=X1+X2 ;

S3=X1+X2+X3 , etc. Fundamente si la distribución de la suma y el promedio serán similares. d. Enuncie al menos una pregunta de acuerdo al problema, sobre el cálculo de probabilidad, donde

tenga que aplicar el teorema central del límite y resuelva.

De los ejercicios dados en el apunte de la lección 2 para los alumnos, el ejercicio

2.3 es interesante de analizar, debido a que requiere estudiar algebraicamente y

gráficamente el comportamiento de la distribución de la suma o media muestral (CP10)

a medida que se van agregando variables (P3). Estamos todavía en el campo de

problemas CP2: Determinar la distribución de la suma de variables aleatorias discretas

idénticamente distribuidas.

La actividad la podían desarrollar en parejas, donde en una de las secciones se

les pidió comenzar por la distribución de la media de tamaño 3 (CP10) y en la otra

sección debían comenzar por el estadístico de la suma de variables aleatorias (CP2). No

hubo dificultades en formar las 27 muestras posibles y la distribución de la suma de v.a

de tamaño 3, como se ilustra a continuación:

Tampoco hubo dificultad en estudiar la media, verificando la distribución de

probabilidades del estadístico:

Page 228: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

221

Muy pocos estudiantes describieron las probabilidades de sucesos equivalentes y

la independencia de las variables aleatorias. Un caso se muestra a continuación:

Los pequeños errores encontrados se debieron a escribir el recorrido de la

distribución de la media, en vez del de la suma, y a considerar 26 muestras, donde la

probabilidad que la media muestral sea 4/3 fue de 0,195 siendo el valor correcto de

0,285, como se transcribe abajo:

De forma análoga los estudiantes desarrollaron la distribución de la suma o

media muestral de tamaño 4 en el apartado a), obteniendo ahora 34 = 81 muestras

posibles. Se ilustra a continuación la función de cuantía de la variable aleatoria de la

suma descrita por un alumno:

Page 229: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

222

Las probabilidades fueron calculadas de igual forma que la anterior, por

ejemplo, en el caso siguiente (AP3):

Hubo algunas equivocaciones en el cálculo de algunas de las probabilidades del

recorrido del estadístico (AP3) y otros casos que no completaron la distribución

muestral. En el apartado b) la mayoría dibujó con lápiz y papel milimetrado o en Excel

el comportamiento de la distribución de la suma de variables aleatorias según aumenta

el tamaño de la muestra de 1 a 4, y observando que a medida que va aumentando el

tamaño extraído de la muestra, la curva que se obtiene va tomando la forma de la

distribución normal infiriendo de la lectura gráfica que “en la medida en que el número

de errores que produce la máquina crece la distribución de probabilidades tiende a una

simetría de la distribución normal”. Un caso se presenta a continuación:

Algunos alumnos argumentan con convicción que para una muestra de tamaño

5, la distribución muestral de la media sería casi normal: “la distribución de 5X sería

prácticamente una distribución normal”, “X1 tiene una distribución aproximada

exponencial y a partir de la media de tamaño 3 tiende a una normal”. Se ilustra una

gráfica donde se va mostrando por separado su comportamiento simétrico e indican “Se

espera que para muestras más grandes de artículos, la distribución sea

Page 230: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

223

aproximadamente normal” (E4):

Los comentarios realizados fueron en relación a la simetría y similaridad con la

distribución normal. Muy pocos expresaron que al ir aumentando la extracción del n-

ésimo artículo, junto con incrementar los valores de la v.a. promedio las probabilidades

van disminuyendo cada vez más, como se observa en la figura anterior para n =2 y n =5.

El siguiente comentario hace notar que al extraer tamaños de muestra más grande la

dispersión de la distribución muestral (o la varianza muestral) es mayor, disminuyendo

las probabilidades, y también enuncia intuitivamente el teorema (E6) al pronosticar la

forma de la distribución de la suma para muestras de tamaño 5:

“Podemos observar que tenemos S1 y luego para tener S2 el primer artículo se devuelve a la

partida y luego escogemos un segundo artículo, y así podemos calcular S3 y S4. Podemos ver

que las curvas de las variables (S1, S2, S3 y S4 ) tienen cierta similitud y a medida que n es más

grande la continuidad de la probabilidad se acerca más a 0 y su x es más grande”,

“Al graficar podemos observar que S2 con S3 y a su vez S3 con S4 tienen un punto donde se

intersectan”,

“Con lo dicho anteriormente podemos trazar la línea de S5 sin saber sus datos, dado que nos

dimos cuenta que S2, S3 y S4 tienen una gran relación” y “Cuando trabajamos con S1 tenemos

que los valores de las probabilidades son más altos, a diferencia de cuando n es grande la

probabilidad es considerablemente menor”.

Un error de interpretación fue asociar la distribución muestral de la media con la

población y no con la distribución normal “cuánto más grande sea el proceso de

muestreo más se parecerá la distribución de la muestra a la de la población”. Otro

Page 231: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

224

error presentado fue considerar en la ordenada de la gráfica las frecuencias absolutas de

las muestras posibles en lugar de las frecuencias relativas o probabilidades de los

eventos equivalentes, como se muestra a continuación:

La gráfica correcta se ilustra a continuación para la distribución de la media

muestral:

Otra gráfica presentada para la suma de variables aleatorias con la predicción

intuitiva del teorema (A4), (E6) es la siguiente:

De los alumnos que presentaron el ejercicio, hubo 34 que graficaron la

distribución de la suma de variables aleatorias discretas de la cual 22 dibujaron la

Page 232: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

225

posible distribución de la suma en muestras de tamaño 4, y de los 22 que dibujaron la

distribución de la media muestral 14 trazaron la posible distribución de 5X . Hubo

algunos casos de gráficas incompletas o simplemente no la dibujaron. Un resumen de

frecuencias de respuestas a los procedimientos del ejercicio se muestra en la siguiente

tabla:

Tabla 6.3.2.2. Frecuencias (porcentajes) de respuestas del Ejercicio 2.3 (n =66)

Aciertos Errores

Determinar la distribución muestral de 3X o S3 (RP) 60 (90,9) 6 (9,1)

a) Obtener la distribución muestral 4X o S4 (RP) 56 (84,8) 6 (7,1)

b) Dibujar la distribución de las sumas de v.a. (A4) 34 (51,5) 2 (3,0) b) Dibujar la distribución de los promedios de v.a. (A4) 22 (33,3) 2 (3,0) c) Comparar las distribuciones de la suma y el promedio (RP) 50 (75,8) 4 (6,1) d) Cálculo y transformación algebraica de v.a. (AP1) 38 (57,6) 6 (9,1) d) Determinar la media de la suma o promedio (P1) 36 (54,5) d) Determinar la varianza de la suma o media muestral (P2) 32 (48,5) 2 (3,0)

A la petición de comparar las distribuciones de la suma y el promedio, en el

apartado c), fue alta la frecuencia de alumnos que calculan las distribuciones de ambas,

para observar que son iguales las probabilidades y que cambian sólo los valores de los

respectivos recorridos, es decir, los valores de la media se obtiene de la sumatoria

dividida por una constante proporcional en cada caso.

“Las dos distribuciones son similares con la diferencia que uno se divide por el tamaño

muestral”, “Cada una va tomando la distribución normal con un cierto desface de forma

proporcional” y “La distribución de la suma y el promedio son similares en la probabilidad, lo

que varía de estos son los Xi”.

Uno de los alumnos que desarrolló la distribución de la suma, sin hacer cálculo

ni gráfica aludió al teorema central del límite (E5), señalando:

“La distribución de las medias muestrales también seguirán una forma similar a la de la suma

porque cuando aumenta el tamaño muestral de una población, la media muestral se aproxima

mucho a la distribución normal, esto por el teorema central del límite”.

Un 76% de los alumnos realizó algún comentario sobre las distribuciones, de los

cuales, un 48% lo hizo algebraicamente (A1) encontrando ambas distribuciones. Dos

respuestas alejadas de la correcta fueron en relación a los errores de las propiedades de

la esperanza (P1) y la varianza (P2):

Page 233: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

226

“Son similares ya que son iguales la media de la población y la media del promedio muestral”,

“la distribución de la media y el promedio no son iguales por propiedad”.

El apartado d) pone a prueba a los alumnos respecto a si comprenden el contexto

y aplican correctamente el teorema. De los 66 alumnos, un 66,7% lo intentó, siendo la

mayoría de las respuestas correctas. De los que calcularon sin dar un contexto la

probabilidad de la media muestral o de la suma, lo más recurrente fue calcular la

probabilidad para un valor del recorrido, como se muestra a continuación:

Un 68,4 de los alumnos que completaron esta parte algebraica (AP1)

procedieron a plantear una situación donde se pudiese aplicar el teorema, y un 50% lo

hizo para la suma de variables aleatorias (CP2), un 25% para la media muestral (CP10)

y un 25% redactaron una situación mediante la distribución binomial (CP1), aplicando

sólo un 20% la corrección de continuidad en variables discretas. Un caso

correspondiente a la suma de variables aleatorias (CP2) se reproduce a continuación:

Situación: “El jefe de producción informa a sus superiores que la máquina produce demasiados

artículos defectuosos, pero le piden un informe estadístico que justifique un número de

porcentaje. Se quiere contratar un técnico para arreglar la máquina. Según la política interna

se justificará tal contratación si la máquina produce al menos partidas de un 40% de artículos

defectuosos. El jefe toma una muestra de 900 productos, ¿Cuál es la probabilidad de que se

autorice la contratación de un técnico?”. Solución :

A continuación, se muestra otra de las aplicaciones del teorema mediante la

aproximación binomial (CP1):

Page 234: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

227

Situación: “Una empresa produce artículos con defectos y también sin defectos. El gerente tiene

como propósito vender con un valor inferior los artículos con defectos. La probabilidad que un

artículo salga sin defecto es de un 20%. Tomando una muestra de 400 artículos queremos saber

¿Cuál es la probabilidad que más de 300 se vendan más económicos?”. Solución:

Errores menores presentados en las aplicaciones fueron de estandarización de la

media muestral (AP2) y de cálculo de la varianza (P2). También, se registró la dificultad

de confundir el tamaño muestral con las réplicas del diseño, por ejemplo en el siguiente

caso se desea calcular la P(media< 5/3) del experimento de extraer el tercer artículo de

la máquina de valores de media y varianza 1,3 y 0,2 respectivamente. En su desarrollo

se considera una muestra de tamaño 100 en vez de 3:

Ejercicio 2.4

Comente, por el foro, la forma de la distribución Poisson para distintos valores de sus parámetros.

Un ejercicio previsto en el diseño, que se incluyó para aclarar algunas de las

dificultades anteriores fue presentar a los alumnos algunas gráficas de la distribución

Poisson para varios valores de sus parámetros, y pedirles comentarios en cuanto a su

Page 235: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

228

forma y los distintos valores de los parámetros. Se pretendía ejercitar los elementos A3:

Simulaciones manipulables de distribuciones en el muestreo y A4: Simulación gráfica

con ordenador del teorema central del límite.

Las respuestas de muchos alumnos permiten entrever que llegan a partir de estas

gráficas a una versión intuitiva del teorema central del límite (E5, E6) favorecida por un

dispositivo didáctico, por ejemplo:

“Se puede observar que, a medida que aumenta el parámetro , la gráfica de la distribución

Poisson se asemeja a la gráfica de la distribución normal. Esto se explica por el teorema central

del límite, el que establece que, si en una m.a simple de tamaño n de cualquier población de

media µ y desviación estándar , cuando n es grande, la media muestral se aproxima mucho a la

distribución normal N(µ, 2 /n) con media µ y desviación estándar / n”.

Varios fueron los comentarios relacionando la mejora de la simetría con el

aumento del recorrido de la variable, es decir, para un pequeño los resultados de las

probabilidades individuales para valores de X son más pequeños conforme la variable

aleatoria toma valores cada vez más grandes (P4):

“Aunque para los cuatros casos analizados se produce un sesgo a la derecha o un sesgo

positivo se puede diferenciar claramente que cuando mayor sea su recorrido la distribución de

probabilidades se vuelve más uniforme y por ende las probabilidades de que ocurra un suceso

en particular es menor. Esto se ve en reflejado en el cuarto gráfico donde se puede apreciar una

campana casi perfecta en la distribución de las probabilidades. Esto nos permite calcular

probabilidades usando el teorema central del límite aproximando las probabilidades de una

distribución de Poisson a una Normal para un n grande”.

Varios alumnos lo plantearon en términos de insesgamiento:

“Para =0,5: Los datos están dispersos, tiene sesgo positivo, su gráfica no es simétrica. La

concentración de sus frecuencias se encuentra a la izquierda. Para =1: Los datos están a

menor distancia, con sesgo positivo. Para = 6: En este caso la gráfica tiene forma de

campana, es simétrica con un sesgo igual cero, la concentración de las frecuencias se encuentra

en el centro” y “Para pequeño se puede usar la aproximación de Poisson, pero si aumentamos

el , observamos que cada vez que aumentan el la gráfica iba adquiriendo forma de campana,

por lo tanto su sesgo se hace 0 y la distribución se sus frecuencias se concentran en el centro”.

Otros dan una respuesta formalizada, relacionando la distribución Poisson con la

Page 236: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

229

distribución binomial:

“La distribución de Poisson puede ser una razonable aproximación a la binomial, pero sólo

bajo ciertas condiciones. Tales condiciones se presentan cuando n es grande y p es pequeña,

esto es, cuando el número de ensayos es grande y la probabilidad binomial de tener éxito es

pequeña. La regla que utilizan con más frecuencia los estadísticos es que la distribución de

Poisson es una buena aproximación de la distribución binomial cuando n es igual o mayor que

30 y p es igual o menor que 0,05. En los casos en que se cumplen estas condiciones, podemos

sustituir la media de la distribución binomial (np) en lugar de la media de la distribución de

Poisson . Por lo tanto, cuando va aumentando el n, más se acerca a la aproximación de la

normal. Además se observa que en el punto más alto del gráfico se concentra la mayor cantidad

de valores, por lo tanto es la media de la distribución”.

Por último, algunos alumnos aparte de visualizar las cuatro gráficas, buscaron en

Internet un applet con la distribución Poisson, simulando para varios valores del

parámetro:

“Se puede observar que mientras mayor sea el parámetro de la Poisson y el n también, mejor será

la aproximación normal. Ver: http://www.stat.vt.edu/~sundar/java/applets/PoiDensityApplet.html”

Posteriormente, persistieron las consultas respecto a la estandarización de la

suma de variables Poisson y cómo debe estandarizarse si se utiliza el promedio en vez

de la suma (AP2).

Ejercicio 2.7

Sea X el número de paquetes que envía por correo un cliente seleccionado al azar, en cierta oficina de envíos. Suponga que la distribución de X es como sigue:

x 1 2 3 4 P ( X1 = x) 0,4 0,3 0,2 0,1

a. Considere una muestra aleatoria de tamaño n = 2 (dos clientes) y sea X el número medio muestral de paquetes enviados. Obtenga la distribución de probabilidad de X .

b. Calcule, para n = 2, la probabilidad P( X 2,5).c. Si se selecciona una muestra aleatoria de tamaño n=3, ¿Cuál es la probabilidad de que el total de

paquetes enviado por los tres clientes sea exactamente de 4 paquetes? d. Encuentre la probabilidad aproximada de que el número promedio de paquetes en 36 clientes sea

menos de 2,5 paquetes.

La solución en el apartado a) implica los pasos siguientes: Primero, determinar

el número de muestras de tamaño dos. Como hay cuatro posibles valores de la variable,

Page 237: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

230

para n=2 tenemos 42 = 42P +4 =16 muestras posibles. Esto requiere conocimientos

previos de los estudiantes sobre combinatoria. Para calcular los promedios muestrales

hay que determinar las probabilidades del recorrido, lo que implica el uso del elemento

AP1: Cálculo algebraico y transformación de variables aleatorias; y AP3: Cálculo de

probabilidades con calculadora u ordenador. Por ejemplo para los dos primeros valores:

P( iX =1)=p(1,1)=p(1)×p(1)=0,42 = 0,16

P( iX =2)=p(1,3)+p(3,1)+p(2,2) = 2×0,4×0,2+0,32 = 0,25

Luego, la distribución de probabilidad de la media muestral, queda de la forma:

iX 1 1,5 2 2,5 3 3,5 4 ni 1 2 3 4 3 2 1

P( iX ) 0,16 0,24 0,25 0,20 0,10 0,04 0,01

De la Tabla 6.3.2.3 se observa que la mayoría cumple correctamente con los

requisitos previos (RP) en establecer las muestras posibles de tamaño 2 y calcular los

promedios. Un 54,7% determinó la distribución de probabilidades asociada de la media

muestral, con algunos errores de cálculo en obtener los valores del recorrido. En el

apartado b) se debe calcular, para n=2, la probabilidad P( X 2,5) = P( X =1)+ P( X =1,5)+

P( X =2)+ P( X =2,5) = 0,16+0,25+0,25+0,20 = 0,85. De nuevo implicó los elementos AP1 y

AP3 con porcentajes correctos de 29,7% y 28,1%.

En el apartado c), si se selecciona una muestra aleatoria de tamaño n = 3 se tiene

43 = 64 muestras posibles de tamaño 3, que con sus respectivas sumas de paquetes

enviados por los tres clientes serían:

Muestras (1,1,1) (1,1,2) (1,2,1) (2,1,4) (1,1,3) .... X1+X2+X3 3 4 4 7 5 ....

La probabilidad de que el total de paquetes enviado por los tres clientes sea

exactamente de 4 paquetes, equivale a considerar sólo tres muestras de las 64 posibles y

viene dada por 43

1i

iXP = p(1,1,2)+p(1,2,1,)+p(2,1,1) = 3×(0,4×0,4×0,3) = 0,144. En este

apartado se requiere nuevamente los elementos AP1, AP3 y conocimientos previos

sobre la regla del producto y combinatoria.

Según se observa en la Tabla 6.3.2.3, resultó difícil el cálculo algebraico de

probabilidades de la suma de v.a. al combinar tres clientes (AP1). Consideraron

demasiadas muestras, para el cálculo para la suma, registrando un 13,3% de acierto.

Este prerrequisito, de no describir necesariamente el total de las muestras, influyó en

Page 238: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

231

que sólo un 14,1% calculó la probabilidad adecuada (AP3).

Tabla 6.3.2.3. Frecuencias de elementos de significados aplicados del ejercicio 2.7 (n = 128)

Ap. Pasos correctos en el problema y elementos implicados a RP: Determinar el número de muestras de tamaño dos 121 RP: Calcular los promedios muestrales 120 AP1: Calcular algebraicamente y transformar las variables aleatorias 70 AP3: Calcular probabilidades con calculadora 61

b AP1: Calcular algebraicamente y transformar las variables aleatorias 38 AP3: Calcular probabilidades con calculadora 36

c RP: Determinar el número de muestras posibles de tamaño tres 12 RP: Calcular el estadístico de la suma 321 XXX de las tres muestras 17

AP1: Calcular algebraicamente y transformar las variables aleatorias 18 AP3: Calcular probabilidades con calculadora 12 RP: Reconocer que la probabilidad conjunta es el producto de las

probabilidades marginales 15

d CP2: Determinar la distribución de la suma de v.a. discretas idénticamente distribuidas AP1: Calcular algebraicamente y transformar las variables aleatorias

9898

P5: Las transformaciones lineales de variables aleatorias también siguen una distribución asintótica normal

39

P1: La media de la dist. aproximada de una suma de v.a. es la suma de las medias 32 P2: La varianza de la dist. aproximada de la suma de v.a. es la suma de las varianzas

E5: Enunciar el teorema de forma general 3214

AP2: Tipificar / Destipificar AP3: Calcular probabilidades con calculadora, tablas estadística u ordenador

1313

Por último, para encontrar la probabilidad aproximada de que el número

promedio de paquetes en 36 clientes sea menos de 2,5 paquetes, P( 36X <2,5) (apartado

d)), se define la variable X: nº de paquetes enviados por un cliente, cuyo recorrido es

RX : 1, 2, 3, 4 . Consideremos una m.a. X1, X2, X3, ...,X36 de 36 clientes que envían

paquetes por correo a una oficina. Como la muestra de tamaño n=36 es grande

utilizamos el teorema central del límite (E5), aproximando la distribución de la v.a. X

discreta acotada por la distribución normal, es decir, el alumno ha de reconocer el

campo de problemas CP2 y llegar a un enunciado del teorema para suma de v.a. i.i.d.

(E4). Necesitamos la media y varianza de X (P1, P2), obteniéndose de la siguiente

forma: E( X )=36

1

)(36

1

i

iXE =2, y V( X )=36

1)(

n

XV i . Entonces X N(2,1/36), luego

aplicando el cálculo algebraico de variables aleatorias (AP1) y tipificación (AP2) así

como el cálculo de probabilidades con calculadora (AP3) llegamos a establecer que:

P( 36X <2,5) P(6/1

25,2

)(

)(36

XV

XEX) = P(Z<3) = 0,9987.

Se observó que un 76,6% de los estudiantes calcularon la probabilidad de la

Page 239: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

232

suma de v.a. Los errores principales fueron en determinar la distribución muestral del

promedio de la muestra de variables aleatorias discretas (P5), un 30,5% lo hizo bien y

que trajo consecuencia en la solución final y en el cálculo de la media y varianza del

promedio con un 25% de acierto. Además, sólo un 10,9 por ciento justificó por escrito

el uso del teorema para la media muestral en muestras grandes (E5).

6.3.3. SIGNIFICADO INSTITUCIONAL IMPLEMENTADO EN LA SEGUNDA LECCIÓN

Tabla 6.3.3.1. Elementos de significados personales identificados en las respuestas de los alumnos a las actividades escritas

Tipo elementos Elementos de significado A2.1 A2.2 A2.3 E2.1 E2.3 E2.4 E2.7 Campos de problemas

CP2: Determinar la distribución de la suma de v.a. discretas idénticamente distribuidas CP10: Obtener la distribución de diferencias de medias muestrales

X X X X

X

Lenguaje Términos y expresiones verbales Notaciones y símbolos Representaciones gráficas

XX

XXX

XX

XXX

XXX

X

X

XX

Procedimiento AP1: Cálculo algebraico y transformación de variables aleatorias AP2: Tipificación / Destipificación AP3: Cálculo de probabilidades con calculadora u ordenador

X

XX

X

XX

X X

XX

X

XX

Enunciados E4: Enunciado para la suma de v.a.i.i.d.E5: Enunciado formal del teorema E6: Enunciado intuitivo del teorema

X

XX

X

XXX

XX

XX

Propiedades P1: La media de la distribución de una suma de v.a. es la suma de las medias P2: La varianza de la distribución de la suma de v.a. es la suma de las varianzas P3: La media aritmética de una m.a. grande sigue una dist. aproximadamente normal P4: La aproximación mejora con el número de sumandos P5: Las transformaciones lineales de v.a. siguen una dist. asintótica normal P8: Aproximación de algunas dist. clásicas a la distribución normal P10: Los estimadores de máxima verosimilitud tienen dist. asintótica normal P12: Corrección de continuidad

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

XArgumentos A1: Demostraciones formales algebraicas

A3: Simulaciones manipulables de distribuciones en el muestreo A4: Simulación gráfica con ordenador A5: Comprobación de ejemplos y contraejemplos, sin generalizar

X

X

X

X

X

X

XX

XX

X

X

X

X

Los elementos de significados que hemos podido identificar en las preguntas y

respuestas de los alumnos en relación al campo de problemas de la distribución de la

Page 240: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

233

suma de variables aleatorias discretas idénticamente distribuidas, se resumen en la Tabla

6.3.3.1. La comprensión fue buena en general en las actividades y ejercicios sobre todo

del estudio gráfico de las distribuciones tanto de la suma como del promedio al

aumentar el número de variables. Se considera que los alumnos han avanzado en esta

lección en la generalización del teorema central del límite a otras distribuciones de

probabilidades de v.a. discretas importantes en ingeniería por medio de algunas

situaciones de contexto.

6.4. OBSERVACIÓN DE LA TERCERA LECCIÓN

La tercera lección titulada “Distribución asintótica de la suma de variables

aleatorias continuas”, presenta el teorema central del límite para el caso de variables

continuas (CP4). Se trabajan principalmente dos campos de problemas, CP4:

Determinar la distribución de la suma de variables aleatorias continuas idénticamente

distribuidas y CP8: Obtener el tamaño adecuado de una muestra aleatoria de

poblaciones desconocidas.

Se basó principalmente en resolver en conjunto con los alumnos actividades de

tipo algebraico, es decir, se usan procedimientos algebraicos (AP1) con apoyo de

calculadora, tablas estadísticas y ordenador en el cálculo de probabilidades (AP3).

Debido al tiempo que deben dedicar los alumnos a entregar ejercicios de las lecciones 1

y 2, y al tiempo de ejecución de los contenidos generales del curso, no se llegó a

desarrollar por escrito todos los ejercicios.

6.4.1 ANÁLISIS DE ACTIVIDADES DESARROLLADAS EN EL AULA

Actividad 3.1

Se tienen n voltajes V1, V2... Vn que se reciben en un concentrador, de tal suerte que n

iiVV

1 es la suma

de los voltajes en ese punto. Cada voltaje Vi es una variable aleatoria distribuida uniformemente en el intervalo [0,10]. Considerando n = 20, calcule la probabilidad de que el voltaje total de entrada sobrepase los 105 volts.

La actividad 3.1 relacionada con la electricidad y magnetismo, en una de las

secciones del curso, fue desarrollada por los alumnos en conjunto con el profesor. El

voltaje total equivale a la suma de los 20 voltajes de entrada, y por tanto se pide la

probabilidad 10520

1iiVP . Ello conduce a intentar una solución aproximada con

Page 241: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

234

justificación en el teorema central del límite (E4). La esperanza y varianza de cada

voltaje son 5 y 25/3 respectivamente. Para n = 20 el voltaje total de entrada anotamos

20

120

iiVS y tenemos 100)(

20

1iiVE y 3/500)(

20

1iiVVar (P1, P2). La variable aleatoria

estandarizada (AP2) 3500

1002020

* SS tiene, por el teorema central del límite (CP4), una

distribución aproximadamente normal estándar para n grande.

Los alumnos comienzan a obtener la primera solución exacta, que debe hallarse

utilizando la distribución uniforme. El profesor la inicia para el caso de n = 2, es decir,

calcular P(V1+V2 >8), recordando a los alumnos los conocimientos previos de la

asignatura de probabilidades, sobre encontrar la función densidad de probabilidad

conjunta y luego calcular la probabilidad en la región dada. Los alumnos comprueban

que es complicado encontrar la función densidad de probabilidad conjunta exacta para

la suma de los 20 voltajes, y más aún la probabilidad:

201105

201

20

1,...,),...,(105 dxdxxxfVP

ii .

Por tanto, se recurre a la segunda solución aproximada, que es mucho más

simple el camino de cálculo mediante la transformación algebraica de la variable en la

distribución normal. Calculan, mediante transformación algebraica (AP1) y cálculo de

probabilidades con calculadora (AP3) la 3500

100105)(105

20

2020

1 S

SESPVP

n

ii

=P(Z>0,387)=1-0,6517=0,342. También, han de usar la tipificación (AP2). El profesor

deja para que decidan por si mismos si será n=20 suficiente para tener una buena

aproximación con población inicial uniforme.

Algunos alumnos plantearon la pregunta ¿Por qué no se usa la corrección por

continuidad?, otros alumnos respondieron “porque n es pequeña”, o “porque la

variable es continua”. El profesor aclaró que la corrección de continuidad sólo se usa

para variables discretas.

En la otra sección, aproximadamente en 25 minutos, un grupo de 55 alumnos

resolvieron por escrito la actividad, y luego el profesor con apoyo de la plataforma

comentó la solución. En la Tabla 6.4.1.1 se registra la frecuencia de respuestas del

algoritmo de resolución de la actividad.

Page 242: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

235

Tabla 6.4.1.1. Frecuencias de respuestas a la Actividad 3.1 (n =55)

Aciertos Errores Términos verbales: suma de v.a., Dist Uniforme, muestra n 35 (63,6) 5 (9,1) Definir el estadístico de la suma (RP) 31 (56,4) Escribir la probabilidad exacta (AP3) 25 (45,5) 4 (7,3) Calcular algebraicamente de la suma de v.a. (AP1) 51 (92,7) Tipificar algebraicamente (AP2) 45 (81,8) 5 (9,1) Calcular probabilidades con calculadora y tabla estadística (AP3) 35 (63,6) 4 (7,3) Media de la suma de v.a. (P1) 40 (72,7) 11 (20,0) Varianza de la suma de v.a. (P2) 36 (65,5) 14 (25,5) La aproximación mejora con el número de sumandos (P4) 9 (16,4) 21 (38,2) No se debe aplicar corrección de continuidad (P12) 15 (27,3) 6 (10,9)

Se les pidió inicialmente enumerar conceptos importantes presentes en la

actividad, es decir, los estudiantes deben utilizar el lenguaje de términos y expresiones

verbales. Un 63,6% en orden de importancia señaló como palabras claves a: La suma de

voltajes forma una nueva variable que puede ser aproximad (35) aludiendo al campo de

problema CP4 de variables continuas, la cantidad de voltaje (34) asociado al tamaño de

la muestra que está presente la distribución uniforme (31). Con menor frecuencia, lo

siguieron la distribución de variables continuas (6), probabilidad aproximada (5) y

teorema central del límite (4). Errores que declararon fueron que la variable es discreta

(2), corrección de continuidad (1), la media y varianza poblacionales son desconocidos

(1).

Un 56,4% de estudiantes escribió la variable suma como el voltaje que recibe un

concentrador y un 45,5% expresó la probabilidad exacta (AP3), de los cuales la mitad

justifica que no es posible calcularla. Algunos de los que dijeron que sí es posible

calcularla, cometieron errores de considerar la distribución uniforme pero del caso

discreto con probabilidad 1/10 o poder calcular una probabilidad puntual en V=105.

También se confunde el recorrido de cada voltaje con el voltaje total:

“No puedo calcular mediante la distribución uniforme ya que se da la probabilidad de que un Vi

está en el rango [0,10] y lo que necesito es calcular la probabilidad de que el voltaje total sea

mayor que 105”.

Un caso de error se muestra a continuación, en que se calcula la probabilidad

para la suma de variables aleatorias con distribución uniforme discreta:

Page 243: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

236

Fue alta la frecuencia de alumnos que determinaron la probabilidad aproximada

mediante el teorema central del límite (E4), con base en el conocimiento de las

lecciones anteriores y descubriendo la extensión al caso de variables continuas. Un 93%

realizaron el cálculo algebraico de la suma de variables aleatorias (AP1), un 82% hizo

bien la tipificación a la distribución normal (AP2) y un 64% llegó a la solución con uso

de la calculadora y la tabla de distribución estadística (AP3). La aplicación de la media

y varianza de la suma fue resuelta por un 73% y 66% respectivamente (P1, P2). Un caso

se muestra a continuación:

Los errores en el procedimiento se debieron a usar la varianza en vez de la

desviación en la estandarización de la variable suma, errores de cálculo en la utilización

de la calculadora o lectura de la distribución normal estándar, consideraron en la

tipificación la esperanza y varianza de la población original y no del estadístico de la

suma, también dividir por 2 en la varianza de la variable uniforme en lugar de 12, y por

último aplicar corrección de continuidad (3 alumnos, 5,5%).

Además, comentan respecto a la solución “por el teorema central del límite se

puede aproximar una probabilidad engorrosa de una distribución continua a una

normal”, algunos continúan teniendo dificultad con la interpretación de la probabilidad

“la solución es de un 35% por lo que es bastante probable que ocurra este suceso”,

otros desean relacionar ambas probabilidades “la probabilidad aproximada es de un

35% pero no tengo con quien compararla”.

Respecto a que si en la distribución uniforme para n =20 será suficiente para

tener una buena la aproximación por la distribución normal, un 16% respondió

afirmativamente y un 38% expresó que no, las justificación más reiterativa fue asociada

a que el tamaño de la muestra sea al menos de 30, como describen algunos libros de

textos, “para utilizar el teorema central del límite y el cálculo aproximado sea más

preciso, se necesita que n sea grande n 30, por lo que seguramente la aproximación

no resulta muy efectiva”, para otros alumnos será buena al considerar n grande.

Por último, un 27% de los alumnos escribió que no se aplica la propiedad de

corrección de continuidad (P12) en la probabilidad aproximada, sólo cuando

aproximamos una variable discreta por una continua “no, porque estamos trabajando

Page 244: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

237

con dos distribuciones de probabilidad continuas”, y un 11% aún manifiesta que sí hay

que utilizar esta propiedad en la actividad. Algunos la justificaron por la exactitud y no

por el tipo de variable “si se debe aplicar la corrección de continuidad porque se debe

eliminar el margen de error”, otros lo justifican por contar con una muestra pequeña

“sí, porque como n<30 debe aplicarse la propiedad de corrección de continuidad para

que para que sea más exacto el resultado”.

Actividad 3.3

Los tiempos que tarda un cajero en procesar el pedido de cada persona son variables aleatorias independientes con distribución exponencial y una media de 1,5 minutos. ¿Cuál es la probabilidad aproximada de que se puedan procesar los pedidos de 100 personas en menos de 2 horas?

En esta actividad, también relacionada con la aplicación del teorema central del

límite a variables continuas (CP4) se relaciona con la distribución exponencial. Previo a

los 20 minutos que dará el profesor para que intenten individualmente resolver este

campo de problema del teorema, se les recuerda que en el proceso de Poisson los

eventos ocurren al azar independientemente y a una tasa uniforme por unidad de tiempo,

definiendo la v.a. Y como número de eventos en el intervalo (0,t . Si estamos

interesados en X que es el tiempo que transcurre hasta que el primer evento ocurre,

entonces X es la llamada v. a. exponencial con parámetro y se recuerda la fórmula de

su función de densidad, así como sus propiedades.

Según los datos del problema los alumnos debieran seguir el siguiente algoritmo

de resolución, tenemos /15,1)(XE , donde 3/2 . Entonces la v.a.

)3/2exp(~X , y además la varianza es 4/9/1)( 2XV . Considerando una muestra

de 100 personas X1, X2,...X100 anotamos 2,1120 XPXP i . Utilizando el teorema

central del límite para n=100, )1,0(~20/3

5,1

100

4/9,5,1~

2

NX

nNX . Así, la

probabilidad pedida es 02275,0)2(20/3

5,12,1ZPZP . En la Tabla 6.4.1.2 se

muestra la frecuencia de algunos elementos de significados del teorema en un grupo de

54 alumnos.

Page 245: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

238

Tabla 6.4.1.2. Frecuencias de respuestas a la Actividad 3.3 (n =54)

Aciertos Errores Expresión verbal de la variable que define el problema 51 (94,4) 3 (5,6) Lenguaje simbólico de la probabilidad para la nueva variable 44 (81,5) 9 (16,7) Calcular la media y varianza de la suma de v.a. continuas (P1, P2) 46 (85,2) 7 (13,0) Calcular la media del promedio muestral (P1) 31 (57,4) 11 (20,4) Calcular la varianza del promedio muestral (P2) 28 (51,9) 13 (24,1) Calcular algebraicamente las variables aleatorias (AP1) 49 (90,7) Tipificar la suma o promedio de v.a. (AP2) 44 (81,5) 5 (9,3) Calcular probabilidades con calculadora (AP3) 36 (66,7) 6 (11,1)

Se observa un avance importante en que la mayoría de los alumnos denotan la

probabilidad en términos de la suma de variables aleatorias continuas, las dificultades

fueron en expresar la desigualdad de la suma en horas y no en minutos y también

escribir la probabilidad en términos de X y no de la suma. Casi la totalidad del grupo

escribió bien la variable de la población como el tiempo que demora un cajero en

atender a un cliente; un error fue confundir la variable con el parámetro de media

“tiempo promedio que tarda un cajero en procesar un pedido” o definir una variable

Poisson “número de pedidos en menos de dos horas”.

Para diferenciar los enunciados del teorema para la suma (E4) o promedios

muestrales (E5), los alumnos calcularon primero la esperanza y varianza para el

estadístico de la suma, con logro de un 85% del grupo; en general obtenida directamente

con el teorema central del límite, como es el caso siguiente, también para la media

muestral:

Las dificultades se presentaron en calcular estas medidas de la suma para la

población exponencial de valores 1,5 y 9/4, también equivocarse en tomar el tiempo 120

como el tamaño de la muestra y en no diferenciar el parámetro lambda de la distribución

exponencial con la media, relacionando = 1/1,5; que conlleva a errores en la aplicación

del teorema para la suma, como muestra el siguiente caso:

Page 246: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

239

Hubo más dificultades en aplicar el teorema para la media muestral, que fue

alcanzada por un 57% en el cálculo de la esperanza y un 51% para la varianza. El

siguiente caso, atribuye el valor de la media 1,5 con lambda,

Otro de los errores fue definir mal la media aritmética obteniendo valores 0,05 y

0,000225 alejados de la media y varianza respectiva, se muestra un caso,

También, se registraron otros dos errores, el primero es de operatoria algebraica

estableciendo la igualdad E(suma)=E(promedio)/tamaño muestral (P1), obteniendo así

los valores respectivos de 15000 y 204000. El segundo fue no aplicar la propiedad de la

esperanza y varianza del promedio sino más bien obtenerla directamente de la

distribución normal, al dividir los valores de la suma por el tamaño de la muestra:

La aplicación algebraica del teorema fue resuelta por un 91% del grupo de

alumnos, de los cuales sólo un 14,3% lo hizo mediante la media muestral, como se

muestra a continuación:

Page 247: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

240

Otra forma preferida por los alumnos fue a través de la suma de variables

aleatorias continuas con distribución exponencial. Un caso es el siguiente con su

interpretación:

No hubo mayores problemas en las operaciones de estandarización y de cálculo

con la tabla estadística y la calculadora (AP1, AP2, AP3). Los errores fue producto de

las dificultades descritas al comienzo. Finalmente, de los que llegaron a calcular un

valor de la probabilidad del estadístico, la mitad comentó acerca de la baja probabilidad

“como la probabilidad es baja indica que el cajero no está óptimo para atender a una

persona en un promedio de 1,5 minutos” y también algunos sobre el teorema, siendo

grande n la aproximación será buena: “ya que n es grande la probabilidad aproximada

calculada a través del teorema central del límite debe ser similar a la calculada de

forma tradicional”.

Una vez cumplido el tiempo de desarrollo de la actividad, el profesor utilizó la

pizarra para desarrollarla de forma algebraica en conjunto con el grupo de alumnos.

Durante la resolución, algunas preguntas planteadas fueron ¿cómo se obtiene la media y

varianza de la suma de v.a a partir de la función de densidad? El profesor, comienza

calculando la esperanza del ejercicio 3.1 (ejercicio anterior): Como la v.a. se distribuye

uniforme en el intervalo (-1,1) entonces de acuerdo a la definición dada en la sección

3.1 su esperanza será 02

11

2)(

baXE i y obtenemos así la esperanza de la

Page 248: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

241

suma 00)()( nXESE in . Otros alumnos preguntaron cómo se resuelve la

actividad si se trabaja con la suma y no el promedio. Se recurrió a recordar de forma

simbólica la aproximación normal de la suma y media con sus respectivos parámetros

de acuerdo a la distribución de origen. Se ayuda a los alumnos a llegar a la siguiente

expresión (como aplicación y extensión de lo aprendido sobre el teorema)

Si )(~ ExpX2

,~nn

NXS in ó n

Nn

SX n

21,

1~

6.4.2. ANÁLISIS DE EJERCICIOS REALIZADOS POR LOS ALUMNOS FUERA DE CLASE

Ejercicio 3.2

Un supervisor de una fábrica está interesado en presupuestar los costos semanales de reparación para cierto tipo de máquina. Los registros de años previos indican que este costo de reparación tiene una distribución exponencial con una media de 20 para cada máquina observada. Sean X1, X2,...X50 los costos de reparación para cincuenta de estas máquinas durante la próxima semana. Determine un número c tal

que 50

1ii cXP = 0,05, suponiendo que las máquinas operan independientemente.

El ejercicio 3.2 también relacionada con la aplicación del teorema central del

límite a variables continuas (CP4) se relaciona con la distribución exponencial. En una

de las sesiones de práctica el profesor solicita a 26 alumnos que resuelvan en un tiempo

corto el ejercicio, para el caso de que n=5 máquinas, en que el valor de c toma por valor

173,56. Un 92,3% realizó bien la destipificación (AP2) de la variable suma y un total de

22 alumnos (84,6%) llegaron a calcular correctamente el valor de c. Se reproduce una

solución por un alumno:

Los alumnos concluyeron que la suma de los costos debe ser mayor a 173,34,

definiendo las variables Xi: costos semanales de reparación para la i-ésima máquina, y

Page 249: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

242

Xi que representa los costos de reparación para cinco máquinas. No hubo dificultades

en la operatoria algebraica inversa a la tipificación (AP2), sólo dos alumnos siguen

pensando que el parámetro lambda es la esperanza de la variable con distribución

exponencial obteniendo un valor de 5,6×10-7 muy distinto para c. Se ilustra este caso:

Luego del tiempo concluido el profesor deja a los alumnos la inquietud de si es

correcto utilizar el teorema central del límite para un n pequeño de una población inicial

con distribución exponencial. Un alumno en voz alta se cuestiona el uso del teorema

“Todos los Sn de variables de una muestra se pueden calcular mediante una

aproximación normal independiente de la distribución original que ésta tenga?”.

A continuación el profesor desarrolló junto con los alumnos el ejercicio para

n=50 de la forma siguiente: Primero, los alumnos definieron sin problemas la v.a. X:

costos de reparación de una máquina que se distribuye exponencial de parámetro

X~exp( ), además identifican sin dificultad sus parámetros E(Xi)=20 y Var(Xi)=400.

Se discute con ellos el hecho de que puede considerarse los costos de reparación

5021 ,...,, XXX como v.a. independientes, pues no dependen unos de otros. Para n=50

>30 grande, siguiendo los ejercicios anteriores, podría aplicarse el teorema central del

límite (E4), y calculando la media y varianza de la suma (P1, P2), llegamos a

50

400,20~

2

nNX . Debemos encontrar el valor de c a partir de la expresión

50

1ii cXP = 0,05; que es equivalente a

5020

2050/c

n

xP = 0,05 y es igual a

5020

2050/cZP = 0,95

5020

2050/c= 1,645 64,1232c .

En esta secuencia hemos realizado los procedimientos AP1: Cálculo algebraico

y transformación de variables aleatorias; AP2: Tipificación y operación inversa a la

tipificación y AP3: Cálculo de probabilidades con calculadora, tablas estadísticas u

Page 250: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

243

ordenador, además de seguir un proceso de demostración formal algebraico (A1).

Ejercicio 3.3

Suponga que la distribución del tiempo X (en horas) utilizados por estudiantes de cierta universidad en sus proyectos de graduación es gamma con parámetros =50 y =2. Debido a que es grande, se puede demostrar que X tiene aproximadamente una distribución normal. Utilice este hecho para calcular la probabilidad de que un estudiante seleccionado al azar pase a lo sumo 125 horas en el proyecto de graduación. ¿Cómo sería la gráfica de la distribución gamma ( =50, =2)?

De acuerdo al campo de problema CP4: Determinar la distribución de la suma de

variables aleatorias continuas idénticamente distribuidas, el ejercicio 3.3 tuvo como

objetivo obtener el cálculo de probabilidad aproximada de la distribución gamma de

parámetros 50 y 2 . Es decir, sigue la propiedad P8: Aproximación de

distribuciones clásicas a la distribución normal. Se conduce al alumno a escribir en

términos de probabilidad la pregunta y se le confronta con lo difícil de poder resolver el

valor exacto de la integral, es decir, 125

0

)125( dxfdpXP . Mediante el uso de la

aproximación 25 estudiantes entregaron el cálculo de valor 0,9616 considerando que la

media es 100 . Aún hay alumnos que tienen problema con la naturaleza de la

variable, al consultar si la v.a. tiempo es discreta o continua. Un caso se muestra en lo

que sigue:

En relación a imaginarse cómo debería ser la gráfica de la distribución gamma

de parámetros grande (según la Figura 5.6.2.2), algunos dijeron no saber dibujarlo, otros

lo hicieron para una distribución normal y 14 alumnos dibujaron para alpha 50 la gráfica

que es casi una línea. Una gráfica se ilustra a continuación señalando “Como alpha = 50

es grande entonces la gráfica se pone más plana, pero toma la tendencia de una

distribución normal”.

Page 251: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

244

Ejercicio 3.9

Al sumar números, un computador aproxima cada número al entero más próximo. Supongamos todos los errores de aproximación son independientes y distribuidos uniformemente entre (-0,5, 0,5). a. Si se suman 1500 números, ¿Cuál es la probabilidad de que la magnitud del error total exceda de

15? b. Cuántos números pueden sumarse juntos a fin de que la magnitud del error total sea menor que 10,

con probabilidad 0,90?

En la parte a) el alumno ha de considerar la variable X: errores de aproximación,

tal que X U [-0,5;0,5], donde E(X)=0 y V(X)=1/12, requiriendo conocimientos previos.

Ha de definir 1500

1iiX : suma de los errores en 1500 números (AP1), determinando su

suma y varianza (P1, P2). Debe identificar el campo de problemas CP4: Determinar la

distribución aproximada de la suma de variables aleatorias continuas y aplicar el

enunciado (E4) del teorema: Xi N(1500×0;1500×1/12), es decir, Xi N(0,125).

125

15115 ZPXP i = 1 – P(-1,34 Z 1,34) . La probabilidad de que la

magnitud del error total exceda de 15 es de 18,02%.

En la parte b) por el teorema, suponiendo n grande Xi N(n×0;n×1/12)

95,012

1090,0

12

1090,010

nZP

nZPXP i

645,112

1095,0

12

10

nnn = 443,45. Por lo tanto se requieren sumar 444

números para que la magnitud del error total sea menor que 10, con una probabilidad

0,9. En la Tabla 6.2.4.1 se resume la frecuencia de elementos del teorema aplicado en

una muestra de 129 alumnos participantes.

En la primera parte, la mayoría de los participantes (94%) caracterizaron la

población original y determinaron la distribución aproximada de la suma de números

iX . Un 90% realizó el cálculo algebraico de la variable suma, donde un 84% utilizó

correctamente la tabla estadística de la distribución normal estándar y de la calculadora.

Sin embargo, sólo un 30% justificaron el teorema central del límite (E5) asociado al

tamaño de la muestra grande.

Page 252: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

245

Tabla 6.4.2.1. Frecuencias de elementos de significados aplicados en el Ejercicio 3.9 (n = 129)

Apartado Pasos correctos en el problema y elementos implicados ni (%)

1 RP:Determinar la esperanza y varianza de los errores iX 122(94,6)

E5: Enunciar el teorema de forma general para los iX 89 (69,0)

AP1: Calcular algebraicamente y transformar las v.a. continuas 116(89,9)

AP3: Calcular las probabilidades con calculadora 108(83,7)

P8: Aproximar las distribuciones clásicas a la distribución normal 39 (30,2)

2 AP1: Calcular algebraicamente las variables aleatorias 62 (48,1)

AP2: Tipificar / Destipificar 60 (46,5)

AP3: Calcular probabilidad del teorema con calculadora 57 (44,2)

A1: Demostrar de formal algebraica 44 (34,1)

2 (Alternativo) CP8: Determinar n mediante la fórmula 55 (42,6)

CP12: Estimar por intervalo de confianza parámetros para n grande 47 (36,4)

P2: Determinar el valor de la varianza

18 (14,0)

En cuanto a la operación inversa a la estandarización (AP2), en parte b), un 47%

lo hizo bien, de los cuales casi todos realizaron el cálculo de probabilidades del teorema.

Hubo un 34% que finalmente llegó algebraicamente a despejar n. Otra solución a este

problema fue dada por 55 alumnos (42,6%) mediante la fórmula para determinar el

tamaño de muestra adecuado (CP8) de variable aleatorias cuantitativa (Ver sección

5.6.2, sesión 11). Los errores detectados fueron en determinar el coeficiente de

confianza y el percentil de la distribución normal estándar (un 36,4% lo hizo), y sólo un

14,1% determinaron el valor de la varianza.

6.4.3. SIGNIFICADO INSTITUCIONAL IMPLEMENTADO EN LA TERCERA LECCIÓN

Los elementos de significados que se identificaron en las observaciones

registradas en las actividades desarrolladas por los alumnos y el profesor, referidas al

estudio del comportamiento de la distribución de la suma de variables aleatorias

continuas idénticamente distribuidas, se resumen en la Tabla 6.4.3.1. La comprensión

fue alta en general a las actividades y ejercicios de tipo algebraico, destacando el

procedimiento formal sistemático empleado por el grupo curso.

Page 253: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

246

Tabla 6.4.3.1. Elementos de significados personales empleados a las actividades escritas

Tipo de elementos Elementos de significado A3.1 A3.3 E3.2 E3.3 E3.9

Campos de problemas

CP4: Determinar la distribución de la suma de variables aleatorias continuas i.i.d. CP8: Obtener el tamaño adecuado de una muestra aleatoria de poblaciones desconocidas CP12: Estimar por intervalos de confianza la media y otros parámetros para n grande

X X X

X

X X

X

X

Lenguaje Términos y expresiones verbales Notaciones y símbolos Representaciones gráficas

XX

XX

XX

XXX

XX

Procedimientos AP1: Cálculo algebraico y transformación de v.a. AP2: Tipificación / Destipificación AP3: Cálculo de probabilidades con calculadora

XXX

XXX

XXX

XXX

XXX

Enunciados E4: Enunciado del teorema para la suma de variables independientes idénticamente distribuidas E5: Enunciado del teorema de formal general

X X X X X

XPropiedades P1: La media de la distribución aproximada de una

suma de v.a. es la suma de las medias P2: Varianza de la distribución aproximada de la suma de v.a. es la suma de las varianzas P3: La media aritmética de una muestra aleatoria de tamaño grande sigue una dist. aprox. normal P4: La aproximación mejora con el número de sumandos P8: Aproximación de distribuciones clásicas a la distribución normal.

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

Argumentos A1: Demostraciones formales algebraicas y/ o deductivas

X X X X X

6.5. CONCLUSIONES SOBRE EL SIGNIFICADO IMPLEMENTADO DEL

TEOREMA CENTRAL DEL LÍMITE

El objetivo de este capítulo fue describir, por medio del análisis de algunas

actividades y ejercicios en cada lección, el significado implementado realmente durante

el proceso de estudio y detectar, en lo posible, algunas dificultades que surgirían en la

evaluación posterior de los conocimientos.

El análisis de la trayectoria didáctica que efectivamente se llevó a cabo, se

realizó resumidamente a partir de la observación de las sesiones de clase y respuestas

escritas a algunas actividades propuestas en las sesiones de clase o ejercicios realizadas

por los estudiantes y enviadas a través del foro de discusión. Se ha presentado un

resumen en las Tablas 6.2.3.1, 6.3.3.1 y 6.4.3.1 de los elementos de significados

implementados, que fueron detectados del análisis del material descrito. El análisis

realizado ha sido de tipo cualitativo, aunque complementado con las frecuencias de

respuestas en las pruebas de evaluación al final de cada tema.

El significado implementado del teorema central del límite está de acuerdo

Page 254: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

247

esencialmente con el significado institucional pretendido (Capítulo 5), aplicando las tres

configuraciones epistémicas esencialmente en las dos primeras lecciones.

Debido a algunos factores hubo algunas diferencias con respecto al significado

pretendido; el tiempo de programación de la asignatura de estadística, que contempla

cinco tópicos desde estadística descriptiva a la regresión lineal múltiple y dar

oportunidad a los alumnos de analizar los ejercicios, durante la lección tres no fue

analizada en conjunto con los alumnos algunos ejercicios de verificación del teorema en

el laboratorio (configuración computacional), por ejemplo los ejercicios 3.4 y 3.5. Sin

embargo, el trabajo de aplicación contextualizada en el Capítulo 7 los alumnos ponen a

prueba sus habilidades para desarrollar las tres configuraciones epistémicas para

variables aleatorias continuas. Además, no se profundizó en los campos de obtener la

distribución de diferencias de medias muestrales en dos poblaciones (CP10) y estimar

por intervalos de confianza la media y otros parámetros para muestras grandes (CP12),

y también desarrollar paso a paso la demostración del teorema como límite ordinario de

una sucesión de funciones (E2).

Por otro lado se incluyeron situaciones imprevistas. De las once sesiones

formales de clase planificadas, se emplearon algunas clases informales de apoyo a las

inquietudes y dificultades a las distintas actividades presentadas. Levantar a tiempo los

demos de simulación en Excel y @risk fue bastante positivo para la realización de

algunas actividades, además de detectar favorablemente el tiempo que dedicaron los

estudiantes a la exploración de distintos applet en Internet.

También muestra la riqueza y complejidad del significado del teorema central

del límite, cuya construcción gradual fue guiada por el profesor en el aula, y que

involucra sistema de muchos elementos de significados conectados, no sólo propios del

teorema, sino de otros conceptos previos que el estudiante ha de recordar. Así, lo refleja

la Tabla 6.5.1 que resume el total de actividades y ejercicios implementados a lo largo

del proceso de estudio del teorema central del límite, analizando un 38,3% de las 47

situaciones-problemas, cuya apropiación del significado del teorema depende del grado

de compromiso tanto de los alumnos en aprender como de los profesores en la forma de

comunicar el conocimiento específico.

Page 255: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 6

248

Tabla 6.5.1. Frecuencia de Actividades y Ejercicios implementados en las tres lecciones

Actividades Ejercicios Total Lección 1 12 8 20 Lección 2 6 7 13 Lección 3 5 9 14

Total 23 24 47

Idoneidad del proceso de estudio

La secuencia efectivamente implementada, muestra una alta idoneidad

epistémica, al englobar los principales elementos de significado identificados en el

estudio previo y que constituyeron el significado institucional pretendido. Comparada

con las propuestas tradicionales, las posibilidades de exploración del teorema para

diferentes distribuciones (uniforme discreta y continua, binomial, Poisson, exponencial,

etc.) y su aplicación a diferentes campos de problemas en el área de la ingeniería

(aproximación de distribuciones, estimación de parámetros, determinación de tamaño de

muestra) la propuesta tiene una alta idoneidad afectiva, al motivar el interés del

estudiante.

El uso de dispositivos didácticos (manipulativos y computacionales, unidos a la

plataforma) aumentó las posibilidades de exploración y el tiempo dedicado por el

estudiante al estudio, dotándola de alta idoneidad mediacional y didáctica.

Respecto a la idoneidad cognitiva del proceso lo que se desprende del análisis

de la observación es que, aunque la mayor parte de las actividades y ejercicios son

asequibles a los estudiantes, todavía quedan puntos difíciles para ellos. Tampoco es

inmediata la transferencia de los conocimientos anteriores a las nuevas situaciones. Por

ejemplo, los estudiantes muestran olvido de las propiedades relacionadas con el estudio

de la simetría, la aplicación de la corrección de continuidad sólo cuando aproximamos

variables con distribución discreta, la justificación de uso del teorema según las

distribuciones de probabilidades y sensibilidad de los parámetros. Por parte del

profesor, habrá que evaluar la conveniencia de la simbología de la varianza muestral en

la aproximación normal, lo que puede haber conducido en algunos alumnos confundir la

varianza con la desviación estándar al aplicar la tipificación de la variable suma o

promedio. Por tanto la idoneidad cognitiva podría ser mejorada.

Hubo una alta idoneidad emocional por el grado observado de implicación

(interés, motivación) del alumnado en el proceso de estudio.

La Idoneidad interaccional o grado en que las configuraciones y trayectorias

didácticas permiten, por una parte, identificar y resolver conflictos semióticos

Page 256: Significados del Teorema Central del Limite en la Enseñanza de la

Significados implementados

249

potenciales durante el proceso de instrucción, fue buena, pero no suficiente. Por un lado,

muchos de los conflictos se detectaron y resolvieron, especialmente los planteados en

tutoría y mediante el foro, así como en las actividades realizadas dentro de clase. Pero,

en otros casos, los conflictos no se han detectado hasta analizar el proceso de estudio y

han quedado sin resolver en algunos estudiantes. No obstante, su identificación

permitirá mejorar futuras versiones del proceso de estudio.

Page 257: Significados del Teorema Central del Limite en la Enseñanza de la

250

Page 258: Significados del Teorema Central del Limite en la Enseñanza de la

251

CAPÍTULO 7.

SIGNIFICADO PERSONAL DE LOS ESTUDIANTES

SOBRE EL TEOREMA CENTRAL DEL LÍMITE AL

FINALIZAR EL PROCESO DE ESTUDIO

7.1. INTRODUCCIÓN

Al final del curso se propuso a los estudiantes de la muestra una prueba de

evaluación, llevada a cabo mediante un cuestionario, que consta de ítems de respuestas

múltiples o verdadero/falso, algunos de ellos con justificación. También se les

entregaron algunos problemas abiertos y una prueba de ensayo, donde el alumno ha de

plantear y resolver un proyecto que involucre el teorema aplicado a la ingeniería.

En base a estos instrumentos, este capítulo caracteriza la comprensión lograda

por los alumnos de los diferentes elementos de significados relacionados con el

teorema, incluidos en el proceso de estudio descrito en los Capítulos 5 y 6. Para este

trabajo se entiende la evaluación como un estudio de la correspondencia entre el

significado institucional presentado en la enseñanza y el significado personal

efectivamente alcanzado por los alumnos (Godino, 2002a). Es decir, se evaluamos la

capacidad de los estudiantes de reconocer y resolver mediante procedimientos correctos

las situaciones prácticas ligadas al teorema, uso correcto del lenguaje, comprensión de

enunciados y propiedades y capacidad de argumentación. El resultado de la evaluación

servirá también para valorar la idoneidad didáctica (epistémica, cognitiva, semiótica,

emocional y mediacional) del proceso didáctico propuesto para los alumnos a quienes

va dirigida (Godino, Contreras y Font, 2006).

Las tareas propuestas en dichos instrumentos han sido construidas en base a la

revisión detallada de los libros de texto de estadística para ingenieros (Capítulo 4) y a la

enseñanza planificada (Capítulo 5). En lo que sigue se analizarán los instrumentos de

recolección de datos y presentarán los resultados del estudio.

Page 259: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

252

7.2. OBJETIVOS E INSTRUMENTOS DE EVALUACIÓN

7.2.1. OBJETIVOS

El objetivo principal al construir el cuestionario y las tareas abiertas fue disponer

de unos instrumentos en el que, en un corto espacio de tiempo, pudiéramos recoger

datos que nos permitan aproximarnos a la comprensión que muestra el grupo de

alumnos en relación con los principales elementos de significado incluidos en el

proceso de estudio.

De este objetivo principal se deducen otros objetivos. El primero de ellos

consiste en estimar la proporción de alumnos en el grupo que muestran una

comprensión y capacidad de aplicación de ciertos elementos de significado incluidos

en la enseñanza. Asimismo, deseamos identificar cuáles de estos elementos resultaron

difíciles, identificando los conflictos semióticos presentados respecto a los mismos,

mostrando tanto las características en la comprensión en el grupo de alumnos, como su

variabilidad.

Particularmente, en los problemas abiertos y la prueba de ensayo, se trata de

describir los elementos de significado usados correcta e incorrectamente por los

estudiantes en su resolución y las conexiones que establecen entre los mismos. Todo

ello permitirá caracterizar el significado personal de los estudiantes sobre el teorema

central del límite al finalizar el proceso de estudio y compararlo con el significado de

referencia implementado, así como caracterizar la idoneidad didáctica del proceso de

estudio.

7.2.2. PROCESO DE CONSTRUCCIÓN

En el proceso de elaboración del cuestionario y de las tareas se han seguido una

serie de recomendaciones tomadas de Osterlind (1989), Thorndike (1989) y Martínez

Arias (1995):

En primer lugar, se delimitó el contenido a evaluar con este instrumento, a partir del

análisis de los diversos elementos del significado institucional local previsto

descrito en el Capítulo 4.

Se especificó el formato de los ítems, decidiendo incluir ítems de selección

múltiple, algunos con una parte de justificación y también con preguntas de

Verdadero/ Falso. Además se propuso a los estudiantes dos problemas abiertos y un

Page 260: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

253253

proyecto de aplicación para valorar mediante ellos las habilidades de pensamiento

de más alto nivel (Gal, 1997). Estas decisiones se tomaron teniendo en cuenta el

tiempo disponible, el tipo de evaluaciones a las que estaban acostumbrados los

estudiantes y que se deseaba incluir un número relativamente amplio de ítems para

cubrir el máximo de elementos de significado.

Se procedió a la elaboración de una colección de ítems inicial, a partir de los cuales

se seleccionaron, posteriormente, los que habrían de constituir el cuestionario.

En una serie de revisiones sucesivas, se completaron y modificaron los ítems,

añadiendo algunos de invención propia y otros elaborados a partir de preguntas o

ejercicios de los libros de texto analizados en el Capítulo 4. Una vez que se llegó a unos

instrumentos que parecían cubrir el contenido pretendido, se procedió a homogeneizar

la redacción y a cambiar el contexto cuando éste no fuese familiar al alumno. Se

hicieron pruebas de comprensión del enunciado, con algunos estudiantes de la misma

especialidad modificando la redacción en los casos que fue necesario.

En la redacción de los enunciados se tuvieron en cuenta los siguientes aspectos

indicados por Brent (1989): Evitar detalles innecesarios, relevancia de las preguntas

formuladas para el estudio, nivel de lectura adecuado, brevedad, evitar las cuestiones

negativas, evitar cuestiones sesgadas o interdependientes, claridad y falta de

ambigüedad, que la respuesta sea razonable para el sujeto y pueda darla, evitar hipótesis

implícitas, nivel apropiado de abstracción, asegurar que las preguntas tienen el mismo

significado para todos los sujetos.

7.3. ANÁLISIS A PRIORI DEL SIGNIFICADO EVALUADO

En el proceso de estudio implementado (Ver Capítulos 5 y 6) se introdujeron una

serie de elementos de significado del teorema central del límite, agrupados en tres

lecciones y utilizando tres configuraciones epistémicas en el trabajo en el aula. El

cuestionario se centra en la evaluación de la comprensión de parte de estos elementos y

presenta 15 ítems, que han sido construidos en base a la revisión detallada de los libros

de texto de estadística para ingenieros. El cuestionario presenta ítems de varios tipos

que se describen y analizan a continuación:

Ítems de opción múltiple en los que una de las opciones corresponde a la respuesta

correcta y el resto a errores descritos en la literatura o constatados en nuestra

Page 261: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

254

práctica docente (ítems 1, 2, 3, 4, 5 y 15). El ítem 15 tiene una parte de

justificación, destinada a valorar la comprensión y aplicación de los conceptos

donde el alumno tiene que explicar por qué responde de una determinada manera,

interpretar un enunciado y aplicar una propiedad.

Ítems de verdadero/falso (ítems del 6 al 14), los cuales piden al estudiante reconocer

hechos o relaciones, discriminar, analizar, hacer inferencias o aplicar propiedades.

Los ítems 6 y 7 contienen tres y cuatro preguntas de verdadero y falso

respectivamente y algunas de ellas piden justificar la respuesta.

Además del cuestionario, hemos incluido dos problemas abiertos y una prueba

abierta a resolver con ordenador.

A continuación un análisis detallado, de cada ítem y tarea, describiendo su

contenido y los posibles errores que, a priori, es previsible que encontremos en las

respuestas de nuestros alumnos. Se marca en negrita la respuesta correcta.

Ítem 1. La aproximación de la distribución binomial bin(n,p) a la distribución normal es suficientemente buena cuando:

a) n es menor que 30 y np aproximadamente igual a 5 b) n es mayor que 30 y p menor que 0,05 c) n es mayor que 30 y p aproximadamente igual a 0,5 d) n mayor que 30 y cualquier pe) n mayor que 30 y p igual a 0,9

Este ítem, presentado mediante expresiones verbales y simbólicas, pretende

evaluar si el alumno reconoce las condiciones que han de cumplir n y p para que la

aproximación de la distribución binomial a la normal sea suficientemente precisa.

Corresponde, al campo de problema CP1: Obtener una aproximación de la distribución

binomial para valores grandes de n, y a las propiedades P4: La aproximación mejora

con el número de sumandos y P7: Aproximación de una distribución discreta por una

continua. El alumno debe razonar acerca del teorema como caso especial de un

resultado general (argumento A2). Lleva implícito un enunciado intuitivo del teorema

central del límite (E6).

La respuesta correcta sería la alternativa (c), pues en este caso la forma de la

distribución es simétrica y cumple las condiciones de muestras de tamaño mayor a 30 y

ser tanto np como nq mayores a 5 (Montgomery y Runger, 1996; Walpole y cols.,

1999).

Los distractores incluidos evalúan los siguientes errores: (a) pensar que la

Page 262: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

255255

aproximación es buena para tamaños pequeños de muestra; (b) aunque n es mayor que

30, el valor esperado np=1,5 es menor que 5; (d) reconocer la precisión de

aproximación a la binomial sólo mediante el tamaño muestral y no el parámetro p; (e)

pensar en una buena convergencia para valores del parámetro cercanos a 1; si bien

cumple la regla, por ejemplo para np=30 0,9= 27 no se cumple para el complemento

nq=30 0,1=3.

Ítem 2. Sean Xi=0 si un producto es defectuoso y Xi =1 si el producto está correcto. En un lote de 30 de estos productos queremos calcular la probabilidad de que 25 al menos sean correctos, aproximando por la normal. La corrección de continuidad para el cálculo implica que tenemos que calcular:

a) )5,25(

30

1i

iXP

b) )5,24(

30

1i

iXP

c) )24(30

1i

iXP

d) )25(30

1i

iXP

e) )5,25(30

1i

iXP

El ítem 2, expresado en notación algebraica, evalúa el conocimiento de la

aplicación de la corrección de continuidad en el cálculo de una probabilidad en un

problema de ingeniería. Se refiere al campo de problema CP1 o CP2: Determinar la

distribución de la suma de variables aleatorias discretas idénticamente distribuidas; y

la propiedad específica P12: Corrección de continuidad. Lleva implícito un enunciado

intuitivo del teorema central del límite. Se ha de razonar de lo particular a lo general.

Para mejorar la aproximación de una variable discreta por una continua, al

calcular la probabilidad de encontrar por lo menos 25 productos en buen estado en la

muestra de 30, restamos el factor de corrección 0,5 al límite inferior del intervalo, cuya

correcta expresión de cálculo es dada en la alternativa (b). Se pretende evaluar las

dificultades en traducir el lenguaje a una desigualdad (e); error acerca de los límites de

la corrección de continuidad al calcular la probabilidad (a) y no considerar el factor de

corrección (c y d).

Ítem 3. La aproximación normal mejora cuando el intervalo a calcular en probabilidad: a) Se acerca al extremo superior de valores de la distribución binomial b) Se aparta del término central de valores de la distribución binomial c) Se acerca al extremo inferior de valores de la distribución binomial d) Se acerca al término central de valores de la distribución binomial

Page 263: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

256

Siguiendo con el campo de problema CP1, se estudia la bondad de aproximación

en diferentes posiciones del rango de la variable usando términos verbales,

considerando la aproximación de una distribución discreta (P7). Lleva implícito un

enunciado intuitivo del teorema central del límite.

La respuesta correcta sería que la calidad de la aproximación se presenta para

valores cercanos al valor esperado de la distribución (d). Los tres distractores están

asociados a pensar en una mejor exactitud en la convergencia en valores alejados de los

centrales.

Ítem 4. Una máquina llena paquetes de azúcar de 1 k. El error promedio de llenado de cada paquete es 2 gramos y la desviación estándar 3 gramos. Si se llenan 400 paquetes a la hora, el cálculo de la probabilidad aproximada de que el exceso de azúcar sea menor que 750, sería:

a) )83,03

2(

XP

b) )6

5

20/3

800( iX

P

c) )6

5

15,0

2(

XP

d) )83,09

400( iX

P

De acuerdo a los elementos de significados del teorema central del límite

corresponde al campo de problemas CP4, distribución de la suma de v.a. continuas y

CP12, estimación de una media.

Considerando la variable Xi : error de llenado de un paquete de azúcar (gramos),

se pide que se exprese que la v.a. suma 400

1iiX : exceso de gramos en azúcar de una

muestra de 400 paquetes, no sea mayor a 750 gramos. Utilizando el teorema central del

límite para muestras de tamaño suficientemente grande, y las propiedades de cálculo de

la media y varianza (P1 y P2) de la distribución asintótica de la suma (P3), se tiene

9400,2400~ 2400

1nnNX

ii = N(800, 3600) o, en forma equivalente, la distribución de

la media muestral 400/9/,2~ 2 nNX . El cálculo de probabilidad pedida es

P( Xi<750)6

5

203

2

60

50

60

800 XP

XP i , por tanto la respuesta correcta sería la

alternativa (c).

Incluiría los procedimientos de Cálculo algebraico y transformación de

variables aleatorias (AP1) y tipificación/destipificación (AP2), y las siguientes

Page 264: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

257257

propiedades: P1: Media de la suma, P2: Varianza de la suma, P3: Distribución de la

media aritmética de una m.a. de tamaño suficientemente grande, y P5:

Transformaciones lineales de v.a. siguen una distribución asintótica normal. Lleva

implícito un enunciado general del teorema central del límite.

Los distractores apuntan a describir posibles errores de estandarización en la

varianza de la media muestral (a), la varianza de la suma (b), y la esperanza de la suma

y la confusión de la varianza por la desviación estándar (d).

Ítem 5. Sea Xi variables aleatorias independientes con la misma distribución. Señala cuál de los siguientes enunciados es falso:

a) P(a<30

1iiX <b) se puede aproximar mediante el área bajo una curva normal entre a y b.

b) Para n observaciones grandes de una población con una media finita y una varianza finita 2 , la distribución de muestreo de la suma Sn= Xi se puede aproximar con una función de densidad normal cuya media es n y varianza 2n .

c) La función de densidad nf de 30

1iiX se aproxima a la función de densidad de una distribución normal,

)2/exp(2

1)( 2zzfLim n

n

d) Si Xi tiene recorrido 1, 2, 3 con probabilidades respectivas 0,2, 0,5, 0,3, entonces, para n = 30, la

expresión npq

npX i sigue una distribución normal N (0,1).

e) Cuando n es grande, la distribución de la media muestral X se aproxima a la distribución normal

),(2

nN con media y desviación estándar n .

El ítem 5 tiene por objeto establecer los distintos enunciados del teorema central

del límite, E2, como límite de una sucesión de funciones (alternativa c); E4, como suma

de variables aleatorias independientes idénticamente distribuidas (b); como suma de

v.a. para n considerada grande (a) y enunciado del teorema de la forma general

(enunciado E5) (e). Se razona de lo general a lo particular.

La respuesta incorrecta es la (d) y pretende evaluar si los alumnos distinguen una

variable con distribución discreta acotada (campo de problema CP2.2) de la

distribución binomial (campo de problema CP1). Corresponde a la propiedad P5,

distribución de la media muestral. Aplicando las operaciones de esperanza y varianza

de la suma de v.a. (propiedades P1 y P2), se obtiene la siguiente estandarización (AP2)

7,14

60301i iX .

Page 265: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

258

Ítem 6. La rapidez con la que la suma de variables aleatorias se aproxima a la distribución normal depende: (contesta cada apartado como V o F)a) De las distribuciones de las v.a. X i

b) Del tamaño de la muestra nc) De los valores de los parámetros

Este ítem, que enuncia intuitivamente el teorema (E6), valora las condiciones que

aseguran la rapidez de la convergencia (Campo CP5). Se espera que la respuesta de los

estudiantes a los tres apartados sea la opción verdadera (V), es decir, que la

aproximación es mejorada no sólo por el aumento del tamaño muestral, sino también

está condicionada a la forma distribucional de la población de origen y de la

sensibilidad de los valores de sus parámetros. El estudiante debe recordar las

actividades realizadas con la simulación en el estudio del comportamiento de los

estadísticos. Por ejemplo, la distribución uniforme discreta converge muy rápidamente

(CP2.1) y también la distribución Poisson (CP2.3) se aproxima a la distribución normal

a partir del valor de µ >5. Esta pregunta abarca las propiedades P4, la aproximación

mejora con el número de sumandos; P8, aproximación de otras distribuciones clásicas

a la distribución normal.

Ítem 7. La aproximación a la normal es bastante buena para valores muy pequeños de n en variables aleatorias con distribución: (contesta cada apartado como V o F): a) Asimétrica b) Simétrica c) Uniformed) Sesgada

El objetivo de este ítem es evaluar específicamente la importancia de la forma o

distribución de la población original para una buena aproximación, cuando la muestra

no sea grande. El alumno debe recordar las actividades analizadas gráficamente y

mediante simulación para distintas distribuciones de probabilidades. La convergencia

rápida se establece en distribuciones de probabilidades simétricas y en la distribución

uniforme, ya sea discreta o continua. Es decir, son verdaderas las opciones (b y c).

Hemos visto que la aproximación a la distribución binomial depende del parámetro p,

por lo que para valores cercanos a cero o uno, se obtiene una distribución sesgada a

izquierda o derecha, y habría que tomar muestras de tamaño más elevado; también si la

distribución es asimétrica se requiere muestras de tamaño muy grande. Implícitamente

se evalúa la propiedad P4: Mejora de la aproximación con n; los campos de problemas

CP2: Determinar la distribución de la suma de variables aleatorias discretas

Page 266: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

259259

idénticamente distribuidas; CP4: Determinar la distribución de la suma de variables

aleatorias continuas; y CP5: Condiciones del error de aproximación.

Ítem 8. Una distribución muestral describe los valores que tomaría un estadístico en muchas repeticiones de una muestra o de un experimento en las mismas condiciones. V/F

Se pide al alumno que recuerde el concepto de distribución muestral, tópico en el

cual se desarrolla el teorema central del límite, previo a la inferencia estadística. La

respuesta es verdadera. No está relacionado directamente con el teorema, pero

queríamos asegurar que el alumno comprende este concepto para evaluar mejor su

respuesta a los siguientes ítems.

Ítem 9. La desviación estándar de la media muestral aumenta a medida que crece el tamaño de la muestra. V/F

Corresponde al campo de problemas CP12, estimación de la media muestral. La

respuesta es falsa, ya que la desviación estándar n de la media muestral disminuye

al aumentar n, o dicho de otra forma, la desviación estándar aumenta a medida que el

tamaño de la muestra decrece. Corresponde a la propiedad P2, la varianza de la

distribución de la suma de v.a. y P4, la aproximación es mejorada para muestras

grandes. También está presente la propiedad P10, los estimadores de máxima

verosimilitud tienen distribución asintótica normal; ya que este es el caso de la media

muestral, buen estimador de la media poblacional, y por ello, mientras más pequeña es

su varianza mayor es la eficiencia de su estimador. El alumno ha de hacer un

razonamiento formal.

Ítem 10. Las representaciones graficas de todas las distribuciones muestrales tienen forma simétrica. V/F

Esta afirmación es falsa, la forma gráfica de la distribución, como hemos

mencionado anteriormente, depende de la distribución original y valores de los

parámetros. El alumno ha de razonar a partir de contraejemplos. Se evalúa

implícitamente el conocimiento de qué estadísticos tienen distribución muestral a las

que se aplica el teorema (P10 y P11). Se debe razonar de lo general a lo particular (A2).

Ítem 11. La media muestral tiene una distribución aproximadamente normal cuando n es suficientemente grande, independiente de la forma que tenga la población. V/F

Page 267: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

260

Esta afirmación expresada en términos verbales es uno de los enunciados del

teorema central del límite de forma general (E5) y que se presenta habitualmente para la

media aritmética en textos de estadística para ingenieros. Las propiedades usadas son

que mejora al aumentar en número de variables aleatorias (P4) y es un buen estimador

asintótico de máxima verosimilitud (P10). Corresponde al campo de problemas CP12

(estimación de la media). Se ha de razonar mediante ejemplos /contraejemplos (A5).

Ítem 12. Cuando el estadístico de prueba es t y el número de grados de libertad se hace muy grande, el valor crítico de t está bastante próximo a la normal estándar z. V/F

Este ítem, al igual que el anterior es verdadero, y es un caso clásico de

aplicación del teorema en la construcción de intervalos de confianza y test de hipótesis

(Campos de problemas CP12 y CP13). En tablas estadísticas es común ver que, para

valores mayores que n=30, los valores críticos de la distribución t-student coinciden con

los de la distribución normal. Considera las propiedades P4 en función del tamaño de la

muestra y la aproximación de otras distribuciones clásicas a la normal, P8. El

estudiante puede justificar su razonamiento mostrando en la tabla estadística de la

distribución t-student y comparando numéricamente la convergencia (A5).

Ítem 13. El valor normal estándar se usa para todas las inferencias sobre proporciones de la población.

V/F.

El ítem 13 es falso, ya que para muestras de tamaño grande se utiliza el

estadístico )1,0()1(

ˆ0 N

npp

ppZ para la construcción de intervalos de confianza de la

proporción población, pero no para muestras pequeñas. Para desarrollar el test de

hipótesis que se refieren a parámetros de distribuciones no normales, se puede utilizar el

teorema central del límite o resultados referentes a la distribución de probabilidades del

estimador máximo verosímil. En particular, en una muestra aleatoria de tamaño n

grande se tiene: )1,0(Nn

X . Por otra parte, si ˆ es el estimador máximo verosímil de

, entonces para n grande: )1,0()ˆ(

ˆN

Var

. Por tanto, se debe recordar la aplicación del

teorema central del límite para intervalos de confianza (CP12) y para test de hipótesis,

CP13 en poblaciones no normales, además de la transformación lineal de la proporción

Page 268: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

261261

de v.a. de poblaciones Bernoulli (propiedad P5).

Ítem 14. El valor esperado de la distribución muestral de las medias muestrales X es igual a la media de

la muestra. V/F

La respuesta es falsa, debido a que el valor esperado de la media muestral es

igual a la media de la población x . Se pretende evaluar si los alumnos

diferencian los parámetros poblacionales de los estadísticos obtenidos de las muestras y

la propiedad P1. Corresponde al campo de problemas CP12: Estimación de una media.

Evalúa el conocimiento de términos (valor esperado, media, muestra, población) y los

correspondientes conceptos y propiedades.

Ítem 15. La primera tarea en un curso introductorio de programación por computadores implica correr un breve programa. Si la experiencia indica que 50% de todos los estudiantes principiantes cometerán errores de programación, ¿Cuál de estos casos te parece más probable? Indica por qué has elegido esta opción: a) Que entre los próximos 10 estudiantes seleccionados 8 o más cometan errores de programación. b) Que entre los próximos 100 estudiantes seleccionados 80 o más cometan errores de programación. c) Las dos cosas anteriores son igual de probables.

Este ítem es una variante del problema de Kahneman, Slovic y Tversly (1982)

sobre heurística de la representatividad, en contexto de informática, y donde el

estudiante debe justificar su elección. La opción (c) pone a prueba si el estudiante tiene

en cuenta el tamaño de la muestra en el cálculo de la probabilidad, y su elección supone

un sesgo de representatividad. De igual manera la opción (b), conlleva a pensar siempre

que mayores muestras tomadas implican mayor chance de ocurrencia en el cálculo de

probabilidades, tienen más variabilidad y fue encontrada en la investigación de Serrano

(1996).

La respuesta correcta es la alternativa (a) que considera más probable el caso de

muestra más pequeña como la de n=10. Para hallar esta solución, en forma algebraica

se debe estandarizar la suma de v.a. Bernoulli y utilizar la corrección de continuidad.

Corresponde al campo de problema CP1 de la distribución aproximada a la binomial,

con procedimientos de cálculo algebraico de v.a. (AP1), tipificación/destipificación

(AP2) y cálculo de probabilidad mediante tablas estadísticas (AP3). Justifica el

teorema como caso particular de un resultado general (A2) y valora las propiedades

P1, P2, P12 en la estandarización de la esperanza, varianza y corrección de

continuidad respectivamente. Para encontrar la respuesta, se seguirían los siguientes

Page 269: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

262

pasos:

Xi bin (n = 10 ; p = 0,5) ; el estadístico de la suma se aproxima a la distribución

normal Xi N( = 5 ; 2= 2,5). Luego 057,058,11

5,2

55,718i .

En cambio, Xi bin(n = 100 ; p = 0,5) ; luego Xi N( = 50 ; 2= 25)

09,5125

505,79180i .

Problema 1. Construcción de un Cruce

Se supone que X, el número de accidentes por mes en un cruce de carreteras dado, tiene una distribución Poisson con 6 . Si el número de accidentes durante tres años es mayor o igual a 240, se deberá

reconstruir el cruce debido a un programa otorgado por el estado. Aproxime la probabilidad de que el cruce en cuestión sea considerado en el programa de emergencia del estado. Comente el resultado.

Para resolver este problema el alumno ha de considerar la variable X: nº de

accidentes por mes, donde X ( =6) sigue la distribución de Poisson. Considerando

las variables aleatorias X1,X2,...,X36 independientes e idénticamente distribuidas, con

distribución de Poisson y definiendo la variable aleatoria Xi : nº de accidentes en tres

años, se puede utilizar el teorema central del límite (para el caso de variables discretas

no acotadas) 36

1ii N(36×6 ;36×6), debido a que el tamaño muestral n =36 30 es grande

y 6.

Es decir se utiliza el campo de problemas CP2: Determinar la distribución de la

suma de variables aleatorias discretas idénticamente distribuidas. El alumno podría

hacer un enunciado intuitivo del teorema (E6), especificar el caso de la suma de

variables independientes idénticamente distribuidas (E4) o bien hacer un enunciado

general del teorema en que la media muestral es aproximada por una normal para un n

grande.

Como propiedades, tiene que utilizar el cálculo de la media y varianza de una

suma de variables aleatorias (P1 y P2) y la aproximación de una distribución clásica

(Poisson) a la normal (propiedad P8), indicando que se cumplen las condiciones

requeridas. Usando la corrección de continuidad, calculamos:

0548,060,11216

2165,239240

36

1ii

El alumno tiene que aplicar la propiedad de corrección de continuidad (P12);

como procedimientos ha de usar el AP1: Cálculo algebraico y transformación de

Page 270: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

263263

variables aleatorias; AP2: Tipificación/destipificación; AP3: Cálculo de probabilidades

con calculadora o tabla. La validación del procedimiento del problema es de forma

algebraica y deductiva (A1), mediante el cálculo correcto de la suma o promedios

muestrales de variables aleatorias y también razonar de lo general a lo particular (A2).

El comentario esperado es que, como la probabilidad de ocurrencia de más de 240

accidentes es baja, el estado no realizará la reconstrucción del cruce. Aparece un

argumento A6: Obtener una conclusión o tomar una decisión en base al teorema

central del límite. En general en esta actividad el alumno usará símbolos y expresiones

verbales, podría también utilizar algún gráfico al calcular probabilidades.

Problema 2. Sondeo político

Suponga que la proporción de votantes rurales de cierto estado, a favor de un candidato a Diputado es 0,45 y la proporción de votantes urbanos que están a favor del mismo candidato es 0,60. Si se obtiene una muestra de 200 votantes rurales y 300 votantes urbanos, ¿cuál es la probabilidad aproximada de que por lo menos 250 de estos votantes estén a favor de este candidato?

Se espera que el estudiante siga los siguientes pasos:

1. Identificar uno de los dos campos de problemas: CP1: Obtener una aproximación

de la distribución binomial para valores grandes de n; o CP2: Determinar la

distribución de la suma de variables aleatorias discretas idénticamente distribuidas.

2. Definir las variables W: Votante a favor de un candidato y Wi : nº de votantes a

favor del candidato, considerando la suma de dos variables y calculando la media y

varianza de la suma de variables (P1 y P2). Usaría la propiedad P7 (aproximación de

distribuciones discretas por continuas).

300

11

200

11

iiiW = 200×0,45 + 300×0,6 = 270

222111 qpnqpnWV i = 200×0,55×0,45 + 800×0,4×0,6 = 121,5.

El alumno usaría un enunciado E4: Enunciado del teorema para la suma de

variables independientes idénticamente distribuidas; iW N (270;121,5), también E6:

Enunciado intuitivo del teorema; por el teorema central del límite, para n grande o bien

un enunciado de forma genera para la media muestral (E5). Se requieren también los

siguientes elementos: AP1: Cálculo y transformación algebraica de variables

aleatorias; AP2: Tipificación y su inversa; AP3: Cálculo de probabilidades con

calculadora. Usando la corrección de continuidad (propiedad P12):

Page 271: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

264

9686,00314,0186,115,121

2705,249250i

Usaría también los argumentos A1: Demostraciones formales algebraicas y/o

deductivas, en el cálculo correcto de la suma o promedio de la muestra de variables con

distribución binomial; A2: Enunciado del teorema como caso especial de un resultado

general, y también A6: Obtener una conclusión en base al teorema, 96,86%

corresponde a la probabilidad de que por lo menos 250 de estos votantes estén a favor

del candidato.

Problema 3. Proyecto de aplicación del teorema central del límite a la ingeniería con @risk

Se pidió a los estudiantes aplicar a un problema de la ingeniería elegido por ellos mismos mediante los conceptos estudiados en las tres lecciones sobre el teorema con apoyo de Excel y @risk. Los datos se simularían a través del programa @risk, analizando para distintos valores de los parámetros la convergencia de la distribución de probabilidades de origen que modela la situación de contexto.

Se sugiere a los estudiantes poner a prueba sus conocimientos del teorema

central del límite situado en un área específica de aplicación, y apoyada con el

ordenador. En un plazo de dos a tres semanas el alumno debería entregar el proyecto

utilizando para su solución lo aprendido en relación al teorema. Ellos deben definir la

variable de interés dentro del contexto de su problema ingenieril, sea discreta o

continua, plantear objetivos y dar referencias de la información. Podrían usar en su

planteamiento problemas en las tesis de ingenieros egresados, libros de ciencias de la

ingeniería o recolección personal de bases de datos. Además, han de incorporar en la

solución entregada las tablas de datos y gráficas como el histograma empleados, la

distribución de probabilidad clásica asociada, y estimar la solución mediante la

simulación para variados valores de muestras, aportando sus conclusiones.

Se espera que, en la preparación de este informe investigativo individual

propuesto al final del semestre académico, el estudiante siga los siguientes pasos:

El primer paso es presentar una problemática en un área específica de aplicación,

que incluya procesos de simulación, y que puede ser resuelta mediante la estimación de

distribuciones de probabilidades de la media muestral. Son varios campos de problemas

que se podrían identificar: Obtener una aproximación de la distribución binomial para

valores grandes de n (CP1), Determinar la distribución de la suma de variables

aleatorias idénticamente distribuidas ya sean discretas (CP2) o continuas (CP4), y

CP3: Establecer la distribución de la suma de variables aleatorias independientes no

Page 272: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

265265

idénticamente distribuidas. También, campos más aplicados como CP8: Obtener el

tamaño adecuado una de muestra aleatoria de poblaciones desconocidas, CP10:

Distribución de diferencias de medias muestrales en dos poblaciones, CP12:

Estimación por intervalos de confianza de la media y otros parámetros para muestras

grandes y CP13: Contraste de hipótesis de la media y otros parámetros en poblaciones

no normales para muestras grandes.

Para enfrentar el problema, el alumno ha de utilizar más de un lenguaje en la

resolución de la situación, tales como términos y expresiones verbales (variable

aleatoria, distribución de probabilidad, muestra aleatoria…), símbolos (distribución

muestral del promedio y su estandarización, estadísticos…) y representaciones gráficas

con simulación (histogramas, curva de densidad,…). Podría describirse el teorema

central del límite con enunciados E4: Suma de variables aleatorias independientes

idénticamente distribuidas; E5: Presentar el teorema de forma general, o bien, señalar

el teorema en forma intuitiva (E6).

Para estimar las probabilidades aproximadas de la media muestral que se piden

en la solución del problema se requiere de varias operaciones, de la cual podemos

señalar: definir la variable y asociarle una distribución de probabilidad conocida,

estimar los parámetros de la distribución escogida, simular en una tabla de datos la

distribución del promedio y representarlo gráficamente, analizar la convergencia del

estadístico y comparar las medias empíricas y teóricas. Los procedimientos que pueden

usarse en la solución del problema son AP1: Cálculo algebraico y transformación de

variables aleatorias aplicando propiedades, AP2: Tipificación y/o operación inversa a

la tipificación normal para obtener una m.a. de tamaño adecuado, AP3: Cálculo de

probabilidades referido al teorema con calculadora o programa de ordenador.

Las propiedades que pueden utilizar los estudiantes una vez definida la

naturaleza de la variable y su distribución de probabilidades son variadas, P1: Media de

la distribución aproximada de una suma de variables aleatorias es la suma de las medias,

P2: Varianza de la distribución aproximada de una suma de variables aleatorias es la

suma de las varianzas, P3: La media aritmética de una m.a. de tamaño suficientemente

grande sigue una distribución aproximadamente normal, P4: Aproximación de la suma

de variables aleatorias a la distribución normal mejora con el número de sumandos, P5:

Transformaciones lineales de variables aleatorias siguen una distribución asintótica

normal, P6: Medias muestrales en dos poblaciones sigue una distribución aproximada

Page 273: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

266

normal, P7: Aproximación de una distribución discreta por una continua, P8:

Aproximación de distribuciones clásicas a la distribución normal, P10: Estimadores de

máxima verosimilitud tienen distribución asintótica normal, P12: Corrección de

continuidad.

Para validar la comprensión de información de datos reales o simulados, el

alumno debería dar argumentos tipo análisis y síntesis. Se consideran que son

aceptables las demostraciones algebraicas (A1), argumentar el teorema como caso

particular de un resultado general (A2), simulación gráfica del teorema mediante el

ordenador (A4), mediante comprobación de ejemplos, contraejemplos y comparación de

medias empíricas y teóricas (A5) y obtener una conclusión o tomar una decisión en base

a resultados del teorema (A6).

Figura 7.3.1. Distribución de muestreo de X cuando la distribución de la población es Weibull, con 2 y 5 utilizando el programa @risk

Previo al planteamiento de esta actividad práctica, los estudiantes hicieron otras

prácticas de simulación con Excel, como las mostradas en la lección uno. Además, se

levantó en la plataforma (EV@ Entorno Virtual de Aprendizaje http://uvirtual.ucsc.cl)

un demo de comandos y gráficas de salidas del programa @risk, utilizando el ejemplo

particular de la distribución Weibull, fijando con valores sus dos parámetros y, para un

promedio de una muestra de cinco valores, se ejecutó con 500 réplicas (Ver Figura

7.3.1. de la distribución de probabilidad de la población y la distribución del promedio

simulado).

A objeto de verificar que los alumnos habían participado con el programa @risk,

se les pidió previamente enviar por EV@, a modo de ejercicio, un experimento de

simulación, aproximando una distribución cualquiera de probabilidad clásica, y

Page 274: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

267267

estudiando la distribución de muestreo de la media muestral. Los alumnos debieron

responder las siguientes interrogantes ¿Para cuáles de los distintos tamaños de muestra

la distribución de la media muestral es aproximadamente normal?, ¿Qué efecto tiene el

incremento del tamaño de la muestra de 100 a 500?, ¿Qué efecto produce el cambio de

5 a 50 muestras?

Como consecuencia del análisis anterior, se presenta en las tablas 7.3.1 a 7.3.6

los elementos de significados del teorema central del límite evaluados en el

cuestionario.

Tabla 7.3.1. Campos de problemas presentes en los instrumentos de evaluación

Ítems 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 P1 P2 P3

CP1. Aproximación de la d. binomial para n grande

X X X X X X X

CP2.1. Uniforme discreta X CP2.2. Discreta acotada X X X X X

CP2.3. Discreta no acotada X X X CP3. Independientes no idénticamente distribuida

X

CP4. Suma v.a. Continuas X X X CP5. Error aproximación X X CP8. Obtener tamaño muestra X

CP10. Diferencias de medias X CP12. Estimación de media X X X X X X X CP13. Contrastes X X X

Tabla 7.3.2. Lenguaje y representaciones presentes en los instrumentos de evaluación

Ítems 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 P1 P2 P3

Términos X X X X X X X X X X X X X X X X

Símbolos X X X X X X X X X Gráficos X X X X

Simulación X

Tabla 7.3.3. Algoritmos y procedimientos presentes en los instrumentos de evaluación

Ítems 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 P1 P2 P3

AP1. Cálculo algebraico X X X X X X

AP2. Tipificación/Destipificación X X X X X X AP3. Cálculo prob (tablas) X X X X AP4. Resolución mediante simulación X

Page 275: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

268

Tabla 7.3.4. Enunciados presentes en los instrumentos de evaluación

Ítems 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 P1 P2 P3

E2. Mediante límite ordinario X

E4. Suma v.a.i. i.d. X X X X E5. Enunciado general X X X X X X X X E6. Enunciado intuitivo X X X X X X X

Tabla 7.3.5. Propiedades presentes en los instrumentos de evaluación

Ítems 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 P1 P2 P3

P1. Media suma X X X X X X X

P2. Varianza suma X X X X X X X P3. Distribución media muestral X X X X P4. Mejora de la aproximación con n X X X X X X X X X

P5. Transformaciones lineales X X X X P6. Medias muestrales en dos poblaciones X P7. Aproximación d.discreta por continua X X X X X X X

P8. Aprox. Distribuciones clásicas X X X X P10. Estimador máxima verosimilitud X X X X X P11. Estimador momentos X

P12. Corrección de continuidad X X X X X

Tabla 7.3.6. Argumentos presentes en los instrumentos de evaluación

Ítems 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 P1 P2 P3

A1. Demostración formal algebraica

X X X X X X

A2. Caso especial de un resultado general

X X X X X X X X

A3. Simulación manipulativa X

A4. Simulación con ordenador X X X A5. Ejemplos /contraejemplos X X X X

A6. Conclusión o tomar una decisión en base al teorema

X X X

7.4. RESULTADOS EN EL CUESTIONARIO

Una vez descritos los instrumentos de evaluación, y analizado su contenido, se

llevó a cabo la evaluación para evaluar el significado personal adquirido por los

estudiantes y compararlo con el significado institucional local planificado en el diseño

del proceso de estudio del teorema central del límite (Capítulo 5).

A continuación, se describen los resultados obtenidos en el cuestionario. Para

ello, en primer lugar, se presenta la frecuencia de respuestas a cada distractor en cada

ítem. Seguidamente se hace un estudio global del número total de ítems correctamente

resueltos por cada alumno y de las interrelaciones entre los ítems. Finalmente, se

identifican tipologías de comprensión del teorema, que se relacionarán con las

Page 276: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

269269

configuraciones cognitivas diferenciadas sobre el mismo, caracterizadas por los

elementos concretos de significado correctamente adquiridos.

Los 15 ítems se completaron en dos sesiones diferentes; la primera (ítems del 1

al 7) con asistencia de 134 alumnos en una de las sesiones de clase, y la segunda sesión

(ítems 8 a 15) como parte de la prueba final del semestre académico. Por lo tanto, en las

Tablas 7.4.1.8 a 7.4.1.16 los porcentajes de aciertos son obtenidos de un total de 106

estudiantes, excluyendo a 28 alumnos que no se presentaron, mientras que en las

primeras los porcentajes se refieren al total de alumnos.

7.4.1. RESPUESTAS A CADA ÍTEM

A continuación (Tablas 7.4.1.1 a 7.4.1.16) se presenta un análisis detallado de

resultados en cada ítem.

Tabla 7.4.1.1. Frecuencias y porcentajes de respuestas a distractores en el Item 1 (n=134)

Ítem 1. La aproximación normal a la distribución binomial B(n,p) es suficientemente buena cuando: Frecuencia Porcentaje a) n es menor que 30 y np aproximadamente igual a 5 6 4,5b) n es mayor que 30 y p menor que 0,05 21 15,7 c) n es mayor que 30 y p aproximadamente igual a 0,5 79 59,0 d) n mayor que 30 y cualquier p 26 19,4e) n mayor que 30 y p igual a 0,9 2 1,5

El ítem 1 se refiere al campo de problemas CP1: aproximación binomial por la

distribución normal y evalúa la comprensión intuitiva del teorema de Laplace-De

Moivre, y la comprensión de la sensibilidad de los parámetros. Se observa que un 59%

de estudiantes reconocen las condiciones que aseguran la precisión de aproximación

(opción c). Los errores se distribuyen en un 41% de alumnos, y son relativos a las

condiciones de aproximación, siendo el orden de importancia el siguiente: el 19% sólo

tiene en cuenta el tamaño muestral y no el parámetro (opción d), un 17% confunde las

condiciones del parámetro para la aproximación (opciones b y e) y un 5% considera

que la aproximación es buena para tamaños pequeños de muestra (opción a).

Méndez (1991) postula cuatro propiedades básicas que deben entenderse para

poder lograr una comprensión sólida del teorema. El ítem 1 se puede considerar un caso

particular de la tercera y cuarta propiedad: “La forma de la distribución muestral tiende

a ser acampanada a medida que se incrementa el tamaño muestral y aproximadamente

normal independiente de la forma de la distribución en la población” y “La forma de la

distribución muestral crece en altura y decrece en dispersión a medida que el tamaño

Page 277: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

270

muestral crece”. Comparada con aquella investigación, los estudiantes muestran mayor

dominio del vocabulario técnico.

En relación al esquema de razonamiento en inferencia estadística (ERIE)

(Moreno, 2003), más de la mitad del grupo se ubica en el nivel analítico de aplicación,

relacionando tres aspectos de convergencia óptima del teorema; influencia del tamaño

de la muestra en la estimación, sensibilidad del parámetro p y condición que np = nq =

15 > 5. De los distractores, un quinto del grupo utilizó el razonamiento de transición

considerando sólo una muestra suficientemente grande para la bondad del ajuste de

aproximación (d), y un porcentaje menor razonó equivocadamente en un nivel

cuantitativo (b y d) al considerar dos aspectos, un tamaño de muestra grande pero np o

nq no cumplen la condición.

Tabla 7.4.1.2. Frecuencias y porcentajes de respuestas a distractores en el Item 2 (n=134)

Ítem 2. Sean iX =0 si un producto es defectuoso y iX =1 si el producto está correcto. En un lote de 30 de

estos productos queremos calcular la probabilidad de que 25 al menos sean correctos, aproximando por la normal. La corrección de continuidad para el cálculo implica que tenemos que calcular: Frecuencia Porcentaje

a) )5,25(

30

1i

iXP27 20,1

b) )5,24(

30

1i

iXP99 73,9

c) )24(30

1i

iXP0 0,0

d) )25(30

1i

iXP6 4,5

e) )5,25(30

1i

iXP2 1,5

La solución correcta a este ítem tiene implícito reconocer y definir la variable

aleatoria binomial como suma de variables de Bernoulli. Del grupo curso (Tabla

7.4.1.2), un 74% aplicó correctamente la corrección de continuidad (b). De los errores

observados, un 25% presenta confusión sobre los límites de la corrección de

continuidad al calcular la probabilidad (opciones a y d); un 2% (opción e) tiene

problemas en traducir el lenguaje a una desigualdad. No se ha encontrado

investigaciones previas que hayan analizado la comprensión de la corrección de

continuidad por parte de los estudiantes.

Page 278: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

271271

Tabla 7.4.1.3. Frecuencias y porcentajes de respuestas a distractores en el Item 3 (n=134)

Ítem 3. La aproximación normal mejora cuando el intervalo a calcular en probabilidad: Frecuencia Porcentaje a) Se acerca al extremo superior de valores de la distribución binomial 13 9,7 b) Se aparta del término central de valores de la distribución binomial 9 6,7c) Se acerca al extremo inferior de valores de la distribución binomial 10 7,5 d) Se acerca al término central de valores de la distribución binomial 89 66,4 No responden 13 9,7

En el ítem 3 (Tabla 7.4.1.3) se mide la comprensión de otro factor que influye en

la buena aproximación a la binomial: la forma de la distribución binomial mejora en

simetría y apuntamiento en torno al valor esperado de la variable, cuando aumenta el

valor de n. Un 66% de estudiantes valora la mejora de la aproximación normal a la

binomial al calcular la probabilidad de un intervalo de valores centrales de la

distribución (opción d). En cambio, respecto de los errores, un 23,9% espera mejor

exactitud en la convergencia en valores alejados de los centrales (opciones a, b y c).

Este ítem corresponde a la propiedad cuatro de Méndez y el porcentaje de alumnos que

la comprenden es mayor que la obtenida en la investigación citada.

Tabla 7.4.1.4. Frecuencias y porcentajes de respuestas a distractores en el Item 4 (n=134)

Ítem 4. Una máquina llena paquetes de azúcar de 1 k. El error promedio de llenado de cada paquete es 2 gramos y la desviación estándar 3 gramos. Si se llenan 400 paquetes a la hora, el cálculo de la probabilidad aproximada de que el exceso de azúcar sea menor que 750, sería: Frecuencia Porcentaje

a) )83,03

2(

XP

5 3,7

b) )6

5

20/3

800( iX

P70 52,2

c) )6

5

15,0

2(

XP

50 37,3

d) )83,09

400( iX

P9 6,7

El ítem 4 (Tabla 7.4.1.4) presentó mayores dificultades del grupo, ya que de los

134 estudiantes, sólo un 37% identificó correctamente las operaciones necesitadas en

la estandarización para el cálculo de una probabilidad en la distribución asintótica de la

media muestral en una muestra suficientemente grande. Se observa que la mayor

frecuencia de error, con un 52%, fue considerar la suma de variables aleatorias, en lugar

de la media, y no tener en cuenta que la desviación estándar de la suma debe ser 60 y no

0,15=3/20. Un 7% confunde la esperanza de la variable suma y también de la varianza,

y un 4% comete errores de estandarización de la varianza del promedio de la muestra.

Page 279: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

272

Tabla 7.4.1.5. Frecuencias y porcentajes de respuestas a distractores en el Item 5(n=134)

Ítem 5. Sea iX variables aleatorias independientes con la misma distribución. Señala cuál de los

siguientes enunciados es falso Frecuencia Porcentaje

a) La P(a<30

1iiX <b) se puede calcular mediante el área bajo una curva

normal entre a y b

9 6,7

b) Para n observaciones grandes de una población con una media finita

y una varianza finita 2 , la distribución de muestreo de la suma in XS

se puede aproximar con una función de densidad normal cuya media es n

y varianza 2n .

4 3,0

c) La función de densidad nf de la 30

1iiX se aproxima a la función de

densidad de una distribución normal, )2/exp(2

1)( 2zzfLim n

n

51 38,1

d) Si iX tiene recorrido 1,2,3 con probabilidades respectivas 0,2, 0,5,

0,3, entonces, para n = 30, la expresión npq

npX i sigue una

distribución normal N (0,1).

63 47,0

e) Cuando n es grande, la distribución de la media muestral X se

aproxima a la distribución normal ),(2

nN con media y desviación

estándar n .

7 5,2

El ítem 5 (Tabla 7.4.1.5) pone a prueba los distintos enunciados del teorema

central del límite dados a lo largo de las tres lecciones. Un 47% de estudiantes distingue

el enunciado falso del teorema, encontrando un error en la estandarización de una

variable con distribución discreta acotada de la distribución binomial (opción d). De las

respuestas erróneas, un 38% no reconoce el enunciado del teorema como límite de una

sucesión de funciones (opción c), lo que puede deberse a que en la lección 3 nos

limitamos sólo a enunciar el teorema y desarrollar su demostración. Sólo un 5% no

asimila el enunciado clásico a través del promedio muestral, presente en los textos. Un

9,7% no reconoce el teorema para la suma de variables aleatorias independientes e

idénticamente distribuidas, al aplicarlo a un rango de valores para un tamaño muestral

grande. No se ha encontrado investigaciones relacionadas con este ítem.

Tabla 7.4.1.6. Frecuencias y porcentajes de respuestas a distractores en el Item 6(n=134)

Ítem 6. La rapidez con la que la suma de variables aleatorias se aproxima a la distribución normal depende: (contesta cada apartado)

Frecuencias V F

Porcentaje de aciertos

a) De las distribuciones de las v.a. X i 78 56 58,2b) Del tamaño de la muestra n 124 10 92,5c) De los valores de los parámetros 90 44 67,2

Page 280: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

273273

La importancia del ítem 6 (Tabla 7.4.1.3) es que pone en juego la comprensión

intuitiva del teorema y el reconocimiento de las tres componentes que deben

considerarse para una buena aproximación, cualquiera sea la distribución de origen. Un

93% de los estudiantes asume la importancia del tamaño muestral en la precisión de la

aproximación (b), 67% comprende la sensibilidad de los parámetros (c), y un 58%

considera la forma de la distribución poblacional de origen (a). Otra mirada de estos

resultados desde la frecuencia de errores es la siguiente: 42% olvida la importancia del

tipo de distribución (a) y 33% de los valores de los parámetros (c) para la rapidez de la

convergencia. Se puede considerar la opción b) dentro de la propiedad tres de Méndez

y la comprensión de nuestros estudiantes fue mayor que la citada en aquella

investigación.

De acuerdo al esquema de razonamiento de Moreno (2003), se observa un nivel

analítico con un promedio de 72,6% de alumnos que valora la influencia del tamaño

muestral relacionándola con la distribución inicial y los valores de sus parámetros.

Tabla 7.4.1.7. Frecuencias y porcentajes de respuestas a distractores en el Item 7(n=134)

Ítem 7. La aproximación a la normal es bastante buena para valores muy pequeños de n en variables aleatorias con distribución: (contesta cada ítem):

Frecuencias V F

Porcentaje de aciertos

a) Asimétrica 21 113 84,3 b) Simétrica 110 24 82,1 b) Uniforme 97 37 72,4 c) Sesgada 36 98 73,1

El ítem 7 (Tabla 7.4.1.7) evalúa la comprensión de los estudiantes de las

actividades de simulación que han desarrollado a lo largo del proceso de estudio del

teorema. Un 82% de alumnos asimila la convergencia rápida en distribuciones de

probabilidades simétricas y un 72% en el caso particular de la distribución uniforme

discreta o continua. Se puede mencionar, según el esquema ERIE, que una gran parte

del grupo utilizó el razonamiento cuantitativo al considerar dos aspectos relevantes en la

aproximación.

Los errores manifestados fueron los siguientes: Un 27% de estudiantes no

comprendió la dependencia de las formas de las gráficas distribucionales, aunque se

trabajó en clase la forma cómo es afectada la distribución binomial para distintos

valores del parámetro p, mostrando gráficas sesgadas para valores extremos. Más aún,

se compararon las diferencias de cálculo de esperanzas empíricas y teóricas para

muestras pequeñas. Un 16% de estudiantes no comprende que si la distribución de la

Page 281: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

274

población es asimétrica se requerirán muestras de tamaño grande para la aplicación del

teorema.

Tabla 7.4.1.8. Frecuencias y porcentajes de respuestas a distractores en el Item 8 (n=106)

Ítem 8. Responda Verdadero (V) si la proposición es siempre verdadera. En caso contrario justifique sustituyendo las palabras en el casillero Falso para las que hagan siempre verdadera la proposición:

Frecuencias V F

Porcentaje de aciertos

Una distribución muestral describe los valores que tomaría un estadístico en muchas repeticiones de una muestra o de un experimento en las mismas condiciones.

87 19 82,1

El ítem 8 (Tabla 7.4.1.8) evalúa la comprensión de un tópico clásico de un curso

de estadística universitaria: el estudio de muestras aleatorias, que conllevará bajo ciertas

condiciones a la necesidad del estudio del teorema central del límite. Del grupo de 106

alumnos que contestaron el ítem, un 82% comprende y reconoce el objetivo de la

distribución muestral. Una de las respuestas incorrecta asoció esta definición con el

concepto de variable. Un 18% no advierte el estudio de estadísticos obtenidos de

muestras, que incidirá en la comprensión del teorema central del límite y su aplicación

en los contrastes de hipótesis (Vallecillos, 1994).

Tabla 7.4.1.9. Frecuencias y porcentajes de respuestas a distractores en el Item 9 (n=106)

Ítem 9. La desviación estándar de la media muestral aumenta a medida que crece el tamaño de la muestra.

Frecuencias %

Verdadero 46 43,4 Falso (correcto) no justifica 9 8,5 Falso (correcto) justifica correctamente 51 48,1

En el ítem 9 (Tabla 7.4.1.9) un 43% de los estudiantes dio como verdadera la

proposición, siendo incorrecta y por tanto tienen dificultades en la interpretación de la

estimación de la media muestral, como también de la bondad del ajuste de

aproximación. Un 57% respondió falsa (respuesta mayoritaria) es decir, que disminuye

la desviación estándar del promedio muestral al crecer la muestra. Sin embargo, hubo

respuestas con las siguientes argumentaciones erróneas: permanece constante, aumenta

según la variabilidad de los datos, sólo si la muestra es representativa de la población, la

varianza aumenta, no depende del tamaño de la muestra, se aproxima más a la

distribución normal. Este ítem se relaciona con la propiedad dos de Méndez que dice: la

varianza de la distribución muestral es menor que la de la población y también fue

analizada en las investigaciones de delMas y Garfield y Chance (1998).

Page 282: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

275275

Tabla 7.4.1.10. Frecuencias y porcentajes de respuestas a distractores en el Item 10 (n=106)

Ítem 10. Las representaciones gráficas de todas las distribuciones muestrales tienen forma simétrica.

Frecuencias %

Verdadero 30 28,3 Falso (correcto) no justifica 14 13,2 Falso (correcto) justifica correctamente 62 58,5

Los resultados del ítem 10 (Tabla 7.4.1.10) permiten apreciar que un 28% del

grupo curso ha respondido de forma incorrecta (opción Verdadera) y no conciben que

algunos histogramas de las distribuciones muestrales tengan forma asimétrica,

dependiendo de los factores anteriores mencionados. Wayner (1992) enfatiza las

dificultades sobre aspectos de comprensión de gráficos, determinando tres niveles de

preguntas, desde nivel elemental a comprensión profunda de la estructura total de datos.

Esta pregunta corresponde al nivel más alto en esta clasificación.

Tabla 7.4.1.11. Frecuencias y porcentajes de respuestas a distractores en el Item 11 (n=106)

Ítem 11. Responda Verdadero (V) si la proposición es siempre verdadera. En caso contrario justifique sustituyendo las palabras en el casillero Falso para las que hagan siempre verdadera la proposición:

Frecuencias V F

Porcentaje de aciertos

La media muestral tiene una distribución aproximadamente normal cuando nes suficientemente grande, independiente de la forma que tenga la población.

80 26 75,5

Un 72% respondió a la alternativa correcta que es falsa, con varias

argumentaciones; por ejemplo, que puede ser asimétrica, que no ocurre en todas las

distribuciones. También razonan a través de contraejemplos y gráficas realizadas, con

comentarios como: la distribución chi-cuadrado y de Fisher no son simétricas, algunas

distribuciones pueden dar forma exponencial, sólo la normal es simétrica, al aproximar

a la distribución normal tiene forma simétrica, también que se cumple para n 30 y p

cercano a 0,5, sólo cuando n es grande, que depende de su parámetro. Otra

argumentación diferente fue que la distribución uniforme es simétrica para n pequeño.

De los estudiantes participantes del proceso de estudio del teorema, un 76% ha

reconocido de forma general uno de los enunciados del teorema central del límite (Item

11, Tabla 7.4.1.11) y por otra parte, un porcentaje no despreciable de 24% no se ha

familiarizado con este enunciado común en los textos de referencia del curso, que hace

referencia al estadístico clásico y potente de la media muestral. Este ítem evalúa la

propiedad tres de Méndez. Los resultados fueron mejores que los de aquél autor.

Page 283: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

276

Tabla 7.4.1.12. Frecuencias y porcentajes de respuestas a distractores en elItem12 (n=106)

Ítem 12. Responda Verdadero (V) si la proposición es siempre verdadera. En caso contrario justifique sustituyendo las palabras en el casillero Falso para las que hagan siempre verdadera la proposición:

Frecuencias V F

Porcentaje de aciertos

Cuando el estadístico de prueba es t y el número de grados de libertad se hace muy grande, el valor crítico de t está bastante próximo a la normal estándar z.

94 12 88,7

En la Tabla 7.4.1.12 se observa que un 89% de los estudiantes asimiló la bondad

de la convergencia de la distribución t-student, distribución especial e importante en

inferencia estadística, a la distribución normal. Un 11% tiene problemas al no distinguir

los grados de libertad o tamaño de la muestra (valores mayores que 30) que se establece

en las tablas estadísticas para que la aproximación numérica sea muy buena. El ítem 12

se considera un caso particular de la propiedad tres de Méndez. Al igual que el ítem

anterior los resultados fueron mejores en nuestra investigación.

Tabla 7.4.1.13. Frecuencias y porcentajes de respuestas a distractores en el Item 13 (n=106)

Ítem 13.El valor normal estándar se usa para todas las inferencias sobre proporciones de la población.

Frecuencias %

Verdadero 84 79,2Falso (correcto) no justifica 15 14,2 Falso (correcto) justifica correctamente 7 6,6

El ítem 13 sólo fue contestado correctamente por un 21% del estudiantado, que

consideró la afirmación es válida sólo en muestras de tamaño grande. Es alto el

porcentaje que contestó equivocadamente que la distribución normal estándar se usa en

inferencias para cualquier tamaño de muestra sobre la proporción. Esto concuerda con

lo que afirman Hawkins, Joliffe y Glickman (1992) sobre el uso de la tipificación de la

normal estándar en general, donde la dificultad no recae en el cálculo, sino más bien al

considerarla como supuesto en la estimación relacionada imperiosamente con el

teorema central del límite.

Tabla 7.4.1.14. Frecuencias y porcentajes de respuestas a distractores en el Item 14 (n=106)

Ítem 14. El valor esperado de la distribución muestral de las medias muestrales X es igual a la media de la muestra.

Frecuencias %

Verdadero 86 81,1 Falso (correcto) no justifica 6 5,7 Falso (correcto) justifica correctamente 14 13,2

El ítem 14 (Tabla 7.4.1.14) también fue difícil de contestar para los futuros

ingenieros. Sólo un 19% anotó falsa esta proposición, al comparar las medias del

Page 284: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

277277

estadístico y de la población con argumentos tales como: El valor esperado del

promedio muestral es igual a la media poblacional, x ; Ocurre en la distribución

normal; La afirmación debe modificarse, porque no es igual. Hubo otras respuestas no

afortunadas al cambiar en el ítem igual por similar, indicar que se cumple siempre que

sea insesgado o que no siempre se cumple. Un 81% de los estudiantes confunde los

conceptos de parámetro y estadístico obtenidos de las muestras, confusión que ha sido

destacado por Vallecillos (1994) en estudiantes de otras especialidades.

Corresponde también este ítem a la propiedad uno de Méndez: La esperanza de

la distribución muestral de la media muestral es igual a la media de la población, a

medida que el tamaño de la muestra tiende al infinito. Al igual que en la investigación

de Méndez, los estudiantes evidencian una carencia de comprensión intuitiva de la

distribución de la media muestral, no así en el procedimiento formal de esta propiedad.

Comparado con el constructo de población y muestra del esquema ERIE de Moreno

(2203), el razonamiento analítico no fue bien utilizado para diferenciar parámetro y

estadístico, es decir razonaron en el nivel de transición sólo formal y no en el contexto

intuitivo.

Tabla 7.4.1.15. Frecuencias y porcentajes de respuestas a distractores en el Item 15 (n=106)

Ítem 15. La experiencia indica que 50% de todos los estudiantes en un curso cometerán errores de programación, ¿Cuál de estos casos te parece más probable? Indica por qué has elegido esta opción: Frecuencia Porcentaje a) Que entre los próximos 10 estudiantes seleccionados 8 o más cometan errores de programación.

13 12,3

b) Que entre los próximos 100 estudiantes seleccionados 80 o más cometan errores de programación.

12 11,3

c) Las dos cosas anteriores son igual de probables. 81 76,4

En el ítem 15, sólo un 12% de estudiantes acertó en considerar más probable el

caso de muestra más pequeña como la de n=10. Un 76% no diferenció el tamaño de la

muestra en el cálculo de probabilidad, lo que puede justificarse por la heurística de la

representatividad (Kahneman y cols., 1982). También, hubo un 11% que señaló más

probable el evento de cometer error de programación asociada a un tamaño de muestra

grande, resultado que también fue encontrado por Serrano (1996) en su investigación

con futuros profesores. En este ítem las justificaciones fueron diferentes en las tres

opciones. A continuación se describen seis categorizaciones encontradas en los alumnos

y que son los siguientes:

Page 285: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

278

1. A mayor tamaño de muestra disminuye la probabilidad de ocurrencia (Justificación

algebraica correcta). Algunos estudiantes calcularon la probabilidad aproximada

para los dos valores de n (como el ejemplo que se incluye a continuación) en forma

simbólica. Ello supone reconocer la aplicación de la distribución binomial en este

contexto y utilizar el campo de problemas CP1 (aproximación a la binomial),

calcular correctamente la media y varianza de la suma de variables aleatorias

(propiedades P1 y P2), aproximar una distribución discreta por una continua (P7),

usar la transformación algebraica (AP1), tipificar (procedimiento AP2) y calcular

probabilidades con tablas o calculadora (AP3), aplicar la corrección de continuidad

(propiedad P12). Realizan un argumento algebraico y deductivo (A1) mediante el

cálculo correcto de probabilidades y razonan de lo general a lo particular (A2). El

teorema central del límite es aplicable en ambos casos, ya que satisfacen la regla

empírica que np y nq son mayores o iguales a 5 (Walpole y Myers, 1999, pp. 217).

A continuación se muestra un ejemplo:

2. También se registró el desarrollo de la probabilidad mediante la binomial para n

=10 y mediante la aplicación del teorema para n =100. Los elementos de

significado usados serían similares al caso anterior, considerando las propiedades “si

n es grande se puede usar el teorema central del límite” (propiedad P4: la

aproximación de la suma de variables aleatorias mejora para muestras grandes), “la

aproximación de una distribución discreta por una continua” (P7) y “usando la

corrección de continuidad” (P12).

“Si Xi ~ bin (n=10, p=1/2) entonces P(X 8) = 0,055

Si Xi ~ bin (n=100, p=1/2) entonces P(X 79,5) = 9,87×10-10”.

Page 286: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

279279

3. A mayor tamaño de muestra disminuye la probabilidad de ocurrencia (Justificación

algebraica sin usar corrección de continuidad). Varios estudiantes optaron

correctamente por la opción a), pero no aplicaron en el desarrollo algebraico (AP1, AP2

y AP3) la propiedad de corrección de continuidad (P12); al aproximar una variable

discreta con distribución binomial por una variable continua de distribución normal

(P7). Un ejemplo de este tipo de respuesta se muestra a continuación para el caso en que

n=100, usando las propiedades P1 y P2 y mediante las validaciones (A1 y A2).

4. A mayor tamaño de muestra disminuye la probabilidad de ocurrencia (Justificación

algebraica con algún error o bien no la completa). Nueve fueron los alumnos que

intentaron validar su respuesta algebraicamente (A1); algunos quedaron a mitad del

desarrollo, con errores de tipificación (AP2) en la varianza del estadístico de la suma

(P2) y por ende el procedimiento de cálculo de la probabilidad (AP3) es incorrecto. El

siguiente ejemplo muestra el procedimiento algebraico incorrecto sin usar también la

propiedad P12.

5. A mayor tamaño de muestra mayor probabilidad de ocurrencia (Justificación verbal

incorrecta). Algunos alumnos piensan que debido a la convergencia en probabilidad, al

crecer el tamaño muestral, aumentarán las posibilidades de éxito. Algunas respuestas en

esta categoría fueron: Se presenta un ejemplo en que se reconoce el campo CP1 y la

propiedad P4: que la aproximación mejora según aumenta el número de sumandos, pero

obtiene incorrectamente una conclusión (argumento A6).

“Son los dos probables p=1/2, se trata la misma proporción porque a medida que aumentamos

el n la probabilidad referida a la muestra va aumentando”.

Page 287: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

280

6. Heurística de representatividad: No se tiene en cuenta el tamaño de la muestra

(justificación verbal incorrecta). Como se observa en la tabla 7.4.1.16, es alto el

porcentaje de estudiantes que presentaron insensibilidad al tamaño muestral,

considerando que en los dos tamaños muestrales dados el porcentaje de cometer error en

la programación es el mismo. Estas concepciones erróneas fueron principalmente

declaradas de forma verbal, señalando por ejemplo: “El parámetro sigue siendo el

mismo, sólo estamos variando el tamaño de la muestra; son equivalentes ya que sólo se

está multiplicando por un escalar 10”; “No importa el tamaño de la muestra pues el

enunciado habla del 50% del total entonces esta información se puede ocupar para

cualquier muestra”. La solución más frecuente se muestra a continuación, en que no se

reconoce el campo de problema CP1 y se comparan sólo las proporciones. Tampoco se

usan las estrategias, propiedades y argumentos que otorga el teorema en una solución

algebraica aproximada.

“Porque al sacar la proporción de estudiantes en las dos opciones dio el mismo resultado, es

decir, al sacar la probabilidad de que 8 de 10 alumnos cometa errores es 0,8 y la probabilidad

de que 80 de 100 alumnos cometan errores es 0,8”.

Tabla 7.4.1.16. Frecuencias y porcentajes de respuestas a justificaciones en el Item 15

Ítem 15. La experiencia indica que 50% de todos los estudiantes en un curso cometerán errores de programación, ¿Cuál de estos casos te parece más probable? Indica por qué has elegido esta opción: Frecuencia Porcentaje 1. Justificación algebraica correcta usando corrección de continuidad 2 1,92. Justificación algebraica correcta sin usar corrección de continuidad 8 7,53. Justificación algebraica incorrecta 9 8,54. Justificación verbal incorrecta 10 9,4 5. Heurística de representatividad 48 45,3 6. No justifica 29 27,4

Las frecuencias de tipos de justificaciones encontradas en el ítem 15 se

presentan en la tabla 7.4.1.16. Se registraron un 27% de respuestas sin justificación

alguna; de las cuales 23 alumnos eligieron la opción c), 3 la a) y 3 la b). Además, un

54,7% de los 106 alumnos justificaron en palabras, un 17,9% lo hizo mediante

formulación algebraica, de los cuales un 9% tuvo problemas con el desarrollo

algebraico y de las 10 respuestas correctas sólo 2 utilizaron la corrección de

continuidad. Se destaca el alto porcentaje de alumnos que muestran la heurística de la

representatividad, incluso después de la enseñanza formal del teorema central del límite

y de las variadas actividades de simulación.

Page 288: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

281281

7.4.2. RESULTADOS GLOBALES

Para completar el estudio del cuestionario, se presenta en las Figuras 7.4.2.1 a

7.4.2.3 la distribución del número total de respuestas correctas en la primera y segunda

parte y en el total (teniendo en cuenta que el número de alumnos participantes en cada

caso varía). En todos los casos el número medio de respuestas correctas es superior a la

media teórica (mitad de preguntas) y hay normalidad aproximada de las distribuciones.

Ello sugiere un primer criterio de idoneidad cognitiva del proceso de estudio, aunque,

por supuesto, se aprecia una variabilidad en los resultados, oscilando el número de

respuestas correctas en el global de la prueba entre 5 y 19.

Figura 7.4.2.1. Distribución del número de ítems correctos en la primera parte del cuestionario (12 ítems)

Figura 7.4.2.2. Distribución del número de ítems correctos en la segunda parte del cuestionario (8 ítems)

El estudio se complementa con un análisis cluster de la matriz alumnos por

respuestas a los diferentes ítems, con la finalidad de mostrar agrupaciones de preguntas

Page 289: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

282

y de estudiantes. Con frecuencia la clasificación es el primer paso para la comprensión

de un fenómeno complejo, ya que el interés está en determinar, en el conjunto dado,

clases tan diferenciadas como sea posible (Cuadras, 1991).

Figura 7.4.2.3. Distribución del número total de ítems correctos en el cuestionario (20 ítems)

Si con este procedimiento se llega a determinar la existencia de agrupaciones

claramente diferenciadas, se puede lograr un doble objetivo: En primer lugar, las

variables pertenecientes a un mismo grupo, podrían estar midiendo el mismo tipo de

conocimiento, por lo que sería posible prescindir de alguna de ellas o sustituir todo el

grupo por una función de las variables que lo integran. Por otro lado, el número de

grupos claramente diferenciados determina el número de características esencialmente

diferentes, por lo que este método puede ser un paso previo al análisis factorial, que en

este caso no podemos aplicar por ser pequeño el número de alumnos, en relación al

número de variables.

El análisis cluster de variables (respuestas correctas/incorrectas a los ítems),

utilizando como distancia el coeficiente de correlación (aplicable al ser ítems

dicotómicos) y criterio de aglomeración el vecino más próximo, se presenta en la Figura

7.4.2.4. De este modo, al formarse los grupos cada variable se une, en primer lugar con

la que más correlaciona con ella. Cada grupo, una vez formado, se sustituye por su

centro de gravedad y el proceso continúa iterativamente hasta agotar las variables. Se

observa tres grandes grupos de variables, que a su vez se dividen en varios:

Page 290: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

283283

Figura 7.4.2.4. Resultados del análisis cluster de variables

Representatividad

Representatividad

Aproximación binomial

Tipificación media muestral

Influencia n en convergencia

Forma distribuciones muestrales

Convergencia T a normal

Mejor convergencia en centro

Dist. Asintótica media muestral

Enunciados del teorema

No siempre se cumple el TCL

Aproximación d. asimétricas

Aproximación d. simétricas

Efecto parámetros en el TCL

Aproximación d. uniformes

Aproximación d. sesgadas

Concepto distribución muestral

D. típica media muestral

Corrección de continuidad

Valor esperado media muestral

Efecto distribución inicial

Rescaled Distance Cluster Combine

0 5 10 15 20 25

Num +---------+---------+---------+---------+---------+

i15

i15j

i1

i4

i6b

i10

i12

i3

i11

i5

i13

i7a

i7b

i6c

i7c

i7d

i8

i9

i2

i14

i6a

El primer grupo (ítems 15, 15j, 1, 4, 6b, 10, 12, 3, 11) engloba la aproximación

binomial, heurística de representatividad (relacionada con ella), influencia de n y

mejor convergencia en el centro de la distribución. La mayoría de los criterios se

relacionan con el campo de problemas CP1 (Aproximación de la distribución

binomial a la normal). La configuración que podría representar este grupo es de una

comprensión intuitiva del teorema destacada en casos particulares de las

distribuciones binomiales y t-student bajo la condición de bondad de la

convergencia principalmente en el tamaño de la muestra.

El grupo central (ítems 5, 13, 17 a y b, 6c, 7c, 7d) incluye los enunciados del

teorema para la distribución muestral de la suma y el promedio que es alcanzada

por la función densidad normal, condiciones de cumplimiento y aproximación en

ciertos tipos de distribuciones (sesgadas/no, simétricas/no). Al distinguir las

distintas formas del teorema, importancia del estudio paramétrico de las

distribuciones, realizadas en actividades experimentales con ordenador,

relacionamos este grupo con la configuración de simulación utilizada en la

enseñanza.

Page 291: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

284

El último grupo (ítems 8, 9, 2, 14, 6a) se relaciona con el concepto de distribución

muestral, valor esperado y varianza de la media muestral, corrección de continuidad

y el efecto de la distribución de probabilidad inicial. Podemos caracterizar este

grupo en una comprensión formal algebraica del teorema con sus elementos

relacionados.

También se ha realizado un análisis cluster de sujetos, utilizando de nuevo el

vecino más próximo como criterio de aglomeración y como distancia la distancia

euclídea simple. En este caso se usó el algoritmo de k-medias (en lugar del cluster

jerárquico), que permite solicitar un número concreto de grupos y examinar las posibles

diferencias de los mismos en cuanto a las variables. Se probaron diferentes

agrupaciones (número de grupos) con los criterios de que el número de estudiantes por

grupo fuese razonable y que los grupos pudiesen interpretarse en relación al marco

teórico. En la Tabla 7.4.2.1 se presentan los “promedios” (valor típico) de las diferentes

variables para cada grupo, en la Tabla 7.4.2.2 los contrastes Anova de diferencia de

medias por grupo para cada variable y en la Tabla 7.4.2.3 el número de sujetos por

grupo.

Tabla 7.4.2.1. Centros de los conglomerados finales en el análisis cluster de sujetos

3 4 1 2 i1 1 0 1 1 i2 1 1 0 1 i3 1 0 0 1 i4 0 0 1 0 i5 1 0 0 0 i6a 0 1 0 1 i6b 1 1 1 1 i6c 1 1 1 0 i7a 1 1 1 0 i7b 1 1 1 0 i7c 1 1 1 0 i7d 1 1 1 0 i8 1 1 1 1 i9 1 1 0 1 i10 1 1 1 1 i11 1 0 1 1 i12 1 1 1 1 i13 0 0 0 0 i14 0 0 0 0 i15 0 0 0 0 i15j 0 0 0 0 Total 15 12 12 10

Page 292: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

285285

Tabla 7.4.2.2. Resultados de ANOVA (Contraste de diferencia de medias)

Conglomerado Error Media

cuadrática gl Media

cuadrática gl F Sig.

i1 1,104 3 ,215 100 5,131 ,002 i2 1,283 3 ,141 100 9,121 ,000 i3 4,490 3 ,109 100 41,180 ,000 i4 3,585 3 ,141 100 25,459 ,000 i5 ,680 3 ,238 100 2,858 ,041 i6a 1,943 3 ,197 100 9,864 ,000 i6b ,136 3 ,070 100 1,948 ,127 i6c 1,575 3 ,185 100 8,519 ,000 i7a 1,598 3 ,087 100 18,278 ,000 i7b 1,900 3 ,092 100 20,678 ,000 i7c 2,534 3 ,133 100 19,035 ,000 i7d ,763 3 ,186 100 4,098 ,009 i8 ,258 3 ,148 100 1,750 ,162 i9 ,827 3 ,232 100 3,569 ,017 i10 ,831 3 ,189 100 4,410 ,006 i11 1,210 3 ,159 100 7,622 ,000 i12 ,036 3 ,105 100 ,340 ,796 i13 ,587 3 ,156 100 3,765 ,013 i14 ,381 3 ,150 100 2,539 ,061 i15 ,467 3 ,100 100 4,677 ,004 i15j ,091 3 ,088 100 1,040 ,378

Tabla 7.4.2.3. Número de casos en cada conglomerado

1 25,0002 18,0003 38,000

Conglomerado

4 23,000Válidos 104,000Perdidos 32,000

En lo que sigue se interpretan los grupos formados como “Configuraciones

cognitivas” diferenciadas en la comprensión del teorema central del límite en los

estudiantes de la muestra. Los ítems 6b, 8, 9, 12, 13, 14 y 15j no discriminan a los

estudiantes. Todos los grupos presentan la heurística de la representatividad, generalizan

excesivamente el teorema central del límite y confunden las diferentes medias

(muestral, poblacional, valor esperado de la media).

El grupo 3 (38 sujetos) es el que más respuestas correctas dan (15). Manifiesta una

comprensión casi completa del teorema central del límite, aparte de los errores

citados.

El grupo 4 (23 estudiantes) con 12 respuestas correctas se caracteriza por fallar a la

vez en los ítems 1 y 3, correspondientes al campo de problemas CP1 (aproximación

binomial a la normal), donde no ha comprendido bien las condiciones de la

Page 293: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

286

convergencia y la parte del rango de la variable donde hay mejor aproximación. No

relaciona la convergencia de la distribución binomial como un caso particular del

teorema central del límite. También presenta confusión sobre la convergencia de la

media muestral (campo de problemas CP12) y propiedad P3 (distribución de la

media muestral).

El grupo 1 (25 estudiantes) también con 12 respuestas correctas es el único que

realiza correctamente la tipificación de la media muestral. Al igual que el anterior

falla en parte de las propiedades de la convergencia de la distribución binomial,

aunque hace diferentes errores, como el concepto de distribución muestral.

Por último el grupo 2 (18 estudiantes) con sólo 10 respuestas correctas, aunque

parece comprender bien el campo de problemas CP1, tiene errores en la

tipificación, confunde los diferentes enunciados del teorema y las condiciones de

convergencias (diferentes apartados en los ítems 6 y 7).

En consecuencia, se puede diferenciar cuatro niveles de configuraciones

cognitivas:

Alumnos que consideran el problema de aproximación de la distribución binomial a

la normal (CP1) y de la convergencia de la media muestral (CP12) como casos

particulares del teorema central del límite e identifican los diferentes enunciados del

teorema (Grupo 3) y condiciones de convergencia.

Alumnos que no incluyen en el teorema los anteriores campos de problemas, aunque

identifican sus diferentes enunciados y las condiciones de convergencia (Grupos 1 y

4) que se diferencian entre si por errores en algunos conceptos relacionados y en la

correcta /incorrecta tipificación, es decir en algunos errores procedimentales.

Alumnos que, aunque incluyen el caso de la aproximación de la distribución

binomial a la normal (CP1) como un caso particular del teorema, no comprenden

las condiciones de la convergencia y confunden los diferentes enunciados.

7.5. RESULTADOS EN PROBLEMAS ABIERTOS

Para completar la evaluación llevada a cabo con el cuestionario, se incluye en el

mismo dos problemas abiertos que permitirían un análisis más detallado del uso de

argumentos y procedimientos de los alumnos en relación con el teorema central del

límite, los cuales fueron escasamente evaluados en el conjunto de ítems. Asimismo, se

Page 294: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

287287

quería analizar la capacidad de los estudiantes para poner en relación los diversos

elementos de significado en la resolución de estos problemas.

Una vez recogidas las respuestas escritas de los alumnos a los problemas, se

realizó un análisis de contenido de dichas respuestas, deduciendo a partir de los mismos

una serie de variables estadísticas que posteriormente se analizarían. Para llevar a cabo

este análisis de contenido, primero se definió los elementos de significado que podían

aparecer en la resolución de los problemas. Para cada alumno y cada problema,

analizamos si en su resolución el alumno había usado correcta o incorrectamente dicho

elemento de significado, asignando un código a una variable definida para tener en

cuenta dicho elemento. Una vez que realizamos la clasificación de elementos de

significado, se procedió a la codificación de las respuestas de la siguiente manera:

Blanco si el alumno no aplicó el elemento correspondiente;

1 si el alumno lo aplicó de forma correcta;

0 si el alumno lo aplicó de forma incorrecta.

De esta forma, resultaron 15 variables (una por cada elemento de significado

interviniente) en el problema 1 y 22 variables en el problema 2. Se grabaron dos

ficheros de datos, uno correspondiente a cada problema. En lo que sigue se describe los

resultados obtenidos en estos problemas, cuyo contenido se analizó en la sección 7.3.

7.5.1. RESULTADOS EN EL PROBLEMA 1

Problema 1. Construcción de un Cruce. Se supone que X, el número de accidentes por mes en un cruce de carreteras dado, tiene una distribución Poisson con µ=6. Si el número de accidentes durante tres años es mayor o igual de 240, se deberá reconstruir el cruce debido a un programa otorgado por el estado. Aproxime la probabilidad de que el cruce en cuestión sea considerado en el programa de emergencia del estado. Comente el resultado.

En este problema se debe aplicar el teorema central del límite para el caso de la

suma de variables aleatorias discretas independientes idénticamente distribuidas (CP2).

El procedimiento de resolución clásico se basa en un desarrollo algebraico, relacionando

varias propiedades expresadas en forma simbólica; y en que el alumno debe tomar una

decisión situada en la ingeniería civil, basada en la aproximación de la distribución de

Poisson por la normal. Los objetos matemáticos identificados en las respuestas de los

134 alumnos se describen a continuación.

Page 295: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

288

Campos de problemas

Sesenta y un alumnos hacen referencia explícita al teorema para la distribución

de la suma de variables discretas no acotadas idénticamente distribuidas (CP2), ya que

la distribución Poisson, aunque se presenta acotada en las aplicaciones, no lo está

teóricamente. Un ejemplo es el siguiente: “X es el número de accidentes por mes en un

cruce, luego aplicando el principio de variables discretas no acotadas, se puede

normalizar con media y varianza n veces el parámetro de la Poisson”.

El resto de estudiantes que proporciona solución trabajaron mediante la v.a. X

(número de accidentes en un mes) y no definieron la nueva v.a. suma 36

1ii (número

total de accidentes en tres años), como se muestra en el siguiente ejemplo, donde el

alumno divide el número total de accidentes cuya probabilidad se pide entre los 36

meses. Por tanto, estos alumnos no identificaron este problema como uno específico del

teorema central del límite para el campo CP2.

Sea X: número de accidentes por mes en un cruce de carreteras

X~P(µ=6) con aproximación X~N(6,6) y entonces se pide P(X 240/36)=P(X 6,67)

Lenguaje

Un elemento característico del lenguaje usado en las aulas de estadística para

ingenieros son las notaciones y la simbología, incluyendo las expresiones utilizadas en

la formulación del teorema y la descripción de los conceptos relacionados. En este

problema los alumnos, en su mayoría, utilizan símbolos para expresar la distribución de

la suma de v.a., la estandarización a la distribución normal y el cálculo de la

probabilidad de Sn; también para la esperanza y varianza de la suma. En algunos casos

hubo error de notación, utilizando X para la varianza en vez de la media muestral. No

hubo representación gráfica.

Enunciados

Un grupo numeroso de alumnos llega a enunciar explícitamente el teorema

central del límite para la suma de variables aleatorias independientes e idénticamente

distribuidas (E4). Como el número de accidentes en tres años es la suma de una muestra

aleatoria de tamaño 36 (meses) de los valores de la distribución de Poisson, aplicamos

el teorema obteniendo que la suma Sn es aproximada por la distribución normal de

Page 296: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

289289

media y varianza 216. Por ejemplo, un alumno indica “Sn: el nº de accidentes en una

muestra de 36 meses es una variable aleatoria discreta no acotada que puede ser

aproximada por una distribución normal”.

Otros alumnos enuncian correctamente el teorema de forma general (E5), es

decir, sin hacer referencia explícita a que la variable es discreta o de tipo Poisson. Estos

alumnos utilizan el hecho que sea cual sea la distribución de la población, la media

muestral es aproximada por una normal para un n grande. Un ejemplo, es el siguiente,

en que el alumno usa también un procedimiento algebraico correcto (AP1), junto con

una tipificación (AP2) correcta y cálculo de probabilidades correcto (AP3), y enuncia la

forma clásica del teorema, en los textos, para el estimador de la media muestral.

Un ejemplo de enunciados incorrecto del teorema se muestra a continuación,

donde, aparte de no indicar que se requiere una muestra grande, hay error en el

procedimiento de tipificación (AP2) y en la varianza del estadístico (P2):

“Por el teorema se aproxima X~N(µ, 2), así P( X >6

6666,6)”

Otro de los errores presentados fue mezclar los enunciados del teorema para la

suma de variables aleatorias (E4) y para el promedio muestral (E5), como el siguiente

caso, que usa la media de Sn y la varianza de la media muestral, es decir, conlleva un

error en la varianza del estimador (P2):

No se registró ningún enunciado intuitivo del teorema (E6), es decir, usando un

gráfico o recordando algunas actividades hechas en clase.

Page 297: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

290

Procedimientos

Los estudiantes, en general utilizan el cálculo y transformación algebraica de

variables aleatorias (AP1). Fue alta la frecuencia de uso correcto de esta técnica por los

alumnos, así como estandarizar una variable discreta Poisson para aproximar por una

normal (AP2). Asimismo usan el cálculo de probabilidades correctamente, pero sin

considerar la corrección de continuidad (P12), como el ejemplo a continuación:

P(Sn 240) = 1- P(Z <216

216240) = 1- P(Z < 1,63) = 1 – 0,9484 = 0,0516

Otras dificultades en los procedimientos de resolución se derivan del enunciado

incorrecto del teorema para la media muestral (E5), que se traduce en error en la

transformación algebraica. El siguiente ejemplo muestra estos errores en la esperanza y

varianza de la media muestral declarada (P1 y P2), aunque la estandarización sería

correcta (AP2):

Los alumnos en su mayoría realizan bien el cálculo de probabilidades con

calculadora o tabla (AP3); casi no hubo errores en cuanto a la lectura de la tabla

estadística de la distribución normal o el uso de la calculadora. Se observa en el

siguiente caso la correcta aplicación del procedimiento de transformación de la media

muestral, las propiedades P1 y P2, pero con el error de lectura de tabla, con un alto

costo en la decisión equivocada como ingeniero de sugerir que debería ser una prioridad

del estado la construcción del cruce:

Xi: número total de accidentes durante los tres años.

P( Xi 240) = P( X >6,67) = P(Z>6/1

667,6) = P(Z>1,64) = 0,9495

“Respuesta: La probabilidad de que en tres años el número de accidentes sea mayo a 240 es

alto, por lo que cruce en cuestión debería ser considerado en el programa de emergencia del

estado”.

Page 298: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

291291

Otros errores en el algoritmo de resolución fueron debidos a que confunden la

desigualdad mayor o igual por menor o igual, y se equivocan al colocar la varianza por

la desviación estándar de Sn en la estandarización.

Propiedades

Una primera propiedad necesaria para resolver el problema es la media de la

suma de variables aleatorias (P1). La v.a. con distribución Poisson de media y varianza

µ es reproductiva, esto es, la suma de v.a.i. i.d. Poisson continúa siendo Poisson pero de

media y varianza n µ. En el siguiente caso se expresa explícitamente la propiedad y se

calcula correctamente la media de la suma (AP1).

“X~P(µ=6) entonces E(X)=6 , V(X)=6

E( Xi) = 6×36 = 216 y V( Xi) = 6×36 = 2”

Varios alumnos tuvieron dificultades en deducir el valor de la media de la suma,

debido a que no identifican el problema como relacionado con una suma de variables

aleatorias. En lugar de ello, y, como se dijo anteriormente, aplicaron la regla de tres

simple para deducir el número de accidentes en un mes (considerando dicho número

como constante) es de 240/36 = 6,67. Otro de los errores al enunciar el teorema fue

confundir el parámetro µ con el de la distribución exponencial 1/ , con su consecuencia

en el mal cálculo de la media y varianza de la suma (P1 y P2):

“Sn : Xi : número de accidentes en 36 meses. Como n>30 por el teorema central del límite

aproximamos Sn ~ N(n µ , n µ) = N(6,6) donde E(Sn) = n×(1/6) =36×( 1/6) = V(Sn)”

Igualmente se requiere conocer la varianza de la suma de variables aleatorias

(P2). Al igual que la propiedad P1 fue alto el porcentaje de estudiantes que utilizó

correctamente esta propiedad, como se han visto en algunos de los ejemplos anteriores.

Sin embargo, hubo estudiantes que cometieron errores en su aplicación, confundiendo la

varianza de la suma con la varianza de la media, como se ha mostrado en los casos

anteriores.

Se esperaba que algunos estudiantes reconozcan que se puede aproximar la

distribución de Poisson (aproximación de distribuciones clásicas P8) y que la

Page 299: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

292

aproximación será buena bajo las condiciones que el tamaño muestral sea grande y el

parámetro de media sea mayor que 5. No se encontró explícitamente esta respuesta.

Algunos alumnos utilizan la corrección de continuidad (P12), recordando que

esta propiedad se utiliza siempre que se aproxima una variable discreta por una

continua, como es el caso de la Poisson. Como se ha ilustrado anteriormente, gran parte

del grupo resolvió el problema sin considerar esta propiedad. El siguiente alumno

obtiene un resultado de 0,456 al tomar la varianza en vez de la desviación estándar y no

relaciona correctamente la interpretación del valor de probabilidad: “Por la

probabilidad que hemos obtenido hay un 46% de posibilidades que la media se acerque

a 240 accidentes en 3 años, por lo cual es muy probable que se pueda reconstruir el

cruce gracias al programa de emergencia del estado”. Otros usan la corrección de

continuidad, pero sólo calculan la probabilidad de un valor puntual 240 de la suma o

suman y restan 5 en lugar de 0,5, como se ejemplifica en estos dos casos:

También, se usa erradamente la propiedad P12, sumando (en vez de restar) y

obteniendo como límite para calcular la probabilidad 240,5:

“Aplicando corrección de continuidad P(Z6216

2165,240) = P(Z 0,68)”

En otros casos se aplica la corrección al número de días (y no al número de

accidentes), obteniendo 1095 días en tres años en lugar de 36 meses, y calculando la

probabilidad de un accidente en un día p = µ/n = 6/30 = 0,2, obteniendo la esperanza y

varianza respectivamente:

Page 300: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

293293

“La variable X se aproxima a la distribución normal X ~ N(µ= np , 2 = npq) donde

µ = 0,2×1095 =219 y 2 = 175,2. Aplicando corrección de continuidad se tiene

1 - P(Sn<240) = 1 - P(Z<2,175

2195,240) = 1 – P(Z<1,62)= 0,0526”

Un alumno procedió como valor de corrección de restarle 1 a 240:

P(X>239) = 1 – P(X 239) = 1 - P(Z216

216239)

Argumentos

En general, como se ha mostrado en los distintos casos anteriores, hubo poca

argumentación, limitándose los alumnos a realizar un razonamiento algebraico

deductivo mediante simbolización, con escasa expresión verbal.

Algunos alumnos llegan explícitamente a una conclusión, tomando una decisión

sobre la necesidad de construir un puente, en base a resultados del teorema (A6).

Ejemplo: “La probabilidad de que en el cruce se produzcan por lo menos 240

accidentes en tres años es muy baja (5,16%), por lo que creo no será considerado en el

programa de emergencia”. Muchos alumnos sencillamente calcularon la probabilidad,

pero no interpretaron el resultado de esta probabilidad pequeña para la toma de una

decisión, por ejemplo:

“La probabilidad de que el cruce en cuestión sea considerado en el programa de emergencia es

de un 5,48%”

Un error conceptual de algunos alumnos, que dificultó la toma de decisión fue

considerar la probabilidad de ocurrencia 0,0516 del evento alta: “Se podría construir ya

que es alta la probabilidad de accidentes en los tres años”. Otros argumentos fallan

porque no llegan a la probabilidad correcta, por ejemplo un alumno obtuvo un resultado

de 0,7967, sin embargo la conclusión es correcta: “tiene una importancia alta alrededor

del 80% de prioridad para el estado”. Otros valores mal calculados fueron 0,09259 y

0,0084 al no aplicar bien la propiedad P12, y 0,0 al calcular mal la media y varianza. El

siguiente alumno confunde el tamaño muestral con el recorrido de la variable suma,

usando n = 240 en lugar de los 36 meses, además de equivocarse en la tipificación

(AP2) al considerar la varianza en lugar de la desviación estándar:

Page 301: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

294

“Si X ~ P(µ=6) aproximamos X N(µ, µ) y entonces Xi N(nµ , nµ) es decir,

Sn = Xi N(240×6 , 240×6) = N(1440 , 1440). Para determinar si el cruce es considerado en

el programa de emergencia debemos calcular:

P( Xi > 240) =1 - P(Z<1440

1440240) = 1 – P(Z<-0,83)= 1- 0,2033 = 0,7967”

“La probabilidad de que se active el programa de emergencia es de un 80% ya que su esperanza

es de 1440 accidentes, entonces supera los 240 que se tienen como mínimo”

No hubo justificaciones razonando de lo general a lo particular (A2), aunque la

situación típica en los textos es argumentar el teorema basado en la aproximación

binomial, que es válida para la distribución Poisson.

La Tabla 7.5.1.1 muestra los resultados obtenidos. Sólo la mitad de los alumnos,

aproximadamente reconocen explícitamente el campo de problemas CP2.3, suma de

variables aleatorias discretas no acotadas y hace referencia explícita al mismo, la

mayoría de ellos correctamente. El resto, como hemos dicho, trabaja directamente con

la distribución de Poisson, calculando la probabilidad de un número de accidentes en un

mes.

Tabla 7.5.1.1. Frecuencias (y porcentajes) de elementos de significado del problema 1 (n=134)

Elementos usados Incorrecto Correcto Campos de problemas

CP2.3: Variables aleatorias discretas no acotadas 6 (4,5) 61 (45,5) Lenguaje

Términos Símbolos

0 (0,0) 34 (25,4)

40 (29,9) 89 (66,4)

Procedimientos

AP1: Cálculo algebraico AP2: Tipificación, destipificación AP3: Cálculo probabilidades (calculadoras, tablas)

0 (0,0) 36 (27,9) 30 (22,4)

126 (94,0) 90 (67,2) 95 (70,9)

Enunciados

E4: Enunciado del teorema para la suma de variables independientes idénticamente distribuidas

E5: Enunciado del teorema de forma general

46 (34,3)

8 (6,0)

54 (40,3)

6 (4,5) Propiedades

P1: Media de la distribución de una suma de variables aleatorias P2: Varianza de la distribución de la suma de variables aleatorias P3: Distribución de la media aritmética de una muestra aleatoria de tamaño

suficientemente grande P8: Aproximación de algunas distribuciones clásicas a la distribución normal P12: Corrección de continuidad

18 (13,4) 35 (26,1) 7 (5,2)

0 (0,0) 17 (12,7)

109 (81,3) 92 (68,7) 5 (3,7)

0 (0,0) 44 (32,8)

Argumentos

A1: Demostraciones formales algebraicas y/ o deductivasA6: Obtener una conclusión o tomar una decisión en base al teorema

88 (65,7) 63 (47,0)

35 (26,1) 50 (37,3)

Page 302: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

295295

La mayoría usa el lenguaje simbólico, aunque una cuarta parte de los estudiantes

comete algún error en la simbolización, confundiendo la expresión simbólica de algunos

conceptos (por ejemplo, varianza); son muchos menos los que usan expresiones

verbales, aunque todos ellos correctamente. Debido a que el problema requiere de un

algoritmo de resolución algebraica y simbólica, la mayoría lo usa, y todos ellos

correctamente. Un 67% aplicó el procedimiento de tipificación /destipificación

correctamente y un 28% tuvo errores, generalmente en la varianza del estimador o al

invertir la tipificación. El cálculo de probabilidades con tabla y calculadora es

generalmente correcto, con algunos errores en la lectura de tablas.

Sin embargo, pocos alumnos llegaron a la solución correcta, utilizando la

corrección de continuidad; un 26% calculó bien la probabilidad de Sn, aplicando P1, P2,

P12, AP1, AP2 y AP3. Gran parte del alumnado intentó aplicar los algoritmos descritos,

se registraron errores en el cálculo adecuado de la probabilidad, ya sea por no

estandarizar bien la suma o no usar la corrección de continuidad (ver ejemplos descritos

en procedimientos). En particular, un 28% tuvo dificultades con la tipificación y un

22% con el uso de tablas estadísticas.

En cuanto a la forma de presentar el teorema, el enunciado más empleado por los

estudiantes es el de la suma de v.a.i..i.d., donde un 40% lo especificaron correctamente,

aunque no todos escribieron que la muestra es grande mayor que 30; sólo lo hicieron 14

alumnos de 54. Fueron 14 los estudiantes que declararon un enunciado de forma general

del teorema, mediante la media muestral; de los cuales sólo 6 (4,5%) lo escribieron

correctamente.

Las propiedades que consideramos fueron aceptadas en un número importante

por los alumnos, el cálculo de la media y la varianza de la suma con aciertos de 81% y

69% respectivamente. Al utilizar la técnica de estandarización se registraron errores de

un 13% al calcular la esperanza de Sn y de 26% en la varianza. Por otro lado, un tercio

del grupo aplicó correctamente la corrección de continuidad y un 13% que lo aplicó lo

hizo incorrectamente (ver los ejemplos en P12). Cabe destacar que fue alto el número de

estudiantes que no consideró esta propiedad (54,5%). Es destacable mencionar que

ninguno del grupo haya señalado que estamos en la presencia de una aproximación de

distribuciones clásicas por la norma. Para este punto vimos en la lección 2 del Capítulo

5 que se aplica el teorema en la distribución Poisson para valores grandes de n y sobre

todo se muestra una convergencia razonable a partir del valor del parámetro µ de media

mayor que 5, que en este caso es µ = 6.

Page 303: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

296

Los argumentos utilizados para justificar sus respuestas a este problema han

sido el deductivo, con muchos errores y también a través de una conclusión a partir del

valor calculado aproximado de la probabilidad de la suma de v.a. y tomar una decisión

frente a situaciones en el campo de la ingeniería; hubo un 37% que respondió

acertadamente al problema de cruce de carreteras. Siendo un elemento de significado

importante para evaluar las decisiones de un ingeniero, un 47% no concluyó en esta

situación, ya sea por cálculos erróneos o desconocer el significado e interpretación de la

probabilidad de variables aleatorias.

En resumen, el análisis de los elementos usados al resolver esta situación nos

señala que la mayoría de los estudiantes ha identificado y dominado el procedimiento de

transformar el estadístico de la suma que proviene de una muestra aleatoria de

población Poisson a una estandarización normal con el cálculo correcto de los nuevos

parámetros de media y varianza, observándose poca cantidad de errores. Sin embargo,

solo una parte identifica el campo de problema y hace alusión explícita al teorema y sus

condiciones de aplicación.

También se nota una falta de rigurosidad en sus justificaciones deductivas, la

especificación de las condiciones de uso del teorema central del límite en esta

distribución clásica, la notación de la suma de v.a. y la notación simbólica de los

muchos elementos que incorpora el teorema. A diferencia del caso de la distribución

binomial, no ha sido internalizado en los alumnos que en las v.a. discretas con

distribución Poisson aproximadas por v.a. con distribución continua se debe utilizar la

corrección de continuidad. Más aún, fue bajo el porcentaje de cálculo correcto de la

probabilidad y su interpretación, fundamental para la toma de decisiones de un futuro

ingeniero.

A objeto de resumir con una medida el número de elementos de significados del

teorema correctamente aprendido por los estudiantes (entre los 15 posibles identificados

en la solución normativa del enunciado), se presenta a continuación un estudio de las

diferencias entre elementos usados correcta e incorrectamente.

Se observa en el gráfico de caja (Figura 7.5.1.1.) que el número de elementos

correctamente utilizados por alumno en la solución varía de 0 a 12, mientras que para el

número de elementos incorrectamente utilizados va de 0 a 8, siendo también mayor el

rango de variación y el número máximo de elementos correctamente utilizados.

También se destaca la superioridad de los cuartiles correspondientes a los elementos

correctos en el 50% central de la distribución y la mediana en relación a las respuestas

Page 304: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

297297

incorrectas. También, la figura da cuenta que las medias poblacionales de puntuaciones

totales de elementos correctos e incorrectos podrían ser distintas ya que no se produce

un traslape de la información central.

Figura 7.5.1.1. Número de elementos correcta e incorrectamente usados en el problema 1

En la Tabla 7.5.1.2 se presentan los estadísticos del número de elementos de

significado del teorema correcto e incorrecto en el problema 1, analizando la diferencia

entre los 134 alumnos participantes. Se observa que el número promedio de respuestas

correctas supera el doble de las respuestas incorrectas, con una media de 6 a 7

elementos de significados por alumno y 2-3 incorrectos de los 15 elementos analizados

en la Tabla 7.5.1.1, siendo ambas de respuestas heterogéneas con coeficientes de

variación 49,6% y 72,9% respectivamente.

Tabla 7.5.1.2. Estadísticos del número de elementos correctos e incorrectos en el problema 1 (n=134)

Media Desviación típ.

Error típ. de la media

Correctos 6,6866 3,31871 ,28669 Incorrectos 2,8955 2,11073 ,18234

Los resultados anteriores nos permiten inferir un contraste T de diferencias de

medias en muestras relacionadas, cuyos resultados se muestran en la Tabla 7.5.1.3 cuya

significación es 0,000 y calculamos el intervalo de confianza del 95% de confianza para

la diferencia de medias en muestras relacionadas. Se puede apreciar que la diferencia

promedio entre respuestas correctas e incorrectas por alumno es altamente significativa,

con un intervalo de confianza dentro de los valores positivos entre 2,9 y 4,6; lo cual

permite rechazar la hipótesis de igualdad de las medias. Ello indica que los alumnos en

Page 305: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

298

su conjunto utilizan más elementos de significado correctamente que incorrectamente en

la resolución de este problema.

Tabla 7.5.1.3. Contraste e intervalo de confianza de la diferencia de elementos correcto e incorrecto en el problema 1

Diferencias relacionadas t gl Sig. Media diferencia Desviación típ. Error típico 95% Intervalo de confianza

Inferior Superior 3,79104 4,98581 ,43071 2,93912 4,64297 8,802 133 ,000

7.5.2. RESULTADOS EN EL PROBLEMA 2

Problema 2. Sondeo político. Suponga que la proporción de votantes rurales de cierto estado, a favor de un candidato a diputado es 0,45 y la proporción de votantes urbanos que están a favor del mismo candidato es 0,60. Si se obtiene una muestra de 200 votantes rurales y 300 votantes urbanos, ¿cuál es la probabilidad aproximada de que por lo menos 250 de estos votantes estén a favor de este candidato?

Este problema se espera un desarrollo con cálculo de probabilidades, notación

simbólica, uso de la distribución binomial y que se conjugue dos muestras aleatorias de

distintos tamaños. Se obtuvieron las siguientes respuestas en un total de 106 estudiantes:

Campos de problemas

El problema corresponde a Obtener una aproximación de la distribución

binomial para valores grandes de n (CP1) o bien Determinar la distribución

aproximada de la suma de variables aleatorias discretas acotadas idénticamente

distribuidas (CP2.2).

No hubo referencia explícita de ninguno de los dos campos señalados por los

estudiantes, aunque aproximadamente 30% de alumnos hace una identificación

implícita a cada uno de estos campos (aplicando el teorema sin explicitarlo). Una cuarta

parte, aproximadamente de los que usan implícitamente el campo CP1 lo hace

incorrectamente y también la mitad de los que usan implícitamente el campo CP2.

Algunos alumnos no utilizan el teorema, sino que obtienen una solución exacta

por medio de la distribución hipergeométrica, haciendo uso de la propiedad P8.

Un 29,3% se equivocó en plantear la situación por los campos CP10 (diferencia

de dos poblaciones, en lugar de la suma) y CP12 (distribución de la media muestral),

aunque luego, en muchos casos, se realiza correctamente la transformación algebraica

al obtener la distribución de promedios muestrales o el estadístico de la diferencia de

Page 306: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

299299

proporciones muestrales dada en intervalos de confianza. Un ejemplo es el siguiente, en

que también se incurre en el error de tomar la probabilidad de que una persona vote a

ese candidato como 0,5 y no la probabilidad dada en el problema, utilizando así mal las

propiedades P1 y P2:

“Como n1 >30 y n2 >30 se utiliza el teorema central del límite, en que la probabilidad de que

una persona elija al diputado es 0,5. Luego, n1× p =200×0,5=100 y n2× p =300×0,5=150”

Lenguaje

El lenguaje utilizado por el alumno en este problema es generalmente

algebraico, mediante la simbología y notaciones, así como expresiones verbales,

generalmente correctas, y utilizadas para describir las variables, distribuciones y sus

parámetros. En general no trabajan con la notación de la sumatoria, sino más bien como

una variable, en cada caso, del sector rural o urbano. Se encontró en algunos casos la

falta de rigurosidad en las notaciones y simbología y, generalmente, intentan enunciar el

teorema mediante una sola variable aleatoria y no como suma de variables Bernoulli.

Enunciados

Se esperaba que los alumnos enunciasen el teorema central del límite para la

suma de variables aleatorias independientes e idénticamente distribuidas (E4), de forma

general (E5) o bien diesen un enunciado intuitivo general (E6). Muy pocos comenzaron

a resolver el problema explicitando la distribución binomial como suma de variables

aleatorias independientes Bernoulli, lo que dificulta la aplicación del teorema a este

caso particular. El siguiente ejemplo, es un caso donde el alumno identifica

correctamente el enunciado E4 y muestra como la rigurosidad al describir las variables

favorece el planteamiento y cálculo de la probabilidad de la suma:

X1 =1 si el votante rural está a favor del diputado, y 0 en caso contrario; X1 ~ bernoulli(p=0,45)

X1 = Sn1 : número de votantes rurales a favor del diputado; Sn1 ~ Bin(n=200, p=0,45)

E (Sn1 ) = n1× p =200×0,45=90 y V (Sn1 ) = n1× p×(1-p) =200×0,45×0,55=49,5

De igual forma se procede para X2 .

La definición sistemática de las variables aleatorias observadas como Bernoulli,

conduce a definir la suma de variables, identificar su suma y varianza (P1, P2) y a

Page 307: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

300

plantear la aproximación normal de la variable suma, por tanto, al campo de problemas

CP1 (aproximación normal a binomial) y el enunciado E4.

El siguiente caso formula el problema sólo en base a la distribución binomial.

Aunque usa correctamente las propiedades P1 y P2, así como el argumento A1 y la

notación algebraica, no llega a concluir el problema.

Muy pocos enunciados explícitos del teorema se encontraron en su forma

general E5 (es decir la formulación del teorema para la media muestral cuando la

muestra de tamaño 500 es grande), y casi todos incorrectos. Lo que sí se observó en los

procedimientos de resolución fue mezclar los enunciados de la suma (E4) con el del

promedio muestral (E5), al definir y calcular la distribución para la suma, pero

planteando la probabilidad para la media muestral, como se muestra a continuación:

P( X >250) = P(Z>725,49

270250)

Se registró el enunciado intuitivo del teorema (E6), en que los alumnos indican

que utilizan la aproximación debido a que la muestra es de tamaño suficientemente

grande, y por tanto recuerdan la aplicación del teorema mostrada gráficamente en las

actividades de aula y/o de los ejercicios de simulación manipulativa.

Procedimientos

Se usa en forma generalizada el cálculo y transformación algebraica de variables

aleatorias (AP1), así como la tipificación /destipificación (AP2). Cerca de dos terceras

partes del grupo trabajaron la técnica de tipificación, aunque no alcanzó al 50% de uso

correcto. Hubo dificultades en las estrategias de resolución. Por ejemplo, un alumno usa

correctamente la propiedad P1 (media de la suma de variables) y P2 (varianza de la

Page 308: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

301301

suma de variables), pero al tipificar usa la varianza de la media, en lugar de la varianza

de la suma. Hay por tanto un error en AP2, al estandarizar la variable y un error al

mezclar los enunciados E4 y E5.

Otro de los errores detectados por algunos alumnos fue confundir el número de

votantes con la v.a. proporción de votantes rurales X1 o urbanos X2, que luego se

estandariza correctamente usando la suma y varianza de la diferencia de proporciones

muestrales; que los alumnos conocen de cálculos de intervalos de confianza. Un

ejemplo es el siguiente, donde el alumno estandariza bien, y también hace un cálculo

algebraico correcto (AP1, AP2), pero tiene un error en la definición de la variable suma;

es decir, confunde el campo de problemas CP1 con el CP2.

5,0

300

4,0*6,0

200

55,0*45,0

)45,06,0()ˆˆ(1250

)()ˆˆ( 21

2

22

1

11

2121 ppP

n

qp

n

qp

ppppP

El siguiente ejemplo presenta una solución que relaciona equivocadamente el

problema con la diferencia de medias poblacionales en la construcción de intervalos de

confianza (CP10: Distribución de diferencias de medias muestrales en dos poblaciones).

Es decir, hay una confusión de campo de problemas, aunque el alumno aplica

correctamente una serie de propiedades (P1, P2) y procedimientos (AP1, AP2), así

como la notación y también hace referencia explícita a un enunciado general del

teorema central del límite (E5):

Los pocos errores en cuanto a la lectura de la tabla estadística de la distribución

normal y uso de la calculadora se presentaron al confundir la desigualdad mayor por

menor obteniendo en el cálculo de la probabilidad de 0,0314. También, al leer 0,352 en

Page 309: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

302

la distribución normal para un área menor de -1,81 en vez de 0,0352; que conlleva a una

probabilidad mal calculada:

1 - P(Z < 5,121

270250) = 1 - P(Z < -1,81 ) = 1 – 0,352 = 0,648

Finalmente los estudiantes realizan el cálculo correcto de los promedios

muestrales o de una suma de variables (A1, argumento algebraico). Un caso de

aplicación correcta de este procedimiento se muestra para la suma de dos variables

aproximadas normales que provienen de poblaciones binomiales de distintos

parámetros, en que utilizan bien los algoritmos AP1, AP2 y AP3 y la propiedad de

corrección de continuidad P12:

Propiedades

Las propiedades más ampliamente usadas han sido el cálculo de estadísticos.

Respecto al cálculo de la media de la suma de variables aleatorias (P1) los estudiantes

calculan la esperanza de la suma de dos variables con distribución binomial resultando

un valor de 270. Una forma alternativa y correcta de calcular la esperanza (P1) y

varianza (P2) es utilizando la proporción ponderada PT = (n1×p1+ n2×p2)/ (n1+ n2) =

0,54 obteniendo un valor 0,9633 de probabilidad, como se muestra a continuación.

Respecto al cálculo de la varianza de la suma de variables aleatorias (P2), uno de

Page 310: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

303303

los errores presentados al trabajar con la proporción fue no usar el tamaño total de la

muestra n = 500.

Hubo estudiantes que, al enunciar el teorema, no explicitan que la muestra es lo

suficientemente grande para aplicarlo (uso incorrecto de la propiedad P4: la

aproximación mejora con el número de sumandos) y también en la notación

correspondiente a la distribución normal, reemplazan con la notación de la binomial

(uso incorrecto de símbolos), como se muestra en este caso que, sin embargo, está bien

desarrollado (AP1, AP2, AP3) e incluso considera la corrección de continuidad (P12):

pR =0,45 , nR =200 , XR bin (90,49,5) y pU =0,6 , nU =300 , XU bin (180,72)

Así, XR +XU bin (µR +µU , 2R + 2

U ) y P(XR +XU 249,5) = 1 – 0,0314 = 0,968

Otros estudiantes cometieron errores al estandarizar la variable suma, al

considerar erradamente la varianza pq/n del estimador de la proporción poblacional.

El siguiente ejemplo, transforma el problema en otro sobre una v.a. discreta

acotada de sólo dos valores 200 y 300 con probabilidades 0,45 y 0,60 respectivamente

(error en CP2). La función de probabilidad de la variable se define equivocadamente:

Proporción de votantes de cierto estado a favor de un candidato. El estudiante incurre en

dos errores: Que no se cumple el axioma de que la suma de las probabilidades debe ser

1 y que obtiene una varianza negativa (error en P2):

Otra propiedad usada es la aproximación de la distribución binomial por la

normal (P7, aproximación de una distribución discreta por una continua). En este caso

la aproximación será buena, bajo las condiciones de que los productos np y nq sean

mayores que 5. No se registraron respuestas que indiquen estas condiciones, aunque son

muchos los alumnos que indican implícitamente la aproximación normal. Hubo dos

alumnos que trataron el problema con el modelo de la distribución hipergeométrica,

como se muestra para la variable definida X1: número de votantes rurales a favor del

Page 311: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

304

candidato e indican explícitamente la aproximación normal (P8).

X1 ~ H (N, n, r) y se tiene p = 90/200 = 0,45. Debido a que n es mayor que 30 utilizamos el

teorema obteniendo la media µ =n r/N = n p =10×0,45 40,5 y la varianza npq = 90×0,45×0,55

=22,28. Por lo tanto X1 ~ N(40,5 , 22,28)

Pocos alumnos utilizan la corrección de continuidad (P12). Un caso de no usar

esta propiedad se presenta a continuación, obteniendo un valor de probabilidad de

0,9641 en vez de 0,9686.

1 – P(X<250) = 1 - P(x

< 5,121

270250) = 1 - P(Z < -1,81 ) = 1 – 0,0359 = 0,9641

Se observaron en relación a esta propiedad varios tipos de errores, como

aplicarla a todo un intervalo:

Otros tomaron la corrección de continuidad del valor 250 sumándole 0,5 en

lugar de restar y obteniendo un valor de probabilidad de P(X 250,5) = 0,9616.

Argumentos

Al igual que en el problema 1, el argumento más común es el deductivo y

algebraico (A1). También se razona de lo general a lo particular (A2), aunque la

aproximación binomial como caso especial del teorema no fue explicada; hubo

validaciones erróneas asociadas por ejemplo: “como el n es grande utilizamos el

siguiente estadístico de la normal para la proporción” y luego calculaban la

probabilidad pedida.

Otros alumnos obtienen una conclusión o toman una decisión en base a

resultados del teorema (A6). En este problema no se pide que comente la solución, por

tanto el único comentario es que “La probabilidad aproximada de que por lo menos 250

votos estén a favor del candidato es del 96%”.

Page 312: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

305305

En resumen, se obtuvieron, con distintos procedimientos y propiedades mal

utilizadas, variados valores de probabilidad calculados desde 0, 0,0314, 0,195, 0,4128,

0,5219, 0,648, 0,8078, 0,8106, 0,993, 1 a valores 0,9616, 0,9633, 0,9772 muy próximos

a la solución. Estos resultados indican las dificultades de comprensión del teorema,

incluso después de un periodo de enseñanza dilatado (seis semanas). Asimismo, indica

las dificultades a las que puede enfrentar un ingeniero en una situación donde debe de

tomar decisiones en base al pensamiento estocástico. El siguiente ejemplo lo demuestra,

el alumno plantea el teorema para la diferencia de variables con distribuciones

aproximadas normales, en lugar de utilizar la suma, y aunque usa bien las propiedades

P12 y P2, obtiene equivocadamente la esperanza con resultado de probabilidad cero.

Esto implicaría un pronóstico de que el candidato prácticamente no tiene posibilidad de

ganar una elección.

La Tabla 7.5.2.1 muestra los resultados de los elementos de significado

aplicados correcta e incorrectamente. Se observa un uso escaso de uno de los dos

campos de problemas del teorema previstos: Aproximación de la suma de variables

aleatorias discretas acotadas (15,5%) o aproximación de la distribución binomial

(26,4%). Aproximadamente un tercio del grupo sitúa mal el problema, un 24% lo

plantea para el estadístico de diferencias de proporciones en intervalos de confianza y

un 6% por diferencia o suma de promedios muestrales.

Los algoritmos de resolución algebraica alcanzaron el 59% de aciertos; un 43%

aplicó bien el procedimiento de transformación de la suma de v.a. y un 53% del grupo

utilizó correctamente la calculadora y tabla estadística en el cálculo de probabilidad.

Hubo un 37% de error en la tipificación de las dos variables con distribución binomial o

consideradas como variables aleatorias. Por otro lado, un 42% utiliza el lenguaje ya sea

Page 313: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

306

en palabra o por símbolos, donde destaca un 42,5% de error en expresar correctamente

la simbología pertinente al problema.

En cuanto a la forma de presentar el teorema, el enunciado mejor empleado por

los estudiantes fue el de la suma de v.a.i..i.d. con distribución aproximada normal de

media 270 y varianza 121,5, donde un 28% lo especificaron, y un 20% escribieron que

la muestra es bastante grande; sólo un caso describió el teorema mediante promedios

muestrales.

Tabla 7.5.2.1. Frecuencias (y porcentajes) de elementos de significado del problema 2 (n=106)

Elementos usados Incorrecto Correcto Campos de problemas

CP1: Obtener una aproximación de la dist. binomial para valores grandes de n CP2: Determinar la distribución de la suma de variables aleatorias discretas

idénticamente distribuidas CP10: Obtener la distribución de diferencias de medias muestrales en dos

poblaciones CP12: Estimar por intervalos de confianza de la media y otros parámetros para

muestras grandes

6 (5,7) 18 (17,0)

6 (5,7)

25 (23,6)

28 (26,4) 16 (15,5)

0 (0,0)

0 (0,0)

Lenguaje

Términos Simbólico

8 (7,5) 45 (42,5)

45 (42,5) 44 (41,5)

Procedimientos

AP1: Cálculo algebraico y transformación de variables aleatorias AP2: Tipificación / Destipificación AP3: Cálculo de probabilidades con calculadora o tablas estadísticas

40 (37,7) 39 (36,8) 12 (11,3)

62 (58,5) 45 (42,5) 56 (52,8)

Enunciados

E4: Enunciado del teorema para la suma de variables independientes idénticamente distribuidas

E5: Enunciado del teorema de forma general E6: Enunciado intuitivo del teorema

4 (3,8)

6 (5,7) 25 (23,6)

30 (28,3)

1 (0,9) 21 (19,8)

Propiedades

P1: Media de la distribución de una suma de variables aleatorias P2: Varianza de la distribución de la suma de variables aleatorias P3: La media aritmética de una muestra aleatoria de tamaño suficientemente

grande sigue una distribución aproximadamente normal P4: La aproximación mejora con el número de sumandos P7: Aproximación de una distribución discreta por una continua P8. Aproximación de algunas distribuciones clásicas a la distribución normalP12: Corrección de continuidad

18 (17,0) 34 (32,1) 4 (3,8)

0 (0,0) 7 (6,6) 3 (2,8) 9 (8,5)

59 (55,7) 45 (42,5) 1 (0,9)

26 (24,5) 24 (22,6) 0 (0,0)

14 (13,2) Argumentos

A1: Demostraciones formales algebraicas y/ o deductivas A2: Presentación del teorema como caso especial de un resultado general A6: Obtener una conclusión o tomar una decisión en base al teorema

40 (37,7) 0 (0,0) 9 (8,5)

34 (32,1) 0 (0,0)

48 (45,3)

Las propiedades que se utilizaron aproximadamente la mitad del grupo de

alumnos fueron el cálculo de la media y la varianza de la suma de variables aleatorias

con aciertos de 56% y 43% respectivamente. Se observó en general al utilizar la técnica

de tipificación un 17% de errores al calcular la esperanza de la suma y de 32% en la

varianza. Cabe señalar que un 23% del grupo haya señalado que estamos en la presencia

Page 314: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

307307

de la aproximación la distribución clásica de la binomial por la normal. Por otro lado,

fue escaso el número de estudiantes que consideró la propiedad de corrección de

continuidad; tan solo un 13% aplicó correctamente la corrección de continuidad y un

9% lo hizo incorrectamente (ver las dificultades en los ejemplos presentados en P12).

El argumento mejor descrito para justificar sus respuestas a este problema ha

sido a través de una conclusión simple a partir del valor calculado aproximado de la

probabilidad de la suma de v.a. y tomar una decisión frente a situaciones en el campo de

la ingeniería; hubo un 45% que escribió acertadamente el resultado de la probabilidad.

Además, un 32% del grupo justificó adecuadamente en forma algebraica,

utilizando la corrección de continuidad P12 y aplicando propiedades P1, P2 y las

técnicas AP1, AP2 y AP3. De los errores, hubo un 38% debido a cálculos incompletos o

equivocados. No se registró argumento de enunciar el teorema como caso especial de un

resultado general dando las condiciones de aproximación binomial por la normal.

En resumen, este problema ha resultado difícil para los estudiantes, como se ha

mostrado a lo largo del análisis de las respuestas; de los alumnos que han intentado

plantear esta situación, han dominado la estrategia de transformación algebraica con el

buen uso de las propiedades señaladas. Sin embargo, constatamos debilidades

importantes en la declaración de las variables involucradas, la justificación de las

condiciones de uso del teorema central del límite en la distribución binomial, la

aplicación de la corrección de continuidad y la inexactitud en el cálculo correcto de la

probabilidad, cuya precisión en los análisis de datos es importante en las conclusiones

de un ingeniero.

En cuanto a la diferencia entre el número de elementos de significado correcta e

incorrectamente empleados por los alumnos al resolver el problema 2, el análisis indica

una discrepancia respecto a los resultados de aplicación del teorema para esta situación.

En la Figura 7.5.2.1 se aprecia la dispersión y medidas de los cuartiles del número de

elementos correctos e incorrectos en las respuestas de cada alumno. Se observa que el

número de elementos correctos es mayor que el número de elementos incorrectos,

manifestado en el recorrido de los elementos correctos que va de 0 a 14, mientras que

para los incorrectos varía de 0 a 10. También, la mediana es visiblemente superior, al

igual que el 50% central de puntuación total; de elementos de significados correctos

comprendido en el intervalo (1; 10), y el intervalo (1; 5) para los elementos incorrectos.

Lo que no se aprecia claramente es si los parámetros de medias de las puntuaciones

correctas e incorrectas pueden o no ser iguales.

Page 315: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

308

Figura 7.5.2.1. Número de elementos correcta e incorrectamente usados en el problema 2

Lo anterior, es reforzado por el resumen de los estadísticos de posición y

dispersión establecidos en la Tabla 7.5.2.2. Se muestra que la media de elementos

adquiridos correctamente por los alumnos es mayor al de elementos incorrectos, además

con coeficientes de variación en las dos distribuciones muy similares (81,6% y 84,7%

respectivamente).

Tabla 7.5.2.2. Estadísticos del número de elementos correctos e incorrectos en el problema 2

Media N Desviación típ. Error típ. de la media P2 Correcto 5,7212 104 4,66854 ,45779 P2 Incorrecto 3,3558 104 2,84184 ,27867

Para un estudio formal de las afirmaciones anteriores se realizó un contraste de

hipótesis de la diferencia entre puntuaciones medias de elementos correcto e incorrecto

para muestras relacionadas, obteniendo un resultado altamente significativo (valor de

probabilidad 0,001). El intervalo de confianza para la diferencia de medias tiene unos

límites comprendidos entre 1,05 y 3,68, indicando que se espera que los estudiantes

contesten correctamente entre 1 y 4 elementos de significados del teorema central del

límite más que el número de errores no adquiridos de los elementos establecidos en

Tabla 7.5.2.1.

Page 316: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

309309

Tabla 7.5.2.3. Contraste e intervalo de confianza de la diferencia de elementos correcto e incorrecto en el problema 2

Diferencias relacionadas t gl Sig.

(bilateral)

Media Desviación

típ. Error típ. de la

media 95% Intervalo de confianza para

la diferencia Inferior Superior

2,36538 6,76952 ,66381 1,04888 3,68189 3,563 103 ,001

7.6. RESULTADOS DE LA PRUEBA DE ENSAYO

Para completar la evaluación y alcanzar de una forma más completa sus

objetivos, se elaboró un tercer instrumento de evaluación. Este instrumento se centraría

en el análisis más detallado del uso de argumentos, los cuales fueron escasamente

incluidos en el cuestionario y que constituye un elemento de significado específico. Se

considera muy importante porque generalmente en la enseñanza tradicional, no se presta

atención específica al desarrollo de esta capacidad, mientras que en nuestro caso, se ha

tratado de reforzarla mediante las actividades de análisis de datos.

Asimismo, se quería analizar la capacidad de los estudiantes para poner en

relación los diversos elementos de significado en tareas de análisis de datos de alto nivel

y su dominio de la herramienta informática software @risk. En lo que sigue se describe

los resultados de esta prueba que fue analizada a priori en la sección 7.3.

Proyecto de aplicación del teorema central del límite a la ingeniería con @risk

Se pidió a los estudiantes aplicar a un problema de la ingeniería elegido por ellos mismos los conceptos estudiados en las tres lecciones sobre el teorema con apoyo de Excel y @risk. Los datos se simularían a través del programa @risk, analizando para distintos valores de los parámetros la convergencia de la distribución de probabilidades de origen que modela la situación de contexto.

Como se ha indicado en el análisis a priori de este proyecto, los alumnos

tuvieron la libertad de emplear los distintos elementos de significado del teorema

adquiridos en la enseñanza. Para realizarlo, los alumnos bajaron por Internet el @risk.

Cada trabajo individual fue enviado por escrito en el procesador Word y se recogieron

83 de estos informes en la plataforma, del cual 12 corresponden a alumnos de la

especialidad de Acuicultura y Pesca, 7 de Marítimo Portuario, 14 de Informática, 43 de

Industrial y 7 de la ingeniería civil. A continuación, se presentan los principales

elementos de significado del teorema central del límite explicitado por los alumnos.

Page 317: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

310

Campos de problemas

Los problemas planteados por los estudiantes para aplicar lo estudiado sobre el

teorema central del límite han abarcado distintas situaciones en las siguientes áreas de

desarrollo: Resistencia de materiales, estructura de construcción, control de calidad,

servicio de atención a clientes, consumo de empresas, forestal, central hidroeléctrica,

tiempo de falla, industria salmonera, cultivo, transporte, flota pesca, computación,

programación, seguridad vial, educación, deporte, automotriz, encuesta laboral, bolsa de

comercio, ganadería y apícola. Se puede clasificar estas aplicaciones en diferentes

campos de problemas.

Hubo 26 alumnos que plantean una aproximación de la distribución binomial

para valores grandes de n (CP1). Un ejemplo es la estimación de número de peces

enfermos en muestras aleatorias, que corresponde a una variable con distribución

binomial: “Número de salmónidos contagiados por el parásito nematodo

Hysterothycacium en cultivos marinos del sur de Chile”. Sin embargo, este estudiante

trabajó su problema sólo mediante esta distribución, encontrando la solución exacta, sin

utilizar el teorema, por lo que se puede considerar que hizo un uso incorrecto del campo

de problemas.

En otros casos se plantea la obtención de la distribución de la suma de variables

aleatorias discretas idénticamente distribuidas (CP2). Encontramos 15 alumnos con

ejemplos correctos de uso del teorema en variable discreta con distribución Poisson,

como, por ejemplo: “Número de camiones cargados por el cargador frontal en un

período de una hora”. Algunos fallos en la resolución fueron usar sólo esta

distribución, sin estimar el valor mediante el teorema, o suponer la distribución Poisson

como una variable continua con distribución exponencial, como el siguiente ejemplo:

“Una empresa de logística desea controlar de mejor manera los tiempos de permanencia de

camiones en el puerto Novix. El tiempo de espera en horas medido a 5 camiones tiene una

distribución Poisson, y se estudia la siguiente variable para varios valores del parámetro (2 y 6)

y tamaños muestrales (5, 15, 25 y 55), X: horas que está un camión en el puerto Novix”.

También se encontró la obtención de la distribución de la suma de variables

aleatorias continuas idénticamente distribuidas (CP4) en 23 estudiantes. La distribución

continua más utilizada fue la exponencial para diferentes aplicaciones:

“Tiempo en horas que demora una máquina de pino en obtener un metro cúbico de

Page 318: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

311311

producción”, “Estimación del crecimiento de Onckorynchus mykiss a través de la utilización de

un factor de conversión” y “Estimar el tiempo de espera que realizan los usuarios al realizar

una transacción bancaria del cajero automático”.

Otra variable continua estudiada fue la distribución uniforme: “Precio de cada

paquete comprado en la transacción en la bolsa de comercio”. Las dificultades de

algunos alumnos en este campo de problemas fueron comenzar su problema asumiendo

que la distribución de la variable de interés es normal, por lo que no es necesario aplicar

el teorema central del límite, o bien definir una variable con distribución exponencial

cuando el modelo adecuado es Poisson. Por ejemplo: ”Estimar la probabilidad de falla

en la producción de chocolate Costa”, el alumno señala:

“Sea X1,X2,…,X12 la cantidad de máquinas en la empresa “COSTA”, en todo chile y sea X:

“cantidad de productos con falla por mes” variable aleatoria continua independientes que se

distribuye exponencial con promedio igual a 10 (por cien) y la varianza igual a 100 (por cien)”.

Además, se encontró un ejemplo de obtención del tamaño de muestra aleatoria

para realizar inferencias sobre la media en poblaciones de distribuciones desconocidas

(CP8):

“Una Apícola quiere analizar el cuidado de las abejas con el fin de reducir las perdidas de

producción de miel. Las proporciones de abejas muertas debido a las enfermedades es de un

11,5%, a condiciones climáticas de un 1,5%. También se conoce la población la cual es de 150

colmenas y cada colmena tiene aproximadamente 50.000 abejas, el promedio porcentual

poblacional de abejas muertas por ambas consecuencias es de 13%. Para comenzar a calcular

probabilidades e intervalos de confianza se necesita analizar un tamaño de muestra adecuado

para poder realizar una investigación real y que sea significativa, si trabajamos con un 95% de

confiabilidad y un error pequeño que no sea mayor que 0,0005. Estudio 1, “Calcular un tamaño

de muestra adecuado para las 3 proporciones”.

Respecto a la estimación por intervalos de confianza de la media y otros

parámetros para muestras grandes (CP12) una alumna sugiere la siguiente situación:

“Un ingeniero analiza el estado de un disco duro de un computador y piensa que al momento

de revisar los computadores más del 30% de los discos duros se encuentran en buen estado.

Para comprobarlo se toma una muestra al azar de 5, 15 y 30 discos duros que hay distintas

oficinas de la empresa. Para determinar si la empresa necesita o no un mantenimiento en sus

Page 319: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

312

computadores se desea estimar a través de un intervalo de confianza del 99% qué proporción de

los discos duros están en buen estado a partir de una muestra de 75 discos duro, de los cuáles

40 están en buen estado”.

Un error respecto a este campo de problemas fue calcular un intervalo de

confianza para la media poblacional cuando se estaba trabajando con la estimación de la

proporción en una variable con distribución binomial.

En el contraste de hipótesis de la media y otros parámetros en poblaciones no

normales para muestras grandes (CP13) y de varianza poblacional desconocida, un error

fue usar la distribución t-student al plantear una dócima para un tamaño considerado

grande en la siguiente situación:

“Análisis de la factibilidad de la pesca del pulpo, mediante un muestreo donde se sondeó el

rendimiento de uno de los barcos destinados a la captura de pulpo, y se tomó el promedio

obtenido de pulpo durante cada semana por un año. Nuestros datos se distribuyen en forma

normal con media 53,32 (ton/cesta) y varianza 7156,04. Para que la productividad de la

explotación de este recurso sea favorable la media anual debe ser superior o igual a 60

(ton/cesta). Para comprobarlo se realizará una prueba de hipótesis con nivel de significación

del 5%”.

El siguiente ejemplo que sitúa el campo CP13, requiere una solución de un

cuestionamiento informático:

“Suponga que se seleccionó al azar un tamaño de muestra n=50 variables de un conjunto de

programas en Pascal y entre ellas se registraron 8 variables de tipo vector. Queremos probar la

hipótesis de que Pascal es un lenguaje más eficiente que Algol, en el sentido de que el 20% de

las variables o más son de vector. Es decir, probaremos H0: p=0,20 contra H1: p>0,20 donde p

es la probabilidad de observar una variable tipo vector en cada prueba. (Suponga que las 50

pruebas son independientes)”.

Lenguaje

Los términos y expresiones verbales fueron usados correctamente por un 66%

de los estudiantes siendo las expresiones más utilizadas las siguientes: Variable

aleatoria, distribución de probabilidad, distribución normal, muestra aleatoria,

estadístico, distribución muestral, teorema central del límite, suma de variables

aleatorias independientes e idénticamente distribuida, simulación, histograma, intervalo

de confianza, dispersión, población. Hubo errores al definir una sola variable en lugar

Page 320: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

313313

de la suma de variables aleatorias, y no mencionar algunos de los términos anteriores

debido a que no reconocen la aplicación del teorema como solución.

En los proyectos, las notaciones simbólicas más recurridas son: X2, X2,...Xn para

referirse a los datos de una muestra aleatoria, ),(~1

pnbinXSn

iin al enunciar la suma de

n variables aleatorias binomiales, nNX 2, al describir la distribución muestral de la

media de la muestra para n suficientemente grande, la fórmula de estandarización de la

suma de v.a.)1( pnp

npSZ n

n . El lenguaje simbólico fue el menos alcanzado por el grupo,

ya que sólo un 39% lo escribieron acertadamente; otros alumnos continúan empleando

la notación de una variable en el cálculo de probabilidades de la suma, mezclan la

notación de la suma o promedio de una muestra en el cálculo, también denotan la

esperanza de una variable Poisson y calculan la de una exponencial.

En cuanto a las Representaciones gráficas, muy usadas en las respuestas (72%),

las consideradas fueron: Gráfico de barras, histograma, polígono de frecuencia, curva

densidad normal y distribuciones clásicas de probabilidad. Hubo algunas respuestas

descontextualizadas en que presentan sólo un gráfico de barras de población binomial,

sin indicar la aplicación a que se refieren. En la simulación se trabajó con la planilla

Excel y el programa estadístico @risk. Un ejemplo de gráfico producido se incluye en

la Figura 7.5.1.

Figura 7.5.1. Simulación gráfica producido por un estudiante

Enunciados

Se enuncia el teorema central del límite para especificar la suma de variables

aleatorias independientes e idénticamente distribuidas (E4), como el siguiente caso:

Page 321: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

314

“Se eligió una distribución Poisson, ya que las variables discretas aleatorias Poisson:

X1, X2, …,Xn son independientes entre sí, toman valoren enteros y tienen una media común µ.

Además por el teorema central del limite, sabemos que la distribución Sn= Xi es

aproximadamente normal con media nµ y varianza nµ, siempre y cuando n sea lo

suficientemente grande. X ~ P(µ = 13) Sn ~ N(nµ, nµ)”.

Otros alumnos describen el teorema de forma general (E5), apoyándose en que,

sea cual sea la distribución de la población, la media muestral es aproximada por una

normal para un n grande. Un ejemplo es el siguiente:

“ Xi: es el tiempo que tarda una persona en comer en una mesa de comida rápida Doggis. La

variable se distribuye exponencial con parámetro =0,033. Utilizando el teorema central del

limite para n= 32 aproximamos el estimador de la media muestral a la distribución normal:

X ~ e ( ) X ~ N (1

=30, n

1=918,27) ”

También se han recogido enunciados intuitivos del teorema mediante

dispositivos didácticos (E6). Registramos 58 respuestas por medio gráfico con @risk.

Un ejemplo (población exponencial) se muestra a continuación:

“Para mejorar el servicio de atención al cliente en distintas sucursales del banco Estado en

horas de 12:00 a 14:00 y evitar las aglomeraciones de clientes se definió la variable. iX :

Tiempo que se demora una cajera en atender a un cliente. Para comenzar con el estudio, el

Gerente tomó varios parámetros y muestras de clientes que llegan al Banco en la hora punta

para cada grupo de cajeras que hay en las sucursales y analizó las gráficas mediante el teorema

central del límite. Se denota: n = número de clientes (tamaño muestral), r = número de cajeras

(réplicas) y el parámetro en minutos”.

Los errores de enunciar el teorema fueron varios, como considerar la población

de origen con distribución normal, utilizar la distribución t-student (en vez de la normal)

en el teorema o simplemente trabajar las probabilidades sólo con la distribución de

origen y no mencionar el teorema, es decir, no usar la aproximación normal.

Page 322: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

315315

Procedimientos

El algoritmo más reiterativo que utilizaron los estudiantes en la resolución de su

situación-problema fue definir la variable aleatoria a la ingeniería, generar una matriz de

datos, representar por un histograma la distribución muestral de la media muestral o

suma de variables aleatorias, interpretar gráficas por ejemplo el histograma, obtener

distribución de probabilidad clásica asociada, cálculo de parámetros de la distribución

de probabilidad escogida, obtener la distribución de muestreo de la media muestral

cuando la población no es normal, comparar valores teóricos esperados con su

correspondiente valor empírico y cálculo de probabilidad en intervalos de la

distribución normal.

Los alumnos usan con corrección el cálculo y transformación algebraica de

variables aleatorias (AP1). Igualmente realizan la tipificación o su operación inversa

(AP2) y el cálculo de probabilidades utilizando el teorema con calculadora o programa

de ordenador (AP3). Uno de los pocos errores fue no considerar la corrección de

continuidad (P12), como se muestra en el siguiente ejemplo, donde, sin embargo se

usan correctamente los elementos anteriores:

¿Cuál es la probabilidad de que a lo más 70 alumnos de ingeniería civil estén en la condición de

“pérdida de carrera” para una muestra de 170 alumnos?

E[X] = n × p = 71,4; V[X] = n× p × q= 170 × 0,42 × 0,58= 41,41;

P(X 170) = P( Z 214,41

4,7170)= P(Z -0,21) = 0,4168

Otra de las equivocaciones se presentó al plantear y calcular la probabilidad de

la variable normal estándar mezclada con la media muestral:

Se quiere estimar el intervalo en que fluctúa el tiempo que demoran en revisar un motor de

automóvil cuya distribución es gamma con parámetros conocidos y , y de media y varianza

E(X)= × =(17)×(3,5)=59,5, V(X)=208,25. Se observó el tiempo que tardan 40 mecánicos de

distintos talleres en revisar un motor. ¿Cuál es la probabilidad que los 40 mecánicos se

demoren más de 6 horas en revisar un motor? Entonces:

P( X 6) = 1 – P( X <6) = 1 – P( Z <4025,208

5,596) = 1 - (-3,71)=1-0=1

Los errores producidos son sugerir que la interrogante debiera ser ¿cuál es la

probabilidad que el tiempo promedio que un mecánico de la muestra tarda en revisar un

Page 323: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

316

motor sea superior a 6 horas ? Otro error es anotar el parámetro de localización =17

en vez de 1,7; por lo tanto induce a error en la transformación algebraica (AP1), la

tipificación (AP2) y el cálculo mediante la calculadora y tabla estadística (AP3), cuyo

valor correcto es 0,33.

Propiedades

Bastantes alumnos calculan correctamente la media de la distribución

aproximada de una suma de variables aleatorias como la suma de las medias (P1), así

como la varianza de la distribución aproximada de la suma de variables aleatorias como

suma de las varianzas (P2). Dichas propiedades P1 y P2 fueron utilizadas correctamente

por 35 alumnos. Un error fue mezclar las distribuciones unifome y binomial al aplicar

estas propiedades:

“El precio Sn de cada paquete comprado es una v.a.i. distribuida uniformemente entre 100

dolares y 200 dolares, de media 150 y varianza 833,3. El precio total de los 10 paquetes

comprados se distribuye según una distribución normal con media n×µ = 1500 y varianza 8333

(utilizando el teorema de Laplace). Para estimar la probabilidad de que ganemos dinero,

calculamos: Z = (1300-1500) / 8333 = -0,024. Usando corrección de continuidad:

P (Sn > 1300) = P (Z > -0,024) = 1 - P (Z <-0,476) = 1 – 0,3156 = 0,6844 ”

Hubo ocho alumnos que usaron la propiedad de que la media aritmética de una

m.a. de tamaño suficientemente grande sigue una distribución aproximadamente normal

(P3). Otra de las propiedades más usadas (57 alumnos) fue que la aproximación de la

suma de variables aleatorias a la distribución normal mejora con el número de

sumandos (P4).

“Al aumentar la muestra, la distribución Poisson se aproxima de mejor manera a una normal,

su grafica toma forma de campana”, ”El valor al aumentar mejora la aproximación a una

distribución normal”.

Algunos alumnos aproximan una distribución discreta por una continua (P7).

Son los alumnos que situaron su problema en el campo CP1, utilizando la distribución

binomial como población de origen, y mencionaron el teorema de Laplace De-Moivre.

Un ejemplo en el estudio de defectos de computadores que fue resuelto simulando para

Page 324: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

317317

varias muestras es el siguiente: Para el caso de n=30 la aproximación de la distribución

binomial a la distribución normal será buena ya que np y nq son mayores que 5 y p y q

no son demasiado pequeños. El alumno incluye los siguientes gráficos:

Se aproximan algunas distribuciones clásicas a la distribución normal (P8). Los

modelos probabilísticos estimados más comentados fueron la Poisson (15 casos) para

variables discretas y la exponencial (20 casos) para variables continuas. Un alumno usó

correctamente la propiedad de que los estimadores de máxima verosimilitud tienen

distribución asintótica normal (P10).

Respecto a la corrección de continuidad (P12), que se aplica sumando en este

caso 0,5 al comienzo del cálculo de la probabilidad para luego estandarizar la variable

Sn, fue empleada en las distribuciones binomial y Poisson. Un ejemplo de error al

considerar esta propiedad en el cálculo de P (S1 > 15) fue usar 14,5 en lugar de 15,5:

S1: El número de compradores de la computadora que adquieren el paquete de software de 80

clientes con probabilidad de éxito p=0,2. Para calcular la probabilidad la distribución binomial

la podemos aproximar a una normal mediante el teorema central del límite porque nuestro

tamaño de muestra es grande. Además, debemos utilizar corrección por continuidad por que

estoy aproximando de una distribución discreta a una continua.

S1~ N (µ=n×p=16; ²=n×p×q=12,8);

P(S1>15)= P(S1>14,5) = 1-P((S1- µ)/ < (14,5-16)/3,57) =1-P (Z< -0.42) = 0,66.

Argumentos

Fueron 30 los alumnos que argumentan y realizan el cálculo correcto de los

promedios muestrales o de una suma de variables (A1), como se muestra en el siguiente

ejemplo de aplicación correcta de los algoritmos AP1, AP2 y AP3 y propiedades P1, P2

y P12:

“Un ingeniero toma una muestra de 50 memorias RAM, y quiere determinar la confiabilidad de

obtener, a lo mas 10 memorias defectuosas. Se define la v.a. X: numero de memorias RAM

defectuosas obtenidos de las 50 extracciones consecutivas. Entonces X~Bin(n=50, p=1/2),

Page 325: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

318

E(X)=n×p=25, V(X)=n×p×q=12,5. Utilizando el teorema de Laplace-DeMoivre se tiene que X se

aproxima a la normal: P(X 10)=P(X<10,5). Por c.c. P(X<10,5)= )5,12

255,10(ZP =P(Z<-4,10)

= 0,000020548939. La confiabilidad de obtener a lo mas 10 memorias defectuosas de una muestra

de 50, es de un 0,002%”.

Veinte alumnos razonan el teorema como caso especial de un resultado general

(A2), aplicándolo a la aproximación de la distribución binomial, que validaron como

caso particular del teorema.

La validación del teorema por medio de la simulación gráfica con ordenador

(A4) fue la más empleada y alcanzada por un 80% del grupo. En el siguiente ejemplo,

de bioingeniería se justifica visualmente mediante la función logística la variación de las

varianzas, que es la segunda propiedad citada por Méndez (1991) sobre la comprensión

del teorema central del límite:

“La sustentabilidad de la merluza de cola, se verifica por la talla (longitud total), a objeto de

saber cuando se debe extraer el recurso y en que latitudes de Chile. La variable es la longitud

máxima que alcanza esta especie para su primera madurez sexual. Es importante mencionar que

gráficamente se observa que la varianza, para un n pequeño, es mucho mayor que para un n

grande (nos indicaría de alguna forma que al aumentar n deberían variar menos los datos que

es lo que generalmente se espera), esta distribución podría de alguna forma representar muy

bien a muestras de poblaciones grandes en donde es importante ver en que medida están

variando los datos”.

Otro ejemplo argumentado por las representaciones gráficas es la que sigue:

“En el gráfico con n=520, se representa el pedido del gerente. Se puede ver claramente la

prueba de que se puede utilizar el teorema central del limite para apreciar como la distribución

de Poisson de los promedios muestrales se aproxima a una distribución normal cuando el n es

suficientemente grande. Además, la media de esta simulación, es la que más se asemeja a la

media teórica planteada en el ejercicio = 13. Con la simulación de @RISK se puede ver que

una distribución de Poisson estará sesgada a la derecha cuando es pequeña y se aproximará a

la simetría al crecer”.

Page 326: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

319319

También, se justifica el teorema mediante la comprobación de ejemplos y

contraejemplos sin pretensión de generalizar (A5). Se observaron 26 respuestas

utilizando este argumento, una de las cuales compara las probabilidades exactas y

aproximadas del teorema para la distribución Poisson:

“En la compra de 520 chips para el uso de su empresa, que sigue la distribución Poisson donde

aparecen 2 chips defectuosos de 40, se tiene como variable el número de chips defectuosos en un

lote de 520 chips. Sea X ~ P(µ = 0,025) de parámetro µ = 2/80 = 0,025 de 520. Se sabe que el

gerente sólo puede recibir a lo más 5 chips defectuosos de su pedido de 520, por lo tanto µ =

520×2/80 = 13 o sea 13 defectuosos de 520 chips. Se calcula la probabilidad de que X < 5, para

saber la probabilidad de que en el pedido se encuentre a lo más 5 chips defectuosos. P(X 5) =

!

13 13

x

ex

= 1,0731×10-2. Como se ve la Probabilidad exacta de que en el pedido se encuentre

a lo más 5 chips defectuosos es de 1,07%. Aproximando a una Normal: X ~ P(µ = 13) Sn ~

N(nµ, nµ); P(X 5) = P( Z <13

130,5)= P(Z < -2,22 ) = 0,0132”.

Veintiseis alumnos obtienen una conclusión o toman una decisión en base a

resultados del teorema (A6). Un ejemplo en estimación de tiempos de espera de

atención se muestra en lo que sigue:

“En su estudio se da cuenta de que para un =2 minutos, para los distintos tamaños de

muestras y replicas, las cajeras se demoran alrededor de 2 a 3 minutos en atender a un cliente.

Para un =5 minutos, para los distintos tamaños de muestras y replicas las cajeras se

demoran alrededor de 5 a 6 minutos en atender a un cliente. Para un =8 minutos, para los

distintos tamaños de muestras y replicas las cajeras se demoran alrededor de 7 a 9 minutos en

atender a un cliente. Por lo tanto, lo más conveniente para el Banco Estado y para los clientes

es considerar el parámetro =2 minutos”.

La Tabla 7.6.1 muestra los resultados obtenidos al analizar los proyectos

presentados por los estudiantes en cuanto a los diferentes procedimientos,

Page 327: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

320

argumentaciones y lenguajes de representaciones gráficas, simbólicos y expresiones

verbales usadas. Se observa que los campos de aplicación del teorema más requerido

son los que provienen de poblaciones binomiales, de distribuciones de la suma de

variables continuas y discretas con participación respectiva de 31%, 28% y 18%.

También, un 15% estimó parámetros por intervalos de confianza. En conjunto han

aparecido todos los campos de problemas incluidos en la enseñanza, en general con uso

correcto.

Tabla 7.6.1. Frecuencias (y porcentajes) de elementos de significado del problema abierto (n=83)

Elementos usados Incorrecto Correcto Campos de problemas CP1: Obtener una aproximación de la dist. binomial para valores grandes de nCP2: Determinar la distribución de la suma de variables aleatorias discretas i.i.d. CP4: Determinar la distribución de la suma de variables aleatorias continuas i.i.d CP8: Obtener del tamaño adecuado de una m.a. de poblaciones desconocidas CP12: Estimar por intervalos de confianza la media y otros parámetros para

muestras grandes CP13: Establecer pruebas de hipótesis de la media y otros parámetros para

muestras grandes

2 (2,4) 6 (7,2) 8 (9,6) 0 (0,0) 1 (1,2)

2 (2,4)

26 (31,3) 15 (18,1) 23 (27,7) 1 (1,2)

12 (14,5)

1 (1,2)

Lenguaje Términos y expresiones verbales Notaciones y símbolos Representaciones gráficas

2 (2,4) 9 (10,8)3 (3,6)

55 (66,3) 32 (38,6) 60 (72,3)

Enunciados E4: Enunciado del teorema para la suma de variables independientes idénticamente

distribuidas E5: Enunciado del teorema de forma general E6: Enunciado intuitivo del teorema

0 (0,0)

1 (1,2) 5 (6,0)

20 (24,1)

7 (8,4) 58 (69,9)

Procedimientos AP1: Cálculo algebraico y transformación de variables aleatorias AP2: Tipificación /Destipificación AP3: Cálculo de probabilidades con calculadora, tablas u ordenador AP4: Cálculo de probabilidades a partir de la simulación

3 (3,6) 9 (10,8) 3 (3,6)

3 (3,6)

37 (44,6) 30 (36,1) 35 (42,2)

66 (79,5) Propiedades P1: La media de la distribución aproximada de una suma de variables aleatorias es

la suma de las medias P2: La varianza de la distribución aproximada de la suma de variables aleatorias es

la suma de las varianzas P3: La media aritmética de una m.a. de tamaño suficientemente grande sigue una

distribución aproximadamente normal P4: La aproximación de la suma de variables aleatorias a la distribución normal

mejora con el número de sumandos P7: Aproximación de una distribución discreta por una continua P8: Aproximación de algunas distribuciones clásicas a la distribución normal P10: Los estimadores de máxima verosimilitud tienen distribución asintótica

normal P12: Corrección de continuidad

5 (6,0)

5 (6,0)

0 (0,0)

1 (1,2)

0 (0,0) 4 (4,8) 0 (0,0)

5 (6,0)

35 (42,2)

35 (42,2)

8 (9,6)

57 (68,7)

20 (24,1) 18 (21,7) 1 (1,2)

15 (18,1) Argumentos A1: Demostraciones formales algebraicas y/ o deductivas A2: Presentación del teorema como caso especial de un resultado general A4: Simulación gráfica con ordenador del teorema A5: Comprobación de ejemplos y contraejemplos sin pretensión de generalizar A6: Obtener una conclusión o tomar una decisión en base al teorema.

9 (10,8) 1 (1,2) 3 (3,6) 0 (0,0) 7 (8,4)

30 (36,1) 20 (24,1) 66 (79,5) 26 (31,3) 26 (31,3)

Page 328: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

321321

Este proyecto por ser abierto, llevó a que los estudiantes se expresarán con

diverso lenguaje, con un 66% de uso correcto de la terminología verbal y un 39% en

notación simbólica. La de mayor uso, con un 72%, fue la de representaciones gráficas,

donde la experiencia de trabajar el teorema mediante la simulación con el computador

resultó positiva. Las respuestas de los estudiantes muestran que aprendieron a utilizar el

programa @risk, obteniendo tablas de la distribución de la suma de variables aleatorias

con muestras de distintos tamaños muestrales y la gráfica de barras e histograma como

un medio de validar la forma simétrica de la distribución de la media muestral y

aproximación a la normal a medida que aumenta el tamaño muestral; propiedades

propuesta por Méndez (1991).

La forma de enunciar intuitivamente el teorema fue la más utilizada con un 70%,

seguido de la suma de variables aleatorias independientes idénticamente distribuidas

(24%) y un 8% declaró el teorema de forma general.

En cuanto a los procedimientos usados para resolver los problemas planteados,

un promedio de 40% usó correctamente las estrategias del cálculo algebraico,

tipificación y cálculo con calculadora, tablas estadísticas o programa de ordenador. La

frecuencia de uso incorrecto de los procedimientos fue pequeña; no todos los alumnos

usan los procedimientos algebraicos, pues algunos plantean los problemas y hacen un

estudio mediante simulación (en lugar de usar un procedimiento algebraico). No se

había considerado este elemento como objeto de estudio, pero muchos estudiantes han

resuelto el problema considerado por medio de la simulación, y por ello lo incluimos

ahora como procedimiento.

En cuanto a las propiedades, los estudiantes en general utilizan el tipo de

variables aleatorias para identificar la distribución clásica de probabilidades y luego

aplicar algunas propiedades de aproximación a la distribución normal. Las de mayor

reconocimiento son: P4, que la aproximación mejora al aumentar el número de variables

(69%), P1 y P2, la media y varianza de la distribución aproximada de la suma de

variables aleatorias es la suma de las medias y varianzas respectivamente (42%), P7,

aproximación de una distribución discreta por una normal (24%), y con un 22% la

propiedad P8 de aproximación de distribuciones clásicas a la distribución normal. Los

alumnos que trabajaron en muestras de poblaciones con distribución discreta, un 18%

usó correctamente la corrección de continuidad P12 con un 6% de error en la aplicación.

Sólo un 10% aplicó que la media de la muestra se aproxima a una distribución normal

Page 329: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

322

para un tamaño muestral grande, P3. Observamos errores en algunos estudiantes que

confunden una variable discreta con una continua, como es el caso de la distribución

Poisson con la distribución exponencial.

Fueron varias las argumentaciones en los distintos problemas de aplicación; la

validación del teorema de mayor éxito fue la simulación gráfica con ordenador (80%),

seguida de formas algebraicas (36%), la comprobación de ejemplos de cálculo de

probabilidades y esperanzas tanto empíricas como teóricas (31%) y un 24% lo

argumentó como caso especial de un resultado general. Muy pocos estudiantes llegan a

una conclusión final correcta en el contexto del problema, relacionando gran parte de

los elementos de significados, realizando un análisis de cada propiedad y concluyendo

con una síntesis. Sólo un 31% concluye con una decisión de contexto basado en el

teorema.

Una síntesis del número de elementos de significados del teorema correctamente

e incorrectamente empleados en este problema por los estudiantes (entre los 29

identificados en la Tabla 7.6.1), se expone en lo que sigue. Se observa en el gráfico de

caja (Figura 7.6.1) que el número de elementos correctamente utilizados por alumno en

la solución varía de 0 a 20, mientras que el número de elementos incorrectamente

utilizados va de 0 a 10. También se destaca la superioridad de los cuantiles

correspondientes a los elementos correctos en el 50% central de la distribución y la

mediana en relación a las respuestas incorrectas. Además, se percibe que las medias

poblacionales de puntuaciones totales de elementos correctos e incorrectos podrían ser

distintas ya que no se produce un traslape de la información central.

Figura 7.6.1. Número de elementos correcta e incorrectamente usados en el proyecto

Page 330: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

323323

En la Tabla 7.6.2 se presentan los estadísticos del número de elementos de

significado del teorema correcto e incorrecto en la prueba de ensayo, analizando la

diferencia entre los alumnos participantes. Se observa que el número promedio de

respuestas correctas es altamente mayor de las respuestas incorrectas, con una media de

10,6 elementos de significados por alumno y 1 incorrecto del total de los 29

especificado en la Tabla 7.6.1, siendo ambas de respuestas heterogéneas (coeficientes de

variación superior a 35%) con desviaciones típicas muy distintas.

Tabla 7.6.2. Estadísticos del número de elementos correctos e incorrectos en el problema de ensayo

Media Desviación típ. Error típ. de la media Correctos 10,6026 5,95293 ,67404 Incorrectos 1,1795 2,19056 ,24803

Los comentarios anteriores son confirmados mediante la inferencia en un

contraste T de diferencias de medias en muestras relacionadas, resultados presentes en

la Tabla 7.6.3 cuyo valor de probabilidad es 0,000 y se calcularon el intervalo de

confianza del 95% de confianza para la diferencia de medias en muestras relacionadas.

Se puede apreciar que la diferencia promedio entre respuestas correctas e incorrectas

por alumno es altamente significativa, con un intervalo de confianza dentro de los

valores positivos entre 7,8 y 11,1; lo cual permite rechazar la hipótesis de igualdad de

las medias. Ello indica que los alumnos en su conjunto utilizan más elementos de

significado correctamente que incorrectamente en la resolución del proyecto de

aplicación contextualizado del teorema central del límite.

Tabla 7.6.3. Contraste e intervalo de confianza de la diferencia de elementos correcto e incorrecto en el problema de ensayo

Diferencias relacionadas t gl Sig.

(bilateral)

Media Desviación

típ. Error típ. de

la media 95% Intervalo de confianza para

la diferencia Inferior Superior

9,42308 7,23361 ,81905 7,79215 11,05400 11,505 77 ,000

7.7. RESUMEN DE RESULTADOS EN LAS TRES PRUEBAS ABIERTAS

Como resumen, se realiza un estudio comparativo del número de elementos de

significado usados correcta o incorrectamente por cada estudiante en el total de las tres

pruebas abiertas.

Page 331: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

324

En relación a la diferencia entre el número de elementos de significado correcto

e incorrectamente empleados por los alumnos al resolver los tres problemas abiertos, el

análisis indica una divergencia respecto a los resultados de aplicación del teorema en las

tres situaciones. En la Figura 7.7.1 se puede valorar que el número de elementos

correctos es mayor que el número de elementos incorrectos, ya que el recorrido de los

elementos correctos que va de 0 a 45, mientras que para los incorrectos varía de 0 a 19.

También, la mediana es visiblemente superior (16 y 7 respectivamente), al igual que el

50% central de puntuación total; de elementos de significados correctos comprendido en

el intervalo (9; 25), y el intervalo (5; 10) para los elementos incorrectos. Se muestra

claramente que las medias poblacionales de las puntuaciones correctas e incorrectas

pueden ser distintos.

Figura 7.7.1. Número de elementos correcta e incorrectamente usados en las tres pruebas

Las afirmaciones anteriores son fortalecidas por el resumen de los estadísticos de

posición y dispersión establecidos en la Tabla 7.7.1. La media de elementos adquiridos

correctamente por los alumnos es casi el triple del valor de elementos incorrectos,

además en las dos distribuciones con coeficientes de variación heterogénea muy

similares (59,3% y 62,5% respectivamente).

Tabla 7.7.1. Estadísticos del número de elementos correctos e incorrectos usados en las tres pruebas (n = 134)

Media N Desviación típ. Error típ. de la media Total correctos 17,2519 134 10,22487 ,88002Total incorrectos 6,2000 134 3,87645 ,33363

Page 332: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

325325

Una forma de consolidar las observaciones anteriores es mediante un contraste

de hipótesis de la diferencia entre puntuaciones medias de elementos correctos e

incorrectos para muestras relacionadas, obteniendo un resultado altamente significativo

(significación de 0,000). El intervalo de confianza para la diferencia de medias tiene

unos límites comprendidos entre 9,1 y 12,9 indicando que los estudiantes usaron

correctamente entre 9 y 13 elementos de significados del teorema central del límite más

que el número de elementos en que presentaron errores, entre los establecidos en las

Tablas 7.5.1.1, 7.5.2.1 y 7.6.1.

Tabla 7.7.2. Contraste e intervalo de confianza de la diferencia de elementos correcto e incorrecto en los tres problemas abiertos

Diferencias relacionadas t gl Sig.

(bilateral)

Media Desviación

típ. Error típ. de

la media 95% Intervalo de confianza

para la diferencia Inferior Superior

11,05185 11,37050 ,97862 9,11632 12,98739 11,293 133 ,000

Los resultados obtenidos ponen de manifiesto la gran diversidad de elementos

que el alumno debe usar para resolver los problemas y las tareas planteadas y la

diferencia del proyecto abierto planteado con las tareas tradicionales incluidas en los

libros de texto. El alumno debe reconocer los campos de problemas del teorema central

del límite, elegir un lenguaje adecuado para representar sus datos, y operar con ellos

mediante una serie de procedimientos que le producen resultados numéricos o gráficos.

Estos resultados han de ser interpretado adecuadamente, estableciendo correspondencias

semióticas pertinentes entre los mismos y los objetos matemáticos y sus propiedades

que intervienen en el teorema y en las tareas.

Finalmente, debe ser capaz de ligar todos estos resultados por medio de una

argumentación pertinente. Es muy importante a la hora de planificar una enseñanza,

tener en cuenta todos los elementos previos que el alumno deberá conocer y manejar

para poder adquirir de manera coherente el significado global del teorema central del

límite. En lo que sigue comparamos el significado personal de los estudiantes, evaluado

mediante el conjunto de pruebas, con el significado institucional de referencia

implementado.

Page 333: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

326

7.8. CONCLUSIONES SOBRE EL SIGNIFICADO PERSONAL DE LOS

ESTUDIANTES

Al finalizar el proceso de estudio del teorema central del límite se han analizado

las respuestas a varios instrumentos de evaluación, un cuestionario y tres problemas

abiertos. A continuación se hace una síntesis de las principales tendencias en el grupo

en cuanto al significado personal de los estudiantes.

7.8.1 CONCORDANCIAS ENTRE SIGNIFICADO PERSONAL Y SIGNIFICADO

IMPLEMENTADO

Una gran variedad de los elementos de significados del teorema ha sido aplicado

en forma correcta por los alumnos, tanto en el cuestionario, como en las pruebas

abiertas. Los campos de problemas más intuitivos en los ítems del cuestionario fueron

obtener un estimador para la media muestral (CP12, 76% en ítem 11), aproximación

binomial a la normal CP1, (59% en ítem 1), el reconocimiento del teorema para la suma

de variables independientes idénticamente distribuidas (CP2, CP4, ítem 5 parte a), b) y

c)) y aproximación de distribuciones clásicas continuas (CP4, 89% la distribución T en

ítem 12).

En los problemas abiertos estos campos fueron menos reconocidos, pues algunos

alumnos transforman el problema en otro correspondiente a la distribución de Poisson o

normal. No obstante un porcentaje de estudiantes reconoce el campo CP1 en el

problema 2 relativo a la aproximación binomial y el CP2 en el problema 1. A diferencia

de los problemas parciales anteriores, el problema 3 destaca el reconocimiento de otros

cuatro campos de problemas en que se utiliza el teorema (CP4, CP8, CP12 y CP13); en

total hay 6 campos de problemas reconocidos (un 94% de estudiantes reconoce alguno

de ellos). Parece que fue más sencillo para el estudiante idear él mismo un problema que

pudiese resolverse mediante el teorema central del límite que identificar el teorema

como solución de un problema previamente planteado.

El lenguaje simbólico fue, en general, sencillo, para los estudiantes, con algunas

excepciones. En los problemas abiertos, observamos que en la aplicación del teorema

mediante la distribución de probabilidad Poisson (problema 1) se ha mostrado una

comprensión de la representación algebraica con distintos porcentajes de logros (66%

en problema 1, 42% en problema 2, 39% en el problema 3); también se añade con

fuerza en este último problema el uso correcto de la representación gráfica (72%).

Los procedimientos mejor utilizados han sido las estrategias algebraicas AP1

Page 334: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

327327

(94% correcto en problema 1 y 59% en problema 2, 45% en el proyecto), la tipificación

y destipificación AP2 (67% correcto en problema 1, 43% en problema 2, 36% en el

proyecto) y el cálculo de probabilidad con tablas AP3 (71% en problema 1, 53% en

problema 2). En el proyecto abierto además, se incorpora la simulación como resolución

del problema de aplicación (70% de uso correcto).

Las propiedades más sencillas fueron la condición del tamaño muestral P4 (93%

en ítem 6 b)), la media de la suma de variables aleatorias P1 (81% en problema 1, 56%

en problema 2, 42% en el proyecto), la varianza de la suma de variables aleatorias P2

(69% en problema 1, 43% en problema 2, 42% en el proyecto), el uso de la corrección

de continuidad a nivel declarativo P12 (74% en ítem 2) y la convergencia de la

distribución binomial en el centro del rango de la distribución P7 (66% en ítem 3). Lo

siguen las propiedades de la distribución de origen y condiciones de la convergencia

para la suma de variables, propiedades no incluidas en el significado institucional de

referencia (entre 58 y 67% de aciertos en los apartados a) y c) del ítem 6; 69% en el

proyecto). Asimismo, se reconoce la convergencia para valores pequeños de n de

algunas distribuciones (entre 72 y 84% de aciertos en diferentes partes del ítem 7). Se

maneja a nivel declarativo el concepto de distribución muestral (82% en ítem 8) y se

conoce la forma de su gráfica (59% en ítem 10).

De las cinco maneras convenientes de validar el procedimiento de análisis,

sobresale la simulación gráfica con ordenador (A4) en el proyecto (80%), la

aproximación a la distribución binomial como caso especial del teorema (A2, 66% en

ítems 1 y 2) y la simulación manipulativa (A3, 77% en ítem 7). Se emplea

correctamente el argumento de conclusión específica en base al resultado (A6), aunque

la frecuencia de uso correcto no alcanza el 50% en los problemas abiertos.

Respecto a las configuraciones empleadas en el proceso de estudio, en el

cuestionario fueron positivos los resultados (frecuencia de éxito) en los ítems 1 y 6

relacionados con configuración manipulativa (un promedio de respuestas correctas de

69,2%), por ejemplo en la comprensión de la convergencia binomial por una

distribución continua. Una tasa de aciertos de 72,1% en la configuración simulación

computacional (ítems 3, 7, 9, 10, 11 y 12) y en la configuración algebraica de 42,9%

(ítems 2, 4, 5 y 14). Por lo tanto, las tres configuraciones epistémicas instauradas en la

primera evaluación (cuestionario) han sido robustecidas la configuración algebraica en

los problemas 1 y 2 y la configuración de simulación e intuitiva en la tarea de contexto a

la ingeniería. Se observa también la mayor dificultad de la configuración algebraica

Page 335: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

328

respecto a las manipulativas y computacional, por lo que la enseñanza con dicha

configuración sólo debiera abordarse, alcanzada la comprensión de las dos primeras.

7.8.2. DIFERENCIAS ENTRE SIGNIFICADO PERSONAL Y SIGNIFICADO

IMPLEMENTADO

Por otro lado, no todos los elementos de significado han sido aplicados con la

misma frecuencia ni todos resultaron igualmente sencillos, habiendo una gama de

dificultad, desde preguntas acertadas por todo el grupo hasta otras con un porcentaje de

aciertos muy bajo. Dentro de las características generales que hemos podido determinar

en las resoluciones de los alumnos, los errores más comunes se describen a

continuación. Una parte importante de estos errores podrían deberse a conflictos

semióticos, aunque este punto deberá ser investigado más adelante, pues en este trabajo

no hemos llevado a cabo un análisis semiótico detallado de las respuestas de los

estudiantes.

Reconocer los campos de problemas donde el teorema es una herramienta de

análisis no fue siempre sencillo para los estudiantes; en el primer problema abierto sólo

el 46% reconoce la aproximación de variables discretas no acotadas correctamente

(CP2). En el problema 2 sólo 26% reconoce la aproximación a la distribución binomial

(CP1) y el 16% la distribución de la suma de variables discretas (CP2). En estos

problemas los alumnos resuelven un problema diferente al planteado mediante la

distribución exacta de Poisson o binomial, respectivamente.

Sólo una cuarta parte del grupo inspecciona aproximaciones de estadísticos que

provienen de poblaciones ya sea discreta o continua y su inferencia en intervalos de

confianza y contraste de hipótesis (CP11 y CP12). Se entiende que una dificultad de los

estudiantes es identificar la distribución de probabilidad apropiada que modela la

variable estadística situada en la ingeniería. Es por ello que hubo mejores respuestas

correctas en el problema 1, donde se indica que el problema de transporte ha sido

modelado por la distribución Poisson. También se presentan errores al extender

indebidamente el teorema para n pequeño en el caso de la proporción (CP1, ítem 13 con

solo 21% de respuestas correctas e ítem 15 con sólo 12% de respuestas correctas),

resultados que se explican por la heurística de la representatividad.

El lenguaje menos utilizado es el de términos y expresiones verbales debido a la

gran cantidad de palabras relacionadas con teorema central del límite y que el alumno

prefiere expresarse en lenguaje simbólico; en general, cuando se usa se hace

Page 336: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

329329

correctamente, pero también se producen errores. Destaca el proyecto abierto, donde

hay un uso correcto del lenguaje en el 66% de los estudiantes.

Fue difícil el procedimiento de estandarización (AP2) a nivel declarativo (ítem

4) pues algunos estudiantes confunden la desviación típica de la media y de la

proporción o comenten errores en el manejo de desigualdades. Cerca de un 25% de los

estudiantes tienen problemas con la tipificación y este porcentaje fue más alto en el ítem

4 con un 62,7% al confundir la tipificación de la suma de variables aleatorias con la

correspondiente a la media aritmética.

Aunque, en general, los alumnos usan la mayor parte de los enunciados del

teorema, les resultó difícil identificar un enunciado incorrecto (sólo 47% en ítem 5)

aunque el error se relaciona con el olvido de la desviación típica para la proporción. En

el problema 1 sólo el 40% reconocen el enunciado para la suma de variables aleatorias

(E4), debido a la falta de reconocimiento del campo de problema CP2. Lo mismo ocurre

en el problema 2 con un 28% y un 20% en plantear el teorema de forma intuitiva (E6) y

muy pocos lo declaran de manera general (E5). Por el contrario, en el proyecto abierto

el 70% usa correctamente el enunciado intuitivo (E6).

En las propiedades hubo un 81% de error al comparar las medias del estadístico

y de la población (ítem 14) (P1) formulada en términos verbales de la distribución

muestral. Resalta que no utilicen la corrección de continuidad en el procedimiento

algebraico (P12) en las distintas situaciones de estimación de distribución discreta por

una continua; de los que la utilizaron esta propiedad un 9,1% lo hicieron mal y sólo un

21,4% en promedio lo aplicó correctamente. Sólo el 33% la usa correctamente en el

problema 1. En cambio en el ítem 2 del cuestionario sólo un 26,1% expresó

simbólicamente mal la corrección, haciendo notar al alumno que el propósito de la

pregunta era aplicar la propiedad. Tampoco alcanzó el 25% del uso correcto de las

propiedades de la media aritmética (P3), aproximación de una distribución discreta por

una continua (P7) y de otras distribuciones clásicas (P8), a diferencia de la aplicación de

la media de la suma de variables aleatorias (P1) y varianza de la suma de variables

aleatorias (P2).

Por último, la unión de todos los elementos de significado del teorema central

del límite presentes no fue consolidada en una buena argumentación por el grupo; un

promedio de 38% concluye en base a la simulación gráfica (A4) o forma algebraica

(A1) determinando una decisión, así también es alto el porcentaje de errores de la

argumentación deductiva (A1) (sólo 26% de razonamientos deductivos correctos en el

Page 337: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

330

problema 1, 32% en el problema 2 y 36,1% en el proyecto abierto). También hay

dificultad al obtener una conclusión a partir del análisis (A6) (sólo 37% lo hacen

correctamente en el problema 1 y 45% en el problema 2). Sin embargo, en el proyecto

abierto la simulación se usa con éxito en la argumentación en un 80% de los

estudiantes.

7.9. CONCLUSIONES SOBRE LA IDONEIDAD DEL PROCESO DE ESTUDIO

Además de estudiar con detalle la comprensión adquirida por los estudiantes

sobre los diferentes elementos de significado incluidos en el proceso de estudio, se

planteó analizar el punto hasta el cuál el proceso de instrucción ha sido eficaz. Para ello

se basó en el análisis de los criterios de idoneidad definidos por Godino, Contreras y

Font (2006).

Idoneidad epistémica

Se refiere al grado de representatividad de los significados institucionales

implementados (o previstos), respecto de unos significados de referencia. Incluye

también las conexiones o apertura hacia otras configuraciones epistémicas que

constituyen la trayectoria correspondiente (Godino, Contreras y Font, 2006).

En el estudio la idoneidad epistémica ha sido muy alta, como se pone de

manifiesto en el análisis realizado en los capítulos 5 y 6 sobre el proceso de estudio

diseñado e implementado y al compararlo con el estudio histórico y en análisis de libros

de texto realizados en los capítulos anteriores. El estudio de libros de texto reveló que

existe diversidad de significados en los libros de estadística para ingenieros en la forma

de presentación del teorema central del límite, aunque el énfasis general se pone en la

resolución de ejercicios rutinarios, bien descontextualizados o contextualizados a la

ingeniería, pero con datos que en ningún modo son reales. Además, la presentación del

teorema se restringe a la distribución de la media de la muestra (en el mejor de los casos

a la suma de variables aleatorias) y se hace poco uso de la herramienta informática.

En la propuesta se han ampliado notablemente los campos de problemas, para

incluir prácticamente todos los encontrados en el estudio histórico, incluyendo, desde la

aproximación de la distribución binomial a las aplicaciones a estimación y obtención

del tamaño de muestra. El significado implementado (Capítulo 6) ha reforzado la

aplicación del teorema central del límite a variables discretas, problemas enfocados a

varias especialidades con dispositivo de simulación y resolución justificada. Se inicia la

Page 338: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

331331

introducción del teorema en la lección 1 a partir de la aproximación de una distribución

de probabilidades particular (utilizada para generar algunos modelos probabilísticos

clásicos), comprometiendo al estudiante a observar distintos acercamientos de la

distribución muestral de varios estadísticos tomados de datos reales recogidos por los

estudiantes e incorporando la informática.

Respecto a la forma de argumentación, se ha ampliado las formas tradicionales,

que consisten esencialmente en el razonamiento formal deductivo. La experiencia de

enseñanza ha permitido otras formas de argumentación que incluyen expresar el

teorema como caso particular de un resultado general, exponer la simulación con

ordenador, formularla mediante ejemplos y contraejemplos y tomar una decisión en

base a los resultados. Especialmente importante ha sido la argumentación basada en la

simulación y visualización con ordenador. La facilidad de simulación de experimentos

aleatorios hizo posible a los alumnos la experimentación y exploración del teorema

central del límite, variando los tipos de distribuciones y sus parámetros y observando

como depende la convergencia de ellos, de una forma interactiva. De este modo el

"objeto" teorema central del límite pierde su carácter abstracto, proporcionando una

experiencia estocástica que no es fácil alcanzar en la vida real (Biehler, 1991, 1997;

Tauber, 2001).

Por tanto los elementos de significado presentados en el proceso de estudio son

una muestra representativa de los que se detallaron en el significado de referencia,

puesto que se han incluido todos los campos de problemas pretendidos, así como los

procedimientos pertinentes, propiedades relacionadas, enunciado y lenguaje. De los 45

elementos de significado del teorema, hubo dos elementos (CP7: campo de problema de

la suma de variables aleatorias dependientes y E1: presentación del teorema como

convergencia de sucesiones de v.a.) no tomados en el diseño debido a su excesiva

dificultad para los estudiantes a que iba dirigido el estudio. Se han establecido también

conexiones hacia otros objetos matemáticos (configuraciones epistémicas), en particular

hacia las distribuciones muestrales de la media y proporción y hacia sus aplicaciones en

la construcción de intervalos de confianza y contrastes de hipótesis.

Idoneidad cognitiva

Expresa el grado de proximidad de los significados implementados con respecto

a los significados personales iniciales de los estudiantes, o, de manera equivalente, la

medida en que el "material de aprendizaje" esté en la zona de desarrollo potencial de los

Page 339: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

332

alumnos (Godino, Contreras y Font, 2006). Puesto que un grupo de estudiantes siempre

es variado, respecto a sus capacidades, conocimientos previos, interés y esfuerzo

durante el proceso de estudio, este tipo de idoneidad nunca será completa (en el sentido

de que todos los estudiantes alcancen todos los objetivos educativos). Por consiguiente,

se habrá de dar un juicio respecto al grado en que se ha conseguido en relación con el

esfuerzo hecho por el estudiante e identificar criterios de mejora para futuras

implementaciones del proceso.

En relación a los fines de la enseñanza, una primera evidencia de idoneidad

cognitiva es el aprendizaje mostrado por el estudiante, evidenciado en las diferentes

pruebas de evaluación. El aprendizaje de los diferentes elementos de significado fue, sin

embargo, desigual, como se ha mostrado al analizar las concordancias y diferencias del

significado implementado y personal de los alumnos y en las diferencias de porcentajes

de respuestas correctas a diferentes ítems del cuestionario. Cada estudiante responde

correctamente en promedio 12-13 ítems correctamente, de un total de 20 en el

cuestionario y la mayor parte de los ítems tienen una alta tasa de respuestas correctas

(aunque en unos pocos casos, como en el ítem relacionado con la heurística de la

representatividad los estudiantes en su mayoría dan la respuesta incorrecta).

La idoneidad cognitiva también se manifiesta en el hecho de que al resolver los

problemas abiertos y el proyecto los alumnos utilizan más elementos de significado

correctamente que incorrectamente en cada una de estas tareas y en su conjunto (el

número de elementos correctamente utilizados duplica al de usados con errores).

Además, casi todos los estudiantes aprendieron a manejar la planilla Excel y el

software @risk, son capaces de simular experimentos y el 62% realizaron un proyecto

opcional en el que fueron capaces de idear un contexto de la ingeniería donde se pueda

aplicar el teorema central del límite. Dichos estudiantes mostraron una alta capacidad de

manejos de procedimientos y la mayoría de las propiedades, variando los campos de

problemas y enunciados presentados. Aún así muchos de ellos no llegan a interpretar

todos los resultados de su proyecto, limitándose a proporcionar los resultados numéricos

sin interpretación.

Esta dificultad (la interpretación) junto con la identificación de los campos de

problemas (en los problemas abiertos 1 y 2) fueron los puntos menos alcanzados. Los

estudiantes dominan los procedimientos, lenguaje y propiedades y son capaces de

inventar un problema que involucre al teorema cuando así se les pide. Es más difícil

para ellos reconocer un problema relativo al teorema central del límite (si no se les

Page 340: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

333333

indica explícitamente) o interpretar los resultados en un contexto de ingeniería.

También la lectura de los capítulos 5 y 6 nos hace reflexionar sobre que

posiblemente hubo diferencia de intensidad de implementación de los diferentes

elementos de significado, dedicándose menos tiempo a estas actividades. No se

emplearon con la misma frecuencia los cinco tipos de argumentación, posiblemente se

priorizó la simulación, cálculo y desarrollo algebraico, que también es frecuente en las

asignaturas previas de Cálculos y Probabilidades. Son estos los puntos en que hay que

mejorar la idoneidad cognitiva del proceso de estudio, posiblemente con más tiempo

dedicado al tema y sobre todo, con más experiencia de los estudiantes en aplicación del

teorema en su futura vida profesional.

Idoneidad semiótica

Tiene en cuenta las posibilidades que ofrece una configuración didáctica para

identificar conflictos semióticos potenciales y de resolverlos mediante la negociación

de significados (Godino, Contreras y Font, 2006).

El dispositivo didáctico implementado permitió identificar muchos de estos

conflictos, tanto a través de las evaluaciones intermedias y finales, como mediante las

preguntas planteadas por los estudiantes a la plataforma EV@. A lo largo del Capítulo

6 se describieron algunos de estos conflictos, aunque no se ha descrito con detalle la

forma en que fueron resueltos colectivamente en la clase, o bien, individualmente en

las tutorías implementadas por el profesor. Los resultados de la evaluación final, en

todo caso, muestra la resolución de una parte importante de los mencionados

conflictos.

Por ejemplo, lo mismo que ocurrió en la investigación de Tauber (2001), en

nuestro curso los alumnos mostraron variados conocimientos previos, y mostraron

conflictos semióticos en relación a la interpretación de histograma y cálculo de área

dentro de un intervalo, y el hecho de que una variable cuantitativa discreta puede ser

aproximada por una distribución continua. Estos conflictos fueron resueltos a lo largo

de la enseñanza. Otros conflictos detectados en la enseñanza y resueltos fueron debidos

a la ejecución de situaciones de estudio mediante la simulación. En los casos de estudio

de la sensibilidad paramétrica para la convergencia en distribución de probabilidad

detectamos y resolvimos en algún grado otros conflictos de diferenciación en los tipos

de asimetría, diferenciación entre modelos teórico y datos empíricos, y entre estadístico

y parámetro.

Page 341: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

334

El tiempo disponible no permitió resolver todos los conflictos presentados, lo

cual sería utópico para un objeto matemático de tal complejidad. Por ejemplo, no se

logró identificar algunos de los campos de problemas o bien no aplicar (o aplicar

incorrectamente) la corrección de continuidad. Otro de los conflictos fue reconocer y

describir la distribución de probabilidades de la población, que concuerda con lo

indicado por Vallecillos (1999) quien indica que muchos alumnos tienen dificultad con

las distribuciones muestrales y su influencia en los procedimientos inferenciales. Sin

embargo, el hecho de que el proceso haya permitido identificarlos indica, por un lado

un grado de idoneidad semiótica. Por otro, proporciona los medios para aumentar

dicha idoneidad en futuras experimentaciones del material, donde se puede tener en

cuenta los conflictos semióticos identificados y tenerlos en cuenta en la revisión y

mejora del proceso de estudio.

Idoneidad mediacional

Es el grado de disponibilidad de los recursos materiales y temporales necesarios

para el desarrollo de la actividad (Godino, Contreras y Font, 2006). El proceso de

estudio analizado tiene una alta idoneidad mediacional, pues permitió a los estudiantes

el trabajo con el teorema central del límite desde tres configuraciones didácticas

diferenciadas: manipulativa, computacional y algebraica, para facilitar la comprensión

progresiva y generalización del teorema central del límite.

En otros cursos de estadística, las clases se desarrollan sólo en el aula

tradicional, presentando a los estudiantes generalmente actividades de problemas y

ejercicios con desarrollo algebraico y demostraciones de propiedades deducidas de los

teoremas y corolarios. Los modelos probabilísticos, presentados comúnmente en forma

matemática, y el estudio de su comportamiento en aplicaciones a la ingeniería, no es un

tema fácil para los estudiantes, que manifiestan sus dificultades y errores en las distintas

evaluaciones implementadas en un semestre académico.

Las actividades propuestas en este caso contemplan un rango de dificultad,

variedad de procedimientos y formas de exploración bastante mayor que la forma

tradicional presentada en los textos de estadística para ingenieros. La simulación y

posibilidades gráficas de software permitió a los estudiantes, sobre todo con applets en

los informáticos, explorar y visualizar conceptos y propiedades complejas, en el caso

de los modelos probabilísticos, analizar las familias de distribuciones de probabilidad

mediante el estudio de sus parámetros y las carácterísticas de la convergencia. En

Page 342: Significados del Teorema Central del Limite en la Enseñanza de la

Significado personal de los estudiantes

335335

nuestro proceso de estudio, las actividades planificadas en las tres lecciones guían de

forma inductiva la introducción del teorema central del límite, la comprensión de la

variabilidad y búsqueda de soluciones a problemas del diseño experimental de

situaciones a la ingeniería.

Las tres configuraciones didácticas implementadas permitieron ampliar

mediante la representación del teorema con ordenador la parte algebraica, conectando

los modelos de probabilidades con su experimentación. No obstante, si bien, las

actividades realizadas con el ordenador han complementado la construcción del

significado del teorema, ha implicado un coste cognitivo al alumno (Garfield y delMas,

1989), ya que deben asimilar distintas formas de comunicación en un tiempo limitado

de su carga académica del semestre.

La plataforma puesta a disposición de los estudiantes, permitió, asimismo,

ampliar sus posibilidades de trabajo en el tema, fuera de las lecciones programadas. El

único punto limitado fue el tiempo disponible que, aunque amplio para algunos de los

alumnos fue insuficiente para que otros llegaran a asimilar todos los objetivos

programados.

Idoneidad emocional

Describe el grado de implicación (interés, motivación) de los alumnos en el

proceso de estudio. La idoneidad emocional está relacionada tanto con factores que

dependen de la institución como con factores que dependen básicamente del alumno y

de su historia escolar previa (Godino, Contreras y Font, 2006).

Para valorarla, hay que tener en cuenta la caracterización del estudiante de

ingeniería cuyas competencias matemáticas son débiles y su ingreso a esta Universidad

no ha sido la primera opción. Los métodos tradicionales que se han estado aplicando en

la Universidad conlleva altos grados de reprobación de estos estudiantes en cursos de

Probabilidades y de Estadística, observando una desmotivación. Los alumnos expresan

su preocupación por la cantidad y complejidad de conceptos y propiedades que han de

asimilar. Una primera medida de la idoneidad emocional fueron los resultados de la

encuesta de evaluación del desempeño docente en el aula de estadística, en los que la

etapa de implementación del proceso de estudio fueron bien evaluados, con un alto

porcentaje favorable a la pregunta si realizaría el curso con el mismo profesor.

En este proceso de estudio se trató de ampliar la idoneidad emocional mediante

un diseño cuidadoso de las aplicaciones presentadas en diversas áreas de la ingeniería.

Page 343: Significados del Teorema Central del Limite en la Enseñanza de la

Capitulo 7

336

Ello llevó a una implicación bastante alta de los estudiantes, puesto de manifiesto en el

número de proyectos presentados (83 de un total de 106 estudiantes que se presentaron

al examen final, hubo otros alumnos que no la rindieron por tener nota de presentación a

examen calificada de bueno), así como en las temáticas elegidas para los mismos.

Page 344: Significados del Teorema Central del Limite en la Enseñanza de la

CAPÍTULO 8.

CONCLUSIONES

8.1. INTRODUCCIÓN

En esta memoria se ha presentado un estudio teórico y experimental sobre la

enseñanza del teorema central del límite en el contexto de las carreras de ingeniería,

basado en el enfoque ontosemiótico desarrollado por Godino y colaboradores, que se

recogen en las referencias citadas a lo largo de la investigación y publicadas de 1994 a

2007. El marco teórico ha permitido analizar sistemáticamente el significado de

referencia del teorema central del límite como objeto matemático y comparar el

significado institucional pretendido con el implementado por el profesor. También se ha

intentado evaluar criterios de idoneidad didáctica del proceso de estudio diseñado y el

significado personal adquirido por estudiantes de ingeniería en una asignatura de

Estadística del área de Ciencias Básicas, comparándolo con el significado

implementado.

A continuación, se presentarán las principales conclusiones desprendidas en los

diferentes capítulos. Se comienza describiendo las conclusiones respecto a los objetivos

e hipótesis de la investigación y presentando las aportaciones más relevantes. Se finaliza

indicando las implicaciones de los resultados de esta memoria para la enseñanza de la

estadística en la educación universitaria y su alcance para futuras líneas de

investigación.

8.2. CONCLUSIONES EN RELACIÓN A LOS OBJETIVOS

En el Capítulo 1 se planteó un objetivo general y varios objetivos específicos. El

objetivo general propuesto se dirigió a fundamentar, diseñar y evaluar un proceso de

enseñanza y aprendizaje del teorema central del límite, que describiése la

implementación de dicho proceso y el aprendizaje de los estudiantes, en la misma línea

de otras investigaciones realizadas en la Universidad de Granada sobre educación

estadística y principalmente de la tesis de Tauber (2001). Este objetivo se expresó en los

siguientes términos:

337

Page 345: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

Diseñar y evaluar un proceso de estudio dirigido sobre el teorema central del

límite a estudiantes de ingeniería, que tenga en cuenta la evolución histórica del

teorema, el contexto educativo y tipos de estudiantes junto con el marco teórico en que

se basa la investigación.

Se ha intentado responder a este objetivo mediante el diseño y evaluación de un

proceso de estudio fundamentado por un riguroso análisis de tipo teórico y

experimental. El marco teórico permitió desglosar el objeto "teorema central del límite"

en componentes específicos, que han sido estudiados desde el punto de vista

institucional y personal con exhaustividad. Este objetivo general se divide, en otros

específicos, cuyos resultados se describen a continuación, tratando de justificar el grado

de cumplimiento en cada cuestión.

Objetivo 1

Realizar un análisis epistemológico de la evolución histórica del teorema

central del límite desde el punto de vista de su significado, identificando los diversos

campos de problemas abordados, así como las diversas formulaciones (enunciados) del

mismo.

Este objetivo se abordó en el Capítulo 2 (Sección 2.3) donde se estudia la

historia del teorema central del límite, identificando siete campos de problemas,

comenzando por la necesidad de aproximar la distribución binomial para valores

grandes del parámetro n, hasta llegar a la generalización del teorema para la distribución

de la suma de variables aleatorias dependientes. También se describieron otros campos

consistentes en el estudio de las condiciones necesarias y suficientes para su aplicación.

El interés de matemáticos de prestigio (desde Laplace a Lévy) en el desarrollo del

teorema (1733 a 1937), así como sus numerosas aplicaciones, dan cuenta de su

relevancia en la teoría de la probabilidad y estadística matemática (ver Tabla 2.3.8.1).

La descripción de los progresivos campos de problemas permitió posteriormente, dirigir

el diseño del proceso de estudio sobre el teorema, de acuerdo a los estudiantes de

ingeniería, considerando tres campos de problemas con intensidad progresiva en la

abstracción de los contenidos y manteniendo el orden de la evolución histórica.

338

Page 346: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

El desarrollo histórico permitió también describir diferentes enunciados del

teorema y caracterizar las herramientas matemáticas usadas en su demostración. Dichas

herramientas incluyen temas asequibles a los estudiantes de ingeniería, como la

distribución normal, transformaciones algebraicas, tipificación de variables aleatorias y

cálculo de probabilidades. Pero también contienen otros, como la función generatriz de

momentos, desarrollo en serie o método de momentos que, si bien es cierto podrían

estar al alcance de estos estudiantes, se hacen inviables en el tiempo disponible de

estudio. La caracterización de estos procedimientos condujo al desafío de implementar

otras dos herramientas previas (configuraciones manipulativa y de simulación) para

sustituir dichos procedimientos formales y lograr un grado de comprensión aceptable

del teorema central del límite. Con todo ello, se ha establecido una primera parte del

significado institucional de referencia del teorema central del límite.

Los resultados de este estudio se publicaron en Alvarado (2004c) y Alvarado y

Batanero (2006a).

Objetivo 2

Describir el significado que se presenta del teorema central del límite en los

libros de estadística para ingenieros, identificando los campos de problemas, lenguaje,

procedimientos, enunciados, propiedades y argumentos usualmente utilizados en la

enseñanza a ingenieros en una muestra representativa de libros de texto destinados a

estos estudiantes.

Este objetivo se aborda en el Capítulo 4, mediante un estudio de la presentación

del teorema en una muestra de dieciséis libros de textos universitarios específicos que se

presentan en la Tabla 4.2.1. Mediante el análisis de contenido (Weber, 1985; Ghiglione

y Matalón, 1991) se ha identificado y caracterizado las diferentes categorías de los

elementos de significado más comunes del teorema central del límite en estos libros,

revelándose la complejidad del significado del teorema y su enlace con otros conceptos

estadísticos importantes. Este estudio, que ha enriquecido y complementado el estudio

histórico, ha sido la base del proceso de estudio, teniendo presente en el diseño los

posibles conflictos para una correcta aplicación del mismo.

En el estudio de los libros surgieron algunos nuevos campos de problemas de

aplicación y se mostró que el aparato avanzado formal de demostración es sustituido en

los textos por una aproximación menos rigurosa pero más adecuada al tipo de alumnos,

339

Page 347: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

donde se emplean otras formas de argumentación como el estudio de ejemplos y

contraejemplos. El análisis también permitió mostrar la escasa presencia de las

representaciones gráficas y simulaciones, medios que consideramos relevantes para el

estudio del teorema. También se observó falta de relación del teorema central del límite

con los subsiguientes temas de inferencia, así como la no diferenciación del teorema en

la aplicación a la media o a la suma de variables aleatorias y poco estudio de las

condiciones de convergencia para familias usuales de distribuciones, como la

distribución uniforme o binomial.

Los resultados obtenidos se han presentado en Alvarado (2004a) y Alvarado y

Batanero (2005b).

Objetivo 3

Seleccionar los elementos de significados más adecuados a la construcción de la

propuesta didáctica, contextualizándolos en campos específicos de problemas con

aplicación a la ingeniería y definiendo las configuraciones didácticas adecuadas para

abordar su enseñanza. Secuenciar y organizar estos elementos y configuraciones en un

proceso de estudio viable para la enseñanza del teorema central del límite a ingenieros

y analizar esta propuesta con objeto de determinar el significado de referencia

pretendido en el proceso de estudio.

La propuesta del proceso de estudio del teorema, analizada en el Capítulo 5, se

basó en el estudio previo histórico y de libros de textos organizándose en tres lecciones,

incorporando también otra sobre conceptos previos acerca de la distribución de

estimadores que provienen de poblaciones con distribución normal. Estas lecciones

complementan los símbolos, procedimiento algebraico en la resolución de problemas,

presentación de forma general del teorema para la media muestral, presentes en los

textos analizados junto con otros procedimientos, lenguaje y argumentos del teorema,

que no están destacados en textos de estadística para ingenieros.

El estudio previo de una muestra amplia de textos con distintos enfoques,

permitió guiar en el diseño al estudiante para un acercamiento progresivo al teorema,

presentándose más de una forma de comunicación e incorporándose situaciones de

aplicación a la ingeniería, con justificación paso a paso en los procedimientos,

argumentando el teorema mediante simulación, tomando decisiones en base a la

utilización del teorema y haciendo notar la diferencia de la convergencia en distribución

340

Page 348: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

para la suma de variables aleatorias y para el promedio muestral. Además, se establecen

varias formulaciones matemáticas del teorema y sobre todo el recurso tecnológico

(plataforma virtual, applet y software estadístico) que se pone a disposición de los

estudiantes y profesores.

El diseño, construido en orden creciente de dificultad y de acuerdo al desarrollo

histórico, permitió ir ampliando el alcance de aplicación de esta proposición según la

naturaleza de las variables, comenzando con su aplicación a la distribución binomial,

luego a variables discretas y finalmente a variables continuas. Para ello, se tuvo presente

varios factores, como el tiempo dedicado a la enseñanza en las distintas sesiones por

semana y las exigencias del programa de la asignatura de Estadística para ingenieros.

También se incorporaron tres configuraciones epistémicas (manipulativa, algebraica y

computacional) como recurso para la resolución de una situación-problema.

En las distintas secciones de cada lección se consideraron la idoneidad afectiva;

incluyendo campos de problemas accesibles a los estudiantes, contextualizados en

aplicaciones a la ingeniería y con bastantes actividades a resolver individual y

colectivamente, tanto en la clase como fuera del aula y estableciendo las funciones

específicas del alumno como también del profesor. Así, se determinó el significado

institucional de referencia pretendido del teorema central del límite, resumido en la

Tabla 5.7.1, constatándose una buena idoneidad epistémica al considerar los elementos

de significado más importantes del teorema. Además, este diseño aporta una base

consistente para compararlo con el significado personal que construyeron los

estudiantes sobre el teorema (idoneidad cognitiva).

Todo este proceso de estudio es analizado con detalle, para cada sesión y

actividad, en el Capítulo 5, proporcionando como conclusión una descripción del

significado de referencia pretendido, que se resume en la Tabla 5.7.1. Los resultados de

esta fase se han publicado en Alvarado y Batanero (2006b).

Objetivo 4

Experimentar el proceso de estudio, observación del mismo y evaluar su

idoneidad potencial para los fines pretendidos.

En el Capítulo 6 se describe la experimentación y observación del proceso de

estudio diseñado en un curso de Estadística dirigido a ingenieros, en el que participan

134 estudiantes aunque, como en cualquier curso universitario, no todos están presentes

341

Page 349: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

en todas las sesiones. La observación se lleva a cabo mediante un estudio cualitativo y

diferentes metodologías, que incluyen la observación en el aula y el análisis de las

producciones escritas de los estudiantes dentro y fuera del aula, así como una breve

evaluación al finalizar cada una de las tres lecciones.

Como resultado de esta observación se ha evaluado positivamente la

implementación del proceso de estudio, destacando una alta idoneidad epistémica, al

considerar la mayoría de los elementos de significado pretendido del teorema. Se

observa una alta idoneidad afectiva al implementar la exploración del teorema en

distintas distribuciones de probabilidades en campos de problemas que interesaron a la

mayoría de los estudiantes. Las nuevas aplicaciones del teorema con apoyo

principalmente de dispositivos de simulación aumentaron la idoneidad mediacional y

didáctica, plasmada en el compromiso de entrega oportuna de las variadas actividades.

La comprensión del teorema que se deduce de la observación y análisis de

actividades y evaluaciones en general se estima, aunque también permitió describir los

conflictos semióticos observados mediante las evaluaciones continuas parciales

realizadas, durante y al finalizar cada una de las tres lecciones. La experiencia sugiere

que la idoneidad cognitiva debe ser revisada en futuras experiencias de enseñanza. En

particular, se podría mejorar la conexión de contenidos teóricos y aplicaciones con las

situaciones, procedimientos y argumentos establecidos anteriormente, así como insistir

en el uso de la corrección de continuidad. En consecuencia, la idoneidad interaccional

fue positiva, pero no suficiente, al detectarse la mayoría de los conflictos semióticos

solo una vez finalizada la experiencia didáctica.

Objetivo 5

Evaluar el significado personal de los estudiantes al finalizar el proceso de

estudio y compararlo con el significado institucional implementado.

Este último objetivo fue analizado en el Capítulo 7, por medio de los resultados

de la evaluación llevada a cabo al finalizar la enseñanza, mediante un cuestionario y

varios problemas abiertos desarrollados por los estudiantes. En base al análisis a priori

del significado evaluado, se caracterizó la comprensión lograda por los futuros

ingenieros, describiéndose los problemas identificados en forma pertinente, además de

los procedimientos, lenguaje, propiedades y argumentos del teorema usados

correctamente.

342

Page 350: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

En base a los resultados podemos decir que, en general fueron positivos en

cuanto a reconocer campos de problemas específicos, elegir un lenguaje adecuado y

trabajar los algoritmos numéricos y gráficos enlazando estos elementos en una

argumentación aceptable.

En particular, los estudiantes de ingeniería han mostrado una mejor

comprensión, del análisis de la distribución aproximada de la media muestral de

variables aleatorias independientes idénticamente distribuidas, que provienen de

poblaciones binomiales. Esto es corroborado por un número importante de problemas

creados por los alumnos, utilizando correctamente esta población de origen en la prueba

abierta de ensayo. Tampoco tuvo mayor dificultad el lenguaje simbólico, con algunas

excepciones en los problemas algebraicos abiertos. El procedimiento algebraico y la

tipificación fueron los mejor utilizados en general, así como la simulación en la

resolución del proyecto contextualizado con apoyo de Excel. Se destaca la apropiación

de las propiedades de la media y varianza de la suma de variables aleatorias y en el

proyecto, la argumentación vía simulación gráfica.

Por otro lado, fueron varios los elementos de significado del teorema que no han

sido aplicados correctamente en los diferentes instrumentos de evaluación, evidenciando

la dificultad de identificación de algunos campos de problemas e identificación de la

distribución de probabilidad que modela la variable estadística en una aplicación a la

ingeniería. Los principales elementos que dan origen a conflictos semióticos en una

proporción importante de los alumnos son los siguientes: No reconocer campos de

problemas en problemas específicos de aplicación a la ingeniería, expresión verbal

incorrecta en una gama de palabras relacionadas con el teorema, errores de

estandarización al confundir la suma de variables aleatorias con el promedio, no aplicar

la corrección de continuidad y no ser capaces de dar una decisión en base al análisis del

teorema central del límite.

El grado de comprensión del teorema en las pruebas de evaluación sugiere de

nuevo, que la idoneidad cognitiva fue positiva pero desigual en el aprendizaje. El grupo

de alumnos, utilizó en promedio y significativamente más elementos de significado del

teorema en forma correcta que incorrecta. Sin embargo, habrá que implementar

acciones de mejora en los elementos menos alcanzados. Como se ha indicado también,

la idoneidad semiótica fue insuficiente para resolver cada uno de los conflictos

detectados y ha de ser mejorada. Parte de los resultados se han publicado en Alvarado y

Batanero (2007).

343

Page 351: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

8.3. CONCLUSIONES EN RELACIÓN A LAS HIPÓTESIS

En relación a las expectativas iniciales que se tenían sobre lo que se esperaba

confirmar con esta investigación, han sido analizadas en las siguientes hipótesis del

trabajo:

Hipótesis 1

H1: El significado del teorema central del límite tiene un carácter complejo,

debido a la multiplicidad de elementos y su interrelación, y ha ido surgiendo

lentamente a lo largo de la historia. Diversos campos de problemas dieron lugar a

enunciados diferenciados del teorema.

Esta hipótesis fue analizada en el estudio histórico, que mostró los variados

campos de problemas de los que surge el teorema central del límite, la diversidad de

objetos asociados y su aparato analítico altamente formalizado. La deducción de las

diferentes versiones del teorema ha evidenciando una sofisticada argumentación

algebraica para llegar a la generalización de diversos tipos de variables y estudiar las

condiciones de validez y alcance de aplicaciones en determinados campos de

problemas. Una primera consecuencia es que la enseñanza de este teorema en cursos de

servicio, tales como los de ingeniería, requería un gran esfuerzo didáctico para

simplificar la presentación y hacerla asequible a los estudiantes.

Hipótesis 2

H2: Asimismo, es complejo el significado del teorema central del límite

presentado en los textos de estadística dirigido a ingenieros y se encontrará una

variedad de enfoques y aproximaciones. En relación a los campos de problemas, se

descubrirán nuevos campos de aplicación y faltarán los campos más complejos. Las

herramientas para resolver los problemas serán de menor complejidad que las usadas

en el estudio histórico, lo que conllevará una menor rigurosidad en las demostraciones

del teorema.

La hipótesis 2, que está en relación con el objetivo 2, y que se deduce de la

anterior, fue corroborada por el análisis de una muestra de libros de textos de estadística

para ingenieros y otros libros con enfoque clásico, que presentan fundamentos

probabilísticos del teorema y tienen un nivel intermedio. El análisis mostrado en el

344

Page 352: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

Capítulo 4 verificó que los textos considerados minimizan las aplicaciones, dando

prioridad al procedimiento y argumentación algebraica. También apoyan los resultados

de otras investigaciones sobre libros de texto de investigadores en Educación Estadística

(Tauber, 2001; Cobo, 2003) que sugieren posibles obstáculos en la presentación de

otros conceptos previos necesitados, como medidas de posición central o la distribución

normal.

Hipótesis 3

H3: La introducción de tres configuraciones epistémicas (manipulativa,

computacional y algebraica) permitirá introducir elementos originales en el significado

de referencia pretendido en la investigación. En particular, la introducción del

ordenador permitirá variación en los campos de problemas, lenguaje y modos de

argumentación.

Esta hipótesis es justificada por los resultados obtenidos en el análisis a priori

del proceso de estudio (Capítulo 5), donde se describe el significado institucional

pretendido. En dicho análisis es visible un abanico amplio de aplicaciones del teorema

central del límite apoyado en las tres configuraciones epistémicas descritas.

Algunos de los elementos originales son la simulación gráfica en forma

dinámica utilizada, tanto como procedimiento de exploración y resolución de

problemas, como para ampliar los tipos de argumentación. El uso de la configuración

manipulativa incorpora y pone en relación con el teorema central del límite objetos

como los de variable estadística y su distribución o la concepción frecuencial de la

probabilidad. El lenguaje gráfico se amplía notablemente mediante la configuración

computacional, tanto en variedad como en posibilidad de ejecución rápida por parte del

estudiante. Los problemas pueden ser más reales al utilizar conjuntos de datos y poder

realizar los cálculos de una forma automática.

Finalmente se destaca la alta correspondencia en la implementación de muchos

de los elementos de significado del teorema presentado en el diseño (significado

pretendido e implementado).

Hipótesis 4

H4: A lo largo de la enseñanza surgirán conflictos semióticos, algunos de los

cuáles se harán explícitos a través de las preguntas de los estudiantes en clase o de las

345

Page 353: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

respuestas a actividades escritas. La gama de dificultades y conflictos planteados

ampliará los resultados de las investigaciones previas sobre el teorema central del

límite.

El análisis de las interacciones observadas en algunas de las actividades

realizadas en clase, así como de las respuestas escritas en la evaluación continua y

tareas realizadas fuera de la clase (Capítulo 6), apoyó esta hipótesis. Es visible de la

descripción hecha en este capítulo (así como de lo previsto en el análisis a priori del

Capítulo 5) los numerosos conflictos y dificultades de los estudiantes en las tareas y

actividades planteadas. La comprensión observada fue desigual, dependiendo de los

elementos de significado, en que algunos fueron retroalimentados oportunamente,

llegando a solucionar el conflicto y en otros (como obtener una conclusión basada en el

teorema central del límite) no fue posible, debido principalmente al factor de tiempo.

Los resultados también corroboran los conflictos descritos en las investigaciones

de Méndez (1991) y Kahneman y cols. (1982) por ejemplo, la confusión de parámetro y

estadístico o la heurística de la representatividad. Se encontraron nuevas dificultades, no

descritas en la investigación previa, como definir inadecuadamente la variable que

modeliza el experimento o el problema situado a la ingeniería y reconocer parcialmente

la distribución de probabilidad asociada, no diferenciar una variable discreta de una

continua por ejemplo, la distribución Poisson de la distribución exponencial y

considerar en el cálculo de probabilidades la varianza de la suma de variables aleatorias

en la tipificación en lugar de la desviación estándar. Otros conflictos son no considerar,

además del tamaño muestral, la naturaleza de la distribución de probabilidades en una

convergencia óptima del teorema y en el caso de la suma de variables discretas,

confundir el número de ensayos de un experimento con el tamaño de la muestra.

Muchos de estos conflictos corresponden a conocimientos previos de la asignatura de

Probabilidades.

Hipótesis 5

H5: Se espera también que una parte importante de estas dificultades y

conflictos quede superada al finalizar la enseñanza y que los estudiantes usen

correctamente un gran abanico de elementos de significado del teorema central del

límite en sus respuestas a las tareas de evaluación, incluso en el caso en que no lleguen

a una respuesta totalmente correcta.

346

Page 354: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

La hipótesis fue corroborada por los resultados descritos en el Capítulo 7. Por un

lado, cuantitativamente se observa una diferencia estadísticamente significativa en el

número de elementos de significado usados correcta o incorrectamente en cada una de

las pruebas abiertas así como en su conjunto. Por otro, se describen con detalle dando

frecuencias los elementos específicos cuya comprensión se observa en los estudiantes,

tanto en las pruebas abiertas como en el cuestionario de opciones múltiples.

La comprensión en las actividades y ejercicios de las lecciones, sobre todo del

lenguaje gráfico, fue aceptable en general, permitiendo la generalización del teorema a

otras distribuciones importantes en ingeniería por medio de situaciones de contexto. A

partir de las representaciones gráficas dinámica con applets y software estadístico, los

alumnos interactuaron con la simulación y efecto de los parámetros sobre la

aproximación y llegaron a una versión intuitiva del teorema, favorecida por dispositivos

didácticos. El estudio del teorema para el caso de la suma de variables continuas se basó

principalmente en actividades algebraicas en que la mayoría de los estudiantes

dominaron el cálculo de la esperanza y varianza de la suma de variables aleatorias.

Tampoco tuvieron problemas con la estandarización y el cálculo de probabilidades con

tablas de la distribución normal y mediante calculadora.

Hipótesis 6

H6: Analizada la multidimensionalidad de las respuestas de los alumnos al

cuestionario, se espera describir tipologías de estudiantes que correspondan a

significados personales diferenciadas sobre el teorema central del límite.

Las técnicas de análisis univariantes y multivariantes utilizadas en el Capítulo 7

han apoyado en gran medida este supuesto, en que logramos definir cuatro grupos de

estudiantes, en relación al tipo de comprensión lograda del teorema, que podemos

describir como configuraciones cognitivas diferenciadas y son los siguientes:

Alumnos que consideran el problema de aproximación de la distribución binomial a

la normal (CP1) y de la convergencia de la media muestral (CP12) como casos

particulares del teorema central del límite e identifican los diferentes enunciados del

teorema y condiciones de convergencia;

Alumnos que no incluyen en el teorema central del límite los anteriores campos de

problemas, aunque identifican sus diferentes enunciados y las condiciones de

347

Page 355: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

convergencia y que constituyen dos grupos que se diferencian entre si por errores en

algunos conceptos relacionados y en la correcta /incorrecta tipificación, es decir, en

algunos errores procedimentales;

Alumnos que, aunque incluyen el caso de la aproximación de la distribución

binomial a la normal (CP1) como un caso particular del teorema central del límite,

no comprenden las condiciones de la convergencia y confunden los diferentes

enunciados.

8.4. PRINCIPALES APORTACIONES DE LA INVESTIGACIÓN

El trabajo presentado a lo largo de esta memoria presenta algunas contribuciones

a la Didáctica de la Estadística a nivel universitario y en particular, al estudio de la

enseñanza del teorema central del límite, que se reflejan también en las diferentes

publicaciones citadas a lo largo de este capítulo y en la lista de referencias.

En primer lugar, se presentó una descripción pormenorizada de la evolución

histórica del teorema central del límite, que permite clasificar sus campos de problemas

y describir algunas de las herramientas analíticas empleadas en su resolución.

Asimismo, se hace un estudio exhaustivo analítico de la presentación del

teorema central del límite en una amplia muestra de libros de texto adecuados para la

enseñanza de ingenieros, clasificando los diversos tipos de elementos de significado y

estudiando su presencia en los mismos. Con todo ello se describe el significado de

referencia del teorema en esta investigación, que puede ser la base para otras

investigaciones sobre el teorema central del límite a nivel universitario.

Otro punto a destacar, es el diseño de un proceso de estudio sobre el teorema

central del límite dirigido a ingenieros, fundamentado en la evolución histórica del

teorema y análisis de los libros de texto, cuya estructura permite distintos acercamientos

hacia la comprensión del teorema. Se ha complementado la forma tradicional de

enseñanza del teorema basada principalmente en el razonamiento formal deductivo, con

una metodología inductiva, basada en la simulación manual y computacional,

aminorando el carácter abstracto de la presentación del teorema central del límite.

También se ha elaborado un cuestionario de evaluación, basado en ítems de

opciones múltiples y problemas abiertos. Estos instrumentos, aunque aún poco

validados, junto con el conjunto de actividades y ejercicios planteados en las tres

lecciones, podrían servir para construir otros instrumentos de evaluación. Además, se

pone a disposición de profesores e investigadores una medida del grado de comprensión

348

Page 356: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

adquirido por los estudiantes, analizando el acuerdo y desacuerdo entre el significado

previsto y el adquirido por los estudiantes.

Finalmente, el exhaustivo estado de la cuestión es una base para la investigación

posterior en el tema.

8.5. IMPLICACIONES PARA LA ENSEÑANZA DEL TEOREMA CENTRAL

DEL LÍMITE EN UN CURSO DE ESTADÍSTICA UNIVERSITARIA

La investigación realizada también proporciona algunas conclusiones de cara a

la docencia. Cada día hay más consenso que la problemática de aula debe estar centrada

en determinar y secuenciar los elementos prioritarios que debe establecer el profesor

para una enseñanza eficaz. Si bien hay esfuerzos en describir las características de los

estudiantes universitarios en relación a su rendimiento académico escolar y

competencias matemáticas previas al ingreso, son pocas las investigaciones que se

centran en avanzar en la mejora de los procesos de enseñanza aprendizaje, evaluando

criterios de idoneidad de procesos de estudio o los conflictos presentados en las

evaluaciones.

Este trabajo proporciona evidencia de los distintos factores que deberían tenerse

presente al momento de preparar la lección del teorema central del límite, considerando

por un lado, más de una forma de comunicar el objeto matemático-estadístico y por

otro, incorporando los recursos tecnológicos a la enseñanza. Además de variadas formas

de argumentación, se analiza la validez del teorema, según la naturaleza de las

distribuciones de probabilidades (discretas o continuas), que no es contemplada en la

mayoría de los libros de texto de estadística para ingenieros.

Todo ello podría ayudar a revisar el currículum de la asignatura de estadística,

respecto a una de las proposiciones fundamentales en esta materia, rica también en

aplicaciones a distintas áreas del conocimiento.

8.6. PERSPECTIVAS FUTURAS DE INVESTIGACIÓN

Finalmente, como en cualquier investigación didáctica, este trabajo tiene

limitaciones lógicas, debido a los necesarios procesos de muestreo (tipo y número de

estudiantes, tiempo limitado de enseñanza, número limitado de ítems de evaluación). Se

espera por tanto, que otros investigadores puedan completar este estudio, modificar

algunas de las variables y estudiar si las hipótesis formuladas se mantienen en otras

349

Page 357: Significados del Teorema Central del Limite en la Enseñanza de la

Conclusiones

experiencias educativas. Algunos puntos concretos en que la investigación podría

continuarse manteniendo este marco teórico, son los siguientes:

Repetir el proceso de estudio con estudiantes de otras características académicas

(por ejemplo, ingenieros en otras universidades o estudiantes de otras

especialidades) para evaluar si se repiten los resultados;

Mejorar el proceso de estudio para que permita superar los conflictos semióticos

descritos en esta investigación y que no fueron resueltos o que permitan identificar

otros nuevos;

Diseñar, implementar y evaluar variaciones del proceso de estudio con diferente

software estadístico y estudiar las consecuencias del cambio;

Mejorar los instrumentos de evaluación, para incluir el estudio de la comprensión

del teorema para la distribución de la suma de variables aleatorias independientes

no idénticamente distribuidas (CP3), que está al alcance de los futuros ingenieros y

que no fueron analizados. Incorporar también transformaciones de variables

aleatorias con distribución de probabilidades clásicas, como las que se presentan en

la propiedad P8 del Capítulo 4;

Continuar el estudio de la comprensión de las aplicaciones del teorema central del

límite en la construcción de intervalos de confianza y contrastes de hipótesis.

350

Page 358: Significados del Teorema Central del Limite en la Enseñanza de la

REFERENCIAS

Accreditation Board for Engineering and Technology. (1997). Trabajo presentado en el

Thirteenth Annual Meeting of National Electrical Engineering Department Heads

Association. Orlando, FL.

Afifi, A. y Azen, S. (1980). Statistical analysis: A computer oriented approach.

London: Academic Press.

Afifi, A. y Clark, V. (1990). Computer-aided multivariate analysis. New York: Van

Nostrand.

Alvarado, H. (2004a). Significado y comprensión de un teorema estadístico: Elementos

básicos en el desarrollo profesional del profesor para una buena enseñanza.

Boletín de Investigación Educacional, 19 (1), 227-244.

Alvarado, H. (2004b). Significado del teorema central del límite: elemento fundamental

en el desarrollo profesional del profesor para una buena enseñanza. Trabajo

presentado en el VI Congreso Latinoamericano de Sociedades de Estadística,

Universidad de Concepción, Chile.

Alvarado H. (2004c). Significados del teorema central del límite y sus campos de

problemas en los textos de estadística para ingenieros. Memoria de Tercer Ciclo,

Universidad de Granada, España.

Alvarado, H. y Batanero, C. (2004a). Elementos del significado del teorema central del

límite. Trabajo presentado en el VIII Simposio de la Sociedad Española de

Investigación en Educación Matemática, La Coruña, España.

Alvarado, H. y Batanero, C. (2004b). Elementos del significado del teorema central del

límite. Trabajo presentado en el I Coloquio de Estadística. Universidad del Bío-

Bío, Concepción, Chile.

Alvarado, H. y Batanero, C. (2005a). Diferentes aproximaciones al teorema central del

límite en la enseñanza a ingenieros. Congreso. Trabajo presentado en el IX

Congreso de Metodología de las Ciencias Sociales y de la Salud, Universidad de

Granada, Granada, España.

Alvarado, H. y Batanero, C. (2005b). Significado del teorema central del límite en

351

Page 359: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

textos universitarios de probabilidad y estadística. Trabajo presentado en las

XXXII Jornadas Nacionales de Estadística, Universidad de Valparaiso, Chile.

Alvarado, H. y Batanero, C. (2006a). El significado del teorema central del límite:

Evolución histórica a partir de sus campos de problemas. En A. Contreras, L.

Ordoñez y C. Batanero (Eds.), Investigación en Didáctica de las Matemáticas/

Congreso Internacional sobre Aplicaciones y Desarrollos de la Teoría de las

Funciones Semióticas (pp. 257-277). Jaén: Universidad de Jaén, España.

Alvarado, H. y Batanero, C. (2006b). Designing a study process of the central limit

theorem for engineers. En A. Rossman y B. Chance (Eds.), Proceedings of

ICOTS-7. Salvador (Bahia): International Association for Statistical Education.

CDROM.

Alvarado, H. y Batanero, C. (2007). Dificultades de comprensión de la aproximación

normal a la distribución binomial. Números, 67.

Alvarado, H., Sánchez, I. y Uribe, M. (2000). Correspondencia entre estrategias de

aprendizaje y rendimiento académico en estudiantes universitarios. Boletín de

Investigación Educacional, 15, 70-88.

Alvarado, H., Sánchez, I., Retamal, L. y Ramos, J. (2003). Una propuesta metodológica

hacia el aprendizaje activo en las matemáticas. Boletín de Investigación

Educacional, 18, 111-126.

Ardanuy, R. y Martín, Q. (1998). Estadística para ingenieros. Salamanca: Hespérides.

Artigue, M., Batanero, C. y Kent, P. (2007). Mathematics thinking and learning at post-

secondary level. En F. Lester (Ed.), En F. Lester (Ed.), Second Handbook of

Research on Mathematics Teaching and Learning (pp. 1011-1049). Greenwich,

CT: Information Age Publishing, Inc., & NCTM.

Batanero, C. (2000) Controversies around significance tests, Mathematical Thinking

and Learning, 2 (1-2), 75–98.

Batanero, C. (2001). Didáctica de la Estadística. Grupo de Investigación en Educación

Estadística, Universidad de Granada.

Batanero, C. (2003). La simulación como instrumento de modelización en probabilidad.

Educación y Pedagogía, 35, 37-64.

Batanero, C. (2006). The challenges of teaching statistical inference. En H. Bacelar

(Ed.), XIII Jornadas de Classificaçap e Analise de Dados (pp. 162-166). Lisboa:

Associaçao de Clasificaçao e Analise de Dados.

Batanero, C. y Díaz, M. C. (2006). Methodological and didactical controversies around

352

Page 360: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

statistical inference. Actes du 38iémes Journeés de Statistique. Paris: Société

Française de Statistique. CD ROM.

Batanero, C., Tauber, L. y Meyer, R. (1999). From data analysis to inference: A

research project on the teaching of normal distributions. Proceedings of the 52nd

Session of the International Statistical Institute (Tome LVIII, Book 1, pp. 57-58).

Helsinki: ISI.

Batanero, C., Tauber, L. y Sánchez, B. (2001). Significado y comprensión de la

distribución normal en un curso de análisis de datos. Quadrante, 10 (1), 59-92.

Batanero, C., Tauber, L. y Sánchez, V. (2004). Student’s reasoning about the normal

distribution. En D. Ben-Zvi y J. B. Garfield (Eds.), The challenge of developing

statistical literacy, reasoning, and thinking (pp. 257-276). Dordrecht: Kluwer.

Behar, R. (2001). Aportaciones para la mejora del proceso de enseñanza-aprendizaje

de la estadística. Tesis Doctoral. Universidad Politécnica de Cataluña, España.

Biehler, R. (1991). Computers in probability education. En R. Kapadia y M. Borovcnick

(Eds.), Chance encounters: Probability in education (pp. 169-211). Dordrecht:

Kluwer.

Biehler, R. (1997). Software for learning and for doing statistics. International

Statistical Review, 65 (2), 167-190.

Bisquerra, R. (1989). Métodos de investigación educativa. Barcelona: CEAC.

Brent, E. E. (1989). Data collection selection: An expert system to assist in the selection

of appropriate data selection procedures. Columbia, MI: The Idea Works inc.

Bunge, M. (1985). La investigación científica. Madrid: Ariel.

Cam, L. (1986). The central limit theorem around 1935. Statistical Science 1(1), 78-96.

Canavos, G. (1992). Probabilidad y estadística. México: McGraw Hill.

Carrasco, G. (2002). Determinación de tamaños muestrales mínimos para la aplicación

del teorema central del límite en poblaciones forestales. Tesis de Magíster.

Universidad de Concepción, Chile.

Castillo, J. (1990). Estadística inferencial básica. México: UNAM.

Chance, B. L., delMas, R. C., y Garfield, J. B. (2004). Reasoning about sampling

distributions. En D. Ben-Zvi y J. Garfield (Eds.), The challenge of developing

statistical literacy, reasoning, and thinking. Dordrecht, The Netherlands: Kluwer.

Chance, B. L., Garfield, J. B. y delMas, R. C. (1999). The role of assessment in research

on teaching and learning statistics. Trabajo presentado en el American

Educational Research Association. Annual Meeting. Montreal, Canadá.

353

Page 361: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

Chevallard (1991). La transposition didactique. Du savoir savant au savoir enseigné.

Grénoble: La Pensée sauvage.

Comisión Nacional de Acreditación de Pregrado (2003). Criterios de acreditación de

carreras de ingeniería. Santiago, Chile. On line: http://www.cnap.cl/.

Cobo, B. (2003). Significado de las medidas de posición central para los estudiantes de

secundaria. Tesis Doctoral. Universidad de Granada.

Countinho, C. (2001). Introduction aus situations aléatoires dés le Collége: de la

modélisation à la simulation d´experiences de Bernoulli dans l´environment

informatique Cabri-géomètre-II. Tesis Doctoral. Universidad de Grénoble.

Cuadras, C. (1991). Análisis multivariante. Barcelona: Eunibar.

Cuadras, C. (1999). Problemas de probabilidades y estadística. Barcelona: EUB.

Curcio, F. R. (1989). Developing graph comprehension. Reston, VA: N.C.T.M.

Dane, F. C. (1990). Research methods. Pacific Grove: Cole Publishing Company.

De Groot, M. (1988). Probabilidad y estadística. Wilmington: Addison-Wesley.

delMas, R. C., Garfield, J. B. y Chance, B. L. (1998). Exploring the role of computer

simulations in developing understand of sampling distributions. Trabajo

presentado en el American Educational Research Association. Annual Meeting.

Montreal.

delMas, R. C., Garfield, J. B. y Chance, B. L. (1999). A model of classroom research in

action: developing simulation activities to improve students´ statistical reasoning.

Journal of Statistic Education, 7, 3. On line:

http://www.amstat.org/publications/jse.

delMas, R. C., Garfield, J. B. y Chance, B. L. (2004). Using assessment to study the

development of students` reasoning about sampling distributions. Trabajo

presentado en el American Educational Research Association. Annual Meeting.

California.

Devore, J. (2001). Probabilidad y estadística para ingeniería y ciencias (5ª ed.).

México: Thompson.

Díaz, C. y de la Fuente, I. (2004). Controversias en el uso de la inferencia en la

investigación experimental. Metodología de las Ciencias del Comportamiento..

Volumen especial 2004, 161-167.

Durand, A. e Ipiña, S. (1994). Introducción a la teoría de la probabilidad y la

inferencia estadística. Madrid: Rueda.

Estepa, A. (1993). Concepciones iniciales sobre la asociación estadística y su evolución

354

Page 362: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

como consecuencia de una enseñanza basada en el uso de ordenadores. Tesis

Doctoral. Universidad de Granada.

Estepa, A. y Moya, J. (2007). The meaning of statistics variation in university books in

Spain. En A. Rossman y B. Chance (Eds.). Proceedings of ICOTS-7. Salvador

(Bahia): International Association for Statistical Education. CDROM.

Fischbein, E. (1975). The intuitive sources of probabilistic thinking in children.

Dordrecht: Reidel.

Fisher, H. (2000). The central limit theorem from Laplace to Cauchy: Changes in

stochastic objetives and in analytical methods. On line: http://mathsrv.ku-

eichstaett.de/MGF/homes/didmath/seite/1850.pdf.

Fox, D. J. (1981). El proceso de investigación en la educación. Pamplona: Eunsa.

Freudenthal, H. (1991). Revisiting mathematics education. Dordrecht: Kluwer.

Freund, J. y Smith, R. (1989). Estadística. Cuarta edición. México: Prentice Hall.

Gal, I. (1997). Assessing students` interpretations of data: Conceptual and pragmatic

issues. En B. Phillips (Ed.), Papers on Statistical Education presented at ICME-8

(pp. 49-58). Universidad Tecnológica de Swinburne.

Gallardo, S. (2001). Variabilidad y representatividad muestral: Un estudio de casos.

Trabajo de Investigación Tutelada. Universidad de Granada.

García Cruz, J.A. (2002). Inferencia y significación estadística. En E. Palacián y J.

Sancho (Eds.), Actas de las X JAEM (Vol. II, 457-466). ICE Universidad de

Zaragoza, Sociedad Aragonesa de Profesores de Matemáticas.

García Cruz, J.A. (2007). La construcción del significado en la enseñanza de la

inferencia estadística. Actas de las XII Jornadas para el Aprendizaje y Enseñanza

de las Matemáticas (pp. 237-247). Universidad de Castilla-La Mancha. Albacete.

Garfield, J. B., y delMas, R. C. (1989). Reasoning about chance events: Assessing and

changing students`conceptions of probability. En C. Maher, G. Goldin y B. Davis

(Eds.), Proceedings of the Eleven Annual Meeting of the North American Chapter

of the International Group for the Psychology of Mathematics Education (vol. 2,

184-195). Rutgers: Rutgers University Press.

Garfield, J. B., delMas, R. C., y Chance, B. L. (2004). Tools for teaching and assessing

statistical inference. On line: http://www.tc.umn.edu/~delma001/stat_tools/.

Ghiglione, R. y Matalón, B. (1991). Les enquêtes sociologiques. Théories et practique.

París: Armand Colin.

Gil, J. (1994). Análisis de datos cualitativos. Barcelona: P.P.U.

355

Page 363: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

Glencross, M. (1988). A practical approach to the central limit theorem. En R. Davidson

y J. Swift (Eds.), Proceedings of the Second International Conference on

Teaching Statistics (pp. 287-291). Victoria BC: University of Victoria.

Godino, J. D. (1995). ¿Qué aportan los ordenadores a la enseñanza y aprendizaje de la

estadística? UNO, 5, 45-55.

Godino, J. D. (1996a). Relaciones entre la investigación en didáctica de las matemáticas

y la práctica de la enseñanza. En L. Puig y J. Calderón (Eds.), Investigación y

Didáctica de las Matemáticas (pp. 119-128). Madrid: CIDE.

Godino, J. D. (1996b). Significado y comprensión de los conceptos matemáticos. En

Puig y A. Gutierrez (Eds), Proceedings of the 20th PME Conference (pp. 417-

424). Universidad de Valencia.

Godino, J. D. (1998). Un modelo semiótico para el análisis de la actividad y la

instrucción matemática. Comunicación presentada en el VIII Congreso

Internacional de la Asociación Española de Semiótica. Granada.

Godino, J. D. (1999a). Implicaciones metodológicas de un enfoque semiótico-

antropológico para la investigación en didáctica de la matemática. En T. Ortega

(Ed.), Actas del III Simposio de la SEIEM (pp. 196-212). Valladolid: SEIEM.

Godino, J. D. (1999b). Análisis epistémico semiótico y didáctico de procesos de

instrucción matemática. Trabajo presentado en el III Simposio de la SEIEM,

Valladolid. On line: www.ugr.es/~jgodino/semioesp/aepistemico.htm.

Godino, J. D. (2002a). Un enfoque ontológico y semiótico de la cognición matemática.

Recherches en Didactique des Mathematiques, 22 (2 y 3).

Godino, J. D. (2002b). Competencia y comprensión matemática: ¿Qué son y cómo se

consiguen? UNO, 29, 9-19.

Godino, J. D. y Batanero, C. (1994). Significado institucional y personal de los objetos

matemáticos. Recherches en Didactique des Mathématiques, 14 (3), 325-355.

Godino, J. D. y Batanero, C. (1998a). Clarifying the meaning of mathematical objects as

a priority area of research in Mathematics Education. En A. Sierpinska y J.

Kilpatrick (Eds.), Mathematics education as a research domain: A search for

identity (pp. 177-195). Dordrecht: Kluwer.

Godino, J. D. y Batanero, C. (1998b). Funciones semióticas en la enseñanza y

aprendizaje de las matemáticas. En I. Vale y J. Portela (Eds.), IX Seminario de

Investigaçao em Educaçao Matemática (pp. 25-45). Lisboa: Associaçao de

Profesores de Matemática.

356

Page 364: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

Godino, J. D. y Batanero, C. (2003). Semiotic functions in teaching and learning

mathematics. En M, Anderson, A. Sáenz-Ludlow, S. Zellweger y V,V, Cifarelli

(Eds.), Educational perspectives on mathematics as semiosis: From thinking to

interpreting to knowing (pp. 149-168). New York: LEGAS.

Godino, J. D., Batanero, C. y Fonts, V. (2007). The onto-semiotic approach to research

in mathematics education. Zentralblatt für Didaktik der Mathematik, 39(1-2), 127-

135.

Godino, J D., Batanero, C. y Roa, R. (2005). A semiotic analysis of combinatorial

problems and its resolution by university students. Educational Studies in

Mathematics, 60 (1), 3-36,

Godino, J. D., Bencomo, E., Font, V. y Wilhelmi, M. (2007). Análisis y valoración de la

idoneidad didáctica de procesos de estudio de las matemáticas. Paradigma, 27 (2),

221-252.

Godino, J. D., Contreras, A. y Font, V. (2006). Análisis de procesos de instrucción

basado en el enfoque ontológico-semiótico de la cognición matemática.

Recherches en Didactiques des Mathematiques, 26 (1), 39-88.

Goetz, J. P. y Lecompte, M. D. (1988). Etnografía y diseño cualitativo en educación.

Morata: Madrid.

Hald, A. (1998). A history of mathematical statistics from 1750 a 1930. New York:

John Wiley.

Harlow, L. L., Mulaik, S. A. y Steiger, J. H. (1997) What if there were no significance

tests? Mahwah, NJ: Erlbaum.

Hawkins, A., Joliffe, F. y Glickman, L. (1992). Teaching statistical concepts. Londres:

Longman.

Heitele, D. (1975). An epistemological view on fundamental stochastic ideas.

Educational Studies in Mathematics, 6, 187-205.

Instituto de Ingenieros de Chile (2002). Educación en ingeniería: Una visión

integradora de las perspectivas profesional y académica. Santiago. On line:

http://www.iing.cl/iexplorer/index_public.html.

James, B. (1981). Probabilidade: um curso em nível intermediario. Brasil: Euclides.

Johnson, R. y Kuby, P. (2004). Estadística elemental (3ª ed.). México: Thompson.

Kahneman, D., Slovic, P., & Tversky, A. (1982) Judgment under uncertainty:

Heuristics and biases. New York: Cambridge University Press.

Kalbfleisch, J. (1984). Probabilidad e inferencia estadística. Madrid: AC.

357

Page 365: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

Kennedy, J. y Neville, A. (1982). Estadística para ciencias e ingeniería (2ª ed.).

México: Harla.

Lebart, L., Morineau, A. y Fénelon, J. (1985). Tratamiento estadístico de datos.

México: Marcombo.

Lehmann, E. L. (1999). Elements of large-sample theory. New York: Springer.

Lipson, K. (1994). Understanding the role of computer based technology in developing

fudamental concepts of statistical inference. En Proceedings of the IV

International Conference on Teaching Statistics (pp. 1, 65-72). Marrakech: The

National Institute of Statistics and Applied Economics.

Lipson, K. (1997). What do students gain from computer simulation exercices? En

Garfield, J. B. y Burril, G. (Eds.), Proceedings of the IASE 1996 Round Table

Conference. (pp. 131-144). Vooburg, Holanda: International Statistical Institute e

International Association for Statistical Education.

Loève, M. (1976). Teoría de la probabilidad. Madrid: Tecnos.

MacGillivray, H. L. (2002a). Technology, statistical thinking and engineering students.

En B. Phillips (Ed), Proceedings of the Sixth International Conference on

Teaching Statistics, Cape Town: ISI. CDROM.

MacGillivray, H. L. (2002b). Lessons from engineering student projects in statistics,

Proceedings of the Australasian Engineering Education Conference (pp. 225-

230). Australia: The Institution of Engineers.

Martín, P. (2006). Achieving success in industrial training. En A. Rossman y B. Chance

(Eds.). Proceedings of ICOTS-7. Salvador (Bahia): International Association for

Statistical Education. CDROM.

Martínez Arias, R. (1995). Psicometría: teoría de los tests psicológicos y educativos.

Madrid: Síntesis.

Mendenhall, W. y Sincich, T. (1997). Probabilidad y estadística para ingeniería y

ciencias (4ª ed.). México: Prentice Hall.

Mendenhall, W., Wackerly, D. y Scheaffer R. (1994). Estadística matemática con

aplicaciones (2ª ed.). México: Grupo Editorial Iberoamericana.

Méndez, H. (1991): Understanding the central limit theorem. Tesis Doctoral.

Universidad de California. UMI 6369.

Mether, M. (2003). The history of the central limit theorem. Sovelletun Matematiikan

erikoistyöt. On line: http://www.sal.tkk.fi/Opinnot/Mat-2.108/pdf-

files/emet03.pdf.

358

Page 366: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

Meyer, P. (1992). Probabilidad y aplicaciones estadística (2ª ed.). México: Addison-

Wesley.

Miller, I., Freund, J. y Johnson, R. (1992). Probabilidad y estadística para ingenieros

(4ª ed.). México: Prentice Hall.

Montgomery, D. y Runger, G. (1996). Probabilidad y estadística aplicadas a la

ingeniería (3ª ed.). México: Mc Graw Hill.

Moore, D. S. (1995). Estadística aplicada básica. España: Antoni Bosch.

Moore, D. (1997). New pedagogy and new content: The case of statistics. International

Statistical Review, 65 (2), 123-155.

Moreno, A. J. (2003). Estudio teórico y experimental sobre el aprendizaje de conceptos

y procedimientos inferenciales en el nivel de secundaria. Tesis Doctoral.

Universidad de Granada.

Moreno, A. y Vallecillos, A. (2001). Exploratory study on inferential’ concepts learning

in secondary level in Spain. En M. van der Heuvel (Ed.), Proceedings of the 25 th

Conference of the International Group of the Psychology of Mathematics

Education (PME) (p. 343). Utrech: Freudenthal Institute and Utrecht University.

Morrison, D. E. y Henkel, R. E. (1970) The significance tests controversy. A reader,

Chicago: Aldine.

Moses, L. E. (1992). The reasoning of statistical inference. En D. C. Hoaglin y D. S.

Moore (Eds.), Perspectivas on contemporary statistics (pp. 107-122).

Washington: Mathematical Association of America.

Novales, A. (1997). Estadística y econometría. Madrid: Mc Graw Hill.

Olivo (2006). Análisis de la presentación de intervalos de confianza en textos de

estadística para ingenieros. Memoria de Tercer Ciclo. Departamento de Didáctica

de la Matemática. Universidad de Granada.

Olivo, E., Ruiz, B. y Albert, A. (2006). Confidence intervals: fields of problems in

engineering textbooks. En A. Rossman y Beth Chance (Eds.), Proceedings of the

Seventh International Conference on Teaching of Statistics. Salvador (Bahia),

Brasil: International Association for Statistical Education.

Ortiz, J. J. (1996). Significado de los conceptos probabilísticos en los textos de

Bachillerato. Memoria de Tercer Ciclo. Universidad de Granada.

Ortiz, J. J. (1999). Significado de los conceptos probabilísticos elementales en los textos

de Bachillerato. Tesis Doctoral. Universidad de Granada.

Ortiz, J. J., Batanero, C., Serrano, L. y Cañizares, M. J. (2000). Variables de tarea en los

359

Page 367: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

ejercicios de probabilidad en los libros de texto. En C. Loureiro, F. Olivera y L.

Brunheira (Eds.), Ensino e Aprendizagem da Estatística (pp. 138-146). Lisboa:

Sociedad Portuguesa de Estatística.

Osterlind, S. (1989). Constructing test item. Boston: Kluwer.

Parra, E., Alvarado, H., Morales, J., Constenla, J. y Díaz, C. (2001). Percepción del

estudiante y del docente de la UCSC respecto del desempeño académico en el

aula. Boletín de Investigación Educacional, 16, 246-264.

Parzen, E. (1987). Teoría moderna de probabilidades y sus aplicaciones (5ª ed.).

México: Limusa.

Paulauskas, V. (1999). J.W. Linderberg and the central limit theorem. Statistics,

registries and research- experiences from Finland (pp. 111-112). Helsinki:

National Statistical Institute.

Peña, D. (1995). Estadística. Modelos y métodos (8ª ed.). Madrid: Alianza

Universitaria.

Peña, D. (2002). Análisis de datos multivariables. Madrid: McGraw-Hill.

Reynolds, M., Burk, T. y Huang, W. (1988). Goodness-of-fit test and model selection

procedures for diameter distributions models. Forest Science. 34, 373-399.

Romeu, J. (2006). Teaching engineering statistics to practicing engineers. En A.

Rossman y B. Chance (Eds.). Proceedings of ICOTS-7. Salvador (Bahia):

International Association for Statistical Education. CDROM.

Rossman, A. (1996). Workshop statistics. Discovery with data. New York: Springer.

Rubin, A., Bruce, B. y Tenney, Y. (1991). Learning about sampling: Trouble at the core

of statistics. En D. Vere-Jones (Ed.), Proceedings of the Third International

Conference on Teaching Statistics. (pp. 314-319). Voorburg, Holanda:

International Statistical Institute.

Saldanha, L. A. (2004). “Is this sample unusual?”: An investigation of students

exploring connections between sampling distributions and statistical inference.

Tesis Doctoral. Vanderbilt University.

Saldanha, L. A. y Thompson, P. W. (2002). Conceptions of sample and their

relationship to statistical inference. Educational Studies in Mathematics, 51, 257-

270.

Sánchez-Cobo, F. (1999). Significado de la regresión y correlación para estudiantes

universitarios. Tesis Doctoral. Universidad de Granada.

Scheaffer, R. y McClave, J. (1993). Probabilidad y estadística para ingenieros (3ª ed.).

360

Page 368: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

México: Grupo Editorial Iberoamericana.

Schuyten, G. (1991). Statistical thinking in psychology and education. En D. Vere-

Jones (Ed.), Proceedings of the III International Conference on Teaching

Statistics (v. 2, 486-489). Dunedin, Australia: Universidad de Otago.

Sedlmeier, P. y Gigerenzer, G. (1997). Intuitions about sample size: The empirical law

of large numbers. Journal of Behavioral Decision Making, 10, 33-51.

Seneta, E. (1984). The central limit problem and linear least squares in pre revolutionary

Russia: The background. Mathematical Scientist, 9, 37-77.

Serrano, L. (1996). Significados institucionales y personales de objetos matemáticos

ligados a la aproximación frecuencial de la probabilidad. Tesis Doctoral.

Universidad de Granada.

Shiryayev, A. N. (1984). Probability. New York: Springer.

Sierpinska, A. y Lerman, S. (1996). Epistemologies of mathematics and of mathematics

education. En A. J. Bishop et al. (Eds.), International Handbook of Mathematics

Education, (pp. 827-876). Dordrecht: Kluwer Academic Publishers.

Stent, A. y McAlevey, L. (1990). Exhibiting the central limit theorem on a spreadsheet.

En D. Vere-Jones (Ed.), Proceedings of ICOTS III (pp. 178-182). Dunedin:

International Statistical Institute.

Stigler, S. M. (1986). The history of statistics the measurement of uncertainty before

1900. Harvard: Prensa de Belknap.

Tauber, L. (2001). Significado y comprensión de la distribución normal a partir de

actividades de análisis de datos. Tesis Doctoral. Universidad de Sevilla.

Tauber, L., Batanero, C. y Sánchez, V. (2005). Diseño, implementación y análisis de

enseñanza de la distribución normal en un curso universitario. EMA, 9 (2), 82-

105.

Thompson, P. W., Saldanha, L. A. y Liu. Y. (2004). Why statistical inference is hard to

understand. Paper presented at the Annual Meeting of the American Educational

Research Association, San Diego, California.

Thorndike, R. L. (1989). Psicometría aplicada. México: Limusa.

Uspensky, J. V. (1937). Introduction to mathematical probability. New York: McGraw-

Hill.

Vallecillos, A. (1994). Estudio teórico-experimental de errores y concepciones sobre el

contraste de hipótesis en estudiantes universitarios. Tesis Doctoral. Universidad

de Granada.

361

Page 369: Significados del Teorema Central del Limite en la Enseñanza de la

Referencias

Vallecillos, A. (1995). Comprensión de la lógica del contraste de hipótesis en

estudiantes universitarios. Recherches en Didactique desa Mathématiques, 15 (3),

53-81.

Vallecillos, A. (1996). Inferencia estadística y enseñanza: Un análisis didáctico del

contraste de hipótesis estadísticas. Madrid: Comares.

Vallecillos, A. (1998). Experimental study on the learning of the significance level

concept. En L.Pereira-Mendoza, L. Seu Kea, T. Wee Kee & W. Wong (Eds.),

Proceedings of ICOTS 5 (pp. 1475-1476). Singapore: Nanyang Technological

University.

Vallecillos, A. (1999). Some empirical evidence on learning difficulties about testing

hypotheses. Bulletin of the International Statistical Institute: Proceedings of the

Fifty-second Session of the International Statistical Institute (Tome 58, Book 2)

(pp. 201-204). Helsinki, Finland.

Vallecillos, A. y Moreno, A. (2002). Framework for instruction and assessment on

elementary inferential statistics thinking. Proceedings of the Second International

Conference on the Teaching of Mathematics. USA: John Wiley. CDROM.

Velasco, G. y Wisniewski, P. (2001). Probabilidad y estadística para ingeniería y

ciencias. México: Thompson.

Walpole, R., Myers, R. y Myers, S. (1999). Probabilidad y estadística para ingenieros

(6ª ed.). México: Prentice Hall, Pearson.

Watson, J. M., & Moritz, J. B. (2000). Developing concepts of sampling. Journal for

Research in Mathematics Education, 31 (1), 44-70.

Wayner, H. (1992). Understandig graphs and tables. Educational Researcher 21 (1), 14-

23.

Weber, R. P. (1985). Basic content analysis. Londres: Sage.

Well, A., Pollatsek, A. y Boyce, S. (1990). Understanding the effects of sample size on

the variability of the mean. Organizational Behavior and Human Decision

Processes, 47, 289-312.

Wisniewski, P. y Velasco, G. (2001). Problemario de probabilidad. México:

Thompson.

Xiuyu, J. (2003). Historical development of central limit theorem. On line:

http://www.stat.rice.edu/~blairc/seminar/Files/julieTalk.pdf.

362