12
Instituto Tecnológico de Tuxtla Gutiérrez Ingeniería en Sistemas Computacionales Simulación Unidad III Reporte Investigación Unidad III Ing. Madain Pérez Patricio Alumno: Luis Alejandro Espinosa Velázquez 5° semestre

Conceptos básicos.docx

Embed Size (px)

Citation preview

Page 1: Conceptos básicos.docx

Instituto Tecnológico de Tuxtla GutiérrezIngeniería en Sistemas Computacionales

Simulación

Unidad III

ReporteInvestigación Unidad III

Ing. Madain Pérez Patricio

Alumno:Luis Alejandro Espinosa Velázquez

5° semestre

Fecha:Lunes 18 de Marzo del 2013

Page 2: Conceptos básicos.docx

INDICE

3.1. Conceptos básicos 3

3.2. Variables aleatorias discretas 3

3.3. Variables aleatorias continúas 4

3.4. Métodos para generar variables aleatorias 5

3.4.1. Método de la transformada inversa 5

3.4.2. Método de convolución 6

3.4.3. Método de composición 6

3.5. Procedimientos especiales 7

3.6. Pruebas estadística. (Pruebas de bondad y ajuste) 8

2

Page 3: Conceptos básicos.docx

3.1. Conceptos básicos

La generación de cualquier variable aleatoria se va a basar en la generación previa de una distribución uniforme (0,1), visto en el tema anterior. En este capítulo vamos a estudiar ciertas transformaciones o algoritmos que nos van a transformar dichos números generados en valores de otras distribuciones.Hay cuatro métodos generales de generación de variables aleatorias y una serie de métodos particulares de las distintas distribuciones.La facilidad de aplicación de dichos métodos, así como el coste computacional asociado a los mismos, varía mucho según la familia de variables aleatorias a las que se apliquen.Normalmente existen varios algoritmos que se pueden utilizar para generar valores de una determinada distribución, y diferentes factores que se pueden considerar para determinar qué algoritmo utilizar en un caso particular. Desafortunadamente dichos factores suelen entrar en conflicto unos con otros y a veces se ha de llegar a una solución de compromiso.Algunos de estos factores son los siguientes:

Exactitud: se han de obtener valores de una variable con una precisión dada. A veces se tiene suficiente con obtener una aproximación y otras no.

Eficiencia: el algoritmo que implementa el método de generación tiene asociado un tiempo de ejecución y un gasto de memoria. Elegiremos un método que sea eficiente en cuando al tiempo y a la cantidad de memoria requeridos.

Complejidad: Buscamos métodos que tengan complejidad mínima, siempre y cuando se garantice cierta exactitud.

Robusted: el método tiene que ser eficiente para cualquier valor que tomen los parámetros de la distribución que siga la variable aleatoria.

Facilidad de implementación.

3.2. Variables aleatorias discretas

Una variable aleatoria X es discreta, si solamente puede tomar un conjunto numerable de valores. Como ejemplos de variables aleatorias discretas podemos mencionar: el número de libros en una biblioteca, el número de habitantes en una población, la cantidad de dinero que una persona trae en su bolsillo, el número de aves en un gallinero, el número de admisiones diarias a un hospital, el número de accidentes automovilísticos en una carretera durante un año, etc. Sea X una variable aleatoria asociada con un experimento aleatorio. Si el resultado de un experimento es a, entonces decimos que en esta prueba la variable aleatoria X ha tomado el valor a, o que hemos observado el valor X = a.

3

Page 4: Conceptos básicos.docx

Una variable aleatoria tiene las siguientes propiedades:

1. La variable aleatoria X es un evento que se define en el espacio muestral S del experimento y sus valores son números reales.

2. Sea a cualquier número real y sea I cualquier intervalo de S. Entonces el conjunto

de todos los valores para los que X = a tiene una probabilidad bien definida y lo mismo se cumple para todos los valores de X que están en I.

Ejemplo Sea el experimento de lanzar 3 veces una moneda y representemos por X el evento del número de caras que aparecen. Encontrar los valores que puede tomar la variable aleatoria. Solución.El espacio muestral de lanzar 3 veces una moneda es:S = { ccc, cc+, c+c, +cc, c++, +c+, ++c, +++} Si solamente nos interesa el número de caras que aparecen, entonces al punto muestral (+++) le corresponde el valor cero porque no hay ninguna cara, a cada punto muestral donde hay una cara (c++, +c+, ++c) le corresponde el valor 1 y así los demás puntos muestrales. Por lo tanto:X(+++) = 0(c++) = X(+x+) = X(++c) = 1X(cc+) = X(c+c) = X(+cc) = 2X(ccc) = 3

3.3. Variables aleatorias continuas

Una variable aleatoria X es continua si su función de distribución es una función continua.En la práctica, se corresponden con variables asociadas con experimentos en los cuales la variable medida puede tomar cualquier valor en un intervalo: mediciones biométricas, intervalos de tiempo, áreas, etc.

Ejemplos Resultado de un generador de números aleatorios entre 0 y 1. Es el ejemplo más

sencillo que podemos considerar, es un caso particular de una familia de variables aleatorias que tienen una distribución uniforme en un intervalo [a, b]. Se corresponde con la elección al azar de cualquier valor entre a y b.

Estatura de una persona elegida al azar en una población. El valor que se obtenga será una medición en cualquier unidad de longitud (m, cm, etc.) dentro de unos límites condicionados por la naturaleza de la variable. El resultado es impredecible con antelación, pero existen intervalos de valores más probables que otros debido

4

Page 5: Conceptos básicos.docx

a la distribución de alturas en la población. Más adelante veremos que, generalmente, variables biométricas como la altura se adaptan un modelo de distribución denominado distribución Normal y representada por una campana de Gauss.

Dentro de las variables aleatorias continuas tenemos las variables aleatorias absolutamente continuas.Diremos que una variable aleatoria X continua tiene una distribución absolutamente continua si existe una función real f, positiva e integrable en el conjunto de números reales, tal que la función de distribución F de X se puede expresar comoUna variable aleatoria con distribución absolutamente continua, por extensión, se clasifica como variable aleatoria absolutamente continua.En el presente manual, todas las variables aleatorias continuas con las que trabajemos pertenecen al grupo de las variables absolutamente continuas, en particular, los ejemplos y casos expuestos.

3.4. Métodos para generar variables aleatorias

3.4.1. Método de la transformada inversaEs el método más directo para generar una variable aleatoria. Sea

una función de distribución cuya función de distribución inversa es:

Sea U una variable aleatoria de   

Se verifica que

Tiene la función de distribución F. La prueba se sigue de la observación de que

Esto sugiere inmediatamente el siguiente esquema de generación:

Algoritmo del método de la transformada inversa

Propósito: Generar Z aleatoriamente de

Entrada: Capacidad para evaluar

5

Page 6: Conceptos básicos.docx

Salida: ZMétodo: Generar aleatoriamente U de

Devolver Z.

Ejemplo. La distribución exponencialSupongamos que  tiene una distribución exponencial de media beta. La función densidad de probabilidad es:

La función de distribución (acumulativa) es:

3.4.2. Método de convolución

Muchas variables aleatorias incluyendo la normal, binomial, poisson, gamma, erlang, etc,

se pueden expresar de forma exacta o aproximada mediante la suma lineal de otras

variables aleatorias.

El método de convolución se puede usar siempre y cuando la variable aleatoria x se

pueda expresar como una combinación lineal de k variables aleatorias:

En este método se necesita generar k números aleatorios (u1,u2,...,uk) para generar

(x1,x2,...xk) variables aleatorias usando alguno de los métodos anteriores y así poder

obtener un valor de la variable que se desea obtener por convolución.

3.4.3. Método de composición

Este método va a poder ser aplicado cuando la función de densidad es fácil de

Siendo n el número de trozos en los que se ha dividido la función.Cada uno de los fragmentos se puede expresar como producto de un función de distribución y un peso

Y la función de distribución global la podemos obtener como

6

Page 7: Conceptos básicos.docx

El método consiste en generar dos números aleatorios, uno sirve para seleccionar un

trozo y el otro se utiliza para generar un valor de una variable que sigue la distribución de

dicho trozo. El valor de la variable obtenida es el valor buscado.

El algoritmo general queda como sigue:

Generar u1,u2~U(0,1)

Si u1=w1 entonces generar x~f1(x)

Si no

Si u1=w1+w2 entonces generar x~f2(x)

3.5. Procedimientos especiales

Existen algunas distribuciones como la distribución de erlang, la distribución normal, etc. Cuya simulación a través del método de la transformada inversa sería demasiado complicada. Para estas y algunas otras distribuciones, es posible utilizar algunas de sus propiedades para facilitar y agilizar el proceso de generación de números al azar.Ejemplos son los siguientes.

Distribución normalEn estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de una función gaussiana.La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes. Su función de densidad viene dada por la fórmula:

Distribución de erlangSe desea generar números al azar que sigan la siguiente distribución de probabilidad:

7

Page 8: Conceptos básicos.docx

Donde n y ƛ son parámetros positivos y además el valor de n está restringido a ser entero. Ha sido demostrado por algunos matemáticos que esta distribución es justamente la suma de n variables aleatorias exponenciales cada una con el valor esperado 1/ƛ. Por consiguiente, para generar números al azar que sigan una distribución de erlang, se necesita solamente sumar los valores simulados de n variables aleatorias exponenciales con 1/ƛ es decir:

Donde las siguen una distribución exponencial y han sido generadas por el método de la transformada inversa.

3.6. Pruebas estadística (pruebas de bondad y ajuste)

Las pruebas de bondad de ajuste son aquellas que comparan los resultados de una muestra con los que se espera obtener cuando la hipótesis nula es verdadera. Esta tienen por objetivo determinar si los datos se ajustan a una determinada distribución, la cual puede estar completamente especificada (hipótesis simple) o perteneciente a una clase para-métrica (hipótesis compuesta).

Prueba de chi-cuadrado

Es una prueba no para-métrica la cual se emplea tanto para distribuciones continuas como para las discretas. Esta se utiliza para encontrar la distribución de una serie de datos. Utiliza la siguiente formula:

Donde x2 es un valor de una variable aleatoria cuya distribución muestral se aproxima muy de cerca con v = k – 1 grados de libertad. Los símbolos representan las frecuencias observadas y esperada, respectivamente, para la i-ésima celda. Pasos para realizar la prueba de chi-cuadrado. Partiendo del supuesto de que los datos son normales y que ya se conocen la media y desviación se hace lo siguiente:

Determinar el número de intervalos y partiendo del límite superior e inferior, y el tamaño del intervalo se calcula cada uno para los intervalos.

Determinar la frecuencia observada por cada intervalo. Hallar la frecuencia relativa esperada acumulada teniendo en cuenta la función de

distribución a utilizar, el límite superior, la media y desviación. Hallar la frecuencia relativa esperada restando la frecuencia relativa esperada

acumulada con el dato anterior de la frecuencia dentro de la columna. Hallar la frecuencia observada esperada (FOE) multiplicando la frecuencia relativa

esperada con la suma de los datos de la frecuencia observada. Calcular el estimador a partir de la fórmula de chi-cuadrado. Se suman los datos calculados en el paso anterior. Se determinan los grados de libertad (V) restando el número de intervalos con 1 y

teniendo en cuenta la suma anterior.

Prueba de bondad de ajuste de kolmogorov smirnov

8

Page 9: Conceptos básicos.docx

Algunos puntos relevantes de este método son.1. Es aplicable solamente a variables aleatorias continuas. Comparar la gráfica de la

distribución empírica acumulada con la correspondiente gráfica de la función de densidad acumulada de la distribución teórica propuesta.

2. Si hay un acercamiento entre las gráficas existe una probabilidad de que la Distribución teórica se ajusta a los datos. El hecho de que utiliza la distribución de probabilidad acumulada la hace un poco más eficiente que la prueba anterior chi-cuadrado.

La metodología de la prueba es la siguiente:Partiendo del supuesto de que los datos son normales y que ya se conocen la media y desviación se hace lo siguiente:

Identificar la muestra de la población a utilizar. Plantear la hipótesis para la muestra: Ho, hipótesis nula. Hi, hipótesis alternativa. Calcular la frecuencia observada de cada uno de los intervalos, luego se suman

todas las frecuencias observadas. Calcular la frecuencia observada relativa (frecuencia observada de cada

intervalo/la sumatoria total de la frecuencia observada). Luego se calcula las frecuencias observada relativa acumulada (FORA) y la

frecuencia esperada relativa acumulada (FERA). Se calcula el Estadístico de Prueba (D) de cada intervalo con la siguiente formula:

D = ABS (FOR Acum - FER Acum) Se busca en la siguiente tabla de acuerdo al tamaño de la muestra y un alfa (α), el

valor esperado: n<40: se realiza el procedimiento normal. n>40: se aplica la fórmula que se expone en la tabla.

9