4to Informe Geoestadistica Marin 1

Embed Size (px)

DESCRIPTION

geoestad

Citation preview

1

TABLA DE CONTENIDO1.OBJETIVOS32.ALCANCES33.INTRODUCCIN34.FUNDAMENTO TEORICO35.PRIMER TRABAJO DEJADO POR EL PHD . MARN76.TABLAS Y FIGURAS76.1 Tablas de datos Tabla de datos de poblacin anormal76.2 Figuras histogramas y P-P plot87.SEGUNDO TRABAJO DEJADO POR EN PHD. MARN117.1Algoritmo del Variograma117.2Visualizacin del programa117.3Algoritmo del programa en VBA117.4Creacin de datos con el T.L.C iniciar el programa128.TABLAS Y FIGURAS138.1Tablas de datos generados138.2Figuras149.CONCLUSIONES1510.REFERENCIAS15

OBJETIVOS Analizar la grfica p-p plot de los Ln de los datos dejador por el PHD Marn. Analizar la grfica p-p plot de los Ln de los datos con un incremento de datos anormales. Tener capacidad para comprender porque se produce cambios es la grppafica p-p plot. Crear un algoritmo para generar datos con distribucin de gauss usando el Teorema del Limite Central.ALCANCESEn el transcurso de este informe se podr dar cuenta de que el anlisis de la curva p-p plot del Ln de los datos nos da informacin de posibles anomalas en nuestros datos.INTRODUCCINLa necesidad de acudir a herramientas estadsticas para el anlisis de datos en todas las reas del conocimiento, ha hecho que aparezcan con el correr de los aos nuevas metodologas que, no obstante se centran en fundamentos probabilsticos comunes, son especficas para cada una de las diversas disciplinas del saber. Algunos ejemplos son, entre otros, la econometra, psicometra o la bioestadstica. La gran relevancia que tiene actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadstica encaminen esfuerzos en el desarrollo de nuevas tcnicas apropiadas para el anlisis de informacin enmarcada dentro de este contexto. Como consecuencia de este impulso surgi la geoestadstica, teniendo como padre a George Matheron.FUNDAMENTO TEORICOPROBABILIDAD-PROBABILIDAD (PP) TERRENOUna probabilidad-probabilidad (PP) parcela se utiliza para ver si un determinado conjunto de datos sigue alguna distribucin especificado. Debe ser aproximadamente lineal si la distribucin especificado es el modelo correcto.

La probabilidad-probabilidad (PP) trama se construye utilizando la funcin de distribucin acumulada terica, F (x), del modelo especificado. Los valores de la muestra de datos, en orden de menor a mayor x, se denotan (1), X (2), ..., x (n). Para i = 1, 2, ....., n, F (x (i)) se representa frente a (i-0.5) / n.EjemploEn la figura de abajo, dos conjuntos de datos se han visualizado en grficos de probabilidad normal. El primer conjunto de datos (que se muestra en negro) realmente proviene de una distribucin normal, por lo que la trama PP es lineal. El segundo conjunto de datos (que se muestra en rojo) proviene de una distribucin exponencial, por lo que no es ni siquiera cerca de simetra, y la trama del PP se desva de una lnea recta. El uso de estas parcelas, queremos inferir correctamente que el primer conjunto de datos es normal, pero la segunda no lo es.

HISTOGRAMAEn estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribucin de la poblacin, o la muestra, respecto a una caracterstica, cuantitativa y continua, de la misma y que es de inters para el observador (como la longitud o la masa). De esta manera ofrece una visin en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o poblacin por ubicarse hacia una determinada regin de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la caracterstica. As pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisin entre los valores de todas las partes que componen la poblacin o la muestra, o, en contraposicin, poder observar el grado de variabilidad, y por ende, la dispersin de todos los valores que toman las partes, tambin es posible no evidenciar ninguna tendencia y obtener que cada miembro de la poblacin toma por su lado y adquiere un valor de la caracterstica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.En el eje vertical se representan las frecuencias, es decir, la cantidad de poblacin o la muestra, segn sea el caso, que se ubica en un determinado valor o subrango de valores de la caracterstica conocido como intervalo de clase. En el eje horizontal se representa el espectro de valores posibles que toma la caracterstica de inters, evidentemente, cuando ste espectro de valores es infinito o muy grande el mismo es reducido a slo una parte que muestre la tendencia o comportamiento de la poblacin, en otras ocasiones ste espectro es extendido para mostrar el alejamiento o ubicacin de la poblacin o la muestra analizada respecto de un valor de inters.TEOREMA DEL LIMITE CENTRALEl teorema del lmite central o teorema central del lmite indica que, en condiciones muy generales, si Sn es la suma de n variables aleatorias independientes y de varianza no nula pero finita, entonces la funcin de distribucin de Sn se aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande.Sealafuncin de densidadde ladistribucin normaldefinida como1

con unamediay unavarianza2. El caso en el que su funcin de densidad sea, a la distribucin se le conoce comonormal estndar. Se defineSncomo la suma denvariables aleatorias, independientes, distribuidas, y con una mediay varianza2finitas (20):

de manera que, la media deSnesny lavarianzan2, dado que son variables aleatorias independientes. Con tal de hacer ms fcil la comprensin del teorema y su posterior uso, se hace una estandarizacin deSncomo

para que la media de la nueva variable sea igual a 0 y ladesviacin estndarsea igual a 1. As, las variablesZnconvergern en distribucina la distribucin normal estndarN(0,1), cuandontienda ainfinito. Como consecuencia, si (z) es lafuncin de distribucinde N(0,1), para cadanmero realz:

donde Pr() indicaprobabilidady lim se refiere almite matemtico.

PRIMER TRABAJO DEJADO POR EL PHD . MARNAgregar datos al archivo una poblacin anormal y ver la media y desviacin tpica hacer el P-P plotTABLAS Y FIGURAS6.1 Tablas de datosTabla de datos de poblacin anormal#DatosLn(datos)

11,91,65

2,76-,27

3,76-,27

4,90-,10

52,991,10

6,49-,71

7,69-,37

81,59,46

92,39,87

10,87-,14

111,88,63

12,97-,03

131,10,10

142,08,73

1965,74-,30

1966,91-,10

19672,05,72

19681,51,41

19693,031,11

19701,12,12

1971,61-,49

1972,95-,05

19731,44,37

19741,16,15

19751,41,35

19761,15,14

1977,86-,15

19782,65,97

#datosLn(datos)

15.041.62

26.531.88

34.451.49

45.861.77

54.931.59

65.071.62

75.121.63

85.841.76

94.141.42

104.031.39

114.631.53

125.851.77

135.011.61

144.911.59

876.391.85

885.861.77

893.301.19

903.711.31

914.651.54

925.221.65

934.051.40

944.681.54

955.431.69

965.371.68

974.821.57

982.731.00

995.731.75

1004.551.52

6.2 Figuras histogramas y P-P plotHISTOGRAMA DE DATOS DEL PHD. MARN

HISTOGRAMA DE LN(DATOS)

P-P PLOT DE LN DE DATOS

HISTOGRAMA DE DATOS AADIDOS CON POBLACIN ANORMAL

HISTOGRAMA DE LN(DATOS+POBLACION ANORMAL)

P-P PLOT DE LN(DATOS+POBLACION ANORMAL)

SEGUNDO TRABAJO DEJADO POR EN PHD. MARNHacer un programa para generar datos con distribucin de gauss usando el Teorema de Limite CentralAlgoritmo del VariogramaEl algoritmo fue desarrollado en el programa VBA, de tal manera que podamos generar 1000 grupos de 100 datos aleatorios y por cada grupo obtener un valor con el T.L.C.Los datos sern puestos en una hoja de Excel pudiendo realizar luego la grfica del histograma correspondiente.Visualizacin del programa

Algoritmo del programa en VBADim aleatorio(1 To 100) As DoubleDim alfa, beta As DoubleDim i, j As IntegerPrivate Sub CommandButton1_Click()Randomizealfa = Val(txt1.Text)beta = Val(txt2.Text)For i = 1 To 1000 For j = 1 To 100 aleatorio(j) = Rnd() suma = suma + aleatorio(j) Next Cells(i, 1) = beta * ((suma - 100 * (1 / 2)) / ((100 ^ 0.5) / (12 ^ 0.5))) + alfa suma = 0NextEnd Sub End SubCreacin de datos con el T.L.C iniciar el programaAsignamos una media = 3 y una desviacin = 1

TABLAS Y FIGURASTablas de datos generados1.- Tabla de 1000 datos generados#Dato generado

13.236860107

22.502508926

33.044123336

44.036864883

52.592318956

62.743508351

71.566836175

83.016841672

94.048143127

103.946861591

112.576919439

123.822491352

133.095587863

142.210041671

154.163704581

163.763722511

9813.455611601

9823.234596133

9833.530082571

9842.559191859

9852.62424915

9862.123699456

9873.151480568

9883.854348866

9892.567150621

9901.601683139

9912.028891703

9922.964398612

9932.586083034

9943.308582791

9952.754979527

9963.088222431

9973.714864213

9984.38110192

9992.033434848

10002.228549237

MediaVarianzaDesviacin estndar

3.024287120.911503120.954726727

Figuras

CONCLUSIONES El p-p plot sirve para identificar la funcin ms adecuada para representar los datos. El p-p plot ayuda a identificar posibles anomalas en el muestreo al variar la recta. El Teorema del Limite central nos ayuda a simular datos con una media y desviacin estndar dados. El teorema del lmite central nos da como resultado una funcin de gaussREFERENCIASClases de Informtica por Ing. Chvez, Adolfo Clases del PhD. Alfredo Marn SuarezClases realizadas por el Ing. Tves.http://www.stats.gla.ac.uk/glossary/?q=node/392http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central