O D A I R A V I N U L A I C A P S E S I S I L Á N A
A A O C E I C I G T T O Á S R I D T M A N O E T E C G S N E E O E O G D A N E M O O L L U P I D Ó D M
0 1 0 2
La Geoestadística se define como la aplicación de la Teoría de Funciones Aleatorias al reconocimiento y estimación de fenómenos naturales, o simplemente, el estudio de las variables numéricas distribuidas en el espacio
Practica # 2 Prof. Dr. Darío Rojas A. J. Javier Martínez Cervantes Alberto Porras
1) Objetivo
Evaluar y practicar el uso de diversas funciones que permiten realizar el análisis espacial univariado de un conjunto de datos. A partir de un conjunto de datos construir el diagrama de dispersión h y el variograma experimenta, igualmente se estudiara su forma en función del valor dado de la amplitud de clase (³h´ lag). La cual se ajustara a diferentes modelos de variograma experimental; con el cual podremos elegir el que mejor se comporte. 2) Introducción
Las herramientas y funciones que se usaron para describir la relación espacial entre dos variables pueden ser también usadas para describir la relación entre el valor de una variable y el valor de la misma en puntos de su vecindad. Su aplicación nos permite estudiar aspectos tales como la la continuidad espacial de la variable, sus tendencias de variación, direcciones privilegiadas o isotropía en su comportamiento espacial. Las relaciones espaciales entre los datos de una variable pueden ser mostradas mediante el uso de un diagrama de dispersión h, que es la gráfica sobre un par de ejes cartesianos de todos los pares de mediciones (z(xi ), z(xi + h)) de el mismo mismo atributo atributo z en sitios separados por una distancia h y en una dirección particular . Por otro lado, la similitud o disimilaridad entre los datos separados por un vector
h puede ser cuantificada maneras:
y
de diversas
La
función de covarianza que mide la similitud entre los datos.
1 N ( h) C (h) ! z ( xE ) z ( xE h) m x m x h N (h) E !1
§
Donde m x ! m x h
y
El
y
El
1 (h)
( h)
§ z ( xE )
y
E !1
1 N ( h ) ! z ( xE h) N ( h) E !1
§
correlograma es una medida sin unidades que mide la similitud entre los datos y que es la forma estandarizada de la covarianza.El conjunto de coeficientes de correlación para los diferentes valores de h constituyen la función correlación experimental. exper imental.
semivariograma que, a diferencia del correlograma y la covarianza, mide la disimilitud promedio entre los datos separados por un vector h.
Existen diversas herramientas que nos ayudan a cuantificar la relación entre el valor de una variable en un lugar particular y el valor de la misma variable en lugares localizados a distancias diferentes (continuidad espacial). Entre las herramientas más comunes para cuantificar la continuidad espacial se encuentra el variograma que puede ser visto como un resumen de un grupo de diagramas de dispersión-h en donde a cada valor del variograma le corresponde un diagrama de dispersión diferente (que
depende de la distancia h en el eje de las absisas). El variograma experimental se constituye como una realización particular del fenómeno de estudio y representa un modelo estadístico (no determinista). El semivariograma calcula como:
K (h) !
1
experimental
N ( h )
§ ( z (u ) z (u 2N(h) i !1
i
i
se
h)) 2
Donde Donde (h) es el núme número ro de pares pares de datos cuyas localizaciones están a una distancia h. El semivariograma es una función tanto de la distancia como de la dirección, aunque en el caso de esta práctica consideraremos el caso isotrópico. 3)
Datos De Wijs Los datos utilizados en esta práctica llevan el nombre de DeWijs. Esta serie de datos fue tomada en 1951 en la mina chilena de Pulacayo y consta de 118 mediciones del contenido de Zinc realizadas en intervalos regulares de distancia (cada dos metros).
A continuación presentamos la serie de datos (el orden es por renglones): 17.7 17.8 9.5 5.2 4.1 19.2 12.4 15.8 20.8 24.1 14.7 21.6 12.8 11.9 35.4 12.3 14.9 19.6 10.6 15.1 15.6 9.3 8.1 13.5 30.2 29.1 7.4 12.3 13.6 9.5 13.1 27.4 8.8 11.4 6.4 11.0 11.4 14.1 20.9 10.6 15.3 24.0 12.3 7.8 9.9 20.7 25.0 19.1 13.1 27.4 15.2 12.2 10.1 12.3 16.7 18.6 6.0 11.6 11.3 4.7 10.9 6.0 7.2 5.6 8.9 5.8 8.9 6.7 7.2 9.7 10.8 17.9 10.9 13.7 22.3 10.2 5.1 13.9 9.0 10.6 13.8 6.5 6.5 10.6 10.6 23.0 21.8 32.8
30.2 30.8 33.7 26.5 39.3 24.5 24.9 23.2 16.0 20.9 10.3 22.6 16.2 22.9 36.9 23.5 18.5 16.4 17.9 18.5 13.6 7.9 31.9 14.1 7.1 3.9 3.7 22.5 27.6 17.3 4) Diagrama de dispersión h. 4.1) Cargue en su hoja de trabajo de excel los datos contenidos en el archivo dewijs.xls
Como se mencionó, el diagrama de dispersión h muestra la relación entre los pares de valores de una variable, para una clase dada de distancia y dirección. Los pares de datos son típicamente agrupados en clases de distancias (lags) [h ± h] y ángulos [U ± ]. Por convención el comienzo del vector h, z(xi) es llamado valor cola (tail), mientras que el valor al final z(xi + h) es llamado el valor cabeza (head). 4.2) Realice los diagramas de dispersión h para los valores del Zn , con h=2m, 4m, 6m. La abscisa corresponde a los valores de las colas y las ordenadas a las cabezas. (Inserte las gráficas obtenidas en su reporte de laboratorio).
ota: Para poder visualizar de una mejor manera la correlación se puede agregar a la gráfica una línea con inclinación de 45º. DESARR OLLO
Primeramente cargamos Excel, en seguida abrimos el archivo de De Wijs, el cual se trabajó en la práctica práct ica pasada. Los datos medidos están a cada 2 metros de distancia.
3
Datos de Zn de Dewijcs
Datos a cada 2 metros
Ahora seleccionamos los datos a cada dos metros, esto lo hacemos poniendo el apuntador más clic y jalándolo hasta el e l último último dato. dat o.
Para seleccionar los datos hay que poner el apuntador
más clic en el botón izquierdo
del ratón y se arrastra hasta el último dato que vayamos a seleccionar.
Ahora le damos botón derecho al mouse y seleccionamos la opción de copiar
Ponemos el apuntador en la celda C2, le damos clic al botón botón derecho del mouse y seleccionamos la opción de pegar
La celda C1 llevara el nombre de ³h=2m.´ 5
En la columna ³D´ pondremos h = 4 metros, para esto seleccionamos lo valores desde 4m hasta el último valor.
Para el diagrama de dispersión de h = 4m tomaremos los valores desde 9. 5 hasta el último dato. Para seleccionar los datos le damos clic al botón izquierdo del mouse y lo arrastramos hacia abajo
Ya que se tienen seleccionados los datos se le da bo tón derecho al mouse y se selecciona la opción de copiar
6
Ponemos el cursor en la celda D2 le damos botón derecho al mouse y le decimos que pegue los datos
Listo, después de pegar los datos se realizan los mismos pasos para lag igual a 6 m. Ahora realizaremos realizaremos la gráfica de dispersión dispersión colas vs cabezas a cada 2, 4 6 10 y 12 metros, para esto seleccionamos los datos de la columna B y C.
7
Ya cuando tenemos los datos seleccionados nos vamos a Insertar, gráfica de Dispersión, escogemos la que es solo con marcadores.
Para editar la gráfica y poner la línea de tendencia le damos un clic a la gráfica, ahora nos vamos a Herramientas de gráficos, diseño de gráfico, ahí seleccionamos el diseño número 9, para editar los encabezados nada nada más se la da doble clic sobre el mismo
8
Este mismo procedimiento se realiza para lagráficas faltante, h = 4m, se seleccionan los datos de la columna B2:B117, D2:D117, al tener seleccionadas estas columnas se realizan todos los pasos anteriores para realizar la gráfica de dispersión. Esto es para h= 6m, h=8m, h=10m y h=12m. 4.3 Preguntas
1
¿Cómo sería la nube de puntos para un valor de h=0?
2
¿Cómo se manifestaría manifestaría en el diagrama de dispersión h una correlación perfecta?
3
¿Es igual el número de puntos que aparecen en los diagramas de dispersión para
diferentes valores valores de h? De qué depende el número de puntos? 4
¿Qué significa el hecho de que la dispersión de la nube de puntos puntos vaya
aumentando conforme aumenta la distancia h? 5
¿Existe alguna relación entre el ensanchamiento de la nube de puntos y el
coeficiente de correlación? 6
¿Existe alguna relación entre el ensanchamiento de la nube de puntos y el
variograma 5) Las
Funciones covarianza, correlograma y semivariograma.
5.1)
Función de covarianza covarianza para el Zinc De acuerdo a las fórmulas vistas en clase implemente la función covarianza (con rangos de clase de 0,2, 4, 6, 8, 10 y 12m) y haga la gráfica correspondiente.
DESARR OLLO Primeramente vamos a crear una columna co lumna en Excel don tendremos los rangos de clase.
Rangos de clase a cada dos metros
9
Adyacentemente a la columna de rangos crearemos la columna de covarianza
Ahora calcularemos la covarianza de los datos de dewijcs, para esto utilizaremos la formula COVAR, ponemos el cursor en la celda P2 y escribimos la formula seleccionando los datos a 0, 2, 4, 6, 8, 10 y 12 metros.
En la Celda P2 ponemos la fórmula:=COVAR(B2:B119,B2: B119) En la celda P3 escribimos la fórmula: =COVAR(B2:B119,C2:C119) En la celda P4 escribimos la fórmula: =COVAR(B2:B117,D2:D117)
Hay que tomar en cuenta que los datos se tienen que acomodar en la forma de la hoja de arriba 10
Ya cuando se obtienen los valores de los diferentes rangos se seleccionan los datos y se
realiza la gráfica (si no se recuerda cómo se realiza una gráfica, ver practica uno) uno ) 5.2)
Correlograma. De manera análoga haga la función del correlograma con su gráfica correspondiente.
DESARR OLLO Adyacentemen Adyacentemente te a la columna columna de COVARIA COVARIA ZA creamos creamos la columna columna del correlograma correlograma (correlación). h
r n 0
rre
r m
63 5094865 865
2 28.6457294 294 4
18. 18.3222919
6
19.5739705 705
8
11.3623777 777
10
15.523716 716
12
10.786588
Ahora calcularemos la correlación entre los datos de dewijcs, para esto utilizaremos la fórmula COEF.DE.CORREL ( ), ponemos el cursor en la celda Q2 y escribimos la formula seleccionando los datos
Los datos se pueden acomodar al gusto del estudiante, este es sólo un ejemplo para desarrollar la práctica. 11
En la Celda Q2 (h=0) escribimos la fórmula: =COEF.DE.CORREL(B2:B119,B2:B119) En la Celda Q3 (h=2) escribimos la fórmula: =COEF.DE.CORREL(B2:B118,C2:C118) En la Celda Q4 (H=4) escribimos la fórmula: =COEF.DE.CORREL(B2:B117,D2:D117)
Después de calcular todos los valores para ³h´ se realiza la gráfica gráfica ³h vs correlograma´
5.3)
Preguntas
7.
Analice las curvas obtenidas y explique su comportamiento. ¿Existe alguna relación entre ellas?
8
¿Qué significa el comportamiento decreciente de la función de covarianza y el
correlograma?
9.
¿A qué distancia de separación (aproximada) decrece a cero la correlación y
covarianza entre los datos?
12
5.4) Semivariograma.
Obtenga los siguientes semivariogramas correspondientes en su reporte.
i)
experimentales
e
inserte
las
gráficas
Clases de distancia distancia de 2m, es decir, h= [0,2,4,6,8«] y h=0m
DESARR OLLO Abrimos Excel copiamos los datos de Dwijs y los pegamos en la columna A de cada una de nuestras hojas de trabajo
Vamos a crear tres hojas con H=2, H=4, H=6. En cada una de estas hojas vamos a pegar los datos de Dwijcs en la columna A.
Para calcular el valor del semivariograma de h=2, acomodaremos los datos de la siguiente manera (este es sólo un ejemplo, el estudiante los puede acomodar como mejor se acomode).
Datos de dewijcs a cada 2 metros 13
En las columnas C, E, G y I calcularemos la diferencia entre colas y cabezas al cuadrado
En la celda C2 escribiremos la fórmula: =(A2-B2)^2 Mientras que en la celda I2 sera la siguiente fórmula: =(A2-H2)^2 Así sucesivamente para h=4, h=6
En la celda C2 Le damos Enter y se arrastra la formula hasta el valor final (CELDA C 118)
14
Cuando se tiene todos los valores calculados, pasamos a realizar la sumatoria de los datos En la celda C120 calculamos el semivariograma de la siguiente manera: =C119/(2*118) Dónde: C119: es la sumatoria de la columna C 118: es el número n úmero total de datos ocupados (colas y cabezas)
Para calcular los valores restantes del semivariograma h=2, se realiza los mismos pasos mencionados anteriormente. Ya cuando se tienen todos los valores se realiza la gráfica de h= 2, ejemplo:
Después de terminar el semivariograma para h=2, pasamos a la hoja H=4, para calcular su semivariograma semivariograma de la misma manera como si hiso en el ejemplo pasado .
15
En las columnas B, D, F y H calcularemos los valores para el semivariograma h=4 En la celda B2 escribiremos la fórmula: =(A2-A3)^2 Le damos E TER y arrastramos la fórmula hasta el valor final (CELDA B236) En la celda D2 la fórmula será: =(A2-A4)^2 Mientras que en la celda F2 es. =(A2-A5)^2 La celda H2 llevara la fórmula. =(A2-A7)^2 En todos los casos la fórmula se arrastra hasta el valor final, siempre será uno menos que el anterior.
Ya que se tienen los valores calculados pasamos a calcular la sumatoria de cada uno de
ellos
Cuando se tiene todos los valores calculados, pasamos a realizar la sumatoria de los datos En la celda B239 calculamos el semivariograma de la siguiente manera: man era: =B237/(2*236) Dónde: B237: es la sumatoria de los datos de la columna C 236: Es el número total de datos ocupados (colas y cabezas)
Por último se realiza la gráfica para el e l semivariograma h = 4, ejemplo: ejemplo:
Para el semivariograma h=6 se realizan los mismo pasaos de los ejemplos anteriores
16
5.5)
Preguntas: 10. ¿De acuerdo a su opinión cuál de los variogramas experimentales obtenidos es el más óptimo para su utilización y por qué?
11. ¿Qué le sucede al semivariograma en la distancia correspondiente al rango? 12. ¿Qué efecto se manifiesta cuando el valor del semivariograma no tiende a cero al tender h a cero? ¿A qué se debe este efecto? 6) A juste manual del variograma a un modelo teórico.
Elija de los variogramas experimentales anteriores el que le parezca más adecuado para ajustar a un modelo teórico. A continuación grafique su variograma experimental y trate de ajustarlo a un modelo esférico de manera manual. Escoja de manera visual el valor del sill de su variograma, después, a partir de un valor inicial para el rango vaya aumentándolo paulatinamente. Grafique los variogramas ajustados sobre el variograma experimental (mínimo 3). En cada caso obtenga el RMSE (Root Mean Square Error) entre el variograma experimental y el ajustado. Variograma esférico
® « ± ¬ esf ( h) ! ¯c 1. ¬ ± °-
h a
¨ h ¸ 0. ©© ¹¹ ª a º
3
» ¾± ¼¿ ¼½ ± À
si h
ea
K h ! c, si h u a
Donde ³c´ es el valor del sill y ³a´ el rango en el modelo esférico. Ejemplo: Primeramente tendremos que escoger el variograma experimental que más se ajuste a nuestro modelo teórico, para modo de ejemplo utilizare el semivariograma h=4
De este semivariograma experimental obtendremos él sill y el rango el cual se elegirá de forma visual. 17
Del semivariograma h=4 tenemos que nuestro sill tendrá un valor inicial de 50 y nuestro rango será de 6.9m, estos esto s valores los tomaremos para calcular el variograma teórico. os vamos a una hoja nueva de Excel para calcular los diferentes variogramas teóricos, en este caso caso vamos a variar variar los los valores valores de SILL y del RA GO, lo cual nos nos ayudara a tener tener el mejor modelo teórico, esto lo comprobaremos co mprobaremos con el error medio cuadrático (RMSE).
Para calcular el variograma teórico vamos a utilizar la fórmula del variograma esférico, el sill y el rango, en la celda D2 vamos a escribir la fórmula: =SI(C2<=$B$3,$B$2*(1.5*C2/$B$3-0 =SI(C2<=$B$3,$B$2*(1.5*C2/$B$3-0.5*(C2/$B$3)^3),$B .5*(C2/$B$3)^3),$B$2) $2)
En la celda D11 donde ya se varió el valor del SIIL y el RA GO la fórmula será la siguiente: =SI(C11<=$B$12,$B$11*(1.5*C11/$B$12-0.5*(C11/$B$12)^3),$B$11)
En el utlimo variograma teórico el valor de la fórmula será: =SI(C22<=$B$23,$B$22*(1.5*C22/$B$23-0.5*(C22/$B$23)^3),$B$22)
Hay que tomar en cuenta que para que la fórmula funcione, los datos tienen que estar acomodados de la misma manera que en en el ejemp ejemplo, lo, los los valores valores del SILL y del RA GO variaran en función de los resultado r esultadoss de cada ca da estudiante.
Por último se realizan las gráficas de cada uno de los variogramas calculados
18
El error medio cuadrático se calcula con los valores del semivariograma experimental y los valores del variograma teórico t eórico
h
semivariog ariogra rama ma exper experime imenta ntall variog ariogra rama ma teóri teórico co (G2(G2-H2 H2)^ )^22 4 42.38265957 38.60777026 14.2497893 8 50.86195279 50 0.74296261 12 52.13467532 50 4.55683874 SUMA SUMATTORIA 19.54 .5495907 RMSE= MSE=
1.47 .47383064
6.1)Preguntas: 13.- ¿Según usted cuál es el mejor ajuste? 14.- ¿Cuál es el ajuste al que le correspondió el menor RMSE? 15.- ¿Usted considera que el RMSE es el mejor parámetro para p ara ajustar un variograma experimental a un modelo teórico? ¿Por qué?
19