Universidad Nacional de Crdoba
Alternativas para el Anlisis de Datos Composicionales con estructura de
tratamiento. Una aplicacin en el estudio del efecto de temperaturas de
quema sobre las propiedades fsicas de suelos en la regin semirida
pampeana central.
Tesis
para optar al grado acadmico de
Magister en Estadstica Aplicada
Lic. Valeria Belmonte
2012
Universidad Nacional de Crdoba
COMISIN ASESORA DE TESIS
Director: Dra. Nlida Winzer
Codirector:
PhD. Mnica Balzarini
FECHA DE APROBACIN DE TESIS: 5 de abril de 2012
A Dante, Santiago y Evangelina,
mis tres grandes amores,
por su paciencia y apoyo incondicional.
Agradecimientos
Quiero agradecer desde lo ms profundo de mi corazn a mi directora de tesis, la Dra.
Nlida Winzer, por orientarme con sus amplios conocimientos, sus enseanzas, su estmulo y
sobre todo por su paciencia en las correcciones en la escritura de la tesis. Destacado que, de
manera incondicional, me ha apoyado durante estos largos aos.
A la Lic. Estela Hepper y Lic. Ana Urioste quienes confiaron en m, invitndome a
participar de su proyecto de investigacin y brindndome los datos utilizados. Resaltando la buena
disposicin de Estela en comprender las interpretaciones que un matemtico tiene respecto su
ciencia.
A mis compaeras de tesis, en las que encontr verdaderas hermanas de la vida, que
aunque la realidad fsica nos diga que estamos a cientos o miles de kilmetros, nuestras
interminables cadenas de mails, nos ensearon a tener los corazones juntos, compartiendo las
alegras y tristezas que el destino nos tiene preparado.
A Mg. Rosana Cepeda y PhD. Mnica Balzarini por haber ledo con paciencia los
preliminares de la tesis y haber realizado valiosos aportes.
A la Facultad de Agronoma de la Universidad de La Pampa, que gracias a su ayuda
econmica me ha permitido viajar para desarrollar esta maestra.
RESUMEN
Los datos multivariados, cuyas componentes suman una constante, deben tratarse teniendo en
cuenta la existencia de correlaciones espurias entre sus partes. Por esta razn las tcnicas
multivariadas clsicas no son adecuadas para analizar este tipo de datos. En Edafologa, las
componentes granulomtricas tienen la propiedad de suma constante para cada muestra,
constituyendo un dato composicional. El conocimiento sobre los cambios de las propiedades
fsicas de los suelos en el ecosistema del Caldenal sometidos a quemas, como eventos naturales
o controlados, es escaso. En este trabajo se analizaron los cambios texturales de dos tipos
distintos de suelo de la regin del Caldenal sometidos a diferentes temperaturas controladas de
quema, desde la estadstica descriptiva e inferencial. Se observaron descriptivamente los cambios
de las fracciones granulomtricas sufridos por las diferentes temperaturas de quema dentro de la
estructura del Simplex. Por medio de las transformaciones alr y clr, los datos fueron trasladados a
un espacio real, posibilitando la aplicacin de tcnicas multivariadas clsicas. Se realiz un
grfico de Biplot que permiti observar el comportamiento conjunto de todas las fracciones
granulomtricas segn suelo y temperatura de quema. Por otro lado, se analizaron los datos
mediante un anlisis multivariado de la varianza (MANOVA) y con la tcnica de Anlisis
Multifactorial de Distancias (AMD) como mtodo alternativo, cuando los supuestos del anlisis de
la varianza multivariado resultaron difciles de corroborar. El arreglo experimental bajo el cual se
analiz fue el de una estructura factorial de tratamientos con dos factores: Suelo (Franco y Franco-
Arenoso) y Temperatura (sin calcinar, 200C, 300C, 400C 500C y 600C) bajo un diseo
completamente aleatorizado. Se logr determinar que los dos tipos de suelos tienen un
comportamiento diferente respecto a las temperaturas de quema, sobre todo en el compartimento
de las arenas. Para ambos suelos, las temperaturas de quema produjeron una reduccin de la
fraccin de arcilla y las temperaturas ms altas de calcinacin ocasionaron los mayores cambios
texturales respecto al suelo sin calcinar. Ambos mtodos estadsticos permitieron obtener
conclusiones, desde puntos de vistas diferentes, sobre el efecto del fuego en ambos suelos
Palabras claves: datos composicionales, AMD, MANOVA, suelo, quema
Alternatives for Compositional Data Analysis with treatment structure. An application for the
analysis of the effect of different burning temperatures on the physical properties of soils in the
Central semiarid pampa.
SUMMARY
Multivariate data, whose components add up to a constant, should take into account the existence
of spurious correlations between its parts. For that reason classical multivariate techniques are not
suitable for analyzing such data. In Soil Science, granulometric components have constant sum
property for each sample, providing a compositional data. Knowledge about changes in soil
physical properties in the Caldenal ecosystem subjected to burning, such as natural or controlled
events, is scarce. In this paper we analyzed the textural changes of two different types of soil from
the Caldenal region subjected to different temperatures during controlled fires, from the descriptive
and inferential statistics. Changes in grain size fractions caused by burning at different
temperatures were observed descriptively within the structure of the data were transferred to a real
space through the alr and clr transformation data . A Biplot was performed to allow observing the
behavior set of all size fractions depending on soil and temperature of burning. On other hand, data
were analyzed by Multivariate Analysis of Variance (MANOVA) and by Analysis of Multifactorial
Distances (AMD) as an alternative method when the assumptions of MANOVA were difficult to
check. A factorial treatment structure with two factors: soil (loam and sandy loam) and temperature
(not calcined, 200C, 300C, 400C, 500C and 600C) under a completely randomized design was
used .It was determined that two soil types have different behavior with respect to temperature of
burning, especially in the sand compartment. Burning temperatures caused a reduction in the
fraction of clay, and calcination at higher temperatures caused major textural changes with respect
to not calcined treatments. Both statistical methods allowed to draw conclusions from different
points of view on the effect of fire for the two soil types.
Keywords: compositional data, AMD, MANOVA, soil, temperature
3
TABLA DE CONTENIDOS
TABLA DE CONTENIDOS ............................................................................................................... 3
CAPTULO 1 ..................................................................................................................................... 7
Introduccin .................................................................................................................................... 7 1.1 Antecedentes .......................................................................................................................... 7 1.2. Objetivo General .................................................................................................................... 9 1.3. Objetivos Especficos ............................................................................................................. 9
CAPTULO 2 ................................................................................................................................... 11
Anlisis de datos composicionales ............................................................................................. 11 2.1 Introduccin .......................................................................................................................... 11 2.2 Definiciones bsicas ............................................................................................................. 12 2.3 El Simplex como espacio vectorial ........................................................................................ 13 2.4 El Simplex como espacio Eucldeo ....................................................................................... 14 2.5 Dificultades del anlisis estadstico de datos composicionales............................................. 15 2.6 Anlisis de log-cocientes ...................................................................................................... 16
2.6.1 Transformaciones de los datos composicionales .......................................................... 17 2.6.2 La transformacin log-cociente aditiva .......................................................................... 17 2.6.3 La transformacin log-cociente centrada ....................................................................... 18 2.6.4 La transformacin log-cociente isomtrica .................................................................... 18
2.7 Medidas de posicin y variabilidad para un conjunto de datos composicionales .................. 19 2.9 Distribuciones en el Simplex ................................................................................................. 21 2.10 Representacin Biplot para datos composicionales............................................................ 21
2.10.1 Construccin del Biplot para datos composicionales ............