Universidade de São Paulo
Escola Superior de Agricultura �Luiz de Queiroz�
Avaliações multivariada, geoestatística e de medidas repetidas de
um experimento sob delineamento sistemático tipo �leque�
João Vitor Teodoro
Tese apresentada para obtenção do título de Doutorem Ciências. Área de concentração: Estatística eExperimentação Agronômica
Piracicaba
2016
João Vitor Teodoro
Licenciado em Matemática
Avaliações multivariada, geoestatística e de medidas repetidas de um
experimento sob delineamento sistemático tipo �leque�
versão revisada de acordo com a resolução CoPGr 6018 de 2011
Orientadora:Profa Dra SÔNIA MARIA DE STEFANO PIEDADE
Tese apresentada para obtenção do título de Doutorem Ciências. Área de concentração: Estatística eExperimentação Agronômica
Piracicaba2016
Dados Internacionais de Catalogação na Publicação
DIVISÃO DE BIBLIOTECA - DIBD/ESALQ/USP
Teodoro, João Vitor Avaliações multivariada, geoestatística e de medidas repetidas de um experimento
sob delineamento sistemático tipo "leque" / João Vitor Teodoro. - - versão revisada de acordo com a resolução CoPGr 6018 de 2011. - - Piracicaba, 2016.
109 p. : il.
Tese (Doutorado) - - Escola Superior de Agricultura “Luiz de Queiroz”.
1. Delineamento sistemático tipo "leque" 2. Floresta 3. Geoestatística 4. Medidas repetidas 5. Multivariada I. Título
CDD 634.97332 T314a
“Permitida a cópia total ou parcial deste documento, desde que citada a fonte – O autor”
3
Dedicatória
Dedico este trabalho:
Aos meus pais, João e Sônia e ao meu irmão Jonatas, que sempre me apoiaram
independente das di�culdades e, compreenderam os motivos de minha ausência.
À minha esposa Jaqueline, por todo companheirismo e motivação.
4
5
AGRADECIMENTOS
Agradeço...
A Deus, por ter me concedido o privilégio da vida e o dom da aprendizagem.
À Profa. Sônia Maria De Stefano Piedade, que me orientou no desenvolvi-
mento deste trabalho e sempre foi uma amiga, me ajudando nos momentos em que mais
precisei.
Ao Prof. Omar Daniel (in memoriam) da FCA/UFGD que forneceu os
dados referentes a este trabalho e me instigou a me aprofundar nos estudos relativos à
problemática. E ao Prof. Rogério de Oliveira que intermediou meu contato com o Prof.
Omar.
Aos meus pais João Maria Teodoro e Sônia Maria Alves Teodoro, por terem
me educado de forma singular e priorizando meu crescimento pessoal. Foram eles meus
primeiros professores e aqueles que sempre acreditaram em meu potencial.
Ao meu irmão Jonatas Henrique Teodoro, pela amizade, con�ança e carinho.
À minha esposa Jaqueline Meneghini Fernandes Teodoro, pelo apoio, inspi-
rações concedidas, por sonhar e realizar os sonhos comigo.
À médica oftalmologista Rosana Teresa Alves Lóis Martin, por desa�ar a
ciência salvando minha visão.
Aos professores e demais pro�ssionais da Escola Estadual Manoel dos Santos,
que me propiciaram uma formação básica sólida e fundamental aos estudos posteriores.
Em especial aos professores Ijosiel Mendes, Fabiano Gonçalves Nicolau, Antonio Lungatto
e Isabel Cristina Bertolo.
Aos professores e demais pro�ssionais do Departamento de Matemática da
Faculdade de Engenharia de Ilha Solteira da Universidade Estadual Paulista �Júlio de
Mesquita Filho�, que me propiciaram um curso de graduação completo e com qualidade.
Ao meu orientador de iniciação cientí�ca Prof. José Marcos Lopes, que me
inseriu no campo cientí�co, me despertou o interesse de ensinar e de seguir carreira na
área de estatística.
Aos amigos com os quais convivi durante o período da graduação em Ilha
Solteira. Sempre serão lembrados por toda amizade e companheirismo. Em especial Luiz
Fernando de Souza Freitas e Douglas Silva Maioli.
À CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior,
pela bolsa concedida.
6
Aos professores que me ministraram aulas durante o curso de mestrado e
doutorado em Estatística e Experimentação Agronômica, me apresentando as ferramen-
tas e possibilidades de alto nível, com as quais pude me inteirar e trabalhar em minhas
pesquisas: Paulo Justiniano Ribeiro Junior, Roseli Aparecida Leandro, Clarice Garcia Bor-
ges Demétrio, Sílvio Sandoval Zocchi, César Gonçalves de Lima, Sônia Maria De Stefano
Piedade, Carlos Tadeu dos Santos Dias, Edwin Moisés Marcos Ortega, Gerson Barreto
Mourão, João Luís Ferreira Batista e Joanir Pereira Eler.
Às professoras Rachel Santos Bueno Carvalho e Mirian Rumenos Piedade
Bacchi pela aprendizagem durante o período de estágio no Programa de Aperfeiçoamento
de Ensino (PAE).
Aos amigos e companheiros de turma de mestrado e doutorado: Adriele,
Ana Júlia, Anderson, Daniel, Gabriel, Iábita, Ítalo, Jaqueline, José Nilton, Kuang, Luiz
Ricardo, Maria Joseane, Marisol, Naimara, Natalie Verônica, Patrícia e Sérgio, por tudo
de bom que compartilhamos.
Aos alunos do curso de Pós-Graduação em Estatística e Experimentação
Agronômica da ESALQ/USP, com os quais compartilhei essa fase da minha vida.
Aos amigos com quem pude conviver durante o mestrado e doutorado em
Piracicaba, por todo companheirismo e amizade.
Aos amigos com quem pude compartilhar bons momentos e experiências sa-
tisfatórias durante a condução de experimentos e coletas de dados: Aline Zampar, Fabiane
de Lima Silva, Gilson Silvério da Rocha, Gregori Alberto Rovadoscki, Johanna Ramirez
Diaz, Juliana Petrini, Laiza Helena de Souza Iung, Mary Ana Petersen Rodriguez, Mayara
Salvian, Simone Fernanda Nedel Pértile e Tiago Almeida de Oliveira.
Aos professores e funcionários do LCE/ESALQ/USP, em especial as secre-
tárias Solange de Assis Paes Sabadin, Luciane Brajão e Mayara Segatto pelo apoio no
transcorrer do curso.
Aos professores Carlos Tadeu dos Santos Dias (LCE/ESALQ/USP), Renata
Alcarde Sermarini (LCE/ESALQ/USP) e Lúcio Borges de Araújo (UFU), pelas dicas e
críticas referentes ao meu trabalho apresentado no exame de quali�cação.
Aos funcionários da Universidade Metodista de Piracicaba. Em especial ao
Prof. Antonio Nelson Corrêia Filho que me propiciou a primeira experiência na docência
de ensino superior.
A todos os professores, funcionários e alunos da Universidade Federal da
7
Grande Dourados, com os quais venho convivendo diariamente nos últimos anos. Em es-
pecial aos professores Ana Maria Villela Grecco, Irene Magalhães Craveiro, Lino Sanabria,
Luiz Gonzaga Manzine, Rogério de Oliveira, Sandra Regina de Oliveira de Souza e Selma
Helena Marchiori Hashimoto.
Aos professores Sônia Maria De Stefano Piedade (LCE/ESALQ/USP),
Renata Alcarde Sermarini (LCE/ESALQ/USP), César Gonçalves de Lima
(FZEA/ESALQ/USP), Antonio Carlos Simões Pião (UNESP/Rio Claro) e José Sil-
vio Govone (UNESP/Rio Claro) pela participação em minha banca de defesa de tese e
pelas signi�cativas contribuições. E à Simone Grego, Valiana Alves Teodoro e Viviane
Panariello Paulenas pela presença em minha defesa.
A todos que contribuíram de alguma forma para a realização deste trabalho
e também àqueles que colocaram as pedras em meu caminho.
Muito obrigado!
8
9
SUMÁRIO
RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 HIPÓTESES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4 REVISÃO BIBLIOGRÁFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.1 Modelos multivariados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.1.1 Análise de componentes principais . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.1.2 Análise de agrupamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.1.3 Análise discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Modelos geoestatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3 Medidas repetidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4 Plantios �orestais: a Canafístula . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5 MATERIAL E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6 RESULTADOS E DISCUSSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.1 Análise multivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.2 Análise geoestatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.3 Análise de medidas repetidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.4 Análises conjuntas alternativas . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
7 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.2 Pesquisas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
10
11
RESUMO
Avaliações multivariada, geoestatística e de medidas repetidas de umexperimento sob delineamento sistemático tipo �leque�
Os experimentos �orestais que estudam os efeitos de espaçamento devemadotar delineamentos distintos daqueles utilizados convencionalmente, por conta dagrande demanda de área experimental dos delineamentos convencionais, o delineamentosistemático tipo �leque� é a forma mais viável de se executar este tipo de ensaio. Nestedelineamento, as árvores são dispostas em diversos círculos concêntricos, de modo que,vários espaçamentos são gerados, porém, sem que haja possibilidade para a casualização.Para este tipo de experimento, convencionalmente são realizadas análises geoestatísticasque modelam o comportamento espacial de dependência entre os elementos, utilizandoalém da variável observada, as coordenadas das observações. Assim, é modelada umafunção denominada semivariograma que explica esta dependência espacial, possibilitandoa criação de um mapa de tendências denominado krigagem. Neste trabalho, são tratadasas variáveis de altura, diâmetro do fuste, diâmetro da copa, área da copa e volumecilíndrico de árvores de Canafístula, aos seis meses para altura e aos 13, 25 e 37 mesespara todas as variáveis, após o plantio de mudas de Canafístula (Peltophorum dubium)em um experimento conduzido em Mato Grosso do Sul. Além da análise geoestatística,também é realizada a análise multivariada objetivando relacionar as variáveis por meiode medidas de correlação, efetuar a análise de componentes principais, de agrupamentose discriminante. Além disso, é realizada a análise de medidas repetidas, objetivandoavaliar o comportamento dessas variáveis ao longo dos períodos. Por �m, algumas formascombinadas de avaliar e interpretar os resultados são apresentadas, de modo a relacionaras análises já realizadas, calculando novos componentes principais para as variáveis, porperíodo, efetuando a análise geoestatística dos componentes principais e avaliando ocomportamento desses componentes ao longo do tempo.
Palavras-chave: Delineamento sistemático tipo �leque�; Floresta; Geoestatística; Medidasrepetidas; Multivariada
12
13
ABSTRACT
Multivariate, geostatistical and repeated measures analyses of anexperiment under a systematic fan design
Forest experiments which study the spacing e�ects should adopt di�erentdelineations from those conventionally used, due to the great demand for experimentalarea of conventional delineations, the systematic fan design is the most viable way to per-form this type of test. In this design, the trees are arranged in several concentric circles, sothat various spacings are generated, however, with no possibility for randomization. Forthis type of experiment, statistical analyses modeling the spatial behavior of dependencebetween the elements are conventionally performed using, in addition to the variable ob-served, the coordinates of the observations. Thus, a function called semivariogram thatexplains the spatial dependence is modeled, enabling the creation of a map of trends calledkriging. In this paper, the variables of height, bole diameter, treetop diameter, area andits cylindrical volume of trees Cana�stula, are treated at six months for height and at13, 25 and 37 months for all variables after planting canafístula seedlings (Peltophorumdubium) in an experiment carried out in Mato Grosso do Sul. In addition to the geosta-tistical analysis, a multivariate analysis is also performed, aiming to relate the variablesby correlation measures and performing the analysis of the main, grouping and discrimi-nating components. Furthermore, the repeated measures analysis is performed aiming toevaluate the behavior of these variables over the periods. Finally, some combined waysto assess and interpret the results are presented in order to relate the previous analyses,calculating new key components for the variables, by period, performing the geostatisticalanalysis of the main components and evaluating the behavior of these components overtime.
Keywords: Systematic fan design; Forest; Geostatistics; Repeated measures; Multivariateanalysis
14
15
LISTA DE FIGURAS
Figura 1 - Semivariograma com efeito pepita . . . . . . . . . . . . . . . . . . . . . 43
Figura 2 - Semivariograma experimental e alguns modelos de semivariância: a) es-
férico, b) exponencial, c) gaussiano e d) linear. Fonte: Miranda-Salas e
Condal (2003) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Figura 3 - Exemplar de Canafístula. Fonte: INSTITUTO BRASILEIRO DE FLO-
RESTAS (2015) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Figura 4 - Locais de ocorrência natural de Canafístula no Brasil. Fonte: Carvalho
(2002) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Figura 5 - Delineamento sistemático tipo �leque� proposto por Nelder . . . . . . . . 62
Figura 6 - Área da planta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Figura 7 - Estimativas para área da planta (diâmetro do círculo) em cada posição . 64
Figura 8 - Grá�co CP1 × CP2 (esquerda), CP1 × CP3 (meio) e CP2 × CP3 (di-
reita), para todas as observações, em que pontos em vermelho correspon-
dem à área por árvore de 7,55m2 a 19,37m2 e pontos em azul correspon-
dem à área por árvore de 21,79m2 a 55,92m2. . . . . . . . . . . . . . . . 73
Figura 9 - Dendrograma das variáveis . . . . . . . . . . . . . . . . . . . . . . . . . 74
Figura 10 -Dendrograma para os círculos observados, do mais interno C01 ao mais
externo C18, para 13 meses (esquerdo) e 25 meses (direito) após o plantio 74
Figura 11 -Dendrograma para os círculos observados, do mais interno C01 ao mais
externo C18, para 37 meses (esquerdo) após o plantio e para todos os
períodos (direita) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Figura 12 -Valores em cada posição (esquerda) e semivariograma (direita) para A6 77
Figura 13 -Valores em cada posição (esquerda) e semivariograma (direita) para A13 78
Figura 14 -Valores em cada posição (esquerda) e semivariograma (direita) para A25 78
Figura 15 -Valores em cada posição (esquerda) e semivariograma (direita) para A37 78
Figura 16 -Valores em cada posição (esquerda) e semivariograma (direita) para DF13 79
Figura 17 -Valores em cada posição (esquerda) e semivariograma (direita) para DF25 79
Figura 18 -Valores em cada posição (esquerda) e semivariograma (direita) para DF37 79
Figura 19 -Valores em cada posição (esquerda) e semivariograma (direita) para DC13 80
Figura 20 -Valores em cada posição (esquerda) e semivariograma (direita) para DC25 80
Figura 21 -Valores em cada posição (esquerda) e semivariograma (direita) para DC37 80
Figura 22 -Valores em cada posição (esquerda) e semivariograma (direita) para AC13 81
16
Figura 23 -Valores em cada posição (esquerda) e semivariograma (direita) para AC25 81
Figura 24 -Valores em cada posição (esquerda) e semivariograma (direita) para AC37 81
Figura 25 -Valores em cada posição (esquerda) e semivariograma (direita) para VC13 82
Figura 26 -Valores em cada posição (esquerda) e semivariograma (direita) para VC25 82
Figura 27 -Valores em cada posição (esquerda) e semivariograma (direita) para VC37 82
Figura 28 -Krigagem da variável A, para 6, 13, 25 e 37 meses respectivamente . . . 83
Figura 29 -Krigagem da variável DF, para 13, 25 e 37 meses respectivamente . . . . 83
Figura 30 -Krigagem da variável DC, para 13, 25 e 37 meses respectivamente . . . . 84
Figura 31 -Krigagem da variável AC, para 13, 25 e 37 meses respectivamente . . . . 84
Figura 32 -Krigagem da variável VC, para 13, 25 e 37 meses respectivamente . . . . 85
Figura 33 -Per�s médios de resposta das alturas (A) nos círculos ao longo do tempo 86
Figura 34 -Per�s médios de resposta dos diâmetros do fuste (DF) nos círculos ao
longo do tempo (esquerda) e tendência das áreas da copa (AC) nos cír-
culos ao longo do tempo (direita) . . . . . . . . . . . . . . . . . . . . . . 86
Figura 35 -Per�s médios de resposta dos diâmetros da copa (DC) nos círculos ao
longo do tempo (esquerda) e tendência dos volumes cilíndricos (VC) nos
círculos ao longo do tempo (direita) . . . . . . . . . . . . . . . . . . . . 86
Figura 36 -Semivariograma (esquerda) e krigagem (direita) do componente principal
1 do grupo de todas as variáveis . . . . . . . . . . . . . . . . . . . . . . 94
Figura 37 -Semivariograma (esquerda) e krigagem (direita) do componente principal
2 do grupo de todas as variáveis . . . . . . . . . . . . . . . . . . . . . . 94
Figura 38 -Semivariograma (esquerda) e krigagem (direita) do componente principal
3 do grupo de todas as variáveis . . . . . . . . . . . . . . . . . . . . . . 94
Figura 39 -Semivariograma (esquerda) e krigagem (direita) do componente principal
1 do grupo de variáveis de 13 meses . . . . . . . . . . . . . . . . . . . . 95
Figura 40 -Semivariograma (esquerda) e krigagem (direita) do componente principal
2 do grupo de variáveis de 13 meses . . . . . . . . . . . . . . . . . . . . 95
Figura 41 -Semivariograma (esquerda) e krigagem (direita) do componente principal
1 do grupo de variáveis de 25 meses . . . . . . . . . . . . . . . . . . . . 95
Figura 42 -Semivariograma (esquerda) e krigagem (direita) do componente principal
2 do grupo de variáveis de 25 meses . . . . . . . . . . . . . . . . . . . . 96
Figura 43 -Semivariograma (esquerda) e krigagem (direita) do componente principal
1 do grupo de variáveis de 37 meses . . . . . . . . . . . . . . . . . . . . 96
17
Figura 44 -Semivariograma (esquerda) e krigagem (direita) do componente principal
2 do grupo de variáveis de 37 meses . . . . . . . . . . . . . . . . . . . . 96
Figura 45 -Per�s médios de resposta dos escores de CP1M nos círculos ao longo do
tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
18
19
LISTA DE TABELAS
Tabela 1 - Análise de variância nos índices Z com N indivíduos . . . . . . . . . . . 39
Tabela 2 - Densidade equivalente de árvores a cada círculo . . . . . . . . . . . . . . 65
Tabela 3 - Estatísticas descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Tabela 4 - Coe�cientes de correlação de Pearson . . . . . . . . . . . . . . . . . . . 71
Tabela 5 - Componentes principais e autovalores, proporção e proporção acumulada
correspondentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Tabela 6 - Autovetores (coe�cientes de correlação de Pearson entre os componentes
principais e as variáveis) . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Tabela 7 - Parâmetros dos semivariogramas . . . . . . . . . . . . . . . . . . . . . . 77
Tabela 8 - Teste de esfericidade de Mauchly . . . . . . . . . . . . . . . . . . . . . . 87
Tabela 9 - Correlações estimadas para alturas (A) entre os quatro períodos avaliados 87
Tabela 10 -Correlações estimadas para diâmetros de fuste (DF) entre os três períodos
avaliados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Tabela 11 -Correlações estimadas para diâmetros de copa (DC) entre os três períodos
avaliados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Tabela 12 -Correlações estimadas para área de copa (AC) entre os três períodos
avaliados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Tabela 13 -Correlações estimadas para volume cilíndrico (VC) entre os três períodos
avaliados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Tabela 14 -Análise multivariada da altura (A) por árvore, no delineamento inteira-
mente casualizado, testando o efeito nulo de fator período após o plantio 88
Tabela 15 -Análise multivariada da altura (A) por árvore, no delineamento inteira-
mente casualizado, testando o efeito nulo de interação período após o
plantio × círculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Tabela 16 -Análise multivariada de diâmetro do fuste (DF) por árvore, no delinea-
mento inteiramente casualizado, testando o efeito nulo de fator período
após o plantio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Tabela 17 -Análise multivariada de diâmetro do fuste (DF) por árvore, no delinea-
mento inteiramente casualizado, testando o efeito nulo de interação pe-
ríodo após o plantio × círculo . . . . . . . . . . . . . . . . . . . . . . . . 89
20
Tabela 18 -Análise multivariada de diâmetro da copa (DC) por árvore, no delinea-
mento inteiramente casualizado, testando o efeito nulo de fator período
após o plantio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Tabela 19 -Análise multivariada de diâmetro da copa (DC) por árvore, no delinea-
mento inteiramente casualizado, testando o efeito nulo de interação pe-
ríodo após o plantio × círculo . . . . . . . . . . . . . . . . . . . . . . . . 89
Tabela 20 -Análise multivariada de área da copa (AC) por árvore, no delineamento
inteiramente casualizado, testando o efeito nulo de fator período após o
plantio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Tabela 21 -Análise multivariada de área da copa (AC) por árvore, no delineamento
inteiramente casualizado, testando o efeito nulo de interação período após
o plantio × círculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Tabela 22 -Análise multivariada de volume cilíndrico (VC) por árvore, no delinea-
mento inteiramente casualizado, testando o efeito nulo de fator período
após o plantio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Tabela 23 -Análise multivariada de volume cilíndrico (VC) por árvore, no delinea-
mento inteiramente casualizado, testando o efeito nulo de interação pe-
ríodo após o plantio × círculo . . . . . . . . . . . . . . . . . . . . . . . . 90
Tabela 24 -Componentes principais e autovalores, proporção e proporção acumulada
correspondentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Tabela 25 -Autovetores considerando grupos de variáveis por período . . . . . . . . 92
Tabela 26 -Coe�cientes de correlação de Pearson entre os componentes principais e
as variáveis, considerando grupos de variáveis por período . . . . . . . . 92
Tabela 27 -Parâmetros dos semivariogramas dos escores dos componentes principais,
considerando grupos de variáveis por período e geral . . . . . . . . . . . 93
Tabela 28 -Correlações estimadas para CP1 entre os quatro períodos avaliados . . . 98
Tabela 29 -Teste de esfericidade de Mauchly . . . . . . . . . . . . . . . . . . . . . . 98
Tabela 30 -Análise multivariada de CP1M por árvore, no delineamento inteiramente
casualizado, testando o efeito nulo de fator período após o plantio . . . . 98
Tabela 31 -Análise multivariada de CP1M por árvore, no delineamento inteiramente
casualizado, testando o efeito nulo de interação período após o plantio ×
círculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
21
1 INTRODUÇÃO
Os sistemas de produção, independente da área, necessitam ser cada vez
mais sustentáveis. Há alguns anos, a exploração dos recursos naturais era realizado sem
qualquer preocupação com os impactos causados, como se o objeto de exploração �zesse
parte de uma fonte inesgotável. Atualmente, após sofrermos efeitos de tais impactos,
e impulsionados por campanhas de conscientização e políticas de incentivos, buscamos
práticas renováveis que tragam maiores benefícios como qualidade, quantidade e lucro,
sob aspectos como baixo custo e tempo reduzido.
A utilização de madeira proveniente de �orestas naturais já consumiu boa
parte da Mata Atlântica e Floresta Amazônica, além de provocar a transformação das
�orestas em pastagens. A implantação de �orestas plantadas vem ocorrendo desde o inicio
do século XX, com a produção de Eucalipto, que gerava parte da matéria prima para a
construção ferroviária. Desde então, diversas espécies vêm formando �orestas plantadas e
gerando diversos produtos além da madeira.
Ao possuir a segunda maior cobertura �orestal em nível mundial, grande po-
tencial e complexo sistema produtivo de �orestas plantadas, principalmente considerando-
se Pinus e Eucaliptos, o Brasil se destaca como forte produtor neste setor. Porém, apesar
das várias restrições impostas pela legislação, que até mesmo limitam a produção �orestal
legal, ainda há muitas ocorrências de desmatamento ilegal de �orestas nativas (SISTEMA
NACIONAL DE INFORMAÇÃO FLORESTAL - SNIF, 2015).
Conforme a Indústria Brasileira de Árvores (2015), atualmente o Brasil tem
3% de participação nos US$ 250 bilhões anuais gerados pela venda de produtos proveni-
entes da madeira produzida em �orestas plantadas no mundo, porém, há uma previsão
de que dobre a área plantada, que em 2015 era de 7 milhões de hectares, até o ano de
2020. Isto se dará pelas condições climáticas associadas aos investimentos empregados em
tecnologia e em pesquisas.
Este trabalho aborda especi�camente a espécie Canafístula (Peltophorum
dubium), que produz madeira de alto valor econômico, utilizada amplamente na construção
civil e na produção de papel, dentre outros produtos. De forma que, conforme Matos
(2014), foi conduzido um experimento na cidade de Dourados no estado de Mato Grosso
do Sul contendo 528 árvores dispostas em delineamento sistemático tipo �leque� proposto
por Nelder (1962), cujas mudas são plantadas ordenadamente de forma circular sob vários
22
raios pré-determinados, objetivando avaliar as características de altura, diâmetro do fuste,
diâmetro da copa, área da copa e volume cilíndrico aos 13, 25 e 37 meses. A altura foi
observada também aos 6 meses.
A disposição experimental em delineamento sistemático tipo �leque� possi-
bilita, por meio da disponibilidade de uma área relativamente pequena e com quantidade
não exagerada de observações, avaliar uma grande quantidade de espaçamentos entre as
árvores. A determinação do espaçamento é um dos fatores mais importantes na produ-
ção �orestal, pois, se houver um espaçamento exagerado, ocorrerá desperdício de área de
produção e, para espaçamentos reduzidos, as árvores podem se desenvolver com caracte-
rísticas de interesse econômico prejudicadas; assim, se faz necessário identi�car, para cada
atributo, o espaçamento ótimo entre árvores. Por conta da grande demanda de terreno
e de mudas, alguns delineamentos �orestais diferentes do esquema de Nelder são muitas
vezes inviáveis, relevando ainda mais a importância deste esquema.
Em grande parte das áreas de conhecimento, os dados provenientes de pes-
quisas, são avaliados normalmente, considerando-se apenas uma variável ou as variáveis
de forma independente. Tanto a localização das unidades amostrais, quanto a natureza
das variáveis e as mensurações feitas nas mesmas unidades amostrais, podem favorecer
uma relação de dependência, de tal forma que análises das variáveis de forma individual e
sem considerar esses aspectos, podem deixar de apresentar determinadas tendências que
convêm ao interesse do pesquisador.
Deste modo, a utilização de modelos que consideram técnicas geoestatísticas,
multivariadas e com medidas repetidas é de fundamental importância. Tratando-se de
dados resultantes de experimentos que utilizam a disposição experimental de Nelder, é
comum ocorrer a análise geoestatística, que possibilita avaliar qual modelo melhor explica
o relacionamento espacial entre as observações (semivariograma), se há realmente uma
dependência espacial, qual o alcance da dependência espacial e quais as estimativas para
as regiões não amostradas por meio de um mapa denominado krigagem.
Em se tratando de um grande conjunto de variáveis, é importante consi-
derar que pode haver um relacionamento entre elas, expresso pelas correlações. Desta
forma, avaliar cada uma delas individualmente pode trazer muitos resultados de forma
redundante. Utilizar técnicas multivariadas para avaliar o conjunto de dados em questão
possibilita obter resultados sucintos, ao abordar os componentes principais, identi�car a
área em que a árvore se desenvolveu, informando-se as variáveis, e avaliar a similaridade
23
entre as árvores amostradas.
Como os atributos abordados foram tomados em vários períodos, é impor-
tante avaliar o comportamento ao longo do tempo, identi�cando como cada área por árvore
in�uencia as variáveis temporalmente. Assim, a análise com medidas repetidas pode trazer
resultados que identi�quem períodos ideais de plantio.
Além das análises convencionais já citadas, outras foram propostas de modo
a combiná-las, possibilitando obter interpretações sob enfoques alternativos que puderam
trazer resultados importantes ainda não identi�cados.
24
25
2 HIPÓTESES
O comportamento espacial de cada variável é identi�cado em função da
mudança do espaçamento.
A relação de correlação entre as variáveis é determinada, favorecendo a re-
dução do número de variáveis e o estudo de agrupamento dos raios e das variáveis, além
da estimação do espaçamento para uma observação por meio dos valores das variáveis.
Mesmo sem a condição de aleatorização satisfeita, é possível identi�car o
comportamento de cada círculo ao longo do tempo.
É possível estabelecer estratégias alternativas para avaliação dos dados, com-
binando as avaliações espaciais, multivariada e com medidas repetidas.
26
27
3 OBJETIVOS
Realizar a análise geoestatística individualmente para cada variável, veri�-
cando a existência de dependência espacial e identi�cando o modelo de semivariograma,
possibilitando obter o alcance espacial desta dependência e gerar a krigagem.
Avaliar o conjunto de dados de forma multivariada, obtendo os coe�cientes
de correlação entre as variáveis, efetuando a análise de componentes principais, a análise de
agrupamentos para as variáveis e para os espaçamentos, e realizar a análise discriminante
objetivando classi�car cada observação nos grupos de espaçamento.
Efetuar a análise de medidas repetidas, veri�cando a tendência dos atributos
ao longo do tempo, para cada círculo.
Desenvolver estratégias que facilitem a interpretação conjunta dos resultados
obtidos nas avaliações geoestatística, multivariada e com medidas repetidas.
28
29
4 REVISÃO BIBLIOGRÁFICA
4.1 Modelos multivariados
Em pesquisas nas áreas da estatística, é necessário levar em consideração um
grande número de fatores. Estabelecer relações entre variáveis pode não ser uma tarefa
trivial e não depende apenas da análise intuitiva do cientista. A área da estatística que
trata das variáveis de forma conjunta é a estatística multivariada.
Antes da prática computacional estar inclusa na ciência e deter certa ca-
pacidade de processamento, era praticamente impossível trabalhar estatisticamente com
variáveis de forma conjunta. Já com o advento desta capacidade se tornou possível avaliar
os fenômenos em sua totalidade, estudando como e quanto as variáveis se relacionam. A
Análise Multivariada é um grande conjunto de métodos e técnicas que avaliam, simulta-
neamente, várias variáveis na interpretação teórica em um conjunto de dados (MOITA
NETO, 2014).
Existem vários métodos de análise multivariada com �nalidades variadas,
assim, a decisão sobre qual método utilizar depende dos objetivos do estudo e resultados
que se deseja gerar. A maior di�culdade, geralmente, não está no processo de análise dos
dados, mas sim, na obtenção de uma boa interpretação para os resultados obtidos.
Uma observação multivariada é uma coleção de medidas em p variáveis to-
madas na mesma unidade amostral. Desta forma, n observações podem ser dispostas em
uma matriz da forma:
X =
x11 x12 . . . x1p
x21 x22 . . . x2p...
.... . .
...
xn1 xn2 . . . xnp
(1)
em que, cada linha de X representa uma observação multivariada. Assim, os dados re-
presentam uma amostra de tamanho n de uma população p variada. Além disso, há um
vetor de médias x de dimensão p e uma matriz de covariâncias S de dimensão p × p que
pode ser associada a X.
Com a �nalidade de se fazer inferências, é necessário considerar pressuposi-
ções a respeito das variáveis cujos valores observados constituem um conjunto de dados X.
30
Os elementos (j, k), j = 1, . . . , n e k = 1, . . . , p da matriz de dados, representam realizações
de uma variável aleatória Xjk e cada conjunto de medidas Xj˜ em p variáveis é um vetor
aleatório (FERREIRA, 1996).
Algumas conclusões podem ser obtidas da distribuição de X˜ e S sem pres-
suposições sobre a distribuição conjunta das variáveis. Considerando X1˜ , X2˜ , . . . , Xn˜ uma
amostra aleatória de uma distribuição conjunta com vetor média µ˜ e matriz de covariância
Σ, então E(X̄˜ ) = µ˜ e Cov(X̄˜ ) = 1nΣ.
Já as análises estatísticas de modelos com erros aditivos baseiam-se na pres-
suposição de normalidade. A distribuição normal requerida refere-se, não à variação dos
dados, mas à variação residual. Para se veri�car a normalidade para distribuições p-
variadas, tem-se que (x− µ)tΣ−1(x− µ) ≤ χ2p(1− α).
Conforme Anderson (1984), a função de densidade de probabilidade normal
multivariada é dada por:
f(X˜ ) =1
(2π)p2 |Σ| 12
exp
[−1
2(X˜ − µ˜)tΣ−1(X˜ − µ˜)
](2)
em que, µ˜ é o vetor esperado do vetor X˜ e Σ é sua matriz de covariâncias.
Conforme Kendall (1975), a estatística multivariada fornece ferramentas
para avaliar e interpretar os dados de várias formas, dos quais, a simpli�cação de uma
estrutura de dados, por meio da transformação, geralmente linear, do conjunto de dados
original em um menor conjunto de dados independentes, o agrupamento de observações
ou variáveis por similaridade e a formulação de hipóteses. Avaliação de interdependência,
incluindo a colinearidade, quando há combinação linear entre variáveis.
Avaliar e interpretar dados univariados é comum e, geralmente, não produz
grandes di�culdades, porém, ao se tratar de múltiplas variáveis correlacionadas, dada a
exigência de trabalhar em espaços multidimensionais, principalmente naqueles superiores
a três dimensões, a di�culdade pode ir além da capacidade humana e exigir alternativas
secundárias. Porém, a análise multivariada oferece soluções que possibilitam avaliar estes
tipos de estruturas de dados de modo mais simpli�cado.
Mas, para casos em que é conhecido o não relacionamento entre as variáveis,
ou seja, independência, por meio da não correlação, é evitável utilizar-se das técnicas mul-
tivariadas. Neste caso, o estudo individual das variáveis, por meio de técnicas univariadas
é a melhor alternativa, pois, de forma mais simpli�cada, obteremos resultados consisten-
31
tes. Porém, se há evidência da relação de dependência, entre algumas das variáveis, é
conveniente o uso das técnicas multivariadas.
4.1.1 Análise de componentes principais
Diante de um grande número de variáveis correlacionadas, é importante que
haja uma redução deste número de variáveis para facilitar na avaliação e interpretação dos
dados. Assim, a análise de componentes principais permite obter um pequeno número de
combinações lineares de um grupo de variáveis, conservando ao máximo, a variabilidade
original dos dados.
Esta técnica não exige o conhecimento sobre a distribuição de probabilidades
da população, assim, não sendo necessária a determinação do modelo estatístico que explica
o comportamento residual. Deve-se testar, para os dados, se há distribuição multinormal,
deste modo, se pode obter signi�cância dos componentes por meio de uma con�abilidade.
Pearson (1901) apresenta pela primeira vez a noção de componentes prin-
cipais, por meio do ajuste de um sistema de pontos multivaridos a uma linha ou plano.
Posteriormente Hotelling (1933) amplia o trabalho de Pearson, sistematizando e de�nindo
o conceito de componente principal, da forma como a utilizamos. Identi�cando e enfo-
cando aqueles componentes com maior variabilidade do sistema, ou seja, que continham
grande porção da variabilidade dos dados.
Ainda segundo Hotelling (1933), a análise de componentes principais, pos-
sibilita identi�car a relação entre elementos da população ou se nesta relação existam
variáveis ou propriedades que a in�uencie.
Assim como outras avaliações, a análise de componentes principais é sensível
às diferenças de magnitude das variáveis, relativamente às unidades de medida. Deste
modo, não é conveniente trabalhar com variáveis que in�uenciarão mais do que outras,
simplesmente pela magnitude e unidade de medida. Assim, uma alternativa coerente que
torna a in�uência das diferentes variáveis mais justa é a padronização, que fornece uma
nova variável com média zero e variância igual a um. Isto é conseguido por meio da
divisão da diferença entre os valores dos dados e a média aritmética pelo desvio padrão
dos mesmos. Assim, a matriz de covariâncias consistirá das correlações. Caso as variáveis
estejam na mesma unidade de medida, é utilizada a matriz de covariância ou de dispersão,
para o cálculo dos componentes principais.
Os componentes principais, sobretudo os dois primeiros, que podem conter a
32
grande parte da variabilidade dos dados, podem determinar os eixos de uma representação
multidimensional e identi�car as coordenadas de cada elemento do conjunto de dados, em
relação a esses componentes dos eixos, reduzindo as dimensões e facilitando a interpretação,
tornando possível classi�car elementos similares em grupos.
Na análise de componentes principais, o número de variáveis originais corre-
lacionadas é reduzido para um conjunto de novas variáveis não correlacionadas, ou seja, os
componentes principais, que são funções lineares das variáveis, por meio da transformação
do espaço dimensional, de modo que a projeção seja ortogonal, tornando-o independente
dos demais.
Conforme a�rma Ribeiro (2001), a análise de componentes principais tam-
bém é útil para identi�car dados anormais do conjunto de dados. Ao observar os primeiros
componentes principais é possível identi�car valores que contribuem fortemente para o
aumento da variância e covariância. Já por meio dos últimos componentes é possível iden-
ti�car valores observados que apresentem dimensões incomuns para o estudo em questão.
A utilização de diagramas de dispersão entre os componentes dois a dois podem auxiliar
nesta identi�cação.
Manly (2004) descreve a análise de componentes principais tomando ini-
cialmente um conjunto com p variáveis em n indivíduos. Assim, o primeiro com-
ponente principal (Z1) é calculado pela combinação linear das p variáveis conforme
Z1 = a11X1 + a12X2 + ... + a1pXp, que varia tanto quanto possível para os indivíduos,
sujeito à a211 + a212 + ...+ a21p = 1.
Desta forma, a variância de Z1 deve ser maximizada, dadas restrições de a1j,
pois caso contrário, esta variância cresce ao aumentar algum a1j.
O segundo componente principal (Z2) é calculado pela combinação linear
das p variáveis conforme Z2 = a21X1 +a22X2 + ...+a2pXp, que varia tanto quanto possível
para os indivíduos, sujeito à a221 + a222 + ...+ a22p = 1.
Desta forma, a variância de Z2 deve ser maximizada, dadas restrições de a2j,
pois caso contrário, esta variância cresce ao aumentar algum a2j.
Do mesmo modo, são determinados os demais componentes principais, até
totalizar uma quantidade máxima de p. O método consiste no cálculo de uma matriz de
covariância e seus autovalores. Seja C a matriz de covariâncias em (3).
33
C =
c11 c12 . . . c1p
c21 c22 . . . c2p...
.... . .
...
cp1 cp2 . . . cpp
(3)
em que,
cii é variância da variável Xi;
cij, i 6= j é a covariância entre as variáveis Xi e Xj.
Os p autovalores de C são as variâncias dos componentes principais, dos
quais alguns podem ser nulos, porém não podem ser negativos. Consideremos os au-
tovalores ordenados segundo λ1 ≥ λ2 ≥ ... ≥ λp ≥ 0, em que, λi = V ar(Xi), para
Zi = ai1X1 +ai2X2 + ...+aipXp, e ai1, ai2, ..., aip são os elementos do autovetor escalonado,
de forma que a2i1 + a2i2 + ...+ a2ip = 1 seja válido.
Uma importante propriedade dos autovalores é que sua soma corresponde
ao traço de C, conforme λ1 +λ2 + ...+λp = c11 + c22 + ...+ cpp. Portanto, os componentes
principais contêm toda a variabilidade proveniente do conjunto de dados.
Conforme já sugerido anteriormente, as variáveis devem ser padronizadas,
para casos em que haja unidades de medida distintas, assim,C é uma matriz de correlações,
de modo que c11 = c22 = ... = cpp = 1.
A contribuição de cada componente principal é dada pela quociente entre a
variância do componente e a variância total, conforme (4), e é dado em porcentagem. Esta
medida representa a importância do componente ou a variância do mesmo em relação à
total. O somatório dos autovalores correspondentes aos k primeiros componentes principais
corresponde à variabilidade acumulada e que é representada em k dimensões. Regazzi
(2000) a�rma que, para escolha do número de componentes considerados, uma alternativa
válida é considerá-los até que 70% ou mais da variabilidade acumulada seja explicada.
Conti =λi × 100%∑p
i=1 λi(4)
Um dos fatores mais importantes na elaboração de uma análise de com-
ponentes principais é a interpretação dada a cada componente. Como os componentes
principais são novas variáveis, também devem ser nomeadas, conforme a interpretação
concedida pelo pesquisador da área de estudo ao observar o nível de in�uência que cada
34
variável tem sobre o componente interpretado, por meio de medidas de correlação (5).
Desta forma, avaliando a correlação entre cada variável original e o componente principal,
é possível nomeá-lo de acordo com as in�uências de cada uma, tornando a avaliação mais
consistente, melhorando a interpretação.
Corr(Zi, Xj) = aij ×√λi√
V ar(Xj)(5)
4.1.2 Análise de agrupamento
Outra análise multivariada amplamente utilizada é a Análise de Agrupa-
mento Hierárquico. Esta análise é dada pelo tratamento matemático de cada amostra
no espaço multidimensional descrito pelas variáveis escolhidas. Podemos assim, conside-
rar uma variável como um ponto no espaço por meio da descrição amostral, existindo a
possibilidade de agrupar variáveis ou amostras. Ao considerar os valores amostrais em
coordenadas do espaço de variáveis, podem-se determinar as distâncias entre eles, gerando
uma matriz de distâncias (MOITA NETO; MOITA, 1998).
Em um conjunto de dados com n observações em p variáveis, X1, X2, ..., Xp,
os valores para o i-ésimo objeto podem ser denotados por xi1, xi2, ..., xip. A forma de cal-
cular distâncias mais simples é a distância euclidiana, que utiliza o teorema de Pitágoras
considerando como hipotenusa a distância entre dois pontos. Deste modo, por exemplo, em
um espaço bivariado, a distância euclidiana entre dois pontos i-ésimo e j-ésimo é calculada
conforme (6), já para uma quantidade p de variáveis, ou seja, em um espaço p-variado,
a distância entre os pontos i e j é dada por (7). Salientando que para p > 3 não é pos-
sível ilustrar gra�camente para visualização, os eixos e valores amostrais correspondentes
(MANLY, 2004).
dij =√
(xi1 − xj1)2 + (xi2 − xj2)2 (6)
dij =
√√√√ p∑k=1
(xik − xjk)2 (7)
Assim como já a�rmado durante a discussão sobre o método de componentes
principais, no cálculo das distâncias também existe grande in�uência das magnitudes e
unidades de medida, pois, algumas variáveis podem in�uenciar signi�cativamente mais do
35
que outras. Assim, neste caso, também é conveniente a padronização de todas as variáveis,
a menos que já estejam na mesma unidade de medida.
Além da distância euclidiana, inúmeras outras são úteis e utilizadas ampla-
mente para a distância entre populações multivariadas. Manly (2004) aborda a distância
de Penrose e a distância de Mahalanobis. Seja µki a média da variável Xk na população i
e Vk a variância de Xk para todas as populações, assim, conforme sugere Penrose (1952),
a expressão (8) fornece uma distância entre as populações i e j. Porém, não é considerado
o relacionamento entre as variáveis por meio da matriz de correlações, tornando algumas
distâncias redundantes quando envolvem variáveis com altas correlações, medindo várias
vezes a mesma variação.
Pij =
∑pk=1(µki − µkj)
2
pVk(8)
Para reparar tal redundância, Manly (2004) sugere a utilização da medi-
dade de distância de Mahalanobis (MAHALANOBIS, 1948), dada pela expressão (9), que
considera, para o cálculo, as correlações entre variáveis, lembrando que esta medida só é
superior à distância de Penrose, quando as covariâncias são estimadas com alta precisão.
Além disso, também permite calcular a distância de cada observação ao centro da sua po-
pulação de origem por meio da expressão (10). Uma interpretação para D2 é relacioná-lo
a um resíduo de x, em relação à distância aos centros das distribuições dos valores, além
disso, se a população é normalmente distribuída de forma multivariada, então D2 tem
distribuição qui-quadrada com p graus de liberdade.
D2ij = (µi − µj)
′V −1(µi − µj) (9)
em que,
µi é o vetor de médias populacional para a i-ésima população;
V é a matriz de covariância populacional, supondo que esta seja a mesma para todas as
populações.
D2ij = (x− µ)′V −1(x− µ) (10)
em que,
x = (x1, x2, . . . , xp);
36
µ é o vetor de médias populacional;
V é a matriz de covariância populacional.
Após determinar qual a melhor metodologia para o cálculo das distâncias
do conjunto de dados multivariado em questão, é desejável que se construa uma matriz
de distâncias, ou de dissimilaridade, entre as amostras. Além desta matriz é conveniente
utilizar uma representação por meio de um diagrama, como o diagrama de similaridade
dendrograma, de modo que o su�xo �dendro� incorpora o signi�cado de árvore. Uma
das técnicas mais usuais na construção de dendrogramas utiliza a forma de classi�cação
conhecida como agrupamento sequencial aglomerativo, que agrupa amostras mais próximas
sequencialmente, formando os grupos.
Para entender o que representa um dendrograma entre amostras, devemos
considerar previamente que duas amostras consideradas próximas devem apresentar maior
proximidade entre os valores das variáveis, apresentando pouco distanciamento no espaço.
O dendrograma representa esta similaridade de forma hierarquizada, de modo que, haja
uma representação no espaço bidimensional entre todas as similaridades, e de uma forma,
também da dissimilaridade, entre quaisquer conjuntos amostrais tratados. Já nos dendro-
gramas elaborados para as variáveis, a similaridade se refere à correlação entre elas.
Várias formas de agrupar ou aglomerar os valores multidimensionais podem
ser desenvolvidas, envolvendo os agrupamentos hierárquicos e utilizando a matriz de si-
milaridade. Os métodos hierárquicos iniciam utilizando a matriz de distâncias entre os
objetos de estudos, e considerando que estes objetos estão inicialmente sozinhos nos gru-
pos. Posteriormente, grupos que estão mais próximos se unem, formando um único grupo,
conforme há redução na similaridade. Este procedimento é realizado sucessivamente, ou
seja, conforme há redução na similaridade, os grupos próximos vão se unindo em um novo
grupo.
A identi�cação da proximidade entre dois grupos para assim poder considerá-
los um único grupo, pode ser realizada de várias formas, uma delas é a ligação do vizinho
mais próximo, de modo que, grupos são unidos a certo nível de distância se um dos objetos
de um grupo está àquela distância ou menos de no mínimo um objeto do outro grupo. Já
no método de ligação do vizinho mais distante, a ligação entre dois grupos ocorre se os
dois elementos mais distantes entre os dois grupos são considerados próximos. E a ligação
média de grupo ocorre se a distância média entre todos os elementos dos dois grupos é
considerada próxima (MANLY, 2004).
37
Manly (2004) ainda a�rma que além dos métodos hierárquicos que produzem
dendrogramas para análise de agrupamento, também há a abordagem que utiliza partição,
que envolve muitos algoritmos. Basicamente, em um estágio inicial os grupos são determi-
nados arbitrariamente, com objetos designados ao centro mais próximo. Posteriormente,
outros centros são calculados, representando a média do grupo. Os objetos são realocados
a novos grupos se estão mais próximos ao novo centro. Grupos próximos são unidos e com
elementos mais distantes são desmembrados em mais grupos. Assim, os procedimentos
são efetuados repetidamente até que se obtenha uma estabilidade satisfatória.
4.1.3 Análise discriminante
Outra técnica de análise estatística multivariada que envolve distâncias é a
análise discriminante. Esta análise, como o próprio nome diz, é utilizada para discriminar
e classi�car elementos. É uma técnica que avalia a separação de elementos da população
em várias classes, e o processo de discriminação/separação é o primeiro a ser executado,
consistindo numa análise exploratória. Esta parte da análise busca e identi�ca as relações
entre variáveis que torna possível designar com mais segurança os objetos em grupos
pré-de�nidos, diferente do que ocorre na análise de agrupamentos (KHATTREE; NAIK,
2000).
Segundo Johnson e Wichern (1999), esta classi�cação pode ser utilizada pos-
teriormente para classi�car também novos objetos. Esta problemática de discriminação
em grupos objetivando classi�cações posteriores foi apresentada inicialmente por Fisher
(1936), de forma que, era constituída pela obtenção de funções com a capacidade de classi-
�car cada observação p-variada Xj em uma das classes, com base nas p características, de
modo que a probabilidade de classi�cação errônea fosse minimizada, ou seja, de classi�car
Xj em uma classe, quando na verdade não pertence à esta.
A obtenção de uma combinação linear das p variáveis que forneça maior
capacidade de discriminação entre grupos é o maior objetivo da metodologia. Esta função
dada pela combinação linear é denominada função discriminante e deve minimizar as
probabilidades de classi�cação errônea considerando tais grupos com distribuições normais
com média e covariâncias conhecidas. Porém, o conhecimento sobre a média e covariâncias
não é possível, apenas o valor estimado. Assim, é possível assumir ou não a igualdade
entre matrizes de covariância, Fisher assume igualdade e sua função é denominada função
discriminante linear. Além da função discriminante linear, também, é possível utilizar
38
uma quadrática.
Um dos objetivos da função discriminante é a identi�cação das regiões de
alocação, que são os conjuntos de elementos separados por uma fronteira. A função discri-
minante utiliza para tal, uma amostra de treinamento. Posteriormente, uma nova amostra
poderá ser classi�cada em cada população, respeitando-se os limites estabelecidos pela
fronteira. Na prática, o conceito de fronteira não existe no sentido de estabelecer parti-
ções, pois haverá superposições, de modo que uma mesma região pode pertencer a vários
grupos, envolvendo um erro de classi�cação, de modo que, uma classi�cação é boa quando
há poucos erros de classi�cação, envolvendo baixa probabilidade de classi�cação errônea.
Johnson e Wichern (1999) a�rmam que, para que haja uma boa classi�cação,
devem ser considerados os custos da má classi�cação e probabilidades a priori. Para
avaliar a classi�cação, é considerado se as variâncias das populações são ou não as mesmas.
Caso sejam consideradas iguais, as funções discriminantes são denominadas lineares, caso
contrário, são ditas quadráticas. Além disso, outras metodologias envolvendo lógica fuzzy
ou redes neurais podem ser utilizadas para elaboração das regras classi�catórias. Esta
última, comparada aos métodos estatísticos, tem a vantagem de indicar uma separação de
classes por meio de planos não-lineares, ao invés de lineares ou quadráticos.
Segundo Manly (2004), uma forma de discriminar é utilizando a distância
de Mahalanobis, de modo que, dadas m amostras, os vetores de médias são considerados
estimativas dos vetores de médias dos grupos; assim, calcula-se as distâncias de cada
observação aos centros dos grupos e cada observação é considerada pertencente aquele
grupo cuja distância ao centro seja inferior. Para tal, consideremos x′i = (x1i, x2i, . . . , xpi)′
o vetor de médias do grupo i, e Ci e C respectivamente, a matriz de covariâncias e a matriz
de covariâncias amostral combinada, assim, pode-se estimar a distância entre a observação
x′ = (x1, x2, . . . , xp)′ e o centro do i-ésimo grupo conforme D2
i = (x−xi)′C−1(x−xi), de
modo que x é considerada pertencente ao grupo cujo valor de distância D2i seja inferior.
Ainda segundo Manly (2004), é importante determinar as combinações li-
neares das variáveis X1, X2, . . . , Xp, que dividem os m grupos de forma otimizada, assim,
tomemos Z = a1X1+a2X2+. . .+apXp para isto. Deste modo, a separação será e�ciente se
Z apresenta variação considerável entre grupos e valores dentro do grupo bem próximos.
O problema então consiste em determinar os coe�cientes ai. Isto possível,
de modo a maximizar o valor da razão F da análise de variância de um fator conforme a
Tabela 1. Assim, a função mais adequada à separação dos grupos, dada por Z, é aquela
39
para o qual F seja máximo, conforme Fisher (1936) sugere.
Nesta metodologia, pode ocorrer a determinação de várias funções lineares,
denominadas funções discriminantes canônicas. Consideremos assim, Z1 = a11X1+a12X2+
. . .+ a1pXp como a primeira delas, apresenta maior F na análise de variância de um fator
para a variação dentro e entre grupos. Se esta função não é única, a próxima é de�nida por
Z2 = a21X1 + a22X2 + . . .+ a2pXp, apresentando maior F possível na análise de variância
de um fator, dado que não há correlação entre Z1 e Z2 nos grupos. E desta forma a análise
prossegue caso haja mais funções discriminantes canônicas.
Tabela 1 - Análise de variância nos índices Z com N indivíduos
Fonte de variação Graus de liberdade Quadrado médio FEntre grupos m-1 MB
MB
MW
Dentro dos grupos N-m MW -Total N-1 - -Fonte: Manly (2004)
Manly (2004) a�rma que a determinação dos coe�cientes das funções discri-
minantes canônicas é contemplada pela utilização de autovalores, de modo que, dadas as
matrizesW de somas de quadrados e produtos cruzados dentro da amostra e T , a matriz
amostral total de somas de quadrados e produtos cruzados, é possível obter a matriz entre
grupos B = T −W . Então, é possível determinar autovalores e autovetores deW−1B, de
forma que, se λ1 > λ2 > . . . > λs, em que s é o número de combinações lineares possíveis,
em geral dado pelo mínimo entre p e m − 1. Assim, λi apresenta a razão da soma dos
quadrados entre grupos e a soma dos quadrados dentro dos grupos, para a combinação
associada a Zi, além de que os autovetores correspondem aos coe�cientes das variáveis
neste índice i. É esperado que não sejam necessárias muitas funções discriminantes, pois
geralmente as primeiras já são o su�ciente para representar as importantes diferenças entre
grupos.
Este método utilizado pressupõe que a matriz de covariâncias dentro do
grupo populacional seja a mesma para os grupos e que, para que seja possível aplicar
testes de signi�cância, haja distribuição multivariada nos dados dentro dos grupos.
4.2 Modelos geoestatísticos
É frequente, nas análises estatísticas de dados, a suposição de independência
das variáveis aleatórias, considerando que as observações não se in�uenciam. Porém, em
40
grande parte dos fenômenos, principalmente naqueles naturais, há in�uência entre obser-
vações feitas em unidades experimentais �sicamente próximas, ou seja, são espacialmente
dependentes.
Nesses casos, avaliar as informações de forma clássica, não deve ser a única
alternativa, pois a análise espacial deve complementá-la utilizando abordagens como a
geoestatística.
Durante algumas análises com dados provenientes de mineração, Krige
(1951) veri�cou que as variâncias deveriam ser avaliadas considerando-se as distâncias
entre as amostras, pois, caso contrário, as conclusões estariam erradas. Considerando-se
esta a�rmação de Krige (1951) é que, Matheron (1963) elaborou uma teoria sobre variá-
veis regionalizadas, em que, é de�nida uma função espacial numérica que varia conforme
o local, apresenta continuidade e a variação não pode ser descrita por uma função mate-
mática simples, criando-se assim, a geoestatística. A geoestatística ganhou impulso em
áreas distintas da mineração e da geologia a partir de 1980, com grande aplicabilidade na
ciência do solo, o que se justi�ca pela relativa simplicidade computacional viabilizando os
cálculos trabalhosos, nesta época.
Segundo Yamamoto e Landim (2015), Matheron criou em 1968 o Centre de
Morphologie Mathématique que, posteriormente foi rami�cado em dois centros, de Mor-
fologia Matemática e de Geoestatística. Os ex-alunos de Matheron, André G. Journel e
Michel David, divulgaram a Geoestatística na América do Norte com a publicação dos
livros Geostatistical ore reserve estimation (DAVID, 1977) e Mining geostatistics (JOUR-
NEL; HUIJBREGTS, 1978).
Em 1969 Jean-Laurent Mallet criou, na Universidade de Lorraine na França,
o Consórcio GoCad, para auxiliar em estudos acadêmicos e industriais, sendo um centro
de aplicação geoestatística e de técnicas de modelagem de reservatórios. Já na década
de 1980, a aplicação de geoestatística passou a ser mais amplamente utilizada além da
mineração, na agricultura de precisão, análise espacial de crimes, cartogra�a, climatologia,
ecologia da paisagem, engenharia �orestal, epidemiologia, geologia do petróleo, geotecnia,
hidrogeologia e pedologia (YAMAMOTO; LANDIM, 2015).
O estudo, em geoestatística, das variáveis regionalizadas, é baseado em al-
guns pressupostos como ergodicidade, estacionariedade e hipótese intrínseca. A ergocidade
se dá pelo fato de que a esperança do conjunto de todas as realizações prováveis é igual a
média de uma delas, em certo domínio. A estacionariedade indica que o fenômeno deve
41
ser homogêneo na região das estimativas e a hipótese intrínseca equivale a a�rmar que as
diferenças são estacionárias localmente, ou seja, têm fraco incremento. Estes pressupostos
serão detalhados matematicamente a seguir.
A geoestatística, é um ramo da estatística espacial que considera o conjunto
de dados y1, y2, . . . , yn nas respectivas localizações x1, x2, . . . , xn de uma região A contínua
espacialmente, em que, A ⊂ Rd. Essas medidas são associadas a um fenômeno espacial,
dado pela realização de um processo estocástico Z(x ), com x ∈ A ⊂ Rd pertencentes a um
mesmo espaço de probabilidade, com d sendo o número de linhas de x , cujos elementos
são as localizações amostrais (DIGGLE; RIBEIRO JR.; CHRISTENSEN, 2003).
A teoria das variáveis regionalizadas pressupõe que a variação de uma va-
riável Z(x ) pode ser expressa pela soma de três componentes (BURROUGH, 1986):
Z(x ) = m(x ) + ε′(x ) + ε′′, em que, m(x ) é uma função determinística que descreve o
componente estrutural de Z em x , ε′(x ) é um termo estocástico, que varia localmente e
depende espacialmente de m(x ) e ε′′ é um resíduo aleatório não correlacionado, com distri-
buição normal com média zero e variância σ2. A geoestatística atua no termo estocástico
ε′(x ).
A Teoria das Variáveis Regionalizadas (geoestatística) é um grande ramo da
estatística espacial, que estuda a relação de uma variável regionalizada com ela mesma,
em outra posição (CRESSIE, 1993).
Segundo Oliveira (1991), há duas propostas para modelar populações: Con-
siderando como uma população, conforme a abordagem clássica de amostragem, conside-
rando independência das unidades amostrais. Neste caso, não é vantajoso considerar a
estrutura de dependência que possivelmente há; Considerando como uma amostra reti-
rada de uma �população� de populações. Neste caso, é considerada a correlação espacial,
porém há pressupostos geoestatísticos (hipótese intrínseca) que requer a estacionaridade
do variagrama, que é a principal hipótese (VIEIRA, 2000).
Em geoestatística se trabalha com situações que envolvem variáveis regio-
nalizadas, que possuem comportamento espacial e características intermediárias entre as
variáveis determinísticas e aleatórias, pois, não há previsão exata em determinado ponto,
mas é esperado que haja um valor neste ponto, parecido com pontos próximos (LANDIN,
2006).
Uma variável regionalizada é intrínseca se existe a esperança para a variável
regionalizada e não depende da posição x , ou seja, E[Z(x )] = m,∀x . Além disso, para
42
qualquer vetor h , V ar[Z(x ) − Z(x + h)] é �nita, depende de h e não depende de x ,
V ar[Z(x )− Z(x + h)] = 2γ(h).
Conforme Silva (1988), a avaliação e estimativa da dependência em um con-
junto de amostras vizinhas pode envolver a utilização da autocorrelação, pois, é de grande
importância na amostragem em uma única direção, porém, ao envolver duas direções, ou
seja, observações no plano, é mais conveniente utilizar o semivariograma.
O semivariograma é um método geoestatístico que identi�ca a existência de
dependência entre as unidades amostrais (DUARTE, 2000). Como forma de caracterização
da estrutura de continuidade espacial, o semivariograma é uma alternativa preferida, pois
exige a hipótese intrínseca, além de apresentar uma função de semivariâncias em relação às
distâncias, sendo assim, a semivariância equivale à metade da variância de diferenças entre
as observações da variável aleatória Z, distanciadas h unidades (RIBEIRO JR., 1995).
O semivariograma detecta e explica o comportamento da dependência es-
pacial entre as amostras de uma área em que o experimento é conduzido, e de�ne os
parâmetros ideais para estimar os valores, para as regiões dentro e próximas desta área,
que não apresentaram amostras, por meio da krigagem (SALVIANO, 1996).
Quanto maior o valor da semivariância, menor é a similaridade e, quanto
mais próximo de zero, mais similares são. A tendência é que haja uma estabilidade após o
aumento da distância, pois, em determinada distância, espera-se que as unidades amostrais
não se in�uenciem mais entre si. Segundo Tobler (1979), na primeira lei da geogra�a, �Tudo
é relacionado com tudo, mas coisas mais próximas estão mais relacionadas que coisas
distantes�. Há vários métodos de estimação de semivariâncias, um dos mais utilizados é o
Método dos Momentos (VIEIRA, 2000).
A função semivariograma equivale à metade da função do variograma (11),
deste modo, seu estimador é dado por (12), em que, h é a distância, N(h) é o número de
pares de pontos com distância h, Z(xi) é o valor da variável regionalizada em xi e Z(xi+h)
é o valor da variável regionalizada em xi + h.
V ar[Z(x )− Z(x + h)] = 2γ(h) (11)
γ̂(h) =
∑N(h)i=1 [Z(xi)− Z(xi + h)]2
2N(h)(12)
O grá�co (Figura 1) da função γ̂(h) representa o semivariograma, permi-
43
tindo estimar os valores de semivariâncias em diferentes possibilidades para os pares de
pontos, sendo possível veri�car o grau da dependência espacial e a de�nição dos parâme-
tros necessários para estimar os valores nos pontos da região experimental, não amostrados
(SOUZA, 1999). Conforme há aumento em h, γ(h) tende a aumentar, pois, conforme Ca-
margo (1997), espera-se que, para amostras extraídas em distâncias reduzidas tenham
[Z(xi)−Z(xi +h)]2 inferiores às das extraídas de maiores distanciamentos. Cressie (1993)
salienta que, embora γ(h) seja considerado nulo quando h = 0, na realidade é comum acei-
tar que, a medida que γ(h) se aproxima de um valor C0 > 0, denominado efeito pepita, h
tende a zero.
Há muitos modelos teóricos que podem ser utilizados para representar com-
portamentos de continuidade espacial, ou seja, ajustado a γ(h)× h. Esses modelos devem
apresentar uma representação estável, denominada krigagem. Os parâmetros a serem es-
timados são o efeito pepita C0, dado por γ(0), a é o alcance da dependência espacial,
ou seja, é a maior distância, cuja dependência espacial existe, assim, γ(h) é denominado
patamar, quando a distância é o alcance de dependência espacial, dado por C + C0. Os
modelos podem ou não apresentar patamar, alguns exemplos seguem.
Figura 1 - Semivariograma com efeito pepita
Exponencial:
γ(h) = C[1− e−
3ha
](13)
Gaussiano:
γ(h) = C[1− e(−
3ha)2]
(14)
44
Esférico:
γ(h) =
C[32(ha)− 1
2(ha)3]
, se h < a;
0 , caso contrário.(15)
Linear:
γ(h) = C0 + bh (16)
Matérn:
γ(h) =21−k
Γ(k)(a‖h‖)kKk(a‖h‖) (17)
em que,
a é um parâmetro de alcance;
Γ(k) é a função Gama;
Kk é a função Bessel de ordem k.
Figura 2 - Semivariograma experimental e alguns modelos de semivariância: a) esférico,
b) exponencial, c) gaussiano e d) linear. Fonte: Miranda-Salas e Condal (2003)
Alguns modelos, como o linear, não apresentam patamar.
Amostras que apresentam maiores distanciamentos não são espacialmente
45
dependentes, enquanto as amostras mais próximas que o alcance são espacialmente de-
pendentes, assim, o semivariograma igual à variância dos dados causa variação aleatória.
Além disso, o alcance de�ne o raio de ação máximo de interpolação por krigagem, ou
range, em que os fatores ponderadores podem afetar signi�cativamente os valores estima-
dos (SOUZA, 1992).
Vieira (2000) a�rma que, convencionalmente, ao obter um semivariograma
ajustado, em seu comportamento, os valores de semivariância aumentam conforme há o
aumento do distanciamento entre os pontos da região, até estabilização, atingindo um
patamar. Silva (1988) ainda completa, informando que se atinge o patamar no momento
em que a variância dos dados amostrados torna-se constante, em relação à distância entre
amostras. Já o valor de γ̂(h) é em torno do valor da variância total neste ponto, além de
ser um parâmetro que permite determinar a distância limite de dependência entre pares
de amostras.
O modelo pode ser considerado com ou sem patamar, pois, para h grande,
o desempenho do semivariograma pode variar. Sendo assim, segundo Machado (1994),
os modelos sem patamar apresentam semivariogramas que podem ser de�nidos, porém,
não estabilizam para nenhum valor de patamar e os modelos satisfazem apenas a hipótese
intrínseca. Os modelos com patamar são funções que expressam a estacionaridade de
segunda ordem, de forma que a semivariância é elevada com o aumento das distâncias
amostrais, até um patamar, ocorrendo a estabilização.
O efeito pepita re�ete o erro analítico, pois, por meio dele, é possível veri�car
a variabilidade proveniente do acaso, entre dois pontos, por conta, dentre vários fatores,
de erros de medida ou microvariação em relação às distâncias amostradas não explicadas
pelo modelo, assim, há a impossibilidade de explicar de forma quantitativa a contribuição
particular de erros de medida e variabilidade.
Antes de efetuar interpolações espaciais ou seguir com demais estimativas
geoestatísticas, é possível veri�car se, de fato, a amostra em questão possui estrutura
geoestatística. Assim, após selecionar o modelo que melhor se ajusta aos dados, por meio
do maior coe�ciente de determinação e a menor soma de quadrados, utilizemos a proposta
de Cambardella et al. (1994) modi�cada por Robertson (1998), que sugere analisar o
avaliador de dependência espacial (ADE), dado por ADE = 100× CC+C0
, considerando os
seguintes critérios:
1. ADE ≤ 25%: Dependência espacial fraca da variável;
46
2. 25% < ADE ≤ 75%: Dependência espacial mediana da variável;
3. ADE > 75%: Dependência espacial forte da variável.
Havendo dependência espacial entre as amostras e por meio deste modelo
de semivariograma, é possível interpolar valores para cada ponto da região em questão
utilizando a krigagem (JOURNEL; HUIJBREGTS, 1978), sem tendência e com variância
mínima (VIEIRA, 2000). Assim, pelo método de interpolação, baseando-se na amostra da
variável e levando em consideração as propriedades estruturais do semivariograma, é pos-
sível representar o comportamento desta variável por um mapa. Em muitos casos o ajuste
do modelo aos dados é feito de forma visual, porém, podem ser utilizados métodos como O
Método dos Quadrados Mínimos Ordinários, Ponderados e da Máxima Verossimilhança.
A seleção do melhor modelo pode ser realizada considerando o critério de informação de
Akaike (AIC) (AKAIKE, 1983) e técnicas de validação cruzada.
Segundo Landim (2006), o termo krigagem, traduzido do francês krigeage,
e do inglês kriging, foi uma homenagem ao engenheiro de minas Daniel G. Krige, que foi
pioneiro em utilizar as técnicas estatísticas em mineração. Esta técnica pode ser usada
como algoritmo estimador para cálculo médio para um volume maior que o suporte ge-
ométrico, de uma variável regionalizada ou previsão de valores pontuais de uma variável
regionalizada dentro do campo geométrico de uma região, sendo um processo exato de
interpolação, levando em consideração os valores observados, para uma construção car-
tográ�ca automática computacionalmente, ao dispor de uma amostra de certa variável
regionalizada em determinada região. Para tais situações há, além dos valores estimados,
cada erro associado às estimativas, assim, diferenciando-o dos demais algoritmos similares
disponíveis.
Ainda segundo Landim (2006), a krigagem usa informações provenientes
do semivariograma para determinar os pesos ótimos associados às amostras, estimando
pontos, áreas ou, até mesmo, blocos. Além disso, a estimativa da krigagem, por meio do
semivariograma não tem como pressuposição a normalidade dos dados, porém, devem ser
observados possíveis assimetrias com valores atípicos, pelo fato de que a krigagem é um
estimador linear.
Conforme Salviano (1996), a função que apresenta o valor estimado da va-
riável regionalizada em determinado ponto da região é Z∗(x0) = λ0 +∑n
i=1 λiZ(xi),
em que, n é a quantidade de pontos vizinhos medidos, Z(xi) são os pontos utilizados
47
na estimativa e λi são os ponderadores referentes a cada Z(xi), selecionados de forma
estimada não tendenciosa, ou seja, E[Z∗(x0) − Z(x0)] = 0 e V ar[Z∗(x0) − Z(x0)] =
E{[Z∗(x0)− Z(x0)]2} seja mínima, garantindo que Z∗(x0) seja o melhor estimador linear
não tendencioso (BLUE), apresentando mínima variância e somatório dos pesos igual à
unidade, ou seja, não é tendencioso.
4.3 Medidas repetidas
A expressão �medidas repetidas� refere-se às respostas múltiplas tomadas em
sequência em uma mesma unidade experimental (NOBRE; SINGER, 2007). Deste modo,
é possível avaliar características em uma dimensão ordenada temporalmente ou espaci-
almente. Experimentos com medidas repetidas podem apresentar vários fatores, dentre
eles, os mais comuns são os tratamentos e os tempos e, dentre seus objetivos principais
estão, a avaliação simultânea de várias sequências de tratamentos e a comparação de di-
ferentes tratamentos quando a variabilidade entre unidades é um fator importante e não
é controlado, porém, é de fundamental importância, observar a evolução de respostas sob
determinadas condições iniciais, dentre outras. Além disso, em muitos casos, por conta de
limitações, o uso de medidas repetidas se apresenta como alternativa única.
A utilização de medidas repetidas possibilita manter o controle da diferença
entre as unidades, de forma que, os efeitos de tratamentos para qualquer medida são
considerados em comparação à média das respostas do indivíduo para cada tratamento.
Assim, a variabilidade das diferenças entre indivíduos é dissociada do resíduo experimental
aumentando a sensibilidade da avaliação experimental.
Nem sempre o tempo é um dos fatores deste tipo de experimento, pois,
qualquer experimento em que são tomadas diversas observações em uma mesma unidade
experimental pode ser caracterizado como medidas repetidas. No caso em que as me-
didas são repetidas no tempo, é possível efetuar comparações entre os tratamentos em
cada tempo e comparações dos tempos em cada tratamento. Portanto, o tempo pode ser
considerado um fator intraindivíduos.
Dentre as principais características de um experimento com esta estrutura
podemos citar que deve haver mais de uma unidade experimental avaliada, assim, não
se tratará apenas de uma série, mas de um conjunto delas. Além disso, por conta da
mesma característica ser medida na mesma unidade experimental diversas vezes, não há
independência entre as respostas, deste modo algumas análises clássicas como de regressão
48
não são adequadas. E a associação entre as observações de mesma variável na mesma
unidade experimental o difere do tratamento multivariado.
Crowder e Hand (1990) apresentam uma estrutura para um conjunto de
dados com medidas repetidas por uma matriz indivíduos × medidas, de forma que cada
indivíduo corresponde à unidade em que as observações são um conjunto de medidas rela-
cionadas e a medida no indivíduo é o que foi observado naquele indivíduo em determinado
momento. Se há, associado à estrutura de medidas repetidas, a observação de duas ou
mais variáveis, a estrutura se dimensionará como indivíduo × medida × variável.
Vários tipos de estudo e delineamentos podem ser desenvolvidos utilizando
medidas repetidas, como por exemplo, parcelas subdivididas, �cross-over� e longitudinais.
A parcela subdividida ou �split-plot� é utilizada quando é desejado obter maior precisão em
uma variável do que em outra, as limitações forçam a utilização de unidades experimentais
de tamanhos diferentes para alguns fatores ou são esperadas que as diferenças dos níveis
de um fator di�ram das diferenças dos níveis de outro fator. E é estruturada quando
cada nível do fator primário é aplicado a uma grande parcela e os níveis de um outro
fator à subparcelas daquela grande parcela. Assim, os tratamentos são atribuídos às
parcelas respeitando o delineamento conveniente e os fatores secundários aleatoriamente às
subparcelas (FISHER, 1925; YATES, 1935). Fernandez (1991) ressalta que, em um estudo
que utiliza parcelas subdivididas e tempo como fator, nem sempre se pode aleatorizar os
níveis do tempo para intervalos, assim, a análise convencional torna-se inválida, pois não
é corretamente estruturada por uma matriz de covariâncias. Deste modo, a probabilidade
do Erro Tipo I é in�acionada.
Já nos experimentos organizados em esquema �cross-over�, são atribuídas às
unidades experimentais uma série de tratamentos, de forma que, os indivíduos recebem,
aleatoriamente, os tratamentos de modo distintamente sequenciados. Assim, ao comparar
tratamentos, também há a comparação dos períodos. Além disso, alguns contrastes de
tratamentos podem ser estimados com maior precisão. Porém, neste tipo de esquema,
geralmente está associado um tempo de execução do experimento mais elevado, e também
podem ocorrer efeitos além do período experimentado.
Os experimentos longitudinais são aqueles quando há repetição das medidas
ao longo do tempo. Neste caso, o principal objetivo deste estudo é descrever as alterações
das variáveis resposta em conformidade com a passagem do tempo, além de identi�car as
in�uências de covariáveis. Sendo assim, já é esperada a dependência das observações da
49
mesma unidade observacional (FARAWAY, 2006).
Dizemos que temos uma estrutura de dados longitudinais, balanceada em
relação ao tempo, quando os intervalos de tempo entre as medidas repetidas consecutivas
sempre forem os mesmos, além disso, possa ser feita a consideração de que, para cada
tempo, as observações foram realizadas em ummesmo instante. Caso contrário, a estrutura
é denominada desbalanceada em relação ao tempo (AMADOR, 2010).
As análises de dados longitudinais trazem algumas vantagens como: a pos-
sibilidade de fazer um estudo do comportamento da variável resposta média de cada tra-
tamento, exige menos unidades experimentais, pois as medidas são feitas nas mesmas
parcelas, possibilita veri�car a existência de dependência da variável resposta com as co-
variáveis, diminui o erro experimental e aumenta a precisão das estimativas de parâmetros
(NOBRE; SINGER, 2007).
Segundo Freitas et al. (2008), um dos tipos de análise de dados longitudinais
é a análise de per�l, que permite a utilização de técnicas univariadas e multivariadas e,
tem como um dos objetivos principais, testar as hipóteses sobre os valores médios da
variável resposta nos diversos tempos e compará-los entre os tratamentos. O modelo mais
simples para ensaios com medidas repetidas é o modelo de parcelas subdivididas. Neste
caso, o tempo é tomado como variável discreta, ordenando a variável resposta na parcela
experimental. O modelo univariado em parcelas subdivididas no tempo com delineamento
inteiramente casualizado é dado por:
yijk = µ+ αi + γj(i) + βk + (αβ)ik + εijk (18)
em que,
yijk é o valor observado para a variável resposta;
µ é uma constante comum a todas as observações;
αi é o efeito do i-ésimo tratamento;
γj(i) é o efeito aleatório da j-ésima unidade experimental dentro do i-ésimo tratamento
com γj(i) ∼ N(0, σ2a);
βk é o efeito do k-ésimo tempo;
(αβ)ik é o efeito da interação do i-ésimo tratamento com o k-ésimo tempo;
εijk é o erro associado às subparcelas com ε ∼ N(0, σ2).
Ao utilizar tal modelo, admite-se que as medidas tomadas em tempos dife-
50
rentes têm variâncias homogêneas e são igualmente correlacionadas. Na prática, isto nem
sempre ocorre.
Uma condição necessária e su�ciente para que a análise de variância univari-
ada seja utilizada no esquema de parcelas subdivididas para um experimento com medidas
repetidas, é que a matriz de covariâncias entre os tempos satisfaça a condição de esferi-
cidade ou circularidade, ou seja, considerar que as variâncias entre pares de erros sejam
iguais (HUYNH; FELDT, 1970).
Tal condição pode ser testada pelo teste de esfericidade (MAUCHLY, 1940),
que veri�ca se uma população normal multivariada apresenta variâncias iguais e correla-
ções nulas. Caso o teste seja não signi�cativo, então a matriz de covariâncias é do tipo
esférico, e o experimento pode ser analisado como parcelas subdivididas. Se o teste for
signi�cativo, então deve-se utilizar a análise multivariada de per�s ou a análise univariada
utilizando-se modelos mistos que permitem incorporar estruturas de matriz de covariân-
cias (De KETELAERE et al., 2003). Littell, Henry e Ammerman (1998) descrevem e
comparam alguns destes métodos.
A análise multivariada de per�s (MANOVA) é relacionada à avaliação simul-
tânea das relações entre múltiplas medidas temporais em cada indivíduo, considerando-se
também outro atributo, geralmente o tratamento. A MANOVA não exige que as estruturas
de variância das medidas repetidas ou de correlação, sejam invariáveis ao longo do tempo,
mas exige a homogeneidade de variâncias e correlações em cada período, não colocando
imposições sobre a matriz de covariâncias (MEREDITH; STEHMAN, 1991).
O modelo utilizado na análise multivariada de per�l é o mesmo daquele
utilizado no estudo da análise de variância multivariada, conforme Ferreira (1996) descreve
pela expressão Y = XB + E, em que, Y é a matriz (n×t) de dados em t variáveis e em n
unidades experimentais, X é a matriz (gk× (g+ 1)) de delineamento, para o inteiramente
casualizado com g tratamentos e k repetições, B é a matriz ((g + 1)× t) de parâmetros e
E é a matriz (n× t) dos erros experimentais.
Considerando ε′ij uma linha de E, o vetor de erros εij corresponde à ij-ésima
unidade experimental. Assim, cada εij é normalmente distribuído de forma t-variada com
vetor de média Φ e matriz de covariâncias Σ, está associado à observação yij. Deste
modo, yij também é normalmente distribuído de forma t-variada, com E[yij] = XB e
V ar[yij] = Σ, ou seja, yij ∼ Nt(XB,Σ) com Σ não estruturada e contendo t(t + 1)/2
parâmetros.
51
Conforme Freitas (2007), nestes casos, três hipóteses podem ser testadas.
Por conta do paralelismo dos per�s médios das respostas associadas aos tratamentos, é as-
sinalada a ausência de interação entre os fatores que determinam os tempos e tratamentos.
Esta hipótese é denotada pela expressão (19).
H0 :
µ11 − µ12
µ12 − µ13
...
µ1(t−1) − µ1t
=
µ21 − µ22
µ22 − µ23
...
µ2(t−1) − µ2t
= . . . =
µg1 − µg2
µg2 − µg3
...
µg(t−1) − µgt
(19)
Um segundo teste pode ser realizado considerando-se que os per�s médios de
respostas referentes aos tratamentos são coincidentes, o que leva à conclusão da ausência
do efeito deste fator tratamento, conforme indica a expressão (20).
H0 :
µ11
µ12
...
µ1t
=
µ21
µ22
...
µ2t
= . . . =
µg1
µg2
...
µgt
(20)
E um terceiro teste pode ser realizado considerando que os per�s médios de
respostas relativos aos tratamentos são paralelos ao eixo das abscissas, o que aponta que
não ocorre efeito do fator tempo, conforme indica a expressão (21).
H0 :
µ11
µ21
...
µg1
=
µ12
µ22
...
µg2
= . . . =
µ1t
µ2t
...
µgt
(21)
Essas hipóteses podem ser expressas de modo a constituírem uma hipótese
linear geral, objetivando a simpli�cação com a forma de resultados uni�cada (FREITAS,
2007). Para testar esta hipótese linear geral, são consideradas as matrizes de somas de
quadrados e produtos de tratamentos e de erros, e a variância generalizada (FERREIRA,
1996). Dentre as várias estatísticas dos testes que são utilizados para avaliação destas
hipóteses estão, em ordem de preferência, Traço de Pillai, Lambda de Wilks, Traço de
Hotelling-Lawley e Raíz máxima de Roy (VIEIRA et al., 2007).
52
É esperado que as observações de uma mesma unidade experimental sejam
correlacionadas e, para que as inferências sejam válidas, esta correlação deve ser modelada
(ROCHA, 2010). Existem vários padrões de correlação e covariância, como por exemplo,
aqueles que consideram as estruturas utilizadas pelo software estatístico SAS (STATISTI-
CAL ANALYSIS SYSTEM, 1999):
Não estruturada (UN): As variâncias e covariâncias podem ser diferentes, pois é uma
matriz geral, atribuindo um parâmetro para cada variância/covariância. Para uma matriz
de dimensões 5× 5 há 15 parâmetros.
σ211 σ12 σ13 σ14 σ15
σ12 σ222 σ23 σ24 σ25
σ13 σ23 σ233 σ34 σ35
σ14 σ24 σ34 σ244 σ45
σ15 σ25 σ35 σ45 σ255
(22)
Componentes de variância: Apresenta mesmas variâncias e covariâncias zero. Assume-se
independência entre as observações e normalidade, apresentando apenas um parâmetro,
por conta das variâncias iguais e covariâncias nulas.
σ2 0 0 0 0
0 σ2 0 0 0
0 0 σ2 0 0
0 0 0 σ2 0
0 0 0 0 σ2
(23)
Toeplitz (TOEP): Esta é uma estrutura de médias móveis de ordem igual ao tamanho da
matriz.
σ21 σ2 σ3 σ4 σ5
σ2 σ21 σ2 σ3 σ4
σ3 σ2 σ21 σ2 σ3
σ4 σ3 σ2 σ21 σ2
σ5 σ4 σ3 σ2 σ21
(24)
Toeplitz de Banda (TOEPH): Equivale a Toeplitz considerando-se nulas as correlações a
53
partir de certa distância entre as observações.
σ21 σ2 0 0 0
σ2 σ21 σ2 0 0
0 σ2 σ21 σ2 0
0 0 σ2 σ21 σ2
0 0 0 σ2 σ21
(25)
Auto-regressiva de Primeira Ordem (AR(1)): É geralmente utilizada em dados provenien-
tes de séries temporais espaçadas de forma igual e cujas correlações diminuem exponen-
cialmente. O parâmetro ρ é chamado autorregressivo e representa o alcance. Além disso,
são considerados |ρ| < 1 para um processo estacionário e dois parâmetros.
σ2
1 ρ ρ2 ρ3 ρ4
ρ 1 ρ ρ2 ρ3
ρ2 ρ 1 ρ ρ2
ρ3 ρ2 ρ 1 ρ
ρ4 ρ3 ρ2 ρ 1
(26)
Não estruturada de Banda (UN(1)): Admite variâncias e covariâncias que podem ser
distintas, porém, considera apenas um número de bandas, ou seja, para as observações
que estão acima de certo distanciamento é considerada correlação nula.
σ21 σ6 0 0 0
σ6 σ22 σ7 0 0
0 σ7 σ23 σ8 0
0 0 σ8 σ24 σ9
0 0 0 σ9 σ25
(27)
Espacial (SP): Também chamada de potência, possui mesma variância (σ2) e as correlações
são dadas por ρdij , em que, d é a distância entre as observações i e j e ρ é a correlação
54
entre observações vizinhas.
σ2
1 ρd12 ρd13 ρd14 ρd15
ρd12 1 ρd23 ρd24 ρd25
ρd13 ρd23 1 ρd34 ρd35
ρd14 ρd24 ρd34 1 ρd45
ρd15 ρd25 ρd35 ρd45 1
(28)
Observa-se que o parâmetro ρ da estrutura Auto-regressiva de Primeira Or-
dem é o parâmetro auto-regressivo, tal que |ρ| < 1 para estacionariedade e o parâmetro ρ
da estrutura Espacial é o parâmetro de correlação espacial e dij são as distâncias euclidi-
anas.
Algumas técnicas devem ser utilizadas para escolha do modelo e da estrutura
de covariância (WOLFINGER, 1993; OGLIARI, 1998; XAVIER, 2000). O teste da razão
de verossimilhança compara os modelos encaixados dois a dois, estimados por máxima ve-
rossimilhança, em que, um dos modelos é uma versão restrita do outro, ou seja, um modelo
tem r parâmetros adicionais e o teste veri�ca se esses parâmetros a mais proporcionam
um melhor modelo. Sejam λ1 o valor de −2log da função de verossimilhança do modelo
com menos parâmetros e λ2 o valor de −2log da função de verossimilhança do modelo com
mais parâmetros. Assim, é testada a hipótese de que os dois modelos são equivalentes,
dado que λ1−λ2 ∼ χ2r assintoticamente, em que, r é a diferença do número de parâmetros
(MOOD; GRAYBILL; BOES, 1974).
Outro teste pode ser realizado considerando a matriz de informação de
Fisher, para o teste qui-quadrado associado à estatística de Wald dos parâmetros de
covariância, comparando dois modelos com efeitos �xos, ainda nos casos em que um é
caso particular do outro. Ele só é utilizado quando se comparam duas estruturas de co-
variância e só apresenta bom desempenho para grandes amostras (BOZDOGAN, 1987).
Para modelos que são casos particulares de outros, é melhor construir testes da razão de
verossimilhança e para modelos mistos é conveniente utilizar a verossimilhança restrita
(SHAALJE et al., 1991).
Outra forma para seleção dos modelos envolve a obtenção dos critérios de
informação de máxima verossimilhança. Deste modo, o modelo escolhido é aquele que
possui o menor valor para um desses critérios. Esses critérios penalizam os modelos com
número grande de parâmetros e indicando uma escolha parcimoniosa (BOZDOGAN, 1987).
55
É importante lembrar que não existem modelos exatos, verdadeiros ou cor-
retos, apenas modelos que se aproximam dos fenômenos estudados com alguns desvios de
informação. Com os testes é possível veri�car quais modelos melhor se ajustam aos dados
analisados e se apresentam de forma simpli�cada.
O critério de informação de Akaike (AIC) (AKAIKE, 1973) é amplamente
utilizado na seleção de modelos, originado na minimização da distância de Kullback-Leibler
(K-L). A informação de K-L representa uma distância do modelo verdadeiro a um modelo
candidato, possibilitando a comparação de um bom modelo a vários candidatos, é possível
obter alguns que se relevem e apresentem resultado satisfatório no relacionamento com os
dados avaliados.
A estimativa desta informação de K-L é baseada na maximização da função
de log-verossimilhança associada à uma penalidade do número de parâmetros:
AIC = −2n∑
i=1
lnL(µ̂i, y1) + 2p (29)
em que,
yi é o valor da resposta i;
µ̂i é a estimativa de yi ao se ajustar um modelo com p parâmetros pela maximização da
função de log-verossimilhança;
2p (duas vezes o número de parâmetros) é a penalidade que corrige um provável viés
advindo da comparação de modelos com quantidades de parâmetros diferentes.
Hurvich e Tsai (1989) apresentaram uma versão do AIC com vício corrigido
(AICc). O comportamento do AIC é melhorado em condições em que a razão entre quan-
tidade de parâmetros ajustados e quantidade de elementos na amostra é grande ou quando
há pequenas amostras. Assim, como o AICc é o AIC somado a um termo não estocástico,
a redução do vício é realizada sem aumento da variância:
AICc = AIC +2(p+ 1)(p+ 2)
n− p− 2(30)
em que,
p é o número de parâmetros;
n é o tamanho da amostra.
Outro critério amplamente utilizado, proposto por Schwarz (1978) e deno-
56
minado critério de Schwarz ou critério de informação bayesiano (BIC), avalia modelos
em termos de probabilidade a posteriori, pois são utilizados argumentos bayesianos. Ele
pressupõe um �modelo verdadeiro� que relaciona a variável dependente com as variáveis
explanatórias para diversos modelos. O critério é a estatística que torna máxima a proba-
bilidade de detecção do �modelo verdadeiro� dentre os testados:
BIC = −2 log f(xn|θ) + p log n (31)
em que,
f(xn|θ) é o modelo escolhido;
p é o número de parâmetros;
n é o tamanho da amostra.
4.4 Plantios �orestais: a Canafístula
O plantio �orestal no Brasil foi iniciado em 1903 por Edmundo Navarro de
Andrade, que trouxe mudas de Eucalipto (Eucalyptus spp.) para formação de �orestas com
o objetivo de fornecer dormentes para as estradas ferroviárias. Por volta de 1947, foi trazido
para o Brasil o Pinus (Pinnus spp.) de modo que o Eucalipto teve boa adaptabilidade no
cerrado do estado de São Paulo, já o Pinus, na região sul. Esses recursos tornaram-se uma
alternativa sustentável à exploração que vinha sendo, até então, realizada com recursos
naturais, principalmente da Mata Atlântica (ANTONANGELO; BACHA, 1998).
Conforme o SERVIÇO FLORESTAL BRASILEIRO (2015), foi na década
de 70 que o país passou por uma política de re�orestamento, incluindo, dentre as prin-
cipais medidas, os incentivos �scais, que foram iniciados ainda na década de 60. Assim,
foi possível produzir grande estoque madeireiro que sustenta a demanda nacional. Houve
grande crescimento nos investimentos em pesquisas silviculturistas destas espécies, tor-
nando o Brasil detentor das melhores tecnologias para tal prática, além de que, ocorreu
também a inserção de outras espécies, visando não apenas a produção madeireira, como
por exemplo, a Seringueira (Hevea spp.), que produz látex.
A Canafístula (Peltophorum dubium) (Figura 3) é uma espécie encontrada
naturalmente em algumas regiões do Uruguai (LOMBARDO, 1964), Paraguai (LOPEZ;
STERRET; MCDONALD, 1987), Argentina (CROVETTO, 1963) e Brasil em locais in-
dicados na Figura 4.
57
Figura 3 - Exemplar de Canafístula. Fonte: INSTITUTO BRASILEIRO DE FLORES-
TAS (2015)
Figura 4 - Locais de ocorrência natural de Canafístula no Brasil. Fonte: Carvalho (2002)
A Canafístula apresenta, dentre as principais características, tronco cilín-
drico cujo fuste atinge até 15 metros, copa ampla, umbeliforme, largamente achatada-
arredondada, casca externa marrom-escura e rugosa, folhas compostas, bipinadas, alter-
nas, de até 50 cm de comprimento por 25 cm de largura, com 16 a 21 pares de pinas, de
cor verde-escura, �ores amarelo-vivas ou alaranjadas, com até 2 cm de comprimento, seu
fruto é a sâmara com 4 a 9,5 cm de comprimento e 1 a 2,5cm de largura cuja superfície
varia de castanho-avermelhada a marrom, contendo de uma a quatro sementes e perde
58
totalmente as folhas no inverno (CARVALHO, 2002).
Ainda segundo Carvalho (2002), a Canafístula é encontrada na natureza
em locais com variados tipos de solo, desde os ácidos até os de alta fertilidade química.
Experimentalmente apresentou melhor desenvolvimento em solos com fertilidade química
média e alta, bem drenados, não suportando aqueles pedregosos, rasos e com alto índice de
umidade. Exige altos teores de nitrogênio e o uso de lodo ou esterco auxilia na produção
de mudas de qualidade elevada.
Um dos pontos positivos na produção de Canafístula é seu crescimento rá-
pido, conforme os resultados mostrados por Nogueira (1977) e Nogueira et al. (1982).
Nesses trabalhos, também foi observada uma média de produtividade volumétrica de
19, 6m3/ha.ano. Sua madeira é densa, conforme observado por Braga (1960) a 15% de
umidade e durabilidade natural moderada ao apodrecimento e altamente resistentes a fun-
gos e cupins conforme observado por Cavalcante et al. (1982), porém, a durabilidade no
solo não é superior a nove anos.
Atualmente, a madeira produzida pela Canafístula é muito valorizada eco-
nomicamente, uma grande inversão considerando-se que há algum tempo era muito des-
valorizada. Sua madeira é indicada para a construção civil com produtos como vigas,
caibros, ripas e assoalhos, além do uso externo como mourões, como material naval, mi-
litar e de carpintaria em geral. Produz carvão e lenha de qualidade mediana e é viável
para a produção de papel. Além da madeira, a Canafístula fornece sementes com açúcares
e galactomanana e folhas com pequena porcentagem de saponina. Sua forragem é uma
ótima alternativa à alimentação animal e suas �ores são melíferas, no entanto há, con-
forme Correa (1952), indícios de sua nocividade para as abelhas. Além do uso medicinal
de algumas partes de sua estrutura, uso paisagístico e de re�orestamento (CARVALHO,
2002).
Ao se tratar de �orestas plantadas, é de fundamental importância ponderar,
dentre vários elementos, lucro e qualidade, para isto, um dos fatores a ser considerado é o
espaçamento entre as árvores. Entretanto, esta determinação deve levar em consideração
diversos critérios como clima, oferta de água, espécie, existência de outras plantas, prin-
cipalmente as daninhas, objetivo do uso da matéria prima e tempo pretendido do plantio
ao corte (CHAPMAN; ALLAN, 1978).
Conforme Balloni e Simões (1980), geralmente, a determinação do espaça-
mento desconsidera grande parte das informações ecológicas e silviculturais, levando em
59
consideração apenas a espécie a ser plantada. Assim, de acordo com Gomes (2002), o
espaçamento ideal é aquele que agrega qualidade e baixo custo, ao espaço apropriado para
máximo desenvolvimento arbóreo para a espécie em questão.
Características de alto interesse econômico como altura e diâmetro arbóreo,
são positivamente correlacionadas com o espaçamento e desta forma, maiores espaçamen-
tos tendem a fornecer árvores maiores (SCHNEIDER, 1993), limitando-se, é claro, a certo
alcance de relação espacial, pois, a partir de certo espaçamento, as árvores não sofrem in-
�uência uma da outra, estabilizando a produção sob maiores espaçamentos. A necessidade
de estudar esta relação espacial, juntamente com o período de plantio, tornam necessárias
análises geoestatísticas e longitudinais.
Istchuk et al. (2010) relatam os efeitos de espaçamentos (1 × 1 m e 1 × 2 m)
no diâmetro do coleto e na altura das plantas de Canafístula, identi�cando uma in�uência
do espaçamento sobre ambas as variáveis, de modo que o espaçamento 1 × 1 m forneceu
médias signi�cativamente maiores.
60
61
5 MATERIAL E MÉTODOS
O experimento foi instalado e conduzido conforme descrito por Matos (2014),
com o plantio das mudas de Canafístula (Peltophorum dubium), em dezembro de 2010, na
Fazenda Experimental da Universidade Federal da Grande Dourados com latitude 22◦ 13'
18.54�S e longitude 54◦ 48' 23.09�O, altitude média de 412 m, no município de Dourados-
MS. O clima é classi�cado como tropical úmido Aw (KÖPPEN, 1948), com estação chuvosa
no verão e seca no inverno. A área apresenta topogra�a plana e o solo é classi�cado como
Latossolo Vermelho distroférrico textura muito argilosa. Os valores para a caracterização
inicial da fertilidade do solo são apresentados para as profundidades de 0-20 cm: MO
(3,2 %), pH CaCl2 (5,7), P (8 mg dm−3); K+(4,4 mmolc dm−3); Ca2+(6,1 cmolc dm−3),
Mg2+(2,6 cmolc dm−3), H+ + Al3+(2,3 cmolc dm−3), SB (90,9 mmolc dm−3), CTC (113,9
mmolc dm−3), V% (79,2 %), conforme análise química realizada no Laboratório de Ferti-
lidade dos Solos da UFGD.
As mudas de Canafístula utilizadas no plantio (2009) foram obtidas do vi-
veiro municipal de São Gabriel do Oeste e apresentavam altura média de 20 cm. A dispo-
sição das plantas ocorreu de forma aleatória, obedecendo ao desenho proposto por Nelder
(1962) (Figura 5), sendo as distâncias e ângulos determinados conforme Namkoong (1965),
com raio dado por (32) e área de cada planta segundo (33), (34) e Figura 6:
rn = r0αn (32)
An = tan
(θ
2
)[(r2n4
)f(α)
](33)
f(α) = (1 + α)2 − (1 + α−1)2 (34)
em que,
An é a área da planta n em cada raio;
α é a constante que determina a razão de mudança no crescimento do espaçamento;
rn é a distância radial para a enésima planta e r0 para a primeira planta de cada raio;
θ é o ângulo entre raios adjacentes.
62
Figura 5 - Delineamento sistemático tipo �leque� proposto por Nelder
Figura 6 - Área da planta
Alguns fatores como tempo, mão-de-obra, área experimental e dinheiro, li-
mitam a prática de alguns delineamentos experimentais. Em se tratando especi�camente
de experimentos �orestais, que objetivam avaliar a in�uência das densidades das árvores,
ao utilizar os planejamentos convencionais, seria necessária uma imensa área experimental,
porém, o esquema de Nelder possibilita avaliar uma vasta quantidade de densidades em
uma área reduzida, tornando possível implantar o experimento.
63
Foram estabelecidos 22 círculos concêntricos e 24 raios, com ângulo θ = 15◦
entre raios adjacentes (Figura 5), totalizando 528 mudas plantadas, observando-se uma
taxa de redução de 12,5 % na densidade das árvores. Isso resultou em acréscimo de 6,066%
na distância para cada novo círculo, representando α de 1,06066. Os dois círculos internos
e os dois externos foram considerados como bordaduras.
Para facilitar no momento do plantio das mudas, conforme suas localizações
(Figura 5), diante de um posicionamento circular, é conveniente utilizar coordenadas po-
lares, pois, há apenas que veri�car a distância dos pontos de plantio até um ponto central,
dados em um mesmo raio, e posicionar os demais raios utilizando um ângulo de 15◦. Po-
rém, ao avaliar os dados é necessário utilizar as coordenadas em sua forma cartesiana,
pois, geralmente os aplicativos de avaliação geoestatística não apresentam suporte para
coordenadas polares. Deste modo, é possível transformar as coordenadas polares dadas
por raio (r) e ângulo (θ), em cartesianas dadas por x = r cos θ e y = rsenθ.
Foram coletadas amostras do experimento das variáveis altura (6, 13, 25 e
37 meses após o plantio), diâmetro do fuste (13, 25 e 37 meses após o plantio), diâmetro
da copa (13, 25 e 37 meses após o plantio), área da copa (13, 25 e 37 meses após o plantio)
e volume cilíndrico (13, 25 e 37 meses após o plantio). Assim, por simpli�cação, vamos
vconsiderar a seguinte representação para as variáveis:
A6 Altura aos 6 meses após o plantio
A13 Altura aos 13 meses após o plantio
A26 Altura aos 26 meses após o plantio
A37 Altura aos 37 meses após o plantio
DF13 Diâmetro do fuste em 1,3 m de altura aos 13 meses após o plantio
DF25 Diâmetro do fuste em 1,3 m de altura aos 25 meses após o plantio
DF37 Diâmetro do fuste em 1,3 m de altura aos 37 meses após o plantio
DC13 Diâmetro da copa aos 13 meses após o plantio
DC25 Diâmetro da copa aos 25 meses após o plantio
DC37 Diâmetro da copa aos 37 meses após o plantio
AC13 Área da copa aos 13 meses após o plantio
64
AC25 Área da copa aos 25 meses após o plantio
AC37 Área da copa aos 37 meses após o plantio
VC13 Volume cilíndrico aos 13 meses após o plantio
VC25 Volume cilíndrico aos 25 meses após o plantio
VC37 Volume cilíndrico aos 37 meses após o plantio
Matos (2014) a�rma que foram mensurados o comprimento da circunferência
a 1,3 m de altura (C), a altura total das árvores (A) e o diâmetro de copa (DC), utilizando-
se �ta métrica e régua graduada. Assim, para o cálculo do diâmetro do fuste considerou-se
a relação DF = C/π, e para o cálculo do volume cilíndrico (VC) foi utilizada a relação VC
= [π/( DF2/4)]×A. Já para o estabelecimento do diâmetro da copa (DC) foram realizadas
duas medições perpendiculares dos diâmetros da projeção da copa.
Além das variáveis observadas, consideremos como tratamento, a área por
árvore, denotado por APA, ilustrada na Figura 6, dadas por An e cujos valores para cada
raio são apresentados na Figura 7 e na Tabela 2.
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●
●●
●●
●●
●●
●●
●●
●●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●
●●
●●
●●
●●
●●
●●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●
●●
●●
●●
●●
●●
●●
●●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●
●●
●●
●●
●●
●●
●●●●●
Figura 7 - Estimativas para área da planta (diâmetro do círculo) em cada posição
A organização e manipulação do conjunto de dados foram realizadas por meio
dos softwares Excel 2010 e R. Para cada atributo estudado foi efetuada a análise inicial por
meio da estatística descritiva no software R. Os resíduos foram calculados considerando-se
65
Tabela 2 - Densidade equivalente de árvores a cada círculo
Série Círculo Distância radial (m) Área por árvore (m2) Densidade das árvores (ha)1 - 19,60 - -2 - 20,79 - -3 1 22,05 7,55 13244 2 23,39 8,50 11775 3 24,81 9,56 10466 4 26,31 10,75 9307 5 27,91 12,10 8278 6 29,60 13,61 7359 7 31,40 15,31 65310 8 33,30 17,22 58111 9 35,32 19,37 51612 10 37,46 21,79 45913 11 39,73 24,51 40814 12 42,15 27,59 36215 13 44,70 31,03 32216 14 47,41 34,90 28617 15 50,29 39,27 25518 16 53,34 44,18 22619 17 56,58 49,71 20120 18 60,01 55,92 17921 - 63,65 - -22 - 67,51 - -
Fonte: Matos (2014)
os efeitos do círculo pertencente. Por meio do método grá�co Boxplot (MCGILL; TUKEY;
LARSEN, 1978), foi veri�cada a presença de valores discrepantes para cada atributo e,
em caso positivo o valor foi substituído utilizando técnicas de imputação (RUBIN, 1996).
Foi efetuada a análise da distribuição de frequência associado ao teste de Shapiro e Wilk
(1965) a 5% de signi�cância para testar a hipótese de normalidade. Nos casos em que a
distribuição normal não se adequou, foi realizada a transformação Box-Cox (BOX; COX,
1964), buscando obter a normalidade. A heterogeneidade de variâncias foi testada por
meio do teste de Levene (LEVENE, 1960) ao nível de signi�cância de 5%.
Conforme Oda (2005) relata, a casualização é uma proposta de Fisher para
contornar a problemática da variabilidade ambiental entre as unidades experimentais, de
modo a garantir a independência dos erros e que eles sejam identicamente distribuídos.
Em muitos experimentos, principalmente naqueles cujos espaçamentos são os objetos de
estudo, a casualização não é praticável, como no delineamento sistemático tipo �leque�
(NELDER, 1962), delegando toda incumbência sobre aquela problemática estudada por
Fisher, à homogeneidade total da área experimental e à boa condução do ensaio. Para
66
tais testes, que estudam os efeitos dos espaçamentos, a aleatorização implicaria em expe-
rimentos de dimensões descomunais, exigindo vastas áreas, grande efetivo de mão-de-obra
quali�cada e considerável recurso �nanceiro. Em nosso estudo, a análise de medidas repe-
tidas será realizada, porém, por conta da ausência da aleatorização, é evidenciado que os
resultados podem não ser con�áveis.
Para a realização das análises estatísticas multivariadas foi utilizado o soft-
ware estatístico SAS (SAS, 1999). Os resíduos foram calculados utilizando-se os efeitos
de APA. As variáveis foram padronizadas previamente, por conta das diferentes unidades
de medida, por meio do procedimento proc standard. A matriz de correlações de Pearson
foi calculada, por meio do procedimento proc corr, entre todas as variáveis e incluindo-se
o tratamento APA, para veri�cação de sua in�uência nos resultados obtidos, porém, para
os procedimentos multivariados que seguem, APA foi desconsiderada.
A análise de componentes principais foi realizada utilizando a função Inte-
ractive Data Analysis (SAS, 1999) considerando a estrutura de correlações e apresentando
todos os componentes principais, autovalores e autovetores, de modo a serem selecionados
aqueles que representem pelo menos 70% da variabilidade dos dados, além de autovalores
superiores a 1. As correlações entre os componentes principais e as variáveis foram ob-
servadas para que os componentes sejam nomeados e para que ocorra uma interpretação
contundente para cada um.
Foram elaborados dendrogramas com ligação média que consideram a dissi-
milaridade calculada pela distância de Mahalanobis, utilizando o procedimento proc clus-
ter. O primeiro dendrograma relaciona as variáveis, de modo que para tal, as variáveis
são consideradas como observações e as observações consideradas variáveis, sendo possível,
após a padronização, relacionar as variáveis. Além deste, mais quatro dendrogramas foram
elaborados, de modo a relacionar as circunferências que contêm diferentes raios, ou seja,
grupos com APA diferenciadas, para cada período e considerando todos os períodos.
Foram realizadas as análises das funções discriminantes linear e quadrática
que classi�cam cada observação multivariada por círculo, ou por diferentes áreas por ár-
vore (APA), utilizando o procedimento proc discrim, sendo observada a taxa de erro de
classi�cação dos dados existentes.
Na análise geoestatística, para cada atributo foi efetuada a análise da depen-
dência espacial por meio da elaboração do semivariograma, com base nas pressuposições
de estacionaridade da hipótese intrínseca e do avaliador de dependência espacial (CAM-
67
BARDELLA et al., 1994). Desta forma, foi realizada a seleção do modelo por meio da
observação dos maiores avaliadores de dependência espacial, menores somas dos quadrados
dos resíduos e maiores coe�cientes de determinação, sendo possível identi�car o alcance e
gerar a krigagem. Estas análises foram realizadas utilizando-se o software Gamma Design
GS+ versão 9.0 (GAMMA DESIGN SOFTWARE, 2004).
Para a realização da análise com medidas repetidas no tempo, foi utilizado
o software SAS (SAS, 1999), de modo que preliminarmente foram gerados os grá�cos da
tendência de cada variável resposta nos círculos ao longo do tempo. Cada variável foi
avaliada univariadamente, por meio da análise de variância, considerando os dados no
esquema de parcelas subdivididas, em que cada árvore representa uma parcela e cada
período em cada árvore uma subparcela, conforme o modelo apresentado em (18). Damon
e Harvey (1987) descrevem este procedimento como parcelas subdivididas em análise do
tempo. Porém, esta metodologia considera que há mesma variância em todos os tempos,
e que pares de medidas em um mesmo indivíduo sejam igualmente correlacionados, não
dependendo do distanciamento no tempo entre elas. Para a validade desta metodologia,
a condição Huynh-Feldt (HUYNH; FELDT, 1970) para a matriz de covariâncias deve ser
satisfeita, para tal veri�cação foi utilizado o teste de esfericidade de Mauchly (MAUCHLY,
1940) a 5% de signi�cância.
Os coe�cientes de correlação foram estimados para cada variável, entre os
períodos, de forma que é possível visualizar a ocorrência a�rmada por Littell, Henry e Am-
merman (1998), de que medidas tomadas em períodos mais próximos no tempo tendem a
serem mais fortemente correlacionadas. Posteriormente, por meio dos testes multivariados
Lambda de Wilks, Traço de Pillai, Traço de Hotelling-Lawley e Raíz máxima de Roy,
foram veri�cados os efeitos do fator período e da interação círculos × períodos. Como
há somente quatro períodos avaliados para a variável altura e três para as demais, há
inviabilidade do ajuste por funções, ao comportamento de cada círculo ao longo do tempo,
sendo necessário obter mais amostras em distintos períodos.
Após realizar as análises multivariada, geoestatística e com medidas repeti-
das, são propostas algumas alternativas de análise conjunta, que envolvem mais de uma
dessas avaliações simultaneamente. Inicialmente, é realizada uma nova análise de compo-
nentes principais, considerando agora, além daquela análise já realizada que avalia todas
as variáveis, três outras considerando grupos de variáveis para 13, 25 e 37 meses. As-
sim, é possível veri�car o comportamento dos componentes e das correlações nas mesmas
68
variáveis, em períodos distintos.
Dados esses quatro grupos de componentes principais, foi efetuada a análise
geoestatística dos mesmos, avaliando o ajuste do modelo de semivariograma, a dependên-
cia espacial e a krigagem. Assim, é possível interpretar os componentes principais que
consideram todo conjunto de variáveis, de forma geoestatística. Os outros três conjun-
tos de componentes, para cada período, podem ser associados por meio da similaridade
entre os autovetores, possibilitando uma comparação aproximada entre suas avaliações
geoestatísticas.
Como os três grupos de componentes principais fornecem autovetores dife-
rentes, apesar da similaridade, não podemos considerá-los como sendo uma mesma variá-
vel, assim, diante da proximidade dos valores, podemos calcular componentes principais
modi�cados, considerando um mesmo conjunto de autovetores para ambos os períodos,
dado pelo valor médio daqueles calculados para os componentes principais originais. Deste
modo, é possível considerar os componentes entre os períodos como uma mesma variável,
possibilitando efetuar a análise com medidas repetidas dos mesmos, para veri�car seus
comportamentos ao longo do tempo.
69
6 RESULTADOS E DISCUSSÃO
As estatísticas descritivas para cada variável são apresentadas na Tabela 3.
Não foram encontrados valores discrepantes para nenhuma variável, não sendo necessário
utilizar técnicas de imputação. O teste de Shapiro e Wilk (1965) a 5% de signi�cância,
rejeitou a hipótese de normalidade para todos os atributos. Foi realizada a transformação
Box-Cox (BOX; COX, 1964) para todos os atributos, por meio do software R, sendo
possível obter a normalidade para todos. Após a transformação dos dados, veri�cou-se
que não existem evidências para rejeitar a hipótese de homogeneidade das variâncias, ao
nível de signi�cância de 5% (LEVENE, 1960).
Tabela 3 - Estatísticas descritivas
Variável Mínimo Máximo Média Variância Coe�ciente de variaçãoA6 0,6 1,50 0,9708 0,030423 17,96%A13 1,0 2,50 1,9381 0,061650 12,81%A25 2,75 4,25 3,7760 0,100683 8,40%A37 3,00 5,00 4,0939 0,122103 8,53%DF13 0,028648 0,05 0,0388 1,77 × 10−5 10,85%DF25 0,044563 0,07 0,0568 3,79 × 10−5 10,84%DF37 0,054113 0,08 0,0659 3,45 × 10−5 8,91%DC13 2,0 4,75 3,2529 0,308721 17,08%DC25 2,75 5,75 4,1198 0,34104 14,17%DC37 3,0 6,25 4,6302 0,394984 13,57%AC13 3,1416 17,72 8,5525 8,743421 34,57%AC25 5,9396 25,97 13,5976 14,42716 27,93%AC37 7,0686 30,68 17,1476 20,97467 26,71%VC13 0,000963 0,004025 0,0023 2,47 × 10−7 21,68%VC25 0,006239 0,015786 0,0096 3,48 × 10−6 19,45%VC37 0,009199 0,019894 0,0140 3,89 × 10−6 14,13%
Na Tabela 3, percebe-se que os valores mínimos, máximos e médios aumen-
tam ao longo do tempo para todas as variáveis, fato já esperado por conta do crescimento
apresentado para todas as observações. Além disso, também houve o aumento da variância
para cada atributo ao longo do tempo. Já os coe�cientes de variação reduziram ao longo
do tempo para todos os atributos, com exceção de A25 e A37. Inicialmente de médios para
baixos para A e DF, permanecendo médios para DC, variando de muito altos para altos
para AC e de altos para médios para VC, conforme classi�cação sugerida por Pimentel-
Gomes (1970). É importante lembrar que esta classi�cação foi desenvolvida baseada em
ensaios agrícolas e podem variar para ensaios �orestais.
70
Foram realizadas as análises multivariadas, geoestatísticas e com medidas
repetidas, além de algumas análises propostas envolvendo mais de uma dessas metodologias
simultaneamente.
6.1 Análise multivariada
Foi calculada a matriz de correlações de Pearson para as variáveis em estudo
(Tabela 4), além da área por árvore (APA). As variáveis referentes às alturas (A) apre-
sentaram correlações positivas entre si com intensidades variando de medianas a fortes,
conforme a proximidade no tempo. As variáveis de diâmetros do fuste (DF) apresentaram
correlações positivas medianas entre elas, assim como entre as variáveis de diâmetro da
copa (DC) e entre as variáveis de área da copa (AC). Já as variáveis de volume cilíndrico
(VC) apresentaram correlações variando de medianas a fracas conforme o aumento no
espaço temporal.
As variáveis de diâmetro do fuste (DF) e volume cilíndrico (VC) apresenta-
ram alta correlação positiva dentro de cada tempo. Este resultado já era esperado, pois as
duas variáveis representam características similares e diretamente associadas. O mesmo
ocorre entre as variáveis de diâmetro da copa (DC) e área da copa (AC).
A área por árvore (APA) apresentou correlações fortes negativas pratica-
mente estáveis ao longo do tempo com a altura (A), já com o diâmetro do fuste (DF)
houve leve aumento da correlação de moderada positiva para alta positiva ao longo do
tempo. Com o diâmetro da copa (DC) e área da copa (AC), a correlação com APA foi
de mediana positiva a fraca positiva. A correlação de APA com o volume cilíndrico (VC)
variou de fraca positiva a mediana positiva ao longo do tempo.
Foi realizada a análise de componentes principais identi�cando que 78% da
variabilidade dos dados pode ser representada pelos três primeiros componentes principais.
O primeiro representa 50%, o segundo 16% e o terceiro 12% da variabilidade total. Os
três primeiros componentes principais apresentam autovalores maiores que 1 (Tabela 5).
Os autovetores e os coe�cientes de correlação entre os três primeiros com-
ponentes principais e as variáveis podem ser visualizados na Tabela 6. Assim, o primeiro
componente principal (CP1) se correlaciona de forma negativa mediana com as variáveis
de altura, e de forma positiva variando sua intensidade de média a forte com as demais
variáveis. Podemos assim, chamar o primeiro componente principal do contraste entre
largura e altura da árvore.
71
Tabela4-Coe�cientes
decorrelação
dePearson
APA
A6
A13
A25
A37
DF13
DF25
DF37
DC13
DC25
DC37
AC13
AC25
AC37
VC13
VC25
A6
-0,70
A13
-0,71
0,75
A25
-0,70
0,61
0,66
A37
-0,67
0,58
0,61
0,88
DF13
0,60
-0,43
-0,33
-0,35
-0,38
DF25
0,63
-0,49
-0,46
-0,47
-0,46
0,73
DF37
0,70
-0,52
-0,52
-0,59
-0,63
0,61
0,71
DC13
0,55
-0,39
-0,38
-0,46
-0,49
0,40
0,48
0,63
DC25
0,51
-0,38
-0,38
-0,42
-0,40
0,33
0,39
0,53
0,78
DC37
0,42
-0,33
-0,31
-0,34
-0,33
0,30
0,38
0,49
0,60
0,68
AC13
0,55
-0,39
-0,38
-0,45
-0,48
0,40
0,48
0,63
0,99
0,79
0,60
AC25
0,52
-0,38
-0,38
-0,42
-0,41
0,34
0,40
0,54
0,79
0,99
0,68
0,81
AC37
0,42
-0,32
-0,31
-0,34
-0,33
0,29
0,38
0,50
0,60
0,67
0,99
0,60
0,67
VC13
0,16
0,01
0,27
0,06
0,00
0,81
0,45
0,29
0,16
0,10
0,11
0,17
0,10
0,11
VC25
0,39
-0,26
-0,20
-0,06
-0,11
0,66
0,90
0,53
0,33
0,24
0,27
0,34
0,25
0,28
0,54
VC37
0,47
-0,30
-0,27
-0,19
-0,18
0,53
0,61
0,87
0,49
0,41
0,41
0,50
0,42
0,42
0,37
0,61
72
Tabela 5 - Componentes principais e autovalores, proporção e proporção acumulada cor-respondentes
Componente Autovalor Proporção Acumulativo1 7,96 0,4981 0,49812 2,50 0,1560 0,65413 1,98 0,1238 0,77794 0,89 0,0558 0,8337
Tabela 6 - Autovetores (coe�cientes de correlação de Pearson entre os componentes prin-cipais e as variáveis)
Variável Componente 1 (CP1) Componente 2 (CP2) Componente 3 (CP3)A6 -0,236 (-0,64) 0,122 (0,19) 0,351 (0,50)A13 -0,215 (-0,61) 0,224 (0,35) 0,373 (0,53)A25 -0,230 (-0,65) 0,237 (0,38) 0,355 (0,50)A37 -0,233 (-0,66) 0,205 (0,32) 0,344 (0,48)DF13 0,236 (0,67) 0,364 (0,58) -0,147 (-0,20)DF25 0,272 (0,77) 0,283 (0,45) -0,182 (-0,26)DF37 0,305 (0,86) 0,098 (0,15) -0,120 (-0,17)DC13 0,296 (0,83) -0,102 (-0,16) 0,198 (0,28)DC25 0,280 (0,79) -0,169 (-0,27) 0,276 (0,39)DC37 0,256 (0,72) -0,120 (-0,19) 0,299 (0,42)AC13 0,296 (0,84) -0,099 (-0,16) 0,203 (0,29)AC25 0,283 (0,80) -0,168 (-0,26) 0,274 (0,39)AC37 0,255 (0,72) -0,120 (-0,19) 0,299 (0,42)VC13 0,106 (0,30) 0,508 (0,80) 0,084 (0,12)VC25 0,200 (0,57) 0,430 (0,68) -0,041 (-0,06)VC37 0,240 (0,68) 0,256 (0,41) 0,057 (0,08)
Já o segundo componente principal (CP2) apresenta forte correlação po-
sitiva com VC13 e moderada correlação positiva com VC25. Denominemos então este
componente principal como volume cilíndrico nos primeiros meses.
O terceiro componente principal (CP3) apresenta coe�cientes de correlação
com as variáveis com intensidades médias e baixas.
Veri�cou-se que os coe�cientes de correlação de Pearson entre APA e PCR1
é 0,78, entre APA e PCR2 é -0,06 e entre APA e PCR3 é -0,36. Então, a proporção entre
largura e altura aumenta conforme se eleva a área por árvore, por conta do coe�ciente
de correlação forte positivo entre APA E PCR1. Isto pode ser veri�cado por meio da
Figura 8, pois no grá�co da esquerda e do meio, veri�ca-se que as observações com área
por árvore entre 7,55m2 e 19,37m2 (vermelho) apresentam com maior frequência valores
73
negativos para CP1, enquanto que as observações com área por árvore entre 21,79m2 e
55,92m2 (azul) apresentam com maior frequência valores positivos para CP1. Já para
os demais componentes, não há diferenças proporcionais para determinadas regiões para
os dois grupos. Foram selecionados apenas dois grupos de áreas por árvore para melhor
visualização grá�ca.
Figura 8 - Grá�co CP1 × CP2 (esquerda), CP1 × CP3 (meio) e CP2 × CP3 (direita),
para todas as observações, em que pontos em vermelho correspondem à área
por árvore de 7,55m2 a 19,37m2 e pontos em azul correspondem à área por
árvore de 21,79m2 a 55,92m2.
A Figura 9 é um dendrograma elaborado para veri�car a associação entre
as variáveis, sendo uma alternativa que apresenta resultados que podem ser associados à
matriz de correlações. Assim, é possível veri�car que DC13 está altamente associada a
AC13, DC25 está altamente associada a AC25 e DC37 está altamente associada a AC37,
ou seja, DC e AC estão altamente correlacionadas dentro de cada tempo. Posteriormente,
veri�ca-se que DF25 tem grande associação com VC25, DF37 tem grande associação com
VC37 e A25 tem grande associação com A37. A partir daqui, considerando-se distâncias
maiores entre as variáveis, as relações entre elas são tomadas aos grupos de variáveis e
estão associadas a relações de médias a fracas. Esses resultados são con�rmados também
por meio dos coe�cientes de correlação (Tabela 4).
A Figura 10 esquerda é um dendrograma que representa a associação entre
os grupos de círculos de árvores, ou seja, cada área por árvore, considerando-se 13 meses.
Assim, observou-se que grupos de círculos adjacentes para 13 meses são mais similares,
com exceção dos círculos C02 e C04 que são mais similares que C02 e C03, e C03 e C04.
Já para 25 meses (Figura 10 direita), 37 meses (Figura 11 esquerda) e considerando-se
todos os períodos (Figura 11 direita), círculos adjacentes apresentam maiores associações.
74
Figura 9 - Dendrograma das variáveis
Figura 10 - Dendrograma para os círculos observados, do mais interno C01 ao mais externo
C18, para 13 meses (esquerdo) e 25 meses (direito) após o plantio
Figura 11 - Dendrograma para os círculos observados, do mais interno C01 ao mais externo
C18, para 37 meses (esquerdo) após o plantio e para todos os períodos (direita)
75
A análise discriminante linear apresentou 87% de classi�cações erradas nos
círculos, ou área por árvore, das observações pré-existentes. Assim, foi realizada a análise
discriminante quadrática, porém, esta apresentou 73% de classi�cações erradas. Portanto,
não foi encontrada função discriminante e�ciente para a classi�cação de novos objetos nos
círculos. Uma alternativa a ser testada é a utilização de metodologias que envolvem redes
neurais e lógica fuzzy.
6.2 Análise geoestatística
As análises descritivas prévias dos valores para cada variável em função de
suas posições são apresentadas nas Figuras 12 a 27 na parte esquerda, possibilitando
uma noção prévia de como os valores para as variáveis se comportam dependentes da
posição. A análise geoestatística iniciou-se com a entrada dos dados para cada variável e
suas respectivas coordenadas no software Gamma Design GS+ versão 9.0 (Gamma Design
Software, 2004). Posteriormente observou-se o melhor ajuste para cada modelo, por meio
dos maiores coe�cientes de determinação e menores somas dos quadrados dos resíduos.
Antes de prosseguir com a avaliação geoestatística, veri�cou-se a existência da dependência
espacial por meio do avaliador de dependência espacial (ADE). Na Tabela 7 seguem os
resultados obtidos para o ajuste para cada variável.
Conforme Tabela 7, é possível concluir que o modelo esférico foi o que melhor
se ajustou às variáveis altura (A) e diâmetro do fuste (DF), para todos os tempos após o
plantio, além disso, para as variáveis diâmetro da copa (DC), área da copa (AC) e volume
cilíndrico (VC), o modelo exponencial foi o que melhor se ajustou, em todos os tempos
após o plantio.
Para a altura (A), as estimativas dos parâmetros de efeito pepita (C0) e
patamar (C + C0) aumentaram do tempo 6 meses ao tempo 37 meses, já o alcance (A),
que é de 37,5 m aos 6 meses, foi reduzido aos 13 meses para 34,7 m, posteriormente, para
25 e 37 meses houve seu aumento para, respectivamente 38 m e 40,1 m. O avaliador de
dependência espacial (ADE) foi mediano aos 6 meses, tornando forte a partir do tempo
13 meses após plantio (Tabela 7, Figura 12, Figura 13, Figura 14 e Figura 15).
O diâmetro do fuste (DF) teve as estimativas do efeito pepita (C0) aumen-
tadas conforme o aumento dos tempos após o plantio medidos, já o patamar (C + C0)
aumentou dos 13 meses para os 25 meses, reduzindo seu valor aos 37 meses após o plan-
tio. O alcance permaneceu praticamente estável para as três medidas no tempo, variando
76
de 35,1 m a 36,9 m. O avaliador de dependência espacial foi forte para as variáveis de
diâmetro do fuste (Tabela 7, Figura 16, Figura 17 e Figura 18).
Considerando as variáveis de diâmetro da copa (DC), as estimativas dos
parâmetros de efeito pepita (C0) e patamar (C + C0) aumentaram dos 13 meses para 25
meses e dos 25 meses para 37 meses após o plantio. Já o alcance (A) foi reduzido, variando
de 31,5 m aos 13 meses para 27,9 m aos 25 meses e para 24,6 m aos 37 meses após o plantio.
O avaliador de dependência espacial apresentou-se forte para os 13 meses e mediano para
os demais tempos de plantio (Tabela 7, Figura 19, Figura 20 e Figura 21).
Avaliando a área da copa (AC), o efeito pepita (C0) e o patamar (C + C0)
aumentaram dos 13 meses para 25 meses e dos 25 meses para 37 meses após o plantio. O
alcance (A) reduziu de 31,8 m aos 13 meses, para 29,4 m aos 25 meses e para 22,8 m aos
37 meses após o plantio. O avaliador de dependência espacial (ADE) foi forte apenas nos
13 meses, já para 25 e 37 meses após o plantio, o ADE foi mediano (Tabela 7, Figura 22,
Figura 23 e Figura 24).
O volume cilíndrico (VC) apresentou estimativas dos parâmetros de efeito
pepita (C0) e patamar (C+C0) aumentados dos 13 meses para os 25 meses e dos 25 meses
para os 37 meses. O alcance aos 13 meses foi de 33,6 m, aumentando para 39,3 m aos 25
meses e reduzindo para 25,5 m aos 37 meses. O avaliador de dependência espacial (ADE)
foi forte para todos os tempos após o plantio neste atributo (Tabela 7, Figura 25, Figura
26 e Figura 27).
Considerando os valores dos avaliadores de dependência espacial (ADE) ob-
tidos, foi efetuada a krigagem para todas as variáveis. Para a variável altura (A), conforme
a Figura 28, observou-se que, em todos os tempos após o plantio, as árvores apresentaram
maiores valores para posições mais centrais do círculo, ou seja, as árvores apresentaram
maior altura para áreas por árvores (APA) menores. Fato que pode ser justi�cado pela
competição pela luz e pela presença de árvores dominantes, indicando a possibilidade de
avaliação de outros atributos como a área da copa iluminada (PADOIN; FINGER, 2010;
TONINI; ARCO-VERDE, 2005).
Contrariamente à altura (A), para as demais variáveis, houve a tendência
de obter valores mais elevados para área por árvore superiores (Figura 29, Figura 30 e
Figura 32) com a presença de alguns sumidouros e aportes a serem investigados, porém
que podem ter sido in�uenciados por variações no solo e outros efeitos não controlados.
77
Tabela 7 - Parâmetros dos semivariogramas
Variável Modelo C0 C0 + C A r2 SQR ADEA6 Esf. 1, 095× 10−2 3, 138× 10−2 37, 5 0, 912 7, 032× 10−5 65, 1%A13 Esf. 1, 480× 10−2 6, 230× 10−2 34, 7 0, 917 3, 384× 10−4 76, 2%A25 Esf. 9, 200× 10−3 9, 340× 10−2 38, 0 0, 926 1, 088× 10−3 90, 1%A37 Esf. 1, 390× 10−2 1, 188× 10−1 40, 1 0, 971 6, 243× 10−4 88, 3%DF13 Esf. 1, 834× 10−6 1, 834× 10−5 35, 8 0, 960 1, 982× 10−11 90, 1%DF25 Esf. 1, 600× 10−6 3, 910× 10−5 36, 9 0, 980 5, 270× 10−11 95, 9%DF37 Esf. 3, 900× 10−6 3, 580× 10−5 35, 1 0, 949 9, 189× 10−11 89, 1%DC13 Exp. 5, 240× 10−2 3, 048× 10−1 31, 5 0, 912 6, 029× 10−3 82, 8%DC25 Exp. 1, 150× 10−1 3, 380× 10−1 27, 9 0, 832 9, 240× 10−3 66, 0%DC37 Exp. 1, 553× 10−1 4, 096× 10−1 24, 6 0, 908 5, 449× 10−3 62, 1%AC13 Exp. 1, 120× 100 8, 347× 100 31, 8 0, 886 6, 760× 100 86, 6%AC25 Exp. 4, 060× 100 1, 398× 101 29, 4 0, 710 1, 860× 101 71, 0%AC37 Exp. 7, 180× 100 2, 117× 101 22, 8 0, 907 1, 860× 101 66, 1%VC13 Exp. 2, 580× 10−8 2, 648× 10−7 33, 6 0, 939 3, 790× 10−15 90, 2%VC25 Exp. 1, 900× 10−7 3, 700× 10−6 39, 3 0, 978 3, 289× 10−13 94, 9%VC37 Exp. 3, 200× 10−7 3, 920× 10−6 25, 5 0, 939 7, 221× 10−13 91, 8%
Esf.: Esférico; Exp.: Exponencial; C0: Efeito pepita; C + C0: Patamar; A: Alcance; r2:Coe�ciente de determinação; SQR: Soma de quadrados dos resíduos; ADE: Avaliador dedependência espacial.
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●
●
●
●
●
●
●●●●●●●●●●●●●●
●
●
●
●
●●●●●●●●
●●
●●
●●
●
●
●
●
●●●●
●●●●
●●
●●
●●
●●
●
●
●●●●●●
●●●●●
●●
●●
●●
●
●●●●●●●●●● ● ● ● ● ● ●●
●
●●●●●●●●● ●● ● ● ● ● ● ● ●
●●●●●●●●●● ● ● ● ● ● ●●
●
●●●●●●●●●●●
●●
●●
●●
●
●●●●●●●●
●●
●●
●●
●
●●
●
●●●●●●●●
●●
●
●●●
●
●●
●
●●●●●
●●●●●●●
●●
●
●
●
●
●●●●●●●●●●●●●
●●
●
●
●
●●●●●●●●●●●
●●
●●
●●
●
●●●●●
●●
●●
●●
●●
●●
●●
●
●●●●●●
●●
●●
●●
●●
●●
●
●
●●●●●●●●●●●●
●●
●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●
●●
●●
●●
●
●●●●
●●
●●
●●
●●
●●
●●
●
●
●●●●
●●●
●●
●●
●●
●●
●●
●
●●●●●●●●●
●●
●
●
●
●
●
●
●
Figura 12 - Valores em cada posição (esquerda) e semivariograma (direita) para A6
78
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●
●
●
●
●
●●●●●●●●●●●●●●●
●●
●
●●●●●●
●●●●●●
●●
●●
●
●
●●●●
●●●●
●●
●●
●●
●●
●●
●●●●●●
●●●●●●●●
●●
●●
●●●●●●●●●●●●●● ● ● ● ●
●●●●●●●●●●●● ● ● ● ● ● ●
●●●●●●●●●●●●●●● ● ● ●
●●●●●●●●●●●●●●
●●
●●
●●●●●●●●●●
●●
●●
●●
●●
●●●●●●●●
●●●●●●
●
●●
●
●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●
●●
●●
●●
●●
●●●●●●●●●●●●●●●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●
●●
●●
●●
●●●●
●●●●
●●●●
●●
●●
●●
●●●●
●●●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●●
●
●
●
Figura 13 - Valores em cada posição (esquerda) e semivariograma (direita) para A13
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●
●
●
●
●
●●●●●●●●●●●●●●
●
●
●
●
●●●●●●●●
●●●●●●
●●
●●
●●●●
●●●●●
●●
●●
●●
●●
●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●●●●●●●● ● ● ● ●●
●●●●●●●●●●●● ● ● ● ● ● ●
●●●●●●●●●●●● ● ● ● ● ● ●
●●●●●●●●●●●●●●
●●
●●
●●●●●●●●●●
●●
●●
●●
●
●
●●●●●●●●●●
●●
●●
●
●
●
●
●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●
●●
●●
●●
●
●●●●●●●●●●●●
●●
●●
●●
●●●●●●●●●●●●●●●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●
●●
●●
●
●●●●
●●●●●
●●
●●
●●
●●
●
●●●●
●●●●
●●
●●
●●
●●
●●
●●●●
●●●●●●●●●●●
●●
●
Figura 14 - Valores em cada posição (esquerda) e semivariograma (direita) para A25
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●
●
●
●
●●●●●●●●●●●●●●
●
●
●
●
●●●●●●●●●●●●
●●
●●
●
●
●●●●
●●●●●
●●
●●
●●
●●
●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●●●●●●●● ● ● ● ●●
●●●●●●●●● ● ● ● ● ● ● ● ● ●
●●●●●●●●●●● ● ● ● ● ● ● ●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●●●●
●●
●●
●●
●●
●
●●●●●●●●
●●●●●
●●
●
●
●
●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●●●●
●●
●
●
●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●●
●●
●●
●●
●●
●●
●
●●●●●●●●●
●●
●●
●●
●●
●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●
●●
●●
●●
●●●●
●●●●●
●●
●●
●●
●●
●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●●
●
●
●
Figura 15 - Valores em cada posição (esquerda) e semivariograma (direita) para A37
79
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●
●
●
●
●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●
●●
●●
●●
●
●●
●
●
●●
●●●
●●
●●
●●
●●
●●
●●
●
●●●●●●●●
●●
●●
●●
●●
●●
●●●●●●● ●●●● ● ● ● ● ● ● ●
●●●●●●●● ● ● ● ● ● ● ● ● ● ●
●●●●●●●●●●●● ● ● ● ● ● ●
●●●●●●●●●●●●●●●
●●
●
●●●●●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●
●●
●●
●●●●●●●●●●●●●●
●●
●
●
●●●●●●●●●●●●●
●
●
●
●
●
●●●●●●●●●●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●
●●●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●
●●
●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●
●●
●●
●
●●●●●
●●
●●
●●
●●
●●
●●
●
●●
●●
●●●
●●
●●
●●
●●
●●
●
●●●●●●●●●●●●●●●●
●●
Figura 16 - Valores em cada posição (esquerda) e semivariograma (direita) para DF13
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●
●
●
●
●●●●●●●●●●●●●●●●●●
●●●●●●
●
●●
●●
●●
●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●
●●
●●
●●
●●
●●
●●●●●●●●●●● ● ● ● ● ● ● ●
●●●●●●●●● ●●●●●●● ● ●
●●●●●●●●●●● ● ● ● ● ● ● ●
●●●●●●●●●●●●●●●●●●
●●●
●●●●
●●
●●
●●
●●
●●
●
●●●●●●●●●●●●●●●●●
●
●●●●●●●●●●
●●●●
●●●●
●●●●
●●●●
●●●●●●●
●
●
●
●●●●●●●●●
●
●●●●●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●
●●●
●●
●●
●●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●
●●●●●
●●
●●
●●
●●
●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●●●
●●
Figura 17 - Valores em cada posição (esquerda) e semivariograma (direita) para DF25
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●
●●●●●●●●●●●●
●●
●●●
●●
●●
●●
●●
●●
●●
●
●●●●●●●●●●●●
●●
●●
●●
●●●●●●●●●●●●●●●● ● ●
●● ● ● ●●●●●●●●● ● ● ● ● ●
●●●●●●●●●●●●●● ● ● ● ●
●●●●●●●●●●●●●●●●●●
●●●
●●●●
●●
●●
●●
●●
●●
●
●●●●●●●●●●●●●●●
●●
●
●●●●
●●●●●●●
●
●
●
●●●
●
●●●●
●●●●●●●●●●●●●●
●●●●●●●●●
●
●●●●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●
●●●
●●
●●
●●
●●
●●
●
●●●●●●●●
●●●
●●
●●
●●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●
●●●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●●●●●
Figura 18 - Valores em cada posição (esquerda) e semivariograma (direita) para DF37
80
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●●
●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●
●●●
●●●●
●●●●
●●
●●
●●●●●●●●●●●
●●
●●
●●
●
●●●●●●●●●● ● ● ● ●●●●●
●●●● ● ●●●●●●●● ●●●● ●
●●●●●●●●●●●●● ● ● ● ● ●
●●●●●●●●●●●●●●●●●●
●●●●●●●●
●●●
●●
●●
●●
●
●●●●●●●●●●●●●●
●●
●●
●●●●●●●●●●●●●
●
●●●
●
●●●●●●●●●●●●●●
●●
●●
●●●●●●●●●●●●●
●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●
●●●●
●●
●
●●
●●●
●●
●●
●●
●●
●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●
●
●●
●●
●●
Figura 19 - Valores em cada posição (esquerda) e semivariograma (direita) para DC13
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●
●●●
●●●●
●●●●
●●
●●
●●●●●●●●●●●
●●
●●
●●
●
●●●●●●● ●●● ● ● ● ● ●●● ●
●●●● ● ●●●●●●● ● ● ●●● ●
●●●●●●●●●●●● ● ● ● ● ● ●
●●●●●●●●●●●●●●●●●●
●●●●●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●●●●
●
●●●●
●●●●●●
●●
●
●
●●●●
●●●●●●●●●●●●●●
●●●●
●●●●●
●
●●●
●
●●●
●
●●●
●
●●●
●●
●●
●●
●
●●
●●
●●
●●
●●●●
●●●●
●●
●●
●●
●●
●●
●●●●●●●
●●●●●
●●
●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●
●●
●●
●
●●
●●
Figura 20 - Valores em cada posição (esquerda) e semivariograma (direita) para DC25
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●
●●●●●●●●●●
●●
●●
●●●
●●
●●●
●●●●
●●
●●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●●●● ●●●● ● ● ● ● ●
●●●●● ●●●●●● ● ● ● ●● ● ●
●●●●●●●●●●●●●● ● ● ● ●
●●●●●●●●●●●●●●●●
●●
●●●●●●
●●●●
●●
●●
●●
●●
●●●●●●●●●●
●●●●●●
●●
●●●●●●●●●●
●●●●
●●●
●
●●●●●●●●●●●●●●●●
●●
●●●●●●●●●
●
●●●●
●●●
●
●●●
●●
●●
●●
●●
●●
●●
●●
●
●●●●●●●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●
●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●
●●●●●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●
●●●
●●
●
●●
●●
Figura 21 - Valores em cada posição (esquerda) e semivariograma (direita) para DC37
81
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●
●
●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●
●●●●
●●
●●●
●●
●●
●●
●●●
●●
●●
●●●●●●●●●●●
●●
●●
●●
●
●●●●●●●●●● ● ● ● ● ●●●●
●●●● ● ●●●● ●●● ● ● ●●● ●
●●●●●●●●●● ● ● ● ● ● ● ● ●
●●●●●●●●●●●●●●
●●●●
●●●●●●●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●
●●
●●
●●●●●●●●●●●●●
●
●●
●
●
●●●●●●●●●●●●
●
●
●
●
●●
●●●●●●
●●●●●
●●
●
●●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●
●●
●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●
●
●●
●●
●●
●●●●●●●●●●●
●
●●
●
●●●
Figura 22 - Valores em cada posição (esquerda) e semivariograma (direita) para AC13
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●
●
●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●
●●●
●●
●●
●●
●●
●●
●●
●
●●●●●●●●●●
●●
●●
●●
●●
●●●●●●● ● ● ● ● ● ● ● ● ● ● ●
●●● ● ● ● ●●●●●● ● ● ●●● ●
●●●●●●●●●●● ● ● ● ● ● ● ●
●●●●●●●●●●●●●●
●●●
●
●●●●●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●
●●●●●
●●
●
●●●●
●●●●●●
●●
●
●
●●●
●
●●●●●●●●●●●●●
●
●●
●●
●●●●●
●
●●●
●
●●●
●
●●●
●
●●●
●●
●●
●●
●
●●
●●
●●
●●
●●●●
●●●●
●●
●●
●●
●●
●●
●●●●●●●
●●●●
●●
●●
●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●
●●●●●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●
●●
●
●●
●●●●●●●
●●
●
●
●
●
●●●
Figura 23 - Valores em cada posição (esquerda) e semivariograma (direita) para AC25
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●
●
●●
●●●●●●●●●●●●●●●
●
●●
●●●●●●
●●●●●●●●●●
●●
●●
●●●●
●●●●
●●●
●●
●●
●
●●●●●●●●●●
●●
●●
●●
●●
●●●●●●●●● ●●●● ● ● ● ● ●
●●●●● ●●●●●● ● ● ● ● ● ● ●
●●●●●●●●●●●●● ● ● ● ● ●
●●●●●●●●●●●●●●●●
●●
●●●●●●●●●
●●
●●
●●
●●
●
●●●●●●●●●●
●●
●●●
●●
●
●●●●●●●●●●
●●●
●
●●
●
●
●●●●●●●●●●●●
●●
●
●
●●
●●●●●●●●●
●
●●●
●
●●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●
●●
●●
●●
●●
●●
●●
●
●●●●●●●●●●●●●
●●
●●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●
●●
●●
●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●
●●●
●
●
●
●
●
●●
Figura 24 - Valores em cada posição (esquerda) e semivariograma (direita) para AC37
82
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●
●
●
●
●
●
●●●●●●●●●●●●●●●
●●
●
●●●●●●●●
●●
●●
●
●
●
●
●
●
●●●
●●
●●
●●
●●
●●
●●
●●
●
●●●●●●●●●
●●
●●
●●
●●
●
●●●●●●●●●●● ● ● ● ● ● ● ●
●●●●●●●● ● ● ● ● ● ● ● ● ● ●
●●●●●●●●●●●●● ● ● ● ● ●
●●●●●●●●●●●●●●
●●
●●
●●●●●●●●
●●
●●
●●
●
●●
●
●●●●●●●●
●●●●●●
●
●●
●
●●●●●●●●●●●●●●
●●●
●
●●●●●●●●●●●●●
●●
●
●
●
●●●●●●●●●●●●●
●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●
●●●●
●●
●●●
●●
●●
●
●●●●●●●●●●●●
●●
●●
●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●
●●
●●
●
●●●●
●●●●●●
●●
●●
●●
●●
●●●
●●●●
●●
●●
●●
●●
●●
●
●●●●●●●●●●●●●●●
●●●
Figura 25 - Valores em cada posição (esquerda) e semivariograma (direita) para VC13
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●
●
●
●
●
●
●●●●●●●●●●●●●●●●●
●
●●
●●●●
●●●●
●●
●●
●
●
●
●
●●
●●
●●
●●
●●
●●
●
●●
●
●
●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●● ●●● ● ● ● ● ● ● ● ●
●●●●●●●● ● ● ●● ● ● ● ● ● ●
●●●●●●●●●●● ● ● ● ● ● ● ●
●●●●●●●●
●●●●●●●●●
●
●●
●●●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●
●●
●●
●
●
●●●●
●●●●●
●
●●
●●
●●●
●
●●●●
●●●●
●●●●●
●
●
●
●
●
●●●●●●●●●
●
●●●●●●●●
●●
●●
●●
●●
●●
●●
●
●●
●●
●
●●●
●●
●●
●●
●●
●●
●●
●
●
●
●●●●●●●●
●●●
●●
●●
●●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●
●●
●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●
●●●●●●●●●●●
●●●
Figura 26 - Valores em cada posição (esquerda) e semivariograma (direita) para VC25
−60 −40 −20 0 20 40 60
−60
−40
−20
020
4060
X Coord
Y C
oord
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●
●
●●●●●●
●●●●●●●●●●
●●
●●
●●●●
●●
●●●
●●
●●
●●
●
●●●●●●●●●
●●
●●
●●
●●
●
●●●●●●●●●●●●● ● ● ● ● ●
●● ● ● ● ●●●● ● ● ● ● ● ● ● ● ●
●●●●●●●●●●●● ● ● ● ● ● ●
●●●●●●●●●●●●●●●●●
●
●●●
●●●
●●
●●
●●
●●
●●
●
●
●●●●●●●●
●●●●●
●●
●
●
●
●●●●●●●●●●●●
●
●
●●
●
●
●●●●●●●●●●●●●●●●●
●
●●●●●●●●●
●●●●
●●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●
●●
●●
●●
●●
●●
●
●●●●●●●●●●●
●●
●●
●●
●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●
●●
●●●
●●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●●●●●●●●●●●●●●
Figura 27 - Valores em cada posição (esquerda) e semivariograma (direita) para VC37
83
Figura 28 - Krigagem da variável A, para 6, 13, 25 e 37 meses respectivamente
Figura 29 - Krigagem da variável DF, para 13, 25 e 37 meses respectivamente
84
Figura 30 - Krigagem da variável DC, para 13, 25 e 37 meses respectivamente
Figura 31 - Krigagem da variável AC, para 13, 25 e 37 meses respectivamente
85
Figura 32 - Krigagem da variável VC, para 13, 25 e 37 meses respectivamente
6.3 Análise de medidas repetidas
Antes da análise de medidas repetidas, mostra-se gra�camente os per�s mé-
dios de respostas das variáveis em cada círculo ao longo dos períodos (Figuras 33, 34 e 35).
Assim como veri�cado na avaliação geoestatística, há um aumento ao longo do tempo para
ambas as variáveis, além de que, há tendência de elevação dos valores ao se aproximar dos
círculos das extremidades, com exceção da altura (A), em que há a tendência de redução.
Apesar destas tendências, os círculos não se apresentam necessariamente ordenados, ha-
vendo também alguns casos em que círculos que apresentavam valores menores em alguns
períodos, apresentam valores maiores que outros círculos em outros períodos.
Ao considerar a análise univariada de per�l, por meio do esquema de parcelas
subdivididas, foi constatado, para todas as variáveis em estudo, que o teste de Mauchly
rejeitou a hipótese de esfericidade (Tabela 8), deste modo, conclui-se que a matriz de
covariâncias dos erros não satisfazem à condição H-F (HUYNH; FELDT, 1970). Assim,
será procedida a análise multivariada de per�s, pois não apresenta restrições sobre a matriz
de covariâncias dos resíduos.
86
C1
0
1
2
3
4
5
TP
6 13 25 37
PLOT C1 C2 C3 C4 C5 C6 C7 C8 C9
C10 C11 C12 C13 C14 C15 C16 C17 C18
Figura 33 - Per�s médios de resposta das alturas (A) nos círculos ao longo do tempo
C1
0.034
0.036
0.038
0.040
0.042
0.044
0.046
0.048
0.050
0.052
0.054
0.056
0.058
0.060
0.062
0.064
0.066
0.068
0.070
0.072
0.074
TP
13 25 37
PLOT C1 C2 C3 C4 C5 C6 C7 C8 C9
C10 C11 C12 C13 C14 C15 C16 C17 C18
C1
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
TP
13 25 37
PLOT C1 C2 C3 C4 C5 C6 C7 C8 C9
C10 C11 C12 C13 C14 C15 C16 C17 C18
Figura 34 - Per�s médios de resposta dos diâmetros do fuste (DF) nos círculos ao longo
do tempo (esquerda) e tendência das áreas da copa (AC) nos círculos ao longo
do tempo (direita)
C1
2
3
4
5
6
TP
13 25 37
PLOT C1 C2 C3 C4 C5 C6 C7 C8 C9
C10 C11 C12 C13 C14 C15 C16 C17 C18
C1
0.001
0.002
0.003
0.004
0.005
0.006
0.007
0.008
0.009
0.010
0.011
0.012
0.013
0.014
0.015
0.016
TP
13 25 37
PLOT C1 C2 C3 C4 C5 C6 C7 C8 C9
C10 C11 C12 C13 C14 C15 C16 C17 C18
Figura 35 - Per�s médios de resposta dos diâmetros da copa (DC) nos círculos ao longo
do tempo (esquerda) e tendência dos volumes cilíndricos (VC) nos círculos ao
longo do tempo (direita)
87
Tabela 8 - Teste de esfericidade de Mauchly
Variável Graus de Critério de Estatística de Valor-pliberdade Mauchly (W) Qui-quadrado χ2
A 5 0,4895786 294,77043 <,0001DF 2 0,9704567 12,385243 0,0020DC 2 0,8527957 65,764176 <,0001AC 2 0,7367622 126,1674 <,0001VC 2 0,9744359 10,695253 0,0048
As Tabelas 9 a 13 apresentam os coe�cientes de correlação estimados para
cada variável, entre os períodos. É possível veri�car que, conforme Littell, Henry e Am-
merman (1998) a�rmam, medidas tomadas em períodos mais próximos tendem a ser mais
fortemente correlacionadas.
Conforme as Tabelas 14, 16, 18, 20 e 22 apresentam, foi testada a hipótese
nula de per�l horizontal para cada variável, ou seja, foi veri�cado o efeito do fator período.
Para tal, foram utilizados os testes multivariados Lambda de Wilks, Traço de Pillai, Traço
de Hotelling-Lawley e Raiz máxima de Roy.
Sob estes mesmos testes, conforme as Tabelas 15, 17, 19, 21 e 23, foi testada
a hipótese nula de per�s paralelos para cada variável, ou seja, foi veri�cada a existência
do efeito da interação círculos × períodos.
Ambos os testes rejeitaram as hipóteses nulas para todas as variáveis, in-
dicando que pelo menos uma combinação de círculos e períodos interage. Além disso,
veri�cou-se a rejeição da hipótese sobre a igualdade dos períodos.
Tabela 9 - Correlações estimadas para alturas (A) entre os quatro períodos avaliados
6 meses 13 meses 25 meses 37 meses6 meses 1,0000 0,4341 (<,0001) 0,1692 (0,0005) 0,1352 (0,0058)13 meses 0,4341 (<,0001) 1,0000 0,2937 (<,0001) 0,2291 (<,0001)25 meses 0,1692 (0,0005) 0,2937 (<,0001) 1,0000 0,7629 (<,0001)37 meses 0,1352 (0,0058) 0,2291 (<,0001) 0,7629 (<,0001) 1,0000
Tabela 10 - Correlações estimadas para diâmetros de fuste (DF) entre os três períodosavaliados
13 meses 25 meses 37 meses13 meses 1,0000 0,5255 (<,0001) 0,2791 (<,0001)25 meses 0,5255 (<,0001) 1,0000 0,4293 (<,0001)37 meses 0,2790 (<,0001) 0,4293 (<,0001) 1,0000
88
Tabela 11 - Correlações estimadas para diâmetros de copa (DC) entre os três períodosavaliados
13 meses 25 meses 37 meses13 meses 1,0000 0,7007 (<,0001) 0,4767 (<,0001)25 meses 0,7007 (<,0001) 1,0000 0,6021 (<,0001)37 meses 0,4767 (<.0001) 0,6021 (<,0001) 1,0000
Tabela 12 - Correlações estimadas para área de copa (AC) entre os três períodos avaliados
13 meses 25 meses 37 meses13 meses 1,0000 0,7320 (<,0001) 0,4869 (<,0001)25 meses 0,7320 (<,0001) 1,0000 0,6038 (<,0001)37 meses 0,4869 (<,0001) 0,6038 (<,0001) 1,0000
Tabela 13 - Correlações estimadas para volume cilíndrico (VC) entre os três períodos ava-liados
13 meses 25 meses 37 meses13 meses 1,0000 0,4889 (<,0001) 0,2853 (<,0001)25 meses 0.4889 (<,0001) 1,0000 0,4793 (<,0001)37 meses 0,2853 (<,0001) 0,4793 (<,0001) 1,0000
Tabela 14 - Análise multivariada da altura (A) por árvore, no delineamento inteiramentecasualizado, testando o efeito nulo de fator período após o plantio
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,00564548 24188,9 3 412 <,0001Traço de Pillai 0,99435452 24188,9 3 412 <,0001Traço de Hotelling-Lawley 176,13295097 24188,9 3 412 <,0001Raiz máxima de Roy 176,13295097 24188,9 3 412 <,0001G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
Tabela 15 - Análise multivariada da altura (A) por árvore, no delineamento inteiramentecasualizado, testando o efeito nulo de interação período após o plantio ×círculo
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,71960129 2,81 51 1227,4 <,0001Traço de Pillai 0,29495959 2,66 51 1242 <,0001Traço de Hotelling-Lawley 0,36968334 2,98 51 1029,9 <,0001Raiz máxima de Roy 0,30850381 7,51 17 414 <,0001
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
89
Tabela 16 - Análise multivariada de diâmetro do fuste (DF) por árvore, no delineamentointeiramente casualizado, testando o efeito nulo de fator período após o plantio
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,02257111 8942,36 2 413 <,0001Traço de Pillai 0,97742889 8942,36 2 413 <,0001Traço de Hotelling-Lawley 43,30443091 8942,36 2 413 <,0001Raiz máxima de Roy 43,30443091 8942,36 2 413 <,0001
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
Tabela 17 - Análise multivariada de diâmetro do fuste (DF) por árvore, no delineamentointeiramente casualizado, testando o efeito nulo de interação período após oplantio × círculo
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,81963597 2,54 34 826 <,0001Traço de Pillai 0,18206299 2,44 34 828 <,0001Traço de Hotelling-Lawley 0,21798100 2,64 34 738,77 <,0001Raiz máxima de Roy 0,20801627 5,07 17 414 <,0001
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
Tabela 18 - Análise multivariada de diâmetro da copa (DC) por árvore, no delineamentointeiramente casualizado, testando o efeito nulo de fator período após o plantio
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,10439408 1771,58 2 413 <,0001Traço de Pillai 0,89560592 1771,58 2 413 <,0001Traço de Hotelling-Lawley 8,57908759 1771,58 2 413 <,0001Raiz máxima de Roy 8,57908759 1771,58 2 413 <,0001
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
Tabela 19 - Análise multivariada de diâmetro da copa (DC) por árvore, no delineamentointeiramente casualizado, testando o efeito nulo de interação período após oplantio × círculo
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,89080508 1,45 34 826 0,0493Traço de Pillai 0,11154262 1,44 34 828 0,0518Traço de Hotelling-Lawley 0,11994455 1,45 34 738,77 0,0474Raiz máxima de Roy 0,09097531 2,22 17 414 0,0037
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
90
Tabela 20 - Análise multivariada de área da copa (AC) por árvore, no delineamento intei-ramente casualizado, testando o efeito nulo de fator período após o plantio
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,11232115 1631,98 2 413 <,0001Traço de Pillai 0,88767885 1631,98 2 413 <,0001Traço de Hotelling-Lawley 7,90304281 1631,98 2 413 <,0001Raiz máxima de Roy 7,90304281 1631,98 2 413 <,0001
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
Tabela 21 - Análise multivariada de área da copa (AC) por árvore, no delineamento intei-ramente casualizado, testando o efeito nulo de interação período após o plantio× círculo
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,88115384 1,59 34 826 0,0189Traço de Pillai 0,12190421 1,58 34 828 0,0197Traço de Hotelling-Lawley 0,13140510 1,59 34 738,77 0,0184Raiz máxima de Roy 0,09479407 2,31 17 414 0,0023
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
Tabela 22 - Análise multivariada de volume cilíndrico (VC) por árvore, no delineamentointeiramente casualizado, testando o efeito nulo de fator período após o plantio
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,01674601 12124,8 2 413 <,0001Traço de Pillai 0,98325399 12124,8 2 413 <,0001Traço de Hotelling-Lawley 58,71572939 12124,8 2 413 <,0001Raiz máxima de Roy 58,71572939 12124,8 2 413 <,0001
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
Tabela 23 - Análise multivariada de volume cilíndrico (VC) por árvore, no delineamentointeiramente casualizado, testando o efeito nulo de interação período após oplantio × círculo
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,68061251 5,15 34 826 <,0001Traço de Pillai 0,32310834 4,69 34 828 <,0001Traço de Hotelling-Lawley 0,46379789 5,62 34 738,77 <,0001Raiz máxima de Roy 0,45169479 11,00 17 414 <,0001
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
91
O ajuste de uma função polinomial para representar o comportamento de
cada variável ao longo do tempo, para cada círculo, pela análise de regressão e a pos-
terior identi�cação dos efeitos aleatórios e a escolha das matrizes de covariâncias mais
adequadas, foi inviabilizada pela pequena quantidade de períodos amostrados. Assim,
para que haja prosseguimento às abordagens citadas, é necessário conduzir experimento
amostrando maior quantidade de períodos. É advertido que o delineamento realizado não
admite aleatorização, assim, os resultados aqui obtidos na análise com medidas repetidas
podem não ser adequadas.
6.4 Análises conjuntas alternativas
Novos componentes principais foram calculados para cada grupo de variáveis
pertencentes a cada tempo. Assim, A, DF, DC, AC e VC foram analisadas conjuntamente
aos 13 meses. Suas correlações, assim como para os outros períodos, também podem ser
observadas na Tabela 4. Os componentes principais obtidos (Tabela 24) acumulam 84% da
variabilidade explicada pelos dois primeiros, de modo que o primeiro componente contém
53% e o segundo 31% da variabilidade total, além de apresentarem autovalores maiores
que um.
Os dois primeiros componentes principais obtidos para as variáveis A, DF,
DC, AC e VC aos 25 meses, representam juntos 84% da variabilidade total do conjunto de
variáveis, sendo 57% correspondente ao primeiro e 27% ao segundo componente, de modo
que ambos apresentam autovalores maiores que 1. Para o período de 37 meses, as variáveis
A, DF, DC, AC e VC apresentam os dois primeiros componentes principais representando
83% da variabilidade, tal que o primeiro e o segundo respondem respectivamente por 62%
e 21% da variabilidade, e ambos têm autovalores maiores que a unidade (Tabela 24).
Tabela 24 - Componentes principais e autovalores, proporção e proporção acumulada cor-respondentes
Grupo de variáveis Componente Autovalor Proporção Acumulativo13 meses 1 2,63 0,53 0,5313 meses 2 1,54 0,31 0,8425 meses 1 2,87 0,57 0,5725 meses 2 1,34 0,27 0,8437 meses 1 3,11 0,62 0,6237 meses 2 1,05 0,21 0,83
92
Tratando-se especi�camente do primeiro componente principal, é possível
observar grande similaridade entre os autovetores (Tabela 25) e nos coe�cientes de corre-
lação de Pearson entre os componentes principais e as variáveis (Tabela 26) ao comparar
os três períodos, fato que explicita os signi�cados similares para este componente nos
períodos correspondentes. Correlações fracas negativas com altura (A), fracas positivas
com volume cilíndrico (VC) e medianas positivas com diâmetro do fuste (DF), diâmetro
da copa (DC) e área da copa (AC). Esta similaridade também é observada ao incluir na
comparação o primeiro componente principal obtido na análise que considera todas as
variáveis simultaneamente (Tabela 6).
Tabela 25 - Autovetores considerando grupos de variáveis por período
Variável CP1 CP2 Variável CP1 CP2 Variável CP1 CP2A13 -0,299 0,457 A25 -0,356 0,212 A37 -0,335 0,284DF13 0,473 0,417 DF25 0,484 0,476 DF37 0,499 -0,458DC13 0,548 -0,245 DC25 0,496 -0,402 DC37 0,478 0,521AC13 0,550 -0,241 AC25 0,496 -0,397 AC37 0,479 0,519VC13 0,291 0,707 VC25 0,379 0,640 VC37 0,424 -0,410
Tabela 26 - Coe�cientes de correlação de Pearson entre os componentes principais e asvariáveis, considerando grupos de variáveis por período
Variável CP1 CP2 Variável CP1 CP2 Variável CP1 CP2A13 -0,49 0,57 A25 -0,60 0,25 A37 -0,59 0,29DF13 0,77 0,52 DF25 0,82 0,55 DF37 0,88 -0,47DC13 0,89 -0,30 DC25 0,84 -0,47 DC37 0,84 0,53AC13 0,89 -0,30 AC25 0,85 -0,46 AC37 0,84 0,53VC13 0,47 0,88 VC25 0,64 0,74 VC37 0,75 -0,42
Para visualizar o comportamento geoestatístico dos componentes principais
1, 2 e 3 do grupo com todas as variáveis, foram ajustados os modelos e obtidas as estima-
tivas dos parâmetros para os semivariogramas (Tabela 27). Para o primeiro componente
principal foi obtido, por melhor ajuste, o modelo esférico, com alcance considerável de 36,5
metros e ADE forte. Já para o segundo e terceiro componentes, o modelo utilizado para o
ajuste foi o exponencial, com alcances dados respectivamente por 12,4 m e 6,07 m, e ADE
forte para o segundo e mediano para o terceiro componente.
A análise geoestatística para os dois primeiros componentes principais do
grupo de variáveis de 13 meses indicou o modelo esférico para o melhor ajuste para o
93
semivariograma de ambos os componentes, de modo que o primeiro apresenta alcance de
33,8 metros, com ADE forte, e o segundo componente apresenta alcance de 26,6 m e ADE
mediano (Tabela 27).
Já para os dois primeiros componentes principais do grupo de variáveis de 25
meses, o modelo de semivariograma esférico se ajustou melhor ao primeiro e o exponencial
se ajustou melhor ao segundo, tal que para o primeiro componente, o alcance é de 36,5 m
com ADE forte, e para segundo, o alcance é de 8,7 m e ADE também forte (Tabela 27).
Os dois primeiros componentes principais das variáveis observadas aos 37
meses, tiveram como melhor ajuste para o semivariograma, respectivamente o modelo
esférico e o exponencial. O primeiro componente apresenta alcance de 33,9 m e ADE
forte, e o segundo apresenta alcance de 2,6 m e ADE também forte (Tabela 27). Os
grá�cos dos modelos de semivariogramas são apresentados nas Figuras 36 a 44 à esquerda.
Tabela 27 - Parâmetros dos semivariogramas dos escores dos componentes principais, con-siderando grupos de variáveis por período e geral
Variáveis Componente Modelo C0 C0 + C A r2 SQR ADETodas CP1 Esf. 0, 620 6, 002 36, 5 0, 939 3, 2900 89, 7%Todas CP2 Exp. 0, 322 1, 490 12, 4 0, 978 0, 0346 78, 4%Todas CP3 Exp. 0, 403 1, 040 6, 1 0, 871 0, 0422 61, 5%13 meses CP1 Esf. 0, 231 1, 568 33, 8 0, 936 0, 2020 85, 3%13 meses CP2 Esf. 0, 348 0, 858 26, 6 0, 944 0, 0217 59, 4%25 meses CP1 Esf. 0, 371 1, 940 36, 5 0, 934 0, 2980 80, 9%25 meses CP2 Exp. 0, 125 0, 688 8, 7 0, 956 0, 0128 81, 8%37 meses CP1 Esf. 0, 501 2, 040 33, 9 0, 959 0, 1690 75, 4%37 meses CP2 Exp.. 0, 063 0, 497 2, 6 0, 858 0, 0063 87, 3%
Esf.: Esférico; Exp.: Exponencial; C0: Efeito pepita; C + C0: Patamar; A: Alcance; r2:Coe�ciente de determinação; SQR: Soma de quadrados dos resíduos; ADE: Avaliador dedependência espacial.
A similaridade encontrada entre os componentes principais 1 dos quatro
grupos de variáveis, também pode ser observada ao comparar suas krigagens (Figuras 36,
39, 41 e 43 à direita). Ambas as krigagens apresentam tendência de redução do valor
conforme os círculos são mais internos, ou seja, conforme há redução da APA. Fato a ser
observado também nos grá�cos da esquerda e central na Figura 8.
As krigagens do segundo e do terceiro componentes principais do grupo for-
mado por todas as variáveis (Figuras 37 e 38 à direita), assim como do segundo componente
principal do grupo de variáveis de 13 meses (Figura 40 à direira), do segundo componente
do grupo de variáveis de 25 meses (Figura 42 à direita) e do segundo componente do grupo
de variáveis de 37 meses (Figura 44 à direita), não mostram nenhuma tendência espacial
94
dependente dos círculos, ou de APA, apesar da dependência espacial entre os valores.
Figura 36 - Semivariograma (esquerda) e krigagem (direita) do componente principal 1 do
grupo de todas as variáveis
Figura 37 - Semivariograma (esquerda) e krigagem (direita) do componente principal 2 do
grupo de todas as variáveis
Figura 38 - Semivariograma (esquerda) e krigagem (direita) do componente principal 3 do
grupo de todas as variáveis
95
Figura 39 - Semivariograma (esquerda) e krigagem (direita) do componente principal 1 do
grupo de variáveis de 13 meses
Figura 40 - Semivariograma (esquerda) e krigagem (direita) do componente principal 2 do
grupo de variáveis de 13 meses
Figura 41 - Semivariograma (esquerda) e krigagem (direita) do componente principal 1 do
grupo de variáveis de 25 meses
96
Figura 42 - Semivariograma (esquerda) e krigagem (direita) do componente principal 2 do
grupo de variáveis de 25 meses
Figura 43 - Semivariograma (esquerda) e krigagem (direita) do componente principal 1 do
grupo de variáveis de 37 meses
Figura 44 - Semivariograma (esquerda) e krigagem (direita) do componente principal 2 do
grupo de variáveis de 37 meses
97
Interessados em avaliar o comportamento do primeiro componente principal
ao longo dos períodos, desejamos utilizar análise de medidas repetidas para tal avaliação.
Porém, como em cada período o componente principal está relacionado a autovalores e au-
tovetores diferentes, não podemos considerar os componentes de diferentes períodos como
uma mesma variável, impossibilitando a análise de medidas repetidas. Uma alternativa é
utilizar mesmos autovalor e autovetor para gerar componentes principais modi�cados em
cada período, calculados pelos valores médios dos autovalores e autovetores dos componen-
tes principais originais. Como há grande similaridade entre os autovalores e autovetores
nos diferentes períodos, pouco diferirão as correlações entre os componentes modi�cados
e as variáveis, daquelas entre os componentes originais e as variáveis.
Deste modo, avaliando o primeiro componente principal modi�cado (CP1M)
ao longo dos três períodos por meio da Figura 45, veri�ca-se gra�camente baixa alteração
dos valores de um período para outro, de modo que as proporções entre largura e al-
tura das árvores são estáveis, apresentando mesma tendência observada nas krigagens dos
componentes principais originais 1 (Figuras 36, 39, 41 e 43), ou seja, redução dos valores
conforme os círculos são mais internos.
C1
-2
-1
0
1
2
3
TP
13 25 37
PLOT C1 C2 C3 C4 C5 C6 C7 C8 C9
C10 C11 C12 C13 C14 C15 C16 C17 C18
Figura 45 - Per�s médios de resposta dos escores de CP1M nos círculos ao longo do tempo
A Tabela 28 apresenta os coe�cientes de correlação estimados para cada
variável, entre os períodos, corroborando com a a�rmação de Littell, Henry e Ammerman
(1998), de que medidas tomadas em períodos mais próximos tendem a ser correlacionados
de forma mais forte. O teste de Mauchly foi realizado, rejeitando a hipótese de esfericidade,
assim, a análise univariada de per�l não deve ser realizada para o esquema de parcelas
subdivididas (Tabela 29). Assim, será realizada a análise de per�l multivariada.
98
Ao testar a hipótese nula de per�l horizontal e a hipótese nula de per�l
paralelo para o componente principal 1 modi�cado, por meio dos testes multivariados
Lambda de Wilks, Traço de Pillai, Traço de Hotelling-Lawley e Raiz máxima de Roy,
veri�cou-se que ambos não rejeitaram as hipóteses nulas, indicando a não rejeição da
hipótese de igualdade dos períodos (Tabela 30) e que os efeitos de círculos não interagem
com efeitos de períodos (Tabela 31).
Tabela 28 - Correlações estimadas para CP1 entre os quatro períodos avaliados
13 meses 25 meses 37 meses13 meses 1,0000 0,6871 (<,0001) 0,5334 (<,0001)25 meses 0,6871 (<,0001) 1,0000 0,6263 (<,0001)37 meses 0,5334 (<,0001) 0,6263 (<,0001) 1,0000
Tabela 29 - Teste de esfericidade de Mauchly
Variável Graus de Critério de Estatística de Valor-pliberdade Mauchly (W) Qui-quadrado χ2
CPM1 2 0,9171039 35,738758 <,0001
Tabela 30 - Análise multivariada de CP1M por árvore, no delineamento inteiramente ca-sualizado, testando o efeito nulo de fator período após o plantio
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,9999 0,01 2 413 0,9999Traço de Pillai 0,0001 0,01 2 413 0,9999Traço de Hotelling-Lawley 0,0001 0,01 2 413 0,9999Raiz máxima de Roy 0,0001 0,01 2 413 0,9999
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
Tabela 31 - Análise multivariada de CP1M por árvore, no delineamento inteiramente ca-sualizado, testando o efeito nulo de interação período após o plantio × círculo
Estatística Valor F G.L. Num. G.L. Den. Valor-pLambda de Wilks 0,94328742 0,72 34 826 0,8823Traço de Pillai 0,05742507 0,72 34 828 0,8820Traço de Hotelling-Lawley 0,05936694 0,72 34 738,77 0,8820Raiz máxima de Roy 0,04089869 1,00 17 414 0,4616
G.L. Num.: Graus de liberdade do numerador; G.L. Den.: Graus de liberdade dodenominador.
99
Novamente, por conta do baixo número de períodos avaliados, não se reali-
zou o ajuste por uma função polinomial para o comportamento de cada círculo ao longo
do tempo, impedindo a identi�cação dos efeitos aleatórios e o estudo das matrizes de cova-
riâncias. Vale relembrar que a análise de medidas repetidas pode não ser adequada, pois
a ausência de aleatorização pode não evitar a dependência dos resíduos.
100
101
7 CONSIDERAÇÕES FINAIS
7.1 Conclusões
Por meio da avaliação multivariada, avaliando-se todas as variáveis, é pos-
sível explicar 77,78% da variabilidade inicial dos dados por meio dos três primeiros com-
ponentes principais. O primeiro, que responde por 49,8% da variabilidade se correlaciona
negativamente de forma mediana com as alturas, e positivamente com os demais atributos,
representando a relação entre largura e altura. A análise de agrupamento para os círculos
mostrou que círculos adjacentes são mais similares.
Já a análise geoestatística mostrou que há dependência espacial para todas
as variáveis, de forma que as alturas tendem a ser maiores para círculos mais centrais,
enquanto que as demais variáveis tendem a apresentar valores menores nos círculos mais
centrais. Pertencer a um círculo mais central equivale a ter menor área por árvore.
A análise de medidas repetidas mostrou gra�camente o aumento em todos
os círculos para os valores de todas as variáveis ao longo dos períodos. Por conta da
rejeição da hipótese de esfericidade, a análise univariada de per�l, por meio do esquema
de parcelas subdivididas não pôde ser realizada. Ao realizar a análise multivariada de
per�l, veri�cou-se que ao menos uma combinação de círculos e períodos interage de modo
dependente e rejeitou-se a hipótese sobre a igualdade dos períodos, para todas as variáveis.
Na análise conjunta das metodologias, foram identi�cados componentes prin-
cipais para cada grupo de variáveis por período. Os componentes principais 1 de cada
período apresentaram grande similaridade entre si e também com o primeiro componente
principal do conjunto de todas as variáveis, ao avaliar seus autovalores, autovetores e cor-
relações com as variáveis. Esta similaridade também foi visualizada nas krigagens desses
componentes, mostrando que os componentes tendem a ser menores para círculos mais
centrais. Já para os demais componentes, apesar da existência de dependência espacial,
não houve nenhum padrão identi�cado.
Ao avaliar os componentes principais modi�cados ao longo do tempo,
veri�cou-se que, para cada círculo, eles tendem a permanecer inalterados nos períodos.
Além disso, não se rejeita a hipótese de igualdade dos períodos e não há interação círculo
× período.
Assim, além da análise geoestatística utilizada tradicionalmente para avaliar
dados de experimentos �orestais, também se apresentam como ferramentas importantes
102
a análise multivariada, abordando as variáveis de forma conjunta, e a análise de medi-
das repetidas, abordando o comportamento das variáveis observadas ao longo do tempo.
Além disso, é possível utilizar procedimentos que associam todas estas formas de análise,
sintetizando os resultados e facilitando a interpretação.
7.2 Pesquisas futuras
Pretende-se, por meio dos resultados aqui obtidos, selecionar alguns dos es-
paçamentos, planejar e executar experimento com Canafístula sob delineamento em que
haja aleatorização, obtendo amostras em uma quantidade máxima de períodos, possibili-
tando modelagem com medidas repetidas con�ável e completa. Deste modo, será possível
o ajuste por funções polinomiais por meio de regressão e a identi�cação dos efeitos aleató-
rios e escolha da melhor estrutura de covariâncias. Outras variáveis também poderão ser
incluídas nas análises.
103
REFERÊNCIAS
AKAIKE, H. Information measures and model selection. Bolletin of the InternationalStatistical Institute, Voorburg, v. 50, n. 1, p. 277-291, 1983.
______. Maximum likelihood identi�cation of Gaussian autoregressive moving averagemodels. Biometrika, Cambridge, v. 60, n. 2, p. 255-265, 1973.
AMADOR, J.P. Modelos mistos no ajuste de curvas de crescimento de Ricinuscommunis. 2010. 139 p. Tese (Doutorado em Agronomia) - Universidade Federal de SantaMaria, Santa Maria, 2010.
ANDERSON, T.W. An introduction to multivariate statistical analysis. 2nd ed. NewYork: John Wiley, 1984. 675 p.
ANTONANGELO, A.; BACHA, C.J.C. As fases da silvicultura no Brasil. Revista Brasileirade Economia, Rio de Janeiro, v. 52, n. 1, p. 207-238, 1998.
BALLONI, E.A.; SIMÕES, J.W. O espaçamento de plantio e suas implicações silviculturais.Série Técnica IPEF, Piracicaba, v. 1, n. 3, p. 1-16, 1980.
BOX, G.E.P.; COX, D.R. An analysis of transformations. Journal of the Royal StatisticalSociety. Series B (Methodological), London, v. 26, n. 2, p. 211-252, 1964.
BOZDOGAN, H. Model selection and Akaike's information criterion (AIC): The general theoryand its analytical extensions. Psychometrika, Williamsburg, v. 52, n. 3, p. 345-370, 1987.
BRAGA, R. Plantas do Nordeste, especialmente do Ceará. Fortaleza: DepartamentoNacional de Obras Contra as Secas, 1960. 540 p.
BURROUGH, P.A. Principles of geographical information systems for land resourcesassessment. New York: Oxford University Press, 1986. 220 p.
CAMARGO, E.C.G. Desenvolvimento, implementação e teste de procedimentosgeoestatísticos (krigeagem) no sistema de processamento de informaçõesgeorreferenciadas (Spring). 1997. 123p. Dissertação (Mestrado em Sensoriamento Remoto)- Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 1997.
CAMBARDELLA, C.A.; MOORMAN, T.B.; NOVAK, J.M.; PARKIN, T.B.; KARLEN, D.L;TURCO, R.F.; KONOPKA, A.E. Field-scale variability of soil properties in central Iowa soils.Soil Science Society of America Journal, Madison, v. 58, n. 5, p. 1501-1511, 1994.
CARVALHO, P.E.R. Circular Técnica: Canafístula. Colombo, 2002. 15 p.
CAVALCANTE, M.S.; MONTAGNA, R.G.; LOPEZ, G.A.A.; MUCCI, E.S.F. Durabilidadenatural de madeiras em contato com o solo. In: CONGRESSO NACIONAL SOBREESSÊNCIAS NATIVAS, 2., 1982, Campos do Jordão, Anais... Campos do Jordão: InstitutoFlorestal, 1982. p.1383-1389.
104
CHAPMAN, G.W.; ALLAN, T.G. Técnicas de establecimiento de plantacionesforestales. Roma: FAO, 1978. 183 p.
CORREA, M.P. Dicionário das plantas úteis do Brasil e das exóticas cultivadas. Riode Janeiro: Serviço de Informação Agrícola, v. 3, 1952. 646 p.
CRESSIE, N. Statistics for spatial data. New York: Wiley, 1993. 900 p.
CROVETTO, R.M. Esquema �togeográ�co de la provincia de Misiones (República Argentina).Bonplandia, Corrientes, v. 1, n. 3, p. 171-223, 1963.
CROWDER, M.J.; HAND, D.J. Analysis of Repeated Measures. London: Chapman &Hall. 1990. 257 p.
DAMON, R.A.; HARVEY, W.R. Experimental design, ANOVA, and regression. NewYork: Harper & Row, 1987. 320 p.
DAVID M. Geostatistical ore reserve estimation. Amsterdam: Elsevier, 1977. 364 p.
De KETELAERE, B.; LAMMERTYN, J.; MOLENBERGHS, G.; NICOLAI, B.; DeBAERDEMAEKER, J. Statistical models for analyzing repeated quality measurements ofhorticultural products. Model evalutions and practical example. Mathematical Biosciences,Amsterdam, v. 185, n. 2, p. 169-189, 2003.
DIGGLE, P.J.; RIBEIRO JR., P.J.; CHRISTENSEN, O.F. An introduction to model-basedgeostatistics. In: MOLLER, J. (Ed.). Spatial Statistics and Computational Methods.New York: Springer, 2003. p. 43-86.
DUARTE, J.B. Sobre o emprego e a análise estatística do delineamento em blocosaumentados no melhoramento genético vegetal. 2000. 292p. Tese (Doutorado emGenética e Melhoramento de Plantas) - Escola Superior de Agricultura �Luiz de Queiroz�,Universidade de São Paulo, Piracicaba, 2000.
FARAWAY, J.J. Extending the linear model with R: generalized linear, mixed e�ectsand nonparametric regression models. New York: Chapman & Hall/CRC, 2006. 312 p.
FERNANDEZ, G.C.J. Repeated measure analysis of line-source sprinkler experiments.HortScience, Alexandria, v. 26, n. 4, p. 339-342, 1991.
FERREIRA, D.F. Análise multivariada. Lavras: UFLA, v. 22, 1996. 394 p.
FISHER, R.A. Statistical methods for research workers. Guildford: Genesis PublishingPvt Ltd, 1925. 354 p.
______. The use of multiple measurements in taxonomic problems. Annals of Eugenics,London, v. 7, n. 2, p. 179-188, 1936.
FREITAS, E.G. Análise de dados longitudinais em experimentos com cana-de-açúcar.2007. 70p. Dissertação (Mestrado em Agronomia) - Escola Superior de Agricultura �Luiz de
105
Queiroz�, Universidade de São Paulo, Piracicaba, 2007.
FREITAS, E.G.; BARBIN, D.; BARBOSA, G.V.S.; CARNEIRO, M.S.; BASSINELLO, A.I.Modelo univariado aplicado a dados longitudinais de cana-de-açúcar. Revista Brasileira deBiometria, Jaboticabal, v. 26, n. 2, p. 93-106, 2008.
GAMMA DESIGN SOFTWARE. Gs+: Geostatistics for the Environmental Sciences:V.9.0. Michigan, 2004. 1 CD-ROM.
GOMES, J.E. Desenvolvimento inicial de Tectona grandis L. f (Teca) em área decerrado sob diferentes espaçamentos. 2002. 76p. Dissertação (Mestrado em CiênciasFlorestais) � Universidade Federal de Lavras, Lavras, 2002.
HOTELLING, H. Analysis of a complex of statistical variables into principal components.Journal of educational psychology, Washington, v. 24, n. 6, p. 417-441, 1933.
HURVICH, C.M.; TSAI, C-L. Regression and time series model selection in small samples.Biometrika, Cambridge, v. 76, n. 2, p. 297-307, 1989.
HUYNH, H.; FELDT, L.S. Conditions under which mean square rations in repeatedmeasurements designs have axact F-distributions. Journal of the American StatisticalAssociation, Boston, v. 65. n. 322, p. 1582-1589, 1970.
IBÁ - INDÚSTRIA BRASILEIRA DE ÁRVORES. O Brasil vai dobrar sua produção demadeira plantada. E o mundo também! Disponível em: <http://www.iba.org/>. Acesso em:12 de dezembro de 2015.
INSTITUTO BRASILEIRO DE FLORESTAS. Disponível em:<http://www.ib�orestas.org.br/>. Acesso em: 27 agosto 2015.
ISTCHUK, A.N.; BRITO, M.; FREIBERGER, T.M.M.; FEY, R.; MATOS, M. Efeitos doespaçamento sobre diâmetro do coleto e altura de Peltophorum dubuim (Spreng.) Taub. In:ENCONTRO ANUAL DE INICIAÇÃO CIENTÍFICA, 19., 2010, Guarapuava. Resumos...Guarapuava: Editora UNICENTRO, 2010.
JOHNSON, R.A.; WICHERN, D.W. Applied multivariate statistical analysis. 4th ed.Upper Saddle River: Prentice-Hall, 1999. 800 p.
JOURNEL, A.G.; HUIJBREGTS, C.J. Mining geostatistics. London: Academic Press, 1978.600 p.
KENDALL, M. Multivariate analysis. London: Charles Gri�n, 1975. 309 p.
KHATTREE, R.; NAIK, D.N. Multivariate data reduction and discrimination withSAS software. Cary: SAS Institute, 2000. 574 p.
KÖPPEN, W. Climatologia: con un estudio de los climas de la tierra. México, D.F.:Fondo de Cultura Econômica, 1948. 479 p.
KRIGE, D.G. A statistical approach to some basic mine valuation problems on the
106
Witwatersrand. Journal of the Chemical, Metallurgical and Mining Society of SouthAfrica, Johannesburg, v. 52, n. 6, p. 119-139, 1951.
LANDIM, P.M.B. Sobre Geoestatística e Mapas. Terrae Didática, Campinas, v. 2, n. 1, p.19-33, 2006.
LEVENE, H. Robust Test for Equality of Variances. In: OLKIN. I.; GRURYE, S.G.;HOEFFDING, W.; MADOW, W.G.; MANN, H.B. (Ed.). Contributions to Probability andStatistics: Essays in Honor of Harold Hotteling. California: Stanford University Press,1960. p. 278�292.
LITTELL, R.C.; HENRY, P.R.; AMMERMAN, C.B. Statistical Analysis of Repeated MeasuresData Using SAS Procedures. Journal of Animal Science, Albany, v. 76, n. 4, p. 1216-1231,1998.
LOMBARDO, A. Flora arbórea y arborescente del Uruguay, con clave paradeterminar las especies. Montevideo: Concejo Departamental de Montevideo, 1964. 151 p.
LOPEZ, J.A.; STERRET, W.R.; MCDONALD, M.J. Arboles Comunes del Paraguay:Ñande yvyra máta kuéra. Asunción: Cuerpo de Paz, 1987. 425 p.
MACHADO, R.V. Variabilidade espacial de atributos físico-hídricos em umahidrosequência de solos bem à muito mal drenados, 1994. 88p. Dissertação (Mestradoem Agronomia) - Escola Superior de Agricultura de Lavras, Lavras, 1994.
MAHALANOBIS, P.C. Historical note on the D2-statistic. Sankhya, Kolkata, v. 9, n. 237, p.237-240, 1948.
MANLY, B.F.J. Multivariate statistical methods: a primer. Boca Raton: CRC Press,2004. 224 p.
MATHERON, G. Principles of geostatistics. Economic Geology, Littleton, v. 58, n. 8, p.1246-1266, 1963.
MATOS, F.A. Relações espaciais e crescimento de Canafístula(Peltophorum dubium(Spreng.) Taub.) e biomassa de Urochloa brizantha cv. BRS Piatã em sistemasilvipastoril. 2014. 100p. Tese (Doutorado em Agronomia) - Universidade Federal da GrandeDourados, Dourados, 2014.
MAUCHLY, J.W. Signi�cance Test for Sphericity of a Normal n-Variate Distribution.TheAnnals of Mathematical Statistics, New York, v. 11, n. 2, p. 204-209, 1940.
MCGILL, R.; TUKEY, J.W.; LARSEN, W.A. Variations of box plots. The AmericanStatistician, Athens, v. 32, n. 1, p. 12-16, 1978.
MEREDITH, M.P.; STEHMAN, S.V. Repeated measuresin forestry: focus on analysis ofresponse curves. Canadian Journal of Forest Research, Ottawa, v. 21, n. 7, p. 957-965,1991.
MIRANDA-SALAS, M.; CONDAL, A.R. Importancia del análisis estadístico exploratorio en el
107
proceso de interpolación espacial: caso de estudio Reserva Forestal Valdivia. Bosque, Valdivia,v. 24, n. 2, p. 29-42, 2003.
MOITA NETO, J.M. Estatística multivariada: Uma visão didática-metodológica. Crítica naRede. Disponível em: <http://www.criticanarede.com/cien_estatistica.html>. Acesso em: 13de maio 2014.
MOITA NETO, J.M.; MOITA, G.C. Uma introdução à análise exploratória de dadosmultivariados. Química Nova, São Paulo, v. 21, n. 4, p. 467-469, 1998.
MOOD, A.M.; GRAYBILL, F.A.; BOES, D.C. Introduction to the theory of statistics.New York: McGraw-Hill, 1974. 480 p.
NAMKOONG, G. Application of Nelder's designs in tree improvement research. In:SOUTHERN CONFERENCE ON FOREST TREE IMPROVEMENTE, 8., 1965, Savannah,Proceedings... Savannah: Department of Forestry, 1965. p. 24-37.
NELDER, J.A. New kinds of systematic designs for spacing experiments. Biometrics,Washington, v. 18, n. 3, p. 283-307, 1962.
NOBRE, J.S.; SINGER, J.M. Residuals analysis for linear mixed models. BiometricalJournal, Berlin, v. 49, n. 6, p. 863-875, 2007.
NOGUEIRA, J.C.B. Re�orestamento heterogêneo com essências indígenas. São Paulo:Instituto Florestal, 1977. 71 p.
NOGUEIRA, J.C.B.; SIQUEIRA, A.C.M.F.; MORAIS, E.; COELHO, L.C.C.; MARIANO, G.;KAGEVAMA, P.V.; ZANATTO, A.C.; FIGLlOLlA, M.B. Conservação genética de essênciasnativas através de ensaios de progênie e procedência. Silvicultura em São Paulo. São Paulo,Instituto Florestal, v. 16, n. 2, p. 957-969, 1982.
ODA, M.L. Aplicação de métodos geoestatísticos para identi�cação de dependênciaespacial na análise de dados de um experimento em delineamento sistemático tipo�leque� . 2005. 72p. Dissertação (Mestrado em Agronomia) - Escola Superior de Agricultura�Luiz de Queiroz�, Universidade de São Paulo, Piracicaba, 2005.
OGLIARI, P.J. Modelos não lineares para dados longitudinais provenientes deexperimentos em blocos casualizados. 1998. 156p. Tese (Doutorado em Agronomia) -Escola Superior de Agricultura �Luiz de Queiroz�, Universidade de São Paulo, Piracicaba, 1998.
OLIVEIRA, M.S. Planos amostrais para variáveis espaciais utilizando geoestatística.1991. 100p. Dissertação (Mestrado em Estatística) - Universidade Estadual de Campinas,Campinas, 1991.
PADOIN, V.; FINGER, C.A.G. Relações entre as dimensões da copa e a altura das árvoresdominantes em povoamentos de Pinus taeda L. Ciência Florestal, Santa Maria, v. 20, n. 1, p.95-105, 2010.
PEARSON, K. Principal components analysis. The London, Edinburgh, and DublinPhilosophical Magazine and Journal of Science, London, v. 6, n. 2, p. 559-572, 1901.
108
PENROSE, L.S. Distance, size and shape. Annals of Eugenics, London, v. 17, n. 1, p.337-343, 1952.
PIMENTEL-GOMES, F. Curso de estatística experimental. São Paulo: Nobel, 1970. 430p.
REGAZZI, A.J. Análise multivariada, notas de aula INF 766. Viçosa: Departamento deInformática da Universidade Federal de Viçosa, v. 2, 2000. 76 p.
RIBEIRO, F.A. de L. Aplicação de métodos de análise multivariada no estudo dehidrocarbonetos policíclicos aromáticos. 2001. 174p. Dissertação (Mestrado emFísico-quimica) - Universidade Estadual de Campinas, Campinas, 2001.
RIBEIRO JÚNIOR, P.J. Métodos geoestatísticos no estudo da variabilidade espacialde parâmetros do solo. 1995. 99p. Dissertação (Mestrado em Agronomia) - Escola Superiorde Agricultura �Luiz de Queiroz�, Universidade de São Paulo, Piracicaba, 1995.
ROBERTSON, G.P. GS+: geostatistics for the environmental sciences. Michigan:Gamma Design Software, 1998. 152 p.
ROCHA, E.B. Modelos não-lineares para dados longitudinais provenientes deesperimentos em blocos casualizados abordagem bayesiana. 2010. 96p. Dissertação(Mestrado em Ciências) - Escola Superior de Agricultura �Luiz de Queiroz�,Universidade de SãoPaulo, Piracicaba, 2010.
RUBIN, D.B. Multiple imputation after 18+ years. Journal of the American statisticalAssociation, Boston, v. 91, n. 434, p. 473-489, 1996.
SALVIANO, A.A.C. Variabilidade de atributos de solo e de Crotalaria juncea em solodegradado do município de Piracicaba-SP. 1996. 91p. Tese (Doutorado em Agronomia) -Escola Superior de Agricultura "Luiz de Queiroz", Universidade de São Paulo, Piracicaba, 1996.
SCHAALJE, B.; ZHANG, J.; PANTULA, S.G.; POLLOCK, K.H. Analysis ofrepeated-measurements data from randomized block experiments. Biometrics, Washington, v.47, n. 3, p. 813-824, 1991.
SCHNEIDER, P.R. Introdução ao manejo �orestal. Santa Maria: UFSM. 1993. 348 p.
SCHWARZ, G. Estimating the dimension of a model. The annals of statistics, Beachwood,v. 6, n. 2, p. 461-464, 1978.
SERVIÇO FLORESTAL BRASILEIRO. Recursos �orestais: As �orestas plantadas. Disponívelem: <http://www.�orestal.gov.br/>. Acesso em: 17 de dezembro de 2015.
SHAPIRO, S.S.; WILK, M.B. An analysis of variance test for normality: Complete samples.Biometrika, Cambridge, v. 52, n. 3/4, p. 591-611, 1965.
SILVA, A.P. Variabilidade espacial de atributos físicos do solo. 1988. 105p. Tese(Doutorado em Agronomia) - Escola Superior de Agricultura �Luiz de Queiroz�, Universidade de
109
São Paulo, Piracicaba, 1988.
SNIF - SISTEMA NACINAL DE INFORMAÇÃO FLORESTAL. Produção Florestal: Cadeiaprodutiva. Disponível em: <http://www.�orestal.gov.br>. Acesso em: 12 de dezembro de 2015.
SOUZA, L.C. de. Variabilidade espacial da salinidade de um solo aluvial nosemi-árido paraibano. 1999. 77p. Dissertação (Mestrado em Engenharia Agrícola) -Universidade Federal da Paraíba, Campina Grande, 1999.
SOUZA, L.S. Variabilidade espacial do solo em sistemas de manejo. 1992. 162p. Tese(Doutorado em Agronomia) - Universidade Federal do Rio Grande do Sul, Porto Alegre, 1992.
STATISTICAL ANALYSIS SYSTEM. SAS/STAT user'guide, version 8.0 ed. Cary: 1999.v.1, 943 p.
TOBLER, W.R.A. A transformational view of cartography. The American Cartographer,London, v. 6, n. 2, p. 101-106, 1979.
TONINI, H.; ARCO-VERDE, M.F. Morfologia da copa para avaliar o espaço vital de quatroespécies nativas da Amazônia. Pesquisa Agropecuária Brasileira, Brasília, v. 40, n. 7, p.633-638, 2005.
VIEIRA, F.T.P.A.; SILVA, J.A.A.; FERREIRA, R.L.C.; CRUZ, M.A.O.M.; FERRAZ, I.A.Uma abordagem multivariada em experimentos silvipastoris com Leucaena leucocephala (Lam.)De Wit no Agreste de Pernambuco. Ciência Florestal, Santa Maria, v. 17, n. 4, p. 333-342,2007.
VIEIRA, S.R. Geoestatística em estudos de variabilidade espacial do solo. In: NOVAES, R.S.;ALVAREZ V.H.; SCHAESER, C.E.G.R. (Ed.). Tópicos em Ciências do Solo. Viçosa:Sociedade Brasileira de Ciência do Solo, 2000, cap.1, p.1-54.
WOLFINGER, R. Covariance structure selection in general mixed models. Communicationsin statistics-Simulation and computation, London, v. 22, n. 4, p. 1079-1106, 1993.
XAVIER, L.H. Modelos univariado e multivariado para análise de medidas repetidase veri�cação da acurácia do modelo univariado por meio de simulação. 2000. 91 p.Dissertação (Mestrado em Agronomia) - Escola Superior de Agricultura �Luiz de Queiroz�,Universidade de São Paulo, Piracicaba, 2000.
YAMAMOTO, J.K.; LANDIM; P.M.B. Geoestatística: conceitos e aplicações. São Paulo:O�cina de Textos, 2015. 215 p.
YATES, F. Complex experiments. Supplement to the Journal of the Royal StatisticalSociety, London, v. 2, n. 2, p. 181-247, 1935.