Upload
pedro-sarmento
View
93
Download
1
Embed Size (px)
Citation preview
Universidade de Évora
Curso de Engenharia Biofísica – Ordenamento e Gestão Ambiental
Avaliação da Exactidão Temática de Cartografias de Ocupação do Solo:
Abordagem Aplicada a Mapas Derivados de Imagens de
Satélite de Média Resolução Espacial
Trabalho de fim de curso realizado por
Pedro Alexandre Reis Sarmento
Évora
Junho de 2007
II
“Este trabalho não inclui as observações e críticas feitas pelo júri.”
III
AGRADECIMENTOS
Aos meus pais pelo seu apoio incondicional.
À Xana por ter estado sempre presente nos bons e maus momentos. Sem ti teria sido muito mais
difícil.
Ao professor Mário Caetano por me ter dado a oportunidade de estagiar no Grupo de Detecção
Remota do Instituto Geográfico Português.
Ao Hugo Carrão, meu co-orientador, por todo o apoio prestado na elaboração deste trabalho de fim
de curso.
Ao pessoal do Grupo de Detecção Remota, por todo o apoio prestado durante a realização deste
trabalho.
IV
RESUMO O recente lançamento do satélite ENVISAT, o qual incorpora o sensor MERIS, abriu novas
expectativas na comunidade científica, para a elaboração de cartografias de ocupação do solo a
escalas regionais e globais. A elevada resolução espectral e temporal deste sensor, veio colmatar a
necessidade de produção de cartografia de ocupação do solo, num curto espaço de tempo e com
uma maior exactidão.
A importância da avaliação da exactidão de cartografias de ocupação do solo é um aspecto que
muitas vezes é relegado para segundo plano, influenciando assim negativamente os processos de
tomada de decisão baseados nestas cartografias temáticas, devido ao desconhecimento do erro a
elas inerente. A avaliação da exactidão temática é realizada através do cruzamento dos mapas
produzidos a partir de imagens de satélite com bases de dados de referência, que representam a
“realidade” da superfície terrestre. No entanto, estas bases de dados, construídas através de métodos
de foto-interpretação, nunca representam a realidade com 100% de certeza, devido a vários
aspectos, e.g. confusão entre classes de ocupação de solo, grau de coberto ou fragmentação da
paisagem. Como tal, existe a necessidade da inclusão da incerteza no processo de avaliação da
exactidão de cartografias de ocupação do solo, com o intuito de incorporar a dúvida humana na
classificação da “realidade” nas bases de dados de referência.
Tradicionalmente, a avaliação da exactidão temática de cartografias de ocupação do solo era tratada
utilizando uma abordagem booleana, ou seja, assume-se que cada classe de ocupação do solo é
mutuamente exclusiva e exaustiva do espaço de ocorrência. No entanto, esta abordagem não reflecte
o modo como são representadas nas cartografias a variação e a heterogeneidade da paisagem. Por
outro lado, utilizando uma abordagem fuzzy, consegue-se transmitir muito mais informação aos
utilizadores das cartografias, nomeadamente sobre a magnitude dos erros e a ambiguidade que
existe entre classes de ocupação do solo nelas representadas. Esta abordagem permite também uma
caracterização mais real da paisagem, pois tem em linha de conta as variações e heterogeneidade da
mesma.
Este trabalho tem como objectivo estudar e avaliar a exactidão e qualidade de cartografias de
ocupação do solo derivadas de imagens MERIS, para Portugal Continental, através de uma
abordagem não convencional cuja utilização é sustentada por uma base de dados de referência com
índices de incerteza e de localização para as unidades amostrais. No decurso deste trabalho
demonstrámos que o recurso a funções fuzzy, para a avaliação da exactidão temática de cartografias
de ocupação do solo, em detrimento da abordagem rígida tradicional, permite fornecer mais
informação aos utilizadores sobre as condições ambientais em que os erros estão a ser cometidos.
Os utilizadores destas cartografias podem assim decidir se uma determinada cartografia satisfaz
globalmente as suas necessidades, pois estão mais conscientes do erro e da incerteza inerente ao
processo de produção da cartografia que estão a utilizar.
V
ACRÓNIMOS
AATSR: Advanced Along Track Scanning Radiometer ACP: Análise de Componentes principais
ASAR: Advanced Synthetic Aperture Radar AVHRR: Advanced Very High Resolution Radiometer
CLC: Co-Ordination of Information on the Enviornment
CLC2000: CORINE Land Cover 2000
CMP 1: Componente 1
CMP 2: Componente 2 DGRF: Direcção Geral dos Recursos Florestais
DORIS: Doppler Orbitography and Radio-positioning Integrated by Satellite ESA: European Spatial Agency
ERS: European Remote Sensing Satellite GLC: Global Land Cover
GOMOS: Global Ozone Monitoring by Occultation of Stars GPS: Global Positioning System
IGARSS’2007: International Geoscience and Remote Sensing Symposium 2007 IGBP: International Geosphere-Biosphere Programme
LRR: Laser Retro-Reflector MERIS: Medium Resolution Imaging Spectrometer Instrument
MIPAS: Michelson Interferometer for Passive Atmospheric Sounding MODIS: Moderate Resolution Imaging Spectroradiometer MWR: Microwave Radiometer NDVI: Normalized Difference Vegetation Index
NOAA: National Oceanic & Atmospheric Administration
RA-2: Radar Altimeter SCIAMACHY: SCanning Imaging Absorption spectroMeter for Atmospheric CartograpHY SIG: Sistema de Informação Geográfica
SPOT: Satellite Pour l'Observation de la Terre
UPA: Unidade primária de amostragem
USA: Unidade secundária de amostragem
VI
ÍNDICE GERAL AGRADECIMENTOS ............................................................................................................................. III
RESUMO................................................................................................................................................ IV
ACRÓNIMOS ..........................................................................................................................................V
ÍNDICE GERAL ......................................................................................................................................VI
ÍNDICE DE FIGURAS ..........................................................................................................................VIII
ÍNDICE DE TABELAS ............................................................................................................................ IX
1. INTRODUÇÃO .................................................................................................................................... 1
2. ENQUADRAMENTO METODOLÓGICO ............................................................................................ 5
2.1 Satélites e sensores de média resolução espacial ....................................................................... 5
2.1.1 Satélite ENVISAT .................................................................................................................. 6
2.1.2 Sensor MERIS ....................................................................................................................... 6
2.2 Avaliação da exactidão temática de cartografias de ocupação do solo ....................................... 8
2.2.1 Nível aceitável de exactidão.................................................................................................. 9
2.2.2 Unidade de amostragem ..................................................................................................... 10
2.2.3 Protocolo de amostragem.................................................................................................... 12
2.2.4 Dimensão da amostra.......................................................................................................... 20
2.2.5 Técnicas de análise da exactidão temática de cartografias de ocupação do solo ............. 21
2.2.6 Testes de hipótese .............................................................................................................. 25
2.3 Avaliação da incerteza em cartografias de ocupação do solo.................................................... 25
2.4 Incerteza na avaliação da exactidão temática de cartografias de ocupação do solo................. 29
2.4.1 Atribuição de dois códigos nas amostras de bases de dados de referência ...................... 29
2.4.2 Teoria fuzzy ......................................................................................................................... 30
2.4.3 Escala linguística ................................................................................................................. 31
2.4.4 Funções fuzzy para avaliação da exactidão temática de cartografias de ocupação do solo
...................................................................................................................................................... 32
3. METODOLOGIA................................................................................................................................ 38
3.1 Base de dados de referência ...................................................................................................... 38
3.1.1 Nomenclatura utilizada ........................................................................................................ 38
3.1.2 Unidade amostral................................................................................................................. 39
3.1.3 Dimensão da amostra e protocolo de amostragem ............................................................ 41
3.1.4 Análise estatística da base de dados de referência............................................................ 41
3.2 Selecção temporal da imagem MERIS para produção do mapa de ocupação do solo para teste
da metodologia de validação ............................................................................................................ 42
3.2.1 Classificação mensal da ocupação do solo através do algoritmo da Máxima
Verosimilhança e avaliação da exactidão mensal dos mapas produzidos .................................. 42
3.2.2 Análise exploratória da separabilidade espectral das classes de ocupação do solo em cada
estação do ano ............................................................................................................................. 43
3.3 Avaliação da exactidão da cartografia de ocupação do solo...................................................... 44
VII
3.3.1 Avaliação da exactidão baseada em matrizes de confusão ............................................... 45
3.3.2 Avaliação da qualidade da cartografia produzida baseada em funções fuzzy ................... 45
4. ANÁLISE DE RESULTADOS............................................................................................................ 50
4.1 Análise estatística da base de dados de referência ................................................................... 50
4.1.1 Análise global das classes de ocupação do solo da base de dados de referência ............ 50
4.1.2 Análise dos índices de confiança da base de dados de referência .................................... 52
4.1.3 Análise dos índices de localização da base de dados de referência.................................. 55
4.1.4 Análise das classes de mosaicos da base de dados de referência.................................... 58
4.2 Exactidão global das imagens MERIS validadas com as amostras de treino............................ 60
4.3 Análise estatística multivariada da separabilidade espectral intra-anual das classes de
ocupação do solo .............................................................................................................................. 60
4.3.1 Análise dos descritores estatísticos .................................................................................... 60
4.3.2 Análise factorial discriminante da separabilidade espectral das classes de ocupação do
solo ............................................................................................................................................... 64
4.3.3 Distância entre classes de ocupação do solo ..................................................................... 67
4.4 Avaliação da exactidão temática da cartografia de ocupação do solo....................................... 73
4.4.1 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de
confusão ....................................................................................................................................... 73
4.4.2 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de
confusão, relativamente aos índices e classes de mosaico da base de dados de referência..... 76
4.4.3 Avaliação da qualidade da cartografia de ocupação do solo através de funções fuzzy ..... 82
5. CONCLUSÃO E RECOMENDAÇÕES.............................................................................................. 95
REFERÊNCIAS BIBLIOGRÁFICAS.................................................................................................... 100
ANEXOS.............................................................................................................................................. 106
Anexo 1 ................................................................................................................................................ I
Anexo 2 .............................................................................................................................................. IX
Anexo 3 .............................................................................................................................................XV
Anexo 4 ...........................................................................................................................................XVII
Anexo 5 ..........................................................................................................................................XVIII
Anexo 6 ...........................................................................................................................................XXII
VIII
ÍNDICE DE FIGURAS Figura 1. Satélite ENVISAT. .................................................................................................................... 6
Figura 2. Sensor MERIS.......................................................................................................................... 7
Figura 3. Sistema de varrimento do MERIS............................................................................................ 8
Figura 4. Amostragem aleatória simples............................................................................................... 13
Figura 5. Amostragem sistemática........................................................................................................ 14
Figura 6. Amostragem estratificada. ..................................................................................................... 16
Figura 7. Amostragem por conglomerados. .......................................................................................... 18
Figura 8. Avaliação da exactidão temática de uma cartografia de ocupação do solo. ......................... 22
Figura 9. Representação matemática de uma matriz de confusão. ..................................................... 23
Figura 10. Acumulação do erro em dados de detecção remota ao longo do processo de produção de
cartografia. .................................................................................................................................... 26
Figura 11. Análise do erro. .................................................................................................................... 27
Figura 12. Unidade amostral e sua vizinhança. .................................................................................... 39
Figura 13. Fluxograma do processo metodológico. .............................................................................. 49
Figura 14. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Janeiro. ...... 61
Figura 15. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Abril........... 62
Figura 16. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Agosto........ 63
Figura 17. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Novembro. 63
Figura 18. Componentes 1 e 2 para o mês de Janeiro........................................................................ 64
Figura 19. Componentes 1 e 2 para o mês de Abril. ............................................................................ 65
Figura 20. Componentes 1 e 2 para o mês de Agosto. ........................................................................ 66
Figura 21. Componentes 1 e 2 para o mês de Novembro. ................................................................... 66
Figura 22. Dendrograma para a imagem do mês de Janeiro. .............................................................. 68
Figura 23. Dendrograma para a imagem do mês de Abril. ................................................................... 69
Figura 24. Dendrograma para a imagem do mês de Agosto. ............................................................... 71
Figura 25. Dendrograma para a imagem do mês de Novembro........................................................... 72
IX
ÍNDICE DE TABELAS Tabela 1. Comprimento de onda das 15 bandas do sensor MERIS e suas principais utilizações......... 7
Tabela 2. Características dos métodos de amostragem mais utilizados na avaliação da exactidão
temática de cartografias de ocupação do solo. ............................................................................ 20
Tabela 3. Nomenclatura de ocupação do solo LANDEO, utilizada na classificação da base de dados
de referência. ................................................................................................................................ 39
Tabela 4. Principais características das imagens aéreas utilizadas na elaboração da base de dados
de referência. ................................................................................................................................ 40
Tabela 5. Códigos e índices atribuídos a cada unidade amostral da base de dados de referência. ... 40
Tabela 6. Número de observações da cada classe de ocupação do solo e respectiva frequência
relativa na base de dados de referência. ..................................................................................... 51
Tabela 7. Frequência de cada classe de ocupação de solo relativamente aos índices de confiança. 53
Tabela 8. Frequência de cada classe de ocupação de solo relativamente aos índices de localização.
...................................................................................................................................................... 56
Tabela 9. Frequência de mosaicos em cada classe de ocupação do solo relativamente às classes de
mosaico......................................................................................................................................... 59
Tabela 10. Exactidão global da classificação efectuada de cada imagem MERIS para cada mês do
ano. ............................................................................................................................................... 60
Tabela 11. Matriz de confusão (Classificação do mapa VS CMP 1 das amostras de referência). ...... 73
Tabela 12. Exactidão global da cartografia sem amostras classificadas como mosaicos e só com
amostras classificadas como mosaicos. ...................................................................................... 77
Tabela 13. Exactidão global da cartografia sem amostras classificadas como mosaico, como mosaico
de áreas agrícolas, como mosaico de vegetação e como mosaico de áreas agrícolas/áreas de
vegetação/áreas artificiais. ........................................................................................................... 78
Tabela 14. Exactidão global da cartografia para cada um dos índices de confiança........................... 80
Tabela 15. Exactidão global da cartografia para cada um dos índices de localização. ....................... 81
Tabela 16. Análise da exactidão temática utilizando as funções MAX e RIGHT................................. 83
Tabela 17. Análise da exactidão temática utilizando a função DIFFERENCE. .................................... 85
Tabela 18. Análise da exactidão temática utilizando a função MEMBERSHIP. ................................... 87
Tabela 19. Confusão e ambiguidade das classes de ocupação do solo utilizando as funções
CONFUSION e AMBIGUITY. ....................................................................................................... 89
Introdução
1
1. INTRODUÇÃO
A ocupação do solo é o elemento resultante das interacções que ocorrem entre as variáveis físicas e
biológicas do território, ou seja, é o que resulta da articulação existente entre os processos naturais e
os processos antrópicos. Como tal, é através da análise da ocupação do solo que o Homem pode
inferir sobre os impactos associados à satisfação das suas necessidades, como também quantificar
os recursos que estão à sua disposição. Em nenhuma outra época da existência humana, o Homem
se deparou com tamanha necessidade de gerir os recursos que lhe são disponibilizados e sem os
quais as suas actividades não seriam possíveis. O aumento demográfico é uma realidade, e urge
planear e gerir os recursos disponíveis, sendo assim necessário, para esse processo de gestão e
planeamento, cartografias temáticas de ocupação do solo actualizadas e rigorosas, para que estas
possam ser utilizadas para cumprir os objectivos para os quais foram concebidas.
As cartografias de ocupação do solo são uma das peças fundamentais na elaboração de diversos
planos e estudos, tais como a distribuição espacial e padrões de ocupação do solo, estimação da
área ocupada pelas mais diversas classes de ocupação do solo, análise das alterações da ocupação
do solo, como dado de input para a concepção de modelos hidrológicos e análises de risco (Stheman,
1998; Stheman e Czaplewski, 1998). Para se entenderem as mudanças constantes a que a
ocupação do solo está sujeita a uma escala global ou regional, é necessária a aquisição de um
elevado volume de dados, o qual só é possível através da detecção remota, mais concretamente
através de imagens digitais obtidas por satélites. Só através de imagens de satélite poderemos
produzir cartografias de ocupação do solo que abranjam grandes superfícies, num espaço temporal
reduzido e com um custo que possa ser comportado pelas entidades que são responsáveis pela sua
produção. De facto, os dados obtidos através de satélites são nos dias de hoje uma fonte crescente
de informação usada na produção de cartografia de ocupação do solo (Caetano et al., 2006). Assim
sendo, neste contexto é necessário compreender o conceito de resolução espacial das imagens de
satélite. Segundo Chuvieco (1996), a resolução espacial determina qual o objecto mais pequeno que
pode ser distinguido numa imagem e desempenha um papel muito importante na interpretação visual
da imagem, pois é este aspecto que determina o detalhe que esta pode oferecer. De facto, os
primeiros satélites a serem lançados para o espaço transportavam sensores com resoluções
espaciais muito reduzidas, e o seu período de revisita de um mesmo local era muito longo, não
permitindo por um lado distinguir determinadas características da paisagem que interessava
cartografar, como não permitiam também acumular um grande volume de dados para uma mesma
região (e.g. SPOT). Mais recentemente, foram lançados satélites com elevadas resoluções espaciais
e temporais, como o IKONOS 2 e o QUICKBIRD 2, que já possuem períodos de revisita do mesmo
local muito curtos (cerca de 3 dias). Contudo, estas imagens são muito dispendiosas e não são as
mais adequadas para uma monitorização a escalas regionais e globais da ocupação do solo. Não
existiam assim, satélites com sensores que pudessem corresponder às necessidades de uma
monitorização a uma escala regional-global, com espaços temporais curtos, para uma maior
Introdução
2
compreensão da dinâmica da ocupação do solo a uma escala planetária. Com o objectivo de
colmatar estas necessidades, foi lançado recentemente o satélite ENVISAT (ESA) com o sensor
MERIS a bordo. Este sensor de média resolução espacial, veio complementar as necessidades da
comunidade científica face às alterações ambientais a uma escala regional e global.
Segundo Caetano et al. (2002), as cartografias temáticas de ocupação do solo são uma ferramenta
indispensável em estudos ambientais, na tomada de decisão em ordenamento e planeamento do
território e na definição de políticas de gestão dos recursos naturais. As cartografias de ocupação do
solo assumem assim um papel muito importante na gestão das principais actividades económicas,
resultantes do uso dos recursos naturais (e.g. agricultura, produção florestal, extracção de inertes,
transportes e telecomunicações), tendo como objectivo alcançar a sustentabilidade. É também
importante na caracterização da situação de referência, nomeadamente em estudos de impacte
ambiental, planos de ordenamento do território, caracterização de habitats com interesse para
conservação, cumprimento do Protocolo de Kyoto, e para a construção de modelos climáticos
baseados na interacção da ocupação do solo/atmosfera e nas alterações das diferentes classes de
ocupação do solo.
Contudo, é importante reconhecer vários aspectos relacionados com a produção de cartografias de
ocupação do solo. Segundo Carrão (2002), existem várias questões às quais é necessário dar
resposta: será que a avaliação de uma paisagem sujeita a pressões externas (e.g. pressão urbana,
fogos florestais), poderá ser diferente em função da escala a que essa avaliação é realizada, ou da
unidade mínima cartográfica; e até que ponto estes aspectos técnicos da cartografia poderão
influenciar os processos de tomada de decisão? Realmente, a elaboração de cartografia temática é
sempre um processo de generalização da realidade (Robinson et al., 1978), pois não é possível
representar toda a realidade do território num mapa, e existem sempre aspectos da paisagem que
são omitidos.
Outra das questões chave da produção de cartografias de ocupação do solo é de que estas
cartografias são muitas vezes avaliadas como tendo qualidade insuficiente para a sua utilização em
aplicações operacionais. Segundo Lunetta et al. (1991), os produtos finais disponibilizados aos
utilizadores, têm muito pouca informação acerca da confiança com que os utilizadores podem utilizar
essa informação. Este aspecto limita a confiança com que é implementada uma decisão, sendo assim
da maior importância melhorar os métodos para quantificar os erros associados aos dados e como
estes se propagam ao longo do processo de elaboração de SIG. A avaliação da qualidade temática é
tipicamente baseada numa comparação dos mapas produzidos com um conjunto de amostras com
informação de referência (Foody, 2002). A não existência de acordo entre estes conjuntos de dados é
tradicionalmente interpretada como sendo um erro na cartografia (Congalton, 1991). No entanto, esta
não concordância pode não ser necessariamente devida a erros de classificação. Congalton e Green
(1999) apontam algumas origens que provocam a não concordância entre as cartografias produzidas
e as bases de dados de referência (e.g. problemas de localização das amostras de referência,
Introdução
3
dificuldade na distinção por parte dos foto-intérpretes de determinadas classes de ocupação do solo,
alterações na ocupação do solo entre a data de produção das cartografias e da classificação das
amostras de referência). Assim sendo, é da maior importância uma maior compreensão da origem do
erro e da incerteza no processo de avaliação da exactidão temática de cartografias de ocupação do
solo, com o intuito de fornecer informação mais adequada e detalhada para cumprir os objectivos de
utilização dos potenciais utilizadores de cartografias de ocupação do solo.
Pretende-se com este estudo verificar o potencial de imagens MERIS na elaboração de cartografias
de ocupação do solo, conjugando métodos e índices de avaliação da exactidão temática tradicionais
(matrizes de confusão), com funções que permitam avaliar a exactidão temática através da inclusão
de incerteza (funções fuzzy). Ao optarmos por uma comparação da avaliação da exactidão temática,
recorrendo a estas duas abordagens, pretendemos demonstrar que existem diferenças na avaliação
da exactidão temática quer ao nível global da cartografia, quer ao nível de cada classe de ocupação
do solo da nomenclatura utilizada e comparar ambas as metodologias. Para além dos aspectos
anteriormente referidos, a utilização de funções que incorporam a incerteza na avaliação, permite
uma análise mais detalhada das classes de ocupação do solo, nomeadamente as que mais se
confundem entre si, bem como aquelas em que houve uma maior dificuldade de interpretação por
parte da equipa que recolheu a amostra de referência que serviu de base à avaliação. Assim sendo,
através do conhecimento destes aspectos pretende-se também verificar até que ponto a inclusão da
incerteza no produto final poderá ser benéfica para os potenciais utilizadores de cartografias de
ocupação do solo. De notar que para cumprir os objectivos deste trabalho, foram efectuados vários
estudos paralelos, nomeadamente uma análise estatística de separabilidade espectral das classes de
ocupação do solo e a produção automática de cartografia de ocupação do solo derivada de imagens
MERIS de 2005, fazendo portanto parte integrante do presente trabalho.
A motivação e o interesse da realização deste estudo estão relacionados com o facto de não
existirem muitos trabalhos sobre avaliação da exactidão de cartografias de ocupação do solo em que
são utilizadas metodologias com a incorporação da incerteza (e.g. Gopal e Woodcock,1994;
Woodcock e Gopal, 2000). Desta forma, os estudos inovadores que constituem este trabalho deram
origem a 3 artigos científicos publicados pelo Grupo de Detecção Remota (GDR) do Instituto
Geográfico Português (IGP). Estes estudos abordam: 1) a elaboração de uma base de dados de
referência que foi utilizada para se proceder à avaliação da exactidão e qualidade temática de
cartografia de ocupação do solo; 2) análise exploratória de imagens MERIS para a avaliação da
separabilidade espectral entre classes de ocupação do solo; 3) classificação e avaliação tradicional
de um mapa de ocupação do solo para Portugal Continental derivado de imagens MERIS. Esta
análise prévia irá permitir a selecção da melhor imagem MERIS relativa ao ano de 2005, com o intuito
de se produzir um mapa, através de métodos automáticos, no qual possamos aplicar a nossa
metodologia de validação. Estes artigos podem ser consultados nos Anexos 1 e 2.
Introdução
4
O presente trabalho encontra-se dividido em cinco capítulos. No primeiro capítulo faz-se uma breve
abordagem aos sensores de média resolução e da importância da avaliação da exactidão temática na
produção de cartografias de ocupação do solo. Referem-se também neste capítulo as motivações
que levaram à elaboração deste trabalho.
No segundo capítulo, realiza-se uma revisão bibliográfica sobre o sensor MERIS, o processo de
avaliação da exactidão temática, e aborda-se também a inclusão da incerteza na construção de
bases de dados de referência, como também na avaliação da qualidade de cartografias de ocupação
do solo.
Relativamente ao terceiro capítulo, descrevem-se as metodologias utilizadas na construção de uma
base de dados de referência e os métodos de análise desta base de dados, os métodos utilizados na
análise exploratória de imagens MERIS relativas ao ano de 2005, com o intuito de se escolher a
melhor imagem que servirá de base à produção de uma cartografia de ocupação do solo e finalmente
os métodos utilizados para a avaliação da exactidão e qualidade da cartografia produzida, ou seja
com a inclusão da incerteza e sem a inclusão da incerteza.
No quarto capítulo, apresentam-se os resultados relativos à base de dados de referência,
nomeadamente os dados estatísticos da amostra, uma análise das classes de ocupação do solo que
apresentam maior confusão e incerteza, uma análise das unidades amostrais que apresentam uma
maior heterogeneidade em termos de ocupação do solo e os resultados obtidos da análise
exploratória das imagens de satélite estudadas. Por fim, analisam-se os resultados relativos à
avaliação da exactidão e qualidade da cartografia de ocupação do solo produzida no âmbito deste
trabalho.
No último capítulo, efectua-se uma reflexão geral sobre os resultados deste trabalho, como também
algumas recomendações e sugestões para o desenvolvimento de futuros trabalhos.
Enquadramento metodológico
5
2. ENQUADRAMENTO METODOLÓGICO
2.1 Satélites e sensores de média resolução espacial
A necessidade de produção de cartografia de ocupação do solo com qualidade, precisa e actualizada
é nos dias de hoje, essencial nos processos de tomada de decisão (Araújo e Caetano, 2006). O factor
escala é essencial na informação que pode ser extraída dessa mesma cartografia, devido à
generalização da realidade. Esta generalização é um processo inerente ao processo de produção de
cartografias de ocupação do solo, pois não é possível cartografar a realidade no seu todo. De facto,
Carrão (2002), considera que é fundamental reconhecer que o processo de generalização depende
fundamentalmente do tipo de mapa a produzir, do seu objectivo, da escala original e da variação de
escala pretendida. Geralmente, as escalas de representação tradicionais de cartografias de ocupação
do solo (por pixel) podem ser consideradas regionais e globais (Gerlach et al., 2005); globais,
continentais e regionais (Bagan et al., 2005).
Vários sensores têm vindo a ser utilizados para a obtenção de dados de detecção remota a uma
escala regional e global, tais como o NOAA-AVHRR, LANDSAT ou o SPOT. Para a monitorização de
grandes áreas como a Europa, tradicionalmente recorria-se à interpretação visual de imagens
LANDSAT e SPOT, ou então a algoritmos de classificação automática. Contudo, estes sensores de
satélites apresentam algumas limitações para a produção de cartografia de ocupação do solo,
nomeadamente a escalas regionais. Estas limitações estão relacionadas principalmente com uma
reduzida resolução temporal, sendo por isso muito dispendiosa e morosa a elaboração de
cartografias de ocupação do solo a nível europeu (Clevers et al. 2004). O mesmo autor refere ainda
que a utilização de imagens obtidas pelo sensor NOAA-AVHRR, também não era a ideal, pois a sua
reduzida resolução espacial (pixel com 1 Km2) e espectral (apenas 5 bandas) não permitia a
identificação de determinadas classes de ocupação do solo que seriam importantes cartografar. Outra
das limitações da utilização das imagens LANDSAT e SPOT está relacionada com os períodos de
revisita (resolução temporal) serem muito alargados e o preço das imagens ser também muito
elevado (Freire et al., 2002).
O recente lançamento dos satélites TERRA e AQUA, que incorporam o sensor MODIS e do satélite
ENVISAT, que incorpora o sensor MERIS, vieram preencher a lacuna que existia entre os sensores
de elevada e reduzida resolução espacial, como também permitiu uma cobertura global da superfície
terrestre de imagens com uma elevada frequência (MERIS: 3 dias; MODIS: 1 a 2 dias). Outra das
vantagens destes sensores de média resolução espacial é o facto de possuírem uma elevada
resolução espectral, nomeadamente o sensor MERIS com 15 bandas (Milla et al., 2005). Bagan et al.
(2005), refere que os produtos MODIS, podem ser obtidos sem qualquer custo, podendo substituir as
imagens AVHRR, para a monitorização regional e global das condições ambientais.
Enquadramento metodológico
6
De seguida, apresenta-se o satélite ENVISAT e o sensor MERIS mais detalhadamente.
2.1.1 Satélite ENVISAT
A ESA, lançou a 1 de Março de 2002 o satélite ENVISAT (Figura 1), com vários objectivos (ESA,
2006):
• Dar continuidade às observações iniciadas pelos satélites ERS, incluindo os que obtêm a
informação através de radar;
• Complementar a missão ERS, nomeadamente as missões ligadas aos oceanos e ao gelo;
• Expandir a gama de parâmetros observados, com o objectivo de aumentar o conhecimento
dos factores ligados ao ambiente;
• Dar um contributo importante aos estudos ambientais, nomeadamente na área da química da
atmosfera e estudos do oceano (incluindo a biologia marinha);
• Permitir uma monitorização e gestão mais efectiva dos recursos terrestres;
• Permitir uma melhor compreensão da dinâmica dos processos do planeta Terra.
Figura 1. Satélite ENVISAT (Fonte: ESA, 2006).
O satélite ENVISAT possui um peso de 8211 kg e as suas dimensões em órbita são de 26 m de
comprimento, 10 m de largura e 5 m de altura. O ENVISAT transporta a bordo 11 sensores (ASAR,
MERIS, AATSR, RA-2, MWR, GOMOS, MIPAS, SCIAMACHY, DORIS e LRR). Um destes sensores,
o MERIS, será abordado mais detalhadamente no próximo capítulo. Este satélite orbita a uma altitude
de 800 km, sendo a sua órbita hélio-sincrona e cruzando o equador às 10h00. A sua resolução
temporal absoluta é de 35 dias (ESA, 2006).
2.1.2 Sensor MERIS
O lançamento do sensor MERIS (Figura 2), a bordo do satélite ENVISAT (Figura 1), tem como
principal objectivo contribuir para um maior conhecimento sobre o papel dos oceanos e a sua
Enquadramento metodológico
7
produtividade no sistema climático. Outros objectivos do sensor MERIS estão directamente
relacionados com uma maior compreensão dos parâmetros atmosféricos associados às nuvens,
vapor de água e aerossóis e com os parâmetros relacionados com a superfície terrestre,
nomeadamente os relacionados com a dinâmica da vegetação (ESA, 2005).
Figura 2. Sensor MERIS (Fonte: ESA, 2002).
O MERIS possui 15 bandas espectrais que podem ser programadas em largura e posição(Tabela 1).
Estas 15 bandas, encontram-se distribuídas no espectro electromagnético pela zona do visível e do
infravermelho próximo (390 nm - 1040 nm). A sua resolução espacial pode ser de 300 m ou 1200 m,
sendo a sua resolução radiométrica de 12 bits (ESA, 2005).
Tabela 1. Comprimento de onda das 15 bandas do sensor MERIS e suas principais utilizações (Fonte: ESA, 2005).
Banda Centro (nm) Largura (nm) Principais utilizações 1 412,5 10 Substância amarela e detritos de pigmentos 2 442,5 10 Máximo de absorção pela clorofila 3 490 10 Clorofila e outros pigmentos 4 510 10 Sedimentos em suspensão, marés vermelhas 5 560 10 Mínimo de absorção pela clorofila 6 620 10 Sedimentos em suspensão 7 665 10 Absorção pela clorofila e referência da fluorescência 8 681,25 7,5 Pico de fluorescência da clorofila 9 708,75 10 Referência da fluorescência, correcções atmosféricas
10 753,75 7,5 Vegetação, nuvens 11 760,625 3,75 Banda R de absorção pelo oxigénio 12 778,75 15 Correcções atmosféricas 13 865 20 Vegetação, referência para o vapor de água 14 885 10 Correcções atmosféricas 15 900 10 Vapor de água, terra
O sensor MERIS, possui um campo de visão de 68,5º, tendo as imagens capturadas pelo sensor uma
largura (swath widht) de 1150 km. O MERIS utiliza para a captura das imagens, um sensor do tipo
push-broom scanning ou along track scanning (Figura 3), tendo uma resolução temporal de 3 dias
(ESA, 2005).
Enquadramento metodológico
8
Figura 3. Sistema de varrimento do MERIS (Fonte: ESA, 2004).
Como anteriormente referido, a resolução espacial das imagens MERIS, pode ser de 300 m ou de
1200 m. Assim sendo, são disponibilizados vários produtos com estas resoluções que podem ser
adquiridos através do software EOLI-SA:
• Resolução máxima (Full Resolution-FR) de 300 m;
• Resolução reduzida (Reduced Resolution-RR) de 1200 m.
2.2 Avaliação da exactidão temática de cartografias de ocupação do solo
As cartografias temáticas elaboradas a partir de dados obtidos por detecção remota, antes de
poderem ser utilizados para investigação cientifica e processos de tomada de decisão, devem ser
sujeitos a uma rigorosa avaliação estatística da sua exactidão (Stheman e Czaplewski, 1998). Esta
avaliação da exactidão de cartografias temáticas, nomeadamente de cartografias de ocupação do
solo, assume um papel muito importante na qualidade das cartografias produzidas posteriormente
com base nos dados obtidos a partir de imagens de satélite. Neste contexto, o conhecimento da
exactidão das cartografias e o seu ajustamento à realidade é um assunto chave, considerando o seu
uso em processos de gestão e de tomada de decisão (Caetano et al., 2006). Estimar a exactidão
temática de cartografias de ocupação do solo é assim um factor importante para o utilizador. Só
através do conhecimento do nível de erro das cartografias se pode ter noção do seu real valor e quais
serão as limitações das mesmas, tendo em conta os objectivos para os quais foram elaboradas e
adquiridas. O desconhecimento do nível de exactidão das cartografias temáticas pode levar a erros
nos processos de tomada de decisão, tanto políticos, económicos, como ambientais. Esta
problemática assume ainda um papel mais importante quando estas decisões afectam directamente a
sociedade, ou seja um desconhecimento do erro inerente às cartografias poderá ser determinante
Enquadramento metodológico
9
numa melhor ou pior tomada de decisão. Um uso responsável dos dados geográficos só é assim
possível se a qualidade dessa informação for conhecida (Hashemian et al., 2004).
Segundo Dicks e Lo (1990), ao desenvolver-se o processo de avaliação da exactidão de cartografias
temáticas, deve-se determinar o nível aceitável de exactidão, a dimensão da amostragem, a
estratégia para a selecção das amostras e os métodos a utilizar para avaliar a exactidão das
cartografias de ocupação do solo.
De seguida apresenta-se um resumo dos procedimentos a cumprir na avaliação da exactidão de
cartografias de ocupação do solo.
2.2.1 Nível aceitável de exactidão
O processo de avaliação da exactidão de cartografias de ocupação do solo deve começar com a
definição do nível aceitável de exactidão (Carrão, 2006). A definição do nível aceitável de exactidão
irá influenciar os restantes passos do processo de avaliação da exactidão de cartografias de
ocupação do solo. Consoante o nível de exactidão que se pretende atingir deverá ser implementada
uma ou outra estratégia de amostragem. De facto, uma das questões fundamentais na adopção de
um ou de outro método de amostragem envolve o nível aceitável de exactidão, desde que o nível
aceitável de exactidão, combinado com o nível aceitável de erro, possa ser utilizado para determinar
a dimensão da amostragem (Wulder et al., 2006).
Segundo Anderson et al. (1976), os dados de ocupação e uso do solo derivados de imagens de
satélite, com o objectivo de planeamento e gestão, deverão ter uma exactidão satisfatória quando o
analista efectua uma interpretação correcta 85% a 90% das vezes. De facto, um valor de 85% como
nível de exactidão temática a atingir é amplamente aceite pela comunidade da detecção remota (e.g.
Foody (2002); Reese et al. (2002)).
Apesar do consenso perante este valor, Wulder et al. (2006) levanta várias questões: Será que este
valor de 85% deverá ser o valor atingido por todas as classes ou por apenas algumas classes? Será
que as classes têm todas a mesma importância ou será que há classes que poderão não apresentar
a mesma importância? O valor de exactidão do produto deve depender do objectivo da sua aplicação
(Wulder et al., 2006). De acordo com Wulder et al. (2006), para a obtenção de ganhos substanciais
na eficiência da amostragem de um produto de ocupação de solo com mais de 10 classes de
ocupação do solo, a exactidão de cada classe deve exceder os 70%.
Em determinadas situações é necessário um nível de exactidão mais elevado (e.g. regulação de
actividades ligadas ao uso do solo). Este aumento do nível de exactidão implica necessariamente um
aumento dos custos, o que nem sempre é possível. No entanto, este valor não é muito realista para
Enquadramento metodológico
10
diversas classes de ocupação do solo. Wulder et al. (2006) estabeleceu uma série de exemplos onde
mostra que a exactidão das cartografias de ocupação do solo estão a estabilizar entre os 50% e os
70%. É também importante referir que não existe um valor fixo e que este não deve depender das
imagens e processos de produção, mas sim dos requisitos dos utilizadores.
2.2.2 Unidade de amostragem
A unidade de amostragem nos processos de avaliação da exactidão de cartografias de ocupação do
solo pode ser definida como a unidade de comparação entre a referência e o mapa de ocupação do
solo produzido. Será da comparação da classificação de imagens de satélite obtida através de
métodos automáticos, com a classificação de referência das unidades amostrais que se obterá a
exactidão global das cartografias produzidas. Segundo Stehman e Czaplewski (1998), a unidade de
amostragem pode ser definida como a unidade fundamental na qual a avaliação da exactidão
temática é baseada, ou seja, é a ligação entre a localização espacial no mapa e a localização
correspondente no território.
Segundo Stehman e Czaplewski (1998), existem dois tipos de unidades de amostragem que podem
ser implementadas no processo de avaliação da exactidão de cartografias de ocupação do solo: 1)
unidades de amostragem implementadas sob a forma de pontos; 2) ou sob a forma de áreas,
podendo apresentar este último caso várias extensões e formas. As unidades de amostragem
implementadas como áreas poderão ter a dimensão do pixel da imagem, ou então serem definidas
como polígonos que contenham vários pixels, podendo não estar necessariamente definidas
consoante as características do mapa de ocupação do solo.
A unidade de amostragem deverá ser definida antes da concepção do protocolo de amostragem. Os
vários protocolos de amostragem existentes têm diferentes características e deverão ser utilizados
tendo em conta qualquer um dos dois tipos de unidades de amostragem adoptados (Stehman e
Czaplewski, 1998).
Outro aspecto que importa realçar é a distinção entre a unidade de amostragem e a classe de
ocupação do solo de referência registada nessa mesma unidade. A unidade de amostragem é
apenas uma localização (ponto) ou área no espaço, onde a observação efectuada nessa mesma
amostra é estabelecida na definição do protocolo de amostragem (Stehman e Czaplewski, 1998)., ou
seja, quando é definida a nomenclatura.
De seguida apresentam-se mais detalhadamente algumas características dos tipos de unidades de
amostragem utilizados na avaliação da exactidão de cartografias de ocupação do solo.
Enquadramento metodológico
11
2.2.2.1 Ponto como unidade de amostragem
Estatisticamente, a principal distinção entre a amostragem por pontos e por áreas é de que a primeira
é vista como uma população continua enquanto que a segunda é vista como discreta. Segundo
Moisen et al. (1994), uma população contínua evita a dificuldade na interpretação de uma
amostragem de referência baseada no pixel.
2.2.2.2 Áreas como unidade de amostragem
A unidade amostral definida como uma área pode ser de três tipos: pixels, polígonos ou
conglomerados. Qualquer um destes tipos de amostragem divide a população num número finito de
unidades discretas (Stehman e Czaplewski, 1998). Segundo os mesmos autores, tanto os pixels
como os polígonos, correspondem a estruturas utilizadas nos SIG para representar uma classe de
ocupação do solo, enquanto que os conglomerados não possuem necessariamente esta
correspondência, ou seja, poderão representar mais do que uma classe de ocupação do solo.
A informação ou classificação contida nos pixels deriva da classificação automática de imagens de
satélite, sendo estas unidades homogéneas em tamanho e forma. De facto esta estrutura é
amplamente utilizada nos SIG, sendo também designada como modelo de dados matricial,
nomeadamente ao nível de operações matemáticas que envolvem vários temas, no qual cada pixel
apresenta apenas um valor. O maior ou menor número de pixels está intimamente relacionado com a
resolução espacial das imagens de satélite. Os satélites de grande resolução espacial (e.g. IKONOS,
QUICKBIRD), possuem resoluções espaciais na ordem das dezenas de metro, ou seja, representam
pequenas áreas, mas dividem a população num número finito, mas elevado, de unidades amostrais,
estando por isso mais relacionados com a amostragem por pontos (Stehman e Czaplewski 1998). Por
outro lado, as imagens de satélite de pequena e média resolução espacial (e.g. MERIS, MODIS)
possuem pixels com dimensões na ordem das centenas ou milhares de metros, ou seja, dividem a
população em áreas maiores, mas num número mais reduzido de unidades de amostragem, estando
por isso mais relacionados com a amostragem por áreas.
Os polígonos como unidade amostral diferem dos pixels, pois geralmente são diferentes em forma e
tamanho. Cada polígono representa conceptualmente uma área homogénea de uma classe de
ocupação do solo representada na imagem classificada (polígono digital), ou então pode ser
identificado a partir de fotografia aérea ou vídeo aéreo (polígono foto-interpretado) (Stehman e
Czaplewski, 1998). Este tipo de unidade amostral está associado ao modelo de dados vectorial.
Em relação aos conglomerados, estes diferem dos dois tipos de unidade acima mencionados devido
a não terem que estar necessariamente associados a uma área homogénea relativa a uma classe de
ocupação de solo classificada automaticamente ou a um polígono digitalizado através de foto-
interpretação. Geralmente estes lotes possuem uma forma e área regular. Existem vários exemplos
Enquadramento metodológico
12
da aplicação deste tipo de unidades de amostragem na avaliação da exactidão temática de
cartografias de ocupação do solo (Wickham et al., 2004; Stehman et al., 2003; Wulder et al., 2006).
2.2.3 Protocolo de amostragem
A escolha do protocolo de amostragem é talvez a decisão mais complexa que tem que ser tomada
durante o planeamento do processo de avaliação da exactidão de cartografias (Wulder et al., 2006).
Definir qual o método de amostragem a utilizar é assim uma das fases mais importantes do processo
de avaliação da exactidão temática de cartografias (Congalton e Green 1999). A amostragem é o
protocolo segundo o qual as unidades de amostragem são seleccionadas (Stehman e Czaplewski
1998). Segundo Stehman (2001), o protocolo de amostragem e a análise das suas componentes
estão directamente relacionados com a inferência estatística e por isso motivam os critérios propostos
para um rigor estatístico. O mesmo autor refere também que um protocolo de amostragem é aquele
no qual a inclusão das probabilidades são conhecidas para todos os elementos na amostra e que a
probabilidade é diferente de zero para todos os elementos da população. Stehman e Czaplewski
(1998), referem que uma amostragem probabilística requer que todas as probabilidades incluídas
sejam superiores a zero e que todas estas probabilidades devem ser conhecidas para todas as
unidades de amostragem seleccionadas na área de estudo. Sem esta inclusão e conhecimento da
probabilidade não é possível obter uma avaliação da exactidão temática estatisticamente válida
(Stehman e Czaplewski 1998).
Utilizando agora uma notação estatística, a probabilidade π de um elemento u, designado por (πu) é
definida como a probabilidade de esse elemento u ser incluído na amostra (u pode ser um pixel, um
polígono ou outra unidade amostral escolhida para a avaliação) (Stehman, 2001). Segundo Stehman
(2001), tendo em conta os aspectos acima mencionados, uma população na qual pode ser aplicada
uma inferência estatística rigorosa é aquela em que todos os seus elementos possuem um πu>0. Se
possuírem um πu=0, são excluídos da amostra e consequentemente a inferência estatística não pode
ser aplicada a esses elementos (e.g. realizar uma amostragem no interior de polígonos exclui uma
parte da população de ser amostrada e a inferência não pode ser aplicada aos limites do polígono).
Stehman e Czaplewski (1998), definiram que uma boa regra a aplicar, quando se planeia uma
avaliação da exactidão temática pode ser implementada quando o protocolo de amostragem proposto
não se adequa aos protocolos de amostragem standard, e os seus implementadores não conseguem
especificar as classes com probabilidade diferente de zero. Nestes casos, o protocolo de amostragem
proposto deve ser posto de parte.
Existem cinco métodos de amostragem muito utilizados que podem ser implementados na recolha
dos dados de referência: amostragem aleatória simples, amostragem aleatória estratificada,
amostragem por conglomerados, amostragem sistemática e amostragem sistemática desalinhada
Enquadramento metodológico
13
(Congalton e Green, 1999; Stehman e Czaplewski, 1998). Estes métodos serão abordados mais em
pormenor nos sub-capítulos seguintes.
Foody (2002), refere que os métodos de amostragem simples, tais como a amostragem aleatória
simples, podem ser apropriados para a avaliação da exactidão de cartografias de ocupação do solo
se o tamanho da amostragem fôr grande o suficiente para garantir que todas as classes sejam
adequadamente representadas. A adopção de um método de amostragem simples pode ser também
útil para ir de encontro às necessidades de um vasto leque de utilizadores (Stehman e Czaplewski,
1998), apesar de os objectivos de todos os utilizadores não poderem ser antecipados (Stehman et al.,
2000).
Os aspectos atrás mencionados nem sempre são possíveis de cumprir, pois pode ser muito difícil
utilizar uma amostragem aleatória em grandes áreas e avaliar a exactidão das cartografias. Este
aspecto deve-se muitas vezes ao facto das amostras escolhidas aleatoriamente poderem situar-se
em zonas geograficamente inacessíveis (onde visitas de campo são muito difíceis de concretizar) e
devido a elevados custos de deslocação (Foody 2002). Como alternativa à acessibilidade destes
locais, muitas vezes a amostragem é condicionada e restrita a locais em que é possível obter
imagens de satélite ou imagens aéreas de grande resolução espacial (Edwards et al., 1998 in Foody,
2002). No entanto, nestas situações é necessário escolher aleatoriamente as imagens, para se poder
implementar um determinado protocolo de amostragem.
Seguidamente apresentam-se mais detalhadamente os principais métodos de amostragem utilizados
na avaliação da exactidão de cartografias de ocupação do solo.
2.2.3.1 Amostragem aleatória simples
Numa amostragem aleatória simples (Figura 4), cada unidade de amostragem na área de estudo tem
a mesma probabilidade de ser escolhida (Congalton e Green, 1999).
Figura 4. Amostragem aleatória simples.
Enquadramento metodológico
14
Stehman (1999), refere que este é um método fácil de implementar, pois o cálculo dos estimadores
estatísticos é muito menos complexo quando comparado com outros métodos de amostragem. Este
método de amostragem apresenta também uma elevada flexibilidade, adaptando-se facilmente à
necessidade de um aumento ou uma diminuição do número de amostras, devido a alguma sob ou
sobre estimação dos custos inerentes ao processo de elaboração da amostragem (Stehman, 1999).
Outra das vantagens deste método é a possibilidade das amostras de referência poderem ser
recolhidas simultaneamente (Congalton e Green, 1999).
Contudo, Congalton e Green (1999) afirmam que este método tem a desvantagem de subestimar as
classes com menos representatividade, que também podem ser importantes, a não ser que se
aumente significativamente o número de unidades amostrais. Uma amostragem de um mapa, com
um número adequado de unidades amostrais para cada classe de ocupação do solo é essencial para
determinar adequadamente a exactidão global das cartografias temáticas (Rosenfield et al., 1982).
Stehman (1999), faz referência ao facto de que a amostragem aleatória simples não é espacialmente
bem distribuída, e se esse for um dos critérios prioritários dever-se-á optar por uma amostragem
sistemática ou estratificada, pois obter-se-ão melhores resultados.
2.2.3.2 Amostragem sistemática
A simplicidade e conveniência da amostragem sistemática são extremamente apelativas para os
utilizadores (Stehman, 1992). A amostragem sistemática, segundo Freund e Williams (1972), em
Rosenfield et al. (1982), distribui as unidades amostrais equitativamente por toda a área de estudo e
como tal pode ser tratada como aleatória (Figura 5).
Figura 5. Amostragem sistemática.
No entanto, há alguma controvérsia em relação às propriedades da amostragem sistemática.
Stehman (1992), afirma que essa controvérsia é geralmente devida à não existência de um estimador
não enviesado para o cálculo da variância. Este aspecto leva a uma sobrestimação da variância
Enquadramento metodológico
15
(Stehman e Czaplewski, 1998). Congalton (1988) afirma mesmo que a amostragem sistemática não
pode ser considerada como aleatória, pois todas as partes da área de estudo (e consequentemente
as classes menos representadas) nunca têm a mesma probabilidade de serem escolhidas. De facto,
a não aleatoriedade da amostragem sistemática pode ser considerada, mas apenas quando a
primeira unidade amostral seleccionada não é escolhida aleatoriamente. Contudo em detecção
remota o aspecto atrás referido não se aplica, pois desde que seja aplicada uma amostragem
sistemática em que a primeira unidade amostral seja escolhida aleatoriamente, podemos afirmar que
este tipo de amostragem é aleatória (Stehman, 1992).
A primeira unidade amostral é seleccionada através de um par de números aleatórios, para fixar a
primeira amostra no canto superior esquerdo da área de estudo. Outro par de números aleatórios
determinam as coordenadas horizontais das restantes amostras na primeira coluna e linha da
amostragem. Os intervalos constantes k são iguais aos lados dos quadrados, estabelecendo a
ligação de todas as amostras. Este aspecto facilita as visitas de campo, pois quando a primeira
unidade amostral é escolhida aleatoriamente, as restantes amostras são colocadas a uma distância e
direcção fixas em relação à primeira amostra (Stehman, 1999).
Como a amostragem sistemática distribui mais uniformemente as unidades amostrais pela área de
estudo, Stehman e Czaplewski (1998) afirmam que este método geralmente produz melhores
resultados do que a amostragem aleatória simples. A facilidade de implementação é outra das
vantagens da amostragem sistemática, sendo por isso outra das razões deste método de
amostragem ser amplamente utilizado pela comunidade cientifica (Stehman, 1999). Stehman (1999),
refere ainda que este método permite uma análise simples dos dados e que a pós-estratificação pode
ser combinada com a amostragem sistemática com o objectivo de se obter uma estratégia de
amostragem mais eficiente.
Neste método de amostragem, um maior ou menor valor da variância depende de como o erro está
distribuído espacialmente (Stehman, 1999). Cochran (1977) afirma que se os erros estiverem
localizados em determinadas áreas da população, a amostragem sistemática terá uma menor
variância do que na amostragem aleatória simples, devido à variabilidade na amostragem simples ser
superior, aspecto este que é indesejado. No entanto, se o erro estiver distribuído uniformemente pela
área de estudo, serão obtidos melhores resultados utilizando uma amostragem aleatória estratificada
do que utilizando uma amostragem sistemática (Cochran, 1977), apesar de o cálculo da variância ser
complicado em ambos os métodos de amostragem (Stehman, 1999). A linearidade do erro é assim
um critério importante antes de se optar por uma amostragem sistemática, pois na presença de um
erro distribuído linearmente pela área de estudo, a implementação deste método de amostragem não
é aconselhável, devido aos valores elevados de variância quando comparados com uma amostragem
aleatória simples (Stehman, 1999).
Enquadramento metodológico
16
Na tentativa de minimizar os efeitos da periodicidade do erro (e.g. topografia de um vale, alinhamento
de campos agrícolas), pode ser aplicado uma variação do método de amostragem sistemática,
denominado de amostragem sistemática desalinhada (Cochran, 1977). Este método pode ser visto
como um compromisso entre a amostragem sistemática e a amostragem aleatória simples, ou seja,
se a linearidade do erro estiver presente, a mostragem sistemática desalinhada é menos susceptível
ao erro (Stehman, 1999). No entanto Stehman (1992), refere que a amostragem sistemática
desalinhada diminui a vantagem da amostragem sistemática quando o intervalo das amostras e a
distribuição espacial do erro favorece a amostragem sistemática sobre a amostragem aleatória
simples.
Devido à não existência de um estimador da variância não enviesado para a amostragem sistemática,
Cochran (1977) afirma que devem ser utilizados os estimadores da amostragem aleatória simples e
realizar uma aproximação aos estimadores da amostragem sistemática. A amostragem sistemática é
assim uma opção viável se a aproximação do cálculo da variância for aceitável, porque obter uma
variância reduzida através de um protocolo de amostragem simples é geralmente mais importante do
que uma estimação da variância enviesada (Stehman, 1999).
2.2.3.3 Amostragem aleatória estratificada
A amostragem aleatória estratificada é muito semelhante à amostragem aleatória simples. A
diferença em relação à primeira deve-se ao facto de ser utilizado um conhecimento prévio para dividir
a área de estudo em estratos em que posteriormente cada um destes estratos é amostrado (Figura 6)
(Congalton e Green, 1999).
Figura 6. Amostragem estratificada.
Na avaliação da exactidão temática de cartografias de ocupação do solo, cada estrato representa
uma classe de ocupação do solo. Segundo Stehman (1999), a amostragem estratificada pode ser
utilizada para assegurar que o tamanho da amostra em cada estrato é adequado para satisfazer os
Enquadramento metodológico
17
requisitos de precisão e avaliação de cada classe de ocupação do solo. Esta característica deste tipo
de amostragem é a sua maior vantagem, pois cada classe por mais pequena que seja é sempre
amostrada (Congalton e Green, 1999).
Em comparação com a amostragem aleatória simples, Cochran (1977) afirma que a amostragem
aleatória estratificada apresenta uma diminuição do desvio padrão se as proporções forem bastante
diferentes entre estratos. No entanto, se os estratos forem diferentes regiões geográficas, a exactidão
nas diversas regiões deverá diferir consideravelmente para a amostragem estratificada (Stehman,
1999). De facto, o mesmo autor refere que a necessidade de satisfazer vários objectivos através de
uma multiestratificação é uma tarefa difícil, devido à criação de muitos estratos. Se forem
consideradas muitas regiões como também muitos estratos, este aspecto pode ser problemático no
caso de não existir muita informação de referência disponível. Apesar dos aspectos atrás
mencionados, a utilização de uma amostragem estratificada por regiões geográficas não se traduz
num grande ganho de precisão quando comparada com a amostragem aleatória simples (Cochran,
1977). A estratificação geográfica, pode também ser utilizada para se obter uma amostragem mais
bem distribuída espacialmente. Stehman (1999) refere que as vantagens desta abordagem são
semelhantes às da amostragem sistemática alinhada e amostragem sistemática desalinhada. No
entanto a amostragem estratificada é menos susceptível a perdas de precisão devido à periodicidade
da amostragem sistemática, o que resulta numa diminuição da variância (Stehman, 1999).
Este método de amostragem apresenta alguns inconvenientes. Stehman e Czaplewski (1998),
referem que a amostragem estratificada apenas possibilita a avaliação do mapa que deu origem aos
estratos, como também implica que o mapa em que se pretenda implementar este método de
amostragem esteja disponível à priori. Segundo Stehman e Czaplewski (1998), uma amostragem
estratificada, com uma localização óptima ou igual de todas as unidades amostrais por estrato,
geralmente leva à inclusão de diferentes probabilidades nas unidades de amostragem nos diferentes
estratos (e.g. polígonos maiores têm maior probabilidade de serem amostrados do que polígonos
mais pequenos, tendo por isso também mais probabilidade de serem incluídos na amostra). O
mesmo autor refere ainda que a diferente probabilidade de determinados estratos serem amostrados
pode não ser um problema, desde que essas probabilidades sejam conhecidas e tidas em conta nas
fórmulas de cálculo dos estimadores estatísticos. No entanto, Stehman (1999) refere que as fórmulas
dos estimadores são mais complexas para a amostragem estratificada do que para a amostragem
aleatória simples ou para a amostragem sistemática, o que dificulta a inclusão das probabilidades no
cálculo dos estimadores estatísticos.
2.2.3.4 Amostragem por conglomerados
A amostragem por conglomerados também tem sido frequentemente utilizada na avaliação da
exactidão temática de cartografias de ocupação do solo, nomeadamente por permitir uma rápida
Enquadramento metodológico
18
recolha de informação em muitas unidades amostrais (Congalton e Green, 1999). Segundo Sarndal et
al. (1992), na amostragem por conglomerados a população é agrupada em sub-populações (Figura
7). A amostragem por conglomerados agrupa unidades amostrais em conjuntos, denominados por
conglomerados (Caetano et al., 2006). Segundo Mata et al. (2004), esta técnica de amostragem é
utilizada quando a informação sobre todas as unidades do universo não está disponível.
Figura 7. Amostragem por conglomerados.
Os conglomerados são denominados por unidades primárias de amostragem (UPA), e as unidades
estatísticas ou de amostragem que os constituem são as unidades secundárias de amostragem
(USA) (Mata et al., 2006).
Segundo Caetano et al. (2006), na amostragem por conglomerados, um conglomerado é
seleccionado aleatoriamente e todos os elementos secundários são examinados. Alternativamente,
as USA podem ser também seleccionadas aleatoriamente. Estes métodos de amostragem são
designados respectivamente, por amostragem de conglomerados numa fase e amostragem por
conglomerados em duas fases (Caetano et al., 2006). Ambos os métodos de amostragem por
conglomerados têm sido implementados na avaliação da exactidão de cartografias de ocupação do
solo (Strahler et al., 2006).
Neste método de amostragem a UPA utilizada, é muitas vezes a área definida pelo limite de uma
imagem aérea, tendo como objectivo a redução de custos inerentes às deslocações (Stehman, 2001),
ou também poderão ser utilizados blocos de 3x3 ou 5x5 pixels (Stehman, 1999).
De facto, segundo Strahler et al. (2006), a utilização de uma amostragem por conglomerados deve-se
ao seu menor custo quando comparada com outros métodos de amostragem utilizados na avaliação
da exactidão temática de cartografias de ocupação do solo. Agrupar os pixels de referência reduz o
custo de aquisição dos dados de referência, o tempo de viagem no caso de serem necessárias visitas
Enquadramento metodológico
19
de campo, ou então redução na quantidade e processamento de imagens aéreas, imagens de satélite
de grande resolução ou videografia utilizada no protocolo de amostragem (Strahler et al., 2006). É
menos dispendioso amostrar todos os nove pixels definidos como uma UPA, i.e. um conglomerado de
3x3 pixels, do que amostrar nove pixels distribuídos aleatoriamente pela área de estudo (Stehman e
Czaplewski, 1998). A proximidade espacial das USA amostradas em cada uma das UPA, permite um
maior número de unidades amostrais por um custo mais reduzido, quando comparado com a
amostragem aleatória simples ou a amostragem sistemática (Stehman, 1999).
Este método de amostragem também possui algumas desvantagens. Apesar da relação custo-
benefício na amostragem por conglomerados ser a sua principal vantagem, este aspecto implica uma
diminuição da consistência estatística, devido à correlação espacial do erro existente entre as
amostras contidas na UPA, provocando um aumento do valor da variância da estimativa do erro
(Cochran, 1977), como também um aumento da complexidade da fórmula do desvio-padrão
(Stehman e Czaplewski,1998). No entanto, Stehman (1999) refere que através do uso de uma
amostragem por conglomerados em duas fases existe um compromisso entre a forte relação espacial
das USA na amostragem por conglomerados de uma fase e a fraca relação espacial da amostragem
aleatória simples e a amostragem sistemática. Apesar deste aspecto favorável também é necessário
ter em conta que a aplicação de uma amostragem por conglomerados de duas fases implica
necessariamente um aumento do número de UPA e consequentemente um maior número de
unidades amostrais, o que provoca um aumento do custo da amostragem (Stehman, 1999). Outro
aspecto negativo da aplicação do método de amostragem por conglomerados em duas fases é de
que as fórmulas do cálculo da variância são mais complexas, como também menos familiares para os
utilizadores, quando comparadas com métodos de amostragem mais simples (Stehman, 1999).
De seguida apresenta-se um quadro resumo dos principais métodos de amostragem utilizados na
avaliação da exactidão de cartografias de ocupação do solo.
Enquadramento metodológico
20
Tabela 2. Características dos métodos de amostragem mais utilizados na avaliação da exactidão temática de cartografias de ocupação do solo (Fonte: Stehman, 1999).
Método Simplicidade analitica Variância Cálculo da
variância Distribuição
espacial Controlo espacial
Aleatória simples Elevada Elevada, a não ser quando combinada com métodos
de cálculo mais complexos Simples Pobre Nenhum
Sistemática Elevadaa Reduzida, a não ser quando utilizada com
periodicidade
Simples, mas enviesada Muito boa Nenhum
Aleatória estratificada
Por ocupação de solo Moderadab
Reduzida para cada estrato, moderada a elevada no global
Moderado Pobrec Nenhum
Pela geografia Moderadab Moderada Moderado Muito boa Reduzidod
Conglomerados
Uma fase Elevada Elevada, a não ser que a correlação espacial seja
reduzida Difícil Pobre a
moderadae Moderado
Duas fases Elevadaf Moderada, mesmo com uma correlação espacial
reduzida Difícil Moderada a
boag Muito elevado
Legenda: a Amostragem sistemática de polígonos resultante da inclusão de diferentes probabilidades e de uma análise mais complexa. b Elevada simplicidade se uma localização proporcional fôr utilizada. c Boa se as classes de ocupação de solo estiverem fortemente relacionadas com as regiões geográficas. d Elevada se uma localização desalinhada fôr utilizada e o esforço da amostragem fôr dirigido para apenas alguns estratos. e Pobre se as UPA forem seleccionadas através de uma amostragem aleatória simples, moderada se as UPA forem
seleccionadas através de uma amostragem sistemática ou através de uma estratificação geográfica. f Difícil se na segunda fase as probabilidades não forem iguais g Moderada se as UPA forem seleccionadas através de uma amostragem aleatória simples, boa se as UPA forem
seleccionadas através de uma amostragem sistemática ou através de uma estratificação geográfica.
2.2.4 Dimensão da amostra
Para que a avaliação da exactidão temática de cartografias de ocupação do solo seja
estatisticamente válida é necessária a recolha de um número adequado de unidades amostrais para
cada classe de ocupação do solo (Congalton e Green, 1999). Segundo Dicks e Lo (1990) quanto
maior fôr a dimensão da amostra, maior será a confiança na exactidão estimada através dessa
amostra. No entanto, é necessário encontrar um compromisso entre o número de unidades amostrais
necessárias e o custo da obtenção da informação de referência para essas mesmas unidades.
Cochran (1977), refere que uma amostra muito grande implica um desperdício de recursos e que uma
amostragem muito pequena diminui a utilidade dos resultados. É assim necessário encontrar uma
relação custo benefício para determinar a dimensão da amostra. Segundo Dicks e Lo (1990), antes
de ser escolhida a dimensão da amostra, deve-se ter em conta qual o nível de exactidão global e o
nível de exactidão por classe de ocupação do solo que se pretende atingir.
Segundo Congalton e Green (1999), os investigadores têm utilizado para a determinação da
dimensão da amostra, uma equação baseada na distribuição binomial ou na distribuição binomial
Enquadramento metodológico
21
aproximada à distribuição normal. Os mesmos autores afirmam também que a escolha da dimensão
da amostra, baseada nas distribuições acima referidas, devem estar dependentes de dois aspectos:
i) o nível aceitável de exactidão;
ii) o nível de confiança da estimativa.
Levando em linha de conta os aspectos acima referidos, a dimensão da amostra deve depender do
risco aceitável que o produtor está disposto a correr. O risco do produtor para a avaliação da
exactidão temática tem sido balizado para valores de 90%, 95% e 99% (Aronoff, 1985).
Congalton e Green (1999), referem que o número mínimo de unidades amostrais que se devem
recolher, tendo em conta as condicionantes práticas, é de 50 unidades amostrais para cada categoria
de ocupação do solo. No entanto, se a nomenclatura de ocupação do solo utilizada contemplar mais
de 12 classes de ocupação do solo, o número mínimo de unidades amostrais recolhidas deve ser
aumentado para 75 a 100 (Congalton e Green ,1999). Stehman (2001), refere também que para a
avaliação da exactidão temática de cartografias de ocupação do solo, uma amostra com 100
unidades amostrais por classe assegura que a exactidão possa ser estimada com um desvio padrão
não superior a 0,05. Apesar deste aspecto, este valor mínimo de unidades amostrais por classe de
ocupação do solo pode variar consoante a importância da avaliação de determinadas classes de
ocupação do solo. Pode ser mais útil aumentar o número de unidades amostrais relativas a uma
classe de ocupação do solo e diminuir o número de unidades amostrais relativas a uma classe de
ocupação do solo menos importante (Congalton e Green, 1999; Stehman, 2001).
2.2.5 Técnicas de análise da exactidão temática de cartografias de ocupação do solo
2.2.5.1 Matriz de confusão
O principal objectivo da avaliação da exactidão temática de cartografias de ocupação do solo é
estimar a proporção da área correctamente classificada para cada classe de ocupação do solo, como
também o intervalo de confiança dos índices de exactidão para cada uma dessas classes (Carrão,
2006). Story e Congalton (1986), referem que o modo mais utilizado para o cálculo da exactidão de
cartografias produzidas a partir de imagens de satélite é através da comparação das áreas de um
mapa com uma base de dados de referência. O método mais utilizado para representar esta
comparação é através da elaboração de uma matriz de confusão, em que geralmente os dados de
referência são representados nas colunas e são comparados com os dados do mapa classificado,
representados geralmente nas linhas da matriz. Os valores na diagonal da matriz indicam o acordo
que existe entre ambos os conjuntos de dados, ou seja, entre o mapa classificado e os dados de
referência. A exactidão global da cartografia é então calculada através da divisão do somatório das
Enquadramento metodológico
22
amostras correctamente classificadas com o número total de amostras (Story e Congalton, 1986). Na
Figura 8, pode ser observado um exemplo da avaliação da exactidão de cartografias de ocupação do
solo, com recurso a uma matriz de confusão.
Figura 8. Avaliação da exactidão temática de uma cartografia de ocupação do solo (Fonte: Congalton e Green, 1999).
Congalton e Green (1999) afirmam que a matriz de confusão (Figura 9) é um método bastante válido
para representar a exactidão dos mapas, pois a exactidão de cada classe de ocupação do solo é
exibida individualmente. O método mais aceite para avaliar a exactidão de cada classe de ocupação
do solo é através da divisão do número de unidades amostrais correctamente classificadas nessa
classe, pelo número total de amostras dessa mesma classe identificadas no mapa (Story e
Congalton, 1986). Contudo, o mesmo autor refere um método alternativo, no qual se divide o número
de unidades amostrais correctamente classificadas, pelo número total de unidades amostrais na
realidade. Neste contexto é então necessário compreender ambos estes métodos, pois podem
resultar em avaliações da exactidão muito diferentes.
Segundo Story e Congalton (1986), no método de cálculo tradicionalmente utilizado na avaliação da
exactidão, o número de unidades amostrais correctamente classificadas (nkk) é dividido pelo número
total das unidades amostrais de referência (total da coluna), ou seja, por n+k. Essa percentagem,
representa a probabilidade das unidades amostrais de referência serem bem classificadas, ou seja,
estão a ser medidos os erros de omissão. Os erros de omissão acontecem quando é excluída uma
Enquadramento metodológico
23
área no mapa pertencente a uma classe de ocupação do solo (Congalton e Green, 1999). Este valor
de exactidão é denominado de exactidão do produtor e indica ao produtor da cartografia como pode
estar correctamente classificada uma área especifica do terreno.
Por outro lado quando o número total de unidades amostrais correctamente classificadas (nkk) de uma
determinada classe de ocupação do solo é dividida pelo número total de unidades amostrais
classificadas no mapa dessa mesma classe de ocupação do solo (nk+), o resultado obtido indica a
probabilidade de uma unidade amostral classificada no mapa representar essa mesma classe na
realidade. Neste caso estão a ser medidos erros de comissão. Os erros de comissão podem ser
definidos como a inclusão de uma área no mapa, numa classe de ocupação do solo na qual essa
área não poderia ter sido incluída (Congalton e Green, 1999). Este valor pode também ser definido
como a exactidão do utilizador, ou seja, indica como o mapa representa a realidade. Um exemplo do
cálculo dos índices anteriormente referidos podem ser observados na Figura 8.
No próximo sub-capítulo, faz-se uma descrição dos índices de exactidão temática, tendo em conta
uma representação matemática da matriz de confusão (Figura 9).
Figura 9. Representação matemática de uma matriz de confusão (Fonte: Congalton e Green, 1999).
2.2.5.2 Índices para estimar a exactidão temática
Neste sub-capítulo irão ser apresentadas algumas técnicas de análise que podem ser realizadas a
partir da matriz de confusão. Estas técnicas demonstram o quão poderosa é a matriz de confusão e
porque deverá ser esta matriz incluída em qualquer processo de avaliação da exactidão de
cartografias (Congalton e Green, 1999). Contudo, Stehman (1997) afirma que nenhum índice de
exactidão é universalmente adequado na avaliação da exactidão temática e que diferentes índices de
exactidão podem levar a conclusões conflituosas, pois esses índices não representam a exactidão da
mesma maneira. Escolher os índices de exactidão apropriados que permitam elucidar os utilizadores
das cartografias se os objectivos exigidos por estes foram atingidos, é um aspecto fundamental no
processo de avaliação da exactidão de cartografias de ocupação do solo. Os índices de exactidão
Enquadramento metodológico
24
temática mais comuns são o índice de exactidão global, índice de exactidão do produtor e o índice de
exactidão do utilizador.
Índice de exactidão global
Este índice é o mais comum e reflecte a proporção de área correctamente classificada (Stehman,
1997), em que nii representa o número de unidades amostrais correctamente classificadas para cada
classe de ocupação do solo e n a dimensão da amostra.
Equação 1. Índice de exactidão global.
Índice de exactidão do produtor
O índice de exactidão do produtor para uma classe de ocupação do solo j, indicando qual a
probabilidade de uma área classificada como uma classe de ocupação do solo j, nos dados de
referência é classificada como j, no mapa produzido (Stehman, 1997).
Equação 2. Índice de exactidão do produtor.
Índice de exactidão do utilizador
Este índice reflecte a exactidão do utilizador para uma classe de ocupação de solo i, indicando qual a
probabilidade de uma área classificada como i pelo mapa produzido é classificada como i, nos dados
de referência (Stehman, 1997).
Equação 3. Índice de exactidão do utilizador.
A exactidão global, do produtor e do utilizador, podem ser calculadas através dos totais marginais da
matriz de confusão e como tal podem ser estimadas a partir do estimador de Horvitz-Thomson (HT)
(Carrão, 2006).
Enquadramento metodológico
25
2.2.6 Testes de hipótese
O cálculo da avaliação da exactidão temática, pode ser visto como um teste de hipótese (Aronoff,
1982). O mesmo autor refere que o teste de hipóteses coloca o problema sob a forma de duas
escolhas exclusivas:
i) Hipótese nula (H0): o mapa é menos exacto do que o pretendido;
ii) Hipótese alternativa (H1): a exactidão do mapa é igual ou superior à pretendida.
O objectivo é realizar uma avaliação da verdadeira exactidão do mapa, mais concretamente
estabelecer um valor mínimo de exactidão, com um elevado nível de confiança (e.g. uma exactidão
mínima de 80% com um nível de confiança de 95%, mesmo que a exactidão estimada seja inferior a
80%). O teste de hipótese indica se o mapa está suficientemente exacto ou não, dependendo se
passou ou não no teste. Este teste é baseado na distribuição binomial, onde cada ponto discreto é
avaliado como correcto ou incorrecto. Outro aspecto a salientar é de que se o número de unidades
amostrais fôr superior a 30, realiza-se uma aproximação da distribuição binomial à distribuição
normal, pois esta aproximação permite uma simplificação do cálculo com a obtenção de resultados
bastante precisos.
No resultado deste teste, podem ser obtidos dois tipos de decisões: correctas e incorrectas (Aronoff,
1982). Os dois tipos de decisões correctas são:
i) aceitar um mapa com uma exactidão suficiente;
ii) rejeitar um mapa
Os dois tipos de decisões incorrectas são:
i) aceitar um mapa, denominado de risco do utilizador;
ii) rejeitar um mapa com a exactidão suficiente, denominado de risco do produtor.
Os termos risco do produtor e risco do utilizador, são dois termos estatísticos derivados de um ramo
da estatística denominado de aceitação da amostragem. Estes termos são amplamente utilizados na
indústria produtiva, nomeadamente no controlo de qualidade.
2.3 Avaliação da incerteza em cartografias de ocupação do solo
A incerteza e o erro são dois aspectos indissociáveis dos dados espaciais (Liu et al., 2004).
Tradicionalmente, o erro é visto como sendo “mau” (Burroughs e McDonnell, 1998). Contudo, os
mesmos autores afirmam também que esta é uma ideia errada, na medida em que a análise da
Enquadramento metodológico
26
incerteza e do erro permite o conhecimento da sua origem, podendo assim estudar-se a
implementação de metodologias para a gestão destes dois aspectos nas bases de dados espaciais.
Lunetta et al. (1991), afirmam que a integração de dados obtidos através de detecção remota num
SIG para produção de cartografia, incluem os seguintes procedimentos: aquisição dos dados,
processamento dos dados, análise dos dados, conversão dos dados, avaliação do erro e a
representação do produto final. Assim sendo, o erro pode ser transferido de procedimento em
procedimento, com o desconhecimento do analista, até que o erro se manifesta no produto final
(Lunetta et al.,1991). Na Figura 10, podemos observar as fontes de erro e a sua acumulação ao longo
do processo de produção de cartografia, com base em dados de detecção remota.
Figura 10. Acumulação do erro em dados de detecção remota ao longo do processo de produção de cartografia (Fonte: Lunetta et al., 1991).
Os erros nos dados espaciais, podem ter várias origens, como também podem surgir em qualquer
altura do processo de avaliação da exactidão de cartografias. Mais concretamente, na fase de análise
podem ocorrer erros de percepção (e.g. erros na foto-interpretação), erros de localização (e.g.
diferença na localização de um pixel numa imagem, e a respectiva amostra de referência); erros na
escolha da projecção geométrica e do esferóide da cartografia; erros derivados da inclusão de
enviesamento no processo de aquisição dos dados (e.g. a não utilização das técnicas de amostragem
mais adequadas, devido a uma restrição do custo relativo ao processo de avaliação da exactidão);
erros derivados do tratamento de fenómenos como contínuos, quando são dados discretos (e.g.
tamanho da amostra e distribuição espacial da amostra); utilização de métodos matemáticos que
podem envolver erros no cálculo da avaliação (Burroughs e McDonnell, 1998).
Enquadramento metodológico
27
No geral, a avaliação do erro em projectos de detecção remota é apenas efectuada na fase de
análise dos dados e contempla apenas uma análise do erro relacionado com as classes temáticas e
com a georreferenciação dos mapas finais (Lunetta et al.,1991). Na Figura 11, pode ser observada
uma das abordagens comuns utilizadas para a avaliação do erro.
Figura 11. Análise do erro (Adaptado de Lunetta et al., 1991).
Segundo Lunetta et al. (1991), a exactidão relativa à localização refere-se à qualidade com que os
algoritmos de georreferenciação colocam correctamente os pixels das imagens numa determinada
projecção. Por outro lado, a avaliação da exactidão temática é muitas vezes efectuada como sendo
um processo paralelo aos projectos, em vez de ser parte integrante destes. Muitos estudos reportam
apenas um índice para expressar a exactidão da classificação da cartografia, enquanto que a
exactidão relativa à localização é omitida. Assim sendo, é apenas quantificado o erro relativo a cada
classe de ocupação de solo, não se tendo em conta os erros relativos à localização (Lunetta et al.,
1991).
Em relação à amostra e como foi referido no capítulo anterior, a escolha da dimensão da amostra e
do método de amostragem, são dois aspectos fundamentais na avaliação da exactidão de
cartografias temáticas. A implementação de um protocolo de amostragem sem o devido cuidado e
sem o conhecimento devido das suas limitações e qualidades, pode originar uma sob ou sobre
estimação dos índices de exactidão e consequentemente fornecer informações erradas sobre a
verdadeira qualidade dos mapas (Lunetta et al., 1991).
A correlação espacial é também um aspecto fundamental no maior ou menor erro associado à
avaliação da exactidão temática. Segundo Lunetta et al. (1991), esta condição é importante, pois
Localização
Verificação Esquema de amostragem Dimensão da amostragem
Classes temáticas
RMSE ou medidas de exactidão
Matriz de erro
Estatística discreta multivariada
Reporte
Enquadramento metodológico
28
permite verificar se um erro numa determinada localização afecta negativa ou positivamente os erros
nas localizações envolventes.
Em detecção remota, a exactidão da localização pode ser reportada como o erro médio quadrático
(RMSE), que é derivado de algoritmos de georreferenciação. Este índice reflecte a proporção ou o
número de pixels nos quais os pontos de controlo da imagem diferem dos pontos de referência do
mapa. No entanto, o RMSE não reflecte a exactidão da localização de todos os pixels da imagem,
mas apenas a exactidão dos pontos de controlo do mapa. O método mais eficaz para determinar a
exactidão relativa à localização, é através da utilização de GPS. Contudo este método geralmente
envolve um elevado custo para a sua implementação (Lunetta et al., 1991).
Em termos gerais, a “incerteza” significa a falta de certeza ou de conhecimento definitivo de um
resultado. O termo “incerteza” refere-se às diferenças entre a informação proveniente de uma base
de dados e a informação correspondente que está disponível para um utilizador que esteja apto para
observar e medir a realidade directamente. A “incerteza” inclui os erros inerentes ao processo da
elaboração de bases de dados, como também a perda de informação que ocorre durante a sua
generalização (e.g. um mapa pode mostrar uma área como sendo uma classe de ocupação do solo
uniforme, mas apesar disso essa área não é realmente uniforme) (Hunter et al., 1995). Segundo
Heuvelink (1993) in Wel (2000), a incerteza pode ser considerada como a falta de confiança sobre o
“verdadeiro valor” de uma característica particular dos dados.
No capítulo anterior foi referido que a elaboração de matrizes de confusão, para a avaliação da
exactidão de cartografias de ocupação do solo, tem como objectivo a determinação do erro inerente à
cartografia produzida. Por outras palavras, a elaboração de matrizes de confusão permite verificar as
diferenças entre a classificação de uma base de dados de referência e a classificação de um mapa
produzido automaticamente, ou seja, o erro do mapa. No entanto Congalton e Green (1993) afirmam
que nem todas estas diferenças se devem a erros de classificação ou de delimitação. Os mesmos
autores referem vários factores que podem originar confusão entre as bases de dados de referência e
os mapas produzidos:
i) Diferenças de registo entre os dados de referência e a classificação do mapa produzido;
ii) Erros de digitalização na delimitação das amostras de referência;
iii) Erros de entrada de dados na elaboração de bases de dados de referência;
iv) Erros na interpretação e digitalização dos dados de referência;
v) Alterações na ocupação do solo entre a data de produção do mapa e a data de produção
da base de dados de referência, ou seja, o erro temporal (e.g. alterações devido a
incêndios ou desenvolvimento urbano);
vi) Variações na classificação e delimitação dos dados de referência, devido à inconsistência
na interpretação de áreas heterogéneas;
vii) Erros na classificação do mapa;
Enquadramento metodológico
29
viii) Erros na delimitação das classes de ocupação do solo no mapa.
Segundo Goodchild et al. (1993), existem três formas de abordar a incerteza em bases de dados
espaciais:
i) ocultar qualquer tipo de referência à incerteza;
ii) inclusão de um índice(s) ou descritor(es) que quantifique a incerteza e seja
disponibilizado aos utilizadores das bases de dados;
iii) produzir amostras dos vários mapas produzidos e mostrar uma escala de incerteza para
os vários mapas.
A primeira opção aborda o problema ignorando-o e é sem dúvida a solução mais fácil de
implementar. No entanto, esta abordagem pode pôr em risco a decisão dos intervenientes nos
processos de tomada de decisão, pois estes têm que decidir baseados na informação disponibilizada.
A segunda opção, aborda o problema, incluindo o uso de descritores da “incerteza”, tais como bandas
épsilon, matrizes de confusão, diagramas de confiança ou o erro médio quadrático. De facto estes
descritores servem como um aviso para os utilizadores acerca da incerteza das bases de dados
espaciais. No entanto, estes descritores são de pouca utilidade para o utilizador, na medida em que
não conseguem mostrar a variação espacial da “incerteza” no produto final. Na terceira e última
opção, diferentes versões do mesmo mapa com a inclusão da “incerteza” podem ser apresentadas
aos utilizadores. Esta opção permite comunicar a incerteza e “educar” o utilizador acerca da
importância deste assunto. Apresentando o nível de incerteza a que o produto disponibilizado ao
utilizador está sujeito, permite que os agentes envolvidos no processo de tomada de decisão o façam
de forma mais consciente.
De seguida apresentam-se alguns métodos para lidar com a incerteza em bases de dados de
referência.
2.4 Incerteza na avaliação da exactidão temática de cartografias de ocupação do solo
2.4.1 Atribuição de dois códigos nas amostras de bases de dados de referência
Durante a elaboração de bases de dados de referência, os técnicos têm que decidir qual a classe de
ocupação do solo a que pertence uma determinada área, seja em visitas de campo ou através de foto
interpretação. No entanto, a decisão que o técnico tem que tomar nem sempre é fácil, como também
nem sempre traduz a verdadeira classe de ocupação do solo da área analisada. De facto, as
cartografias obtidas a partir de dados de detecção remota, têm frequentemente mais informação do
Enquadramento metodológico
30
que a classe de ocupação do solo atribuída a uma determinada área (Woodcock et al., 1996). A
dificuldade dos técnicos em atribuir uma determinada classe de ocupação do solo a uma determinada
área deve-se a diversos factores: áreas em que existe mais do que uma classe de ocupação do solo
(fragmentação da paisagem), a existência de sub-coberto, mistura espectral. Woodcock et al. (1996),
sugerem que uma das formas de ultrapassar este problema é a atribuição de classificações
secundárias, ou seja atribuir rótulos secundários às áreas em causa. O mesmo autor refere que a
primeira classificação atribuída a uma área é uma agregação que suaviza o erro que ocorre ao nível
do pixel. A atribuição de uma classificação secundária, permite também uma agregação, mas agora
ao nível do pixel. Logicamente, as classificações secundárias serão no geral menos exactas do que
as primárias.
Para a atribuição de uma classificação secundária é necessária a elaboração de uma escala
linguística que reflicta a adequabilidade dessa classificação à área em causa. Esta escala é utilizada
para verificar qual a classificação mais adequada em cada área, e assim poder-se inferir sobre a
classificação mais correcta, ou seja, a classificação primária ou a secundária. Woodcock et al. (1996)
desenvolveram uma escala linguística, tendo como objectivo a avaliação das classificações atribuídas
pelos técnicos em cada uma das áreas interpretadas no campo.
2.4.2 Teoria fuzzy
Tradicionalmente, a utilização de classes de ocupação do solo discretas em mapas temáticos tem
seguido uma abordagem clássica, na qual se assume que a localização de cada área na paisagem
pertence apenas a uma determinada classe de ocupação do solo no mapa elaborado. Assume-se
que as categorias dos mapas são exclusivas e exaustivas (Woodcock e Gopal, 2000). Este tipo de
classificação é denominado de classificação rígida e permite apenas a utilização de funções binárias
na atribuição de uma determinada classe de ocupação do solo a uma determinada área, seguindo
uma lógica booleana (Burroughs e McDonnell, 1998). Utilizando esta abordagem na avaliação da
exactidão de cartografias de ocupação do solo, Woodcock e Gopal (2000) afirmam que se cada
localização no mapa faz parte de uma determinada classe, então todas as outras classes são
consideradas igualmente e completamente erradas nessa mesma localização.
Contudo, esta abordagem nem sempre é a mais apropriada, pois a variação encontrada na paisagem
tem que ser dividida num número finito de classes. De um modo geral, as classes são facilmente
distinguíveis no seu estado puro e vão-se tornando cada vez menos separáveis perto das linhas
divisórias entre classes (Gopal e Woodcock, 1994). Os mesmos autores referem algumas limitações
da classificação rígida na avaliação da exactidão de cartografias de ocupação do solo:
i) É assumido que a cada área no mapa apenas pode ser atribuída uma e só uma classe
com toda a certeza. Em visitas de campo ou através de foto-interpretação, para a
Enquadramento metodológico
31
elaboração de uma base de dados de referência, o técnico tem que resolver esta
questão, escolhendo uma classe para cada localização no campo;
ii) A amplitude dos erros está limitada pelo registo do padrão da não concordância entre as
categorias do mapa e as categorias da base de dados de referência. Os dados acerca da
magnitude ou gravidade da não concordância entre o mapa e a referência, não podem
ser utilizados;
iii) O utilizador necessita que lhe seja fornecida informação mais completa e interpretável
sobre o mapa que está a utilizar (Aronoff, 1982). Informação mais detalhada dos erros irá
ajudar os utilizadores a verificarem se os mapas poderão ser utilizados para satisfazerem
as suas necessidades.
A abordagem fuzzy, introduzida por Zadeh em 1965, teve como intuito, caracterizar a capacidade do
cérebro humano em lidar com relações vagas. O conceito chave por trás desta abordagem é o facto
da pertença de uma área na realidade a uma determinada classe ser uma questão de gradiente. O
aspecto atrás referido é uma das principais diferenças entre a abordagem clássica e a abordagem
fuzzy. A teoria fuzzy permite estabelecer gradientes de pertença a uma determinada classe,
providenciando assim uma maior flexibilidade do que a teoria clássica na avaliação da exactidão
temática de cartografias de ocupação do solo (Woodcock e Gopal, 2000).
Contudo, a implementação da teoria fuzzy, não é uma tarefa fácil devido à dificuldade em estabelecer
regras para a sua aplicação (Congalton e Green, 1999). Aquando da interpretação de uma imagem,
os especialistas exprimem a sua avaliação utilizando uma linguagem qualitativa. A abordagem fuzzy
pode assim ser utilizada para transformar essas regras qualitativas numa linguagem matemática, ou
seja, quantitativa (Gopal e Woodcock, 1994). Esta característica fornece assim um método
consistente para medir e modelar valores qualitativos que são posteriormente úteis nos processos de
tomada de decisão (Hadipriono et al., 1991). Robinson (1988), afirmou que a teoria fuzzy pode ser
aplicada em aplicações SIG e que pode ser utilizada para representar e manipular a incerteza.
2.4.3 Escala linguística
A observação avaliação da exactidão de cartografias temáticas por parte de peritos, é muitas vezes
baseada na utilização de uma escala linguística, a qual tem um carácter qualitativo. Mais
concretamente, são estes termos linguísticos que são geralmente utilizados para avaliar a
compatibilidade da classificação obtida nos mapas e as amostras de referência sujeitas a visitas de
campo (Gopal e Woodcock, 1994). Os mesmos autores referem que os especialistas estão aptos,
tanto para distinguir o que está “absolutamente correcto” e o “absolutamente errado”, como também
os valores intermédios entre este dois extremos. Através dos aspectos atrás mencionados, Gopal e
Woodcock (1994), elaboraram uma escala linguística com cinco classes, com o intuito de descrever a
Enquadramento metodológico
32
percepção que os especialistas têm da ocupação do solo em cada local onde se realizam visitas de
campo:
1) Classe absolutamente errada: Classe inaceitável. Muito errado.
2) Percebe-se mas errada: Não é uma boa classe. Existe algum factor no local que faz com
que se perceba a classe, mas existe claramente uma melhor classe. Esta classe pode ser um
problema para os utilizadores do mapa. Não está certa.
3) Classe aceitável ou razoável: Pode não ser a melhor classe possível, mas é aceitável; esta
classe não coloca qualquer problema ao utilizador se vier expressa no mapa. Certa.
4) Boa classe: Classe muito certa.
5) Classe absolutamente correcta: Sem dúvida acerca da compatibilidade. Classe perfeita.
Este procedimento é utilizado para obter a escala linguística. O especialista avalia cada classe de
ocupação do solo na visita de campo e atribui o valor linguístico mais adequado para descrever a
correspondência entre a classificação obtida no mapa e a “verdade” do terreno. Outro aspecto
importante, é o facto do especialista não conhecer qual a classificação obtida no mapa, antes e
durante o processo de avaliação das unidades amostrais de referência. Os valores linguísticos, são
posteriormente convertidos em valores de 1 a 5, em vez dos valores entre 0 e 1 tradicionalmente
utilizados na teoria fuzzy, ou seja, a escala de linguagem é discreta e não continua. Este aspecto,
segundo Woodcock e Gopal (2000), é uma das limitações desta abordagem, pois seguindo a teoria
fuzzy, os valores de pertença das classes são geralmente contínuos. Gopal e Woodcock (1994)
referem ainda que a utilização deste método permite ao especialista reconhecer a heterogeneidade
da cobertura do solo e a ambiguidade das classes obtidas no mapa, e utilizá-lo para definir o grau de
compatibilidade do mapa produzido com as unidades amostrais de referência. Assim sendo, o
especialista não está limitado apenas a uma resposta correcta ou errada para cada unidade amostral,
contrariamente aos métodos tradicionais de avaliação da exactidão temática que permitem apenas
duas respostas: a unidade amostral está correcta ou incorrectamente classificada.
2.4.4 Funções fuzzy para avaliação da exactidão temática de cartografias de ocupação do solo
Várias medidas de exactidão temática têm sido desenvolvidas com base em funções fuzzy, com o
intuito de determinar a qualidade de cartografias e das suas respectivas categorias (Zadeh, 1965).
Estas funções fornecem mais informação do que uma tradicional matriz de confusão, podendo
determinar-se várias medidas de exactidão temática, tais como: frequência de concordância e não
Enquadramento metodológico
33
concordância entre as unidades amostrais de referência e a classificação dos mapas produzidos,
magnitude dos erros, origem dos erros e a natureza dos erros (Gopal e Woodcock, 1994).
Seguidamente apresenta-se uma breve abordagem das funções fuzzy utilizados no trabalho de Gopal
e Woodcock (1994), como também a metodologia utilizada no seu trabalho.
2.4.4.1 Frequência de concordância e não concordância
Nesta fase da avaliação da exactidão temática, pretende-se medir a exactidão da cartografia
produzida em termos da frequência de concordância e não concordância entre a amostra de
referência (M) e a escala linguística (A). Este procedimento divide o problema tradicional “qual a
exactidão do mapa”, em duas questões mais precisas:
i) Com que frequência é a categoria classificada no mapa a melhor escolha para representar a
realidade?
ii) Com que frequência é a categoria classificada no mapa aceitável?
Seja σ uma função booleana na qual se obtém um resultado de 0 ou 1, segundo a pertença da
unidade amostral x à classe C. A avaliação da pertença da unidade amostral x do conjunto S (x ∈ a
S) à classe C do mapa, depende do critério utilizado para definir σ. σ (x, C) = 1 se x pertencer a C, e
σ (x, C) = 0 se x não pertencer a C. Considerando agora duas diferentes definições de σ, em que א
(x) é a classe no mapa. Se σ (x, א (x)) = 1, então podemos dizer que existe compatibilidade entre os
dados do mapa produzido e a avaliação do especialista na unidade amostral x na realidade, se σ (x, א
(x)) = 0, então são incompatíveis.
Para cada classe do mapa C ∈ C , calculam-se duas quantidades:
Cω = |{x ∈ S | א(x) = C e σ (x, C) = 1}|
Cϖ = |{x ∈ S | א(x) = C e σ (x, C) = 0}|
Ou seja, conta-se o número de unidades amostrais x com א(x) = C em termos de concordância ( Cω )
e não concordância ( Cϖ ).
A concordância e não concordância pode ser definida através de duas funções:
1) Função MAX
A função MAX pode ser definida como:
Enquadramento metodológico
34
MAX (x, C) = 1 se o valor da função de pertença x na classe C (μC (x)), é máximo ao longo de todas
as classes do mapa (μC ‘ (x)).
2) Função RIGHT
A função RIGHT é definida tendo como ponto inicial um valor predefinido t, em que t é um valor da
escala linguística ou um valor especifico da função de pertença. Uma amostra x “pertence” a uma
classe C se a sua função de pertença μC (x) ≥ t.
A função RIGHT pode ser definida como:
Normalmente a função MAX é mais conservadora do que a função RIGHT, mas este facto nem
sempre acontece. Este aspecto pode acontecer devido à possibilidade de existirem unidades
amostrais em que não existam classes que coincidam com a função RIGHT, mas mesmo assim,
tenham um valor elevado (Gopal e Woodcock, 1994). O mesmo autor refere ainda que na elaboração
de matrizes de confusão, geralmente são utilizadas as funções RIGHT e MAX. A função MAX é
aplicada quando a matriz de confusão é elaborada a partir de unidades amostrais “cegas” (quando a
classificação do mapa não é utilizada, na fase de avaliação das unidades amostrais). Por outro lado a
função RIGHT é utilizada quando existe o conhecimento da classificação do mapa durante a
avaliação das unidades amostrais. Muitas vezes, o conhecimento da classificação do mapa durante a
sua avaliação não é fornecido numa matriz de confusão. Separando os resultados das funções
RIGHT e MAX, permite que não exista confusão no aspecto anteriormente referido. Os dados das
funções RIGHT e MAX quando obtidos em conjunto, são mais úteis do que quando obtidos em
separado.
2.4.4.2 Magnitude do erro
Como já foi anteriormente referido, uma das vantagens da utilização de funções fuzzy para a
avaliação da exactidão temática é a possibilidade de estes fornecerem informação sobre a magnitude
e a gravidade dos erros. Com o intuito de avaliar a magnitude dos erros, consideremos a função Δ(x)
→ Z. Para uma determinada unidade amostral x, Δ(x) mede a diferença entre o resultado obtido pela
1 se μC (x) ≥ t RIGHT(x, C) = 0 se μC (x) ≤ t
1 se μC (x) ≥ μC ‘ (x) para todos os C’ ∈ C MAX (x, C) = 0 se μC (x) ≤ μC ‘ (x) para todos os C’ ∈ C
Enquadramento metodológico
35
categoria א(x) em x e o valor mais elevado atribuído a x entre todas as outras categorias de C. A
função acima descrita é denominada de DIFFERENCE e pode ser definida como:
DIFFERENCE (Δ(x)) = μ א(x)(x) – max μC (x)
Utilizando a escala linguística elaborada por Gopal e Woodcock (1994), podemos verificar que esta
varia entre 1 e 5, ou seja a função DIFFERENCE irá estar compreendida entre – 4 e 4 inclusive. No
caso em que a classe atribuída no mapa está perfeitamente correcta (valor = 5) e todas as outras
classes estão completamente erradas (valor = 1), a função DIFFERENCE retribuirá um valor igual a
4. Todas as amostras que são compatíveis, utilizando a função MAX, terão valores da função
DIFFERENCE superiores ou iguais a 0. Por outro lado, as amostras nas quais se obtêm valores
negativos, correspondem a amostras incompatíveis. Uma amostra incompatível com um valor de
DIFFERENCE de –1, corresponde a um caso em que se atribuiu apenas um valor abaixo na unidade
amostral de referência, em relação ao possível valor máximo atribuível a essa mesma unidade
amostral. Logicamente um valor de –4 traduz a maior discrepância possível, sendo por isso um erro
mais grave do que o anterior.
Gopal e Woodcock (1994) salientam o facto de que o uso desta função está dependente da maneira
como os valores são atribuídos. No exemplo apresentado pelos autores, a escala linguística foi
convertida em valores discretos através de uma função linear simples, mas no entanto existem muito
mais possibilidades.
A utilização dos valores obtidos a partir da função DIFFERENCE, em conjunto com as classes do
mapa, podem fornecer índices muito úteis. Gopal e Woodcock (1994) referem que pode ser útil a
atribuição de pesos, para acentuar os efeitos dos valores negativos, com o intuito de produzir um
índice da magnitude do erro para cada classe.
2.4.4.3 Origem do erro
Os erros de classificação em cartografias de ocupação do solo, são muitas vezes derivados da
natureza heterogénea da paisagem. Estes erros podem ser analisados utilizando a função
MEMBERSHIP λ : N → Z, a qual analisa as várias classes de ocupação do solo nas várias unidades
amostrais de referência analisadas pelos especialistas (Gopal e Woodcock,1994).
A função MEMBERSHIP, pode ser definida como:
MEMBERSHIP (λ (x)) = |{C | C ∈ C e μC (x) ≥ t}|
Esta função fornece informação acerca da frequência da pertença das várias classes em cada
unidade amostral de referência. Os vários graus de pertença são representados pela escala
Enquadramento metodológico
36
linguística utilizada. No exemplo apresentado por Gopal e Woodcock (1994), o valor mínimo do grau
de pertença é 3, aumentando até ao valor máximo (5). Para cada classe C ∈ C e valores
compreendidos no intervalo 1 ≤ i ≤ 4, são calculados o número de amostras nas quais א(x) = C e λ(x)
= i. Uma amostra de referência tem um valor de pertença superior a t, para apenas uma categoria,
enquanto que uma amostra com mais do que uma classe, tem valores de pertença para duas ou mais
classes. O número total de amostras em cada grupo é adicionalmente distinguido entre amostras
compatíveis e incompatíveis, utilizando a função MAX.
A utilização da função MEMBERSHIP, segundo Gopal e Woodcock (1994), tem como objectivo
explorar as possíveis fontes de erro nos mapas. Estas origens podem ser identificadas a partir da
frequência de acordo e desacordo para os diferentes valores da escala de pertença. Esta função
permite também inferir sobre quais as condições ambientais nas quais os erros estão a ser
cometidos. Se existir um elevado número de erros (não concordância) nas amostras em que foi
atribuída apenas uma classe, então o processo de elaboração do mapa está a ter falhas nos locais
sem ambiguidade. Por outro lado, se o número de locais onde não existe concordância estiverem
concentrados em amostras com mais do que uma classe definida, então o esforço de produção do
mapa deve ser concentrado nos locais com mais heterogeneidade e com maior ambiguidade entre as
diferentes classes. Gopal e Woodcock (1994) salientam ainda o facto de que uma elevada frequência
de erro em locais com mais do que uma classe de ocupação do solo, podem servir de indicação para
o utilizador do mapa das características dessa mesma classe. É importante também referir que a
utilização desta função, bem como da teoria fuzzy, não faz sentido nos casos em que as unidades
amostrais apresentam apenas uma classe.
2.4.4.4 Natureza do erro
Gopal e Woodcock (1994), referem que uma importante fonte de informação é a natureza dos erros
das classes e entre que classes existe mais confusão. Esta informação, nos métodos tradicionais de
avaliação da exactidão temática, pode ser observada nos valores da matriz de confusão que estão
fora da diagonal. Estas matrizes também podem ser construídas utilizando as funções CONFUSION
e AMBIGUITY. A função CONFUSION, ζ : N → 2C, identifica as categorias com um índice superior ao
das classes do mapa e pode ser definida como:
CONFUSION (ζ(x)) = { C | C ∈ C e μC (x) > μ א(x)(x)}
Em particular, para uma unidade amostral x, ζ(x) calcula o conjunto de classes, nas quais os valores
de pertença são superiores ao valor atribuído à classe do mapa א(x). Este método é muito
semelhante ao da elaboração de uma matriz de erro, no entanto uma classe pode ter um índice (μC)
superior ao da classe do mapa μ א(x)(x) numa unidade amostral (x). Para cada par de categorias
(ambas diferentes) C, C’ ∈ C, é calculado ζCC ’, ou seja o número de unidades amostrais x em que
.C e μC ’ (x) > μC(x) = (x)א
Enquadramento metodológico
37
A função AMBIGUITY, η : N → 2C, identifica as classes com o mesmo índice que a classe do mapa e
pode ser definida como:
AMBIGUITY (η (x)) = { C | C ∈ C e μC (x) = μ א(x)(x)}
Para cada par de classes distintas C, C’ ∈ C, é calculada a quantidade ηCC ’, ou seja o número de
amostras x em que ζ(x) = C e μC ’ (x) = μC(x)
A informação obtida nas classes ambíguas ou com uma atribuição de índices iguais, podem ser
particularmente interessantes para os utilizadores de mapas em que a matriz não é simétrica. As
assimetrias indicam quais as classes que incluem frequentemente unidades amostrais com uma
maior ambiguidade em relação à classe a que essas unidades amostrais pertencem (Gopal e
Woodcock, 1994).
A implementação da teoria fuzzy, na avaliação da exactidão temática, fornece mais informação sobre
os erros do que a teoria clássica, nomeadamente em relação à frequência e à natureza desses
mesmos erros. Para além dos aspectos anteriormente referidos, a utilização da teoria fuzzy, permite
também quantificar a magnitude dos erros, como também verificar a ambiguidade e confusão que
existe entre as classes de ocupação do solo (Woodcock e Gopal, 2000). Contudo, ainda persistem
muitas questões por responder no que respeita à utilização da teoria fuzzy na avaliação da exactidão
temática. Uma das áreas que necessita de mais estudos é a utilização dos métodos anteriormente
descritos, na comparação de cartografias. Neste contexto é necessária a elaboração de um índice
estandardizado de exactidão temática, como também a produção de um índice Kappa, de forma a
permitir a harmonização dos resultados de diferentes projectos relacionados com a avaliação da
exactidão temática (Gopal e Woodcock, 1994).
Metodologia
38
3. METODOLOGIA
Neste capítulo faz-se uma descrição dos métodos utilizados para a aplicação da nossa abordagem de
avaliação da exactidão temática de cartografias de ocupação do solo a imagens de satélite de média
resolução espacial. Inicialmente elaborou-se uma base de dados de referência com vários índices,
com o intuito de estes serem utilizados como dados de input para as funções fuzzy. Posteriormente,
para procedemos à classificação automática de imagens MERIS, com o intuito de se produzir um
mapa para aplicarmos a metodologia de valiadação proposta neste trabalho, efectuou-se uma análise
de separabilidade espectral com o objectivo de seleccionar a imagem relativa ao ano de 2005, que
espectralmente garantisse uma melhor discriminação entre as classes de ocupação do solo da
nomenclatura adoptada. Faz-se também uma descrição do método de classificação automática
utilizado para a produção automática da cartografia de ocupação do solo, derivado da imagem
seleccionada. Por fim efectuou-se uma avaliação da exactidão temática do mapa produzido,
utilizando uma abordagem tradicional (matriz de confusão), como também através de funções fuzzy.
3.1 Base de dados de referência
A base de dados de referência consiste numa amostra, na qual se pretende que esta represente a
“realidade”. Esta base de dados irá ser posteriormente utilizada para validação do mapa produzido,
como também para caracterizarmos a paisagem portuguesa, através das classes de ocupação do
solo, índices de certeza e localização, atribuídos em cada unidade amostral.
3.1.1 Nomenclatura utilizada
A base de dados de referência foi elaborada no âmbito do projecto LANDEO (Caracterização da
ocupação do solo para monitorização ambiental multi-escala com utilização de dados multi-sensor de
observação da Terra). O objectivo principal deste projecto é o desenvolvimento de uma metodologia
que possa ser utilizada para a produção regular de cartografias de ocupação do solo, para Portugal
Continental, derivada de dados de detecção remota (Carrão, 2006). No âmbito deste projecto, foi
desenvolvida uma nomenclatura simples, clara, com limites de classes bem definidos, e com a
possibilidade de ser aplicada à produção de cartografias de ocupação do solo a diferentes escalas de
análise. Outro dos objectivos do desenvolvimento desta nomenclatura foi o de esta permitir uma
comparação e harmonização de cartografias produzidas com diferentes nomenclaturas (e.g. IGBP
(International Geosphere-Biosphere Programme), CLC (Corine Land Cover) e GLC (Global Land
Cover)). Esta nomenclatura, quando aplicada com o maior detalhe possível, divide a ocupação do
solo em 33 classes, organizadas em diferentes níveis de detalhe consoante o tipo de ocupação
Metodologia
39
(Araújo e Caetano, 2006). Na Tabela 3 apresentam-se as classes da nomenclatura LANDEO, e as
respectivas percentagens de coberto que caracterizam cada classe de ocupação do solo.
Tabela 3. Nomenclatura de ocupação do solo LANDEO, utilizada na classificação da base de dados de referência.
ID Classe Coberto (%) 11 Áreas artificiais contínuas >80% 12 Áreas artificiais descontínuas 30%<>80% 21 Culturas de sequeiro >80% 22 Culturas de regadio >80% 23 Arrozais >80%
241 Culturas permanentes de folha perene >80% 242 Culturas permanentes de folha caduca >80% 25 Mosaico de áreas agrícolas
311 Floresta de folhosas fechada 40%<>100% 312 Floresta de folhosas aberta 15%<>40% 321 Floresta de resinosas fechada 40%<>100% 322 Floresta de resinosas aberta 15%<>40% 331 Floresta mista fechada 40%<>100% 332 Floresta mista aberta 15%<>40% 34 Vegetação arbustiva 15%<>100% 35 Vegetação herbácea 15%<>100% 36 Vegetação esparsa 4%<>15% 37 Mosaico de áreas com vegetação 38 Áreas ardidas 15%<>100%
41 Mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais
5 Zonas permanentemente alagadas 6 Solo nu <4% 7 Corpos de água
3.1.2 Unidade amostral
A unidade amostral utilizada para a elaboração da base de dados de referência, corresponde a uma
área de 300 por 300m, ou seja, um polígono de forma quadrangular com a mesma dimensão de um
pixel de uma imagem MERIS (Level 2 FR). Com a finalidade de analisar a vizinhança do pixel central
para verificar se existiam problemas relacionados com erros de geo-localização das unidades
amostrais em relação ao mapa, foi também implementado um bloco de 3x3 pixels, exactamente com
a mesma dimensão do pixel central (Figura 12).
Figura 12. Unidade amostral e sua vizinhança.
Para a interpretação da classe de referência em cada unidade amostral, recorreu-se a imagens
aéreas adquiridas durante os anos de 2004, 2005 e 2006 pelo Instituto Geográfico Português (IGP) e
Metodologia
40
a Direcção Geral dos Recursos Florestais (DGRF). Na Tabela 4, apresentam-se as principais
características dessas imagens e no Anexo 3 pode ser observado um exemplo de cada classe de
ocupação do solo, utilizando as imagens mencionadas.
Tabela 4. Principais características das imagens aéreas utilizadas na elaboração da base de dados de referência.
Direitos de propriedade DGRF / IGP Câmara Ultracam da Vexcel
Altura de voo Aproximadamente 5800m Formato das imagens TIFF
Área de cada imagem no terreno 4 x 5 kmResolução espacial 0,5 m
Resolução radiométrica 8 bits por banda Bandas Azul, verde, vermelho e infravermelho próximo
Sistema de referência Datum 73 Hayford Gauss IPCC Datas das imagens aéreas Novembro de 2004; Agosto e Setembro de 2005;
Maio e Junho de 2006
A informação acerca da classificação da ocupação do solo na realidade em cada unidade amostral foi
recolhida por dois foto-intérpretes, que recolheram a informação relativa ao pixel central e aos pixels
vizinhos. Em relação ao pixel central, os foto-intérpretes recolheram a informação relativa às duas
ocupações do solo mais prováveis na localização relativa a cada unidade amostral. Para além desta
informação, indicaram também qual o índice de confiança com que atribuíram a classe de ocupação
do solo mais provável. Em relação aos pixels vizinhos, os foto-intérpretes atribuíram um índice de
localização em relação à ocupação do solo predominante. Foi também indicado por parte do foto-
intérprete se a unidade amostral correspondia a uma classe de mosaico. Na Tabela 5, faz-se uma
descrição dos códigos e índices atribuídos a cada unidade amostral da base de dados de referência.
Tabela 5. Códigos e índices atribuídos a cada unidade amostral da base de dados de referência.
Campos da tabela de atributos Significado Atributos
LABEL 1 Classe de ocupação de solo mais provável Códigos da nomenclatura LANDEO (ID)
LABEL 2 Segunda classe de ocupação de solo mais provável Códigos da nomenclatura LANDEO (ID)
Índice de confiança (ICR)
Índice de certeza com que o foto-intérprete classificou a classe de ocupação de solo mais provável
3: Muita confiança 2: Confiança relativa 1: Pouca confiança
Índice de localização
(LCR) Índice de localização da unidade de amostragem
3: Ocupação de solo heterogénea em torno do pixel central 2: Ocupação de solo homogénea em torno do pixel central 1: No limite entre duas ou mais ocupações de solo
Mosaicos (MOS) Indicação do tipo de mosaico
25: Mosaico de áreas agrícolas 37: Mosaico de vegetação 41: Mosaico de áreas agrícolas/vegetação/áreas artificiais
Metodologia
41
Para além da criação destes campos da tabela de atributos, criámos dois campos novos CMP 1
(Componente 1) e CMP 2 (Componente 2), os quais são semelhantes ao LABEL 1 e LABEL 2, mas
nos quais foram introduzidas as classes de ocupação do solo à excepção das classes de mosaico, ou
seja, foram apenas introduzidas as classes de ocupação do solo principais e secundárias, ignorando
se estávamos perante classes de mosaico ou não.
3.1.3 Dimensão da amostra e protocolo de amostragem
Tal como referido no segundo capítulo, Stehman (2001) estabeleceu um número mínimo de 100
amostras por classe para garantir que a avaliação da exactidão possa ser estimada com um desvio
padrão não superior a 0,05. Tendo em conta este aspecto definiu-se que a dimensão da amostra
seria de 1900 amostras, ou seja, 100 unidades amostrais por cada uma das 19 classes de ocupação
do solo.
Para garantir as 100 unidades amostrais por classe, recorremos a uma amostragem aleatória
estratificada com o intuito de garantir que todas as classes de ocupação do solo teriam a mesma
probabilidade de serem amostradas. Assim, para a concepção e desenho da amostra, foi produzido
um mapa de ocupação do solo derivado de uma imagem MERIS, recorrendo ao algoritmo da Máxima
Verosimilhança. Posteriormente, recorremos à extensão Hawth’s Tools do software ArcGis 9, para
recolher aleatoriamente as 100 unidades amostrais por cada classe de ocupação do solo. A
distribuição das unidades amostrais pelo território de Portugal Continental pode ser observada no
Anexo 4.
3.1.4 Análise estatística da base de dados de referência
Com o objectivo de estudar as relações existentes entre cada classe de ocupação do solo e os
índices de confiança, localização e mosaicos, foram calculadas as frequências relativas de cada
classe e frequências absolutas, para cada um dos parâmetros anteriormente referidos. Com esta
análise, estudamos também a qualidade do sensor MERIS para a caracterização da paisagem
portuguesa, como também analisamos as características do território de Portugal Continental. Esta
análise, também permitiu inferir sobre a análise da exactidão para cada classe de ocupação do solo,
e verificar se de alguma forma os erros do mapa produzido estão relacionados com as proporções
relativas, que cada classe de ocupação do solo possui em relação a cada um dos índices da base de
dados de referência.
Metodologia
42
3.2 Selecção temporal da imagem MERIS para produção do mapa de ocupação do solo para teste da metodologia de validação
Com o objectivo de elaborar uma cartografia de ocupação do solo, para posterior cruzamento com a
base de dados de referência, foi adquirido um conjunto de 12 imagens MERIS (Level 2 FR), cada
uma relativa a cada mês do ano de 2005. A obtenção deste conjunto esteve relacionada com o facto
de se pretender escolher a imagem que na prática permitiria obter uma melhor separação inter-classe
entre as várias classes de ocupação do solo. Para tal, procedeu-se a uma classificação assistida das
12 imagens, das quais foram escolhidas quatro (cada uma correspondente a uma estação do ano)
que resultaram dos melhores resultados. Para decidir qual destas quatro imagens seria a utilizada
para a avaliação da exactidão tradicional e avaliação da qualidade com funções fuzzy do mapa de
ocupação do solo, procedeu-se a uma análise estatística multivariada da separabilidade espectral da
ocupação do solo em cada uma. Esta análise permitiu seleccionar a imagem que permitia uma
melhor separabilidade inter-classes de ocupação do solo e assim apoiar a decisão sobre qual destas
imagens se poderiam obter melhores resultados.
3.2.1 Classificação mensal da ocupação do solo através do algoritmo da Máxima Verosimilhança e avaliação da exactidão mensal dos mapas produzidos
Segundo Caetano (2004), a classificação assistida engloba dois passos: (1) fase de treino, onde se
definem as unidades amostrais de cada classe da nomenclatura que se adoptou, e (2) classificação,
com algoritmos específicos, de todos os pixels da imagem nas classes definidas no primeiro passo.
Na fase de treino, foram recolhidas indutivamente 735 unidades amostrais com dimensão exacta de
um pixel MERIS (300X300 m), recorrendo à interpretação visual das imagens aéreas utilizadas para a
elaboração da base de dados de referência (Tabela 4) e a CLC2000. O número de unidades
amostrais recolhidas para cada classe de ocupação de solo pode ser consultado no Anexo 2. Com o
intuito de diminuir os erros, derivados das condições de captura dos números digitais por parte do
sensor em cada pixel das imagens, foram retiradas da fase de treino as unidades amostrais que
coincidissem com pixels das imagens que acusassem qualquer tipo de erro na informação capturada
pelo sensor (e.g. nuvens, efeito glint). Esta informação está contida numa banda das imagens
MERIS, denominada de Quality Flags. Para além deste aspecto, não foram recolhidas amostras de
treino para as classes de corpos de água, zonas permanentemente húmidas e áreas ardidas. Em
relação às áreas ardidas, estas não foram treinadas devido à sua elevada dinâmica durante um ano,
e portanto não podem ser relacionadas com um momento especifico no tempo. Em relação às
classes de corpos de água e de zonas permanentemente alagadas, estas não foram treinadas,
porque são facilmente distinguíveis através da classificação automática de imagens MERIS (Carrão
et al., 2006), não havendo necessidade de estudar a sua separabilidade. As classes de mosaico
Metodologia
43
também não foram treinadas, dado que estas representam uma mistura de classes homogéneas em
várias proporções, logo a técnica de classificação terá que ser diferente.
A classificação automática de cada uma das imagens foi realizada através do algoritmo da Máxima
Verosimilhança.
Para determinar a melhor imagem para cada uma das estações do ano, elaboraram-se 12 matrizes
de confusão, cada uma correspondendo ao cruzamento da classificação de cada uma das imagens,
com as amostras de treino. A elaboração das matrizes permitiu o cálculo da exactidão global para
cada uma das 12 imagens. Pudemos assim escolher a imagem com uma exactidão global mais
elevada para cada estação do ano.
3.2.2 Análise exploratória da separabilidade espectral das classes de ocupação do solo em cada estação do ano
Para analisar qual das quatro imagens escolhidas permitiria uma melhor separabilidade entre classes
de ocupação do solo, foram utilizados três métodos estatísticos de análise de dados. Esta análise foi
realizada tendo por base as mesmas unidades amostrais de treino que foram utilizadas para a
classificação mensal. Todos estes cálculos foram efectuados no software MATLAB.
- Análise dos descritores estatísticos (média, 1º e 3º quartil e extremos)
Os descritores estatísticos foram calculados a partir do NDVI (Normalized Difference Vegetation
Index) para cada uma das unidades amostrais de treino, tendo por base a informação da classe de
ocupação do solo para cada uma das amostras. O NDVI é um índice de vegetação, sendo este, o
mais utilizado e divulgado (Caetano, 2004). Segundo Huete (1989) in Caetano (2004), os índices de
vegetação são combinações matemáticas de duas ou mais bandas (geralmente a banda do vermelho
e infra-vermelho) e, de uma forma geral, são concebidos com o objectivo de estimar a abundância de
vegetação em cada pixel. Tendo em conta este índice, elaboramos uma boxplot para cada uma das
classes de ocupação do solo. Com esta análise pretendemos verificar qual a variabilidade intra e
inter-classe de cada uma das classes de ocupação do solo. É de salientar que o NDVI não foi
utilizado para treinar o classificador automático e sendo esta uma análise exploratória, pretendemos
apenas ter uma ideia das classes de ocupação do solo que se podem misturar entre si.
- Análise factorial discriminante das bandas espectrais
Segundo Caetano (2004) a análise de componentes principais (ACP) consiste numa transformação
dos dados originais noutro conjunto menos correlacionado. É a obtenção de um pequeno número de
combinações lineares (componentes principais) de um conjunto de variáveis, que retenham o máximo
Metodologia
44
possível da informação contida nas variáveis iniciais. As componentes são extraídas na ordem da
mais explicativa para a menos explicativa. Teoricamente o número de componentes é sempre igual
ao número de variáveis. No entanto, são poucas as componentes responsáveis pela retenção de
grande parte da informação contida nessas variáveis.
Se os indivíduos de uma amostra na nossa base de dados estiverem organizados em grupos, e.g.
classes de ocupação do solo, as componentes principais a extrair das variáveis iniciais são aquelas
que garantem um maior afastamento dos grupos no espaço dimensional considerado. Estas
componentes principais são calculadas através de uma análise factorial discriminante de Fisher.
Neste estudo realizámos esta análise, a qual permite evidenciar quais as classes de ocupação do
solo que melhor se separam entre si no espaço espectral de 13 dimensões considerado (13
corresponde ao número de bandas de cada imagem). Esta análise tem por base o ratio derivado da
expressão S = σ 2 inter-grupo / σ 2
intra-grupo, em que σ 2 é a variância; quanto maior o valor de S, maior o
afastamento entre as classes. Este ratio, foi representado num gráfico de dispersão para cada uma
das imagens, em que cada um dos eixos corresponde às componentes mais explicativas. É
importante salientar que este estudo é apenas exploratório e que a separação das classes não
depende apenas da informação contida nestas duas componentes, podendo também as restantes
contribuir para uma melhor separabilidade.
- Cálculo da distância entre classes de ocupação do solo
Outra forma de avaliar a separabilidade das classes de ocupação do solo, resultante de uma
classificação automática, é através do cálculo de uma distância estatistica entre classes de ocupação
do solo para cada uma das imagens. Esta distância foi calculada através do método ward, o qual é
baseado na soma de quadrados dentro do grupo, ou no nosso caso entre classes de ocupação do
solo. Este método pode ser definido como a soma dos quadrados das distâncias entre todos os
objectos de um grupo (classes) e o centróide de cada um dos restantes grupos. Esta distância foi
representada num dendrograma que permitiu avaliar a distância entre cada uma das classes de
ocupação do solo.
3.3 Avaliação da exactidão da cartografia de ocupação do solo
Para avaliar a exactidão temática do mapa derivado da imagem MERIS, que foi seleccionada depois
do estudo exploratório, foram utilizadas duas abordagens distintas. Numa primeira, fase avaliamos a
exactidão do mapa produzido com base em matrizes de confusão. Posteriormente, a qualidade do
mapa produzido foi avaliada através de uma metodologia baseada na teoria fuzzy, nomeadamente
utilizando as funções descritas no trabalho de Gopal e Woodcock (1994). Em ambas as abordagens
utilizamos como informação de referência a base de dados, descrita no ponto um do presente
Metodologia
45
capítulo, à qual foram retiradas as unidades amostrais foto-interpretadas como pertencendo às
classes de corpos de água, zonas permanentemente alagadas e áreas ardidas.
3.3.1 Avaliação da exactidão baseada em matrizes de confusão
Para avaliar exactidão do mapa produzido através de métodos tradicionais, considerámos como uma
classificação correcta do mapa produzido, as unidades amostrais nas quais o primeiro código da base
de dados coincidisse com a classificação do mapa.
Para a elaborar as matrizes de confusão, cruzamos as classes de ocupação do solo, relativas ao
mapa produzido por métodos automáticos, com as classes de ocupação do solo atribuídas a cada
unidade amostral da base de dados de referência. Nas linhas da matriz, introduzimos a classificação
do mapa e nas colunas a classificação atribuída às unidades amostrais de referência. Com o intuito
de calcular o índice de exactidão do utilizador, utilizamos a Equação três do Capítulo dois deste
trabalho. Já para o cálculo da exactidão global e da exactidão do produtor para cada classe, foram
utilizadas equações diferentes das referidas no Capítulo dois, por forma a respeitar as estimativas
baseadas na amostragem aleatória estratificada. Assim sendo, utilizámos as equações propostas por
Carrão et al. (2007) (Anexo 5), derivadas do trabalho de Cochran (1977).
Para além da elaboração da matriz de confusão anteriormente referida, calculámos a exactidão global
e a exactidão do utilizador para cada classe de ocupação do solo, relativamente aos índices de
certeza, índices de localização e classes de mosaico. Esta análise teve como objectivo verificar se o
erro poderia estar de alguma forma relacionado com as situações particulares enunciadas
anteriormente.
3.3.2 Avaliação da qualidade da cartografia produzida baseada em funções fuzzy
Para avaliar a qualidade do mapa produzido e das suas classes, baseada em funções fuzzy, tivemos
que adaptar as funções descritas no trabalho de Gopal e Woodcock (1994), para a abordagem
utilizada no presente trabalho. Apresentamos de seguida as expressões utilizadas para o cálculo de
cada uma das funções, nas quais consideramos CLASS como a classificação do mapa produzido.
3.3.2.1 Frequência de concordância e não concordância
Para determinar a frequência de concordância e não concordância calculámos as funções MAX e
RIGHT. A função MAX, representa o número de unidades amostrais bem classificadas, em que
apenas a componente 1 da unidade amostral coincide com a classificação do mapa. A função RIGHT
representa o número de unidades amostrais bem classificadas nas quais a componente 1 ou a
Metodologia
46
componente 2 coincide com a classificação do mapa. Com estas funções pretendemos verificar se
existe uma melhoria na exactidão do mapa quando cruzado com uma ou duas classes de ocupação
de solo de cada unidade amostral da base de dados de referência.
- Função MAX
MAX = SE(CMP1=CLASS);CLASS;FALSO)
- Função RIGHT
RIGHT = SE(OU(CMP1=CLASS;CMP2=CLASS);CLASS;FALSO)
3.3.2.2 Magnitude do erro
Para verificarmos que classes de ocupação do solo possuem erros de classificação mais graves e
que classes de ocupação de solo têm maior confiança na classificação, calculámos a função
DIFFERENCE para cada uma das classes de ocupação do solo. A confiança na classificação
corresponde a unidades amostrais bem classificadas em que o mapa produzido corresponde à
componente 1 da amostra, havendo uma diminuição da confiança na classificação à medida que vai
diminuindo o índice de confiança. A confiança na classificação intermédia corresponde a unidades
amostrais bem classificadas em que o mapa produzido corresponde à componente 2 da unidade
amostral, havendo uma diminuição da confiança na classificação à medida que vai diminuindo o
índice de confiança. Os erros correspondem a unidades amostrais mal classificadas em que o mapa
produzido não corresponde a qualquer uma das componentes da unidade amostral, havendo um
aumento da gravidade do erro à medida que vai aumentando o índice de confiança.
- Função DIFFERENCE
Considerando DIFFERENCE (0), como o nível máximo de confiança na classificação e DIFFERENCE
(-7), o nível de erro mais grave, foi elaborada a seguinte escala de erro, para cada uma das classes
de ocupação do solo:
Confiança na classificação muito elevada:
DIFFERENCE (0) = SE(E(CMP1=CLASS;ICR=3); CLASS; FALSO)
Confiança na classificação elevada:
DIFFERENCE (-1) = SE(E(CMP1=CLASS;ICR=2); CLASS; FALSO)
Confiança na classificação aceitável:
DIFFERENCE (-2) = SE(E(CMP1=CLASS;ICR=1); CLASS; FALSO)
Metodologia
47
Confiança na classificação reduzida:
DIFFERENCE (-3) = SE(E(CMP2=CLASS;ICR=2); CLASS; FALSO)
Confiança na classificação muito reduzida:
DIFFERENCE (-4) = SE(E(CMP2=CLASS;ICR=1); CLASS; FALSO)
Erro aceitável:
DIFFERENCE (-5) = SE(E(CMP1<>CLASS;CMP2<>CLASS;ICR=1); CLASS; FALSO)
Erro grave:
DIFFERENCE (-6) = SE(E(CMP1<>CLASS;CMP2<>CLASS;ICR=2); CLASS; FALSO)
Erro muito grave:
DIFFERENCE (-7) = SE(E(CMP1<>CLASS;CMP2<>CLASS;ICR=3); CLASS; FALSO)
3.3.2.4 Origem do erro
Para determinar se a origem dos erros está ligada ao facto de haverem unidades amostrais
classificadas com duas classes de ocupação do solo, ou seja, se os erros estão ligados à
heterogeneidade da paisagem, calculámos a função MEMBERSHIP. Esta função implica o cálculo da
exactidão das unidades amostrais foto-interpretadas com duas classes de ocupação do solo e com
uma classe de ocupação do solo. Permite verificar que classes de ocupação do solo apresentam
mais erros relacionados com a heterogeneidade da paisagem, ou se por outro lado os erros
acontecem em amostras puras, permitindo verificar se os erros estão ligados com o facto do
classificador automático não conseguir discriminar determinadas classes. Para além dos aspectos
anteriormente referidos, esta função permite verificar que classes possuem uma maior frequência de
surgirem na amostra em conjunto com outra classe de ocupação do solo.
- Função MEMBERSHIP
MEMBERSHIP (uma classe) = SE(E(CMP1=CLASS;ICR=3);CLASS; FALSO)
MEMBERSHIP (duas classes) =
SE(OU(CMP1=CLASS;CMP2=CLASS);CLASS;FALSO);SE(E(ICR<3);CLASS;FALSO)
3.3.2.5 Natureza do erro
Para determinarmos a natureza do erro, foram utilizadas as funções CONFUSION e AMBIGUITY. A
função CONFUSION, que corresponde aos elementos fora da diagonal da matriz de confusão, na
Metodologia
48
qual se assinala, para além de um dos códigos em que não há concordância com o mapa, o código
alternativo, ou seja, assinala-se a CMP 1 e a CMP 2 da unidade amostral em que não existe
concordância com o mapa. Pretendemos com esta função verificar quais as classes que mais se
confundem entre si. Em relação à função AMBIGUITY, esta corresponde a unidades amostrais
correctamente classificadas, nas quais atribuímos uma classe de ocupação do solo alternativa. Esta
função corresponde à função RIGHT, mas em vez de ser representada na matriz a classe de
ocupação do solo em concordância com a referência, representa-se a classe de ocupação do solo
alternativa atribuída a essa mesma unidade amostral, mas que foi mal classificada. As amostras em
que a CMP 1 e a CMP 2 são iguais não foram consideradas. Com esta função pretendemos verificar
que classes de ocupação do solo são mais ambíguas, ou seja, apesar de estarem correctamente
classificadas, existe também na “realidade” outra classe de ocupação do solo para a mesma
localização.
- Função CONFUSION
CONFUSION =
SE(OU(CMP1<>CLASS;CMP2<>CLASS);CMP1;FALSO);
SE(OU(CMP1<>CLASS;CMP2<>CLASS);CMP2;FALSO)
- Função AMBIGUITY
AMBIGUITY = SE(E(CMP1=CLASS;ICR<3);CMP2;SE(E(CMP2=CLASS;ICR<3);CMP1))
Na Figura 13, apresentamos um fluxograma com todos as etapas do processo metodológico utilizado
neste trabalho, desde os métodos utilizados para a selecção da imagem de 2005 para produção de
um mapa de ocupação do solo e a posterior avaliação da exactidão temática do mapa de ocupação
do solo produzido.
Metodologia
49
Figura 13. Fluxograma do processo metodológico.
PRIMAVERA
VERÃO
OUTONO
INVERNO
MELHOR MÊS
ANÁLISE EXPLORATÓRIA DA MELHOR IMAGEM PARA CADA
ESTAÇÃO DO ANO
AVALIAÇÃO DA QUALIDADE (Funções fuzzy)
MATRIZ DE CONFUSÃO
MAX
DIFFERENCE
RIGHT
MEMBERSHIP
CONFUSION & AMBIGUITY
MATRIZ DE CONFUSÃO (ICR)
MATRIZ DE CONFUSÃO (LCR)
MATRIZ DE CONFUSÃO (MOS)
INFO
RM
AÇ
ÃO
FINA
L DISPO
NIB
ILIZAD
A A
O U
TILIZAD
OR
Amostras de treino
Imagens aéreas
AGO
JAN
FEV
MAR
MAI
ABR
JUN
JUL
NOV
OUT
SET
DEZ
CLASSIFICAÇÃO MENSAL DA OCUPAÇÃO DO SOLO
BASE DE DADOSLANDEO
ELABORAÇÃO E ANÁLISE ESTATISTICA DA BASE
DE DADOS DE REFERÊNCIA
Caracterização da paisagem
ICR LCR MOS
AVALIAÇÃO DA EXACTIDÃO TRADICIONAL (Matriz de confusão)
Análise de resultados
50
4. ANÁLISE DE RESULTADOS
4.1 Análise estatística da base de dados de referência
A análise estatística da base de dados de referência numa primeira fase serviu para caracterizar a
paisagem portuguesa, relativamente ao ano de 2005. Esta análise foi realizada globalmente, como
também para casos particulares relativos aos índices de confiança, localização e classes de mosaico,
com o intuito de verificarmos que classes de ocupação do solo estão mais relacionadas com os
aspectos referidos anteriormente. Posteriormente ajudou-nos a compreender melhor os erros que
iremos obter no mapa produzido para cada classe de ocupação do solo e verificar se de alguma
forma estes poderão estar associados com as características de cada classe na paisagem
portuguesa.
4.1.1 Análise global das classes de ocupação do solo da base de dados de referência
Após a foto-interpretação das unidades amostrais de referência e da atribuição dos respectivos
índices de confiança e localização para cada unidade, elaborámos várias tabelas com os resultados
obtidos para as 1567 amostras. É de relembrar que o número total de unidades amostrais não é de
1900 mas sim de 1567, devido ao facto de termos retirado as amostras relativas às classes de água
(7), áreas permanentemente alagadas (5) e áreas ardidas (38). Seria de esperar que do processo de
amostragem aleatório estratificado, obtivéssemos um número semelhante de unidades amostrais por
classe. No entanto, isso não aconteceu devido à selecção das unidades amostrais ter sido realizada
com base num mapa que não representa da melhor maneira a realidade.
Analisando a Tabela 6, podemos constatar que a classe de ocupação do solo mais abundante na
“realidade” corresponde à classe de mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais
(41), com uma frequência de 24,8%. Este aspecto revela-nos a verdadeira génese de grande parte do
território português. De facto a estrutura da propriedade em Portugal Continental é em grande parte
baseada no minifúndio, levando a uma elevada diversidade de ocupações de pequena dimensão um
pouco por todo o território nacional. É no entanto também importante relembrar que esta amostragem
foi baseada em unidades amostrais de 300X300 m, o que deixa antever que a resolução do sensor
MERIS, poderá não ser a ideal para a caracterização do território de Portugal Continental,
nomeadamente em zonas com elevada heterogeneidade de ocupações.
Análise de resultados
51
Tabela 6. Número de observações da cada classe de ocupação do solo e respectiva frequência relativa na base de dados de referência.
Classes ID LABEL 1 LABEL 2 CMP 1 CMP 2 FCMP1 (%) FCMP2 (%) Áreas artificiais
contínuas 11 25 26 29 29 1,6 1,7
Áreas artificiais descontínuas 12 43 40 98 100 2,7 2,6
Culturas de sequeiro 21 113 79 198 183 7,2 5,0 Culturas de regadio 22 38 32 99 71 2,4 2,0
Arrozais 23 29 25 41 25 1,9 1,6 Culturas permanentes
de folha perene 241 20 22 65 79 1,3 1,4
Culturas permanentes de folha caduca 242 15 18 47 45 1,0 1,1
Mosaico de áreas agrícolas 25 76 76 - - 4,9 4,9
Vegetação arbustiva 34 204 208 303 330 13,0 13,3 Vegetação herbácea 35 63 99 96 148 4,0 6,3 Vegetação esparsa 36 31 31 34 37 2,0 2,0
Mosaico de vegetação 37 154 154 - - 9,8 9,8 Floresta de folhosas
fechada 311 83 67 113 82 5,3 4,3
Floresta de folhosas aberta 312 74 78 102 130 4,7 5,0
Floresta de resinosas fechada 321 99 80 149 103 6,3 5,1
Floresta de resinosas aberta 322 27 32 32 39 1,7 2,0
Floresta mista fechada 331 46 49 102 79 2,9 3,1
Floresta mista aberta 332 30 41 46 58 1,9 2,6 Mosaico de áreas agrícolas/áreas de
vegetação /áreas artificiais
41 389 389 - - 24,8 24,8
Solo nu 6 8 21 13 29 0,5 1,3 Total 1567 1567 1567 1567 100 100
A segunda classe mais predominante corresponde à classe de vegetação arbustiva (34), com uma
frequência de 13%. Esta grande representatividade da classe de vegetação arbustiva, deve-se a
vários aspectos. Um dos aspectos a salientar é o facto de as novas plantações terem sido incluídas
na classe de vegetação arbustiva, por ser a que em termos morfológicos se assemelha mais às
novas plantações. Outro dos aspectos que pode explicar o elevado número de observações de
vegetação arbustiva, é o facto de esta ser a comunidade vegetal mais importante e representativa
das geofitocenoses do território de Portugal Continental. O elevado número de unidades amostrais
classificadas como vegetação arbustiva pode estar também relacionada com o facto de a actividade
agrícola estar cada vez mais sujeita ao abandono. Assim sendo, o abandono da agricultura leva ao
reiniciar da sucessão vegetal típica (vegetação herbácea → vegetação arbustiva → floresta), na qual
a vegetação arbustiva representa o estádio intermédio, sendo esta a comunidade que permite um
melhor compromisso entre resiliência/resistência, adaptando-se facilmente a condições ecológicas
mais adversas (e.g. solos degradados, declives acentuados, regeneração após os incêndios). O facto
de Portugal Continental, ter sido violentamente fustigado por incêndios florestais, nomeadamente a
partir do ano de 2003, pode ajudar também a explicar a presença de um elevado número de unidades
amostrais classificadas como vegetação arbustiva, devido a uma regressão na série vegetativa.
Análise de resultados
52
Tendo em conta os aspectos mencionados, não é de estranhar que a classe de mosaico de
vegetação (37) também possua uma elevada frequência.
A classe de culturas de sequeiro (21), como a classe de vegetação herbácea, estão também muito
representadas na amostra, devido ao facto de esta ser a cultura agrícola que se adequa mais às
características orográficas, climáticas e edafoclimáticas do território nacional.
Também a classe de vegetação herbácea (35) é bastante classificada não como ocupação principal,
mas sim como classe de ocupação alternativa. Este aspecto deve-se à dificuldade em distinguir,
através de imagens aéreas relativas a um único período no tempo, a classe de vegetação herbácea e
a classe de culturas de sequeiro (21).
Em relação às classes florestais, os povoamentos abertos (312, 322 e 332) são muito menos
amostrados do que os povoamentos fechados (311, 321 e 331), à excepção da classe de floresta de
folhosas aberta (312). Este aspecto está relacionado com a grande ocupação de montados no
território nacional.
As classes de culturas de regadio (22) e arrozais (23), estão pouco representadas. No entanto,
nomeadamente em relação à classe de culturas de regadio, a sua representatividade aumenta nas
situações em que esta classe é uma das componentes de mosaico. A situação anteriormente referida
é bastante similar ao número de observações que se verificaram em relação às culturas permanentes
de folha perene (241) e às culturas permanentes de folha caduca (242).
A classe de vegetação esparsa (36), foi muito pouco observada na amostra. Julgamos que este facto
se deva especialmente a dois factores: dificuldade na interpretação desta classe devido à
semelhança com as classes de solo nú (6) e vegetação herbácea (35).
Em relação às áreas artificiais contínuas (11) e descontínuas (12), verificamos uma maior
predominância da classe de áreas artificiais descontínuas. Este facto já era de esperar, pois grande
parte do tecido urbano de Portugal Continental é constituído por áreas artificiais descontínuas,
reflectindo a matriz rural do país. Grande parte das áreas de tecido urbano continuo localizam-se
junto ao litoral e geralmente nas grandes cidades, estando por isso mais localizadas e daí não terem
sido tantas vezes observadas.
4.1.2 Análise dos índices de confiança da base de dados de referência
Na Tabela 7, apresentamos os resultados referentes à análise da base de dados de referência e o
número de observações para cada classe relativamente aos índices de confiança.
Análise de resultados
53
Tabela 7. Frequência de cada classe de ocupação de solo relativamente aos índices de confiança.
Muita confiança Confiança parcial Pouca confiança Classes
N Total f (%) Total f (%) Total f (%)
11 29 22 75,9 2 6,9 5 17,2
12 98 37 37,8 26 26,5 35 35,7
21 198 48 24,2 40 20,2 110 55,6
22 99 22 22,2 29 29,3 48 48,5
23 41 25 61,0 8 19,5 8 19,5
241 65 16 24,6 12 18,5 37 56,9
242 47 13 27,7 7 14,9 27 57,4
311 113 51 45,1 6 5,3 56 49,6
312 102 6 5,9 24 23,5 72 70,6
321 149 62 41,6 25 16,8 62 41,6
322 32 2 6,3 7 21,9 23 71,9
331 102 23 22,5 15 14,7 64 62,7
332 46 2 4,3 14 30,4 30 65,2
34 303 81 26,7 66 21,8 156 51,5
35 96 2 2,1 21 21,9 73 76,0
36 34 4 11,8 6 17,6 24 70,6
6 13 2 15,4 3 23,1 8 61,5
Total 1567 418 26,7 311 19,8 838 53,5
Legenda:
N: nº total de unidades amostrais para cada classe
f: frequência
Observando a Tabela 7, podemos verificar que cerca de metade das unidades amostrais foram foto
interpretadas com pouca confiança. Já as unidades amostrais com muita confiança e confiança
parcial, representam respectivamente 26,7% e 19,8% da base de dados de referência. O facto da
maior parte das unidades amostrais ter sido classificada com pouca confiança por parte do foto
intérprete, deve-se ao facto de à escala de um pixel MERIS, surgir geralmente mais do que uma
classe de ocupação do solo na unidade amostral. Assim sendo, o foto intérprete é incapaz de atribuir
muita confiança à classe de ocupação do solo principal atribuída a essa unidade amostral.
Relativamente à classe de áreas artificiais contínuas (11), podemos verificar que esta foi foto-
interpretada na sua grande maioria com muita confiança. Este aspecto já seria de esperar, pois esta
classe através de foto interpretação é facilmente distinguível. No entanto, o facto desta classe possuir
alguma frequência nos restantes níveis de confiança está relacionado com o facto de por vezes ser
difícil discriminar a percentagem entre esta classe e a classe de áreas artificiais descontínuas (12),
como também a possibilidade de esta classe estar contida em zonas de transição entre classes de
ocupação do solo, constituindo assim áreas de mosaico.
A classe de áreas artificiais descontínuas (12) possui, semelhantemente, elevada frequência de
unidades amostrais foto-interpretadas com muita confiança, e com pouca confiança. Neste caso
Análise de resultados
54
deve-se a esta classe muitas vezes se encontrar misturada com outras classes, nomeadamente
agrícolas e florestais, o que pode levar a uma redução da confiança por parte do foto-intérprete.
A classe de culturas de sequeiro (21), por seu lado, apresenta valores de frequência mais elevados
para unidades amostrais com pouca confiança. Este aspecto, está relacionado com o facto de por
vezes ser difícil por parte do foto-intérprete em diferenciar este tipo de ocupação através de imagens
aéreas uni-temporais, sendo difícil de distinguir esta classe da de vegetação herbácea (35), como por
vezes das culturas de regadio (22).
Também a classe de culturas de regadio (22), apresenta uma elevada frequência em unidades
amostrais foto-interpretadas com pouca confiança. No entanto, existem situações em que existe
muita certeza, nomeadamente nas culturas de regadio, por se ter conseguido detectar a presença de
pivots ou canais de rega.
Em relação à classe de arrozais (23), existe também uma frequência bastante elevada de unidades
amostrais foto-interpretadas com muita confiança, devido ao facto de esta classe estar associada na
sua grande maioria às lezírias do Tejo e Sado, sendo facilmente distinguível. No entanto, é de
salientar que a frequência de unidades amostrais foto-interpretadas com confiança parcial ou pouca
confiança, deve-se ao facto de nestas zonas a classe de arrozais se encontrar associada à classe de
culturas de regadio (22), formando mosaicos à escala de um pixel MERIS.
Relativamente às classes de culturas permanentes de folha perene (241) e de culturas permanentes
de folha caduca (242), podemos verificar que existe uma maior tendência, para o foto-intérprete
classificar essas unidades amostrais com pouca confiança ou com confiança parcial. Este facto deve-
se, por vezes, à dificuldade em conseguir discriminar entre estas classes, como também à mistura
que estas classes possuem com outras classes de ocupação do solo, formando mosaicos. Este
último aspecto pode ser observado na Tabela 9, pelo elevado número de unidades amostrais destas
classes classificadas como constituintes de mosaicos.
As classes de floresta de folhosas fechada (311), floresta de resinosas fechada (321) e floresta mista
fechada (331), apresentam, na sua maioria, unidades amostrais foto-interpretadas com muita
confiança como também com pouca confiança. Já seria de esperar a sua óptima separação, pois
estas classes podem ser facilmente distinguidas pela utilização da banda do infra-vermelho próximo
das imagens aéreas utilizadas. No entanto, existem unidades amostrais em que estas classes estão
no limite entre classes e que sejam classificadas como mosaico. No caso da classe de floresta mista
fechada, o aspecto anteriormente referido ainda é mais acentuado, pois é difícil distinguir o limiar de
percentagem mínimo (20%) do outro tipo de classe florestal representado na unidade amostral para
considerá-la como pertencendo à classe referida, tendo por isso uma maior frequência de unidades
amostrais foto-interpretadas com pouca confiança.
Análise de resultados
55
Em relação às classes de floresta de folhosas aberta (312), floresta de resinosas aberta (322) e
floresta mista aberta (332), podemos verificar que existe uma maior tendência para as unidades
amostrais serem foto-interpretadas com pouca confiança. No caso da classe de floresta de folhosas
aberta este aspecto está relacionado com as zonas de montado, nas quais o sub coberto poderá ser
constituído por culturas agrícolas de sequeiro ou vegetação herbácea, existindo dúvida entre
classificar a unidade amostral como montado ou agricultura. Para além deste aspecto, nas zonas de
eucaliptal aberto, poderá haver também uma forte componente arbustiva no sub-coberto e dúvida na
percentagem de coberto da floresta, levando assim à atribuição de confiança reduzida, o que também
acontece no caso da classe de floresta de resinosas aberta. Esta situação é similar para o caso dos
povoamentos mistos abertos, com a agravante de existir dúvida sobre se há percentagem suficiente
ou não de classes florestais para se considerar uma floresta mista.
Relativamente à classe de vegetação arbustiva (34), podemos verificar que esta classe possui uma
frequência elevada de unidades amostrais com pouca confiança. Este facto deve-se à multiplicidade
de situações em que esta classe pode surgir como mosaico, como povoamento puro, ou então em
situações em que é difícil por parte do foto-intérprete, diferenciar esta classe da classe de vegetação
herbácea (35). Este facto está relacionado com a altura da vegetação (< 30 cm) a partir da qual se
poderá considerar uma amostra como pertencente à classe de vegetação arbustiva e não à classe de
vegetação herbácea.
As classes de vegetação herbácea (35), vegetação esparsa (36) e solo nú (6), apresentam uma clara
tendência para serem foto-interpretadas com pouca confiança. Este facto, deve-se à dificuldade em
conseguir definir os limiares de percentagem de coberto que permitam optar pela classe de
vegetação herbácea (>15%) ou de vegetação esparsa (4%<>15%). O mesmo se passa em relação à
classe de solo nú (<4%), sendo difícil de diferenciar esta classe da classe de vegetação esparsa.
4.1.3 Análise dos índices de localização da base de dados de referência
De seguida, na Tabela 8 apresentamos os resultados referentes à análise da base de dados de
referência e o número de observações para cada classe relativamente aos índices de localização.
Analisando a Tabela 8, podemos verificar que os índices de localização se encontram distribuídos em
proporções semelhantes na base de dados de referência, tendo maior frequência por ordem
decrescente, as unidades amostrais foto-interpretadas em áreas heterogéneas, no limite e
homogéneas.
Análise de resultados
56
Tabela 8. Frequência de cada classe de ocupação de solo relativamente aos índices de localização.
Heterogéneo No limite Homogéneo Classes
N Total f (%) Total f (%) Total f (%)
11 29 7 24,1 10 34,5 12 41,4
12 98 45 45,9 33 33,7 20 20,4
21 198 81 40,9 50 25,3 67 33,8
22 99 48 48,5 35 35,4 16 16,2
23 41 2 4,9 23 56,1 16 39,0
241 65 34 52,3 22 33,8 9 13,8
242 47 27 57,4 17 36,2 3 6,4
311 113 24 21,2 39 34,5 50 44,2
312 102 28 27,5 30 29,4 44 43,1
321 149 35 23,5 62 41,6 52 34,9
322 32 9 28,1 14 43,8 9 28,1
331 102 48 47,1 40 39,2 14 13,7
332 46 28 60,9 12 26,1 6 13,0
34 303 127 41,9 82 27,1 94 31,0
35 96 49 51,0 26 27,1 21 21,9
36 34 9 26,5 5 14,7 20 58,8
6 13 3 23,1 6 46,2 4 30,8
Total 1567 604 38,5 506 32,3 457 29,2
Legenda:
N: nº total de unidades amostrais para cada classe
f: frequência
Em relação a cada uma das classes de ocupação do solo e a heterogeneidade na área envolvente a
cada unidade amostral, podemos verificar que a classe de áreas artificiais contínuas (11) encontra-se
frequentemente em zonas homogéneas e no limite entre ocupações. Este facto já seria de esperar,
pois esta classe está na sua grande maioria restrita aos grandes centros urbanos junto ao litoral,
constituindo grandes áreas metropolitanas (Lisboa e Porto), que formam estruturas lineares na
paisagem portuguesa. A sua grande extensão, permite também que a esta escala, exista uma
elevada frequência de unidades amostrais foto-interpretadas em zonas homogéneas. A classe de
áreas artificiais descontínuas (12), encontra-se maioritariamente distribuída em zonas heterogéneas e
no limite entre ocupações. Este facto já era esperado, pois estas áreas correspondem geralmente a
pequenas povoações em que na sua envolvente existem áreas com usos ligados à produção agrícola
e florestal.
Relativamente à classe de culturas de sequeiro (21), maior parte das unidades amostrais foram
classificadas como estando em áreas heterogéneas mas também em homogéneas. Este aspecto
seria de esperar pois, nomeadamente na região do Alentejo onde existe este tipo de ocupação em
maior proporção, esta classe ocupa áreas muito extensas que não aparecem fragmentadas à escala
de um pixel MERIS. Por outro lado, nomeadamente no norte do país esta classe surge mais
fragmentada, pois esta classe de ocupação do solo surge em áreas muito mais reduzidas.
Análise de resultados
57
As culturas de regadio (22), por seu lado, foram classificadas na sua maioria como estando em zonas
heterogéneas ou no limite entre duas ocupações do solo. Também seria de esperar este aspecto,
pois grande parte destas áreas podem ser encontradas nas lezírias do Tejo e Sado, indicando assim
que esta classe possui uma elevada linearidade ao longo das regiões referidas. Tal como para a
classe de culturas de sequeiro, nas regiões do norte do país estas áreas são muito mais reduzidas,
surgindo assim muito fragmentadas. Já no caso dos arrozais (23), esta classe apresenta uma maior
frequência em áreas homogéneas e no limite entre ocupações. Tal como no caso das culturas de
regadio estas culturas encontram-se na sua grande maioria e em maior extensão nas lezírias do Tejo
e Sado, surgindo assim linearmente ao longo da margem deste dois rios em zonas extensas e
homogéneas.
Em relação às culturas permanentes de folha perene (241), podemos verificar que à medida que vai
aumentando a homogeneidade, vai havendo um decréscimo da frequência. Já seria de esperar, pois
apesar de esta classe estar bastante representada em grandes áreas do Alentejo, esta também está
muito representada em zonas onde se praticam actividades agrícolas não extensivas e daí o seu
maior valor de frequência em zonas heterogéneas, nomeadamente no norte do país. O aspecto
anteriormente referido para a classe de culturas permanentes de folha perene é bastante similar para
a classe de culturas permanentes de folha caduca (242), sendo mais evidente a frequência em zonas
heterogéneas e no limite entre ocupações.
A classe de floresta de folhosas fechada (311) encontra-se na sua grande maioria em zonas
homogéneas. Este facto deve-se às extensas áreas de eucaliptal para produção de madeira e pasta
de papel que surgem um pouco por todo o país, principalmente na região Centro. Já em relação à
classe de floresta de folhosas aberta (312), podemos verificar que maior parte das áreas amostradas
se encontram em zonas homogéneas. Este aspecto já seria de esperar, pois esta classe representa
também os montados que ocupam extensas áreas na região Sul de Portugal Continental.
Relativamente à classe de floresta de resinosas fechada (321), podemos verificar que grande parte
das áreas amostradas correspondem a áreas no limite ou homogéneas. Já seria de esperar, pois este
tipo de povoamento florestal ocupa vastas extensões do território por ser um tipo de floresta utilizado
pela indústria de produção de madeira. Já a classe de floresta de resinosas aberta (322), surge na
sua grande maioria em zonas no limite entre ocupações. Julgamos que este aspecto esteja
relacionado com o facto de estes povoamentos surgirem em zonas de corte e novas plantações
incluídas nas vastas manchas da classe de floresta de resinosas fechada.
Em relação à classe de floresta mista fechada (331), esta apresenta uma maior frequência em zonas
localizadas no limite e heterogéneas, com igual frequência. Julgamos que este aspecto possa estar
relacionado com a ocorrência em zonas de transição entre povoamentos florestais de folhosas e
resinosas, ou com povoamentos deste tipo de floresta que à escala do pixel MERIS, surgem
fragmentados na paisagem portuguesa. A classe de floresta mista aberta (332), por seu lado
Análise de resultados
58
apresenta uma maior frequência em zonas heterogéneas, indicando que esta classe se encontra
fragmentada na paisagem portuguesa.
Relativamente à classe de vegetação arbustiva (34), esta encontra-se distribuída equitativamente
pelos vários tipos de localização, com mais destaque para zonas heterogéneas e no limite entre
ocupações. Pensamos que este aspecto possa estar relacionado com o elevado número de unidades
amostrais classificadas como vegetação arbustiva, nas mais diversas combinações de classes ou
então como classe pura em cada amostra.
A classe de vegetação herbácea (35), apresentou maior tendência para estar localizada em áreas
heterogéneas. Seria de esperar que esta classe se encontrasse maioritariamente em zonas
homogéneas, nomeadamente nas vastas planícies alentejanas associada aos montados, mas tal não
aconteceu. Julgamos que esta heterogeneidade esteja relacionada com a vegetação herbácea que
se encontra em zonas de montanha, que a esta resolução espacial apresenta-se fragmentada na
paisagem portuguesa. Por outro lado, julgamos que este aspecto possa estar também relacionado
com a dificuldade em distinguir os limites desta classe, por ser uma classe de ocupação de solo muito
dinâmica.
Relativamente à classe de vegetação esparsa (36), verificamos que esta surge com maior frequência
em áreas homogéneas. Seria também de esperar este aspecto, pois esta classe está associada às
áreas de alta montanha do norte de Portugal, que geralmente são constituídas por este tipo de
vegetação.
Em relação à classe de solo nú (6), esta na sua maioria surge em zonas homogéneas ou no limite
entre ocupações. No primeiro caso, julgamos que este aspecto está associado ao facto de esta
classe existir nas zonas de alta montanha. Por outro lado, as situações referentes a áreas no limite
entre ocupações julgamos que se tratem de zonas do litoral, nomeadamente praias, que à escala do
pixel MERIS, não têm largura suficiente para serem recolhidas amostras apenas com solo nú.
4.1.4 Análise das classes de mosaicos da base de dados de referência
Na Tabela 9, apresentamos os resultados referentes à análise da base de dados de referência e o
número de observações para cada classe relativamente às classes de mosaico.
Observando a Tabela 9, podemos verificar que 39,5% das unidades amostrais foto-interpretadas
pertencem às classes de mosaico, sendo maior a parte relativa à classe de mosaico de culturas
agrícolas/áreas de vegetação/áreas artificiais.
Análise de resultados
59
Tabela 9. Frequência de mosaicos em cada classe de ocupação do solo relativamente às classes de mosaico.
Mosaico de áreas agrícolas
Mosaico de áreas com vegetação
Mosaico de áreas agrícolas/áreas de vegetação/áreas
artificiais Mosaicos (Total)
Classe N
Total f (%) Total f (%) Total f (%) Total (%)
11 29 0 0,0 0 0,0 4 13,8 13,8
12 98 0 0,0 0 0,0 55 56,1 56,1
21 198 27 13,6 0 0,0 58 29,3 42,9
22 99 14 14,1 0 0,0 47 47,5 61,6
23 41 3 7,3 0 0,0 9 22,0 29,3
241 65 18 27,7 0 0,0 27 41,5 69,2
242 47 14 29,8 0 0,0 18 38,3 68,1
311 113 0 0,0 16 14,2 14 12,4 26,5
312 102 0 0,0 7 6,9 21 20,6 27,5
321 149 0 0,0 30 20,1 20 13,4 33,6
322 32 0 0,0 3 9,4 2 6,3 15,6
331 102 0 0,0 25 24,5 31 30,4 54,9
332 46 0 0,0 3 6,5 13 28,3 34,8
34 303 0 0,0 50 16,5 49 16,2 32,7
35 96 0 0,0 19 19,8 14 14,6 34,4
36 34 0 0,0 1 2,9 2 5,9 8,8
6 13 0 0,0 0 0,0 5 38,5 38,5
Total 1567 76 4,9 154 9,8 389 24,8 39,5
Legenda:
N: nº total de unidades amostrais para cada classe
f: frequência
Em relação às classes de ocupação do solo, as classes com maior frequência de mosaicos, são as
classes de áreas artificiais descontínuas (12), culturas de sequeiro (21), culturas de regadio (22),
culturas permanentes de folha perene (241), culturas permanentes de folha caduca (242) e floresta
mista fechada (331), tendo sido classificadas com maior frequência como mosaico de culturas
agrícolas/áreas de vegetação/áreas artificiais. Este aspecto deixa antever que estas classes surjam
mais combinadas com classes de vegetação ou de áreas artificiais, estando muito misturadas em
conjunto com outras classes.
Já as classes de áreas artificias contínuas (11), vegetação esparsa (36) e floresta mista aberta (332),
têm poucas amostras classificadas como mosaico. Julgamos que este aspecto esteja relacionado
com o facto de as duas últimas classes mencionadas, serem de difícil distinção entre outras, não se
conseguindo definir bem as unidades de paisagem. Em relação à classe de áreas artificiais
contínuas, julgamos que esteja relacionado com o facto de esta classe se poder situar em zonas
homogéneas.
Análise de resultados
60
4.2 Exactidão global das imagens MERIS validadas com as amostras de treino
Para a produção do mapa, que servirá de base ao teste da nossa metodologia de avaliação,
realizámos uma avaliação inicial da melhor data mensal para a classificação da ocupação do solo em
Portugal Continental. Assim sendo, fez-se uma classificação com amostras de treino e teste para o
ano de 2005 com imagens MERIS, para as 17 classes da nomenclatura, utilizando o algoritmo da
Máxima Verosimilhança. Os resultados desta avaliação são apresentados na Tabela 10.
Tabela 10. Exactidão global da classificação efectuada de cada imagem MERIS para cada mês do ano.
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
84,8% 83,5% 80,9% 84,4% 82,1% 84,5% 83,6% 85,8% 85,7% 83,8% 83,8% 82,3%
Observando a Tabela 10, podemos verificar que a exactidão global para o ano de 2005 do conjunto
das 12 imagens MERIS, está compreendida entre os 80,9% (Março) e os 85,8% (Agosto). Em relação
a cada estação do ano, as imagens que obtiveram melhores resultados foram: Janeiro (Inverno); Abril
(Primavera), Agosto (Verão) e Novembro (Outono). As imagens de cada um destes meses, foram
assim seleccionadas para realizar uma análise estatística multivariada, com o intuito de determinar
qual destas imagens permitiria uma melhor separação entre as classes de ocupação do solo.
4.3 Análise estatística multivariada da separabilidade espectral intra-anual das classes de ocupação do solo
Esta análise teve como objectivo determinar qual das imagens seleccionadas anteriormente, de cada
estação do ano, permite uma melhor separabilidade entre classes de ocupação do solo, para assim
podermos seleccionar a imagem sobre a qual iremos produzir um mapa de ocupação do solo e
aplicarmos a nossa metodologia de validação.
4.3.1 Análise dos descritores estatísticos
Após a elaboração de boxplots para cada classe de ocupação do solo e para cada imagem relativa a
uma estação do ano, obtivemos os resultados apresentados nas Figuras 13-16. Com esta análise
pretendemos comparar, apenas em relação ao NDVI, se existe semelhança dos descritores
estatísticos entre classes de ocupação do solo, como também verificar se estes variam muito para
cada classe. É de salientar que os resultados obtidos, podem ser diferentes se utilizarmos mais
bandas na análise. No entanto, como este é um estudo exploratório, queremos ter apenas uma
percepção relativa da variabilidade intra e inter classe para cada classe de ocupação do solo.
Análise de resultados
61
Analisando a Figura 14. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Janeiro.,
podemos verificar que as classes de áreas artificiais contínuas (11), áreas artificiais descontínuas
(12), arrozais (23), vegetação arbustiva (34), vegetação esparsa (36) e florestas fechadas (311,321 e
331), têm uma variabilidade intra-classe reduzida. No entanto, em relação à classe de vegetação
arbustiva é de salientar a presença de alguns outliers que podem afectar a sua variabilidade intra-
classe. As restantes classes apresentam uma variabilidade intra- classe já mais elevada,
nomeadamente as classes de florestas abertas (312, 322 e 332) e culturas permanentes de folha
caduca (242), o que indicia que estas classes tenham uma maior tendência para se confundirem com
outras. É também de salientar que as classes de floresta fechada se sobrepõem verticalmente, ou
seja, têm uma variabilidade inter-classe reduzida indicando que estas se podem confundir neste mês
do ano. O mesmo acontece entre as classes de floresta aberta.
Figura 14. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Janeiro.
Analisando agora as boxplots, para a imagem do mês de Abril (Figura 15), podemos verificar que as
classes de ocupação do solo com menor variabilidade intra-classe, são as mesmas da imagem de
Janeiro. No entanto, é de salientar que as classes que apresentam vegetação possuem uma maior
variabilidade intra-classe, aumentando assim ainda mais a possibilidade de se misturarem entre elas.
Este facto acontece porque estamos na Primavera e nesta altura do ano as espécies vegetais que
pertencem a uma determinada classe podem estar em estados vegetativos diferentes. Tal como no
mês de Janeiro, as classes de povoamentos florestais fechados (311, 321, 331) sobrepõem-se
verticalmente entre si, como também as classes de povoamentos florestais abertos (312, 322, 332),
sugerindo que estas classes se possam confundir entre si, dentro de cada grupo.
Análise de resultados
62
Figura 15. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Abril.
Relativamente ao mês de Agosto (Figura 16), podemos verificar que as classes com menor
variabilidade intra-classe correspondem às classes de solo nú (6), áreas artificiais contínuas (11),
culturas de sequeiro (21), arrozais (23), culturas permanentes (241 e 242), floresta de folhosas
fechada (311) e floresta de resinosas fechada (321). Este aspecto anteriormente referido é bastante
evidente na classe de culturas de sequeiro, devendo-se ao facto destas culturas em Agosto já terem
sido colhidas e daí o seu valor médio de NDVI ser muito reduzido, como também estar compreendido
dentro de um intervalo bastante reduzido. Verificamos que este mês possui bastantes classes com
uma variabilidade intra-classe muito reduzida, o que deixa antever que a imagem relativa a este mês
seja uma boa opção para uma posterior classificação. Por outro lado, as classes de culturas de
regadio (22), vegetação herbácea (35) e floresta mista aberta (332), possuem uma elevada
variabilidade intra-classe. É de salientar que relativamente a este mês, já não existe uma
sobreposição vertical entre as classes que pertencem aos povoamentos florestais fechados (311,
321, 331), como também entre as classes que pertencem de povoamentos florestais abertos (312,
322, 332).
Análise de resultados
63
Figura 16. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Agosto.
Relativamente ao mês de Novembro (Figura 17), podemos verificar que no geral todas as classes não
possuem uma elevada variabilidade intra-classe. No entanto, é de salientar que existe bastante
linearidade de todas as classes em relação ao valor de NDVI, ou seja, quase todas as classes têm o
seu valor médio no mesmo valor de ordenada, deixando antever que grande parte das classes de
ocupação do solo se confundam entre si no mês de Novembro.
Figura 17. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Novembro.
Análise de resultados
64
4.3.2 Análise factorial discriminante da separabilidade espectral das classes de ocupação do solo
Após a elaboração dos gráficos de dispersão relativamente às componentes um e dois para os
meses de Janeiro, Abril, Agosto e Novembro obtivemos os resultados apresentados nas Figuras 18 a
21. Pretendemos com esta análise verificar que classes de ocupação do solo maximizam a
separação entre indivíduos de diferentes grupos (classes de ocupação do solo) e minimizam a
separação entre indivíduos do mesmo grupo (classe de ocupação do solo). É de referir, que esta
análise é apenas exploratória e que a separação das classes de ocupação do solo não depende
apenas da informação contida nestas duas componentes, podendo as restantes componentes
contribuir para uma melhor separabilidade das classes de ocupação do solo.
Analisando a Figura 18. Componentes 1 e 2 para o mês de Janeiro., podemos verificar que as classes de
ocupação do solo que se afastam mais da principal nuvem de dispersão são as classes relativas às
áreas artificiais contínuas (11) e as áreas artificiais descontínuas (12) ao longo do eixo das abcissas,
havendo no entanto, alguma sobreposição entre estas duas classes. Em relação às restantes
classes, podemos verificar que de um modo geral todas se confundem, ou seja, se sobrepõem na
nuvem de dispersão principal. No entanto, é de salientar o facto de haver algum afastamento da
nuvem principal, relativamente às classes de culturas de sequeiro (21), culturas de regadio (22) e
culturas permanentes de folha caduca (242), apesar de se sobreporem entre elas. Os aspectos
anteriormente mencionados, deixam antever que existe pouca separabilidade entre maior parte das
classes de ocupação do solo.
Figura 18. Componentes 1 e 2 para o mês de Janeiro.
Em relação às componentes um e dois do mês de Abril (Figura 19), podemos verificar que as classes
de áreas artificiais (11 e 12) apresentam um padrão de dispersão semelhante ao do mês de Janeiro.
Análise de resultados
65
No entanto, algumas das classes de ocupação do solo agrícolas, nomeadamente as culturas de
regadio (22), as culturas permanentes de folha caduca (242) e os arrozais (23) afastam-se ao longo
do eixo das ordenadas da principal nuvem de dispersão. É de salientar o facto de na imagem de Abril,
a classe relativa às culturas de sequeiro (21), já não se afastar tanto da nuvem de dispersão principal.
Este aspecto pode estar relacionado com o estado de crescimento destas culturas, que nesta altura
do ano já apresentarem um grau de desenvolvimento no qual a sua reflectância se começa a
assemelhar, por exemplo, à classe de vegetação herbácea (35). Podemos constatar também que as
classes de culturas permanentes de folha perene (241) e de solo nú (6) afastam-se da nuvem de
dispersão principal, apesar deste afastamento ser muito reduzido.
Em termos de sobreposição de classes, podemos constatar que existe sobreposição das nuvens
entre as classes de áreas artificiais contínuas (11) e áreas artificiais descontínuas (12); culturas de
regadio (22), arrozais (23) e culturas permanentes de folha caduca (242); culturas de sequeiro (21) e
culturas permanentes de folha perene (241); as restantes classes.
Figura 19. Componentes 1 e 2 para o mês de Abril.
Relativamente ao mês de Agosto (Figura 20), podemos verificar que existem dois grupos de classes
de ocupação do solo que se separam claramente da principal nuvem de dispersão: ao longo do eixo
das abcissas as classes de áreas artificiais contínuas (11) e áreas artificiais descontínuas (12) e ao
longo do eixo das ordenadas, as classes de culturas de regadio (22) e de arrozais (23). É de notar
ainda algum afastamento em relação à nuvem principal, ao longo do eixo das abcissas, da classe de
culturas permanentes de folha perene (241), apesar deste afastamento não ser muito acentuado.
Outras das classes que apresentam um certo afastamento, são as classes de solo nú (6), e menos
evidente, na de culturas de sequeiro (21) e floresta de folhosas fechada (311). Todas as outras
classes, no geral, confundem-se todas entre elas, à excepção de algumas situações pontuais
anteriormente referidas.
Análise de resultados
66
Figura 20. Componentes 1 e 2 para o mês de Agosto.
Observando a Figura 21, relativa ao mês de Novembro, podemos verificar que ao longo do eixo das
abcissas, as classes de áreas artificiais contínuas (11) e áreas artificiais descontínuas (12), se
separam claramente da nuvem de dispersão principal. Em relação ao eixo das ordenadas, podemos
verificar que existem várias classes, nomeadamente agrícolas, que se separam da nuvem de
dispersão principal. Estas classes são as de culturas de sequeiro (21), culturas de regadio (22),
arrozais (23), culturas permanentes de folha perene (241) e culturas permanentes de folha caduca
(242). No entanto, apesar desta separação da nuvem principal todas estas classes se sobrepõem
entre si. As restantes classes encontram-se todas aglomeradas na nuvem principal, estando também
todas sobrepostas entre si.
Figura 21. Componentes 1 e 2 para o mês de Novembro.
Análise de resultados
67
4.3.3 Distância entre classes de ocupação do solo
Após a elaboração dos dendrogramas, relativamente à reflectância de cada banda para as imagens
dos meses de Janeiro, Abril, Agosto e Novembro nas amostras de treino, obtivemos os resultados
apresentados nas Figuras 22 a 25. Pretendemos com esta análise, avaliar a separabilidade entre as
classes de ocupação do solo, considerando todas as bandas de cada imagem estudada. O eixo das
ordenadas indica a distância entre os centros do espaço dimensional característico de cada classe.
Quanto maior fôr esse valor, maior será a distância entre classes de ocupação do solo.
Analisando a Figura 22, e considerando a distância=20, podemos considerar que para o mês de
Janeiro existem quatro grandes grupos de classes de ocupação do solo, em termos da sua
separabilidade espectral. Assim sendo, da esquerda para a direita do dendrograma temos: grupo 1 -
os povoamentos florestais (311, 312, 321, 322, 331 e 332) e vegetação arbustiva (34); grupo 2 -
classes de vegetação herbácea (35), vegetação esparsa (36) e solo nú (6); grupo 3 - classes de
agricultura (21, 22, 241, 242); grupo 4 - áreas artificiais (11 e 12).
Relativamente ao primeiro grupo, podemos verificar uma menor distância entre as classes de
povoamentos florestais abertos (312, 322 e 332) e a classe de vegetação arbustiva (34). Este aspecto
poderá estar relacionado com o sinal que é transmitido pelo sub-coberto e captado pelo sensor. Ainda
dentro deste grupo, podemos verificar também uma distância reduzida entre as classes de
povoamentos florestais fechados (311, 321 e 331). É de salientar que os povoamentos florestais de
folhosas (311 e 312), possuem uma maior proximidade com os povoamentos florestais mistos (331 e
332) do que com os povoamentos florestais de resinosas (321 e 322). Este aspecto verifica-se tanto
relativamente aos povoamentos florestais abertos como fechados.
Em relação ao segundo grupo, podemos verificar uma menor distância entre as classes de vegetação
herbácea (35) e vegetação esparsa (36), ficando a classe de solo nú (6) mais afastada. Este aspecto
deixa antever uma maior semelhança espectral entre a classe de vegetação herbácea e a classe de
vegetação esparsa. Durante o processo de foto-interpretação também se verificou esta dificuldade na
discriminação destas classes que se deveu à dificuldade em descriminar o limite de percentagem de
coberto para cada uma destas classes (solo nu (<4%); vegetação esparsa (4%<>15%); vegetação
herbácea (>15%)).
No terceiro grupo, podemos considerar dois sub-grupos distintos: um relativo às classes de culturas
de sequeiro (21) e culturas permanentes de folha perene (241) e outro mais distante deste, relativo às
classes de culturas de regadio (22), arrozais (23) e culturas permanentes de folha caduca (242).
Estranhamente, existe uma maior proximidade espectral no mês de Janeiro entre a classe de arrozais
e a classe de culturas permanentes de folha caduca do que relativamente à classe de culturas de
regadio.
Análise de resultados
68
O quarto e último grupo é apenas composto pelas áreas artificiais contínuas e descontínuas. De facto
este grupo é o mais distante de todos os outros, aspecto este que já era esperado. No entanto, é de
salientar a pouca distância que existe entre ambas as classes anteriormente referidas.
Figura 22. Dendrograma para a imagem do mês de Janeiro.
Em relação às amostras de cada uma das classes, caracterizadas pela informação espectral da
imagem do mês de Abril, podemos verificar através da análise da Figura 23 e considerando
novamente a distância=20, que existem quatro grandes grupos de classes de ocupação do solo.
Assim sendo, da esquerda para a direita do dendrograma: grupo um - classes de povoamentos
florestais (311, 312, 321, 322, 331 e 332), vegetação arbustiva (34), vegetação herbácea (35),
vegetação esparsa (36) e solo nú (6); grupo dois - culturas de sequeiro (21) e culturas permanentes
de folha perene (241); grupo três - culturas de regadio (22), culturas permanentes de folha caduca
(242) e os arrozais (23); grupo quatro - áreas artificiais contínuas (11) e descontínuas (12).
Em relação ao primeiro grupo, podemos verificar que este é composto pelas mesmas classes do
grupo um da imagem relativa a Janeiro (Figura 22), mais as classes de vegetação herbácea (35),
vegetação esparsa (36) e solo nú (6). È de salientar que para a imagem de Abril, a classe de
vegetação herbácea se encontra mais distante das classes de vegetação esparsa e solo nú. Este
aspecto está relacionado com o facto de na Primavera a vegetação herbácea estar no seu vigor
máximo e dai a sua maior distância relativamente às classes de vegetação esparsa e solo nú.
O segundo grupo é apenas composto pelas classes de culturas de sequeiro (21) e culturas
permanentes de folha perene (241), estando no entanto estas classes muito pouco distantes entre si.
Este grupo revela que houve uma separação entre estas duas classes e as restantes classes
agrícolas que para a imagem do mês de Janeiro (Figura 23) se encontravam todas no mesmo grupo.
Julgamos que esta separação esteja relacionada com o facto de na Primavera as culturas de
sequeiro já se encontrarem num avançado estado de desenvolvimento e por outro lado as culturas
Análise de resultados
69
permanentes de folha perene, podem apresentar no sub-coberto culturas de sequeiro ou vegetação
herbácea (35).
Relativamente ao terceiro grupo, podemos verificar uma maior proximidade entre as classes de
culturas de regadio (22) e de culturas permanentes de folha caduca (242), estando a classe de
arrozais mais distante destas duas (23).
O quarto e último grupo é novamente composto pelas classes de áreas artificiais contínuas (11) e
descontínuas (12), estando estas classes também muito próximas entre si, tal como na cartografia
produzida para o mês de Janeiro.
Figura 23. Dendrograma para a imagem do mês de Abril.
Analisando agora a Figura 24, relativamente às amostras de cada uma das classes caracterizadas
pela informação espectral da imagem de Agosto e considerando a distância=20, podemos verificar
que existem agora seis grupos de classes de ocupação do solo. Especificamente, cada grupo
engloba as seguintes classes de ocupação do solo: grupo um - classes de povoamentos florestais
abertos e fechados (311, 312, 321, 322, 331, 332) e vegetação arbustiva (34); grupo dois - ao qual
pertencem as classes de vegetação herbácea (35), vegetação esparsa (36) e solo nú (6); grupo três -
classe de culturas de sequeiro (21); grupo quatro - ao qual pertencem as classes de culturas
permanentes de folha perene (241) e de culturas permanentes de folha caduca (242); grupo cinco -
ao qual pertencem as classes de culturas de regadio (22) e de arrozais (23); grupo seis - ao qual
pertencem as classes de áreas artificiais contínuas (11) e áreas artificiais descontínuas (12). O facto
de com a imagem de Agosto existirem 6 grupos, sugere que com esta imagem se consiga uma
melhor separabilidade entre classes de ocupação do solo. Para além disso, podemos verificar que o
valor máximo de distância, chega agora aos 140, outro forte indício de que com a imagem de Agosto,
conseguiremos uma melhor separabilidade entre classes de ocupação do solo.
Análise de resultados
70
Analisando o primeiro grupo, podemos verificar que existe uma grande proximidade entre os
povoamentos florestais abertos (312, 322 e 332) e fechados (311, 321, 331) de cada um dos tipos de
povoamentos florestais (folhosas ou resinosas). Este aspecto deixa antever que com a imagem de
Agosto, se consiga uma melhor discriminação entre os diferentes tipos de floresta. A classe de
vegetação arbustiva (34), encontra-se mais próxima das classes de povoamentos florestais mistos
(331 e 332), sendo as classes de povoamentos de resinosas (321 e 322) as que seguidamente se
encontram mais próximas dessa classe. Os povoamentos florestais de folhosas (311 e 312), são as
classes que se encontram mais afastadas das classes de ocupação do solo anteriormente
mencionadas.
O segundo grupo é em tudo semelhante ao segundo grupo da imagem de Janeiro, estando mais
próximas entre si as classes de vegetação herbácea (35) e vegetação esparsa (36) e a classe de solo
nú (6) mais afastada. Este novo agrupamento destas classes (na imagem do mês de Abril, tínhamos
verificado que a classe de vegetação herbácea se tinha separado das classes de vegetação esparsa
e solo nú), está relacionado com o facto de a vegetação herbácea no Verão se encontrar na sua
grande maioria seca.
O terceiro grupo apenas contempla a classe de culturas de sequeiro (21), estando este grupo mais
próximo do grupo quatro, que é composto pelas classes de culturas permanentes de folha perene
(241) e de culturas permanentes de folha caduca (242). Este facto deve-se às culturas de sequeiro
nesta altura do ano já terem sido colhidas, havendo assim uma mudança radical na sua constituição e
consequentemente na sua reflectância.
Relativamente ao quarto grupo, podemos verificar que não existe uma grande distância entre as
classes de ocupação do solo que o constituem.
O quinto grupo é apenas constituído pelas classes de culturas de regadio (22) e arrozais (23), não
estando muito distantes entre si.
O sexto e último grupo é em tudo semelhante ao grupo quatro, relativamente aos meses de Janeiro e
de Abril, não se distanciando também substancialmente entre si.
Análise de resultados
71
Figura 24. Dendrograma para a imagem do mês de Agosto.
Relativamente às unidades amostrais de cada uma das classes caracterizadas pela informação
espectral da imagem de Novembro, podemos verificar através da análise da Figura 25 e
considerando a distância=20, que existem três grupos. Grupo um - engloba as classes de
povoamentos florestais (311, 312, 321, 322, 331 e 332), vegetação arbustiva (34), vegetação
herbácea (35), vegetação esparsa (36) e solo nú (6); grupo dois - engloba as classes de culturas de
sequeiro (21), culturas de regadio (22), culturas permanentes de folha perene (241), culturas
permanentes de folha caduca (242) e arrozais (23); grupo três - englobas as classes de áreas
artificiais contínuas e descontínuas. É de salientar que a presença de apenas 3 grupos para a
imagem de Novembro, como também uma distância máxima entre classes de 80, deixam antever que
esta imagem seja uma má opção para a produção de uma cartografia de ocupação do solo, pois é a
imagem que proporciona uma menor distância entre classes de ocupação do solo.
Observando o primeiro grupo, podemos verificar que a classe de floresta de folhosas fechada (311)
está muito pouco distante da classe de floresta mista aberta (332). A classe de floresta mista fechada
(331) é a classe menos distante das classes referidas anteriormente. Este aspecto reforça o que foi
dito anteriormente sobre a separabilidade espectral de cada classe de ocupação do solo para a
imagem de Novembro. De facto, esta imagem mistura classes de ocupação do solo completamente
distintas (floresta de folhosas fechada (311), com floresta mista aberta (332)), realçando mais a sua
fraca apetência para a produção de uma cartografia de ocupação do solo. Relativamente à classe de
vegetação arbustiva (34) esta é a classe menos distante das classes referidas anteriormente. As
classes de povoamentos de resinosas (321 e 322), encontram-se muito pouco distantes entre si e são
as classes mais próximas das classes referidas anteriormente. As classes de vegetação herbácea
(35) e de floresta de folhosas aberta (312), estão também muito próximas entre si e são as classes
mais próximas das classes referidas anteriormente. Mais distante destas classes, encontram-se as
classes de vegetação esparsa (36) e solo nú (6). Através desta análise, podemos verificar que existe
uma grande confusão entre todas estas classes. Relativamente aos povoamentos de folhosas
Análise de resultados
72
abertos (312) se encontrarem muito pouco distantes da classe de vegetação herbácea (35), pode ser
explicado pelo facto desta classe florestal, ser na sua grande maioria respeitante a montados de
azinho e sobro, os quais possuem no seu sub-coberto, nesta altura do ano alguma componente
vegetativa.
Em relação ao segundo grupo, podemos verificar que as classes de culturas de sequeiro (21) e de
culturas permanentes de folha caduca (242), estão muito próximas, sendo a classe dos arrozais (23)
mais próxima destas duas classes referidas anteriormente. As classes relativas às culturas de regadio
(22) e culturas permanentes de folha perene (241) estão muito próximas entre si e seguidamente
próximas do grupo de classes referido anteriormente. Temos novamente as classes agrícolas todas
incluídas no mesmo grupo. Isto deve-se ao facto de todas as culturas agrícolas não se encontrarem
no campo, ou então já foram semeadas, não possuindo ainda uma componente vegetativa muito
forte.
O terceiro grupo é novamente composto pelas classes de áreas artificiais contínuas (11) e
descontínuas (12), sendo este o grupo mais distante dos grupos um e dois.
Figura 25. Dendrograma para a imagem do mês de Novembro.
Após esta análise, optámos pela imagem de Agosto para a produção automática do mapa final pois é
a que permite a menor variabilidade intra e inter-classe, como também é a que permite obter uma
maior separação entre classes de ocupação do solo. Já estaríamos à espera que assim fosse, pois
este mês corresponde à altura do ano em que o ângulo zenital entre o Sol e a Terra é menor. Para
além disso, segundo Gonçalves et al. (2006), este é o período do ano que permite uma maior
separação entre classes, como também é a imagem que possui a menor cobertura de nuvens de todo
o conjunto das imagens MERIS, para o ano de 2005. O mapa produzido pode ser consultado no
Anexo 6.
Análise de resultados
73
4.4 Avaliação da exactidão temática da cartografia de ocupação do solo
Neste capítulo apresentamos a avaliação da exactidão temática da cartografia de ocupação do solo
que serviu de base para este estudo. Esta cartografia foi derivada anteriormente da imagem MERIS
do mês de Agosto, através do algoritmo da máxima verosimilhança. Posteriormente, o mapa
produzido foi avaliado através da metodologia tradicional (matriz de confusão) e de funções fuzzy que
nos permitiram compreender a génese dos erros do mapa e relacioná-los com as análises feitas
anteriormente, nomeadamente com a análise estatística da base de dados e com a análise
exploratória da imagem da qual se derivou o mapa produzido.
4.4.1 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de confusão
Na Tabela 11, apresentamos o cruzamento entre a classificação do mapa produzido e a primeira
classificação da base de dados de referência (CMP 1), através de uma matriz de confusão, tendo em
conta a área de cada estrato.
Tabela 11. Matriz de confusão (Classificação do mapa VS CMP 1 das amostras de referência).
Amostras de referência Classes
11 12 21 22 23 241 242 311 312 321 322 331 332 34 35 36 6
Total E.U.(%)
11 8 6 1 1 16 50,0
12 17 48 3 1 1 1 1 3 5 3 6 1 90 53,3
21 1 40 1 2 1 1 3 6 1 56 71,4
22 7 8 52 11 5 3 2 2 7 6 1 104 50,0
23 3 2 12 17 1 4 1 40 42,5
241 1 12 51 8 3 26 14 12 28 1 1 5 4 48 19 2 3 238 10,9
242 2 10 40 10 3 20 16 5 12 1 21 9 2 2 153 10,5
311 1 4 27 7 12 4 9 1 65 41,5
312 1 24 3 1 4 3 39 39 7 9 3 6 43 8 3 193 20,2
321 25 25 100,0
322 4 2 19 7 1 3 19 2 1 58 12,1
331 1 2 2 2 6 3 26 2 45 9 20 8 126 35,7
332 3 13 2 2 3 5 8 33 7 5 7 17 7 1 113 6,2
34 3 2 1 1 4 4 13 2 8 1 43 5 1 88 48,9
35 1 8 4 4 2 4 3 6 1 7 4 33 14 11 2 104 13,5
36 3 1 1 1 1 4 3 6 3 1 2 31 9 7 73 9,6
Cla
ssifi
caçã
o do
map
a
6 2 1 1 1 1 1 7 2 8 1 25 4,0
Total 29 98 198 99 41 65 47 113 102 149 32 102 46 303 96 34 13 1567
E.P.(%) 37,5 40,6 18,7 42,2 90,7 34,0 31,8 26,0 34,1 5,4 27,6 43,7 17,2 13,1 16,6 26,0 9,6 E.G.(%) = 23,1
Legenda:
E.P.:Exactidão do produtor
Análise de resultados
74
E.U.: Exactidão do utilizador
E.G.: Exactidão global
Analisando a Tabela 11, podemos verificar que a exactidão global foi de 23,1%, após o cruzamento
das amostras de referência com a cartografia produzida. Este valor é muito reduzido, o que deixa
antever que as imagens MERIS, poderão não ser as mais adequadas para a elaboração de
cartografias de ocupação do solo para Portugal Continental, com uma nomenclatura tão detalhada a
esta resolução espacial. No entanto, é necessário analisar mais concretamente cada classe de
ocupação do solo, relativamente aos erros de omissão e de comissão, para se poderem retirar
ilações mais precisas.
Relativamente aos erros de omissão, ou seja em relação à exactidão do produtor, podemos verificar
que no geral os erros foram elevados, nomeadamente as classes de culturas de sequeiro (21) de
floresta de resinosas fechada (321), floresta mista aberta (332), vegetação arbustiva (34), vegetação
herbácea (35) e solo nu (6). Podemos assim afirmar que se tivesse sido apenas atribuída uma classe
de ocupação do solo a cada unidade amostral, seria recomendável que as amostras de referência,
relativas a estas classes, fossem verificadas. Por outro lado as classes com erros de omissão
menores, destacam-se as classes de arrozais (23), com uma exactidão do produtor de 90,7%, áreas
artificiais descontínuas (12), culturas de regadio (22) e floresta mista fechada (331). Este aspecto não
seria de esperar, nomeadamente em relação às classes de culturas de regadio e floresta mista
fechada. No primeiro caso, devido à utilização de imagens uni-temporais que não permitem uma clara
distinção entre as classes de culturas de regadio (22) e culturas de sequeiro (21). Já no segundo
caso, este facto é devido à dificuldade por parte do foto intérprete em determinar a percentagem
mínima de um determinado povoamento florestal, para que em conjunto com outro tipo de
povoamento florestal, seja atribuída a classe de floresta mista, sendo de esperar um maior número de
erros de omissão nesta classe.
Em relação à exactidão do utilizador, os resultados obtidos para cada classe de ocupação do solo já
são mais elevados, das quais se destacam as classes de floresta de resinosas fechada (321) com
100%, áreas artificiais contínuas (11), áreas artificiais descontínuas (12), culturas de sequeiro (21) e
culturas de regadio (22). No entanto, é de salientar o facto de o número de unidades amostrais
classificadas no mapa como floresta de resinosas e áreas artificiais contínuas ser muito reduzido, 25
e 16 respectivamente, podendo o valor da exactidão do utilizador para estas classes possuir um
intervalo de confiança muito elevado. Analisando a Figura 20, podemos verificar que estas classes
são as que em termos espectrais se afastam mais da nuvem de dispersão principal, indicando que
são as classes com menos hipóteses de se misturarem em termos espectrais.
Já as classes com erros de comissão elevados, podemos destacar as classes de culturas
permanentes (241 e 242), floresta de resinosas aberta (322), floresta mista aberta (332), vegetação
herbácea (35), vegetação esparsa (36) e solo nú (6). Todas estas classes se encontram misturadas
na nuvem de dispersão principal, indicando possuírem semelhança espectral com todas as outras
Análise de resultados
75
classes, à excepção das classes com melhores resultados relativamente à exactidão do utilizador
(Figura 20).
Analisando agora a confusão que existe entre as classes com erros de comissão mais elevados e as
restantes classes, podemos verificar que em relação à classe de culturas permanentes de folha
perene (241), esta confunde-se na sua grande maioria com a classe de culturas de sequeiro (21),
floresta de folhosas aberta (312) e vegetação arbustiva (34). Já estaríamos à espera que esta classe
se confundisse com a classe de culturas de sequeiro, pois através da análise da Figura 24, podemos
verificar que estas classes estão em termos espectrais, muito próximas entre si. Por outro lado a
classe de culturas permanentes de folha perene pode também possuir no sub-coberto culturas de
sequeiro. Em relação à mistura desta classe, com a classe de floresta de folhosas aberta (312),
julgamos que esteja relacionada com o facto de estas classes serem muito semelhantes, pois a
oliveira também é uma folhosa e é a espécie que representa a maioria das unidades amostrais foto-
interpretadas como culturas permanentes de folha perene (olivais), sendo plantada com
espaçamento, ou seja o grau de coberto é semelhante ao da classe de floresta de folhosas aberta. A
confusão da classe de culturas permanentes de folha perene relativamente à classe de vegetação
arbustiva, julgamos que de alguma forma possa estar relacionado com o treino efectuado para a
classe de vegetação arbustiva no qual, foram recolhidas amostras homogéneas que não representam
todas as variações possíveis desta classe, nomeadamente vegetação arbustiva mais esparsa.
Relativamente à classe de culturas permanentes de folha caduca (242), podemos verificar que esta
se confunde com as classes de culturas de sequeiro (21), culturas permanentes de folha perene (241)
e vegetação arbustiva (34). A mistura da classe de culturas permanentes de folha caduca com as
classes de culturas de sequeiro e de culturas permanentes de folha perene, está relacionada com o
facto de estas classes estarem muito próximas entre si em termos espectrais (Figura 24). A confusão
relativa à classe de vegetação arbustiva, pode ser explicado pelo facto de as unidades amostrais
recolhidas para o treino do classificador, serem homogéneas e densas, não representando áreas de
vegetação arbustiva mais abertas que também existem na realidade, sendo semelhantes às unidades
amostrais recolhidas para a classe de culturas permanentes de folha caduca.
Observando a Tabela 11, podemos verificar que tanto as classes de floresta de resinosas aberta
(322), como de floresta mista aberta (332) se confundem com as classes de floresta de resinosas
fechada (321) e vegetação arbustiva (34). Este facto pode ser explicado pela proximidade entre todas
estas classes em termos espectrais (Figura 24), originando erros de classificação.
Em relação às classe de vegetação herbácea (35) e vegetação esparsa (36), podemos verificar
através da análise da Tabela 11, que estas se misturam na sua grande maioria com a classe de
vegetação arbustiva (34). De facto, esta mistura está relacionada com a possibilidade de mesmo nas
unidades amostrais de treino existirem ambas estas classes em algumas situações. Por vezes é difícil
distinguir entre vegetação herbácea (35) e vegetação arbustiva (34) através de imagens aéreas,
Análise de resultados
76
nomeadamente em zonas com uma elevada densidade, pois para se considerar uma amostra como
vegetação herbácea, a vegetação existente na unidade amostral não poderá ter mais de 30 cm, o que
através de imagens aéreas não é possível. Em relação à confusão da vegetação esparsa com a
classe de vegetação arbustiva, este facto está relacionado com a dificuldade em determinar o limiar
de percentagem de coberto, para o foto-intérprete decidir sobre qual das classes introduzir na
unidade amostral de referência. Analisando a Tabela 7, podemos verificar que esta classe foi foto-
interpretada na grande maioria das vezes com muito pouca confiança, o que vem salientar o aspecto
anteriormente descrito. Esta explicação pode também ser dada para a confusão que existe na classe
de solo nú (6), que foi confundida com as classes de vegetação esparsa (36) e vegetação arbustiva
(34), pois a classe de solo nú, foi também muitas vezes foto-interpretada com pouca confiança
(Tabela 7), devido à dificuldade em definir o limiar da percentagem de coberto.
4.4.2 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de confusão, relativamente aos índices e classes de mosaico da base de dados de referência
De seguida, apresenta-se a avaliação da exactidão (Tabela 12) para os casos particulares de
unidades amostrais classificadas como mosaico e sem mosaico, tendo como objectivo perceber se os
erros poderão estar de alguma forma ligados com a classificação do mapa em unidades amostrais
foto-interpretadas como mosaicos ou não.
Observando a Tabela 12, podemos verificar que foi obtida uma exactidão global de 38,7% para o
caso das amostras que não foram classificadas como mosaico, enquanto que avaliando a exactidão
apenas com amostras classificadas como mosaico, a exactidão desceu para os 33,6%. Estes
resultados já eram esperados, pois as classes de mosaico possuem uma mistura espectral mais
elevada e consequentemente existe uma maior probabilidade de erro por parte do classificador que
não foi treinado para as classes de mosaico exactamente devido à elevada mistura espectral que as
classes de mosaico possuem. No entanto, esta diferença não é tão elevada como esperaríamos. Este
aspecto leva a crer que a existência de mosaicos pode não originar tantos erros como esperaríamos.
No entanto, é de salientar que em determinadas classes não se verifica a tendência anteriormente
descrita. São os casos relativos às classes de culturas permanentes (241 e 242), floresta mista
fechada (331) e vegetação herbácea (35). Ou seja, para estas classes, não podemos afirmar que os
erros estejam associados a unidades amostrais classificadas como mosaico.
Análise de resultados
77
Tabela 12. Exactidão global da cartografia sem amostras classificadas como mosaicos e só com amostras classificadas como mosaicos.
Sem mosaico Com mosaico Classes N
Total C E.U. (%) Total C E.U. (%)
11 16 13 8 61,5 3 0 0,0
12 90 50 28 56,0 40 20 50,0
21 56 45 35 77,8 11 5 45,5
22 104 44 24 54,5 60 28 46,7
23 40 22 14 63,6 18 3 16,7
241 238 134 11 8,2 104 15 14,4
242 153 71 5 7,0 82 11 13,4
311 65 39 19 48,7 26 8 30,8
312 193 134 33 24,6 59 6 10,2
321 25 24 24 100,0 1 1 100,0
322 58 44 6 13,6 14 1 7,1
331 126 79 27 34,2 47 18 38,3
332 113 61 5 8,2 52 2 3,8
34 88 65 35 53,8 23 8 34,8
35 104 54 7 13,0 50 7 14,0
36 73 51 7 13,7 22 0 0,0
6 25 18 1 5,6 7 0 0,0
Total 1567 948 289 619 133
E.G. (%) 30,5 21,5 Legenda: N: nº total de unidades amostrais classificadas no mapa para cada classe
C: nº de unidades amostrais da referência em concordância com o mapa produzido
E.U.: Exactidão do utilizador
E.G.: Exactidão global
Na Tabela 13, apresenta-se a exactidão global e do utilizador, para os casos particulares de unidades
amostrais classificadas sem serem mosaicos e para cada uma das classes de mosaico
individualmente, tendo como objectivo perceber se os erros poderão estar de alguma forma
relacionados com a classificação do mapa em unidades amostrais classificadas como uma
determinada classe de mosaico.
Relativamente à análise das amostras classificadas em cada uma das classes de mosaico
individualmente, podemos verificar que a classe de mosaico agrícola obteve uma exactidão de
34,2%, a classe de mosaico de vegetação 20,8% e a classe de mosaico de áreas agrícolas/áreas de
vegetação/áreas artificiais 19,3%. Os resultados obtidos para cada uma destas classes já eram
esperados.
Análise de resultados
78
Tabela 13. Exactidão global da cartografia sem amostras classificadas como mosaico, como mosaico de áreas agrícolas, como mosaico de vegetação e como mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais.
Sem mosaico Mosaico de áreas agrícolas
Mosaico de áreas com vegetação
Mosaico de áreas agrícolas/áreas de
vegetação/áreas artificiaisClasses N
Total C E.U. (%) Total C E.U. (%) Total C E.U. (%) Total C E.U. (%)
11 16 13 8 61,5 0 0 0,0 0 0 0,0 3 0 0,0
12 90 50 28 56,0 0 0 0,0 2 0 0,0 38 20 52,6
21 56 45 35 77,8 4 2 50,0 0 0 0,0 7 3 42,9
22 104 44 24 54,5 11 6 54,5 1 0 0,0 48 22 45,8
23 40 22 14 63,6 2 1 50,0 1 0 0,0 15 2 13,3
241 238 134 11 8,2 16 8 50,0 12 0 0,0 76 7 9,2
242 153 71 5 7,0 25 9 36,0 5 0 0,0 52 2 3,8
311 65 39 19 48,7 2 0 0,0 15 6 40,0 9 2 22,2
312 193 134 33 24,6 7 0 0,0 20 3 15,0 32 3 9,4
321 25 24 24 100,0 0 0 0,0 1 1 100,0 0 0 0,0
322 58 44 6 13,6 1 0 0,0 8 0 0,0 5 1 20,0
331 126 79 27 34,2 0 0 0,0 23 11 47,8 24 7 29,2
332 113 61 5 8,2 4 0 0,0 19 0 0,0 29 2 6,9
34 88 65 35 53,8 1 0 0,0 9 4 44,4 13 4 30,8
35 104 54 7 13,0 3 0 0,0 25 7 28,0 22 0 0,0
36 73 51 7 13,7 0 0 0,0 12 0 0,0 10 0 0,0
6 25 18 1 5,6 0 0 0,0 1 0 0,0 6 0 0,0
Total 1567 948 289 76 26 154 32 389 75
E.G. (%) 30,5 34,2 0 20,8 0 19,3 Legenda: N: nº total de unidades amostrais classificadas no mapa para cada classe
C: nº de unidades amostrais da referência em concordância com o mapa produzido
E.U.: Exactidão do utilizador
E.G.: Exactidão global
No caso da classe de mosaico de áreas agrícolas, esta só pode ser composta por uma combinação
de quatro classes de ocupação do solo (culturas de sequeiro, culturas de regadio, culturas
permanentes de folha perene e culturas permanentes de folha caduca), o que faz com que esta seja
a classe de mosaico com uma possibilidade de mistura espectral menor e desta forma a diversidade
de classes possíveis é menor, como também o erro. Outro aspecto que importa realçar em relação a
esta classe de mosaico é o facto de, no geral, as culturas de regadio no mês de Agosto ainda se
encontrarem no campo, ao contrário das culturas de sequeiro que já foram retiradas. Assim sendo,
estas duas classes apresentam em Agosto características completamente distintas, o que implica
necessariamente reflectâncias muito distintas entre ambas as classes e consequentemente chegam
ao sensor sinais completamente distintos.
Relativamente à classe de mosaico de vegetação, já foram obtidos resultados inferiores. Este aspecto
pode ser explicado pelo facto de esta classe poder ser constituída por uma combinação de nove
classes de ocupação do solo (floresta de folhosas fechada, floresta de folhosas aberta, floresta de
resinosas fechada, floresta de resinosas aberta, floresta mista aberta, floresta mista fechada,
Análise de resultados
79
vegetação arbustiva, vegetação herbácea, vegetação esparsa), o que implica uma elevada mistura
espectral nesta classe de ocupação do solo. Para além deste aspecto a inclusão na nomenclatura de
classes florestais com um grau de coberto reduzido, permite que o sub coberto (vegetação arbustiva
ou vegetação herbácea) transmita também bastante sinal, havendo assim uma maior mistura
espectral e aumentando assim a probabilidade de erro por parte do classificador.
O mosaico de áreas agrícolas/vegetação/áreas artificiais, foi a classe de mosaico que obteve os
piores resultados, pois esta classe permite uma combinação entre todas as classes de ocupação do
solo, sendo assim a classe de mosaico em que a mistura espectral é mais elevada. No entanto,
esperaríamos uma exactidão global muito mais reduzida quando comparada com a exactidão da
classe de mosaico de áreas com vegetação.
É também importante salientar que a tendência verificada após a análise da Tabela 12,
nomeadamente em relação às classes de culturas permanentes de folha caduca e floresta mista
fechada, já não é tão óbvia quando analisadas as classes de mosaico em particular. Podemos
verificar através da análise da Tabela 13 que quando analisamos as classes mencionadas,
relativamente à classe de mosaico de áreas agrícolas/vegetação/áreas artificiais que há um
decréscimo da exactidão para estas classes. Podemos assim concluir que para estas classes, o erro
poderá estar associado a esta classe de mosaico, apesar de quando analisamos as classes de
mosaico no geral, este aspecto não se verificar.
De seguida apresenta-se na Tabela 14, a exactidão global e do utilizador para cada um dos índices
de confiança atribuídos às unidades amostrais. Pretendemos com esta análise verificar se existe
relação entre o nível de confiança atribuído às unidades amostrais e os erros na classificação do
mapa.
Analisando a Tabela 14, podemos verificar que a exactidão global é muito mais elevada quando
avaliamos a exactidão apenas com amostras classificadas com muita confiança (41,1%). Por outro
lado a exactidão da classificação com amostras classificadas com confiança parcial, foi de 25,7% e a
exactidão apenas com amostras classificadas com pouca confiança foi de 20,3%. Esta tendência já
era esperada, pois à medida que a confiança na atribuição das classes de ocupação do solo em cada
amostra por parte do foto-intérprete vai diminuindo, significa que existe uma maior mistura entre
classes de ocupação do solo e uma maior dificuldade na atribuição de uma determinada classe. Este
aspecto implica necessariamente uma maior dificuldade por parte do classificador automático em
atribuir a classe de ocupação do solo correcta. No caso de amostras em que na referência foi
atribuída confiança parcial ou pouca confiança na atribuição da classe de ocupação do solo, isto
sugere que mais do que uma classe de ocupação do solo foi atribuída a essas mesmas amostras.
Análise de resultados
80
Tabela 14. Exactidão global da cartografia para cada um dos índices de confiança.
Muita confiança Confiança parcial Pouca confiança Classes
N Total C E.U. (%) Total C E.U. (%) Total C E.U. (%)
11 16 11 7 63,6 1 0 0,0 4 1 25,0
12 90 38 23 60,5 22 13 59,1 30 12 40,0
21 56 23 20 87,0 15 11 73,3 18 9 50,0
22 104 31 18 58,1 23 13 56,5 50 21 42,0
23 40 14 11 78,6 9 2 22,2 17 4 23,5
241 238 51 9 17,6 42 2 4,8 145 15 10,3
242 153 32 5 15,6 33 3 9,1 88 8 9,1
311 65 22 15 68,2 13 4 30,8 30 8 26,7
312 193 37 3 8,1 47 14 29,8 109 22 20,2
321 25 22 22 100,0 0 0 0,0 3 3 100,0
322 58 19 1 5,3 11 2 18,2 28 4 14,3
331 126 33 15 45,5 26 5 19,2 67 25 37,3
332 113 18 0 0,0 21 1 4,8 74 6 8,1
34 88 29 21 72,4 15 7 46,7 44 15 34,1
35 104 16 1 6,3 16 2 12,5 72 11 15,3
36 73 18 1 5,6 12 1 8,3 43 5 11,6
6 25 4 0 0,0 5 0 0,0 16 1 6,3
Total 1567 418 172 311 80 838 170
E.G. (%) 41,1 25,7 20,3 Legenda: N: nº total de unidades amostrais classificadas no mapa para cada classe
C: nº de unidades amostrais da referência em concordância com o mapa produzido
E.U.: Exactidão do utilizador
E.G.: Exactidão global
No entanto, existem classes de ocupação do solo que não seguem este padrão, nomeadamente as
classes de floresta mista aberta (332), vegetação herbácea (35), vegetação esparsa (36) e solo nú
(6), ou seja possuem maiores índices de exactidão em amostras classificadas com pouca confiança e
menores índices de exactidão em amostras classificadas com muita confiança. Relativamente à maior
exactidão das amostras classificadas com pouca confiança, este facto sugere que o classificador
acertou aleatoriamente na classe atribuída pelo foto-intérprete, ou seja, como o foto-intérprete teve
muitas dúvidas a atribuir uma classe de ocupação de solo a essas amostras, estas poderiam ter sido
classificadas como outra classe qualquer que não aquela atribuída pelo foto intérprete. De facto estas
classes possuem valores de exactidão do utilizador muito reduzidos (Tabela 11. Matriz de confusão
(Classificação do mapa VS CMP 1 das amostras de referência). o que sugere que o classificador não consegue
descriminar estas classes, pois estas estão muito próximas em termos espectrais (Figura 24). É
assim necessário relembrar que amostras classificadas com muita confiança são muito semelhantes
às amostras de treino recolhidas na fase de treino, o que explica esta exactidão reduzida
relativamente a estas classes em amostras classificadas com muita confiança.
Análise de resultados
81
Relativamente à Tabela 15, apresenta-se a exactidão global e do utilizador para cada um dos índices
de localização atribuídos às amostras. Pretendemos com esta análise verificar se existe relação entre
o índice de localização atribuído às amostras e os erros na classificação do mapa.
Tabela 15. Exactidão global da cartografia para cada um dos índices de localização.
Heterogéneo No limite Homogéneo Classes
N Total C E.U. (%) Total C E.U. (%) Total C E.U. (%)
11 16 6 3 50,0 5 0 0,0 5 5 100,0
12 90 33 17 51,5 31 14 45,2 26 17 65,4
21 56 8 5 62,5 16 9 56,3 32 26 81,3
22 104 41 21 51,2 43 19 44,2 20 12 60,0
23 40 14 1 7,1 13 5 38,5 13 11 84,6
241 238 101 10 9,9 77 10 13,0 60 6 10,0
242 153 75 11 14,7 40 3 7,5 38 2 5,3
311 65 23 6 26,1 27 12 44,4 15 9 60,0
312 193 66 6 9,1 54 12 22,2 73 21 28,8
321 25 1 1 100,0 4 4 100,0 20 20 100,0
322 58 20 2 10,0 16 3 18,8 22 2 9,1
331 126 53 20 37,7 52 18 34,6 21 7 33,3
332 113 53 5 9,4 34 0 0,0 26 2 7,7
34 88 33 19 57,6 30 10 33,3 25 14 56,0
35 104 50 6 12,0 35 5 14,3 19 3 15,8
36 73 20 2 10,0 23 1 4,3 30 4 13,3
6 25 7 0 0,0 6 0 0,0 12 1 8,3
Total 1567 604 135 506 125 457 162
E.G. (%) 22,4 24,7 35,4 Legenda: N: nº total de unidades amostrais classificadas no mapa para cada classe
C: nº de unidades amostrais da referência em concordância com o mapa produzido
E.U.: Exactidão do utilizador
E.G.: Exactidão global
Analisando a Tabela 15, podemos verificar que houve uma maior concordância entre as amostras e a
classificação do mapa, nas amostras classificadas como estando localizadas em zonas homogéneas
(45,5%). Por outro lado as amostras com índice de localização no limite entre duas ocupações de
solo obtiveram uma concordância de 34,2% e as amostras localizadas em zonas heterogéneas uma
concordância de 32,1%. Este aumento da concordância de zonas mais heterogéneas para zonas
homogéneas já era esperado, pois se tiver ocorrido algum deslocamento dos pixels do mapa
produzido, a amostra correspondente a esse pixel irá conter a classificação de um dos pixels
envolventes e não a classificação do pixel central. Este facto também sugere que se houver algum
tipo de deslocamento do mapa produzido, este não é muito grave, pois existe uma maior exactidão
em amostras com uma envolvente homogénea. É de salientar que amostras classificadas no limite
são menos heterogéneas que amostras classificadas como heterogéneas, pois o número de classes
Análise de resultados
82
de ocupação do solo na zona envolvente é superior (no limite são duas e em zonas heterogéneas
podem ser mais que duas).
No entanto, é de salientar que mais uma vez nem todas as classes de ocupação do solo seguem este
padrão, nomeadamente as classes de culturas permanentes de folha caduca (242), floresta de
resinosas aberta (322), floresta mista fechada (331), floresta mista aberta (332). Julgamos que este
aspecto esteja associado com o facto de o classificador não conseguir descriminar estas classes, o
que pode ser verificado na Tabela 11, através da análise da exactidão do utilizador para cada classe.
De facto as amostras de treino foram recolhidas em áreas homogéneas, sendo assim de esperar que
estas áreas fossem bem classificadas, o que não aconteceu. Assim sendo, o maior valor de exactidão
do utilizador destas classes em áreas heterogéneas, deve-se à aleatoriedade da classificação, tendo
sido uma questão de sorte estarem correctamente classificadas.
4.4.3 Avaliação da qualidade da cartografia de ocupação do solo através de funções fuzzy
Neste sub-capítulo avalia-se a qualidade do mapa produzido através de funções fuzzy, pretendendo-
se analisar a distribuição e natureza do erro, a gravidade do erro e a confiança na classificação, a
origem do erro e a natureza do erro e verificar que classes de ocupação do solo contribuem mais
para cada um dos tipos de erro mencionados, como também relacioná-los com a análise estatística
da base de dados e a análise exploratória da imagem que serviu de base para a produção do mapa
de ocupação do solo.
4.4.3.1 Distribuição e natureza do erro
Na Tabela 16, apresenta-se a distribuição e natureza do erro, pretendendo-se com esta análise
verificar se existe uma melhoria da exactidão, quando se avalia a exactidão considerando uma
determinada classe como sendo acertada na classificação do mapa, ou seja quando a classificação
no mapa, está em concordância com a CMP 1 ou CMP 2.
Analisando a função MAX, ou seja, a frequência de amostras correctamente classificadas em que a
classe de ocupação do solo atribuída à CMP 1 corresponde à classe do mapa, podemos verificar que
a exactidão global é de 23,1%, tal como na Tabela 11. Já a função RIGHT, ou seja, a frequência de
amostras correctamente classificadas em que a classe de ocupação do solo atribuída à CMP 1 ou à
CMP 2 corresponde à classificação do mapa, podemos verificar que a exactidão global é de 33%.
Estes valores indicam no caso da função MAX que em 23,1% das unidades amostrais, foram
atribuídas pelo foto-intérprete, classes de ocupação do solo que correspondem à melhor escolha para
essas mesmas unidades amostrais, ou seja, as classes atribuídas à CMP 1. Já no caso da função
RIGHT, 33% das unidades amostrais foram classificadas pelo foto-intérprete como sendo pelo menos
Análise de resultados
83
aceitáveis, ou seja, amostras às quais foram atribuídas na CMP 1 ou na CMP 2 classes de ocupação
do solo distintas.
Tabela 16. Análise da exactidão temática utilizando as funções MAX e RIGHT.
MAX RIGHT Melhoria Classes N
n Concordância (%) n Concordância (%) n R – M (%) Áreas (pesos)
11 16 8 50,0 8 50,0 0 0,0 0,0031
12 90 48 53,3 63 70,0 15 16,7 0,0304
21 56 40 71,4 44 78,6 4 7,1 0,0417
22 104 52 50,0 61 58,7 9 8,7 0,0412
23 40 17 42,5 17 42,5 0 0,0 0,0101
241 238 26 10,9 40 16,8 14 5,9 0,2013
242 153 16 10,5 25 16,3 9 5,9 0,1105
311 65 27 41,5 30 46,2 3 4,6 0,0494
312 193 39 20,2 76 39,4 37 19,2 0,1448
321 25 25 100,0 25 100,0 0 0,0 0,0035
322 58 7 12,1 12 20,7 5 8,6 0,0482
331 126 45 35,7 55 43,7 10 7,9 0,0665
332 113 7 6,2 13 11,5 6 5,3 0,0685
34 88 43 48,9 57 64,8 14 15,9 0,0468
35 104 14 13,5 30 28,8 16 15,4 0,0720
36 73 7 9,6 12 16,4 5 6,8 0,0467
6 25 1 4,0 7 28,0 6 24,0 0,0152
Total 1567 422 575 153 1
E.G.(%) 26,9 36,7 9,8
E.G. pesos (%) 23,1
33,0
9,9
Legenda:
N: nº total de unidades amostrais classificadas no mapa para cada classe
n: nº de unidades amostrais na diagonal das matrizes
E.G.: Exactidão global
É de salientar que estes valores de exactidão foram calculados tendo em conta o peso da área
relativa a cada classe, tal como na Tabela 11. A exactidão global de 26,9% e 36,7%, para as funções
MAX e RIGHT, respectivamente, tratam o método de amostragem como sendo aleatório. No entanto,
como já foi explicado na metodologia deste trabalho, a amostragem utilizada para a avaliação da
exactidão do mapa produzido, foi uma amostragem estratificada e por esse motivo calculou-se a
exactidão global com os pesos relativos a cada estrato (classe de ocupação do solo). A utilização
deste método é menos enviesado do que o método utilizado para o cálculo da exactidão global
quando se realiza uma amostragem aleatória simples, pois permite o cálculo dos índices de exactidão
com intervalos de confiança mais reduzidos.
Análise de resultados
84
Podemos assim verificar que houve globalmente uma melhoria de 9,9%, quando foi utilizada a função
RIGHT. Assim sendo a utilização destas duas funções em conjunto permite uma análise mais
detalhada de matrizes de confusão elaboradas com a função MAX e RIGHT em separado.
Relativamente à análise ao nível da classe, verificámos que para as classes de áreas artificiais
contínuas (11), arrozais (23) e floresta de resinosas fechada (321), não houve uma melhoria nestas
classes entre as funções MAX e RIGHT. Este aspecto deve-se ao facto de, relativamente às classes
de áreas artificiais contínuas e arrozais, terem uma elevada frequência de unidades amostrais
classificadas com índice de confiança máximo (Tabela 7. Frequência de cada classe de ocupação de solo
relativamente aos índices de confiança., ou seja, unidades amostrais classificadas com apenas uma classe
de ocupação do solo. Relativamente à classe de floresta de resinosas fechada esta não melhorou,
pois relativamente à função MAX, esta classe apresenta uma exactidão de 100%, sendo impossível
haver uma melhoria quando é avaliada a exactidão com a função RIGHT. Por outro lado, as classes
de áreas artificiais descontínuas (12), floresta de folhosas aberta (312), vegetação arbustiva (34),
vegetação esparsa (36) e solo nú (6), obtiveram melhorias na exactidão, pois são classes que na sua
constituição têm elementos que surgem em mais do que uma classe homogénea e portanto podem
ser correctamente classificadas numa dessas classes.
As classes com uma menor exactidão, analisando a função MAX, são as classes de culturas
permanentes de folha perene (241), culturas permanentes de folha caduca (242), floresta de folhosas
aberta (312), floresta de resinosas aberta (322), floresta mista aberta (332), vegetação herbácea (35),
vegetação esparsa (36) e solo nú (6). Esta menor exactidão, está relacionada com o facto de todas
estas classes terem elevada frequência de unidades amostrais às quais foi atribuída pouca confiança,
ou seja, o foto-intérprete atribuiu pouca confiança à classe principal, o que indica que estas classes
se encontram muito misturadas com pelo menos mais uma ocupação do solo. Importa salientar os
resultados da função MAX, que para as classes de povoamentos florestais abertos são muito
reduzidos, o que põem em evidencia a mistura espectral provocada pela influência do sub coberto no
sinal captado pelo sensor. Todas estas classes melhoram quando é utilizada a função RIGHT. Este
facto já era esperado, pois quando aplicamos a função RIGHT, estamos a ter em conta a
possibilidade da classe de ocupação do solo secundária, estar também correcta, havendo assim um
aumento da exactidão destas classes, apesar de estas se encontrarem em locais com mais do que
uma ocupação do solo. As classes com muito pouca fiabilidade, são as classes relativas de culturas
permanentes de folha perene, culturas permanentes de folha caduca, floresta mista aberta e
vegetação esparsa que mesmo com a utilização da função RIGHT, a sua exactidão continua muito
reduzida.
4.4.3.2 Gravidade do erro e confiança na classificação
Analisando agora a Tabela 17, pretendemos verificar que classes de ocupação do solo possuem
erros mais graves como também uma confiança na classificação mais elevada.
Análise de resultados
85
Tabela 17. Análise da exactidão temática utilizando a função DIFFERENCE.
Não concordância (%) Concordância (%) Classes N
-7 -6 -5 -4 -3 -2 -1 0 Moda
11 16 25,0 6,3 18,8 0,0 0,0 6,3 0,0 43,8 0
12 90 16,7 4,4 8,9 11,1 5,6 13,3 14,4 25,6 0
21 56 5,4 3,6 12,5 3,6 3,6 16,1 19,6 35,7 0
22 104 12,5 4,8 24,0 3,8 4,8 20,2 12,5 17,3 -5
23 40 7,5 17,5 32,5 0,0 0,0 10,0 5,0 27,5 -5
241 238 17,6 16,0 49,6 5,0 0,8 6,3 0,8 3,8 -5
242 153 17,6 19,0 47,1 5,2 0,7 5,2 2,0 3,3 -5
311 65 10,8 12,3 30,8 3,1 1,5 12,3 6,2 23,1 -5
312 193 17,6 11,9 31,1 14,0 5,2 11,4 7,3 1,6 -5
321 25 0,0 0,0 0,0 0,0 0,0 12,0 0,0 88,0 0
322 58 31,0 15,5 32,8 8,6 0,0 6,9 3,4 1,7 -5
331 126 14,3 15,9 26,2 7,1 0,8 19,8 4,0 11,9 -5
332 113 15,9 16,8 55,8 4,4 0,9 5,3 0,9 0,0 -5
34 88 9,1 2,3 23,9 9,1 6,8 17,0 8,0 23,9 -5
35 104 14,4 10,6 46,2 12,5 2,9 10,6 1,9 1,0 -5
36 73 23,3 13,7 46,6 5,5 1,4 6,8 1,4 1,4 -5
6 25 16,0 20,0 36,0 24,0 0,0 4,0 0,0 0,0 -5
Total 1567 15,7 12,3 35,3 7,3 2,4 10,8 5,1 11,0
Legenda:
N: nº total de unidades amostrais classificadas no mapa para cada classe
0: confiança na classificação elevada
-1: confiança na classificação elevada
-2: confiança na classificação aceitável
-3: confiança na classificação reduzida
-4: confiança na classificação muito reduzida
-5: erro aceitável
-6: erro grave
-7: erro muito grave
Observando a Tabela 17, podemos verificar que relativamente à gravidade do erro, as classes com
mais erros, correspondem às classes de culturas permanentes de folha perene (241), culturas
permanentes de folha caduca (242), floresta de resinosas aberta (322), floresta mista aberta (332),
vegetação esparsa (36) e solo nú (6). Todas estas classes apresentam assim erros que na sua
maioria estão relacionados com o facto de maior parte das unidades amostrais terem sido
incorrectamente classificadas pelo classificador, facto este que pode ser observado na Tabela 11,
através dos índices do utilizador, os quais são muito reduzidos para as classes mencionadas.
No entanto, é de salientar que todas estas classes, à excepção da classe de floresta de resinosas
aberta (322), apresentam erros aceitáveis, ou seja amostras nas quais o mapa não concorda com a
referência, mas às quais foi atribuída pouca confiança à classe da referência por parte do foto-
Análise de resultados
86
intérprete. No caso da classe de floresta de resinosas aberta (322), os erros encontram-se igualmente
repartidos pelo tipo de erro anteriormente referido e pelos erros muito graves, os quais correspondem
a amostras nas quais o mapa não concorda com a referência, mas às quais foi atribuída muita
confiança à classe da referência por parte do foto-intérprete. Tal como a classe de floresta de
resinosas aberta, as classes de culturas permanentes (241 e 242), povoamentos florestais abertos
(312 e 332), vegetação herbácea (35), vegetação esparsa (36) e solo nú (6), apresentam erros
graves, ou seja, são classes que estão mal classificadas em zonas muito bem identificadas pelo foto-
intérprete, indicando que há dificuldade em discriminarem-se espectralmente através do algoritmo da
Máxima Verosimilhança. Estes resultados revelam que pode ser necessária uma remodelação da
nomenclatura, com o intuito de minimizar estes erros graves.
Já as classes de culturas de regadio (22), arrozais (23), floresta de folhosas fechada (311) e floresta
mista fechada (331), são classes que de certa forma são facilmente identificadas pelo foto-intérprete
e bem classificadas pelo classificador, e o erro só surge em zonas em que o foto-intérprete tem
dúvidas na atribuição de uma classe de ocupação do solo. Portanto, podemos afirmar que os erros
nestas classes estão principalmente relacionados com a incerteza na elaboração da base de dados
de referência, ou seja, na validação. Analisando a Tabela 14, podemos corroborar a nossa afirmação,
pois estas classes têm uma reduzida exactidão do utilizador nas unidades amostrais classificadas
com pouca confiança.
Relativamente à confiança na classificação das classes de ocupação do solo do mapa produzido, as
classes com maior confiança, são as classes relativas às áreas artificiais contínuas (11), áreas
artificiais descontínuas (12), culturas de sequeiro (21), floresta de resinosas fechada (321) e
vegetação arbustiva (34), ou seja, todas estas classes apresentam um elevado número de unidades
amostrais correctamente classificadas, às quais foi atribuída muita confiança por parte do foto-
intérprete. Todas estas classes apresentam também índices de exactidão do utilizador elevados,
como pode ser observado na Tabela 11. O utilizador poderá assim depositar maior confiança em
áreas classificadas no mapa como pertencendo às classes acima referidas.
4.4.3.3 Origem do erro
Na Tabela 18, apresenta-se a função MEMBERSHIP, com a qual pretendemos verificar se o erro está
associado a áreas em que a paisagem é heterogénea, ou seja, unidades amostrais às quais foi
atribuída mais do que uma classe de ocupação do solo ou então se estarão ligados ao facto do
classificador não conseguir discriminar determinadas classes. Pretendemos também identificar as
classes de ocupação do solo que surgem com maior frequência como única classe de ocupação do
solo, ou em conjunto com outra classe.
Analisando a Tabela 18, podemos verificar que as unidades amostrais nas quais foi apenas atribuída
uma classe de ocupação do solo, foram as que obtiveram melhores resultados com uma
Análise de resultados
87
concordância de 41,1%. Por outro lado, a concordância obtida com as unidades amostrais
classificadas com duas classes de ocupação do solo foi inferior (35,1%). Contrariamente ao que era
esperado, as amostras classificadas com duas classes, são as que apresentam uma menor
concordância apesar de terem uma maior hipótese de concordância com a classificação do mapa
devido ao efeito da aleatoriedade. No entanto estas unidades amostrais têm uma maior mistura
espectral, pois são compostas por mais do que uma classe de ocupação do solo e diferem assim das
assinaturas espectrais recolhidas na fase de treino para treinar o classificador.
Tabela 18. Análise da exactidão temática utilizando a função MEMBERSHIP.
Duas classes Uma classe Classes N
Total C f (%) E. U. (%) Total C f (%) E. U. (%)
11 16 5 1 31,3 20,0 11 7 68,8 63,6
12 90 52 40 57,8 76,9 38 23 42,2 60,5
21 56 33 24 58,9 72,7 23 20 41,1 87,0
22 104 73 43 70,2 58,9 31 18 29,8 58,1
23 40 26 6 65,0 23,1 14 11 35,0 78,6
241 238 187 31 78,6 16,6 51 9 21,4 17,6
242 153 121 20 79,1 16,5 32 5 20,9 15,6
311 65 43 15 66,2 34,9 22 15 33,8 68,2
312 193 156 73 80,8 46,8 37 3 19,2 8,1
321 25 3 3 12,0 100,0 22 22 88,0 100,0
322 58 39 11 67,2 28,2 19 1 32,8 5,3
331 126 93 40 73,8 43,0 33 15 26,2 45,5
332 113 95 13 84,1 13,7 18 0 15,9 0,0
34 88 59 36 67,0 61,0 29 21 33,0 72,4
35 104 88 29 84,6 33,0 16 1 15,4 6,3
36 73 55 11 75,3 20,0 18 1 24,7 5,6
6 25 21 7 84,0 33,3 4 0 16,0 0,0
Total 1567 1149 403 73,3 418 172 26,7
E. G. (%) 35,1 41,1
Legenda:
N: nº total de unidades amostrais
C: nº de unidades amostrais do mapa produzido em concordância com a referência
f: frequência de cada classe
E.G.: Exactidão global
Analisando agora cada classe de ocupação do solo em pormenor, podemos verificar que as classes
com maior índice de exactidão quando surgem como classe única em cada unidade amostral,
correspondem às classes de áreas artificiais contínuas (11), áreas artificiais descontínuas (12),
culturas de sequeiro (21), culturas de regadio (22), arrozais (23) e povoamentos florestais fechados
(311, 321 e 331). Isto indica que estas classes de ocupação do solo são bem discriminadas pelo
classificador.
Análise de resultados
88
Pelo contrário, as classes de culturas permanentes (241 e 242), povoamentos florestais abertos (312,
322 e 332), vegetação herbácea (35), vegetação esparsa (36) e solo nú (6), têm índices de exactidão
muito reduzidos, indicando que estas classes não conseguem ser discriminadas pelo classificador.
Este facto sugere que estas classes deveriam ser agrupadas e consequentemente dar origem a uma
redefinição da nomenclatura proposta. Julgamos que o facto de estas classes apresentarem índices
de exactidão elevados quando surgem em conjunto com outra classe, à excepção das classes de
culturas permanentes, esteja relacionado com o efeito de aleatoriedade, pois todas estas classes
apresentam maior frequência de unidades amostrais em que surgem em conjunto com outra classe.
Este aspecto faz levantar outra questão que está relacionada com o facto destas classes surgirem
com maior frequência em conjunto com outra classe de ocupação do solo. Realmente as classes de
povoamentos florestais abertos, quando observadas em imagens aéreas, apresentam sempre sub-
coberto, quer seja constituído por classes agrícolas, de vegetação arbustiva ou vegetação herbácea.
Assim sendo estas classes, nunca deveriam ter sido foto-interpretadas com muita certeza, pois existe
sempre outra classe que pode estar também correcta numa determinada unidade amostral
classificada como floresta aberta. O mesmo se passa em relação às classes de vegetação herbácea,
vegetação esparsa e solo nú, pois estas classes são dificilmente distinguíveis através de imagens
aéreas, devido à dificuldade em determinar o limiar de percentagem que permite ao foto-intérprete
optar por uma ou por outra classe. Assim, também estas classes deveriam ter sido sempre foto
interpretadas com mais do que uma classe de ocupação do solo.
As classes de culturas permanentes, nem nesta situação anteriormente referida foram bem
identificadas pelo classificador, o que indica que estas classes são problemáticas em ambas as
situações, ou seja, quando surgem isoladas ou em conjunto.
4.4.3.4 Natureza do erro
De seguida apresentam-se na Tabela 19, as funções CONFUSION e AMBIGUITY. Com a função
CONFUSION, pretendemos verificar entre que classes existe maior confusão, sendo semelhante ao
número de unidades amostrais fora da diagonal da Tabela 11, mas em que para além de se assinalar
a classe de ocupação do solo principal que não foi correctamente classificada, assinala-se também a
classe de ocupação do solo alternativa que não foi correctamente classificada. Em relação à função
AMBIGUITY, pretendemos verificar entre que classes existe a maior ambiguidade, ou seja,
pretendemos verificar que classes foram correctamente classificadas, mas às quais na fase de
elaboração da base de dados de referência foi também atribuída uma classe de ocupação do solo
alternativa.
Análise de resultados
89
Tabela 19. Confusão e ambiguidade das classes de ocupação do solo utilizando as funções CONFUSION e AMBIGUITY.
Amostras de referência
11 12 21 22 23 241 242 311 312 321 322 331 332 34 35 36 6 NC
Classes
ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η
11 X X 11 1 1 1 1 1 1 16 1 12 30 7 X X 3 4 4 1 1 3 1 2 2 2 3 1 3 4 6 7 3 6 1 54 40 21 1 1 X X 2 3 4 2 2 1 3 2 2 5 5 11 3 1 24 24
22 10 12 12 7 X X 15 2 3 1 11 2 3 1 4 3 2 3 8 2 4 5 10 1 4 4 86 43
23 7 5 17 4 X X 1 1 1 1 2 6 2 1 1 3 46 6
241 1 1 23 4 87 10 17 5 X X 21 1 20 2 50 4 3 2 10 2 5 1 90 4 46 2 10 6 396 31
242 3 16 68 5 8 3 6 28 7 X X 11 26 4 1 2 1 1 44 3 26 1 6 6 256 20
311 1 5 1 3 1 X X 1 2 10 3 22 2 5 20 6 2 1 70 15
312 1 37 14 6 1 10 1 3 47 18 X X 12 11 1 6 13 3 56 27 24 8 2 6 234 73
321 X X 1 1 1 0 3
322 1 1 7 2 3 4 30 3 X X 4 7 29 7 3 2 92 11
331 6 1 4 3 1 3 1 1 4 10 2 6 1 36 12 4 X X 15 3 40 11 12 3 1 2 142 40
332 4 21 2 6 3 7 7 1 9 15 1 47 11 13 X X 40 7 14 2 2 1 200 13
34 3 1 2 1 1 6 1 7 1 5 4 16 4 6 4 9 1 1 7 X X 5 9 1 3 62 36
35 3 19 2 7 1 7 3 5 1 6 2 10 4 1 11 2 6 2 47 16 X X 16 2 4 148 29
36 7 4 1 2 2 6 7 1 8 7 3 4 55 6 15 X X 1 4 122 11
Cla
ssifi
caçã
o do
map
a
6 3 2 2 2 1 1 2 1 12 5 5 7 X X 36 7
Total 35 8 93 19 269 48 72 19 34 4 78 17 57 5 124 26 131 22 181 24 51 7 99 12 66 25 453 102 165 48 49 9 27 8 1984 403
Legenda:
ζ : CONFUSION
η : AMBIGUITY
Análise de resultados
90
Relativamente à função CONFUSION, podemos verificar que as classes com maior confusão são as
classes de culturas permanentes de folha perene (241), culturas permanentes de folha caduca (242),
floresta de folhosas aberta (312), floresta mista fechada (331), floresta mista aberta (332), vegetação
herbácea (35) e vegetação esparsa (36).
A classe de culturas permanentes de folha perene, confunde-se na sua grande maioria com as
classes de culturas de sequeiro (21), floresta de folhosas aberta (312), vegetação arbustiva (34) e
vegetação herbácea (35). Relativamente à confusão com as classes de culturas de sequeiro e
vegetação herbácea, está relacionada com o facto do sub-coberto da classe de culturas permanentes
de folha perene ser muito semelhante ao das classes referidas anteriormente, principalmente no mês
de Agosto, no qual as culturas de sequeiro já foram colhidas do campo, estando os terrenos
desprovidos de vegetação, tal como nos olivais que também têm o sub-coberto desprovido de
vegetação e que são representados pela classe de culturas permanentes de folha perene. A confusão
desta classe com a classe de culturas de sequeiro está também relacionada com o facto de estas
classes não estarem muito distantes entre si em termos espectrais, apesar de se encontrarem em
grupos diferentes (Figura 24). A confusão da classe de culturas permanentes de folha perene
relativamente à classe de vegetação arbustiva, julgamos que de alguma forma possa estar
relacionado com o treino efectuado para a classe de vegetação arbustiva no qual, foram recolhidas
amostras homogéneas que não representam todas as variações possíveis desta classe,
nomeadamente vegetação arbustiva mais esparsa. Relativamente à confusão da classe de culturas
permanentes de folha perene com a classe de floresta de folhosas aberta, está relacionada com a
grande semelhança do tipo de árvores que compõem estas duas classes. A classe de culturas
permanentes de folha perene representa na sua grande maioria o olival que é composto por folhosas
(oliveira), com um grau de coberto muito semelhante ao dos montados, que estão inseridos na classe
de floresta de folhosas aberta.
Analisando agora a classificação da classe de culturas permanentes de folha caduca (242), podemos
verificar que 68 amostras foram foto-interpretadas como culturas de sequeiro (21). Julgamos que esta
confusão esteja relacionada, mais uma vez, com a reflectância por parte do sub-coberto, pois este
tipo de culturas permanentes não possui uma componente vegetativa muito forte no mês de Agosto,
como pode ser observado na Figura 16, havendo bastante sinal que é proveniente do sub-coberto. O
aspecto anteriormente referido, pode também ser observado na Figura 24, onde se pode observar a
grande proximidade espectral que existe entre as classes de culturas permanentes de folha caduca e
culturas de sequeiro. Outra das grandes fontes de confusão da classe de culturas permanentes de
folha caduca, é com a classe de vegetação arbustiva (34), em que 44 amostras foram classificadas
como culturas permanentes de folha caduca. Este aspecto, pode ser explicado pelo facto de as
amostras recolhidas para o treino do classificador, serem homogéneas e densas, não representando
áreas de vegetação arbustiva mais abertas que também existem na realidade. Estas áreas de
vegetação arbustiva mais esparsa são assim bastante similares ao padrão das culturas permanentes
Análise de resultados
91
de folha caduca nomeadamente, mais concretamente a vinha que é plantada em linha e com
espaçamento, possuindo um porte bastante similar ao da vegetação arbustiva.
Em relação à classificação da classe de floresta de folhosas aberta (312), podemos observar que
houve bastante confusão (56 unidades amostrais) com a classe de vegetação arbustiva (34). Este
facto já era esperado, pois como se trata de povoamentos florestais abertos, é difícil por parte do foto-
intérprete determinar a percentagem para se considerar uma unidade amostral como sendo de
floresta aberta ou então como vegetação arbustiva. Por esta razão houve um número elevado de
amostras foto-interpretadas como vegetação arbustiva e que foram classificadas como floresta de
folhosas aberta, pois é possível que em muitas delas chegue ao sensor o sinal proveniente das
árvores e não do sub coberto. Esta confusão com a classe de vegetação arbustiva é também devida
à pouca distância espectral entre estas classes, facto este que pode ser observado na Figura 24. A
dificuldade em distinguir o limiar da percentagem, para se considerar um povoamento florestal aberto
ou fechado justifica também as 47 unidades amostrais classificadas como floresta de folhosas aberta
que foram foto-interpretadas como floresta de folhosas fechada (311). Analisando a Figura 24,
podemos verificar que estas classes se encontram muito próximas espectralmente existindo uma
forte possibilidade de se misturarem. Relativamente às 37 unidades amostrais foto-interpretadas
como culturas de sequeiro e às 24 unidades amostrais foto-interpretadas como vegetação herbácea,
e que foram classificadas como floresta de folhosas aberta, estão relacionadas com o facto de muitas
destas unidades amostrais serem relativas a sistemas agro-florestais (montados) que apesar do seu
reduzido número de árvores, poderá ter sido transmitido ao sensor essa componente arbórea e não a
componente relativa ao sub-coberto.
Relativamente à classificação da classe de floresta mista fechada (331), podemos verificar que existe
confusão com unidades amostrais foto-interpretadas como floresta de resinosas fechada (321) e
vegetação arbustiva (34). Como se pode observar na Figura 24, verificamos que as classes de
vegetação arbustiva e de floresta mista fechada se encontram muito próximas da classe de floresta
mista fechada em termos espectrais, o que justifica a confusão que existe entre estas classes.
Analisando também a Figura 16, podemos verificar que existe alguma sobreposição vertical entre a
classe de vegetação arbustiva e a classe de floresta mista fechada, o que indicia que estas classes
se possam misturar. No entanto, é necessário relembrar que o NDVI não foi utilizado para a
classificação da imagem de Agosto, senso essa análise apenas exploratória e indicadora em termos
espectrais, das classes com tendência para se misturarem.
A classe de floresta mista aberta (332), também se mistura na sua grande maioria, com as classes de
vegetação arbustiva (34) e floresta de resinosas fechada (321). Analisando a Figura 24, podemos
verificar que estas classes pertencem todas ao mesmo grupo, considerando uma distância entre
classes de 20 unidades, o que indica que existe uma elevada semelhança espectral entre estas
classes, havendo tendência para se misturarem entre si. A Figura 16 revela também, que a classe de
floresta mista aberta, possui uma elevada variabilidade intra-classe, sendo por isso de esperar um
Análise de resultados
92
elevado número de unidades amostrais incorrectamente classificadas. Esta confusão está também
relacionada, relativamente à classe de floresta de resinosas fechada, com o facto de haver
dificuldade por parte do foto-intérprete em determinar e distinguir a percentagem que determina que
um determinado povoamento florestal pertença a apenas um tipo de floresta, ou então seja uma
mistura de povoamentos florestais (tem que existir pelo menos 20% de outro tipo de floresta para se
considerar uma floresta mista). Esta dúvida na percentagem, acontece também com unidades
amostrais foto-interpretadas como vegetação arbustiva, devido ao facto do foto-intérprete ter
considerado que não existiam os 15% de coberto arbóreo, para considerar as unidades amostrais
como floresta mista aberta. No entanto, apesar dessa pequena percentagem de árvores, terá sido
emitido sinal suficiente para o sensor e daí as amostras terem sido classificadas como floresta mista
aberta.
Em relação às unidades amostrais classificadas como vegetação herbácea (35), verificamos que a
maioria da confusão está relacionada com unidades amostrais foto-interpretadas como vegetação
arbustiva (34). De facto a grande similaridade espectral entre ambas estas classes relativamente ao
NDVI (Figura 16), terá sido determinante para confusão que existe entre estas classes. Outro dos
factores que julgamos que esteja relacionado com esta confusão é a possibilidade de mesmo nas
amostras de treino existirem ambas estas classes em algumas situações. Por vezes é difícil distinguir
entre vegetação herbácea (35) e vegetação arbustiva (34) através de imagens aéreas,
nomeadamente em zonas com uma elevada densidade, pois para se considerar uma amostra como
vegetação herbácea, a vegetação existente na unidade amostral não poderá ter mais de 30 cm, o que
através de imagens aéreas não é possível. É de salientar também a confusão que existe com a
classe de vegetação esparsa (36) e as culturas de sequeiro (21). No caso da foto-interpretação da
classe de vegetação esparsa é muito difícil determinar o limiar entre vegetação herbácea e vegetação
esparsa, para além deste tipo de vegetação ser altamente dinâmico num curto espaço de tempo,
aumentando a possibilidade de erro devido às diferenças de data entre o mapa produzido e a data
das imagens aéreas utilizadas para elaborar a base de dados de referência. A Figura 24, revela
também que existe uma grande semelhança espectral entre estas classes, pois estas pertencem ao
mesmo grupo considerando uma distância de 20 unidades. Em relação à confusão com a classe de
culturas de sequeiro, esta deve-se ao facto de tanto esta classe como a classe de vegetação
herbácea serem muito semelhantes. No entanto, seria de esperar que a colheita destas culturas no
mês de Agosto permitisse uma maior distinção entre ambas as classes, pois como pode ser
observado na Figura 16, estas classes não se sobrepõem verticalmente.
Das amostras classificadas como vegetação esparsa (36), grande parte da confusão foi com a classe
de vegetação arbustiva (34). Como anteriormente referido, para o caso da vegetação herbácea (35)
este aspecto poderá estar relacionado com a dificuldade em determinar o limiar da percentagem por
parte do foto-intérprete, tanto na elaboração da base de dados de referência, como na recolha de
amostras de treino para treinar o classificador. Também o facto de pertencerem ao mesmo grupo na
Figura 24, explica a elevada semelhança espectral, acentuando a possibilidade de se misturarem.
Análise de resultados
93
Relativamente à função AMBIGUITY, podemos verificar através da análise da Tabela 19, que as
classes mais ambíguas são as classes de áreas artificiais descontínuas (12), culturas de regadio (22),
floresta de folhosas aberta (312), floresta mista fechada (331), vegetação arbustiva (34) e vegetação
herbácea (35). Este aspecto, pode ser observado na Tabela 14, onde se pode verificar um elevado
número de unidades amostrais correctamente classificadas com confiança parcial e com pouca
confiança para estas classes, indicando que apesar de estarem bem classificadas, essas unidades
amostrais foram também foto-interpretadas com outra classe de ocupação do solo.
Analisando agora as unidades amostrais classificadas como áreas artificiais descontínuas (12),
podemos verificar que sete unidades amostrais foram também foto-interpretadas como classe de
áreas artificiais contínuas (11). Este aspecto já era esperado, pois é normal que exista por parte do
foto-intérprete dúvida sobre a percentagem de áreas impermeabilizadas, ou seja, se uma
determinada unidade amostral tem percentagem suficiente ou não para pertencer à classe de áreas
artificiais descontínuas. O utilizador neste caso, deverá esperar que em áreas ambíguas entre as
classes de áreas artificiais descontínuas e contínuas, estas estejam classificadas como áreas
artificiais descontínuas. O aspecto referido anteriormente também se verifica para a ambiguidade
entre a classe de áreas artificiais descontínuas e as classes de vegetação arbustiva (34) e vegetação
herbácea (35).
Das amostras classificadas como culturas de regadio (22), podemos verificar que maior parte das
unidades amostrais ambíguas correspondem às classes de áreas artificiais descontínuas (12) e de
culturas de sequeiro (21). Assim sendo o utilizador deverá ter em atenção que em áreas ambíguas
foto-interpretadas como áreas artificiais descontínuas e culturas de sequeiro surjam no mapa como
culturas de regadio. Este facto não é de estranhar, pois muitas vezes é difícil discernir por parte do
foto-intérprete quando a classe de culturas de regadio deixa de o ser, para passar a ser uma área
artificial descontinua, devido à percentagem de ambas as áreas de cada classe ser de difícil
distinção. Este aspecto acontece muitas vezes devido a estas classes se encontrarem bastante
misturadas. Em relação à ambiguidade entre a classe de culturas de regadio e a classe de culturas
de sequeiro esta existe devido à dificuldade em distinguir estas classes através de imagens aéreas, à
excepção de imagens do mês de Agosto, em que as culturas de sequeiro já foram colhidas,
contrariamente ao que acontece em relação às culturas de regadio.
Relativamente à classe de floresta de folhosas aberta (312), esta possui uma elevada ambiguidade,
nomeadamente com as classes de culturas de sequeiro (21), floresta de folhosas fechada (311),
vegetação arbustiva (34) e vegetação herbácea (35). Esta ambiguidade relativa à classe de floresta
de folhosas aberta deve-se ao sub-coberto deste tipo de povoamentos. Nos montados teremos
ambiguidade com as culturas de sequeiro e vegetação herbácea, enquanto que em florestas de
produção, teremos como classe alternativa a classe de vegetação arbustiva, podendo também surgir
a classe de vegetação herbácea. A ambiguidade entre a classe de floresta de folhosas aberta e
fechada, deve-se ao facto de existir dificuldade na foto interpretação em determinar o limiar de
Análise de resultados
94
percentagem entre estas duas classes. Assim sendo, os utilizadores desta cartografia, deverão ter
em atenção que em áreas ambíguas foto-interpretadas como uma combinação da classe de floresta
de folhosas aberta, de floresta de folhosas fechada, vegetação arbustiva culturas de sequeiro e
vegetação herbácea, aparecerão no mapa produzido, classificadas como floresta de folhosas aberta.
Em relação à classe de floresta mista fechada (331), esta possui uma maior ambiguidade em
conjugação com as classes de floresta de resinosas fechada (321) e vegetação arbustiva (34). Por
um lado a ambiguidade relativa à classe de floresta de resinosas fechada, deve-se ao facto da
dificuldade por parte do foto-intérprete em conseguir discriminar o limiar de percentagem que
distingue um povoamento florestal misto de um povoamento florestal puro. Por outro lado, a
conjugação com a classe de vegetação arbustiva está relacionada com o facto de a classe de floresta
mista fechada ter uma elevada frequência de unidades amostrais classificadas como mosaico, como
pode observado na Tabela 9. Assim sendo, em áreas ambíguas foto-interpretadas como floresta
mista fechada em conjugação tanto com floresta de resinosas fechada e vegetação arbustiva,
aparecerão representadas no mapa produzido como floresta mista fechada.
A classe de vegetação arbustiva (34) possui amostras ambíguas com praticamente todas as outras
classes de ocupação do solo. No entanto, destaca-se a ambiguidade com a classe de vegetação
herbácea (35) e floresta mista aberta (332). Esta ambiguidade está relacionada com o facto de por
vezes ser complicado por parte do foto-intérprete conseguir discriminar o porte de ambas estas
classes, aspecto determinante para se optar por ou por outra classe. A ambiguidade com a classe de
floresta mista aberta, está relacionada com o facto dos povoamentos mistos abertos possuírem
também no sub-coberto vegetação arbustiva. Assim, os utilizadores em áreas ambíguas foto-
interpretadas como floresta mista aberta e vegetação herbácea deverão esperar que estas áreas
surjam no mapa como vegetação arbustiva.
Em relação à classe de vegetação herbácea (35), passa-se o oposto ao anteriormente referido para a
classe de vegetação arbustiva (34). No entanto, é de salientar um número mais elevado de unidades
amostrais que foram também foto-interpretadas como vegetação arbustiva, mas que foram
classificadas como vegetação herbácea (16 amostras). Assim sendo, será de esperar que em áreas
foto-interpretadas como vegetação herbácea e como vegetação arbustiva surjam classificadas no
mapa como vegetação herbácea.
Conclusão e recomendações
95
5. CONCLUSÃO E RECOMENDAÇÕES
Ao finalizarmos este trabalho interessa tecer algumas considerações acerca dos elementos
metodológicos que levaram à consecução dos objectivos a que nos propusemos inicialmente. Este
trabalho resulta da fusão de vários estudos paralelos, que consistentemente integrados, permitiram
uma análise mais aprofundada da origem, tratamento e eliminação de erros temáticos em cartografias
de ocupação do solo. De forma a reportar sumariamente as dificuldades sentidas ao longo da
elaboração deste trabalho e os principais resultados obtidos, abordamos de seguida passo a passo
as conclusões de cada etapa da abordagem metodológica que adoptamos.
Em relação à base de dados de referência, o facto de termos utilizado uma amostragem estratificada
com um elevado número de amostras, esteve relacionada com a pretensão de conseguirmos obter
valores de exactidão estatisticamente sólidos e válidos. Este elevado número de amostras que
tiveram de ser foto-interpretadas requereu um elevado esforço logístico (tempo e recursos), o que
nem sempre é possível. De toda a pesquisa bibliográfica realizada neste trabalho relacionada com a
avaliação da exactidão temática de cartografias de ocupação do solo, pudemos verificar que esta
base de dados destaca-se de grande parte dos trabalhos realizados pela sua dimensão. No entanto,
este elevado esforço apresenta para além da vantagem de permitir calcular os índices de exactidão
temática com intervalos de confiança reduzidos, o elevado número de amostras permite também uma
amostragem bem distribuída geograficamente pelo território de Portugal Continental. Assim sendo,
este último aspecto permitiu para além de uma análise das proporções de cada classe de ocupação
do solo no território de Portugal Continental, uma análise de quais destas classes foram foto-
interpretadas com maior ou menor certeza, a sua localização e inserção na paisagem portuguesa,
como também as que constituem mosaicos. Assim sendo, para além desta base de dados poder ser
utilizada para a avaliação da exactidão temática de cartografias de ocupação do solo, poderá também
vir a ser utilizada para estudos de fenómenos sociais, económicos e ambientais.
Após a analise global da base de dados de referência, verificamos que as classes mais
representadas, são as classes de mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais,
mosaico de vegetação e vegetação arbustiva. Nomeadamente as classes de mosaicos mais
representadas reflectem a elevada heterogeneidade e fragmentação das classes de ocupação do
solo em Portugal Continental. No entanto, é necessário referir que, como demonstrado por Carrão
(2002), a representação da paisagem portuguesa surge mais fragmentada quando são utilizadas
UMC inferiores a dez hectares, o que também pode ajudar a explicar esta elevada percentagem das
classes de mosaicos, pois para a elaboração da base de dados utilizamos uma UMC de nove
hectares. Assim sendo o maior ou menor número de mosaicos está dependente da escala de
representação da cartografia, indicando também que a nomenclatura adoptada, a esta escala não
garante uma discriminação aceitável das unidades de paisagem. Neste contexto, é assim necessário
para a utilização da nomenclatura LANDEO em cartografia derivada de imagens MERIS, fazer um
Conclusão e recomendações
96
ajuste das classes de ocupação do solo utilizadas tendo em vista alcançar uma exactidão temática
mais precisa e que sirva melhor os utilizadores.
Abordando agora a análise do índice de certeza, pudemos verificar que a maior parte das amostras
foram classificadas com pouca confiança. A elevada frequência de mosaicos, pode estar assim
relacionada com uma maior incerteza na classificação por parte da equipa de foto-interpretação.
Para além deste aspecto a utilização de imagens uni-temporais, pode não ser a mais adequada para
a foto-interpretação de determinadas classes (e.g. culturas de sequeiro, culturas de regadio,
vegetação herbácea), devido à sua elevada dinâmica num único ano. É assim aconselhável que para
a elaboração de futuras bases de dados de referência sejam incluídas abordagens multi-temporais.
Relativamente aos índices de localização, estes inicialmente tinham o propósito de detectar possíveis
erros derivados da diferença de localização entre a base de dados de referência e a cartografia
produzida. No entanto, quando analisada a relação deste índice com as classes de ocupação do solo,
concluímos que este índice pode ser também utilizado para determinar se uma classe de ocupação
do solo se encontra inserida em áreas do território mais fragmentadas, lineares ou homogéneas.
Assim sendo, as classes inseridas em zonas mais fragmentadas correspondem às classes de áreas
artificiais descontínuas e agrícolas com excepção dos arrozais que apresenta maior tendência para
áreas lineares, tal como a classe de resinosas fechada. As classes inseridas em áreas homogéneas
são relativas às áreas artificiais contínuas e floresta de folhosas aberta. A utilização deste índice,
pode ser assim muito útil para estudos de cariz social, económico e ambiental. Exemplificando, este
índice pode ser utilizado para determinar se uma paisagem protegida está cada vez mais isolada
devido à fragmentação da sua envolvente, podendo haver o risco de esta se extinguir. Por outro lado,
estudando a linearidade da paisagem, podemos verificar se por exemplo os corredores ecológicos
abrangidos pela lei da REN continuam a apresentar um continuum natural, fundamental para o fluxo e
manutenção da biodiversidade, ou então se esta continuidade está a ser posta em causa devido à
sua fragmentação.
Já a análise das classes de mosaicos da base de dados de referência, revelou que as classes de
áreas artificiais descontínuas, culturas de regadio, culturas permanentes e floresta mista fechada,
apresentam uma elevada frequência de mosaicos.
No que respeita à análise exploratória das imagens de satélite, pudemos verificar que a imagem de
Agosto é a que permite uma melhor separação entre classes de ocupação do solo. Mais
concretamente é a imagem que permite obter uma menor variabilidade intra-classe, uma maior
distância entre classes de ocupação do solo e obter o melhor ratio intra e inter classe entre classes
de ocupação do solo. As classes de ocupação do solo com menor variabilidade intra classe são as
relativas às classes de solo nú, áreas artificiais contínuas, culturas de sequeiro, arrozais, culturas
permanentes de folha caduca, floresta de folhosas fechada e floresta de resinosas fechada. As
classes de áreas artificiais contínuas, áreas artificiais descontínuas classes de culturas de regadio e
Conclusão e recomendações
97
de arrozais, foram as classes com o melhor ratio intra e inter-classe. Através da análise da distância
entre classes, pudemos verificar que a imagem do mês de Agosto permite uma maior distância entre
classes de ocupação do solo e consequentemente a formação de um maior número de grupos de
classes de ocupação do solo. Futuramente, seria interessante desenvolver um estudo em que fossem
treinadas e estudadas as classes de mosaicos em termos da sua reflectância, e tentar desenvolver
metodologias que permitissem realizar uma posterior classificação automática destas classes.
Comentando agora a avaliação da exactidão temática da cartografia produzida, verificamos que
obtivemos valores globais de exactidão muito reduzidos. Este aspecto é mais evidente quando
utilizamos apenas uma classe de ocupação do solo para cruzar com a classificação da cartografia
produzida. Contudo, tal como demonstrado no trabalho de Carrão et al. (2007), não treinando as
classes de culturas permanentes e de povoamentos florestais abertos e agregando as classes de
vegetação arbustiva, vegetação herbácea, vegetação esparsa e solo nu, a exactidão global sobe para
os 62%, sendo já este um valor bastante razoável. No entanto, podemos verificar que existem classes
com uma exactidão do produtor bastante aceitável, como são os casos das classes de áreas urbanas
descontínuas, culturas de sequeiro, culturas de regadio, floresta de resinosas fechada e vegetação
arbustiva. Por outro lado, as classes de culturas permanentes de folha perene, culturas permanentes
de folha caduca, floresta de resinosas aberta, floresta mista aberta, vegetação herbácea, vegetação
esparsa e solo nú, apresentam uma exactidão reduzida. Estes reduzidos valores de exactidão, têm
uma clara relação com o facto de estas classes apresentarem elevada frequência de mosaicos, de
terem uma elevada frequência de unidades amostrais classificadas com pouca confiança ou estarem
localizadas em áreas heterogéneas. De facto as unidades amostrais com mosaico, heterogéneas e
com pouca confiança, revelaram ter uma exactidão inferior relativamente às amostras classificadas
sem mosaico, em áreas homogéneas ou no limite, com muita confiança ou com assinaturas
espectrais semelhantes a outras classes. Podemos assim afirmar que os erros estão directamente
ligados com os aspectos anteriormente referidos.
Referindo-nos agora à avaliação da qualidade da cartografia produzida, através de funções fuzzy,
pudemos verificar que relativamente à distribuição e natureza dos erros, com a função RIGHT
conseguimos obter melhores resultados do que só utilizando a função MAX. Ou seja, quando é
utilizada a classe de ocupação do solo alternativa em vez de se utilizar apenas a classe mais
provável, existe uma melhoria na exactidão global. As classes com uma evidente melhoria são as
classes relativas de áreas artificiais descontínuas, floresta de folhosas aberta, vegetação arbustiva,
vegetação herbácea e solo nú. Adicionalmente, conseguimos também demonstrar que a utilização
destas duas funções em conjunto, torna-se uma ferramenta mais útil do que analisar os resultados
destas duas funções em separado. O utilizador é assim informado de que os resultados podem não
ser tão negativos, como a função MAX deixa transparecer.
A magnitude dos erros, revelou que as classes de culturas permanentes, floresta mista aberta,
vegetação esparsa e solo nú, são as que têm erros mais graves. Mais uma vez este facto, deve-se a
Conclusão e recomendações
98
estas classes possuírem uma elevada frequência de unidades amostrais classificadas com pouca
confiança, em áreas heterogéneas, ou como mosaico e que também possuem assinaturas espectrais
semelhantes às de outras classes. Assim, o utilizador da cartografia está informado das classes
temáticas com erros mais graves e pode verificar se a cartografia produzida corresponde às suas
necessidades ou não.
Similarmente ao abordado anteriormente, mas agora em relação à origem dos erros, verificamos
através da função MEMBERSHIP que as unidades amostrais classificadas com uma única classe
apresentaram no geral melhores resultados, à excepção das classes de culturas permanentes,
povoamentos florestais abertos, vegetação herbácea, vegetação esparsa e solo nú, o que indica que
estas classes em termos espectrais são difíceis de discriminar. No entanto, os povoamentos florestais
abertos têm maior exactidão em unidades amostrais nas quais surgem em conjunto com outra classe,
estando este facto relacionado com o sub-coberto que poderá também conter outra classe que seja
acertada nessa mesma localização. Com as classes de vegetação herbácea, vegetação esparsa e
solo nú, verifica-se o mesmo, mas nestes casos deve-se à dificuldade por parte do foto-intérprete em
optar por uma destas classes, devido à dificuldade em determinar o limiar de percentagem entre
estas classes. Assim sendo, estas classes deverão ser sempre foto-interpretadas com confiança
parcial ou pouca confiança, pois são classes que pela sua natureza surgem em conjunto com outras.
Assim, para uma posterior disponibilização desta cartografia, o seu produtor deverá ter em atenção
que deverá desenvolver metodologias, para lidar com as áreas mais heterogéneas, com a finalidade
de obter um produto mais fiável.
Através dos resultados da função CONFUSION, verificamos que as classes de culturas permanentes,
floresta de folhosas aberta, povoamentos florestais mistos, vegetação herbácea e vegetação esparsa
são as pior classificadas, tanto em situações em que surgem como classe de ocupação do solo
principal, ou como classe de ocupação do solo alternativa. Já as classes mais ambíguas, são
relativas às classes de áreas artificiais descontínuas, culturas de regadio, floresta de folhosas aberta
e floresta mista aberta. O utilizador deverá ter em atenção que estas classes, apesar de estarem bem
classificadas, possuem outra classe de ocupação do solo e decidir se para cumprirem os seus
objectivos, necessitam de classes puras ou com alguma ambiguidade.
Fazendo agora uma reflexão final, sobre este trabalho, verificamos que os nossos objectivos foram
atingidos. Através de uma metodologia relativamente simples, conseguimos fornecer mais informação
ao utilizador sobre a cartografia produzida, do que se tivesse sido apenas implementada uma
avaliação da exactidão tradicional. Para além disso, o produtor pode também melhorar os métodos
utilizados na produção de cartografias de ocupação do solo, pois agora está mais informado sobre a
origem do erro da cartografia produzida.
Através destes métodos, conseguimos discernir e descrever a “realidade” com maior rigor e aferir
sobre esta. Esta metodologia poderá ser assim implementada em futuros projectos ligados à
Conclusão e recomendações
99
avaliação da exactidão de cartografias de ocupação do solo, sendo uma mais valia nos processos de
tomada de decisão. Os actores intervenientes neste processo estarão assim mais conscientes do erro
e incerteza inerente ao processo de elaboração das cartografias de ocupação do solo. Este trabalho é
assim uma boa base para que no futuro se possam desenvolver índices de exactidão standard,
utilizando esta metodologia, e assim possibilitar a comparação entre outras cartografias, pois esta é
uma área ainda muito pouco desenvolvida e que necessita de mais investigação.
Referências bibliográficas
100
REFERÊNCIAS BIBLIOGRÁFICAS
Anderson, J. R., E. E. Hardy, J. T. Roach, and R.E. Witmer, 1976. A Land Use and Land Cover
Classification System for Use with Remote Sensor Data, Prof. Paper 964, US Geological Survey,
Reston, VA.
Araújo, A., and M. Caetano, 2006. Exploring MERIS images through temporal map algebra for land
cover mapping: first results, Proceedings of the 2nd EARSeL SIG Workshop on Land Use & Land
Cover, 28 - 30 September 2006, Bonn, Germany, unpaginated CD-ROM.
Araújo, A., e M. Caetano, 2006. Nomenclatura de Ocupação do solo LANDEO. Instituto Geográfico
Português (IGP), Lisboa, Janeiro 2006, 33 p.
Aronoff, S., 1982. Classification Accuracy: A User Approach, Photogrammetric Engineering & Remote
Sensing, 48(8):1299-1307.
Aronoff, S., 1985. The Minimum Accuracy Value as an Index of Classification Accuracy,
Photogrammetric Engineering & Remote Sensing, 51(1):99-111.
Bishop, Y., S. Fienberg and P. Holland, 1975. Discrete Multivariate Analysis: Theory and Practice, MIT
Press, Cambridge, MA.
Burrough, P. A., and R. A. McDonnell, 1998. Principles of Geographical Information Systems, Oxford
University Press Inc., New York, 333 p.
Caetano, M., 2004. Apontamentos de Mestrado e Pós-Graduação em Ciência e Sistemas de
Informação Geográfica, ISEGI, UNL, Lisboa, 168 p.
Caetano, M., T. Santos, and L. Gonçalves, 2002. Cartografia de Ocupação do Solo com Imagens de
Satélite: Estado da Arte. Actas do VII Encontro de Utilizadores de Informação Geográfica
(ESIG'2002), Novembro 2002, Oeiras, unpaginated CD-ROM.
Caetano, M., F. Mata, and S. Freire, 2006. Accuracy assessment of the Portuguese CORINE Land
Cover Map. in Global Developments in Environmental Earth Observation from Space (A. Marçal,
editor), Millpress, Rotterdam, pp. 459-467.
Carrão, H., 2002. Caracterização da Estrutura da Paisagem: Modelação e Avaliação das
Transformações na Representação da Ocupação do Solo, Estágio final da Licenciatura em Eng.ª
Biofísica, Universidade de Évora, Évora, 138 p.
Referências bibliográficas
101
Carrão, H., 2006. Land Cover Cartography Accuracy Assessment: An approach in the framework of
LANDEO project, IGP, Lisboa.
Carrão, H., M. Caetano, and P. Coelho, 2007. Sample Design and Analysis for Thematic Map
Accuracy Assessment: An Approach Based on Domain Estimation for the Validation of Land Cover
Products, Proceedings of the 32nd International Symposium on Remote Sensing of Environment, San
Jose, Costa Rica.
Carrão, H., P. Gonçalves, & M. Caetano, 2006. MERIS Based Land Cover Characterization: A
Comparative Study, Proceedings of the ASPRS 2006 Annual Conference - Prospecting for Geospatial
Information Integration, 1-5 May 2006, Reno, Nevada, USA, unpaginated CD-ROM.
Carrão, H., P. Sarmento, A. Araújo, and M. Caetano, 2007. Retrieving land cover information from
MERIS and MODIS data: a comparative study for landscape characterization in Portugal”,
Proceedings of the 2007 International Geoscience and Remote Sensing Symposium (IGARSS´2007).
Chuvieco, E., 1996. Fundamentos de Teledetección Espacial, Ediciones Rialp, Alcalá, Madrid, 568 p.
Clevers, J., H. Bartholomeus, S. Mücher, and A. Wit, 2004. Land Cover Classification with the Medium
Resolution Imaging Spectrometer (MERIS), Proceedings of the 24thSymposium of the European
Association of Remote Sensing Laboratories, 25-27 May 2004, Dubrovnik, Croatia, 3(3):354-362.
Cochran, W. G., 1977. Sampling Techniques, Wiley, New York, 428 p.
Congalton, R.G., 1988. A comparison of sampling schemes used in generating error matrices for
assessing the accuracy of maps generated from remotely sensed data, Photogrammetric Engineer
and Remote Sensing, 54(5):593-600.
Congalton, R. G., 1991. A review of assessing the accuracy of classifications of remotely sensed data,
Remote Sensing of Enviornment, 37:35-46.
Congalton, R. G., and K. Green, 1993. A Practical Look at the Sources of Confusion in Error Matrix
Generation, Photogrammetric Engineering & Remote Sensing, 59(5):641-644.
Congalton, R. G., and K. Green, 1999. Assessing the Accuracy of Remotely Sensed Data: Principles
and Practices, Lewis Publishers, Boca Raton, Florida, 137 p.
Dicks, S. E., and T.H.C. Lo, 1990. Evaluation of Thematic Map Accuracy in a Land-Use and Land-
Cover Mapping Program, Photogrammetric Engineering & Remote Sensing, 56(9):1247-1252.
Referências bibliográficas
102
ESA, 2005. URL: http://earth.esa.int/object/index.cfm?fobjectid=1665 (last date accessed: 15 March
2007)
ESA, 2006. URL: http://earth.esa.int/category/index.cfm?fcategoryid=60 (last date accessed: 18 March
2007)
ESA, 2006. URL: http://envisat.esa.int/object/index.cfm?fobjectid=3768 (last date accessed: 18 March
2007)
Foody G. M., 2002. Status of land cover classification accuracy assessment, Remote Sensing of
Environment, 80:185-201.
Freire, S., H. Carrão, e M. Caetano, 2002. Produção de Cartografia de Risco de Incêndio Florestal
com Recurso a Imagens de Satélite e Dados Auxiliares, Actas do VII Encontro de Utilizadores de
Informação Geográfica (ESIG'2002), 13 - 15 Novembro, Oeiras, unpaginated CD-ROM.
Gerlach, R., L. Skinner, A. Luckman, and C. Schmullius, 2005. Deriving Land Cover Information over
Siberia: Comparing Results from MERIS and MODIS, Proceedings of the MERIS and (A)ATSR 2005
User Workshop, 26–30 September, Frascati, Italy, Published on CDROM, p.46.1.
Gopal, S., and C. Woodcock, 1994. Theory and Methods for Accuracy Assessment of Thematic Maps
Using Fuzzy Sets, Photogrammetric Engineering & Remote Sensing, 60(2):181-188.
Goodchild, M. F., C. Lin, and Y. Leung, 1993. Visualization in Geographic Information Systems, John
Wiley & Sons, London, 167 p.
Gonçalves, P., H. Carrão, A. Pinheiro, & M. Caetano, 2006. Land cover classification with Support
Vector Machine Applied to MODIS imagery, Global Developments in Environmental Earth Observation
from Space (A. Marçal, editors), Millpress, Rotterdam, pp. 517-526.
Hadipriono, F. C., J. G. Lyon, and L. Thomas, 1991. Expert opinion in satellite data interpretation,
Photogrammetric Engineering & Remote Sensing, 57(1):75-78.
Hashemian M.S., A.A. Abkar, & S.B. Fatemi, 2004. Study of sampling methods for accuracy
assessment of classified remotely sensed data, Proceedings of the 20th International Society for
Photogrammetry and Remote Sensing Congress, 12-23 July, Istanbul, Turkey, unpaginated CD-ROM.
Hunter, G. J., M. Caetano, and F. Goodchild, 1995. A Methodology for Reporting Uncertainty in
Spatial Database Products, Journal of the Urban and Regional Information Systems Association,
7(2):11-21.
Referências bibliográficas
103
Liu, W., S. Gopal, and C. E. Woodcocck, 2004. Uncertainty and Confidence in Land Cover
Classification Using a Hybrid Classifier Approach, Photogrammetric Engineering & Remote Sensing,
70(8):963-971.
Lunetta, R. S., R. G. Congalton, L. K. Fenstermaker, J. R. Jensen, K. C. McGwire, e L. R. Tinney,
1991. Remote Sensing and Geographic Information System Data Integration: Error Sources and
Research Issues, Photogrammetric Engineering & Remote Sensing, 57(6):677-687.
Mata, F., G. Cavaco, e M. Caetano, 2004. Validação de cartografia temática produzida por
classificação de imagens obtidas por detecção remota: estado da arte, Actas do VIII Encontro de
Utilizadores de Sistemas de Informação Geográfica (ESIG'2004), 2 - 4 Junho 2004, Oeiras,
unpaginated CD-ROM.
Milla, R. Z., J.P.G.W. Clevers, M. E. Schaepman, & A. J. Plaza, 2005. Retrieving sub-pixel land cover
composition through an effective integration of the spatial, spectral and temporal dimensions of
MERIS imagery, Proceedings of the 9th International Symposium on Physical Measurements and
Signatures in Remote Sensing, 17-19 October 2005, Beijing, China, unpaginated CD-ROM.
Moisen G.G., T.C.Jr. Edwards, & D.R. Cutler, 1994. Spatial sampling to assess classification accuracy
of remotely sensed data, Environmental Information Management and Analysis: Ecosystem to Global
Scales. (W.K. Michener, J.W. Brunt, & S.G. Stafford, editors), Taylor & Francis, London, pp. 159-176.
Reese H. M., T. M. Lillesand, D. E. Nagel, J.S. Stewart, R.A. Goldmann, T.E. Simmons, J. W.
Chipman, P. A. Tessar, 2002. Statewide land cover derived from multiseasonal Landsat TM data - A
retrospective of the WISCLAND project, Remote Sensing of Environment, 82: 224-237.
Robinson, V. B., 1988. Some implications of fuzzy set theory applied to geographic databases,
Computers, Enviornment, and Urban Systems, 12:89-97.
Robinson, A., R. Sale, e J. Morrison, 1978. Elements of Cartography, John Wiley & Sons, Inc, 448 p.
Rosenfield, G. H., K. Fitzpatrick-Lins, and H. S. Ling, 1982. Sampling for Thematic Map Accuracy
Testing, Photogrammetric Engineering & Remote Sensing, 48(1):131-137.
Sarndal, C. E., B. Swensson, and J. Wretman, 1992. Model-Assisted Survey Sampling, Springer-
Verlag, 694 p.
Referências bibliográficas
104
Siegert, F., e S. Huang, 2004. Large-Scale Forest Fires in Siberia Analysed by MODIS, MERIS and
ASTER Multiresolution Satellite Imagery, Proceedings of the 2004 Envisat & ERS Symposium, 6 – 10
September 2004, Salzburg, Austria, unpaginated CD-ROM.
Stehman, S. V., 1992. Comparison of Systematic and Random Sampling for Estimating the Accuracy
of Maps Generated from Remotely Sensed Data, Photogrammetric Engineering & Remote Sensing,
58(9):1343-1350.
Stehman, S. V., 1997. Selecting and Interpreting Measures of Thematic Classification Accuracy,
Remote Sensing of Environment, 62:77-89.
Stehman, S. V., 1999. Basic probability sampling designs for thematic map accuracy assessment,
International Journal of Remote Sensing, 20(12):2423-2441.
Stehman, S. V., 2001. Statistical Rigor and Practical Utility in Thematic Map Accuracy Assessment,
Photogrammetric Engineering & Remote Sensing, 67(6):727-734.
Stehman, S.V., J.D. Wickham, J.H. Smith, and L. Yang, 2003. Thematic accuracy of the 1992 National
Land-Cover Data for the eastern United States: Statistical methodology and regional results, Remote
Sensing of Environment, 86: 500-516.
Stehman, S.V., J.D. Wickham, L. Yang, and J.H. Smith, 2000. Assessing the Accuracy of Large-Area
Land Cover Maps: Experiences from the Multi-Resolution Land Cover Characteristics (MRLC) Project,
Proceedings of the 4th International Symposium on Spatial Accuracy Assessment in Natural
Resources and Environmental Sciences, July 2000, Amsterdam, pp. 601-608.
Stehman, S.V., and L. Czaplewski, 1998. Design and Analysis for Thematic Map Accuracy
Assessment: Fundamental Principles, Remote Sensing of Environment, 64:331-344.
Story, M., and R. G. Congalton, 1986. Accuracy Assessment: A User’s Perspective, Photogrammetric
Engineering & Remote Sensing, 52(3):397-399.
Strahler, S. H., Boschetti L., Foody G. M., Friedl M.A., Hansen M. C., Herold, M., Mayaux P.,
Morissette J. T., Stehman S. V., and Woodcock C. E., 2006. Global Land Cover Validation:
Recommendations for Evaluation and Accuracy Assessment of Global Land Cover Maps, Technical
Report, Joint Research Centre, Ispra, in press.
Wel, F. J. M., 2000. Assessment and Visualisation of Uncertainty in Remote Sensing Land Cover
Classifications, M. A. dissertation, University of Utrecht, Utrecht, Netherlands, 187 p.
Referências bibliográficas
105
Wickham J. D., S.V. Stheman, J.H. Smith, and L. Yang, 2004. Thematic accuracy of the 1992 National
Land-Cover Data for the western United States, Remote Sensing of Environment, 91:452-468.
Woodcock, C. E., S. Gopal, and W. Albert, 1996. Evaluation of the Potential for Providing Secondary
Labels in Vegetation Maps, Photogrammetric Engineering & Remote Sensing, 62(4):393-399.
Woodcock, C. E., and S. Gopal, 2000. Fuzzy set theory and thematic maps: accuracy assessment
and area estimation, International Journal of Geographical Information Science, 14(2):153-172.
Wulder M. A., S. E. Franklin, J.C. White, J. Linke, and S. Magnussen, 2006. An accuracy assessment
framework for large-area land cover classification products derived from medium-resolution satellite
data, International Journal of Remote Sensing, 27(4):663-683.
Zadeh, L. A., 1965. Fuzzy Sets, Information and Control, 8(3):338-353.
Anexos
106
ANEXOS
Anexos
I
Anexo 1
Artigos científicos elaborados no âmbito da conferência IGARSS2007
Anexos
II
Anexos
III
Anexos
IV
Anexos
V
Anexos
VI
Anexos
VII
Anexos
VIII
Anexos
IX
Anexo 2
Artigo científico elaborado no âmbito da conferência ENVISAT Symposium 2007
Anexos
X
Anexos
XI
Anexos
XII
Anexos
XIII
Anexos
XIV
Anexos
XV
Anexo 3
Exemplo de cada classe de ocupação do solo
Classe 11
Classe 12
Classe 21
Classe 22
Classe 23
Classe 241
Classe 242
Classe 25
Classe 311
Classe 312
Classe 321
Classe 322
Anexos
XVI
Classe 331
Classe 332
Classe 34
Classe 35
Classe 36
Classe 37
Classe 38
Classe 41
Classe 5
Classe 6
Classe 7
Anexos
XVII
Anexo 4
Distribuição das unidades amostrais pelo território de Portugal Continental
Anexos
XVIII
Anexo 5
Artigo científico com as fórmulas de cálculo dos índices de exactidão para a amostragem estratificada
Anexos
XIX
Anexos
XX
Anexos
XXI
Anexos
XXII
Anexo 6
Mapa de ocupação do solo produzido com base na imagem MERIS de Agosto de 2005