TFC_Pedro_Sarmento

Universidade de Évora

Curso de Engenharia Biofísica – Ordenamento e Gestão Ambiental

Avaliação da Exactidão Temática de Cartografias de Ocupação do Solo:

Abordagem Aplicada a Mapas Derivados de Imagens de

Satélite de Média Resolução Espacial

Trabalho de fim de curso realizado por

Pedro Alexandre Reis Sarmento

Évora

Junho de 2007

II

“Este trabalho não inclui as observações e críticas feitas pelo júri.”

III

AGRADECIMENTOS

Aos meus pais pelo seu apoio incondicional.

À Xana por ter estado sempre presente nos bons e maus momentos. Sem ti teria sido muito mais

difícil.

Ao professor Mário Caetano por me ter dado a oportunidade de estagiar no Grupo de Detecção

Remota do Instituto Geográfico Português.

Ao Hugo Carrão, meu co-orientador, por todo o apoio prestado na elaboração deste trabalho de fim

de curso.

Ao pessoal do Grupo de Detecção Remota, por todo o apoio prestado durante a realização deste

trabalho.

IV

RESUMO O recente lançamento do satélite ENVISAT, o qual incorpora o sensor MERIS, abriu novas

expectativas na comunidade científica, para a elaboração de cartografias de ocupação do solo a

escalas regionais e globais. A elevada resolução espectral e temporal deste sensor, veio colmatar a

necessidade de produção de cartografia de ocupação do solo, num curto espaço de tempo e com

uma maior exactidão.

A importância da avaliação da exactidão de cartografias de ocupação do solo é um aspecto que

muitas vezes é relegado para segundo plano, influenciando assim negativamente os processos de

tomada de decisão baseados nestas cartografias temáticas, devido ao desconhecimento do erro a

elas inerente. A avaliação da exactidão temática é realizada através do cruzamento dos mapas

produzidos a partir de imagens de satélite com bases de dados de referência, que representam a

“realidade” da superfície terrestre. No entanto, estas bases de dados, construídas através de métodos

de foto-interpretação, nunca representam a realidade com 100% de certeza, devido a vários

aspectos, e.g. confusão entre classes de ocupação de solo, grau de coberto ou fragmentação da

paisagem. Como tal, existe a necessidade da inclusão da incerteza no processo de avaliação da

exactidão de cartografias de ocupação do solo, com o intuito de incorporar a dúvida humana na

classificação da “realidade” nas bases de dados de referência.

Tradicionalmente, a avaliação da exactidão temática de cartografias de ocupação do solo era tratada

utilizando uma abordagem booleana, ou seja, assume-se que cada classe de ocupação do solo é

mutuamente exclusiva e exaustiva do espaço de ocorrência. No entanto, esta abordagem não reflecte

o modo como são representadas nas cartografias a variação e a heterogeneidade da paisagem. Por

outro lado, utilizando uma abordagem fuzzy, consegue-se transmitir muito mais informação aos

utilizadores das cartografias, nomeadamente sobre a magnitude dos erros e a ambiguidade que

existe entre classes de ocupação do solo nelas representadas. Esta abordagem permite também uma

caracterização mais real da paisagem, pois tem em linha de conta as variações e heterogeneidade da

mesma.

Este trabalho tem como objectivo estudar e avaliar a exactidão e qualidade de cartografias de

ocupação do solo derivadas de imagens MERIS, para Portugal Continental, através de uma

abordagem não convencional cuja utilização é sustentada por uma base de dados de referência com

índices de incerteza e de localização para as unidades amostrais. No decurso deste trabalho

demonstrámos que o recurso a funções fuzzy, para a avaliação da exactidão temática de cartografias

de ocupação do solo, em detrimento da abordagem rígida tradicional, permite fornecer mais

informação aos utilizadores sobre as condições ambientais em que os erros estão a ser cometidos.

Os utilizadores destas cartografias podem assim decidir se uma determinada cartografia satisfaz

globalmente as suas necessidades, pois estão mais conscientes do erro e da incerteza inerente ao

processo de produção da cartografia que estão a utilizar.

V

ACRÓNIMOS

AATSR: Advanced Along Track Scanning Radiometer ACP: Análise de Componentes principais

ASAR: Advanced Synthetic Aperture Radar AVHRR: Advanced Very High Resolution Radiometer

CLC: Co-Ordination of Information on the Enviornment

CLC2000: CORINE Land Cover 2000

CMP 1: Componente 1

CMP 2: Componente 2 DGRF: Direcção Geral dos Recursos Florestais

DORIS: Doppler Orbitography and Radio-positioning Integrated by Satellite ESA: European Spatial Agency

ERS: European Remote Sensing Satellite GLC: Global Land Cover

GOMOS: Global Ozone Monitoring by Occultation of Stars GPS: Global Positioning System

IGARSS’2007: International Geoscience and Remote Sensing Symposium 2007 IGBP: International Geosphere-Biosphere Programme

LRR: Laser Retro-Reflector MERIS: Medium Resolution Imaging Spectrometer Instrument

MIPAS: Michelson Interferometer for Passive Atmospheric Sounding MODIS: Moderate Resolution Imaging Spectroradiometer MWR: Microwave Radiometer NDVI: Normalized Difference Vegetation Index

NOAA: National Oceanic & Atmospheric Administration

RA-2: Radar Altimeter SCIAMACHY: SCanning Imaging Absorption spectroMeter for Atmospheric CartograpHY SIG: Sistema de Informação Geográfica

SPOT: Satellite Pour l'Observation de la Terre

UPA: Unidade primária de amostragem

USA: Unidade secundária de amostragem

http://envisat.esa.int/instruments/meris/

VI

ÍNDICE GERAL AGRADECIMENTOS ............................................................................................................................. III

RESUMO................................................................................................................................................ IV

ACRÓNIMOS ..........................................................................................................................................V

ÍNDICE GERAL ......................................................................................................................................VI

ÍNDICE DE FIGURAS ..........................................................................................................................VIII

ÍNDICE DE TABELAS ............................................................................................................................ IX

1. INTRODUÇÃO .................................................................................................................................... 1

2. ENQUADRAMENTO METODOLÓGICO ............................................................................................ 5

2.1 Satélites e sensores de média resolução espacial ....................................................................... 5

2.1.1 Satélite ENVISAT .................................................................................................................. 6

2.1.2 Sensor MERIS ....................................................................................................................... 6

2.2 Avaliação da exactidão temática de cartografias de ocupação do solo ....................................... 8

2.2.1 Nível aceitável de exactidão.................................................................................................. 9

2.2.2 Unidade de amostragem ..................................................................................................... 10

2.2.3 Protocolo de amostragem.................................................................................................... 12

2.2.4 Dimensão da amostra.......................................................................................................... 20

2.2.5 Técnicas de análise da exactidão temática de cartografias de ocupação do solo ............. 21

2.2.6 Testes de hipótese .............................................................................................................. 25

2.3 Avaliação da incerteza em cartografias de ocupação do solo.................................................... 25

2.4 Incerteza na avaliação da exactidão temática de cartografias de ocupação do solo................. 29

2.4.1 Atribuição de dois códigos nas amostras de bases de dados de referência ...................... 29

2.4.2 Teoria fuzzy ......................................................................................................................... 30

2.4.3 Escala linguística ................................................................................................................. 31

2.4.4 Funções fuzzy para avaliação da exactidão temática de cartografias de ocupação do solo

...................................................................................................................................................... 32

3. METODOLOGIA................................................................................................................................ 38

3.1 Base de dados de referência ...................................................................................................... 38

3.1.1 Nomenclatura utilizada ........................................................................................................ 38

3.1.2 Unidade amostral................................................................................................................. 39

3.1.3 Dimensão da amostra e protocolo de amostragem ............................................................ 41

3.1.4 Análise estatística da base de dados de referência............................................................ 41

3.2 Selecção temporal da imagem MERIS para produção do mapa de ocupação do solo para teste

da metodologia de validação ............................................................................................................ 42

3.2.1 Classificação mensal da ocupação do solo através do algoritmo da Máxima

Verosimilhança e avaliação da exactidão mensal dos mapas produzidos .................................. 42

3.2.2 Análise exploratória da separabilidade espectral das classes de ocupação do solo em cada

estação do ano ............................................................................................................................. 43

3.3 Avaliação da exactidão da cartografia de ocupação do solo...................................................... 44

VII

3.3.1 Avaliação da exactidão baseada em matrizes de confusão ............................................... 45

3.3.2 Avaliação da qualidade da cartografia produzida baseada em funções fuzzy ................... 45

4. ANÁLISE DE RESULTADOS............................................................................................................ 50

4.1 Análise estatística da base de dados de referência ................................................................... 50

4.1.1 Análise global das classes de ocupação do solo da base de dados de referência ............ 50

4.1.2 Análise dos índices de confiança da base de dados de referência .................................... 52

4.1.3 Análise dos índices de localização da base de dados de referência.................................. 55

4.1.4 Análise das classes de mosaicos da base de dados de referência.................................... 58

4.2 Exactidão global das imagens MERIS validadas com as amostras de treino............................ 60

4.3 Análise estatística multivariada da separabilidade espectral intra-anual das classes de

ocupação do solo .............................................................................................................................. 60

4.3.1 Análise dos descritores estatísticos .................................................................................... 60

4.3.2 Análise factorial discriminante da separabilidade espectral das classes de ocupação do

solo ............................................................................................................................................... 64

4.3.3 Distância entre classes de ocupação do solo ..................................................................... 67

4.4 Avaliação da exactidão temática da cartografia de ocupação do solo....................................... 73

4.4.1 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de

confusão ....................................................................................................................................... 73

4.4.2 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de

confusão, relativamente aos índices e classes de mosaico da base de dados de referência..... 76

4.4.3 Avaliação da qualidade da cartografia de ocupação do solo através de funções fuzzy ..... 82

5. CONCLUSÃO E RECOMENDAÇÕES.............................................................................................. 95

REFERÊNCIAS BIBLIOGRÁFICAS.................................................................................................... 100

ANEXOS.............................................................................................................................................. 106

Anexo 1 ................................................................................................................................................ I

Anexo 2 .............................................................................................................................................. IX

Anexo 3 .............................................................................................................................................XV

Anexo 4 ...........................................................................................................................................XVII

Anexo 5 ..........................................................................................................................................XVIII

Anexo 6 ...........................................................................................................................................XXII

VIII

ÍNDICE DE FIGURAS Figura 1. Satélite ENVISAT. .................................................................................................................... 6

Figura 2. Sensor MERIS.......................................................................................................................... 7

Figura 3. Sistema de varrimento do MERIS............................................................................................ 8

Figura 4. Amostragem aleatória simples............................................................................................... 13

Figura 5. Amostragem sistemática........................................................................................................ 14

Figura 6. Amostragem estratificada. ..................................................................................................... 16

Figura 7. Amostragem por conglomerados. .......................................................................................... 18

Figura 8. Avaliação da exactidão temática de uma cartografia de ocupação do solo. ......................... 22

Figura 9. Representação matemática de uma matriz de confusão. ..................................................... 23

Figura 10. Acumulação do erro em dados de detecção remota ao longo do processo de produção de

cartografia. .................................................................................................................................... 26

Figura 11. Análise do erro. .................................................................................................................... 27

Figura 12. Unidade amostral e sua vizinhança. .................................................................................... 39

Figura 13. Fluxograma do processo metodológico. .............................................................................. 49

Figura 14. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Janeiro. ...... 61

Figura 15. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Abril........... 62

Figura 16. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Agosto........ 63

Figura 17. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Novembro. 63

Figura 18. Componentes 1 e 2 para o mês de Janeiro........................................................................ 64

Figura 19. Componentes 1 e 2 para o mês de Abril. ............................................................................ 65

Figura 20. Componentes 1 e 2 para o mês de Agosto. ........................................................................ 66

Figura 21. Componentes 1 e 2 para o mês de Novembro. ................................................................... 66

Figura 22. Dendrograma para a imagem do mês de Janeiro. .............................................................. 68

Figura 23. Dendrograma para a imagem do mês de Abril. ................................................................... 69

Figura 24. Dendrograma para a imagem do mês de Agosto. ............................................................... 71

Figura 25. Dendrograma para a imagem do mês de Novembro........................................................... 72

IX

ÍNDICE DE TABELAS Tabela 1. Comprimento de onda das 15 bandas do sensor MERIS e suas principais utilizações......... 7

Tabela 2. Características dos métodos de amostragem mais utilizados na avaliação da exactidão

temática de cartografias de ocupação do solo. ............................................................................ 20

Tabela 3. Nomenclatura de ocupação do solo LANDEO, utilizada na classificação da base de dados

de referência. ................................................................................................................................ 39

Tabela 4. Principais características das imagens aéreas utilizadas na elaboração da base de dados

de referência. ................................................................................................................................ 40

Tabela 5. Códigos e índices atribuídos a cada unidade amostral da base de dados de referência. ... 40

Tabela 6. Número de observações da cada classe de ocupação do solo e respectiva frequência

relativa na base de dados de referência. ..................................................................................... 51

Tabela 7. Frequência de cada classe de ocupação de solo relativamente aos índices de confiança. 53

Tabela 8. Frequência de cada classe de ocupação de solo relativamente aos índices de localização.

...................................................................................................................................................... 56

Tabela 9. Frequência de mosaicos em cada classe de ocupação do solo relativamente às classes de

mosaico......................................................................................................................................... 59

Tabela 10. Exactidão global da classificação efectuada de cada imagem MERIS para cada mês do

ano. ............................................................................................................................................... 60

Tabela 11. Matriz de confusão (Classificação do mapa VS CMP 1 das amostras de referência). ...... 73

Tabela 12. Exactidão global da cartografia sem amostras classificadas como mosaicos e só com

amostras classificadas como mosaicos. ...................................................................................... 77

Tabela 13. Exactidão global da cartografia sem amostras classificadas como mosaico, como mosaico

de áreas agrícolas, como mosaico de vegetação e como mosaico de áreas agrícolas/áreas de

vegetação/áreas artificiais. ........................................................................................................... 78

Tabela 14. Exactidão global da cartografia para cada um dos índices de confiança........................... 80

Tabela 15. Exactidão global da cartografia para cada um dos índices de localização. ....................... 81

Tabela 16. Análise da exactidão temática utilizando as funções MAX e RIGHT................................. 83

Tabela 17. Análise da exactidão temática utilizando a função DIFFERENCE. .................................... 85

Tabela 18. Análise da exactidão temática utilizando a função MEMBERSHIP. ................................... 87

Tabela 19. Confusão e ambiguidade das classes de ocupação do solo utilizando as funções

CONFUSION e AMBIGUITY. ....................................................................................................... 89

Introdução

1

1. INTRODUÇÃO

A ocupação do solo é o elemento resultante das interacções que ocorrem entre as variáveis físicas e

biológicas do território, ou seja, é o que resulta da articulação existente entre os processos naturais e

os processos antrópicos. Como tal, é através da análise da ocupação do solo que o Homem pode

inferir sobre os impactos associados à satisfação das suas necessidades, como também quantificar

os recursos que estão à sua disposição. Em nenhuma outra época da existência humana, o Homem

se deparou com tamanha necessidade de gerir os recursos que lhe são disponibilizados e sem os

quais as suas actividades não seriam possíveis. O aumento demográfico é uma realidade, e urge

planear e gerir os recursos disponíveis, sendo assim necessário, para esse processo de gestão e

planeamento, cartografias temáticas de ocupação do solo actualizadas e rigorosas, para que estas

possam ser utilizadas para cumprir os objectivos para os quais foram concebidas.

As cartografias de ocupação do solo são uma das peças fundamentais na elaboração de diversos

planos e estudos, tais como a distribuição espacial e padrões de ocupação do solo, estimação da

área ocupada pelas mais diversas classes de ocupação do solo, análise das alterações da ocupação

do solo, como dado de input para a concepção de modelos hidrológicos e análises de risco (Stheman,

1998; Stheman e Czaplewski, 1998). Para se entenderem as mudanças constantes a que a

ocupação do solo está sujeita a uma escala global ou regional, é necessária a aquisição de um

elevado volume de dados, o qual só é possível através da detecção remota, mais concretamente

através de imagens digitais obtidas por satélites. Só através de imagens de satélite poderemos

produzir cartografias de ocupação do solo que abranjam grandes superfícies, num espaço temporal

reduzido e com um custo que possa ser comportado pelas entidades que são responsáveis pela sua

produção. De facto, os dados obtidos através de satélites são nos dias de hoje uma fonte crescente

de informação usada na produção de cartografia de ocupação do solo (Caetano et al., 2006). Assim

sendo, neste contexto é necessário compreender o conceito de resolução espacial das imagens de

satélite. Segundo Chuvieco (1996), a resolução espacial determina qual o objecto mais pequeno que

pode ser distinguido numa imagem e desempenha um papel muito importante na interpretação visual

da imagem, pois é este aspecto que determina o detalhe que esta pode oferecer. De facto, os

primeiros satélites a serem lançados para o espaço transportavam sensores com resoluções

espaciais muito reduzidas, e o seu período de revisita de um mesmo local era muito longo, não

permitindo por um lado distinguir determinadas características da paisagem que interessava

cartografar, como não permitiam também acumular um grande volume de dados para uma mesma

região (e.g. SPOT). Mais recentemente, foram lançados satélites com elevadas resoluções espaciais

e temporais, como o IKONOS 2 e o QUICKBIRD 2, que já possuem períodos de revisita do mesmo

local muito curtos (cerca de 3 dias). Contudo, estas imagens são muito dispendiosas e não são as

mais adequadas para uma monitorização a escalas regionais e globais da ocupação do solo. Não

existiam assim, satélites com sensores que pudessem corresponder às necessidades de uma

monitorização a uma escala regional-global, com espaços temporais curtos, para uma maior

Introdução

2

compreensão da dinâmica da ocupação do solo a uma escala planetária. Com o objectivo de

colmatar estas necessidades, foi lançado recentemente o satélite ENVISAT (ESA) com o sensor

MERIS a bordo. Este sensor de média resolução espacial, veio complementar as necessidades da

comunidade científica face às alterações ambientais a uma escala regional e global.

Segundo Caetano et al. (2002), as cartografias temáticas de ocupação do solo são uma ferramenta

indispensável em estudos ambientais, na tomada de decisão em ordenamento e planeamento do

território e na definição de políticas de gestão dos recursos naturais. As cartografias de ocupação do

solo assumem assim um papel muito importante na gestão das principais actividades económicas,

resultantes do uso dos recursos naturais (e.g. agricultura, produção florestal, extracção de inertes,

transportes e telecomunicações), tendo como objectivo alcançar a sustentabilidade. É também

importante na caracterização da situação de referência, nomeadamente em estudos de impacte

ambiental, planos de ordenamento do território, caracterização de habitats com interesse para

conservação, cumprimento do Protocolo de Kyoto, e para a construção de modelos climáticos

baseados na interacção da ocupação do solo/atmosfera e nas alterações das diferentes classes de

ocupação do solo.

Contudo, é importante reconhecer vários aspectos relacionados com a produção de cartografias de

ocupação do solo. Segundo Carrão (2002), existem várias questões às quais é necessário dar

resposta: será que a avaliação de uma paisagem sujeita a pressões externas (e.g. pressão urbana,

fogos florestais), poderá ser diferente em função da escala a que essa avaliação é realizada, ou da

unidade mínima cartográfica; e até que ponto estes aspectos técnicos da cartografia poderão

influenciar os processos de tomada de decisão? Realmente, a elaboração de cartografia temática é

sempre um processo de generalização da realidade (Robinson et al., 1978), pois não é possível

representar toda a realidade do território num mapa, e existem sempre aspectos da paisagem que

são omitidos.

Outra das questões chave da produção de cartografias de ocupação do solo é de que estas

cartografias são muitas vezes avaliadas como tendo qualidade insuficiente para a sua utilização em

aplicações operacionais. Segundo Lunetta et al. (1991), os produtos finais disponibilizados aos

utilizadores, têm muito pouca informação acerca da confiança com que os utilizadores podem utilizar

essa informação. Este aspecto limita a confiança com que é implementada uma decisão, sendo assim

da maior importância melhorar os métodos para quantificar os erros associados aos dados e como

estes se propagam ao longo do processo de elaboração de SIG. A avaliação da qualidade temática é

tipicamente baseada numa comparação dos mapas produzidos com um conjunto de amostras com

informação de referência (Foody, 2002). A não existência de acordo entre estes conjuntos de dados é

tradicionalmente interpretada como sendo um erro na cartografia (Congalton, 1991). No entanto, esta

não concordância pode não ser necessariamente devida a erros de classificação. Congalton e Green

(1999) apontam algumas origens que provocam a não concordância entre as cartografias produzidas

e as bases de dados de referência (e.g. problemas de localização das amostras de referência,

Introdução

3

dificuldade na distinção por parte dos foto-intérpretes de determinadas classes de ocupação do solo,

alterações na ocupação do solo entre a data de produção das cartografias e da classificação das

amostras de referência). Assim sendo, é da maior importância uma maior compreensão da origem do

erro e da incerteza no processo de avaliação da exactidão temática de cartografias de ocupação do

solo, com o intuito de fornecer informação mais adequada e detalhada para cumprir os objectivos de

utilização dos potenciais utilizadores de cartografias de ocupação do solo.

Pretende-se com este estudo verificar o potencial de imagens MERIS na elaboração de cartografias

de ocupação do solo, conjugando métodos e índices de avaliação da exactidão temática tradicionais

(matrizes de confusão), com funções que permitam avaliar a exactidão temática através da inclusão

de incerteza (funções fuzzy). Ao optarmos por uma comparação da avaliação da exactidão temática,

recorrendo a estas duas abordagens, pretendemos demonstrar que existem diferenças na avaliação

da exactidão temática quer ao nível global da cartografia, quer ao nível de cada classe de ocupação

do solo da nomenclatura utilizada e comparar ambas as metodologias. Para além dos aspectos

anteriormente referidos, a utilização de funções que incorporam a incerteza na avaliação, permite

uma análise mais detalhada das classes de ocupação do solo, nomeadamente as que mais se

confundem entre si, bem como aquelas em que houve uma maior dificuldade de interpretação por

parte da equipa que recolheu a amostra de referência que serviu de base à avaliação. Assim sendo,

através do conhecimento destes aspectos pretende-se também verificar até que ponto a inclusão da

incerteza no produto final poderá ser benéfica para os potenciais utilizadores de cartografias de

ocupação do solo. De notar que para cumprir os objectivos deste trabalho, foram efectuados vários

estudos paralelos, nomeadamente uma análise estatística de separabilidade espectral das classes de

ocupação do solo e a produção automática de cartografia de ocupação do solo derivada de imagens

MERIS de 2005, fazendo portanto parte integrante do presente trabalho.

A motivação e o interesse da realização deste estudo estão relacionados com o facto de não

existirem muitos trabalhos sobre avaliação da exactidão de cartografias de ocupação do solo em que

são utilizadas metodologias com a incorporação da incerteza (e.g. Gopal e Woodcock,1994;

Woodcock e Gopal, 2000). Desta forma, os estudos inovadores que constituem este trabalho deram

origem a 3 artigos científicos publicados pelo Grupo de Detecção Remota (GDR) do Instituto

Geográfico Português (IGP). Estes estudos abordam: 1) a elaboração de uma base de dados de

referência que foi utilizada para se proceder à avaliação da exactidão e qualidade temática de

cartografia de ocupação do solo; 2) análise exploratória de imagens MERIS para a avaliação da

separabilidade espectral entre classes de ocupação do solo; 3) classificação e avaliação tradicional

de um mapa de ocupação do solo para Portugal Continental derivado de imagens MERIS. Esta

análise prévia irá permitir a selecção da melhor imagem MERIS relativa ao ano de 2005, com o intuito

de se produzir um mapa, através de métodos automáticos, no qual possamos aplicar a nossa

metodologia de validação. Estes artigos podem ser consultados nos Anexos 1 e 2.

Introdução

4

O presente trabalho encontra-se dividido em cinco capítulos. No primeiro capítulo faz-se uma breve

abordagem aos sensores de média resolução e da importância da avaliação da exactidão temática na

produção de cartografias de ocupação do solo. Referem-se também neste capítulo as motivações

que levaram à elaboração deste trabalho.

No segundo capítulo, realiza-se uma revisão bibliográfica sobre o sensor MERIS, o processo de

avaliação da exactidão temática, e aborda-se também a inclusão da incerteza na construção de

bases de dados de referência, como também na avaliação da qualidade de cartografias de ocupação

do solo.

Relativamente ao terceiro capítulo, descrevem-se as metodologias utilizadas na construção de uma

base de dados de referência e os métodos de análise desta base de dados, os métodos utilizados na

análise exploratória de imagens MERIS relativas ao ano de 2005, com o intuito de se escolher a

melhor imagem que servirá de base à produção de uma cartografia de ocupação do solo e finalmente

os métodos utilizados para a avaliação da exactidão e qualidade da cartografia produzida, ou seja

com a inclusão da incerteza e sem a inclusão da incerteza.

No quarto capítulo, apresentam-se os resultados relativos à base de dados de referência,

nomeadamente os dados estatísticos da amostra, uma análise das classes de ocupação do solo que

apresentam maior confusão e incerteza, uma análise das unidades amostrais que apresentam uma

maior heterogeneidade em termos de ocupação do solo e os resultados obtidos da análise

exploratória das imagens de satélite estudadas. Por fim, analisam-se os resultados relativos à

avaliação da exactidão e qualidade da cartografia de ocupação do solo produzida no âmbito deste

trabalho.

No último capítulo, efectua-se uma reflexão geral sobre os resultados deste trabalho, como também

algumas recomendações e sugestões para o desenvolvimento de futuros trabalhos.

Enquadramento metodológico

5

2. ENQUADRAMENTO METODOLÓGICO

2.1 Satélites e sensores de média resolução espacial

A necessidade de produção de cartografia de ocupação do solo com qualidade, precisa e actualizada

é nos dias de hoje, essencial nos processos de tomada de decisão (Araújo e Caetano, 2006). O factor

escala é essencial na informação que pode ser extraída dessa mesma cartografia, devido à

generalização da realidade. Esta generalização é um processo inerente ao processo de produção de

cartografias de ocupação do solo, pois não é possível cartografar a realidade no seu todo. De facto,

Carrão (2002), considera que é fundamental reconhecer que o processo de generalização depende

fundamentalmente do tipo de mapa a produzir, do seu objectivo, da escala original e da variação de

escala pretendida. Geralmente, as escalas de representação tradicionais de cartografias de ocupação

do solo (por pixel) podem ser consideradas regionais e globais (Gerlach et al., 2005); globais,

continentais e regionais (Bagan et al., 2005).

Vários sensores têm vindo a ser utilizados para a obtenção de dados de detecção remota a uma

escala regional e global, tais como o NOAA-AVHRR, LANDSAT ou o SPOT. Para a monitorização de

grandes áreas como a Europa, tradicionalmente recorria-se à interpretação visual de imagens

LANDSAT e SPOT, ou então a algoritmos de classificação automática. Contudo, estes sensores de

satélites apresentam algumas limitações para a produção de cartografia de ocupação do solo,

nomeadamente a escalas regionais. Estas limitações estão relacionadas principalmente com uma

reduzida resolução temporal, sendo por isso muito dispendiosa e morosa a elaboração de

cartografias de ocupação do solo a nível europeu (Clevers et al. 2004). O mesmo autor refere ainda

que a utilização de imagens obtidas pelo sensor NOAA-AVHRR, também não era a ideal, pois a sua

reduzida resolução espacial (pixel com 1 Km2) e espectral (apenas 5 bandas) não permitia a

identificação de determinadas classes de ocupação do solo que seriam importantes cartografar. Outra

das limitações da utilização das imagens LANDSAT e SPOT está relacionada com os períodos de

revisita (resolução temporal) serem muito alargados e o preço das imagens ser também muito

elevado (Freire et al., 2002).

O recente lançamento dos satélites TERRA e AQUA, que incorporam o sensor MODIS e do satélite

ENVISAT, que incorpora o sensor MERIS, vieram preencher a lacuna que existia entre os sensores

de elevada e reduzida resolução espacial, como também permitiu uma cobertura global da superfície

terrestre de imagens com uma elevada frequência (MERIS: 3 dias; MODIS: 1 a 2 dias). Outra das

vantagens destes sensores de média resolução espacial é o facto de possuírem uma elevada

resolução espectral, nomeadamente o sensor MERIS com 15 bandas (Milla et al., 2005). Bagan et al.

(2005), refere que os produtos MODIS, podem ser obtidos sem qualquer custo, podendo substituir as

imagens AVHRR, para a monitorização regional e global das condições ambientais.


6

De seguida, apresenta-se o satélite ENVISAT e o sensor MERIS mais detalhadamente.

2.1.1 Satélite ENVISAT

A ESA, lançou a 1 de Março de 2002 o satélite ENVISAT (Figura 1), com vários objectivos (ESA,

2006):

• Dar continuidade às observações iniciadas pelos satélites ERS, incluindo os que obtêm a

informação através de radar;

• Complementar a missão ERS, nomeadamente as missões ligadas aos oceanos e ao gelo;

• Expandir a gama de parâmetros observados, com o objectivo de aumentar o conhecimento

dos factores ligados ao ambiente;

• Dar um contributo importante aos estudos ambientais, nomeadamente na área da química da

atmosfera e estudos do oceano (incluindo a biologia marinha);

• Permitir uma monitorização e gestão mais efectiva dos recursos terrestres;

• Permitir uma melhor compreensão da dinâmica dos processos do planeta Terra.

Figura 1. Satélite ENVISAT (Fonte: ESA, 2006).

O satélite ENVISAT possui um peso de 8211 kg e as suas dimensões em órbita são de 26 m de

comprimento, 10 m de largura e 5 m de altura. O ENVISAT transporta a bordo 11 sensores (ASAR,

MERIS, AATSR, RA-2, MWR, GOMOS, MIPAS, SCIAMACHY, DORIS e LRR). Um destes sensores,

o MERIS, será abordado mais detalhadamente no próximo capítulo. Este satélite orbita a uma altitude

de 800 km, sendo a sua órbita hélio-sincrona e cruzando o equador às 10h00. A sua resolução

temporal absoluta é de 35 dias (ESA, 2006).

2.1.2 Sensor MERIS

O lançamento do sensor MERIS (Figura 2), a bordo do satélite ENVISAT (Figura 1), tem como

principal objectivo contribuir para um maior conhecimento sobre o papel dos oceanos e a sua


7

produtividade no sistema climático. Outros objectivos do sensor MERIS estão directamente

relacionados com uma maior compreensão dos parâmetros atmosféricos associados às nuvens,

vapor de água e aerossóis e com os parâmetros relacionados com a superfície terrestre,

nomeadamente os relacionados com a dinâmica da vegetação (ESA, 2005).

Figura 2. Sensor MERIS (Fonte: ESA, 2002).

O MERIS possui 15 bandas espectrais que podem ser programadas em largura e posição(Tabela 1).

Estas 15 bandas, encontram-se distribuídas no espectro electromagnético pela zona do visível e do

infravermelho próximo (390 nm - 1040 nm). A sua resolução espacial pode ser de 300 m ou 1200 m,

sendo a sua resolução radiométrica de 12 bits (ESA, 2005).

Tabela 1. Comprimento de onda das 15 bandas do sensor MERIS e suas principais utilizações (Fonte: ESA, 2005).

Banda Centro (nm) Largura (nm) Principais utilizações 1 412,5 10 Substância amarela e detritos de pigmentos 2 442,5 10 Máximo de absorção pela clorofila 3 490 10 Clorofila e outros pigmentos 4 510 10 Sedimentos em suspensão, marés vermelhas 5 560 10 Mínimo de absorção pela clorofila 6 620 10 Sedimentos em suspensão 7 665 10 Absorção pela clorofila e referência da fluorescência 8 681,25 7,5 Pico de fluorescência da clorofila 9 708,75 10 Referência da fluorescência, correcções atmosféricas

10 753,75 7,5 Vegetação, nuvens 11 760,625 3,75 Banda R de absorção pelo oxigénio 12 778,75 15 Correcções atmosféricas 13 865 20 Vegetação, referência para o vapor de água 14 885 10 Correcções atmosféricas 15 900 10 Vapor de água, terra

O sensor MERIS, possui um campo de visão de 68,5º, tendo as imagens capturadas pelo sensor uma

largura (swath widht) de 1150 km. O MERIS utiliza para a captura das imagens, um sensor do tipo

push-broom scanning ou along track scanning (Figura 3), tendo uma resolução temporal de 3 dias

(ESA, 2005).


8

Figura 3. Sistema de varrimento do MERIS (Fonte: ESA, 2004).

Como anteriormente referido, a resolução espacial das imagens MERIS, pode ser de 300 m ou de

1200 m. Assim sendo, são disponibilizados vários produtos com estas resoluções que podem ser

adquiridos através do software EOLI-SA:

• Resolução máxima (Full Resolution-FR) de 300 m;

• Resolução reduzida (Reduced Resolution-RR) de 1200 m.

2.2 Avaliação da exactidão temática de cartografias de ocupação do solo

As cartografias temáticas elaboradas a partir de dados obtidos por detecção remota, antes de

poderem ser utilizados para investigação cientifica e processos de tomada de decisão, devem ser

sujeitos a uma rigorosa avaliação estatística da sua exactidão (Stheman e Czaplewski, 1998). Esta

avaliação da exactidão de cartografias temáticas, nomeadamente de cartografias de ocupação do

solo, assume um papel muito importante na qualidade das cartografias produzidas posteriormente

com base nos dados obtidos a partir de imagens de satélite. Neste contexto, o conhecimento da

exactidão das cartografias e o seu ajustamento à realidade é um assunto chave, considerando o seu

uso em processos de gestão e de tomada de decisão (Caetano et al., 2006). Estimar a exactidão

temática de cartografias de ocupação do solo é assim um factor importante para o utilizador. Só

através do conhecimento do nível de erro das cartografias se pode ter noção do seu real valor e quais

serão as limitações das mesmas, tendo em conta os objectivos para os quais foram elaboradas e

adquiridas. O desconhecimento do nível de exactidão das cartografias temáticas pode levar a erros

nos processos de tomada de decisão, tanto políticos, económicos, como ambientais. Esta

problemática assume ainda um papel mais importante quando estas decisões afectam directamente a

sociedade, ou seja um desconhecimento do erro inerente às cartografias poderá ser determinante


9

numa melhor ou pior tomada de decisão. Um uso responsável dos dados geográficos só é assim

possível se a qualidade dessa informação for conhecida (Hashemian et al., 2004).

Segundo Dicks e Lo (1990), ao desenvolver-se o processo de avaliação da exactidão de cartografias

temáticas, deve-se determinar o nível aceitável de exactidão, a dimensão da amostragem, a

estratégia para a selecção das amostras e os métodos a utilizar para avaliar a exactidão das

cartografias de ocupação do solo.

De seguida apresenta-se um resumo dos procedimentos a cumprir na avaliação da exactidão de

cartografias de ocupação do solo.

2.2.1 Nível aceitável de exactidão

O processo de avaliação da exactidão de cartografias de ocupação do solo deve começar com a

definição do nível aceitável de exactidão (Carrão, 2006). A definição do nível aceitável de exactidão

irá influenciar os restantes passos do processo de avaliação da exactidão de cartografias de

ocupação do solo. Consoante o nível de exactidão que se pretende atingir deverá ser implementada

uma ou outra estratégia de amostragem. De facto, uma das questões fundamentais na adopção de

um ou de outro método de amostragem envolve o nível aceitável de exactidão, desde que o nível

aceitável de exactidão, combinado com o nível aceitável de erro, possa ser utilizado para determinar

a dimensão da amostragem (Wulder et al., 2006).

Segundo Anderson et al. (1976), os dados de ocupação e uso do solo derivados de imagens de

satélite, com o objectivo de planeamento e gestão, deverão ter uma exactidão satisfatória quando o

analista efectua uma interpretação correcta 85% a 90% das vezes. De facto, um valor de 85% como

nível de exactidão temática a atingir é amplamente aceite pela comunidade da detecção remota (e.g.

Foody (2002); Reese et al. (2002)).

Apesar do consenso perante este valor, Wulder et al. (2006) levanta várias questões: Será que este

valor de 85% deverá ser o valor atingido por todas as classes ou por apenas algumas classes? Será

que as classes têm todas a mesma importância ou será que há classes que poderão não apresentar

a mesma importância? O valor de exactidão do produto deve depender do objectivo da sua aplicação

(Wulder et al., 2006). De acordo com Wulder et al. (2006), para a obtenção de ganhos substanciais

na eficiência da amostragem de um produto de ocupação de solo com mais de 10 classes de

ocupação do solo, a exactidão de cada classe deve exceder os 70%.

Em determinadas situações é necessário um nível de exactidão mais elevado (e.g. regulação de

actividades ligadas ao uso do solo). Este aumento do nível de exactidão implica necessariamente um

aumento dos custos, o que nem sempre é possível. No entanto, este valor não é muito realista para


10

diversas classes de ocupação do solo. Wulder et al. (2006) estabeleceu uma série de exemplos onde

mostra que a exactidão das cartografias de ocupação do solo estão a estabilizar entre os 50% e os

70%. É também importante referir que não existe um valor fixo e que este não deve depender das

imagens e processos de produção, mas sim dos requisitos dos utilizadores.

2.2.2 Unidade de amostragem

A unidade de amostragem nos processos de avaliação da exactidão de cartografias de ocupação do

solo pode ser definida como a unidade de comparação entre a referência e o mapa de ocupação do

solo produzido. Será da comparação da classificação de imagens de satélite obtida através de

métodos automáticos, com a classificação de referência das unidades amostrais que se obterá a

exactidão global das cartografias produzidas. Segundo Stehman e Czaplewski (1998), a unidade de

amostragem pode ser definida como a unidade fundamental na qual a avaliação da exactidão

temática é baseada, ou seja, é a ligação entre a localização espacial no mapa e a localização

correspondente no território.

Segundo Stehman e Czaplewski (1998), existem dois tipos de unidades de amostragem que podem

ser implementadas no processo de avaliação da exactidão de cartografias de ocupação do solo: 1)

unidades de amostragem implementadas sob a forma de pontos; 2) ou sob a forma de áreas,

podendo apresentar este último caso várias extensões e formas. As unidades de amostragem

implementadas como áreas poderão ter a dimensão do pixel da imagem, ou então serem definidas

como polígonos que contenham vários pixels, podendo não estar necessariamente definidas

consoante as características do mapa de ocupação do solo.

A unidade de amostragem deverá ser definida antes da concepção do protocolo de amostragem. Os

vários protocolos de amostragem existentes têm diferentes características e deverão ser utilizados

tendo em conta qualquer um dos dois tipos de unidades de amostragem adoptados (Stehman e

Czaplewski, 1998).

Outro aspecto que importa realçar é a distinção entre a unidade de amostragem e a classe de

ocupação do solo de referência registada nessa mesma unidade. A unidade de amostragem é

apenas uma localização (ponto) ou área no espaço, onde a observação efectuada nessa mesma

amostra é estabelecida na definição do protocolo de amostragem (Stehman e Czaplewski, 1998)., ou

seja, quando é definida a nomenclatura.

De seguida apresentam-se mais detalhadamente algumas características dos tipos de unidades de

amostragem utilizados na avaliação da exactidão de cartografias de ocupação do solo.


11

2.2.2.1 Ponto como unidade de amostragem

Estatisticamente, a principal distinção entre a amostragem por pontos e por áreas é de que a primeira

é vista como uma população continua enquanto que a segunda é vista como discreta. Segundo

Moisen et al. (1994), uma população contínua evita a dificuldade na interpretação de uma

amostragem de referência baseada no pixel.

2.2.2.2 Áreas como unidade de amostragem

A unidade amostral definida como uma área pode ser de três tipos: pixels, polígonos ou

conglomerados. Qualquer um destes tipos de amostragem divide a população num número finito de

unidades discretas (Stehman e Czaplewski, 1998). Segundo os mesmos autores, tanto os pixels

como os polígonos, correspondem a estruturas utilizadas nos SIG para representar uma classe de

ocupação do solo, enquanto que os conglomerados não possuem necessariamente esta

correspondência, ou seja, poderão representar mais do que uma classe de ocupação do solo.

A informação ou classificação contida nos pixels deriva da classificação automática de imagens de

satélite, sendo estas unidades homogéneas em tamanho e forma. De facto esta estrutura é

amplamente utilizada nos SIG, sendo também designada como modelo de dados matricial,

nomeadamente ao nível de operações matemáticas que envolvem vários temas, no qual cada pixel

apresenta apenas um valor. O maior ou menor número de pixels está intimamente relacionado com a

resolução espacial das imagens de satélite. Os satélites de grande resolução espacial (e.g. IKONOS,

QUICKBIRD), possuem resoluções espaciais na ordem das dezenas de metro, ou seja, representam

pequenas áreas, mas dividem a população num número finito, mas elevado, de unidades amostrais,

estando por isso mais relacionados com a amostragem por pontos (Stehman e Czaplewski 1998). Por

outro lado, as imagens de satélite de pequena e média resolução espacial (e.g. MERIS, MODIS)

possuem pixels com dimensões na ordem das centenas ou milhares de metros, ou seja, dividem a

população em áreas maiores, mas num número mais reduzido de unidades de amostragem, estando

por isso mais relacionados com a amostragem por áreas.

Os polígonos como unidade amostral diferem dos pixels, pois geralmente são diferentes em forma e

tamanho. Cada polígono representa conceptualmente uma área homogénea de uma classe de

ocupação do solo representada na imagem classificada (polígono digital), ou então pode ser

identificado a partir de fotografia aérea ou vídeo aéreo (polígono foto-interpretado) (Stehman e

Czaplewski, 1998). Este tipo de unidade amostral está associado ao modelo de dados vectorial.

Em relação aos conglomerados, estes diferem dos dois tipos de unidade acima mencionados devido

a não terem que estar necessariamente associados a uma área homogénea relativa a uma classe de

ocupação de solo classificada automaticamente ou a um polígono digitalizado através de foto-

interpretação. Geralmente estes lotes possuem uma forma e área regular. Existem vários exemplos


12

da aplicação deste tipo de unidades de amostragem na avaliação da exactidão temática de

cartografias de ocupação do solo (Wickham et al., 2004; Stehman et al., 2003; Wulder et al., 2006).

2.2.3 Protocolo de amostragem

A escolha do protocolo de amostragem é talvez a decisão mais complexa que tem que ser tomada

durante o planeamento do processo de avaliação da exactidão de cartografias (Wulder et al., 2006).

Definir qual o método de amostragem a utilizar é assim uma das fases mais importantes do processo

de avaliação da exactidão temática de cartografias (Congalton e Green 1999). A amostragem é o

protocolo segundo o qual as unidades de amostragem são seleccionadas (Stehman e Czaplewski

1998). Segundo Stehman (2001), o protocolo de amostragem e a análise das suas componentes

estão directamente relacionados com a inferência estatística e por isso motivam os critérios propostos

para um rigor estatístico. O mesmo autor refere também que um protocolo de amostragem é aquele

no qual a inclusão das probabilidades são conhecidas para todos os elementos na amostra e que a

probabilidade é diferente de zero para todos os elementos da população. Stehman e Czaplewski

(1998), referem que uma amostragem probabilística requer que todas as probabilidades incluídas

sejam superiores a zero e que todas estas probabilidades devem ser conhecidas para todas as

unidades de amostragem seleccionadas na área de estudo. Sem esta inclusão e conhecimento da

probabilidade não é possível obter uma avaliação da exactidão temática estatisticamente válida

(Stehman e Czaplewski 1998).

Utilizando agora uma notação estatística, a probabilidade π de um elemento u, designado por (πu) é

definida como a probabilidade de esse elemento u ser incluído na amostra (u pode ser um pixel, um

polígono ou outra unidade amostral escolhida para a avaliação) (Stehman, 2001). Segundo Stehman

(2001), tendo em conta os aspectos acima mencionados, uma população na qual pode ser aplicada

uma inferência estatística rigorosa é aquela em que todos os seus elementos possuem um πu>0. Se

possuírem um πu=0, são excluídos da amostra e consequentemente a inferência estatística não pode

ser aplicada a esses elementos (e.g. realizar uma amostragem no interior de polígonos exclui uma

parte da população de ser amostrada e a inferência não pode ser aplicada aos limites do polígono).

Stehman e Czaplewski (1998), definiram que uma boa regra a aplicar, quando se planeia uma

avaliação da exactidão temática pode ser implementada quando o protocolo de amostragem proposto

não se adequa aos protocolos de amostragem standard, e os seus implementadores não conseguem

especificar as classes com probabilidade diferente de zero. Nestes casos, o protocolo de amostragem

proposto deve ser posto de parte.

Existem cinco métodos de amostragem muito utilizados que podem ser implementados na recolha

dos dados de referência: amostragem aleatória simples, amostragem aleatória estratificada,

amostragem por conglomerados, amostragem sistemática e amostragem sistemática desalinhada


13

(Congalton e Green, 1999; Stehman e Czaplewski, 1998). Estes métodos serão abordados mais em

pormenor nos sub-capítulos seguintes.

Foody (2002), refere que os métodos de amostragem simples, tais como a amostragem aleatória

simples, podem ser apropriados para a avaliação da exactidão de cartografias de ocupação do solo

se o tamanho da amostragem fôr grande o suficiente para garantir que todas as classes sejam

adequadamente representadas. A adopção de um método de amostragem simples pode ser também

útil para ir de encontro às necessidades de um vasto leque de utilizadores (Stehman e Czaplewski,

1998), apesar de os objectivos de todos os utilizadores não poderem ser antecipados (Stehman et al.,

2000).

Os aspectos atrás mencionados nem sempre são possíveis de cumprir, pois pode ser muito difícil

utilizar uma amostragem aleatória em grandes áreas e avaliar a exactidão das cartografias. Este

aspecto deve-se muitas vezes ao facto das amostras escolhidas aleatoriamente poderem situar-se

em zonas geograficamente inacessíveis (onde visitas de campo são muito difíceis de concretizar) e

devido a elevados custos de deslocação (Foody 2002). Como alternativa à acessibilidade destes

locais, muitas vezes a amostragem é condicionada e restrita a locais em que é possível obter

imagens de satélite ou imagens aéreas de grande resolução espacial (Edwards et al., 1998 in Foody,

2002). No entanto, nestas situações é necessário escolher aleatoriamente as imagens, para se poder

implementar um determinado protocolo de amostragem.

Seguidamente apresentam-se mais detalhadamente os principais métodos de amostragem utilizados

na avaliação da exactidão de cartografias de ocupação do solo.

2.2.3.1 Amostragem aleatória simples

Numa amostragem aleatória simples (Figura 4), cada unidade de amostragem na área de estudo tem

a mesma probabilidade de ser escolhida (Congalton e Green, 1999).

Figura 4. Amostragem aleatória simples.


14

Stehman (1999), refere que este é um método fácil de implementar, pois o cálculo dos estimadores

estatísticos é muito menos complexo quando comparado com outros métodos de amostragem. Este

método de amostragem apresenta também uma elevada flexibilidade, adaptando-se facilmente à

necessidade de um aumento ou uma diminuição do número de amostras, devido a alguma sob ou

sobre estimação dos custos inerentes ao processo de elaboração da amostragem (Stehman, 1999).

Outra das vantagens deste método é a possibilidade das amostras de referência poderem ser

recolhidas simultaneamente (Congalton e Green, 1999).

Contudo, Congalton e Green (1999) afirmam que este método tem a desvantagem de subestimar as

classes com menos representatividade, que também podem ser importantes, a não ser que se

aumente significativamente o número de unidades amostrais. Uma amostragem de um mapa, com

um número adequado de unidades amostrais para cada classe de ocupação do solo é essencial para

determinar adequadamente a exactidão global das cartografias temáticas (Rosenfield et al., 1982).

Stehman (1999), faz referência ao facto de que a amostragem aleatória simples não é espacialmente

bem distribuída, e se esse for um dos critérios prioritários dever-se-á optar por uma amostragem

sistemática ou estratificada, pois obter-se-ão melhores resultados.

2.2.3.2 Amostragem sistemática

A simplicidade e conveniência da amostragem sistemática são extremamente apelativas para os

utilizadores (Stehman, 1992). A amostragem sistemática, segundo Freund e Williams (1972), em

Rosenfield et al. (1982), distribui as unidades amostrais equitativamente por toda a área de estudo e

como tal pode ser tratada como aleatória (Figura 5).

Figura 5. Amostragem sistemática.

No entanto, há alguma controvérsia em relação às propriedades da amostragem sistemática.

Stehman (1992), afirma que essa controvérsia é geralmente devida à não existência de um estimador

não enviesado para o cálculo da variância. Este aspecto leva a uma sobrestimação da variância


15

(Stehman e Czaplewski, 1998). Congalton (1988) afirma mesmo que a amostragem sistemática não

pode ser considerada como aleatória, pois todas as partes da área de estudo (e consequentemente

as classes menos representadas) nunca têm a mesma probabilidade de serem escolhidas. De facto,

a não aleatoriedade da amostragem sistemática pode ser considerada, mas apenas quando a

primeira unidade amostral seleccionada não é escolhida aleatoriamente. Contudo em detecção

remota o aspecto atrás referido não se aplica, pois desde que seja aplicada uma amostragem

sistemática em que a primeira unidade amostral seja escolhida aleatoriamente, podemos afirmar que

este tipo de amostragem é aleatória (Stehman, 1992).

A primeira unidade amostral é seleccionada através de um par de números aleatórios, para fixar a

primeira amostra no canto superior esquerdo da área de estudo. Outro par de números aleatórios

determinam as coordenadas horizontais das restantes amostras na primeira coluna e linha da

amostragem. Os intervalos constantes k são iguais aos lados dos quadrados, estabelecendo a

ligação de todas as amostras. Este aspecto facilita as visitas de campo, pois quando a primeira

unidade amostral é escolhida aleatoriamente, as restantes amostras são colocadas a uma distância e

direcção fixas em relação à primeira amostra (Stehman, 1999).

Como a amostragem sistemática distribui mais uniformemente as unidades amostrais pela área de

estudo, Stehman e Czaplewski (1998) afirmam que este método geralmente produz melhores

resultados do que a amostragem aleatória simples. A facilidade de implementação é outra das

vantagens da amostragem sistemática, sendo por isso outra das razões deste método de

amostragem ser amplamente utilizado pela comunidade cientifica (Stehman, 1999). Stehman (1999),

refere ainda que este método permite uma análise simples dos dados e que a pós-estratificação pode

ser combinada com a amostragem sistemática com o objectivo de se obter uma estratégia de

amostragem mais eficiente.

Neste método de amostragem, um maior ou menor valor da variância depende de como o erro está

distribuído espacialmente (Stehman, 1999). Cochran (1977) afirma que se os erros estiverem

localizados em determinadas áreas da população, a amostragem sistemática terá uma menor

variância do que na amostragem aleatória simples, devido à variabilidade na amostragem simples ser

superior, aspecto este que é indesejado. No entanto, se o erro estiver distribuído uniformemente pela

área de estudo, serão obtidos melhores resultados utilizando uma amostragem aleatória estratificada

do que utilizando uma amostragem sistemática (Cochran, 1977), apesar de o cálculo da variância ser

complicado em ambos os métodos de amostragem (Stehman, 1999). A linearidade do erro é assim

um critério importante antes de se optar por uma amostragem sistemática, pois na presença de um

erro distribuído linearmente pela área de estudo, a implementação deste método de amostragem não

é aconselhável, devido aos valores elevados de variância quando comparados com uma amostragem

aleatória simples (Stehman, 1999).


16

Na tentativa de minimizar os efeitos da periodicidade do erro (e.g. topografia de um vale, alinhamento

de campos agrícolas), pode ser aplicado uma variação do método de amostragem sistemática,

denominado de amostragem sistemática desalinhada (Cochran, 1977). Este método pode ser visto

como um compromisso entre a amostragem sistemática e a amostragem aleatória simples, ou seja,

se a linearidade do erro estiver presente, a mostragem sistemática desalinhada é menos susceptível

ao erro (Stehman, 1999). No entanto Stehman (1992), refere que a amostragem sistemática

desalinhada diminui a vantagem da amostragem sistemática quando o intervalo das amostras e a

distribuição espacial do erro favorece a amostragem sistemática sobre a amostragem aleatória

simples.

Devido à não existência de um estimador da variância não enviesado para a amostragem sistemática,

Cochran (1977) afirma que devem ser utilizados os estimadores da amostragem aleatória simples e

realizar uma aproximação aos estimadores da amostragem sistemática. A amostragem sistemática é

assim uma opção viável se a aproximação do cálculo da variância for aceitável, porque obter uma

variância reduzida através de um protocolo de amostragem simples é geralmente mais importante do

que uma estimação da variância enviesada (Stehman, 1999).

2.2.3.3 Amostragem aleatória estratificada

A amostragem aleatória estratificada é muito semelhante à amostragem aleatória simples. A

diferença em relação à primeira deve-se ao facto de ser utilizado um conhecimento prévio para dividir

a área de estudo em estratos em que posteriormente cada um destes estratos é amostrado (Figura 6)

(Congalton e Green, 1999).

Figura 6. Amostragem estratificada.

Na avaliação da exactidão temática de cartografias de ocupação do solo, cada estrato representa

uma classe de ocupação do solo. Segundo Stehman (1999), a amostragem estratificada pode ser

utilizada para assegurar que o tamanho da amostra em cada estrato é adequado para satisfazer os


17

requisitos de precisão e avaliação de cada classe de ocupação do solo. Esta característica deste tipo

de amostragem é a sua maior vantagem, pois cada classe por mais pequena que seja é sempre

amostrada (Congalton e Green, 1999).

Em comparação com a amostragem aleatória simples, Cochran (1977) afirma que a amostragem

aleatória estratificada apresenta uma diminuição do desvio padrão se as proporções forem bastante

diferentes entre estratos. No entanto, se os estratos forem diferentes regiões geográficas, a exactidão

nas diversas regiões deverá diferir consideravelmente para a amostragem estratificada (Stehman,

1999). De facto, o mesmo autor refere que a necessidade de satisfazer vários objectivos através de

uma multiestratificação é uma tarefa difícil, devido à criação de muitos estratos. Se forem

consideradas muitas regiões como também muitos estratos, este aspecto pode ser problemático no

caso de não existir muita informação de referência disponível. Apesar dos aspectos atrás

mencionados, a utilização de uma amostragem estratificada por regiões geográficas não se traduz

num grande ganho de precisão quando comparada com a amostragem aleatória simples (Cochran,

1977). A estratificação geográfica, pode também ser utilizada para se obter uma amostragem mais

bem distribuída espacialmente. Stehman (1999) refere que as vantagens desta abordagem são

semelhantes às da amostragem sistemática alinhada e amostragem sistemática desalinhada. No

entanto a amostragem estratificada é menos susceptível a perdas de precisão devido à periodicidade

da amostragem sistemática, o que resulta numa diminuição da variância (Stehman, 1999).

Este método de amostragem apresenta alguns inconvenientes. Stehman e Czaplewski (1998),

referem que a amostragem estratificada apenas possibilita a avaliação do mapa que deu origem aos

estratos, como também implica que o mapa em que se pretenda implementar este método de

amostragem esteja disponível à priori. Segundo Stehman e Czaplewski (1998), uma amostragem

estratificada, com uma localização óptima ou igual de todas as unidades amostrais por estrato,

geralmente leva à inclusão de diferentes probabilidades nas unidades de amostragem nos diferentes

estratos (e.g. polígonos maiores têm maior probabilidade de serem amostrados do que polígonos

mais pequenos, tendo por isso também mais probabilidade de serem incluídos na amostra). O

mesmo autor refere ainda que a diferente probabilidade de determinados estratos serem amostrados

pode não ser um problema, desde que essas probabilidades sejam conhecidas e tidas em conta nas

fórmulas de cálculo dos estimadores estatísticos. No entanto, Stehman (1999) refere que as fórmulas

dos estimadores são mais complexas para a amostragem estratificada do que para a amostragem

aleatória simples ou para a amostragem sistemática, o que dificulta a inclusão das probabilidades no

cálculo dos estimadores estatísticos.

2.2.3.4 Amostragem por conglomerados

A amostragem por conglomerados também tem sido frequentemente utilizada na avaliação da

exactidão temática de cartografias de ocupação do solo, nomeadamente por permitir uma rápida


18

recolha de informação em muitas unidades amostrais (Congalton e Green, 1999). Segundo Sarndal et

al. (1992), na amostragem por conglomerados a população é agrupada em sub-populações (Figura

7). A amostragem por conglomerados agrupa unidades amostrais em conjuntos, denominados por

conglomerados (Caetano et al., 2006). Segundo Mata et al. (2004), esta técnica de amostragem é

utilizada quando a informação sobre todas as unidades do universo não está disponível.

Figura 7. Amostragem por conglomerados.

Os conglomerados são denominados por unidades primárias de amostragem (UPA), e as unidades

estatísticas ou de amostragem que os constituem são as unidades secundárias de amostragem

(USA) (Mata et al., 2006).

Segundo Caetano et al. (2006), na amostragem por conglomerados, um conglomerado é

seleccionado aleatoriamente e todos os elementos secundários são examinados. Alternativamente,

as USA podem ser também seleccionadas aleatoriamente. Estes métodos de amostragem são

designados respectivamente, por amostragem de conglomerados numa fase e amostragem por

conglomerados em duas fases (Caetano et al., 2006). Ambos os métodos de amostragem por

conglomerados têm sido implementados na avaliação da exactidão de cartografias de ocupação do

solo (Strahler et al., 2006).

Neste método de amostragem a UPA utilizada, é muitas vezes a área definida pelo limite de uma

imagem aérea, tendo como objectivo a redução de custos inerentes às deslocações (Stehman, 2001),

ou também poderão ser utilizados blocos de 3x3 ou 5x5 pixels (Stehman, 1999).

De facto, segundo Strahler et al. (2006), a utilização de uma amostragem por conglomerados deve-se

ao seu menor custo quando comparada com outros métodos de amostragem utilizados na avaliação

da exactidão temática de cartografias de ocupação do solo. Agrupar os pixels de referência reduz o

custo de aquisição dos dados de referência, o tempo de viagem no caso de serem necessárias visitas


19

de campo, ou então redução na quantidade e processamento de imagens aéreas, imagens de satélite

de grande resolução ou videografia utilizada no protocolo de amostragem (Strahler et al., 2006). É

menos dispendioso amostrar todos os nove pixels definidos como uma UPA, i.e. um conglomerado de

3x3 pixels, do que amostrar nove pixels distribuídos aleatoriamente pela área de estudo (Stehman e

Czaplewski, 1998). A proximidade espacial das USA amostradas em cada uma das UPA, permite um

maior número de unidades amostrais por um custo mais reduzido, quando comparado com a

amostragem aleatória simples ou a amostragem sistemática (Stehman, 1999).

Este método de amostragem também possui algumas desvantagens. Apesar da relação custo-

benefício na amostragem por conglomerados ser a sua principal vantagem, este aspecto implica uma

diminuição da consistência estatística, devido à correlação espacial do erro existente entre as

amostras contidas na UPA, provocando um aumento do valor da variância da estimativa do erro

(Cochran, 1977), como também um aumento da complexidade da fórmula do desvio-padrão

(Stehman e Czaplewski,1998). No entanto, Stehman (1999) refere que através do uso de uma

amostragem por conglomerados em duas fases existe um compromisso entre a forte relação espacial

das USA na amostragem por conglomerados de uma fase e a fraca relação espacial da amostragem

aleatória simples e a amostragem sistemática. Apesar deste aspecto favorável também é necessário

ter em conta que a aplicação de uma amostragem por conglomerados de duas fases implica

necessariamente um aumento do número de UPA e consequentemente um maior número de

unidades amostrais, o que provoca um aumento do custo da amostragem (Stehman, 1999). Outro

aspecto negativo da aplicação do método de amostragem por conglomerados em duas fases é de

que as fórmulas do cálculo da variância são mais complexas, como também menos familiares para os

utilizadores, quando comparadas com métodos de amostragem mais simples (Stehman, 1999).

De seguida apresenta-se um quadro resumo dos principais métodos de amostragem utilizados na

avaliação da exactidão de cartografias de ocupação do solo.


20

Tabela 2. Características dos métodos de amostragem mais utilizados na avaliação da exactidão temática de cartografias de ocupação do solo (Fonte: Stehman, 1999).

Método Simplicidade analitica Variância Cálculo da

variância Distribuição

espacial Controlo espacial

Aleatória simples Elevada Elevada, a não ser quando combinada com métodos

de cálculo mais complexos Simples Pobre Nenhum

Sistemática Elevadaa Reduzida, a não ser quando utilizada com

periodicidade

Simples, mas enviesada Muito boa Nenhum

Aleatória estratificada

Por ocupação de solo Moderadab

Reduzida para cada estrato, moderada a elevada no global

Moderado Pobrec Nenhum

Pela geografia Moderadab Moderada Moderado Muito boa Reduzidod

Conglomerados

Uma fase Elevada Elevada, a não ser que a correlação espacial seja

reduzida Difícil Pobre a

moderadae Moderado

Duas fases Elevadaf Moderada, mesmo com uma correlação espacial

reduzida Difícil Moderada a

boag Muito elevado

Legenda: a Amostragem sistemática de polígonos resultante da inclusão de diferentes probabilidades e de uma análise mais complexa. b Elevada simplicidade se uma localização proporcional fôr utilizada. c Boa se as classes de ocupação de solo estiverem fortemente relacionadas com as regiões geográficas. d Elevada se uma localização desalinhada fôr utilizada e o esforço da amostragem fôr dirigido para apenas alguns estratos. e Pobre se as UPA forem seleccionadas através de uma amostragem aleatória simples, moderada se as UPA forem

seleccionadas através de uma amostragem sistemática ou através de uma estratificação geográfica. f Difícil se na segunda fase as probabilidades não forem iguais g Moderada se as UPA forem seleccionadas através de uma amostragem aleatória simples, boa se as UPA forem

seleccionadas através de uma amostragem sistemática ou através de uma estratificação geográfica.

2.2.4 Dimensão da amostra

Para que a avaliação da exactidão temática de cartografias de ocupação do solo seja

estatisticamente válida é necessária a recolha de um número adequado de unidades amostrais para

cada classe de ocupação do solo (Congalton e Green, 1999). Segundo Dicks e Lo (1990) quanto

maior fôr a dimensão da amostra, maior será a confiança na exactidão estimada através dessa

amostra. No entanto, é necessário encontrar um compromisso entre o número de unidades amostrais

necessárias e o custo da obtenção da informação de referência para essas mesmas unidades.

Cochran (1977), refere que uma amostra muito grande implica um desperdício de recursos e que uma

amostragem muito pequena diminui a utilidade dos resultados. É assim necessário encontrar uma

relação custo benefício para determinar a dimensão da amostra. Segundo Dicks e Lo (1990), antes

de ser escolhida a dimensão da amostra, deve-se ter em conta qual o nível de exactidão global e o

nível de exactidão por classe de ocupação do solo que se pretende atingir.

Segundo Congalton e Green (1999), os investigadores têm utilizado para a determinação da

dimensão da amostra, uma equação baseada na distribuição binomial ou na distribuição binomial


21

aproximada à distribuição normal. Os mesmos autores afirmam também que a escolha da dimensão

da amostra, baseada nas distribuições acima referidas, devem estar dependentes de dois aspectos:

i) o nível aceitável de exactidão;

ii) o nível de confiança da estimativa.

Levando em linha de conta os aspectos acima referidos, a dimensão da amostra deve depender do

risco aceitável que o produtor está disposto a correr. O risco do produtor para a avaliação da

exactidão temática tem sido balizado para valores de 90%, 95% e 99% (Aronoff, 1985).

Congalton e Green (1999), referem que o número mínimo de unidades amostrais que se devem

recolher, tendo em conta as condicionantes práticas, é de 50 unidades amostrais para cada categoria

de ocupação do solo. No entanto, se a nomenclatura de ocupação do solo utilizada contemplar mais

de 12 classes de ocupação do solo, o número mínimo de unidades amostrais recolhidas deve ser

aumentado para 75 a 100 (Congalton e Green ,1999). Stehman (2001), refere também que para a

avaliação da exactidão temática de cartografias de ocupação do solo, uma amostra com 100

unidades amostrais por classe assegura que a exactidão possa ser estimada com um desvio padrão

não superior a 0,05. Apesar deste aspecto, este valor mínimo de unidades amostrais por classe de

ocupação do solo pode variar consoante a importância da avaliação de determinadas classes de

ocupação do solo. Pode ser mais útil aumentar o número de unidades amostrais relativas a uma

classe de ocupação do solo e diminuir o número de unidades amostrais relativas a uma classe de

ocupação do solo menos importante (Congalton e Green, 1999; Stehman, 2001).

2.2.5 Técnicas de análise da exactidão temática de cartografias de ocupação do solo

2.2.5.1 Matriz de confusão

O principal objectivo da avaliação da exactidão temática de cartografias de ocupação do solo é

estimar a proporção da área correctamente classificada para cada classe de ocupação do solo, como

também o intervalo de confiança dos índices de exactidão para cada uma dessas classes (Carrão,

2006). Story e Congalton (1986), referem que o modo mais utilizado para o cálculo da exactidão de

cartografias produzidas a partir de imagens de satélite é através da comparação das áreas de um

mapa com uma base de dados de referência. O método mais utilizado para representar esta

comparação é através da elaboração de uma matriz de confusão, em que geralmente os dados de

referência são representados nas colunas e são comparados com os dados do mapa classificado,

representados geralmente nas linhas da matriz. Os valores na diagonal da matriz indicam o acordo

que existe entre ambos os conjuntos de dados, ou seja, entre o mapa classificado e os dados de

referência. A exactidão global da cartografia é então calculada através da divisão do somatório das


22

amostras correctamente classificadas com o número total de amostras (Story e Congalton, 1986). Na

Figura 8, pode ser observado um exemplo da avaliação da exactidão de cartografias de ocupação do

solo, com recurso a uma matriz de confusão.

Figura 8. Avaliação da exactidão temática de uma cartografia de ocupação do solo (Fonte: Congalton e Green, 1999).

Congalton e Green (1999) afirmam que a matriz de confusão (Figura 9) é um método bastante válido

para representar a exactidão dos mapas, pois a exactidão de cada classe de ocupação do solo é

exibida individualmente. O método mais aceite para avaliar a exactidão de cada classe de ocupação

do solo é através da divisão do número de unidades amostrais correctamente classificadas nessa

classe, pelo número total de amostras dessa mesma classe identificadas no mapa (Story e

Congalton, 1986). Contudo, o mesmo autor refere um método alternativo, no qual se divide o número

de unidades amostrais correctamente classificadas, pelo número total de unidades amostrais na

realidade. Neste contexto é então necessário compreender ambos estes métodos, pois podem

resultar em avaliações da exactidão muito diferentes.

Segundo Story e Congalton (1986), no método de cálculo tradicionalmente utilizado na avaliação da

exactidão, o número de unidades amostrais correctamente classificadas (nkk) é dividido pelo número

total das unidades amostrais de referência (total da coluna), ou seja, por n+k. Essa percentagem,

representa a probabilidade das unidades amostrais de referência serem bem classificadas, ou seja,

estão a ser medidos os erros de omissão. Os erros de omissão acontecem quando é excluída uma


23

área no mapa pertencente a uma classe de ocupação do solo (Congalton e Green, 1999). Este valor

de exactidão é denominado de exactidão do produtor e indica ao produtor da cartografia como pode

estar correctamente classificada uma área especifica do terreno.

Por outro lado quando o número total de unidades amostrais correctamente classificadas (nkk) de uma

determinada classe de ocupação do solo é dividida pelo número total de unidades amostrais

classificadas no mapa dessa mesma classe de ocupação do solo (nk+), o resultado obtido indica a

probabilidade de uma unidade amostral classificada no mapa representar essa mesma classe na

realidade. Neste caso estão a ser medidos erros de comissão. Os erros de comissão podem ser

definidos como a inclusão de uma área no mapa, numa classe de ocupação do solo na qual essa

área não poderia ter sido incluída (Congalton e Green, 1999). Este valor pode também ser definido

como a exactidão do utilizador, ou seja, indica como o mapa representa a realidade. Um exemplo do

cálculo dos índices anteriormente referidos podem ser observados na Figura 8.

No próximo sub-capítulo, faz-se uma descrição dos índices de exactidão temática, tendo em conta

uma representação matemática da matriz de confusão (Figura 9).

Figura 9. Representação matemática de uma matriz de confusão (Fonte: Congalton e Green, 1999).

2.2.5.2 Índices para estimar a exactidão temática

Neste sub-capítulo irão ser apresentadas algumas técnicas de análise que podem ser realizadas a

partir da matriz de confusão. Estas técnicas demonstram o quão poderosa é a matriz de confusão e

porque deverá ser esta matriz incluída em qualquer processo de avaliação da exactidão de

cartografias (Congalton e Green, 1999). Contudo, Stehman (1997) afirma que nenhum índice de

exactidão é universalmente adequado na avaliação da exactidão temática e que diferentes índices de

exactidão podem levar a conclusões conflituosas, pois esses índices não representam a exactidão da

mesma maneira. Escolher os índices de exactidão apropriados que permitam elucidar os utilizadores

das cartografias se os objectivos exigidos por estes foram atingidos, é um aspecto fundamental no

processo de avaliação da exactidão de cartografias de ocupação do solo. Os índices de exactidão


24

temática mais comuns são o índice de exactidão global, índice de exactidão do produtor e o índice de

exactidão do utilizador.

Índice de exactidão global

Este índice é o mais comum e reflecte a proporção de área correctamente classificada (Stehman,

1997), em que nii representa o número de unidades amostrais correctamente classificadas para cada

classe de ocupação do solo e n a dimensão da amostra.

Equação 1. Índice de exactidão global.

Índice de exactidão do produtor

O índice de exactidão do produtor para uma classe de ocupação do solo j, indicando qual a

probabilidade de uma área classificada como uma classe de ocupação do solo j, nos dados de

referência é classificada como j, no mapa produzido (Stehman, 1997).

Equação 2. Índice de exactidão do produtor.

Índice de exactidão do utilizador

Este índice reflecte a exactidão do utilizador para uma classe de ocupação de solo i, indicando qual a

probabilidade de uma área classificada como i pelo mapa produzido é classificada como i, nos dados

de referência (Stehman, 1997).

Equação 3. Índice de exactidão do utilizador.

A exactidão global, do produtor e do utilizador, podem ser calculadas através dos totais marginais da

matriz de confusão e como tal podem ser estimadas a partir do estimador de Horvitz-Thomson (HT)

(Carrão, 2006).


25

2.2.6 Testes de hipótese

O cálculo da avaliação da exactidão temática, pode ser visto como um teste de hipótese (Aronoff,

1982). O mesmo autor refere que o teste de hipóteses coloca o problema sob a forma de duas

escolhas exclusivas:

i) Hipótese nula (H0): o mapa é menos exacto do que o pretendido;

ii) Hipótese alternativa (H1): a exactidão do mapa é igual ou superior à pretendida.

O objectivo é realizar uma avaliação da verdadeira exactidão do mapa, mais concretamente

estabelecer um valor mínimo de exactidão, com um elevado nível de confiança (e.g. uma exactidão

mínima de 80% com um nível de confiança de 95%, mesmo que a exactidão estimada seja inferior a

80%). O teste de hipótese indica se o mapa está suficientemente exacto ou não, dependendo se

passou ou não no teste. Este teste é baseado na distribuição binomial, onde cada ponto discreto é

avaliado como correcto ou incorrecto. Outro aspecto a salientar é de que se o número de unidades

amostrais fôr superior a 30, realiza-se uma aproximação da distribuição binomial à distribuição

normal, pois esta aproximação permite uma simplificação do cálculo com a obtenção de resultados

bastante precisos.

No resultado deste teste, podem ser obtidos dois tipos de decisões: correctas e incorrectas (Aronoff,

1982). Os dois tipos de decisões correctas são:

i) aceitar um mapa com uma exactidão suficiente;

ii) rejeitar um mapa

Os dois tipos de decisões incorrectas são:

i) aceitar um mapa, denominado de risco do utilizador;

ii) rejeitar um mapa com a exactidão suficiente, denominado de risco do produtor.

Os termos risco do produtor e risco do utilizador, são dois termos estatísticos derivados de um ramo

da estatística denominado de aceitação da amostragem. Estes termos são amplamente utilizados na

indústria produtiva, nomeadamente no controlo de qualidade.

2.3 Avaliação da incerteza em cartografias de ocupação do solo

A incerteza e o erro são dois aspectos indissociáveis dos dados espaciais (Liu et al., 2004).

Tradicionalmente, o erro é visto como sendo “mau” (Burroughs e McDonnell, 1998). Contudo, os

mesmos autores afirmam também que esta é uma ideia errada, na medida em que a análise da


26

incerteza e do erro permite o conhecimento da sua origem, podendo assim estudar-se a

implementação de metodologias para a gestão destes dois aspectos nas bases de dados espaciais.

Lunetta et al. (1991), afirmam que a integração de dados obtidos através de detecção remota num

SIG para produção de cartografia, incluem os seguintes procedimentos: aquisição dos dados,

processamento dos dados, análise dos dados, conversão dos dados, avaliação do erro e a

representação do produto final. Assim sendo, o erro pode ser transferido de procedimento em

procedimento, com o desconhecimento do analista, até que o erro se manifesta no produto final

(Lunetta et al.,1991). Na Figura 10, podemos observar as fontes de erro e a sua acumulação ao longo

do processo de produção de cartografia, com base em dados de detecção remota.

Figura 10. Acumulação do erro em dados de detecção remota ao longo do processo de produção de cartografia (Fonte: Lunetta et al., 1991).

Os erros nos dados espaciais, podem ter várias origens, como também podem surgir em qualquer

altura do processo de avaliação da exactidão de cartografias. Mais concretamente, na fase de análise

podem ocorrer erros de percepção (e.g. erros na foto-interpretação), erros de localização (e.g.

diferença na localização de um pixel numa imagem, e a respectiva amostra de referência); erros na

escolha da projecção geométrica e do esferóide da cartografia; erros derivados da inclusão de

enviesamento no processo de aquisição dos dados (e.g. a não utilização das técnicas de amostragem

mais adequadas, devido a uma restrição do custo relativo ao processo de avaliação da exactidão);

erros derivados do tratamento de fenómenos como contínuos, quando são dados discretos (e.g.

tamanho da amostra e distribuição espacial da amostra); utilização de métodos matemáticos que

podem envolver erros no cálculo da avaliação (Burroughs e McDonnell, 1998).


27

No geral, a avaliação do erro em projectos de detecção remota é apenas efectuada na fase de

análise dos dados e contempla apenas uma análise do erro relacionado com as classes temáticas e

com a georreferenciação dos mapas finais (Lunetta et al.,1991). Na Figura 11, pode ser observada

uma das abordagens comuns utilizadas para a avaliação do erro.

Figura 11. Análise do erro (Adaptado de Lunetta et al., 1991).

Segundo Lunetta et al. (1991), a exactidão relativa à localização refere-se à qualidade com que os

algoritmos de georreferenciação colocam correctamente os pixels das imagens numa determinada

projecção. Por outro lado, a avaliação da exactidão temática é muitas vezes efectuada como sendo

um processo paralelo aos projectos, em vez de ser parte integrante destes. Muitos estudos reportam

apenas um índice para expressar a exactidão da classificação da cartografia, enquanto que a

exactidão relativa à localização é omitida. Assim sendo, é apenas quantificado o erro relativo a cada

classe de ocupação de solo, não se tendo em conta os erros relativos à localização (Lunetta et al.,

1991).

Em relação à amostra e como foi referido no capítulo anterior, a escolha da dimensão da amostra e

do método de amostragem, são dois aspectos fundamentais na avaliação da exactidão de

cartografias temáticas. A implementação de um protocolo de amostragem sem o devido cuidado e

sem o conhecimento devido das suas limitações e qualidades, pode originar uma sob ou sobre

estimação dos índices de exactidão e consequentemente fornecer informações erradas sobre a

verdadeira qualidade dos mapas (Lunetta et al., 1991).

A correlação espacial é também um aspecto fundamental no maior ou menor erro associado à

avaliação da exactidão temática. Segundo Lunetta et al. (1991), esta condição é importante, pois

Localização

Verificação Esquema de amostragem Dimensão da amostragem

Classes temáticas

RMSE ou medidas de exactidão

Matriz de erro

Estatística discreta multivariada

Reporte


28

permite verificar se um erro numa determinada localização afecta negativa ou positivamente os erros

nas localizações envolventes.

Em detecção remota, a exactidão da localização pode ser reportada como o erro médio quadrático

(RMSE), que é derivado de algoritmos de georreferenciação. Este índice reflecte a proporção ou o

número de pixels nos quais os pontos de controlo da imagem diferem dos pontos de referência do

mapa. No entanto, o RMSE não reflecte a exactidão da localização de todos os pixels da imagem,

mas apenas a exactidão dos pontos de controlo do mapa. O método mais eficaz para determinar a

exactidão relativa à localização, é através da utilização de GPS. Contudo este método geralmente

envolve um elevado custo para a sua implementação (Lunetta et al., 1991).

Em termos gerais, a “incerteza” significa a falta de certeza ou de conhecimento definitivo de um

resultado. O termo “incerteza” refere-se às diferenças entre a informação proveniente de uma base

de dados e a informação correspondente que está disponível para um utilizador que esteja apto para

observar e medir a realidade directamente. A “incerteza” inclui os erros inerentes ao processo da

elaboração de bases de dados, como também a perda de informação que ocorre durante a sua

generalização (e.g. um mapa pode mostrar uma área como sendo uma classe de ocupação do solo

uniforme, mas apesar disso essa área não é realmente uniforme) (Hunter et al., 1995). Segundo

Heuvelink (1993) in Wel (2000), a incerteza pode ser considerada como a falta de confiança sobre o

“verdadeiro valor” de uma característica particular dos dados.

No capítulo anterior foi referido que a elaboração de matrizes de confusão, para a avaliação da

exactidão de cartografias de ocupação do solo, tem como objectivo a determinação do erro inerente à

cartografia produzida. Por outras palavras, a elaboração de matrizes de confusão permite verificar as

diferenças entre a classificação de uma base de dados de referência e a classificação de um mapa

produzido automaticamente, ou seja, o erro do mapa. No entanto Congalton e Green (1993) afirmam

que nem todas estas diferenças se devem a erros de classificação ou de delimitação. Os mesmos

autores referem vários factores que podem originar confusão entre as bases de dados de referência e

os mapas produzidos:

i) Diferenças de registo entre os dados de referência e a classificação do mapa produzido;

ii) Erros de digitalização na delimitação das amostras de referência;

iii) Erros de entrada de dados na elaboração de bases de dados de referência;

iv) Erros na interpretação e digitalização dos dados de referência;

v) Alterações na ocupação do solo entre a data de produção do mapa e a data de produção

da base de dados de referência, ou seja, o erro temporal (e.g. alterações devido a

incêndios ou desenvolvimento urbano);

vi) Variações na classificação e delimitação dos dados de referência, devido à inconsistência

na interpretação de áreas heterogéneas;

vii) Erros na classificação do mapa;


29

viii) Erros na delimitação das classes de ocupação do solo no mapa.

Segundo Goodchild et al. (1993), existem três formas de abordar a incerteza em bases de dados

espaciais:

i) ocultar qualquer tipo de referência à incerteza;

ii) inclusão de um índice(s) ou descritor(es) que quantifique a incerteza e seja

disponibilizado aos utilizadores das bases de dados;

iii) produzir amostras dos vários mapas produzidos e mostrar uma escala de incerteza para

os vários mapas.

A primeira opção aborda o problema ignorando-o e é sem dúvida a solução mais fácil de

implementar. No entanto, esta abordagem pode pôr em risco a decisão dos intervenientes nos

processos de tomada de decisão, pois estes têm que decidir baseados na informação disponibilizada.

A segunda opção, aborda o problema, incluindo o uso de descritores da “incerteza”, tais como bandas

épsilon, matrizes de confusão, diagramas de confiança ou o erro médio quadrático. De facto estes

descritores servem como um aviso para os utilizadores acerca da incerteza das bases de dados

espaciais. No entanto, estes descritores são de pouca utilidade para o utilizador, na medida em que

não conseguem mostrar a variação espacial da “incerteza” no produto final. Na terceira e última

opção, diferentes versões do mesmo mapa com a inclusão da “incerteza” podem ser apresentadas

aos utilizadores. Esta opção permite comunicar a incerteza e “educar” o utilizador acerca da

importância deste assunto. Apresentando o nível de incerteza a que o produto disponibilizado ao

utilizador está sujeito, permite que os agentes envolvidos no processo de tomada de decisão o façam

de forma mais consciente.

De seguida apresentam-se alguns métodos para lidar com a incerteza em bases de dados de

referência.

2.4 Incerteza na avaliação da exactidão temática de cartografias de ocupação do solo

2.4.1 Atribuição de dois códigos nas amostras de bases de dados de referência

Durante a elaboração de bases de dados de referência, os técnicos têm que decidir qual a classe de

ocupação do solo a que pertence uma determinada área, seja em visitas de campo ou através de foto

interpretação. No entanto, a decisão que o técnico tem que tomar nem sempre é fácil, como também

nem sempre traduz a verdadeira classe de ocupação do solo da área analisada. De facto, as

cartografias obtidas a partir de dados de detecção remota, têm frequentemente mais informação do


30

que a classe de ocupação do solo atribuída a uma determinada área (Woodcock et al., 1996). A

dificuldade dos técnicos em atribuir uma determinada classe de ocupação do solo a uma determinada

área deve-se a diversos factores: áreas em que existe mais do que uma classe de ocupação do solo

(fragmentação da paisagem), a existência de sub-coberto, mistura espectral. Woodcock et al. (1996),

sugerem que uma das formas de ultrapassar este problema é a atribuição de classificações

secundárias, ou seja atribuir rótulos secundários às áreas em causa. O mesmo autor refere que a

primeira classificação atribuída a uma área é uma agregação que suaviza o erro que ocorre ao nível

do pixel. A atribuição de uma classificação secundária, permite também uma agregação, mas agora

ao nível do pixel. Logicamente, as classificações secundárias serão no geral menos exactas do que

as primárias.

Para a atribuição de uma classificação secundária é necessária a elaboração de uma escala

linguística que reflicta a adequabilidade dessa classificação à área em causa. Esta escala é utilizada

para verificar qual a classificação mais adequada em cada área, e assim poder-se inferir sobre a

classificação mais correcta, ou seja, a classificação primária ou a secundária. Woodcock et al. (1996)

desenvolveram uma escala linguística, tendo como objectivo a avaliação das classificações atribuídas

pelos técnicos em cada uma das áreas interpretadas no campo.

2.4.2 Teoria fuzzy

Tradicionalmente, a utilização de classes de ocupação do solo discretas em mapas temáticos tem

seguido uma abordagem clássica, na qual se assume que a localização de cada área na paisagem

pertence apenas a uma determinada classe de ocupação do solo no mapa elaborado. Assume-se

que as categorias dos mapas são exclusivas e exaustivas (Woodcock e Gopal, 2000). Este tipo de

classificação é denominado de classificação rígida e permite apenas a utilização de funções binárias

na atribuição de uma determinada classe de ocupação do solo a uma determinada área, seguindo

uma lógica booleana (Burroughs e McDonnell, 1998). Utilizando esta abordagem na avaliação da

exactidão de cartografias de ocupação do solo, Woodcock e Gopal (2000) afirmam que se cada

localização no mapa faz parte de uma determinada classe, então todas as outras classes são

consideradas igualmente e completamente erradas nessa mesma localização.

Contudo, esta abordagem nem sempre é a mais apropriada, pois a variação encontrada na paisagem

tem que ser dividida num número finito de classes. De um modo geral, as classes são facilmente

distinguíveis no seu estado puro e vão-se tornando cada vez menos separáveis perto das linhas

divisórias entre classes (Gopal e Woodcock, 1994). Os mesmos autores referem algumas limitações

da classificação rígida na avaliação da exactidão de cartografias de ocupação do solo:

i) É assumido que a cada área no mapa apenas pode ser atribuída uma e só uma classe

com toda a certeza. Em visitas de campo ou através de foto-interpretação, para a


31

elaboração de uma base de dados de referência, o técnico tem que resolver esta

questão, escolhendo uma classe para cada localização no campo;

ii) A amplitude dos erros está limitada pelo registo do padrão da não concordância entre as

categorias do mapa e as categorias da base de dados de referência. Os dados acerca da

magnitude ou gravidade da não concordância entre o mapa e a referência, não podem

ser utilizados;

iii) O utilizador necessita que lhe seja fornecida informação mais completa e interpretável

sobre o mapa que está a utilizar (Aronoff, 1982). Informação mais detalhada dos erros irá

ajudar os utilizadores a verificarem se os mapas poderão ser utilizados para satisfazerem

as suas necessidades.

A abordagem fuzzy, introduzida por Zadeh em 1965, teve como intuito, caracterizar a capacidade do

cérebro humano em lidar com relações vagas. O conceito chave por trás desta abordagem é o facto

da pertença de uma área na realidade a uma determinada classe ser uma questão de gradiente. O

aspecto atrás referido é uma das principais diferenças entre a abordagem clássica e a abordagem

fuzzy. A teoria fuzzy permite estabelecer gradientes de pertença a uma determinada classe,

providenciando assim uma maior flexibilidade do que a teoria clássica na avaliação da exactidão

temática de cartografias de ocupação do solo (Woodcock e Gopal, 2000).

Contudo, a implementação da teoria fuzzy, não é uma tarefa fácil devido à dificuldade em estabelecer

regras para a sua aplicação (Congalton e Green, 1999). Aquando da interpretação de uma imagem,

os especialistas exprimem a sua avaliação utilizando uma linguagem qualitativa. A abordagem fuzzy

pode assim ser utilizada para transformar essas regras qualitativas numa linguagem matemática, ou

seja, quantitativa (Gopal e Woodcock, 1994). Esta característica fornece assim um método

consistente para medir e modelar valores qualitativos que são posteriormente úteis nos processos de

tomada de decisão (Hadipriono et al., 1991). Robinson (1988), afirmou que a teoria fuzzy pode ser

aplicada em aplicações SIG e que pode ser utilizada para representar e manipular a incerteza.

2.4.3 Escala linguística

A observação avaliação da exactidão de cartografias temáticas por parte de peritos, é muitas vezes

baseada na utilização de uma escala linguística, a qual tem um carácter qualitativo. Mais

concretamente, são estes termos linguísticos que são geralmente utilizados para avaliar a

compatibilidade da classificação obtida nos mapas e as amostras de referência sujeitas a visitas de

campo (Gopal e Woodcock, 1994). Os mesmos autores referem que os especialistas estão aptos,

tanto para distinguir o que está “absolutamente correcto” e o “absolutamente errado”, como também

os valores intermédios entre este dois extremos. Através dos aspectos atrás mencionados, Gopal e

Woodcock (1994), elaboraram uma escala linguística com cinco classes, com o intuito de descrever a


32

percepção que os especialistas têm da ocupação do solo em cada local onde se realizam visitas de

campo:

1) Classe absolutamente errada: Classe inaceitável. Muito errado.

2) Percebe-se mas errada: Não é uma boa classe. Existe algum factor no local que faz com

que se perceba a classe, mas existe claramente uma melhor classe. Esta classe pode ser um

problema para os utilizadores do mapa. Não está certa.

3) Classe aceitável ou razoável: Pode não ser a melhor classe possível, mas é aceitável; esta

classe não coloca qualquer problema ao utilizador se vier expressa no mapa. Certa.

4) Boa classe: Classe muito certa.

5) Classe absolutamente correcta: Sem dúvida acerca da compatibilidade. Classe perfeita.

Este procedimento é utilizado para obter a escala linguística. O especialista avalia cada classe de

ocupação do solo na visita de campo e atribui o valor linguístico mais adequado para descrever a

correspondência entre a classificação obtida no mapa e a “verdade” do terreno. Outro aspecto

importante, é o facto do especialista não conhecer qual a classificação obtida no mapa, antes e

durante o processo de avaliação das unidades amostrais de referência. Os valores linguísticos, são

posteriormente convertidos em valores de 1 a 5, em vez dos valores entre 0 e 1 tradicionalmente

utilizados na teoria fuzzy, ou seja, a escala de linguagem é discreta e não continua. Este aspecto,

segundo Woodcock e Gopal (2000), é uma das limitações desta abordagem, pois seguindo a teoria

fuzzy, os valores de pertença das classes são geralmente contínuos. Gopal e Woodcock (1994)

referem ainda que a utilização deste método permite ao especialista reconhecer a heterogeneidade

da cobertura do solo e a ambiguidade das classes obtidas no mapa, e utilizá-lo para definir o grau de

compatibilidade do mapa produzido com as unidades amostrais de referência. Assim sendo, o

especialista não está limitado apenas a uma resposta correcta ou errada para cada unidade amostral,

contrariamente aos métodos tradicionais de avaliação da exactidão temática que permitem apenas

duas respostas: a unidade amostral está correcta ou incorrectamente classificada.

2.4.4 Funções fuzzy para avaliação da exactidão temática de cartografias de ocupação do solo

Várias medidas de exactidão temática têm sido desenvolvidas com base em funções fuzzy, com o

intuito de determinar a qualidade de cartografias e das suas respectivas categorias (Zadeh, 1965).

Estas funções fornecem mais informação do que uma tradicional matriz de confusão, podendo

determinar-se várias medidas de exactidão temática, tais como: frequência de concordância e não


33

concordância entre as unidades amostrais de referência e a classificação dos mapas produzidos,

magnitude dos erros, origem dos erros e a natureza dos erros (Gopal e Woodcock, 1994).

Seguidamente apresenta-se uma breve abordagem das funções fuzzy utilizados no trabalho de Gopal

e Woodcock (1994), como também a metodologia utilizada no seu trabalho.

2.4.4.1 Frequência de concordância e não concordância

Nesta fase da avaliação da exactidão temática, pretende-se medir a exactidão da cartografia

produzida em termos da frequência de concordância e não concordância entre a amostra de

referência (M) e a escala linguística (A). Este procedimento divide o problema tradicional “qual a

exactidão do mapa”, em duas questões mais precisas:

i) Com que frequência é a categoria classificada no mapa a melhor escolha para representar a

realidade?

ii) Com que frequência é a categoria classificada no mapa aceitável?

Seja σ uma função booleana na qual se obtém um resultado de 0 ou 1, segundo a pertença da

unidade amostral x à classe C. A avaliação da pertença da unidade amostral x do conjunto S (x ∈ a

S) à classe C do mapa, depende do critério utilizado para definir σ. σ (x, C) = 1 se x pertencer a C, e

σ (x, C) = 0 se x não pertencer a C. Considerando agora duas diferentes definições de σ, em que א

(x) é a classe no mapa. Se σ (x, א (x)) = 1, então podemos dizer que existe compatibilidade entre os

dados do mapa produzido e a avaliação do especialista na unidade amostral x na realidade, se σ (x, א

(x)) = 0, então são incompatíveis.

Para cada classe do mapa C ∈ C , calculam-se duas quantidades:

Cω = |{x ∈ S | א(x) = C e σ (x, C) = 1}|

Cϖ = |{x ∈ S | א(x) = C e σ (x, C) = 0}|

Ou seja, conta-se o número de unidades amostrais x com א(x) = C em termos de concordância ( Cω )

e não concordância ( Cϖ ).

A concordância e não concordância pode ser definida através de duas funções:

1) Função MAX

A função MAX pode ser definida como:


34

MAX (x, C) = 1 se o valor da função de pertença x na classe C (μC (x)), é máximo ao longo de todas

as classes do mapa (μC ‘ (x)).

2) Função RIGHT

A função RIGHT é definida tendo como ponto inicial um valor predefinido t, em que t é um valor da

escala linguística ou um valor especifico da função de pertença. Uma amostra x “pertence” a uma

classe C se a sua função de pertença μC (x) ≥ t.

A função RIGHT pode ser definida como:

Normalmente a função MAX é mais conservadora do que a função RIGHT, mas este facto nem

sempre acontece. Este aspecto pode acontecer devido à possibilidade de existirem unidades

amostrais em que não existam classes que coincidam com a função RIGHT, mas mesmo assim,

tenham um valor elevado (Gopal e Woodcock, 1994). O mesmo autor refere ainda que na elaboração

de matrizes de confusão, geralmente são utilizadas as funções RIGHT e MAX. A função MAX é

aplicada quando a matriz de confusão é elaborada a partir de unidades amostrais “cegas” (quando a

classificação do mapa não é utilizada, na fase de avaliação das unidades amostrais). Por outro lado a

função RIGHT é utilizada quando existe o conhecimento da classificação do mapa durante a

avaliação das unidades amostrais. Muitas vezes, o conhecimento da classificação do mapa durante a

sua avaliação não é fornecido numa matriz de confusão. Separando os resultados das funções

RIGHT e MAX, permite que não exista confusão no aspecto anteriormente referido. Os dados das

funções RIGHT e MAX quando obtidos em conjunto, são mais úteis do que quando obtidos em

separado.

2.4.4.2 Magnitude do erro

Como já foi anteriormente referido, uma das vantagens da utilização de funções fuzzy para a

avaliação da exactidão temática é a possibilidade de estes fornecerem informação sobre a magnitude

e a gravidade dos erros. Com o intuito de avaliar a magnitude dos erros, consideremos a função Δ(x)

→ Z. Para uma determinada unidade amostral x, Δ(x) mede a diferença entre o resultado obtido pela

1 se μC (x) ≥ t RIGHT(x, C) = 0 se μC (x) ≤ t

1 se μC (x) ≥ μC ‘ (x) para todos os C’ ∈ C MAX (x, C) = 0 se μC (x) ≤ μC ‘ (x) para todos os C’ ∈ C


35

categoria א(x) em x e o valor mais elevado atribuído a x entre todas as outras categorias de C. A

função acima descrita é denominada de DIFFERENCE e pode ser definida como:

DIFFERENCE (Δ(x)) = μ א(x)(x) – max μC (x)

Utilizando a escala linguística elaborada por Gopal e Woodcock (1994), podemos verificar que esta

varia entre 1 e 5, ou seja a função DIFFERENCE irá estar compreendida entre – 4 e 4 inclusive. No

caso em que a classe atribuída no mapa está perfeitamente correcta (valor = 5) e todas as outras

classes estão completamente erradas (valor = 1), a função DIFFERENCE retribuirá um valor igual a

4. Todas as amostras que são compatíveis, utilizando a função MAX, terão valores da função

DIFFERENCE superiores ou iguais a 0. Por outro lado, as amostras nas quais se obtêm valores

negativos, correspondem a amostras incompatíveis. Uma amostra incompatível com um valor de

DIFFERENCE de –1, corresponde a um caso em que se atribuiu apenas um valor abaixo na unidade

amostral de referência, em relação ao possível valor máximo atribuível a essa mesma unidade

amostral. Logicamente um valor de –4 traduz a maior discrepância possível, sendo por isso um erro

mais grave do que o anterior.

Gopal e Woodcock (1994) salientam o facto de que o uso desta função está dependente da maneira

como os valores são atribuídos. No exemplo apresentado pelos autores, a escala linguística foi

convertida em valores discretos através de uma função linear simples, mas no entanto existem muito

mais possibilidades.

A utilização dos valores obtidos a partir da função DIFFERENCE, em conjunto com as classes do

mapa, podem fornecer índices muito úteis. Gopal e Woodcock (1994) referem que pode ser útil a

atribuição de pesos, para acentuar os efeitos dos valores negativos, com o intuito de produzir um

índice da magnitude do erro para cada classe.

2.4.4.3 Origem do erro

Os erros de classificação em cartografias de ocupação do solo, são muitas vezes derivados da

natureza heterogénea da paisagem. Estes erros podem ser analisados utilizando a função

MEMBERSHIP λ : N → Z, a qual analisa as várias classes de ocupação do solo nas várias unidades

amostrais de referência analisadas pelos especialistas (Gopal e Woodcock,1994).

A função MEMBERSHIP, pode ser definida como:

MEMBERSHIP (λ (x)) = |{C | C ∈ C e μC (x) ≥ t}|

Esta função fornece informação acerca da frequência da pertença das várias classes em cada

unidade amostral de referência. Os vários graus de pertença são representados pela escala


36

linguística utilizada. No exemplo apresentado por Gopal e Woodcock (1994), o valor mínimo do grau

de pertença é 3, aumentando até ao valor máximo (5). Para cada classe C ∈ C e valores

compreendidos no intervalo 1 ≤ i ≤ 4, são calculados o número de amostras nas quais א(x) = C e λ(x)

= i. Uma amostra de referência tem um valor de pertença superior a t, para apenas uma categoria,

enquanto que uma amostra com mais do que uma classe, tem valores de pertença para duas ou mais

classes. O número total de amostras em cada grupo é adicionalmente distinguido entre amostras

compatíveis e incompatíveis, utilizando a função MAX.

A utilização da função MEMBERSHIP, segundo Gopal e Woodcock (1994), tem como objectivo

explorar as possíveis fontes de erro nos mapas. Estas origens podem ser identificadas a partir da

frequência de acordo e desacordo para os diferentes valores da escala de pertença. Esta função

permite também inferir sobre quais as condições ambientais nas quais os erros estão a ser

cometidos. Se existir um elevado número de erros (não concordância) nas amostras em que foi

atribuída apenas uma classe, então o processo de elaboração do mapa está a ter falhas nos locais

sem ambiguidade. Por outro lado, se o número de locais onde não existe concordância estiverem

concentrados em amostras com mais do que uma classe definida, então o esforço de produção do

mapa deve ser concentrado nos locais com mais heterogeneidade e com maior ambiguidade entre as

diferentes classes. Gopal e Woodcock (1994) salientam ainda o facto de que uma elevada frequência

de erro em locais com mais do que uma classe de ocupação do solo, podem servir de indicação para

o utilizador do mapa das características dessa mesma classe. É importante também referir que a

utilização desta função, bem como da teoria fuzzy, não faz sentido nos casos em que as unidades

amostrais apresentam apenas uma classe.

2.4.4.4 Natureza do erro

Gopal e Woodcock (1994), referem que uma importante fonte de informação é a natureza dos erros

das classes e entre que classes existe mais confusão. Esta informação, nos métodos tradicionais de

avaliação da exactidão temática, pode ser observada nos valores da matriz de confusão que estão

fora da diagonal. Estas matrizes também podem ser construídas utilizando as funções CONFUSION

e AMBIGUITY. A função CONFUSION, ζ : N → 2C, identifica as categorias com um índice superior ao

das classes do mapa e pode ser definida como:

CONFUSION (ζ(x)) = { C | C ∈ C e μC (x) > μ א(x)(x)}

Em particular, para uma unidade amostral x, ζ(x) calcula o conjunto de classes, nas quais os valores

de pertença são superiores ao valor atribuído à classe do mapa א(x). Este método é muito

semelhante ao da elaboração de uma matriz de erro, no entanto uma classe pode ter um índice (μC)

superior ao da classe do mapa μ א(x)(x) numa unidade amostral (x). Para cada par de categorias

(ambas diferentes) C, C’ ∈ C, é calculado ζCC ’, ou seja o número de unidades amostrais x em que

.C e μC ’ (x) > μC(x) = (x)א


37

A função AMBIGUITY, η : N → 2C, identifica as classes com o mesmo índice que a classe do mapa e

pode ser definida como:

AMBIGUITY (η (x)) = { C | C ∈ C e μC (x) = μ א(x)(x)}

Para cada par de classes distintas C, C’ ∈ C, é calculada a quantidade ηCC ’, ou seja o número de

amostras x em que ζ(x) = C e μC ’ (x) = μC(x)

A informação obtida nas classes ambíguas ou com uma atribuição de índices iguais, podem ser

particularmente interessantes para os utilizadores de mapas em que a matriz não é simétrica. As

assimetrias indicam quais as classes que incluem frequentemente unidades amostrais com uma

maior ambiguidade em relação à classe a que essas unidades amostrais pertencem (Gopal e

Woodcock, 1994).

A implementação da teoria fuzzy, na avaliação da exactidão temática, fornece mais informação sobre

os erros do que a teoria clássica, nomeadamente em relação à frequência e à natureza desses

mesmos erros. Para além dos aspectos anteriormente referidos, a utilização da teoria fuzzy, permite

também quantificar a magnitude dos erros, como também verificar a ambiguidade e confusão que

existe entre as classes de ocupação do solo (Woodcock e Gopal, 2000). Contudo, ainda persistem

muitas questões por responder no que respeita à utilização da teoria fuzzy na avaliação da exactidão

temática. Uma das áreas que necessita de mais estudos é a utilização dos métodos anteriormente

descritos, na comparação de cartografias. Neste contexto é necessária a elaboração de um índice

estandardizado de exactidão temática, como também a produção de um índice Kappa, de forma a

permitir a harmonização dos resultados de diferentes projectos relacionados com a avaliação da

exactidão temática (Gopal e Woodcock, 1994).

Metodologia

38

3. METODOLOGIA

Neste capítulo faz-se uma descrição dos métodos utilizados para a aplicação da nossa abordagem de

avaliação da exactidão temática de cartografias de ocupação do solo a imagens de satélite de média

resolução espacial. Inicialmente elaborou-se uma base de dados de referência com vários índices,

com o intuito de estes serem utilizados como dados de input para as funções fuzzy. Posteriormente,

para procedemos à classificação automática de imagens MERIS, com o intuito de se produzir um

mapa para aplicarmos a metodologia de valiadação proposta neste trabalho, efectuou-se uma análise

de separabilidade espectral com o objectivo de seleccionar a imagem relativa ao ano de 2005, que

espectralmente garantisse uma melhor discriminação entre as classes de ocupação do solo da

nomenclatura adoptada. Faz-se também uma descrição do método de classificação automática

utilizado para a produção automática da cartografia de ocupação do solo, derivado da imagem

seleccionada. Por fim efectuou-se uma avaliação da exactidão temática do mapa produzido,

utilizando uma abordagem tradicional (matriz de confusão), como também através de funções fuzzy.

3.1 Base de dados de referência

A base de dados de referência consiste numa amostra, na qual se pretende que esta represente a

“realidade”. Esta base de dados irá ser posteriormente utilizada para validação do mapa produzido,

como também para caracterizarmos a paisagem portuguesa, através das classes de ocupação do

solo, índices de certeza e localização, atribuídos em cada unidade amostral.

3.1.1 Nomenclatura utilizada

A base de dados de referência foi elaborada no âmbito do projecto LANDEO (Caracterização da

ocupação do solo para monitorização ambiental multi-escala com utilização de dados multi-sensor de

observação da Terra). O objectivo principal deste projecto é o desenvolvimento de uma metodologia

que possa ser utilizada para a produção regular de cartografias de ocupação do solo, para Portugal

Continental, derivada de dados de detecção remota (Carrão, 2006). No âmbito deste projecto, foi

desenvolvida uma nomenclatura simples, clara, com limites de classes bem definidos, e com a

possibilidade de ser aplicada à produção de cartografias de ocupação do solo a diferentes escalas de

análise. Outro dos objectivos do desenvolvimento desta nomenclatura foi o de esta permitir uma

comparação e harmonização de cartografias produzidas com diferentes nomenclaturas (e.g. IGBP

(International Geosphere-Biosphere Programme), CLC (Corine Land Cover) e GLC (Global Land

Cover)). Esta nomenclatura, quando aplicada com o maior detalhe possível, divide a ocupação do

solo em 33 classes, organizadas em diferentes níveis de detalhe consoante o tipo de ocupação

Metodologia

39

(Araújo e Caetano, 2006). Na Tabela 3 apresentam-se as classes da nomenclatura LANDEO, e as

respectivas percentagens de coberto que caracterizam cada classe de ocupação do solo.

Tabela 3. Nomenclatura de ocupação do solo LANDEO, utilizada na classificação da base de dados de referência.

ID Classe Coberto (%) 11 Áreas artificiais contínuas >80% 12 Áreas artificiais descontínuas 30%<>80% 21 Culturas de sequeiro >80% 22 Culturas de regadio >80% 23 Arrozais >80%

241 Culturas permanentes de folha perene >80% 242 Culturas permanentes de folha caduca >80% 25 Mosaico de áreas agrícolas

311 Floresta de folhosas fechada 40%<>100% 312 Floresta de folhosas aberta 15%<>40% 321 Floresta de resinosas fechada 40%<>100% 322 Floresta de resinosas aberta 15%<>40% 331 Floresta mista fechada 40%<>100% 332 Floresta mista aberta 15%<>40% 34 Vegetação arbustiva 15%<>100% 35 Vegetação herbácea 15%<>100% 36 Vegetação esparsa 4%<>15% 37 Mosaico de áreas com vegetação 38 Áreas ardidas 15%<>100%

41 Mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais

5 Zonas permanentemente alagadas 6 Solo nu <4% 7 Corpos de água

3.1.2 Unidade amostral

A unidade amostral utilizada para a elaboração da base de dados de referência, corresponde a uma

área de 300 por 300m, ou seja, um polígono de forma quadrangular com a mesma dimensão de um

pixel de uma imagem MERIS (Level 2 FR). Com a finalidade de analisar a vizinhança do pixel central

para verificar se existiam problemas relacionados com erros de geo-localização das unidades

amostrais em relação ao mapa, foi também implementado um bloco de 3x3 pixels, exactamente com

a mesma dimensão do pixel central (Figura 12).

Figura 12. Unidade amostral e sua vizinhança.

Para a interpretação da classe de referência em cada unidade amostral, recorreu-se a imagens

aéreas adquiridas durante os anos de 2004, 2005 e 2006 pelo Instituto Geográfico Português (IGP) e

Metodologia

40

a Direcção Geral dos Recursos Florestais (DGRF). Na Tabela 4, apresentam-se as principais

características dessas imagens e no Anexo 3 pode ser observado um exemplo de cada classe de

ocupação do solo, utilizando as imagens mencionadas.

Tabela 4. Principais características das imagens aéreas utilizadas na elaboração da base de dados de referência.

Direitos de propriedade DGRF / IGP Câmara Ultracam da Vexcel

Altura de voo Aproximadamente 5800m Formato das imagens TIFF

Área de cada imagem no terreno 4 x 5 kmResolução espacial 0,5 m

Resolução radiométrica 8 bits por banda Bandas Azul, verde, vermelho e infravermelho próximo

Sistema de referência Datum 73 Hayford Gauss IPCC Datas das imagens aéreas Novembro de 2004; Agosto e Setembro de 2005;

Maio e Junho de 2006

A informação acerca da classificação da ocupação do solo na realidade em cada unidade amostral foi

recolhida por dois foto-intérpretes, que recolheram a informação relativa ao pixel central e aos pixels

vizinhos. Em relação ao pixel central, os foto-intérpretes recolheram a informação relativa às duas

ocupações do solo mais prováveis na localização relativa a cada unidade amostral. Para além desta

informação, indicaram também qual o índice de confiança com que atribuíram a classe de ocupação

do solo mais provável. Em relação aos pixels vizinhos, os foto-intérpretes atribuíram um índice de

localização em relação à ocupação do solo predominante. Foi também indicado por parte do foto-

intérprete se a unidade amostral correspondia a uma classe de mosaico. Na Tabela 5, faz-se uma

descrição dos códigos e índices atribuídos a cada unidade amostral da base de dados de referência.

Tabela 5. Códigos e índices atribuídos a cada unidade amostral da base de dados de referência.

Campos da tabela de atributos Significado Atributos

LABEL 1 Classe de ocupação de solo mais provável Códigos da nomenclatura LANDEO (ID)

LABEL 2 Segunda classe de ocupação de solo mais provável Códigos da nomenclatura LANDEO (ID)

Índice de confiança (ICR)

Índice de certeza com que o foto-intérprete classificou a classe de ocupação de solo mais provável

3: Muita confiança 2: Confiança relativa 1: Pouca confiança

Índice de localização

(LCR) Índice de localização da unidade de amostragem

3: Ocupação de solo heterogénea em torno do pixel central 2: Ocupação de solo homogénea em torno do pixel central 1: No limite entre duas ou mais ocupações de solo

Mosaicos (MOS) Indicação do tipo de mosaico

25: Mosaico de áreas agrícolas 37: Mosaico de vegetação 41: Mosaico de áreas agrícolas/vegetação/áreas artificiais

Metodologia

41

Para além da criação destes campos da tabela de atributos, criámos dois campos novos CMP 1

(Componente 1) e CMP 2 (Componente 2), os quais são semelhantes ao LABEL 1 e LABEL 2, mas

nos quais foram introduzidas as classes de ocupação do solo à excepção das classes de mosaico, ou

seja, foram apenas introduzidas as classes de ocupação do solo principais e secundárias, ignorando

se estávamos perante classes de mosaico ou não.

3.1.3 Dimensão da amostra e protocolo de amostragem

Tal como referido no segundo capítulo, Stehman (2001) estabeleceu um número mínimo de 100

amostras por classe para garantir que a avaliação da exactidão possa ser estimada com um desvio

padrão não superior a 0,05. Tendo em conta este aspecto definiu-se que a dimensão da amostra

seria de 1900 amostras, ou seja, 100 unidades amostrais por cada uma das 19 classes de ocupação

do solo.

Para garantir as 100 unidades amostrais por classe, recorremos a uma amostragem aleatória

estratificada com o intuito de garantir que todas as classes de ocupação do solo teriam a mesma

probabilidade de serem amostradas. Assim, para a concepção e desenho da amostra, foi produzido

um mapa de ocupação do solo derivado de uma imagem MERIS, recorrendo ao algoritmo da Máxima

Verosimilhança. Posteriormente, recorremos à extensão Hawth’s Tools do software ArcGis 9, para

recolher aleatoriamente as 100 unidades amostrais por cada classe de ocupação do solo. A

distribuição das unidades amostrais pelo território de Portugal Continental pode ser observada no

Anexo 4.

3.1.4 Análise estatística da base de dados de referência

Com o objectivo de estudar as relações existentes entre cada classe de ocupação do solo e os

índices de confiança, localização e mosaicos, foram calculadas as frequências relativas de cada

classe e frequências absolutas, para cada um dos parâmetros anteriormente referidos. Com esta

análise, estudamos também a qualidade do sensor MERIS para a caracterização da paisagem

portuguesa, como também analisamos as características do território de Portugal Continental. Esta

análise, também permitiu inferir sobre a análise da exactidão para cada classe de ocupação do solo,

e verificar se de alguma forma os erros do mapa produzido estão relacionados com as proporções

relativas, que cada classe de ocupação do solo possui em relação a cada um dos índices da base de

dados de referência.

Metodologia

42

3.2 Selecção temporal da imagem MERIS para produção do mapa de ocupação do solo para teste da metodologia de validação

Com o objectivo de elaborar uma cartografia de ocupação do solo, para posterior cruzamento com a

base de dados de referência, foi adquirido um conjunto de 12 imagens MERIS (Level 2 FR), cada

uma relativa a cada mês do ano de 2005. A obtenção deste conjunto esteve relacionada com o facto

de se pretender escolher a imagem que na prática permitiria obter uma melhor separação inter-classe

entre as várias classes de ocupação do solo. Para tal, procedeu-se a uma classificação assistida das

12 imagens, das quais foram escolhidas quatro (cada uma correspondente a uma estação do ano)

que resultaram dos melhores resultados. Para decidir qual destas quatro imagens seria a utilizada

para a avaliação da exactidão tradicional e avaliação da qualidade com funções fuzzy do mapa de

ocupação do solo, procedeu-se a uma análise estatística multivariada da separabilidade espectral da

ocupação do solo em cada uma. Esta análise permitiu seleccionar a imagem que permitia uma

melhor separabilidade inter-classes de ocupação do solo e assim apoiar a decisão sobre qual destas

imagens se poderiam obter melhores resultados.

3.2.1 Classificação mensal da ocupação do solo através do algoritmo da Máxima Verosimilhança e avaliação da exactidão mensal dos mapas produzidos

Segundo Caetano (2004), a classificação assistida engloba dois passos: (1) fase de treino, onde se

definem as unidades amostrais de cada classe da nomenclatura que se adoptou, e (2) classificação,

com algoritmos específicos, de todos os pixels da imagem nas classes definidas no primeiro passo.

Na fase de treino, foram recolhidas indutivamente 735 unidades amostrais com dimensão exacta de

um pixel MERIS (300X300 m), recorrendo à interpretação visual das imagens aéreas utilizadas para a

elaboração da base de dados de referência (Tabela 4) e a CLC2000. O número de unidades

amostrais recolhidas para cada classe de ocupação de solo pode ser consultado no Anexo 2. Com o

intuito de diminuir os erros, derivados das condições de captura dos números digitais por parte do

sensor em cada pixel das imagens, foram retiradas da fase de treino as unidades amostrais que

coincidissem com pixels das imagens que acusassem qualquer tipo de erro na informação capturada

pelo sensor (e.g. nuvens, efeito glint). Esta informação está contida numa banda das imagens

MERIS, denominada de Quality Flags. Para além deste aspecto, não foram recolhidas amostras de

treino para as classes de corpos de água, zonas permanentemente húmidas e áreas ardidas. Em

relação às áreas ardidas, estas não foram treinadas devido à sua elevada dinâmica durante um ano,

e portanto não podem ser relacionadas com um momento especifico no tempo. Em relação às

classes de corpos de água e de zonas permanentemente alagadas, estas não foram treinadas,

porque são facilmente distinguíveis através da classificação automática de imagens MERIS (Carrão

et al., 2006), não havendo necessidade de estudar a sua separabilidade. As classes de mosaico

Metodologia

43

também não foram treinadas, dado que estas representam uma mistura de classes homogéneas em

várias proporções, logo a técnica de classificação terá que ser diferente.

A classificação automática de cada uma das imagens foi realizada através do algoritmo da Máxima

Verosimilhança.

Para determinar a melhor imagem para cada uma das estações do ano, elaboraram-se 12 matrizes

de confusão, cada uma correspondendo ao cruzamento da classificação de cada uma das imagens,

com as amostras de treino. A elaboração das matrizes permitiu o cálculo da exactidão global para

cada uma das 12 imagens. Pudemos assim escolher a imagem com uma exactidão global mais

elevada para cada estação do ano.

3.2.2 Análise exploratória da separabilidade espectral das classes de ocupação do solo em cada estação do ano

Para analisar qual das quatro imagens escolhidas permitiria uma melhor separabilidade entre classes

de ocupação do solo, foram utilizados três métodos estatísticos de análise de dados. Esta análise foi

realizada tendo por base as mesmas unidades amostrais de treino que foram utilizadas para a

classificação mensal. Todos estes cálculos foram efectuados no software MATLAB.

- Análise dos descritores estatísticos (média, 1º e 3º quartil e extremos)

Os descritores estatísticos foram calculados a partir do NDVI (Normalized Difference Vegetation

Index) para cada uma das unidades amostrais de treino, tendo por base a informação da classe de

ocupação do solo para cada uma das amostras. O NDVI é um índice de vegetação, sendo este, o

mais utilizado e divulgado (Caetano, 2004). Segundo Huete (1989) in Caetano (2004), os índices de

vegetação são combinações matemáticas de duas ou mais bandas (geralmente a banda do vermelho

e infra-vermelho) e, de uma forma geral, são concebidos com o objectivo de estimar a abundância de

vegetação em cada pixel. Tendo em conta este índice, elaboramos uma boxplot para cada uma das

classes de ocupação do solo. Com esta análise pretendemos verificar qual a variabilidade intra e

inter-classe de cada uma das classes de ocupação do solo. É de salientar que o NDVI não foi

utilizado para treinar o classificador automático e sendo esta uma análise exploratória, pretendemos

apenas ter uma ideia das classes de ocupação do solo que se podem misturar entre si.

- Análise factorial discriminante das bandas espectrais

Segundo Caetano (2004) a análise de componentes principais (ACP) consiste numa transformação

dos dados originais noutro conjunto menos correlacionado. É a obtenção de um pequeno número de

combinações lineares (componentes principais) de um conjunto de variáveis, que retenham o máximo

Metodologia

44

possível da informação contida nas variáveis iniciais. As componentes são extraídas na ordem da

mais explicativa para a menos explicativa. Teoricamente o número de componentes é sempre igual

ao número de variáveis. No entanto, são poucas as componentes responsáveis pela retenção de

grande parte da informação contida nessas variáveis.

Se os indivíduos de uma amostra na nossa base de dados estiverem organizados em grupos, e.g.

classes de ocupação do solo, as componentes principais a extrair das variáveis iniciais são aquelas

que garantem um maior afastamento dos grupos no espaço dimensional considerado. Estas

componentes principais são calculadas através de uma análise factorial discriminante de Fisher.

Neste estudo realizámos esta análise, a qual permite evidenciar quais as classes de ocupação do

solo que melhor se separam entre si no espaço espectral de 13 dimensões considerado (13

corresponde ao número de bandas de cada imagem). Esta análise tem por base o ratio derivado da

expressão S = σ 2 inter-grupo / σ 2

intra-grupo, em que σ 2 é a variância; quanto maior o valor de S, maior o

afastamento entre as classes. Este ratio, foi representado num gráfico de dispersão para cada uma

das imagens, em que cada um dos eixos corresponde às componentes mais explicativas. É

importante salientar que este estudo é apenas exploratório e que a separação das classes não

depende apenas da informação contida nestas duas componentes, podendo também as restantes

contribuir para uma melhor separabilidade.

- Cálculo da distância entre classes de ocupação do solo

Outra forma de avaliar a separabilidade das classes de ocupação do solo, resultante de uma

classificação automática, é através do cálculo de uma distância estatistica entre classes de ocupação

do solo para cada uma das imagens. Esta distância foi calculada através do método ward, o qual é

baseado na soma de quadrados dentro do grupo, ou no nosso caso entre classes de ocupação do

solo. Este método pode ser definido como a soma dos quadrados das distâncias entre todos os

objectos de um grupo (classes) e o centróide de cada um dos restantes grupos. Esta distância foi

representada num dendrograma que permitiu avaliar a distância entre cada uma das classes de

ocupação do solo.

3.3 Avaliação da exactidão da cartografia de ocupação do solo

Para avaliar a exactidão temática do mapa derivado da imagem MERIS, que foi seleccionada depois

do estudo exploratório, foram utilizadas duas abordagens distintas. Numa primeira, fase avaliamos a

exactidão do mapa produzido com base em matrizes de confusão. Posteriormente, a qualidade do

mapa produzido foi avaliada através de uma metodologia baseada na teoria fuzzy, nomeadamente

utilizando as funções descritas no trabalho de Gopal e Woodcock (1994). Em ambas as abordagens

utilizamos como informação de referência a base de dados, descrita no ponto um do presente

Metodologia

45

capítulo, à qual foram retiradas as unidades amostrais foto-interpretadas como pertencendo às

classes de corpos de água, zonas permanentemente alagadas e áreas ardidas.

3.3.1 Avaliação da exactidão baseada em matrizes de confusão

Para avaliar exactidão do mapa produzido através de métodos tradicionais, considerámos como uma

classificação correcta do mapa produzido, as unidades amostrais nas quais o primeiro código da base

de dados coincidisse com a classificação do mapa.

Para a elaborar as matrizes de confusão, cruzamos as classes de ocupação do solo, relativas ao

mapa produzido por métodos automáticos, com as classes de ocupação do solo atribuídas a cada

unidade amostral da base de dados de referência. Nas linhas da matriz, introduzimos a classificação

do mapa e nas colunas a classificação atribuída às unidades amostrais de referência. Com o intuito

de calcular o índice de exactidão do utilizador, utilizamos a Equação três do Capítulo dois deste

trabalho. Já para o cálculo da exactidão global e da exactidão do produtor para cada classe, foram

utilizadas equações diferentes das referidas no Capítulo dois, por forma a respeitar as estimativas

baseadas na amostragem aleatória estratificada. Assim sendo, utilizámos as equações propostas por

Carrão et al. (2007) (Anexo 5), derivadas do trabalho de Cochran (1977).

Para além da elaboração da matriz de confusão anteriormente referida, calculámos a exactidão global

e a exactidão do utilizador para cada classe de ocupação do solo, relativamente aos índices de

certeza, índices de localização e classes de mosaico. Esta análise teve como objectivo verificar se o

erro poderia estar de alguma forma relacionado com as situações particulares enunciadas

anteriormente.

3.3.2 Avaliação da qualidade da cartografia produzida baseada em funções fuzzy

Para avaliar a qualidade do mapa produzido e das suas classes, baseada em funções fuzzy, tivemos

que adaptar as funções descritas no trabalho de Gopal e Woodcock (1994), para a abordagem

utilizada no presente trabalho. Apresentamos de seguida as expressões utilizadas para o cálculo de

cada uma das funções, nas quais consideramos CLASS como a classificação do mapa produzido.

3.3.2.1 Frequência de concordância e não concordância

Para determinar a frequência de concordância e não concordância calculámos as funções MAX e

RIGHT. A função MAX, representa o número de unidades amostrais bem classificadas, em que

apenas a componente 1 da unidade amostral coincide com a classificação do mapa. A função RIGHT

representa o número de unidades amostrais bem classificadas nas quais a componente 1 ou a

Metodologia

46

componente 2 coincide com a classificação do mapa. Com estas funções pretendemos verificar se

existe uma melhoria na exactidão do mapa quando cruzado com uma ou duas classes de ocupação

de solo de cada unidade amostral da base de dados de referência.

- Função MAX

MAX = SE(CMP1=CLASS);CLASS;FALSO)

- Função RIGHT

RIGHT = SE(OU(CMP1=CLASS;CMP2=CLASS);CLASS;FALSO)

3.3.2.2 Magnitude do erro

Para verificarmos que classes de ocupação do solo possuem erros de classificação mais graves e

que classes de ocupação de solo têm maior confiança na classificação, calculámos a função

DIFFERENCE para cada uma das classes de ocupação do solo. A confiança na classificação

corresponde a unidades amostrais bem classificadas em que o mapa produzido corresponde à

componente 1 da amostra, havendo uma diminuição da confiança na classificação à medida que vai

diminuindo o índice de confiança. A confiança na classificação intermédia corresponde a unidades

amostrais bem classificadas em que o mapa produzido corresponde à componente 2 da unidade

amostral, havendo uma diminuição da confiança na classificação à medida que vai diminuindo o

índice de confiança. Os erros correspondem a unidades amostrais mal classificadas em que o mapa

produzido não corresponde a qualquer uma das componentes da unidade amostral, havendo um

aumento da gravidade do erro à medida que vai aumentando o índice de confiança.

- Função DIFFERENCE

Considerando DIFFERENCE (0), como o nível máximo de confiança na classificação e DIFFERENCE

(-7), o nível de erro mais grave, foi elaborada a seguinte escala de erro, para cada uma das classes

de ocupação do solo:

Confiança na classificação muito elevada:

DIFFERENCE (0) = SE(E(CMP1=CLASS;ICR=3); CLASS; FALSO)

Confiança na classificação elevada:

DIFFERENCE (-1) = SE(E(CMP1=CLASS;ICR=2); CLASS; FALSO)

Confiança na classificação aceitável:


Metodologia

47

Confiança na classificação reduzida:


Confiança na classificação muito reduzida:


Erro aceitável:

DIFFERENCE (-5) = SE(E(CMP1<>CLASS;CMP2<>CLASS;ICR=1); CLASS; FALSO)

Erro grave:


Erro muito grave:



Para determinar se a origem dos erros está ligada ao facto de haverem unidades amostrais

classificadas com duas classes de ocupação do solo, ou seja, se os erros estão ligados à

heterogeneidade da paisagem, calculámos a função MEMBERSHIP. Esta função implica o cálculo da

exactidão das unidades amostrais foto-interpretadas com duas classes de ocupação do solo e com

uma classe de ocupação do solo. Permite verificar que classes de ocupação do solo apresentam

mais erros relacionados com a heterogeneidade da paisagem, ou se por outro lado os erros

acontecem em amostras puras, permitindo verificar se os erros estão ligados com o facto do

classificador automático não conseguir discriminar determinadas classes. Para além dos aspectos

anteriormente referidos, esta função permite verificar que classes possuem uma maior frequência de

surgirem na amostra em conjunto com outra classe de ocupação do solo.

- Função MEMBERSHIP

MEMBERSHIP (uma classe) = SE(E(CMP1=CLASS;ICR=3);CLASS; FALSO)

MEMBERSHIP (duas classes) =

SE(OU(CMP1=CLASS;CMP2=CLASS);CLASS;FALSO);SE(E(ICR<3);CLASS;FALSO)


Para determinarmos a natureza do erro, foram utilizadas as funções CONFUSION e AMBIGUITY. A

função CONFUSION, que corresponde aos elementos fora da diagonal da matriz de confusão, na

Metodologia

48

qual se assinala, para além de um dos códigos em que não há concordância com o mapa, o código

alternativo, ou seja, assinala-se a CMP 1 e a CMP 2 da unidade amostral em que não existe

concordância com o mapa. Pretendemos com esta função verificar quais as classes que mais se

confundem entre si. Em relação à função AMBIGUITY, esta corresponde a unidades amostrais

correctamente classificadas, nas quais atribuímos uma classe de ocupação do solo alternativa. Esta

função corresponde à função RIGHT, mas em vez de ser representada na matriz a classe de

ocupação do solo em concordância com a referência, representa-se a classe de ocupação do solo

alternativa atribuída a essa mesma unidade amostral, mas que foi mal classificada. As amostras em

que a CMP 1 e a CMP 2 são iguais não foram consideradas. Com esta função pretendemos verificar

que classes de ocupação do solo são mais ambíguas, ou seja, apesar de estarem correctamente

classificadas, existe também na “realidade” outra classe de ocupação do solo para a mesma

localização.

- Função CONFUSION

CONFUSION =

SE(OU(CMP1<>CLASS;CMP2<>CLASS);CMP1;FALSO);

SE(OU(CMP1<>CLASS;CMP2<>CLASS);CMP2;FALSO)

- Função AMBIGUITY

AMBIGUITY = SE(E(CMP1=CLASS;ICR<3);CMP2;SE(E(CMP2=CLASS;ICR<3);CMP1))

Na Figura 13, apresentamos um fluxograma com todos as etapas do processo metodológico utilizado

neste trabalho, desde os métodos utilizados para a selecção da imagem de 2005 para produção de

um mapa de ocupação do solo e a posterior avaliação da exactidão temática do mapa de ocupação

do solo produzido.

Metodologia

49

Figura 13. Fluxograma do processo metodológico.

PRIMAVERA

VERÃO

OUTONO

INVERNO

MELHOR MÊS

ANÁLISE EXPLORATÓRIA DA MELHOR IMAGEM PARA CADA

ESTAÇÃO DO ANO

AVALIAÇÃO DA QUALIDADE (Funções fuzzy)

MATRIZ DE CONFUSÃO

MAX

DIFFERENCE

RIGHT

MEMBERSHIP

CONFUSION & AMBIGUITY

MATRIZ DE CONFUSÃO (ICR)

MATRIZ DE CONFUSÃO (LCR)

MATRIZ DE CONFUSÃO (MOS)

INFO

RM

AÇ

ÃO

FINA

L DISPO

NIB

ILIZAD

A A

O U

TILIZAD

OR

Amostras de treino

Imagens aéreas

AGO

JAN

FEV

MAR

MAI

ABR

JUN

JUL

NOV

OUT

SET

DEZ

CLASSIFICAÇÃO MENSAL DA OCUPAÇÃO DO SOLO

BASE DE DADOSLANDEO

ELABORAÇÃO E ANÁLISE ESTATISTICA DA BASE

DE DADOS DE REFERÊNCIA

Caracterização da paisagem

ICR LCR MOS

AVALIAÇÃO DA EXACTIDÃO TRADICIONAL (Matriz de confusão)

Análise de resultados

50

4. ANÁLISE DE RESULTADOS

4.1 Análise estatística da base de dados de referência

A análise estatística da base de dados de referência numa primeira fase serviu para caracterizar a

paisagem portuguesa, relativamente ao ano de 2005. Esta análise foi realizada globalmente, como

também para casos particulares relativos aos índices de confiança, localização e classes de mosaico,

com o intuito de verificarmos que classes de ocupação do solo estão mais relacionadas com os

aspectos referidos anteriormente. Posteriormente ajudou-nos a compreender melhor os erros que

iremos obter no mapa produzido para cada classe de ocupação do solo e verificar se de alguma

forma estes poderão estar associados com as características de cada classe na paisagem

portuguesa.

4.1.1 Análise global das classes de ocupação do solo da base de dados de referência

Após a foto-interpretação das unidades amostrais de referência e da atribuição dos respectivos

índices de confiança e localização para cada unidade, elaborámos várias tabelas com os resultados

obtidos para as 1567 amostras. É de relembrar que o número total de unidades amostrais não é de

1900 mas sim de 1567, devido ao facto de termos retirado as amostras relativas às classes de água

(7), áreas permanentemente alagadas (5) e áreas ardidas (38). Seria de esperar que do processo de

amostragem aleatório estratificado, obtivéssemos um número semelhante de unidades amostrais por

classe. No entanto, isso não aconteceu devido à selecção das unidades amostrais ter sido realizada

com base num mapa que não representa da melhor maneira a realidade.

Analisando a Tabela 6, podemos constatar que a classe de ocupação do solo mais abundante na

“realidade” corresponde à classe de mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais

(41), com uma frequência de 24,8%. Este aspecto revela-nos a verdadeira génese de grande parte do

território português. De facto a estrutura da propriedade em Portugal Continental é em grande parte

baseada no minifúndio, levando a uma elevada diversidade de ocupações de pequena dimensão um

pouco por todo o território nacional. É no entanto também importante relembrar que esta amostragem

foi baseada em unidades amostrais de 300X300 m, o que deixa antever que a resolução do sensor

MERIS, poderá não ser a ideal para a caracterização do território de Portugal Continental,

nomeadamente em zonas com elevada heterogeneidade de ocupações.


51

Tabela 6. Número de observações da cada classe de ocupação do solo e respectiva frequência relativa na base de dados de referência.

Classes ID LABEL 1 LABEL 2 CMP 1 CMP 2 FCMP1 (%) FCMP2 (%) Áreas artificiais

contínuas 11 25 26 29 29 1,6 1,7

Áreas artificiais descontínuas 12 43 40 98 100 2,7 2,6

Culturas de sequeiro 21 113 79 198 183 7,2 5,0 Culturas de regadio 22 38 32 99 71 2,4 2,0

Arrozais 23 29 25 41 25 1,9 1,6 Culturas permanentes

de folha perene 241 20 22 65 79 1,3 1,4

Culturas permanentes de folha caduca 242 15 18 47 45 1,0 1,1

Mosaico de áreas agrícolas 25 76 76 - - 4,9 4,9

Vegetação arbustiva 34 204 208 303 330 13,0 13,3 Vegetação herbácea 35 63 99 96 148 4,0 6,3 Vegetação esparsa 36 31 31 34 37 2,0 2,0

Mosaico de vegetação 37 154 154 - - 9,8 9,8 Floresta de folhosas

fechada 311 83 67 113 82 5,3 4,3

Floresta de folhosas aberta 312 74 78 102 130 4,7 5,0

Floresta de resinosas fechada 321 99 80 149 103 6,3 5,1

Floresta de resinosas aberta 322 27 32 32 39 1,7 2,0

Floresta mista fechada 331 46 49 102 79 2,9 3,1

Floresta mista aberta 332 30 41 46 58 1,9 2,6 Mosaico de áreas agrícolas/áreas de

vegetação /áreas artificiais

41 389 389 - - 24,8 24,8

Solo nu 6 8 21 13 29 0,5 1,3 Total 1567 1567 1567 1567 100 100

A segunda classe mais predominante corresponde à classe de vegetação arbustiva (34), com uma

frequência de 13%. Esta grande representatividade da classe de vegetação arbustiva, deve-se a

vários aspectos. Um dos aspectos a salientar é o facto de as novas plantações terem sido incluídas

na classe de vegetação arbustiva, por ser a que em termos morfológicos se assemelha mais às

novas plantações. Outro dos aspectos que pode explicar o elevado número de observações de

vegetação arbustiva, é o facto de esta ser a comunidade vegetal mais importante e representativa

das geofitocenoses do território de Portugal Continental. O elevado número de unidades amostrais

classificadas como vegetação arbustiva pode estar também relacionada com o facto de a actividade

agrícola estar cada vez mais sujeita ao abandono. Assim sendo, o abandono da agricultura leva ao

reiniciar da sucessão vegetal típica (vegetação herbácea → vegetação arbustiva → floresta), na qual

a vegetação arbustiva representa o estádio intermédio, sendo esta a comunidade que permite um

melhor compromisso entre resiliência/resistência, adaptando-se facilmente a condições ecológicas

mais adversas (e.g. solos degradados, declives acentuados, regeneração após os incêndios). O facto

de Portugal Continental, ter sido violentamente fustigado por incêndios florestais, nomeadamente a

partir do ano de 2003, pode ajudar também a explicar a presença de um elevado número de unidades

amostrais classificadas como vegetação arbustiva, devido a uma regressão na série vegetativa.


52

Tendo em conta os aspectos mencionados, não é de estranhar que a classe de mosaico de

vegetação (37) também possua uma elevada frequência.

A classe de culturas de sequeiro (21), como a classe de vegetação herbácea, estão também muito

representadas na amostra, devido ao facto de esta ser a cultura agrícola que se adequa mais às

características orográficas, climáticas e edafoclimáticas do território nacional.

Também a classe de vegetação herbácea (35) é bastante classificada não como ocupação principal,

mas sim como classe de ocupação alternativa. Este aspecto deve-se à dificuldade em distinguir,

através de imagens aéreas relativas a um único período no tempo, a classe de vegetação herbácea e

a classe de culturas de sequeiro (21).

Em relação às classes florestais, os povoamentos abertos (312, 322 e 332) são muito menos

amostrados do que os povoamentos fechados (311, 321 e 331), à excepção da classe de floresta de

folhosas aberta (312). Este aspecto está relacionado com a grande ocupação de montados no

território nacional.

As classes de culturas de regadio (22) e arrozais (23), estão pouco representadas. No entanto,

nomeadamente em relação à classe de culturas de regadio, a sua representatividade aumenta nas

situações em que esta classe é uma das componentes de mosaico. A situação anteriormente referida

é bastante similar ao número de observações que se verificaram em relação às culturas permanentes

de folha perene (241) e às culturas permanentes de folha caduca (242).

A classe de vegetação esparsa (36), foi muito pouco observada na amostra. Julgamos que este facto

se deva especialmente a dois factores: dificuldade na interpretação desta classe devido à

semelhança com as classes de solo nú (6) e vegetação herbácea (35).

Em relação às áreas artificiais contínuas (11) e descontínuas (12), verificamos uma maior

predominância da classe de áreas artificiais descontínuas. Este facto já era de esperar, pois grande

parte do tecido urbano de Portugal Continental é constituído por áreas artificiais descontínuas,

reflectindo a matriz rural do país. Grande parte das áreas de tecido urbano continuo localizam-se

junto ao litoral e geralmente nas grandes cidades, estando por isso mais localizadas e daí não terem

sido tantas vezes observadas.

4.1.2 Análise dos índices de confiança da base de dados de referência

Na Tabela 7, apresentamos os resultados referentes à análise da base de dados de referência e o

número de observações para cada classe relativamente aos índices de confiança.


53

Tabela 7. Frequência de cada classe de ocupação de solo relativamente aos índices de confiança.

Muita confiança Confiança parcial Pouca confiança Classes

N Total f (%) Total f (%) Total f (%)

11 29 22 75,9 2 6,9 5 17,2

12 98 37 37,8 26 26,5 35 35,7

21 198 48 24,2 40 20,2 110 55,6

22 99 22 22,2 29 29,3 48 48,5

23 41 25 61,0 8 19,5 8 19,5

241 65 16 24,6 12 18,5 37 56,9

242 47 13 27,7 7 14,9 27 57,4

311 113 51 45,1 6 5,3 56 49,6

312 102 6 5,9 24 23,5 72 70,6

321 149 62 41,6 25 16,8 62 41,6

322 32 2 6,3 7 21,9 23 71,9

331 102 23 22,5 15 14,7 64 62,7

332 46 2 4,3 14 30,4 30 65,2

34 303 81 26,7 66 21,8 156 51,5

35 96 2 2,1 21 21,9 73 76,0

36 34 4 11,8 6 17,6 24 70,6

6 13 2 15,4 3 23,1 8 61,5

Total 1567 418 26,7 311 19,8 838 53,5

Legenda:

N: nº total de unidades amostrais para cada classe

f: frequência

Observando a Tabela 7, podemos verificar que cerca de metade das unidades amostrais foram foto

interpretadas com pouca confiança. Já as unidades amostrais com muita confiança e confiança

parcial, representam respectivamente 26,7% e 19,8% da base de dados de referência. O facto da

maior parte das unidades amostrais ter sido classificada com pouca confiança por parte do foto

intérprete, deve-se ao facto de à escala de um pixel MERIS, surgir geralmente mais do que uma

classe de ocupação do solo na unidade amostral. Assim sendo, o foto intérprete é incapaz de atribuir

muita confiança à classe de ocupação do solo principal atribuída a essa unidade amostral.

Relativamente à classe de áreas artificiais contínuas (11), podemos verificar que esta foi foto-

interpretada na sua grande maioria com muita confiança. Este aspecto já seria de esperar, pois esta

classe através de foto interpretação é facilmente distinguível. No entanto, o facto desta classe possuir

alguma frequência nos restantes níveis de confiança está relacionado com o facto de por vezes ser

difícil discriminar a percentagem entre esta classe e a classe de áreas artificiais descontínuas (12),

como também a possibilidade de esta classe estar contida em zonas de transição entre classes de

ocupação do solo, constituindo assim áreas de mosaico.

A classe de áreas artificiais descontínuas (12) possui, semelhantemente, elevada frequência de

unidades amostrais foto-interpretadas com muita confiança, e com pouca confiança. Neste caso


54

deve-se a esta classe muitas vezes se encontrar misturada com outras classes, nomeadamente

agrícolas e florestais, o que pode levar a uma redução da confiança por parte do foto-intérprete.

A classe de culturas de sequeiro (21), por seu lado, apresenta valores de frequência mais elevados

para unidades amostrais com pouca confiança. Este aspecto, está relacionado com o facto de por

vezes ser difícil por parte do foto-intérprete em diferenciar este tipo de ocupação através de imagens

aéreas uni-temporais, sendo difícil de distinguir esta classe da de vegetação herbácea (35), como por

vezes das culturas de regadio (22).

Também a classe de culturas de regadio (22), apresenta uma elevada frequência em unidades

amostrais foto-interpretadas com pouca confiança. No entanto, existem situações em que existe

muita certeza, nomeadamente nas culturas de regadio, por se ter conseguido detectar a presença de

pivots ou canais de rega.

Em relação à classe de arrozais (23), existe também uma frequência bastante elevada de unidades

amostrais foto-interpretadas com muita confiança, devido ao facto de esta classe estar associada na

sua grande maioria às lezírias do Tejo e Sado, sendo facilmente distinguível. No entanto, é de

salientar que a frequência de unidades amostrais foto-interpretadas com confiança parcial ou pouca

confiança, deve-se ao facto de nestas zonas a classe de arrozais se encontrar associada à classe de

culturas de regadio (22), formando mosaicos à escala de um pixel MERIS.

Relativamente às classes de culturas permanentes de folha perene (241) e de culturas permanentes

de folha caduca (242), podemos verificar que existe uma maior tendência, para o foto-intérprete

classificar essas unidades amostrais com pouca confiança ou com confiança parcial. Este facto deve-

se, por vezes, à dificuldade em conseguir discriminar entre estas classes, como também à mistura

que estas classes possuem com outras classes de ocupação do solo, formando mosaicos. Este

último aspecto pode ser observado na Tabela 9, pelo elevado número de unidades amostrais destas

classes classificadas como constituintes de mosaicos.

As classes de floresta de folhosas fechada (311), floresta de resinosas fechada (321) e floresta mista

fechada (331), apresentam, na sua maioria, unidades amostrais foto-interpretadas com muita

confiança como também com pouca confiança. Já seria de esperar a sua óptima separação, pois

estas classes podem ser facilmente distinguidas pela utilização da banda do infra-vermelho próximo

das imagens aéreas utilizadas. No entanto, existem unidades amostrais em que estas classes estão

no limite entre classes e que sejam classificadas como mosaico. No caso da classe de floresta mista

fechada, o aspecto anteriormente referido ainda é mais acentuado, pois é difícil distinguir o limiar de

percentagem mínimo (20%) do outro tipo de classe florestal representado na unidade amostral para

considerá-la como pertencendo à classe referida, tendo por isso uma maior frequência de unidades

amostrais foto-interpretadas com pouca confiança.


55

Em relação às classes de floresta de folhosas aberta (312), floresta de resinosas aberta (322) e

floresta mista aberta (332), podemos verificar que existe uma maior tendência para as unidades

amostrais serem foto-interpretadas com pouca confiança. No caso da classe de floresta de folhosas

aberta este aspecto está relacionado com as zonas de montado, nas quais o sub coberto poderá ser

constituído por culturas agrícolas de sequeiro ou vegetação herbácea, existindo dúvida entre

classificar a unidade amostral como montado ou agricultura. Para além deste aspecto, nas zonas de

eucaliptal aberto, poderá haver também uma forte componente arbustiva no sub-coberto e dúvida na

percentagem de coberto da floresta, levando assim à atribuição de confiança reduzida, o que também

acontece no caso da classe de floresta de resinosas aberta. Esta situação é similar para o caso dos

povoamentos mistos abertos, com a agravante de existir dúvida sobre se há percentagem suficiente

ou não de classes florestais para se considerar uma floresta mista.

Relativamente à classe de vegetação arbustiva (34), podemos verificar que esta classe possui uma

frequência elevada de unidades amostrais com pouca confiança. Este facto deve-se à multiplicidade

de situações em que esta classe pode surgir como mosaico, como povoamento puro, ou então em

situações em que é difícil por parte do foto-intérprete, diferenciar esta classe da classe de vegetação

herbácea (35). Este facto está relacionado com a altura da vegetação (< 30 cm) a partir da qual se

poderá considerar uma amostra como pertencente à classe de vegetação arbustiva e não à classe de

vegetação herbácea.

As classes de vegetação herbácea (35), vegetação esparsa (36) e solo nú (6), apresentam uma clara

tendência para serem foto-interpretadas com pouca confiança. Este facto, deve-se à dificuldade em

conseguir definir os limiares de percentagem de coberto que permitam optar pela classe de

vegetação herbácea (>15%) ou de vegetação esparsa (4%<>15%). O mesmo se passa em relação à

classe de solo nú (<4%), sendo difícil de diferenciar esta classe da classe de vegetação esparsa.

4.1.3 Análise dos índices de localização da base de dados de referência

De seguida, na Tabela 8 apresentamos os resultados referentes à análise da base de dados de

referência e o número de observações para cada classe relativamente aos índices de localização.

Analisando a Tabela 8, podemos verificar que os índices de localização se encontram distribuídos em

proporções semelhantes na base de dados de referência, tendo maior frequência por ordem

decrescente, as unidades amostrais foto-interpretadas em áreas heterogéneas, no limite e

homogéneas.


56

Tabela 8. Frequência de cada classe de ocupação de solo relativamente aos índices de localização.

Heterogéneo No limite Homogéneo Classes

N Total f (%) Total f (%) Total f (%)

11 29 7 24,1 10 34,5 12 41,4

12 98 45 45,9 33 33,7 20 20,4

21 198 81 40,9 50 25,3 67 33,8

22 99 48 48,5 35 35,4 16 16,2

23 41 2 4,9 23 56,1 16 39,0

241 65 34 52,3 22 33,8 9 13,8

242 47 27 57,4 17 36,2 3 6,4

311 113 24 21,2 39 34,5 50 44,2

312 102 28 27,5 30 29,4 44 43,1

321 149 35 23,5 62 41,6 52 34,9

322 32 9 28,1 14 43,8 9 28,1

331 102 48 47,1 40 39,2 14 13,7

332 46 28 60,9 12 26,1 6 13,0

34 303 127 41,9 82 27,1 94 31,0

35 96 49 51,0 26 27,1 21 21,9

36 34 9 26,5 5 14,7 20 58,8

6 13 3 23,1 6 46,2 4 30,8

Total 1567 604 38,5 506 32,3 457 29,2

Legenda:


f: frequência

Em relação a cada uma das classes de ocupação do solo e a heterogeneidade na área envolvente a

cada unidade amostral, podemos verificar que a classe de áreas artificiais contínuas (11) encontra-se

frequentemente em zonas homogéneas e no limite entre ocupações. Este facto já seria de esperar,

pois esta classe está na sua grande maioria restrita aos grandes centros urbanos junto ao litoral,

constituindo grandes áreas metropolitanas (Lisboa e Porto), que formam estruturas lineares na

paisagem portuguesa. A sua grande extensão, permite também que a esta escala, exista uma

elevada frequência de unidades amostrais foto-interpretadas em zonas homogéneas. A classe de

áreas artificiais descontínuas (12), encontra-se maioritariamente distribuída em zonas heterogéneas e

no limite entre ocupações. Este facto já era esperado, pois estas áreas correspondem geralmente a

pequenas povoações em que na sua envolvente existem áreas com usos ligados à produção agrícola

e florestal.

Relativamente à classe de culturas de sequeiro (21), maior parte das unidades amostrais foram

classificadas como estando em áreas heterogéneas mas também em homogéneas. Este aspecto

seria de esperar pois, nomeadamente na região do Alentejo onde existe este tipo de ocupação em

maior proporção, esta classe ocupa áreas muito extensas que não aparecem fragmentadas à escala

de um pixel MERIS. Por outro lado, nomeadamente no norte do país esta classe surge mais

fragmentada, pois esta classe de ocupação do solo surge em áreas muito mais reduzidas.


57

As culturas de regadio (22), por seu lado, foram classificadas na sua maioria como estando em zonas

heterogéneas ou no limite entre duas ocupações do solo. Também seria de esperar este aspecto,

pois grande parte destas áreas podem ser encontradas nas lezírias do Tejo e Sado, indicando assim

que esta classe possui uma elevada linearidade ao longo das regiões referidas. Tal como para a

classe de culturas de sequeiro, nas regiões do norte do país estas áreas são muito mais reduzidas,

surgindo assim muito fragmentadas. Já no caso dos arrozais (23), esta classe apresenta uma maior

frequência em áreas homogéneas e no limite entre ocupações. Tal como no caso das culturas de

regadio estas culturas encontram-se na sua grande maioria e em maior extensão nas lezírias do Tejo

e Sado, surgindo assim linearmente ao longo da margem deste dois rios em zonas extensas e

homogéneas.

Em relação às culturas permanentes de folha perene (241), podemos verificar que à medida que vai

aumentando a homogeneidade, vai havendo um decréscimo da frequência. Já seria de esperar, pois

apesar de esta classe estar bastante representada em grandes áreas do Alentejo, esta também está

muito representada em zonas onde se praticam actividades agrícolas não extensivas e daí o seu

maior valor de frequência em zonas heterogéneas, nomeadamente no norte do país. O aspecto

anteriormente referido para a classe de culturas permanentes de folha perene é bastante similar para

a classe de culturas permanentes de folha caduca (242), sendo mais evidente a frequência em zonas

heterogéneas e no limite entre ocupações.

A classe de floresta de folhosas fechada (311) encontra-se na sua grande maioria em zonas

homogéneas. Este facto deve-se às extensas áreas de eucaliptal para produção de madeira e pasta

de papel que surgem um pouco por todo o país, principalmente na região Centro. Já em relação à

classe de floresta de folhosas aberta (312), podemos verificar que maior parte das áreas amostradas

se encontram em zonas homogéneas. Este aspecto já seria de esperar, pois esta classe representa

também os montados que ocupam extensas áreas na região Sul de Portugal Continental.

Relativamente à classe de floresta de resinosas fechada (321), podemos verificar que grande parte

das áreas amostradas correspondem a áreas no limite ou homogéneas. Já seria de esperar, pois este

tipo de povoamento florestal ocupa vastas extensões do território por ser um tipo de floresta utilizado

pela indústria de produção de madeira. Já a classe de floresta de resinosas aberta (322), surge na

sua grande maioria em zonas no limite entre ocupações. Julgamos que este aspecto esteja

relacionado com o facto de estes povoamentos surgirem em zonas de corte e novas plantações

incluídas nas vastas manchas da classe de floresta de resinosas fechada.

Em relação à classe de floresta mista fechada (331), esta apresenta uma maior frequência em zonas

localizadas no limite e heterogéneas, com igual frequência. Julgamos que este aspecto possa estar

relacionado com a ocorrência em zonas de transição entre povoamentos florestais de folhosas e

resinosas, ou com povoamentos deste tipo de floresta que à escala do pixel MERIS, surgem

fragmentados na paisagem portuguesa. A classe de floresta mista aberta (332), por seu lado


58

apresenta uma maior frequência em zonas heterogéneas, indicando que esta classe se encontra

fragmentada na paisagem portuguesa.

Relativamente à classe de vegetação arbustiva (34), esta encontra-se distribuída equitativamente

pelos vários tipos de localização, com mais destaque para zonas heterogéneas e no limite entre

ocupações. Pensamos que este aspecto possa estar relacionado com o elevado número de unidades

amostrais classificadas como vegetação arbustiva, nas mais diversas combinações de classes ou

então como classe pura em cada amostra.

A classe de vegetação herbácea (35), apresentou maior tendência para estar localizada em áreas

heterogéneas. Seria de esperar que esta classe se encontrasse maioritariamente em zonas

homogéneas, nomeadamente nas vastas planícies alentejanas associada aos montados, mas tal não

aconteceu. Julgamos que esta heterogeneidade esteja relacionada com a vegetação herbácea que

se encontra em zonas de montanha, que a esta resolução espacial apresenta-se fragmentada na

paisagem portuguesa. Por outro lado, julgamos que este aspecto possa estar também relacionado

com a dificuldade em distinguir os limites desta classe, por ser uma classe de ocupação de solo muito

dinâmica.

Relativamente à classe de vegetação esparsa (36), verificamos que esta surge com maior frequência

em áreas homogéneas. Seria também de esperar este aspecto, pois esta classe está associada às

áreas de alta montanha do norte de Portugal, que geralmente são constituídas por este tipo de

vegetação.

Em relação à classe de solo nú (6), esta na sua maioria surge em zonas homogéneas ou no limite

entre ocupações. No primeiro caso, julgamos que este aspecto está associado ao facto de esta

classe existir nas zonas de alta montanha. Por outro lado, as situações referentes a áreas no limite

entre ocupações julgamos que se tratem de zonas do litoral, nomeadamente praias, que à escala do

pixel MERIS, não têm largura suficiente para serem recolhidas amostras apenas com solo nú.

4.1.4 Análise das classes de mosaicos da base de dados de referência

Na Tabela 9, apresentamos os resultados referentes à análise da base de dados de referência e o

número de observações para cada classe relativamente às classes de mosaico.

Observando a Tabela 9, podemos verificar que 39,5% das unidades amostrais foto-interpretadas

pertencem às classes de mosaico, sendo maior a parte relativa à classe de mosaico de culturas

agrícolas/áreas de vegetação/áreas artificiais.


59

Tabela 9. Frequência de mosaicos em cada classe de ocupação do solo relativamente às classes de mosaico.

Mosaico de áreas agrícolas

Mosaico de áreas com vegetação

Mosaico de áreas agrícolas/áreas de vegetação/áreas

artificiais Mosaicos (Total)

Classe N

Total f (%) Total f (%) Total f (%) Total (%)

11 29 0 0,0 0 0,0 4 13,8 13,8

12 98 0 0,0 0 0,0 55 56,1 56,1

21 198 27 13,6 0 0,0 58 29,3 42,9

22 99 14 14,1 0 0,0 47 47,5 61,6

23 41 3 7,3 0 0,0 9 22,0 29,3

241 65 18 27,7 0 0,0 27 41,5 69,2

242 47 14 29,8 0 0,0 18 38,3 68,1

311 113 0 0,0 16 14,2 14 12,4 26,5

312 102 0 0,0 7 6,9 21 20,6 27,5

321 149 0 0,0 30 20,1 20 13,4 33,6

322 32 0 0,0 3 9,4 2 6,3 15,6

331 102 0 0,0 25 24,5 31 30,4 54,9

332 46 0 0,0 3 6,5 13 28,3 34,8

34 303 0 0,0 50 16,5 49 16,2 32,7

35 96 0 0,0 19 19,8 14 14,6 34,4

36 34 0 0,0 1 2,9 2 5,9 8,8

6 13 0 0,0 0 0,0 5 38,5 38,5

Total 1567 76 4,9 154 9,8 389 24,8 39,5

Legenda:


f: frequência

Em relação às classes de ocupação do solo, as classes com maior frequência de mosaicos, são as

classes de áreas artificiais descontínuas (12), culturas de sequeiro (21), culturas de regadio (22),

culturas permanentes de folha perene (241), culturas permanentes de folha caduca (242) e floresta

mista fechada (331), tendo sido classificadas com maior frequência como mosaico de culturas

agrícolas/áreas de vegetação/áreas artificiais. Este aspecto deixa antever que estas classes surjam

mais combinadas com classes de vegetação ou de áreas artificiais, estando muito misturadas em

conjunto com outras classes.

Já as classes de áreas artificias contínuas (11), vegetação esparsa (36) e floresta mista aberta (332),

têm poucas amostras classificadas como mosaico. Julgamos que este aspecto esteja relacionado

com o facto de as duas últimas classes mencionadas, serem de difícil distinção entre outras, não se

conseguindo definir bem as unidades de paisagem. Em relação à classe de áreas artificiais

contínuas, julgamos que esteja relacionado com o facto de esta classe se poder situar em zonas

homogéneas.


60

4.2 Exactidão global das imagens MERIS validadas com as amostras de treino

Para a produção do mapa, que servirá de base ao teste da nossa metodologia de avaliação,

realizámos uma avaliação inicial da melhor data mensal para a classificação da ocupação do solo em

Portugal Continental. Assim sendo, fez-se uma classificação com amostras de treino e teste para o

ano de 2005 com imagens MERIS, para as 17 classes da nomenclatura, utilizando o algoritmo da

Máxima Verosimilhança. Os resultados desta avaliação são apresentados na Tabela 10.

Tabela 10. Exactidão global da classificação efectuada de cada imagem MERIS para cada mês do ano.

Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez

84,8% 83,5% 80,9% 84,4% 82,1% 84,5% 83,6% 85,8% 85,7% 83,8% 83,8% 82,3%

Observando a Tabela 10, podemos verificar que a exactidão global para o ano de 2005 do conjunto

das 12 imagens MERIS, está compreendida entre os 80,9% (Março) e os 85,8% (Agosto). Em relação

a cada estação do ano, as imagens que obtiveram melhores resultados foram: Janeiro (Inverno); Abril

(Primavera), Agosto (Verão) e Novembro (Outono). As imagens de cada um destes meses, foram

assim seleccionadas para realizar uma análise estatística multivariada, com o intuito de determinar

qual destas imagens permitiria uma melhor separação entre as classes de ocupação do solo.

4.3 Análise estatística multivariada da separabilidade espectral intra-anual das classes de ocupação do solo

Esta análise teve como objectivo determinar qual das imagens seleccionadas anteriormente, de cada

estação do ano, permite uma melhor separabilidade entre classes de ocupação do solo, para assim

podermos seleccionar a imagem sobre a qual iremos produzir um mapa de ocupação do solo e

aplicarmos a nossa metodologia de validação.

4.3.1 Análise dos descritores estatísticos

Após a elaboração de boxplots para cada classe de ocupação do solo e para cada imagem relativa a

uma estação do ano, obtivemos os resultados apresentados nas Figuras 13-16. Com esta análise

pretendemos comparar, apenas em relação ao NDVI, se existe semelhança dos descritores

estatísticos entre classes de ocupação do solo, como também verificar se estes variam muito para

cada classe. É de salientar que os resultados obtidos, podem ser diferentes se utilizarmos mais

bandas na análise. No entanto, como este é um estudo exploratório, queremos ter apenas uma

percepção relativa da variabilidade intra e inter classe para cada classe de ocupação do solo.


61

Analisando a Figura 14. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Janeiro.,

podemos verificar que as classes de áreas artificiais contínuas (11), áreas artificiais descontínuas

(12), arrozais (23), vegetação arbustiva (34), vegetação esparsa (36) e florestas fechadas (311,321 e

331), têm uma variabilidade intra-classe reduzida. No entanto, em relação à classe de vegetação

arbustiva é de salientar a presença de alguns outliers que podem afectar a sua variabilidade intra-

classe. As restantes classes apresentam uma variabilidade intra- classe já mais elevada,

nomeadamente as classes de florestas abertas (312, 322 e 332) e culturas permanentes de folha

caduca (242), o que indicia que estas classes tenham uma maior tendência para se confundirem com

outras. É também de salientar que as classes de floresta fechada se sobrepõem verticalmente, ou

seja, têm uma variabilidade inter-classe reduzida indicando que estas se podem confundir neste mês

do ano. O mesmo acontece entre as classes de floresta aberta.

Figura 14. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Janeiro.

Analisando agora as boxplots, para a imagem do mês de Abril (Figura 15), podemos verificar que as

classes de ocupação do solo com menor variabilidade intra-classe, são as mesmas da imagem de

Janeiro. No entanto, é de salientar que as classes que apresentam vegetação possuem uma maior

variabilidade intra-classe, aumentando assim ainda mais a possibilidade de se misturarem entre elas.

Este facto acontece porque estamos na Primavera e nesta altura do ano as espécies vegetais que

pertencem a uma determinada classe podem estar em estados vegetativos diferentes. Tal como no

mês de Janeiro, as classes de povoamentos florestais fechados (311, 321, 331) sobrepõem-se

verticalmente entre si, como também as classes de povoamentos florestais abertos (312, 322, 332),

sugerindo que estas classes se possam confundir entre si, dentro de cada grupo.


62

Figura 15. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Abril.

Relativamente ao mês de Agosto (Figura 16), podemos verificar que as classes com menor

variabilidade intra-classe correspondem às classes de solo nú (6), áreas artificiais contínuas (11),

culturas de sequeiro (21), arrozais (23), culturas permanentes (241 e 242), floresta de folhosas

fechada (311) e floresta de resinosas fechada (321). Este aspecto anteriormente referido é bastante

evidente na classe de culturas de sequeiro, devendo-se ao facto destas culturas em Agosto já terem

sido colhidas e daí o seu valor médio de NDVI ser muito reduzido, como também estar compreendido

dentro de um intervalo bastante reduzido. Verificamos que este mês possui bastantes classes com

uma variabilidade intra-classe muito reduzida, o que deixa antever que a imagem relativa a este mês

seja uma boa opção para uma posterior classificação. Por outro lado, as classes de culturas de

regadio (22), vegetação herbácea (35) e floresta mista aberta (332), possuem uma elevada

variabilidade intra-classe. É de salientar que relativamente a este mês, já não existe uma

sobreposição vertical entre as classes que pertencem aos povoamentos florestais fechados (311,

321, 331), como também entre as classes que pertencem de povoamentos florestais abertos (312,

322, 332).


63

Figura 16. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Agosto.

Relativamente ao mês de Novembro (Figura 17), podemos verificar que no geral todas as classes não

possuem uma elevada variabilidade intra-classe. No entanto, é de salientar que existe bastante

linearidade de todas as classes em relação ao valor de NDVI, ou seja, quase todas as classes têm o

seu valor médio no mesmo valor de ordenada, deixando antever que grande parte das classes de

ocupação do solo se confundam entre si no mês de Novembro.

Figura 17. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Novembro.


64

4.3.2 Análise factorial discriminante da separabilidade espectral das classes de ocupação do solo

Após a elaboração dos gráficos de dispersão relativamente às componentes um e dois para os

meses de Janeiro, Abril, Agosto e Novembro obtivemos os resultados apresentados nas Figuras 18 a

21. Pretendemos com esta análise verificar que classes de ocupação do solo maximizam a

separação entre indivíduos de diferentes grupos (classes de ocupação do solo) e minimizam a

separação entre indivíduos do mesmo grupo (classe de ocupação do solo). É de referir, que esta

análise é apenas exploratória e que a separação das classes de ocupação do solo não depende

apenas da informação contida nestas duas componentes, podendo as restantes componentes

contribuir para uma melhor separabilidade das classes de ocupação do solo.

Analisando a Figura 18. Componentes 1 e 2 para o mês de Janeiro., podemos verificar que as classes de

ocupação do solo que se afastam mais da principal nuvem de dispersão são as classes relativas às

áreas artificiais contínuas (11) e as áreas artificiais descontínuas (12) ao longo do eixo das abcissas,

havendo no entanto, alguma sobreposição entre estas duas classes. Em relação às restantes

classes, podemos verificar que de um modo geral todas se confundem, ou seja, se sobrepõem na

nuvem de dispersão principal. No entanto, é de salientar o facto de haver algum afastamento da

nuvem principal, relativamente às classes de culturas de sequeiro (21), culturas de regadio (22) e

culturas permanentes de folha caduca (242), apesar de se sobreporem entre elas. Os aspectos

anteriormente mencionados, deixam antever que existe pouca separabilidade entre maior parte das

classes de ocupação do solo.

Figura 18. Componentes 1 e 2 para o mês de Janeiro.

Em relação às componentes um e dois do mês de Abril (Figura 19), podemos verificar que as classes

de áreas artificiais (11 e 12) apresentam um padrão de dispersão semelhante ao do mês de Janeiro.


65

No entanto, algumas das classes de ocupação do solo agrícolas, nomeadamente as culturas de

regadio (22), as culturas permanentes de folha caduca (242) e os arrozais (23) afastam-se ao longo

do eixo das ordenadas da principal nuvem de dispersão. É de salientar o facto de na imagem de Abril,

a classe relativa às culturas de sequeiro (21), já não se afastar tanto da nuvem de dispersão principal.

Este aspecto pode estar relacionado com o estado de crescimento destas culturas, que nesta altura

do ano já apresentarem um grau de desenvolvimento no qual a sua reflectância se começa a

assemelhar, por exemplo, à classe de vegetação herbácea (35). Podemos constatar também que as

classes de culturas permanentes de folha perene (241) e de solo nú (6) afastam-se da nuvem de

dispersão principal, apesar deste afastamento ser muito reduzido.

Em termos de sobreposição de classes, podemos constatar que existe sobreposição das nuvens

entre as classes de áreas artificiais contínuas (11) e áreas artificiais descontínuas (12); culturas de

regadio (22), arrozais (23) e culturas permanentes de folha caduca (242); culturas de sequeiro (21) e

culturas permanentes de folha perene (241); as restantes classes.

Figura 19. Componentes 1 e 2 para o mês de Abril.

Relativamente ao mês de Agosto (Figura 20), podemos verificar que existem dois grupos de classes

de ocupação do solo que se separam claramente da principal nuvem de dispersão: ao longo do eixo

das abcissas as classes de áreas artificiais contínuas (11) e áreas artificiais descontínuas (12) e ao

longo do eixo das ordenadas, as classes de culturas de regadio (22) e de arrozais (23). É de notar

ainda algum afastamento em relação à nuvem principal, ao longo do eixo das abcissas, da classe de

culturas permanentes de folha perene (241), apesar deste afastamento não ser muito acentuado.

Outras das classes que apresentam um certo afastamento, são as classes de solo nú (6), e menos

evidente, na de culturas de sequeiro (21) e floresta de folhosas fechada (311). Todas as outras

classes, no geral, confundem-se todas entre elas, à excepção de algumas situações pontuais

anteriormente referidas.


66

Figura 20. Componentes 1 e 2 para o mês de Agosto.

Observando a Figura 21, relativa ao mês de Novembro, podemos verificar que ao longo do eixo das

abcissas, as classes de áreas artificiais contínuas (11) e áreas artificiais descontínuas (12), se

separam claramente da nuvem de dispersão principal. Em relação ao eixo das ordenadas, podemos

verificar que existem várias classes, nomeadamente agrícolas, que se separam da nuvem de

dispersão principal. Estas classes são as de culturas de sequeiro (21), culturas de regadio (22),

arrozais (23), culturas permanentes de folha perene (241) e culturas permanentes de folha caduca

(242). No entanto, apesar desta separação da nuvem principal todas estas classes se sobrepõem

entre si. As restantes classes encontram-se todas aglomeradas na nuvem principal, estando também

todas sobrepostas entre si.

Figura 21. Componentes 1 e 2 para o mês de Novembro.


67

4.3.3 Distância entre classes de ocupação do solo

Após a elaboração dos dendrogramas, relativamente à reflectância de cada banda para as imagens

dos meses de Janeiro, Abril, Agosto e Novembro nas amostras de treino, obtivemos os resultados

apresentados nas Figuras 22 a 25. Pretendemos com esta análise, avaliar a separabilidade entre as

classes de ocupação do solo, considerando todas as bandas de cada imagem estudada. O eixo das

ordenadas indica a distância entre os centros do espaço dimensional característico de cada classe.

Quanto maior fôr esse valor, maior será a distância entre classes de ocupação do solo.

Analisando a Figura 22, e considerando a distância=20, podemos considerar que para o mês de

Janeiro existem quatro grandes grupos de classes de ocupação do solo, em termos da sua

separabilidade espectral. Assim sendo, da esquerda para a direita do dendrograma temos: grupo 1 -

os povoamentos florestais (311, 312, 321, 322, 331 e 332) e vegetação arbustiva (34); grupo 2 -

classes de vegetação herbácea (35), vegetação esparsa (36) e solo nú (6); grupo 3 - classes de

agricultura (21, 22, 241, 242); grupo 4 - áreas artificiais (11 e 12).

Relativamente ao primeiro grupo, podemos verificar uma menor distância entre as classes de

povoamentos florestais abertos (312, 322 e 332) e a classe de vegetação arbustiva (34). Este aspecto

poderá estar relacionado com o sinal que é transmitido pelo sub-coberto e captado pelo sensor. Ainda

dentro deste grupo, podemos verificar também uma distância reduzida entre as classes de

povoamentos florestais fechados (311, 321 e 331). É de salientar que os povoamentos florestais de

folhosas (311 e 312), possuem uma maior proximidade com os povoamentos florestais mistos (331 e

332) do que com os povoamentos florestais de resinosas (321 e 322). Este aspecto verifica-se tanto

relativamente aos povoamentos florestais abertos como fechados.

Em relação ao segundo grupo, podemos verificar uma menor distância entre as classes de vegetação

herbácea (35) e vegetação esparsa (36), ficando a classe de solo nú (6) mais afastada. Este aspecto

deixa antever uma maior semelhança espectral entre a classe de vegetação herbácea e a classe de

vegetação esparsa. Durante o processo de foto-interpretação também se verificou esta dificuldade na

discriminação destas classes que se deveu à dificuldade em descriminar o limite de percentagem de

coberto para cada uma destas classes (solo nu (<4%); vegetação esparsa (4%<>15%); vegetação

herbácea (>15%)).

No terceiro grupo, podemos considerar dois sub-grupos distintos: um relativo às classes de culturas

de sequeiro (21) e culturas permanentes de folha perene (241) e outro mais distante deste, relativo às

classes de culturas de regadio (22), arrozais (23) e culturas permanentes de folha caduca (242).

Estranhamente, existe uma maior proximidade espectral no mês de Janeiro entre a classe de arrozais

e a classe de culturas permanentes de folha caduca do que relativamente à classe de culturas de

regadio.


68

O quarto e último grupo é apenas composto pelas áreas artificiais contínuas e descontínuas. De facto

este grupo é o mais distante de todos os outros, aspecto este que já era esperado. No entanto, é de

salientar a pouca distância que existe entre ambas as classes anteriormente referidas.

Figura 22. Dendrograma para a imagem do mês de Janeiro.

Em relação às amostras de cada uma das classes, caracterizadas pela informação espectral da

imagem do mês de Abril, podemos verificar através da análise da Figura 23 e considerando

novamente a distância=20, que existem quatro grandes grupos de classes de ocupação do solo.

Assim sendo, da esquerda para a direita do dendrograma: grupo um - classes de povoamentos

florestais (311, 312, 321, 322, 331 e 332), vegetação arbustiva (34), vegetação herbácea (35),

vegetação esparsa (36) e solo nú (6); grupo dois - culturas de sequeiro (21) e culturas permanentes

de folha perene (241); grupo três - culturas de regadio (22), culturas permanentes de folha caduca

(242) e os arrozais (23); grupo quatro - áreas artificiais contínuas (11) e descontínuas (12).

Em relação ao primeiro grupo, podemos verificar que este é composto pelas mesmas classes do

grupo um da imagem relativa a Janeiro (Figura 22), mais as classes de vegetação herbácea (35),

vegetação esparsa (36) e solo nú (6). È de salientar que para a imagem de Abril, a classe de

vegetação herbácea se encontra mais distante das classes de vegetação esparsa e solo nú. Este

aspecto está relacionado com o facto de na Primavera a vegetação herbácea estar no seu vigor

máximo e dai a sua maior distância relativamente às classes de vegetação esparsa e solo nú.

O segundo grupo é apenas composto pelas classes de culturas de sequeiro (21) e culturas

permanentes de folha perene (241), estando no entanto estas classes muito pouco distantes entre si.

Este grupo revela que houve uma separação entre estas duas classes e as restantes classes

agrícolas que para a imagem do mês de Janeiro (Figura 23) se encontravam todas no mesmo grupo.

Julgamos que esta separação esteja relacionada com o facto de na Primavera as culturas de

sequeiro já se encontrarem num avançado estado de desenvolvimento e por outro lado as culturas


69

permanentes de folha perene, podem apresentar no sub-coberto culturas de sequeiro ou vegetação

herbácea (35).

Relativamente ao terceiro grupo, podemos verificar uma maior proximidade entre as classes de

culturas de regadio (22) e de culturas permanentes de folha caduca (242), estando a classe de

arrozais mais distante destas duas (23).

O quarto e último grupo é novamente composto pelas classes de áreas artificiais contínuas (11) e

descontínuas (12), estando estas classes também muito próximas entre si, tal como na cartografia

produzida para o mês de Janeiro.

Figura 23. Dendrograma para a imagem do mês de Abril.

Analisando agora a Figura 24, relativamente às amostras de cada uma das classes caracterizadas

pela informação espectral da imagem de Agosto e considerando a distância=20, podemos verificar

que existem agora seis grupos de classes de ocupação do solo. Especificamente, cada grupo

engloba as seguintes classes de ocupação do solo: grupo um - classes de povoamentos florestais

abertos e fechados (311, 312, 321, 322, 331, 332) e vegetação arbustiva (34); grupo dois - ao qual

pertencem as classes de vegetação herbácea (35), vegetação esparsa (36) e solo nú (6); grupo três -

classe de culturas de sequeiro (21); grupo quatro - ao qual pertencem as classes de culturas

permanentes de folha perene (241) e de culturas permanentes de folha caduca (242); grupo cinco -

ao qual pertencem as classes de culturas de regadio (22) e de arrozais (23); grupo seis - ao qual

pertencem as classes de áreas artificiais contínuas (11) e áreas artificiais descontínuas (12). O facto

de com a imagem de Agosto existirem 6 grupos, sugere que com esta imagem se consiga uma

melhor separabilidade entre classes de ocupação do solo. Para além disso, podemos verificar que o

valor máximo de distância, chega agora aos 140, outro forte indício de que com a imagem de Agosto,

conseguiremos uma melhor separabilidade entre classes de ocupação do solo.


70

Analisando o primeiro grupo, podemos verificar que existe uma grande proximidade entre os

povoamentos florestais abertos (312, 322 e 332) e fechados (311, 321, 331) de cada um dos tipos de

povoamentos florestais (folhosas ou resinosas). Este aspecto deixa antever que com a imagem de

Agosto, se consiga uma melhor discriminação entre os diferentes tipos de floresta. A classe de

vegetação arbustiva (34), encontra-se mais próxima das classes de povoamentos florestais mistos

(331 e 332), sendo as classes de povoamentos de resinosas (321 e 322) as que seguidamente se

encontram mais próximas dessa classe. Os povoamentos florestais de folhosas (311 e 312), são as

classes que se encontram mais afastadas das classes de ocupação do solo anteriormente

mencionadas.

O segundo grupo é em tudo semelhante ao segundo grupo da imagem de Janeiro, estando mais

próximas entre si as classes de vegetação herbácea (35) e vegetação esparsa (36) e a classe de solo

nú (6) mais afastada. Este novo agrupamento destas classes (na imagem do mês de Abril, tínhamos

verificado que a classe de vegetação herbácea se tinha separado das classes de vegetação esparsa

e solo nú), está relacionado com o facto de a vegetação herbácea no Verão se encontrar na sua

grande maioria seca.

O terceiro grupo apenas contempla a classe de culturas de sequeiro (21), estando este grupo mais

próximo do grupo quatro, que é composto pelas classes de culturas permanentes de folha perene

(241) e de culturas permanentes de folha caduca (242). Este facto deve-se às culturas de sequeiro

nesta altura do ano já terem sido colhidas, havendo assim uma mudança radical na sua constituição e

consequentemente na sua reflectância.

Relativamente ao quarto grupo, podemos verificar que não existe uma grande distância entre as

classes de ocupação do solo que o constituem.

O quinto grupo é apenas constituído pelas classes de culturas de regadio (22) e arrozais (23), não

estando muito distantes entre si.

O sexto e último grupo é em tudo semelhante ao grupo quatro, relativamente aos meses de Janeiro e

de Abril, não se distanciando também substancialmente entre si.


71

Figura 24. Dendrograma para a imagem do mês de Agosto.

Relativamente às unidades amostrais de cada uma das classes caracterizadas pela informação

espectral da imagem de Novembro, podemos verificar através da análise da Figura 25 e

considerando a distância=20, que existem três grupos. Grupo um - engloba as classes de

povoamentos florestais (311, 312, 321, 322, 331 e 332), vegetação arbustiva (34), vegetação

herbácea (35), vegetação esparsa (36) e solo nú (6); grupo dois - engloba as classes de culturas de

sequeiro (21), culturas de regadio (22), culturas permanentes de folha perene (241), culturas

permanentes de folha caduca (242) e arrozais (23); grupo três - englobas as classes de áreas

artificiais contínuas e descontínuas. É de salientar que a presença de apenas 3 grupos para a

imagem de Novembro, como também uma distância máxima entre classes de 80, deixam antever que

esta imagem seja uma má opção para a produção de uma cartografia de ocupação do solo, pois é a

imagem que proporciona uma menor distância entre classes de ocupação do solo.

Observando o primeiro grupo, podemos verificar que a classe de floresta de folhosas fechada (311)

está muito pouco distante da classe de floresta mista aberta (332). A classe de floresta mista fechada

(331) é a classe menos distante das classes referidas anteriormente. Este aspecto reforça o que foi

dito anteriormente sobre a separabilidade espectral de cada classe de ocupação do solo para a

imagem de Novembro. De facto, esta imagem mistura classes de ocupação do solo completamente

distintas (floresta de folhosas fechada (311), com floresta mista aberta (332)), realçando mais a sua

fraca apetência para a produção de uma cartografia de ocupação do solo. Relativamente à classe de

vegetação arbustiva (34) esta é a classe menos distante das classes referidas anteriormente. As

classes de povoamentos de resinosas (321 e 322), encontram-se muito pouco distantes entre si e são

as classes mais próximas das classes referidas anteriormente. As classes de vegetação herbácea

(35) e de floresta de folhosas aberta (312), estão também muito próximas entre si e são as classes

mais próximas das classes referidas anteriormente. Mais distante destas classes, encontram-se as

classes de vegetação esparsa (36) e solo nú (6). Através desta análise, podemos verificar que existe

uma grande confusão entre todas estas classes. Relativamente aos povoamentos de folhosas


72

abertos (312) se encontrarem muito pouco distantes da classe de vegetação herbácea (35), pode ser

explicado pelo facto desta classe florestal, ser na sua grande maioria respeitante a montados de

azinho e sobro, os quais possuem no seu sub-coberto, nesta altura do ano alguma componente

vegetativa.

Em relação ao segundo grupo, podemos verificar que as classes de culturas de sequeiro (21) e de

culturas permanentes de folha caduca (242), estão muito próximas, sendo a classe dos arrozais (23)

mais próxima destas duas classes referidas anteriormente. As classes relativas às culturas de regadio

(22) e culturas permanentes de folha perene (241) estão muito próximas entre si e seguidamente

próximas do grupo de classes referido anteriormente. Temos novamente as classes agrícolas todas

incluídas no mesmo grupo. Isto deve-se ao facto de todas as culturas agrícolas não se encontrarem

no campo, ou então já foram semeadas, não possuindo ainda uma componente vegetativa muito

forte.

O terceiro grupo é novamente composto pelas classes de áreas artificiais contínuas (11) e

descontínuas (12), sendo este o grupo mais distante dos grupos um e dois.

Figura 25. Dendrograma para a imagem do mês de Novembro.

Após esta análise, optámos pela imagem de Agosto para a produção automática do mapa final pois é

a que permite a menor variabilidade intra e inter-classe, como também é a que permite obter uma

maior separação entre classes de ocupação do solo. Já estaríamos à espera que assim fosse, pois

este mês corresponde à altura do ano em que o ângulo zenital entre o Sol e a Terra é menor. Para

além disso, segundo Gonçalves et al. (2006), este é o período do ano que permite uma maior

separação entre classes, como também é a imagem que possui a menor cobertura de nuvens de todo

o conjunto das imagens MERIS, para o ano de 2005. O mapa produzido pode ser consultado no

Anexo 6.


73

4.4 Avaliação da exactidão temática da cartografia de ocupação do solo

Neste capítulo apresentamos a avaliação da exactidão temática da cartografia de ocupação do solo

que serviu de base para este estudo. Esta cartografia foi derivada anteriormente da imagem MERIS

do mês de Agosto, através do algoritmo da máxima verosimilhança. Posteriormente, o mapa

produzido foi avaliado através da metodologia tradicional (matriz de confusão) e de funções fuzzy que

nos permitiram compreender a génese dos erros do mapa e relacioná-los com as análises feitas

anteriormente, nomeadamente com a análise estatística da base de dados e com a análise

exploratória da imagem da qual se derivou o mapa produzido.

4.4.1 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de confusão

Na Tabela 11, apresentamos o cruzamento entre a classificação do mapa produzido e a primeira

classificação da base de dados de referência (CMP 1), através de uma matriz de confusão, tendo em

conta a área de cada estrato.

Tabela 11. Matriz de confusão (Classificação do mapa VS CMP 1 das amostras de referência).

Amostras de referência Classes

11 12 21 22 23 241 242 311 312 321 322 331 332 34 35 36 6

Total E.U.(%)

11 8 6 1 1 16 50,0

12 17 48 3 1 1 1 1 3 5 3 6 1 90 53,3

21 1 40 1 2 1 1 3 6 1 56 71,4

22 7 8 52 11 5 3 2 2 7 6 1 104 50,0

23 3 2 12 17 1 4 1 40 42,5

241 1 12 51 8 3 26 14 12 28 1 1 5 4 48 19 2 3 238 10,9

242 2 10 40 10 3 20 16 5 12 1 21 9 2 2 153 10,5

311 1 4 27 7 12 4 9 1 65 41,5

312 1 24 3 1 4 3 39 39 7 9 3 6 43 8 3 193 20,2

321 25 25 100,0

322 4 2 19 7 1 3 19 2 1 58 12,1

331 1 2 2 2 6 3 26 2 45 9 20 8 126 35,7

332 3 13 2 2 3 5 8 33 7 5 7 17 7 1 113 6,2

34 3 2 1 1 4 4 13 2 8 1 43 5 1 88 48,9

35 1 8 4 4 2 4 3 6 1 7 4 33 14 11 2 104 13,5

36 3 1 1 1 1 4 3 6 3 1 2 31 9 7 73 9,6

Cla

ssifi

caçã

o do

map

a

6 2 1 1 1 1 1 7 2 8 1 25 4,0

Total 29 98 198 99 41 65 47 113 102 149 32 102 46 303 96 34 13 1567

E.P.(%) 37,5 40,6 18,7 42,2 90,7 34,0 31,8 26,0 34,1 5,4 27,6 43,7 17,2 13,1 16,6 26,0 9,6 E.G.(%) = 23,1

Legenda:

E.P.:Exactidão do produtor


74

E.U.: Exactidão do utilizador

E.G.: Exactidão global

Analisando a Tabela 11, podemos verificar que a exactidão global foi de 23,1%, após o cruzamento

das amostras de referência com a cartografia produzida. Este valor é muito reduzido, o que deixa

antever que as imagens MERIS, poderão não ser as mais adequadas para a elaboração de

cartografias de ocupação do solo para Portugal Continental, com uma nomenclatura tão detalhada a

esta resolução espacial. No entanto, é necessário analisar mais concretamente cada classe de

ocupação do solo, relativamente aos erros de omissão e de comissão, para se poderem retirar

ilações mais precisas.

Relativamente aos erros de omissão, ou seja em relação à exactidão do produtor, podemos verificar

que no geral os erros foram elevados, nomeadamente as classes de culturas de sequeiro (21) de

floresta de resinosas fechada (321), floresta mista aberta (332), vegetação arbustiva (34), vegetação

herbácea (35) e solo nu (6). Podemos assim afirmar que se tivesse sido apenas atribuída uma classe

de ocupação do solo a cada unidade amostral, seria recomendável que as amostras de referência,

relativas a estas classes, fossem verificadas. Por outro lado as classes com erros de omissão

menores, destacam-se as classes de arrozais (23), com uma exactidão do produtor de 90,7%, áreas

artificiais descontínuas (12), culturas de regadio (22) e floresta mista fechada (331). Este aspecto não

seria de esperar, nomeadamente em relação às classes de culturas de regadio e floresta mista

fechada. No primeiro caso, devido à utilização de imagens uni-temporais que não permitem uma clara

distinção entre as classes de culturas de regadio (22) e culturas de sequeiro (21). Já no segundo

caso, este facto é devido à dificuldade por parte do foto intérprete em determinar a percentagem

mínima de um determinado povoamento florestal, para que em conjunto com outro tipo de

povoamento florestal, seja atribuída a classe de floresta mista, sendo de esperar um maior número de

erros de omissão nesta classe.

Em relação à exactidão do utilizador, os resultados obtidos para cada classe de ocupação do solo já

são mais elevados, das quais se destacam as classes de floresta de resinosas fechada (321) com

100%, áreas artificiais contínuas (11), áreas artificiais descontínuas (12), culturas de sequeiro (21) e

culturas de regadio (22). No entanto, é de salientar o facto de o número de unidades amostrais

classificadas no mapa como floresta de resinosas e áreas artificiais contínuas ser muito reduzido, 25

e 16 respectivamente, podendo o valor da exactidão do utilizador para estas classes possuir um

intervalo de confiança muito elevado. Analisando a Figura 20, podemos verificar que estas classes

são as que em termos espectrais se afastam mais da nuvem de dispersão principal, indicando que

são as classes com menos hipóteses de se misturarem em termos espectrais.

Já as classes com erros de comissão elevados, podemos destacar as classes de culturas

permanentes (241 e 242), floresta de resinosas aberta (322), floresta mista aberta (332), vegetação

herbácea (35), vegetação esparsa (36) e solo nú (6). Todas estas classes se encontram misturadas

na nuvem de dispersão principal, indicando possuírem semelhança espectral com todas as outras


75

classes, à excepção das classes com melhores resultados relativamente à exactidão do utilizador

(Figura 20).

Analisando agora a confusão que existe entre as classes com erros de comissão mais elevados e as

restantes classes, podemos verificar que em relação à classe de culturas permanentes de folha

perene (241), esta confunde-se na sua grande maioria com a classe de culturas de sequeiro (21),

floresta de folhosas aberta (312) e vegetação arbustiva (34). Já estaríamos à espera que esta classe

se confundisse com a classe de culturas de sequeiro, pois através da análise da Figura 24, podemos

verificar que estas classes estão em termos espectrais, muito próximas entre si. Por outro lado a

classe de culturas permanentes de folha perene pode também possuir no sub-coberto culturas de

sequeiro. Em relação à mistura desta classe, com a classe de floresta de folhosas aberta (312),

julgamos que esteja relacionada com o facto de estas classes serem muito semelhantes, pois a

oliveira também é uma folhosa e é a espécie que representa a maioria das unidades amostrais foto-

interpretadas como culturas permanentes de folha perene (olivais), sendo plantada com

espaçamento, ou seja o grau de coberto é semelhante ao da classe de floresta de folhosas aberta. A

confusão da classe de culturas permanentes de folha perene relativamente à classe de vegetação

arbustiva, julgamos que de alguma forma possa estar relacionado com o treino efectuado para a

classe de vegetação arbustiva no qual, foram recolhidas amostras homogéneas que não representam

todas as variações possíveis desta classe, nomeadamente vegetação arbustiva mais esparsa.

Relativamente à classe de culturas permanentes de folha caduca (242), podemos verificar que esta

se confunde com as classes de culturas de sequeiro (21), culturas permanentes de folha perene (241)

e vegetação arbustiva (34). A mistura da classe de culturas permanentes de folha caduca com as

classes de culturas de sequeiro e de culturas permanentes de folha perene, está relacionada com o

facto de estas classes estarem muito próximas entre si em termos espectrais (Figura 24). A confusão

relativa à classe de vegetação arbustiva, pode ser explicado pelo facto de as unidades amostrais

recolhidas para o treino do classificador, serem homogéneas e densas, não representando áreas de

vegetação arbustiva mais abertas que também existem na realidade, sendo semelhantes às unidades

amostrais recolhidas para a classe de culturas permanentes de folha caduca.

Observando a Tabela 11, podemos verificar que tanto as classes de floresta de resinosas aberta

(322), como de floresta mista aberta (332) se confundem com as classes de floresta de resinosas

fechada (321) e vegetação arbustiva (34). Este facto pode ser explicado pela proximidade entre todas

estas classes em termos espectrais (Figura 24), originando erros de classificação.

Em relação às classe de vegetação herbácea (35) e vegetação esparsa (36), podemos verificar

através da análise da Tabela 11, que estas se misturam na sua grande maioria com a classe de

vegetação arbustiva (34). De facto, esta mistura está relacionada com a possibilidade de mesmo nas

unidades amostrais de treino existirem ambas estas classes em algumas situações. Por vezes é difícil

distinguir entre vegetação herbácea (35) e vegetação arbustiva (34) através de imagens aéreas,


76

nomeadamente em zonas com uma elevada densidade, pois para se considerar uma amostra como

vegetação herbácea, a vegetação existente na unidade amostral não poderá ter mais de 30 cm, o que

através de imagens aéreas não é possível. Em relação à confusão da vegetação esparsa com a

classe de vegetação arbustiva, este facto está relacionado com a dificuldade em determinar o limiar

de percentagem de coberto, para o foto-intérprete decidir sobre qual das classes introduzir na

unidade amostral de referência. Analisando a Tabela 7, podemos verificar que esta classe foi foto-

interpretada na grande maioria das vezes com muito pouca confiança, o que vem salientar o aspecto

anteriormente descrito. Esta explicação pode também ser dada para a confusão que existe na classe

de solo nú (6), que foi confundida com as classes de vegetação esparsa (36) e vegetação arbustiva

(34), pois a classe de solo nú, foi também muitas vezes foto-interpretada com pouca confiança

(Tabela 7), devido à dificuldade em definir o limiar da percentagem de coberto.

4.4.2 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de confusão, relativamente aos índices e classes de mosaico da base de dados de referência

De seguida, apresenta-se a avaliação da exactidão (Tabela 12) para os casos particulares de

unidades amostrais classificadas como mosaico e sem mosaico, tendo como objectivo perceber se os

erros poderão estar de alguma forma ligados com a classificação do mapa em unidades amostrais

foto-interpretadas como mosaicos ou não.

Observando a Tabela 12, podemos verificar que foi obtida uma exactidão global de 38,7% para o

caso das amostras que não foram classificadas como mosaico, enquanto que avaliando a exactidão

apenas com amostras classificadas como mosaico, a exactidão desceu para os 33,6%. Estes

resultados já eram esperados, pois as classes de mosaico possuem uma mistura espectral mais

elevada e consequentemente existe uma maior probabilidade de erro por parte do classificador que

não foi treinado para as classes de mosaico exactamente devido à elevada mistura espectral que as

classes de mosaico possuem. No entanto, esta diferença não é tão elevada como esperaríamos. Este

aspecto leva a crer que a existência de mosaicos pode não originar tantos erros como esperaríamos.

No entanto, é de salientar que em determinadas classes não se verifica a tendência anteriormente

descrita. São os casos relativos às classes de culturas permanentes (241 e 242), floresta mista

fechada (331) e vegetação herbácea (35). Ou seja, para estas classes, não podemos afirmar que os

erros estejam associados a unidades amostrais classificadas como mosaico.


77

Tabela 12. Exactidão global da cartografia sem amostras classificadas como mosaicos e só com amostras classificadas como mosaicos.

Sem mosaico Com mosaico Classes N

Total C E.U. (%) Total C E.U. (%)

11 16 13 8 61,5 3 0 0,0

12 90 50 28 56,0 40 20 50,0

21 56 45 35 77,8 11 5 45,5

22 104 44 24 54,5 60 28 46,7

23 40 22 14 63,6 18 3 16,7

241 238 134 11 8,2 104 15 14,4

242 153 71 5 7,0 82 11 13,4

311 65 39 19 48,7 26 8 30,8

312 193 134 33 24,6 59 6 10,2

321 25 24 24 100,0 1 1 100,0

322 58 44 6 13,6 14 1 7,1

331 126 79 27 34,2 47 18 38,3

332 113 61 5 8,2 52 2 3,8

34 88 65 35 53,8 23 8 34,8

35 104 54 7 13,0 50 7 14,0

36 73 51 7 13,7 22 0 0,0

6 25 18 1 5,6 7 0 0,0

Total 1567 948 289 619 133

E.G. (%) 30,5 21,5 Legenda: N: nº total de unidades amostrais classificadas no mapa para cada classe

C: nº de unidades amostrais da referência em concordância com o mapa produzido



Na Tabela 13, apresenta-se a exactidão global e do utilizador, para os casos particulares de unidades

amostrais classificadas sem serem mosaicos e para cada uma das classes de mosaico

individualmente, tendo como objectivo perceber se os erros poderão estar de alguma forma

relacionados com a classificação do mapa em unidades amostrais classificadas como uma

determinada classe de mosaico.

Relativamente à análise das amostras classificadas em cada uma das classes de mosaico

individualmente, podemos verificar que a classe de mosaico agrícola obteve uma exactidão de

34,2%, a classe de mosaico de vegetação 20,8% e a classe de mosaico de áreas agrícolas/áreas de

vegetação/áreas artificiais 19,3%. Os resultados obtidos para cada uma destas classes já eram

esperados.


78

Tabela 13. Exactidão global da cartografia sem amostras classificadas como mosaico, como mosaico de áreas agrícolas, como mosaico de vegetação e como mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais.

Sem mosaico Mosaico de áreas agrícolas

Mosaico de áreas com vegetação

Mosaico de áreas agrícolas/áreas de

vegetação/áreas artificiaisClasses N

Total C E.U. (%) Total C E.U. (%) Total C E.U. (%) Total C E.U. (%)

11 16 13 8 61,5 0 0 0,0 0 0 0,0 3 0 0,0

12 90 50 28 56,0 0 0 0,0 2 0 0,0 38 20 52,6

21 56 45 35 77,8 4 2 50,0 0 0 0,0 7 3 42,9

22 104 44 24 54,5 11 6 54,5 1 0 0,0 48 22 45,8

23 40 22 14 63,6 2 1 50,0 1 0 0,0 15 2 13,3

241 238 134 11 8,2 16 8 50,0 12 0 0,0 76 7 9,2

242 153 71 5 7,0 25 9 36,0 5 0 0,0 52 2 3,8

311 65 39 19 48,7 2 0 0,0 15 6 40,0 9 2 22,2

312 193 134 33 24,6 7 0 0,0 20 3 15,0 32 3 9,4

321 25 24 24 100,0 0 0 0,0 1 1 100,0 0 0 0,0

322 58 44 6 13,6 1 0 0,0 8 0 0,0 5 1 20,0

331 126 79 27 34,2 0 0 0,0 23 11 47,8 24 7 29,2

332 113 61 5 8,2 4 0 0,0 19 0 0,0 29 2 6,9

34 88 65 35 53,8 1 0 0,0 9 4 44,4 13 4 30,8

35 104 54 7 13,0 3 0 0,0 25 7 28,0 22 0 0,0

36 73 51 7 13,7 0 0 0,0 12 0 0,0 10 0 0,0

6 25 18 1 5,6 0 0 0,0 1 0 0,0 6 0 0,0

Total 1567 948 289 76 26 154 32 389 75

E.G. (%) 30,5 34,2 0 20,8 0 19,3 Legenda: N: nº total de unidades amostrais classificadas no mapa para cada classe




No caso da classe de mosaico de áreas agrícolas, esta só pode ser composta por uma combinação

de quatro classes de ocupação do solo (culturas de sequeiro, culturas de regadio, culturas

permanentes de folha perene e culturas permanentes de folha caduca), o que faz com que esta seja

a classe de mosaico com uma possibilidade de mistura espectral menor e desta forma a diversidade

de classes possíveis é menor, como também o erro. Outro aspecto que importa realçar em relação a

esta classe de mosaico é o facto de, no geral, as culturas de regadio no mês de Agosto ainda se

encontrarem no campo, ao contrário das culturas de sequeiro que já foram retiradas. Assim sendo,

estas duas classes apresentam em Agosto características completamente distintas, o que implica

necessariamente reflectâncias muito distintas entre ambas as classes e consequentemente chegam

ao sensor sinais completamente distintos.

Relativamente à classe de mosaico de vegetação, já foram obtidos resultados inferiores. Este aspecto

pode ser explicado pelo facto de esta classe poder ser constituída por uma combinação de nove

classes de ocupação do solo (floresta de folhosas fechada, floresta de folhosas aberta, floresta de

resinosas fechada, floresta de resinosas aberta, floresta mista aberta, floresta mista fechada,


79

vegetação arbustiva, vegetação herbácea, vegetação esparsa), o que implica uma elevada mistura

espectral nesta classe de ocupação do solo. Para além deste aspecto a inclusão na nomenclatura de

classes florestais com um grau de coberto reduzido, permite que o sub coberto (vegetação arbustiva

ou vegetação herbácea) transmita também bastante sinal, havendo assim uma maior mistura

espectral e aumentando assim a probabilidade de erro por parte do classificador.

O mosaico de áreas agrícolas/vegetação/áreas artificiais, foi a classe de mosaico que obteve os

piores resultados, pois esta classe permite uma combinação entre todas as classes de ocupação do

solo, sendo assim a classe de mosaico em que a mistura espectral é mais elevada. No entanto,

esperaríamos uma exactidão global muito mais reduzida quando comparada com a exactidão da

classe de mosaico de áreas com vegetação.

É também importante salientar que a tendência verificada após a análise da Tabela 12,

nomeadamente em relação às classes de culturas permanentes de folha caduca e floresta mista

fechada, já não é tão óbvia quando analisadas as classes de mosaico em particular. Podemos

verificar através da análise da Tabela 13 que quando analisamos as classes mencionadas,

relativamente à classe de mosaico de áreas agrícolas/vegetação/áreas artificiais que há um

decréscimo da exactidão para estas classes. Podemos assim concluir que para estas classes, o erro

poderá estar associado a esta classe de mosaico, apesar de quando analisamos as classes de

mosaico no geral, este aspecto não se verificar.

De seguida apresenta-se na Tabela 14, a exactidão global e do utilizador para cada um dos índices

de confiança atribuídos às unidades amostrais. Pretendemos com esta análise verificar se existe

relação entre o nível de confiança atribuído às unidades amostrais e os erros na classificação do

mapa.

Analisando a Tabela 14, podemos verificar que a exactidão global é muito mais elevada quando

avaliamos a exactidão apenas com amostras classificadas com muita confiança (41,1%). Por outro

lado a exactidão da classificação com amostras classificadas com confiança parcial, foi de 25,7% e a

exactidão apenas com amostras classificadas com pouca confiança foi de 20,3%. Esta tendência já

era esperada, pois à medida que a confiança na atribuição das classes de ocupação do solo em cada

amostra por parte do foto-intérprete vai diminuindo, significa que existe uma maior mistura entre

classes de ocupação do solo e uma maior dificuldade na atribuição de uma determinada classe. Este

aspecto implica necessariamente uma maior dificuldade por parte do classificador automático em

atribuir a classe de ocupação do solo correcta. No caso de amostras em que na referência foi

atribuída confiança parcial ou pouca confiança na atribuição da classe de ocupação do solo, isto

sugere que mais do que uma classe de ocupação do solo foi atribuída a essas mesmas amostras.


80

Tabela 14. Exactidão global da cartografia para cada um dos índices de confiança.

Muita confiança Confiança parcial Pouca confiança Classes

N Total C E.U. (%) Total C E.U. (%) Total C E.U. (%)

11 16 11 7 63,6 1 0 0,0 4 1 25,0

12 90 38 23 60,5 22 13 59,1 30 12 40,0

21 56 23 20 87,0 15 11 73,3 18 9 50,0

22 104 31 18 58,1 23 13 56,5 50 21 42,0

23 40 14 11 78,6 9 2 22,2 17 4 23,5

241 238 51 9 17,6 42 2 4,8 145 15 10,3

242 153 32 5 15,6 33 3 9,1 88 8 9,1

311 65 22 15 68,2 13 4 30,8 30 8 26,7

312 193 37 3 8,1 47 14 29,8 109 22 20,2

321 25 22 22 100,0 0 0 0,0 3 3 100,0

322 58 19 1 5,3 11 2 18,2 28 4 14,3

331 126 33 15 45,5 26 5 19,2 67 25 37,3

332 113 18 0 0,0 21 1 4,8 74 6 8,1

34 88 29 21 72,4 15 7 46,7 44 15 34,1

35 104 16 1 6,3 16 2 12,5 72 11 15,3

36 73 18 1 5,6 12 1 8,3 43 5 11,6

6 25 4 0 0,0 5 0 0,0 16 1 6,3

Total 1567 418 172 311 80 838 170

E.G. (%) 41,1 25,7 20,3 Legenda: N: nº total de unidades amostrais classificadas no mapa para cada classe




No entanto, existem classes de ocupação do solo que não seguem este padrão, nomeadamente as

classes de floresta mista aberta (332), vegetação herbácea (35), vegetação esparsa (36) e solo nú

(6), ou seja possuem maiores índices de exactidão em amostras classificadas com pouca confiança e

menores índices de exactidão em amostras classificadas com muita confiança. Relativamente à maior

exactidão das amostras classificadas com pouca confiança, este facto sugere que o classificador

acertou aleatoriamente na classe atribuída pelo foto-intérprete, ou seja, como o foto-intérprete teve

muitas dúvidas a atribuir uma classe de ocupação de solo a essas amostras, estas poderiam ter sido

classificadas como outra classe qualquer que não aquela atribuída pelo foto intérprete. De facto estas

classes possuem valores de exactidão do utilizador muito reduzidos (Tabela 11. Matriz de confusão

(Classificação do mapa VS CMP 1 das amostras de referência). o que sugere que o classificador não consegue

descriminar estas classes, pois estas estão muito próximas em termos espectrais (Figura 24). É

assim necessário relembrar que amostras classificadas com muita confiança são muito semelhantes

às amostras de treino recolhidas na fase de treino, o que explica esta exactidão reduzida

relativamente a estas classes em amostras classificadas com muita confiança.


81

Relativamente à Tabela 15, apresenta-se a exactidão global e do utilizador para cada um dos índices

de localização atribuídos às amostras. Pretendemos com esta análise verificar se existe relação entre

o índice de localização atribuído às amostras e os erros na classificação do mapa.

Tabela 15. Exactidão global da cartografia para cada um dos índices de localização.

Heterogéneo No limite Homogéneo Classes

N Total C E.U. (%) Total C E.U. (%) Total C E.U. (%)

11 16 6 3 50,0 5 0 0,0 5 5 100,0

12 90 33 17 51,5 31 14 45,2 26 17 65,4

21 56 8 5 62,5 16 9 56,3 32 26 81,3

22 104 41 21 51,2 43 19 44,2 20 12 60,0

23 40 14 1 7,1 13 5 38,5 13 11 84,6

241 238 101 10 9,9 77 10 13,0 60 6 10,0

242 153 75 11 14,7 40 3 7,5 38 2 5,3

311 65 23 6 26,1 27 12 44,4 15 9 60,0

312 193 66 6 9,1 54 12 22,2 73 21 28,8

321 25 1 1 100,0 4 4 100,0 20 20 100,0

322 58 20 2 10,0 16 3 18,8 22 2 9,1

331 126 53 20 37,7 52 18 34,6 21 7 33,3

332 113 53 5 9,4 34 0 0,0 26 2 7,7

34 88 33 19 57,6 30 10 33,3 25 14 56,0

35 104 50 6 12,0 35 5 14,3 19 3 15,8

36 73 20 2 10,0 23 1 4,3 30 4 13,3

6 25 7 0 0,0 6 0 0,0 12 1 8,3

Total 1567 604 135 506 125 457 162

E.G. (%) 22,4 24,7 35,4 Legenda: N: nº total de unidades amostrais classificadas no mapa para cada classe




Analisando a Tabela 15, podemos verificar que houve uma maior concordância entre as amostras e a

classificação do mapa, nas amostras classificadas como estando localizadas em zonas homogéneas

(45,5%). Por outro lado as amostras com índice de localização no limite entre duas ocupações de

solo obtiveram uma concordância de 34,2% e as amostras localizadas em zonas heterogéneas uma

concordância de 32,1%. Este aumento da concordância de zonas mais heterogéneas para zonas

homogéneas já era esperado, pois se tiver ocorrido algum deslocamento dos pixels do mapa

produzido, a amostra correspondente a esse pixel irá conter a classificação de um dos pixels

envolventes e não a classificação do pixel central. Este facto também sugere que se houver algum

tipo de deslocamento do mapa produzido, este não é muito grave, pois existe uma maior exactidão

em amostras com uma envolvente homogénea. É de salientar que amostras classificadas no limite

são menos heterogéneas que amostras classificadas como heterogéneas, pois o número de classes


82

de ocupação do solo na zona envolvente é superior (no limite são duas e em zonas heterogéneas

podem ser mais que duas).

No entanto, é de salientar que mais uma vez nem todas as classes de ocupação do solo seguem este

padrão, nomeadamente as classes de culturas permanentes de folha caduca (242), floresta de

resinosas aberta (322), floresta mista fechada (331), floresta mista aberta (332). Julgamos que este

aspecto esteja associado com o facto de o classificador não conseguir descriminar estas classes, o

que pode ser verificado na Tabela 11, através da análise da exactidão do utilizador para cada classe.

De facto as amostras de treino foram recolhidas em áreas homogéneas, sendo assim de esperar que

estas áreas fossem bem classificadas, o que não aconteceu. Assim sendo, o maior valor de exactidão

do utilizador destas classes em áreas heterogéneas, deve-se à aleatoriedade da classificação, tendo

sido uma questão de sorte estarem correctamente classificadas.

4.4.3 Avaliação da qualidade da cartografia de ocupação do solo através de funções fuzzy

Neste sub-capítulo avalia-se a qualidade do mapa produzido através de funções fuzzy, pretendendo-

se analisar a distribuição e natureza do erro, a gravidade do erro e a confiança na classificação, a

origem do erro e a natureza do erro e verificar que classes de ocupação do solo contribuem mais

para cada um dos tipos de erro mencionados, como também relacioná-los com a análise estatística

da base de dados e a análise exploratória da imagem que serviu de base para a produção do mapa

de ocupação do solo.

4.4.3.1 Distribuição e natureza do erro

Na Tabela 16, apresenta-se a distribuição e natureza do erro, pretendendo-se com esta análise

verificar se existe uma melhoria da exactidão, quando se avalia a exactidão considerando uma

determinada classe como sendo acertada na classificação do mapa, ou seja quando a classificação

no mapa, está em concordância com a CMP 1 ou CMP 2.

Analisando a função MAX, ou seja, a frequência de amostras correctamente classificadas em que a

classe de ocupação do solo atribuída à CMP 1 corresponde à classe do mapa, podemos verificar que

a exactidão global é de 23,1%, tal como na Tabela 11. Já a função RIGHT, ou seja, a frequência de

amostras correctamente classificadas em que a classe de ocupação do solo atribuída à CMP 1 ou à

CMP 2 corresponde à classificação do mapa, podemos verificar que a exactidão global é de 33%.

Estes valores indicam no caso da função MAX que em 23,1% das unidades amostrais, foram

atribuídas pelo foto-intérprete, classes de ocupação do solo que correspondem à melhor escolha para

essas mesmas unidades amostrais, ou seja, as classes atribuídas à CMP 1. Já no caso da função

RIGHT, 33% das unidades amostrais foram classificadas pelo foto-intérprete como sendo pelo menos


83

aceitáveis, ou seja, amostras às quais foram atribuídas na CMP 1 ou na CMP 2 classes de ocupação

do solo distintas.

Tabela 16. Análise da exactidão temática utilizando as funções MAX e RIGHT.

MAX RIGHT Melhoria Classes N

n Concordância (%) n Concordância (%) n R – M (%) Áreas (pesos)

11 16 8 50,0 8 50,0 0 0,0 0,0031

12 90 48 53,3 63 70,0 15 16,7 0,0304

21 56 40 71,4 44 78,6 4 7,1 0,0417

22 104 52 50,0 61 58,7 9 8,7 0,0412

23 40 17 42,5 17 42,5 0 0,0 0,0101

241 238 26 10,9 40 16,8 14 5,9 0,2013

242 153 16 10,5 25 16,3 9 5,9 0,1105

311 65 27 41,5 30 46,2 3 4,6 0,0494

312 193 39 20,2 76 39,4 37 19,2 0,1448

321 25 25 100,0 25 100,0 0 0,0 0,0035

322 58 7 12,1 12 20,7 5 8,6 0,0482

331 126 45 35,7 55 43,7 10 7,9 0,0665

332 113 7 6,2 13 11,5 6 5,3 0,0685

34 88 43 48,9 57 64,8 14 15,9 0,0468

35 104 14 13,5 30 28,8 16 15,4 0,0720

36 73 7 9,6 12 16,4 5 6,8 0,0467

6 25 1 4,0 7 28,0 6 24,0 0,0152

Total 1567 422 575 153 1

E.G.(%) 26,9 36,7 9,8

E.G. pesos (%) 23,1

33,0

9,9

Legenda:

N: nº total de unidades amostrais classificadas no mapa para cada classe

n: nº de unidades amostrais na diagonal das matrizes


É de salientar que estes valores de exactidão foram calculados tendo em conta o peso da área

relativa a cada classe, tal como na Tabela 11. A exactidão global de 26,9% e 36,7%, para as funções

MAX e RIGHT, respectivamente, tratam o método de amostragem como sendo aleatório. No entanto,

como já foi explicado na metodologia deste trabalho, a amostragem utilizada para a avaliação da

exactidão do mapa produzido, foi uma amostragem estratificada e por esse motivo calculou-se a

exactidão global com os pesos relativos a cada estrato (classe de ocupação do solo). A utilização

deste método é menos enviesado do que o método utilizado para o cálculo da exactidão global

quando se realiza uma amostragem aleatória simples, pois permite o cálculo dos índices de exactidão

com intervalos de confiança mais reduzidos.


84

Podemos assim verificar que houve globalmente uma melhoria de 9,9%, quando foi utilizada a função

RIGHT. Assim sendo a utilização destas duas funções em conjunto permite uma análise mais

detalhada de matrizes de confusão elaboradas com a função MAX e RIGHT em separado.

Relativamente à análise ao nível da classe, verificámos que para as classes de áreas artificiais

contínuas (11), arrozais (23) e floresta de resinosas fechada (321), não houve uma melhoria nestas

classes entre as funções MAX e RIGHT. Este aspecto deve-se ao facto de, relativamente às classes

de áreas artificiais contínuas e arrozais, terem uma elevada frequência de unidades amostrais

classificadas com índice de confiança máximo (Tabela 7. Frequência de cada classe de ocupação de solo

relativamente aos índices de confiança., ou seja, unidades amostrais classificadas com apenas uma classe

de ocupação do solo. Relativamente à classe de floresta de resinosas fechada esta não melhorou,

pois relativamente à função MAX, esta classe apresenta uma exactidão de 100%, sendo impossível

haver uma melhoria quando é avaliada a exactidão com a função RIGHT. Por outro lado, as classes

de áreas artificiais descontínuas (12), floresta de folhosas aberta (312), vegetação arbustiva (34),

vegetação esparsa (36) e solo nú (6), obtiveram melhorias na exactidão, pois são classes que na sua

constituição têm elementos que surgem em mais do que uma classe homogénea e portanto podem

ser correctamente classificadas numa dessas classes.

As classes com uma menor exactidão, analisando a função MAX, são as classes de culturas

permanentes de folha perene (241), culturas permanentes de folha caduca (242), floresta de folhosas

aberta (312), floresta de resinosas aberta (322), floresta mista aberta (332), vegetação herbácea (35),

vegetação esparsa (36) e solo nú (6). Esta menor exactidão, está relacionada com o facto de todas

estas classes terem elevada frequência de unidades amostrais às quais foi atribuída pouca confiança,

ou seja, o foto-intérprete atribuiu pouca confiança à classe principal, o que indica que estas classes

se encontram muito misturadas com pelo menos mais uma ocupação do solo. Importa salientar os

resultados da função MAX, que para as classes de povoamentos florestais abertos são muito

reduzidos, o que põem em evidencia a mistura espectral provocada pela influência do sub coberto no

sinal captado pelo sensor. Todas estas classes melhoram quando é utilizada a função RIGHT. Este

facto já era esperado, pois quando aplicamos a função RIGHT, estamos a ter em conta a

possibilidade da classe de ocupação do solo secundária, estar também correcta, havendo assim um

aumento da exactidão destas classes, apesar de estas se encontrarem em locais com mais do que

uma ocupação do solo. As classes com muito pouca fiabilidade, são as classes relativas de culturas

permanentes de folha perene, culturas permanentes de folha caduca, floresta mista aberta e

vegetação esparsa que mesmo com a utilização da função RIGHT, a sua exactidão continua muito

reduzida.

4.4.3.2 Gravidade do erro e confiança na classificação

Analisando agora a Tabela 17, pretendemos verificar que classes de ocupação do solo possuem

erros mais graves como também uma confiança na classificação mais elevada.


85

Tabela 17. Análise da exactidão temática utilizando a função DIFFERENCE.

Não concordância (%) Concordância (%) Classes N

-7 -6 -5 -4 -3 -2 -1 0 Moda

11 16 25,0 6,3 18,8 0,0 0,0 6,3 0,0 43,8 0

12 90 16,7 4,4 8,9 11,1 5,6 13,3 14,4 25,6 0

21 56 5,4 3,6 12,5 3,6 3,6 16,1 19,6 35,7 0

22 104 12,5 4,8 24,0 3,8 4,8 20,2 12,5 17,3 -5

23 40 7,5 17,5 32,5 0,0 0,0 10,0 5,0 27,5 -5

241 238 17,6 16,0 49,6 5,0 0,8 6,3 0,8 3,8 -5

242 153 17,6 19,0 47,1 5,2 0,7 5,2 2,0 3,3 -5

311 65 10,8 12,3 30,8 3,1 1,5 12,3 6,2 23,1 -5

312 193 17,6 11,9 31,1 14,0 5,2 11,4 7,3 1,6 -5

321 25 0,0 0,0 0,0 0,0 0,0 12,0 0,0 88,0 0

322 58 31,0 15,5 32,8 8,6 0,0 6,9 3,4 1,7 -5

331 126 14,3 15,9 26,2 7,1 0,8 19,8 4,0 11,9 -5

332 113 15,9 16,8 55,8 4,4 0,9 5,3 0,9 0,0 -5

34 88 9,1 2,3 23,9 9,1 6,8 17,0 8,0 23,9 -5

35 104 14,4 10,6 46,2 12,5 2,9 10,6 1,9 1,0 -5

36 73 23,3 13,7 46,6 5,5 1,4 6,8 1,4 1,4 -5

6 25 16,0 20,0 36,0 24,0 0,0 4,0 0,0 0,0 -5

Total 1567 15,7 12,3 35,3 7,3 2,4 10,8 5,1 11,0

Legenda:

N: nº total de unidades amostrais classificadas no mapa para cada classe

0: confiança na classificação elevada

-1: confiança na classificação elevada

-2: confiança na classificação aceitável

-3: confiança na classificação reduzida

-4: confiança na classificação muito reduzida

-5: erro aceitável

-6: erro grave

-7: erro muito grave

Observando a Tabela 17, podemos verificar que relativamente à gravidade do erro, as classes com

mais erros, correspondem às classes de culturas permanentes de folha perene (241), culturas

permanentes de folha caduca (242), floresta de resinosas aberta (322), floresta mista aberta (332),

vegetação esparsa (36) e solo nú (6). Todas estas classes apresentam assim erros que na sua

maioria estão relacionados com o facto de maior parte das unidades amostrais terem sido

incorrectamente classificadas pelo classificador, facto este que pode ser observado na Tabela 11,

através dos índices do utilizador, os quais são muito reduzidos para as classes mencionadas.

No entanto, é de salientar que todas estas classes, à excepção da classe de floresta de resinosas

aberta (322), apresentam erros aceitáveis, ou seja amostras nas quais o mapa não concorda com a

referência, mas às quais foi atribuída pouca confiança à classe da referência por parte do foto-


86

intérprete. No caso da classe de floresta de resinosas aberta (322), os erros encontram-se igualmente

repartidos pelo tipo de erro anteriormente referido e pelos erros muito graves, os quais correspondem

a amostras nas quais o mapa não concorda com a referência, mas às quais foi atribuída muita

confiança à classe da referência por parte do foto-intérprete. Tal como a classe de floresta de

resinosas aberta, as classes de culturas permanentes (241 e 242), povoamentos florestais abertos

(312 e 332), vegetação herbácea (35), vegetação esparsa (36) e solo nú (6), apresentam erros

graves, ou seja, são classes que estão mal classificadas em zonas muito bem identificadas pelo foto-

intérprete, indicando que há dificuldade em discriminarem-se espectralmente através do algoritmo da

Máxima Verosimilhança. Estes resultados revelam que pode ser necessária uma remodelação da

nomenclatura, com o intuito de minimizar estes erros graves.

Já as classes de culturas de regadio (22), arrozais (23), floresta de folhosas fechada (311) e floresta

mista fechada (331), são classes que de certa forma são facilmente identificadas pelo foto-intérprete

e bem classificadas pelo classificador, e o erro só surge em zonas em que o foto-intérprete tem

dúvidas na atribuição de uma classe de ocupação do solo. Portanto, podemos afirmar que os erros

nestas classes estão principalmente relacionados com a incerteza na elaboração da base de dados

de referência, ou seja, na validação. Analisando a Tabela 14, podemos corroborar a nossa afirmação,

pois estas classes têm uma reduzida exactidão do utilizador nas unidades amostrais classificadas

com pouca confiança.

Relativamente à confiança na classificação das classes de ocupação do solo do mapa produzido, as

classes com maior confiança, são as classes relativas às áreas artificiais contínuas (11), áreas

artificiais descontínuas (12), culturas de sequeiro (21), floresta de resinosas fechada (321) e

vegetação arbustiva (34), ou seja, todas estas classes apresentam um elevado número de unidades

amostrais correctamente classificadas, às quais foi atribuída muita confiança por parte do foto-

intérprete. Todas estas classes apresentam também índices de exactidão do utilizador elevados,

como pode ser observado na Tabela 11. O utilizador poderá assim depositar maior confiança em

áreas classificadas no mapa como pertencendo às classes acima referidas.


Na Tabela 18, apresenta-se a função MEMBERSHIP, com a qual pretendemos verificar se o erro está

associado a áreas em que a paisagem é heterogénea, ou seja, unidades amostrais às quais foi

atribuída mais do que uma classe de ocupação do solo ou então se estarão ligados ao facto do

classificador não conseguir discriminar determinadas classes. Pretendemos também identificar as

classes de ocupação do solo que surgem com maior frequência como única classe de ocupação do

solo, ou em conjunto com outra classe.

Analisando a Tabela 18, podemos verificar que as unidades amostrais nas quais foi apenas atribuída

uma classe de ocupação do solo, foram as que obtiveram melhores resultados com uma


87

concordância de 41,1%. Por outro lado, a concordância obtida com as unidades amostrais

classificadas com duas classes de ocupação do solo foi inferior (35,1%). Contrariamente ao que era

esperado, as amostras classificadas com duas classes, são as que apresentam uma menor

concordância apesar de terem uma maior hipótese de concordância com a classificação do mapa

devido ao efeito da aleatoriedade. No entanto estas unidades amostrais têm uma maior mistura

espectral, pois são compostas por mais do que uma classe de ocupação do solo e diferem assim das

assinaturas espectrais recolhidas na fase de treino para treinar o classificador.

Tabela 18. Análise da exactidão temática utilizando a função MEMBERSHIP.

Duas classes Uma classe Classes N

Total C f (%) E. U. (%) Total C f (%) E. U. (%)

11 16 5 1 31,3 20,0 11 7 68,8 63,6

12 90 52 40 57,8 76,9 38 23 42,2 60,5

21 56 33 24 58,9 72,7 23 20 41,1 87,0

22 104 73 43 70,2 58,9 31 18 29,8 58,1

23 40 26 6 65,0 23,1 14 11 35,0 78,6

241 238 187 31 78,6 16,6 51 9 21,4 17,6

242 153 121 20 79,1 16,5 32 5 20,9 15,6

311 65 43 15 66,2 34,9 22 15 33,8 68,2

312 193 156 73 80,8 46,8 37 3 19,2 8,1

321 25 3 3 12,0 100,0 22 22 88,0 100,0

322 58 39 11 67,2 28,2 19 1 32,8 5,3

331 126 93 40 73,8 43,0 33 15 26,2 45,5

332 113 95 13 84,1 13,7 18 0 15,9 0,0

34 88 59 36 67,0 61,0 29 21 33,0 72,4

35 104 88 29 84,6 33,0 16 1 15,4 6,3

36 73 55 11 75,3 20,0 18 1 24,7 5,6

6 25 21 7 84,0 33,3 4 0 16,0 0,0

Total 1567 1149 403 73,3 418 172 26,7

E. G. (%) 35,1 41,1

Legenda:

N: nº total de unidades amostrais

C: nº de unidades amostrais do mapa produzido em concordância com a referência

f: frequência de cada classe


Analisando agora cada classe de ocupação do solo em pormenor, podemos verificar que as classes

com maior índice de exactidão quando surgem como classe única em cada unidade amostral,

correspondem às classes de áreas artificiais contínuas (11), áreas artificiais descontínuas (12),

culturas de sequeiro (21), culturas de regadio (22), arrozais (23) e povoamentos florestais fechados

(311, 321 e 331). Isto indica que estas classes de ocupação do solo são bem discriminadas pelo

classificador.


88

Pelo contrário, as classes de culturas permanentes (241 e 242), povoamentos florestais abertos (312,

322 e 332), vegetação herbácea (35), vegetação esparsa (36) e solo nú (6), têm índices de exactidão

muito reduzidos, indicando que estas classes não conseguem ser discriminadas pelo classificador.

Este facto sugere que estas classes deveriam ser agrupadas e consequentemente dar origem a uma

redefinição da nomenclatura proposta. Julgamos que o facto de estas classes apresentarem índices

de exactidão elevados quando surgem em conjunto com outra classe, à excepção das classes de

culturas permanentes, esteja relacionado com o efeito de aleatoriedade, pois todas estas classes

apresentam maior frequência de unidades amostrais em que surgem em conjunto com outra classe.

Este aspecto faz levantar outra questão que está relacionada com o facto destas classes surgirem

com maior frequência em conjunto com outra classe de ocupação do solo. Realmente as classes de

povoamentos florestais abertos, quando observadas em imagens aéreas, apresentam sempre sub-

coberto, quer seja constituído por classes agrícolas, de vegetação arbustiva ou vegetação herbácea.

Assim sendo estas classes, nunca deveriam ter sido foto-interpretadas com muita certeza, pois existe

sempre outra classe que pode estar também correcta numa determinada unidade amostral

classificada como floresta aberta. O mesmo se passa em relação às classes de vegetação herbácea,

vegetação esparsa e solo nú, pois estas classes são dificilmente distinguíveis através de imagens

aéreas, devido à dificuldade em determinar o limiar de percentagem que permite ao foto-intérprete

optar por uma ou por outra classe. Assim, também estas classes deveriam ter sido sempre foto

interpretadas com mais do que uma classe de ocupação do solo.

As classes de culturas permanentes, nem nesta situação anteriormente referida foram bem

identificadas pelo classificador, o que indica que estas classes são problemáticas em ambas as

situações, ou seja, quando surgem isoladas ou em conjunto.


De seguida apresentam-se na Tabela 19, as funções CONFUSION e AMBIGUITY. Com a função

CONFUSION, pretendemos verificar entre que classes existe maior confusão, sendo semelhante ao

número de unidades amostrais fora da diagonal da Tabela 11, mas em que para além de se assinalar

a classe de ocupação do solo principal que não foi correctamente classificada, assinala-se também a

classe de ocupação do solo alternativa que não foi correctamente classificada. Em relação à função

AMBIGUITY, pretendemos verificar entre que classes existe a maior ambiguidade, ou seja,

pretendemos verificar que classes foram correctamente classificadas, mas às quais na fase de

elaboração da base de dados de referência foi também atribuída uma classe de ocupação do solo

alternativa.


89

Tabela 19. Confusão e ambiguidade das classes de ocupação do solo utilizando as funções CONFUSION e AMBIGUITY.

Amostras de referência

11 12 21 22 23 241 242 311 312 321 322 331 332 34 35 36 6 NC

Classes

ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η ζ η

11 X X 11 1 1 1 1 1 1 16 1 12 30 7 X X 3 4 4 1 1 3 1 2 2 2 3 1 3 4 6 7 3 6 1 54 40 21 1 1 X X 2 3 4 2 2 1 3 2 2 5 5 11 3 1 24 24

22 10 12 12 7 X X 15 2 3 1 11 2 3 1 4 3 2 3 8 2 4 5 10 1 4 4 86 43

23 7 5 17 4 X X 1 1 1 1 2 6 2 1 1 3 46 6

241 1 1 23 4 87 10 17 5 X X 21 1 20 2 50 4 3 2 10 2 5 1 90 4 46 2 10 6 396 31

242 3 16 68 5 8 3 6 28 7 X X 11 26 4 1 2 1 1 44 3 26 1 6 6 256 20

311 1 5 1 3 1 X X 1 2 10 3 22 2 5 20 6 2 1 70 15

312 1 37 14 6 1 10 1 3 47 18 X X 12 11 1 6 13 3 56 27 24 8 2 6 234 73

321 X X 1 1 1 0 3

322 1 1 7 2 3 4 30 3 X X 4 7 29 7 3 2 92 11

331 6 1 4 3 1 3 1 1 4 10 2 6 1 36 12 4 X X 15 3 40 11 12 3 1 2 142 40

332 4 21 2 6 3 7 7 1 9 15 1 47 11 13 X X 40 7 14 2 2 1 200 13

34 3 1 2 1 1 6 1 7 1 5 4 16 4 6 4 9 1 1 7 X X 5 9 1 3 62 36

35 3 19 2 7 1 7 3 5 1 6 2 10 4 1 11 2 6 2 47 16 X X 16 2 4 148 29

36 7 4 1 2 2 6 7 1 8 7 3 4 55 6 15 X X 1 4 122 11

Cla

ssifi

caçã

o do

map

a

6 3 2 2 2 1 1 2 1 12 5 5 7 X X 36 7

Total 35 8 93 19 269 48 72 19 34 4 78 17 57 5 124 26 131 22 181 24 51 7 99 12 66 25 453 102 165 48 49 9 27 8 1984 403

Legenda:

ζ : CONFUSION

η : AMBIGUITY


90

Relativamente à função CONFUSION, podemos verificar que as classes com maior confusão são as

classes de culturas permanentes de folha perene (241), culturas permanentes de folha caduca (242),

floresta de folhosas aberta (312), floresta mista fechada (331), floresta mista aberta (332), vegetação

herbácea (35) e vegetação esparsa (36).

A classe de culturas permanentes de folha perene, confunde-se na sua grande maioria com as

classes de culturas de sequeiro (21), floresta de folhosas aberta (312), vegetação arbustiva (34) e

vegetação herbácea (35). Relativamente à confusão com as classes de culturas de sequeiro e

vegetação herbácea, está relacionada com o facto do sub-coberto da classe de culturas permanentes

de folha perene ser muito semelhante ao das classes referidas anteriormente, principalmente no mês

de Agosto, no qual as culturas de sequeiro já foram colhidas do campo, estando os terrenos

desprovidos de vegetação, tal como nos olivais que também têm o sub-coberto desprovido de

vegetação e que são representados pela classe de culturas permanentes de folha perene. A confusão

desta classe com a classe de culturas de sequeiro está também relacionada com o facto de estas

classes não estarem muito distantes entre si em termos espectrais, apesar de se encontrarem em

grupos diferentes (Figura 24). A confusão da classe de culturas permanentes de folha perene

relativamente à classe de vegetação arbustiva, julgamos que de alguma forma possa estar

relacionado com o treino efectuado para a classe de vegetação arbustiva no qual, foram recolhidas

amostras homogéneas que não representam todas as variações possíveis desta classe,

nomeadamente vegetação arbustiva mais esparsa. Relativamente à confusão da classe de culturas

permanentes de folha perene com a classe de floresta de folhosas aberta, está relacionada com a

grande semelhança do tipo de árvores que compõem estas duas classes. A classe de culturas

permanentes de folha perene representa na sua grande maioria o olival que é composto por folhosas

(oliveira), com um grau de coberto muito semelhante ao dos montados, que estão inseridos na classe

de floresta de folhosas aberta.

Analisando agora a classificação da classe de culturas permanentes de folha caduca (242), podemos

verificar que 68 amostras foram foto-interpretadas como culturas de sequeiro (21). Julgamos que esta

confusão esteja relacionada, mais uma vez, com a reflectância por parte do sub-coberto, pois este

tipo de culturas permanentes não possui uma componente vegetativa muito forte no mês de Agosto,

como pode ser observado na Figura 16, havendo bastante sinal que é proveniente do sub-coberto. O

aspecto anteriormente referido, pode também ser observado na Figura 24, onde se pode observar a

grande proximidade espectral que existe entre as classes de culturas permanentes de folha caduca e

culturas de sequeiro. Outra das grandes fontes de confusão da classe de culturas permanentes de

folha caduca, é com a classe de vegetação arbustiva (34), em que 44 amostras foram classificadas

como culturas permanentes de folha caduca. Este aspecto, pode ser explicado pelo facto de as

amostras recolhidas para o treino do classificador, serem homogéneas e densas, não representando

áreas de vegetação arbustiva mais abertas que também existem na realidade. Estas áreas de

vegetação arbustiva mais esparsa são assim bastante similares ao padrão das culturas permanentes


91

de folha caduca nomeadamente, mais concretamente a vinha que é plantada em linha e com

espaçamento, possuindo um porte bastante similar ao da vegetação arbustiva.

Em relação à classificação da classe de floresta de folhosas aberta (312), podemos observar que

houve bastante confusão (56 unidades amostrais) com a classe de vegetação arbustiva (34). Este

facto já era esperado, pois como se trata de povoamentos florestais abertos, é difícil por parte do foto-

intérprete determinar a percentagem para se considerar uma unidade amostral como sendo de

floresta aberta ou então como vegetação arbustiva. Por esta razão houve um número elevado de

amostras foto-interpretadas como vegetação arbustiva e que foram classificadas como floresta de

folhosas aberta, pois é possível que em muitas delas chegue ao sensor o sinal proveniente das

árvores e não do sub coberto. Esta confusão com a classe de vegetação arbustiva é também devida

à pouca distância espectral entre estas classes, facto este que pode ser observado na Figura 24. A

dificuldade em distinguir o limiar da percentagem, para se considerar um povoamento florestal aberto

ou fechado justifica também as 47 unidades amostrais classificadas como floresta de folhosas aberta

que foram foto-interpretadas como floresta de folhosas fechada (311). Analisando a Figura 24,

podemos verificar que estas classes se encontram muito próximas espectralmente existindo uma

forte possibilidade de se misturarem. Relativamente às 37 unidades amostrais foto-interpretadas

como culturas de sequeiro e às 24 unidades amostrais foto-interpretadas como vegetação herbácea,

e que foram classificadas como floresta de folhosas aberta, estão relacionadas com o facto de muitas

destas unidades amostrais serem relativas a sistemas agro-florestais (montados) que apesar do seu

reduzido número de árvores, poderá ter sido transmitido ao sensor essa componente arbórea e não a

componente relativa ao sub-coberto.

Relativamente à classificação da classe de floresta mista fechada (331), podemos verificar que existe

confusão com unidades amostrais foto-interpretadas como floresta de resinosas fechada (321) e

vegetação arbustiva (34). Como se pode observar na Figura 24, verificamos que as classes de

vegetação arbustiva e de floresta mista fechada se encontram muito próximas da classe de floresta

mista fechada em termos espectrais, o que justifica a confusão que existe entre estas classes.

Analisando também a Figura 16, podemos verificar que existe alguma sobreposição vertical entre a

classe de vegetação arbustiva e a classe de floresta mista fechada, o que indicia que estas classes

se possam misturar. No entanto, é necessário relembrar que o NDVI não foi utilizado para a

classificação da imagem de Agosto, senso essa análise apenas exploratória e indicadora em termos

espectrais, das classes com tendência para se misturarem.

A classe de floresta mista aberta (332), também se mistura na sua grande maioria, com as classes de

vegetação arbustiva (34) e floresta de resinosas fechada (321). Analisando a Figura 24, podemos

verificar que estas classes pertencem todas ao mesmo grupo, considerando uma distância entre

classes de 20 unidades, o que indica que existe uma elevada semelhança espectral entre estas

classes, havendo tendência para se misturarem entre si. A Figura 16 revela também, que a classe de

floresta mista aberta, possui uma elevada variabilidade intra-classe, sendo por isso de esperar um


92

elevado número de unidades amostrais incorrectamente classificadas. Esta confusão está também

relacionada, relativamente à classe de floresta de resinosas fechada, com o facto de haver

dificuldade por parte do foto-intérprete em determinar e distinguir a percentagem que determina que

um determinado povoamento florestal pertença a apenas um tipo de floresta, ou então seja uma

mistura de povoamentos florestais (tem que existir pelo menos 20% de outro tipo de floresta para se

considerar uma floresta mista). Esta dúvida na percentagem, acontece também com unidades

amostrais foto-interpretadas como vegetação arbustiva, devido ao facto do foto-intérprete ter

considerado que não existiam os 15% de coberto arbóreo, para considerar as unidades amostrais

como floresta mista aberta. No entanto, apesar dessa pequena percentagem de árvores, terá sido

emitido sinal suficiente para o sensor e daí as amostras terem sido classificadas como floresta mista

aberta.

Em relação às unidades amostrais classificadas como vegetação herbácea (35), verificamos que a

maioria da confusão está relacionada com unidades amostrais foto-interpretadas como vegetação

arbustiva (34). De facto a grande similaridade espectral entre ambas estas classes relativamente ao

NDVI (Figura 16), terá sido determinante para confusão que existe entre estas classes. Outro dos

factores que julgamos que esteja relacionado com esta confusão é a possibilidade de mesmo nas

amostras de treino existirem ambas estas classes em algumas situações. Por vezes é difícil distinguir

entre vegetação herbácea (35) e vegetação arbustiva (34) através de imagens aéreas,

nomeadamente em zonas com uma elevada densidade, pois para se considerar uma amostra como

vegetação herbácea, a vegetação existente na unidade amostral não poderá ter mais de 30 cm, o que

através de imagens aéreas não é possível. É de salientar também a confusão que existe com a

classe de vegetação esparsa (36) e as culturas de sequeiro (21). No caso da foto-interpretação da

classe de vegetação esparsa é muito difícil determinar o limiar entre vegetação herbácea e vegetação

esparsa, para além deste tipo de vegetação ser altamente dinâmico num curto espaço de tempo,

aumentando a possibilidade de erro devido às diferenças de data entre o mapa produzido e a data

das imagens aéreas utilizadas para elaborar a base de dados de referência. A Figura 24, revela

também que existe uma grande semelhança espectral entre estas classes, pois estas pertencem ao

mesmo grupo considerando uma distância de 20 unidades. Em relação à confusão com a classe de

culturas de sequeiro, esta deve-se ao facto de tanto esta classe como a classe de vegetação

herbácea serem muito semelhantes. No entanto, seria de esperar que a colheita destas culturas no

mês de Agosto permitisse uma maior distinção entre ambas as classes, pois como pode ser

observado na Figura 16, estas classes não se sobrepõem verticalmente.

Das amostras classificadas como vegetação esparsa (36), grande parte da confusão foi com a classe

de vegetação arbustiva (34). Como anteriormente referido, para o caso da vegetação herbácea (35)

este aspecto poderá estar relacionado com a dificuldade em determinar o limiar da percentagem por

parte do foto-intérprete, tanto na elaboração da base de dados de referência, como na recolha de

amostras de treino para treinar o classificador. Também o facto de pertencerem ao mesmo grupo na

Figura 24, explica a elevada semelhança espectral, acentuando a possibilidade de se misturarem.


93

Relativamente à função AMBIGUITY, podemos verificar através da análise da Tabela 19, que as

classes mais ambíguas são as classes de áreas artificiais descontínuas (12), culturas de regadio (22),

floresta de folhosas aberta (312), floresta mista fechada (331), vegetação arbustiva (34) e vegetação

herbácea (35). Este aspecto, pode ser observado na Tabela 14, onde se pode verificar um elevado

número de unidades amostrais correctamente classificadas com confiança parcial e com pouca

confiança para estas classes, indicando que apesar de estarem bem classificadas, essas unidades

amostrais foram também foto-interpretadas com outra classe de ocupação do solo.

Analisando agora as unidades amostrais classificadas como áreas artificiais descontínuas (12),

podemos verificar que sete unidades amostrais foram também foto-interpretadas como classe de

áreas artificiais contínuas (11). Este aspecto já era esperado, pois é normal que exista por parte do

foto-intérprete dúvida sobre a percentagem de áreas impermeabilizadas, ou seja, se uma

determinada unidade amostral tem percentagem suficiente ou não para pertencer à classe de áreas

artificiais descontínuas. O utilizador neste caso, deverá esperar que em áreas ambíguas entre as

classes de áreas artificiais descontínuas e contínuas, estas estejam classificadas como áreas

artificiais descontínuas. O aspecto referido anteriormente também se verifica para a ambiguidade

entre a classe de áreas artificiais descontínuas e as classes de vegetação arbustiva (34) e vegetação

herbácea (35).

Das amostras classificadas como culturas de regadio (22), podemos verificar que maior parte das

unidades amostrais ambíguas correspondem às classes de áreas artificiais descontínuas (12) e de

culturas de sequeiro (21). Assim sendo o utilizador deverá ter em atenção que em áreas ambíguas

foto-interpretadas como áreas artificiais descontínuas e culturas de sequeiro surjam no mapa como

culturas de regadio. Este facto não é de estranhar, pois muitas vezes é difícil discernir por parte do

foto-intérprete quando a classe de culturas de regadio deixa de o ser, para passar a ser uma área

artificial descontinua, devido à percentagem de ambas as áreas de cada classe ser de difícil

distinção. Este aspecto acontece muitas vezes devido a estas classes se encontrarem bastante

misturadas. Em relação à ambiguidade entre a classe de culturas de regadio e a classe de culturas

de sequeiro esta existe devido à dificuldade em distinguir estas classes através de imagens aéreas, à

excepção de imagens do mês de Agosto, em que as culturas de sequeiro já foram colhidas,

contrariamente ao que acontece em relação às culturas de regadio.

Relativamente à classe de floresta de folhosas aberta (312), esta possui uma elevada ambiguidade,

nomeadamente com as classes de culturas de sequeiro (21), floresta de folhosas fechada (311),

vegetação arbustiva (34) e vegetação herbácea (35). Esta ambiguidade relativa à classe de floresta

de folhosas aberta deve-se ao sub-coberto deste tipo de povoamentos. Nos montados teremos

ambiguidade com as culturas de sequeiro e vegetação herbácea, enquanto que em florestas de

produção, teremos como classe alternativa a classe de vegetação arbustiva, podendo também surgir

a classe de vegetação herbácea. A ambiguidade entre a classe de floresta de folhosas aberta e

fechada, deve-se ao facto de existir dificuldade na foto interpretação em determinar o limiar de


94

percentagem entre estas duas classes. Assim sendo, os utilizadores desta cartografia, deverão ter

em atenção que em áreas ambíguas foto-interpretadas como uma combinação da classe de floresta

de folhosas aberta, de floresta de folhosas fechada, vegetação arbustiva culturas de sequeiro e

vegetação herbácea, aparecerão no mapa produzido, classificadas como floresta de folhosas aberta.

Em relação à classe de floresta mista fechada (331), esta possui uma maior ambiguidade em

conjugação com as classes de floresta de resinosas fechada (321) e vegetação arbustiva (34). Por

um lado a ambiguidade relativa à classe de floresta de resinosas fechada, deve-se ao facto da

dificuldade por parte do foto-intérprete em conseguir discriminar o limiar de percentagem que

distingue um povoamento florestal misto de um povoamento florestal puro. Por outro lado, a

conjugação com a classe de vegetação arbustiva está relacionada com o facto de a classe de floresta

mista fechada ter uma elevada frequência de unidades amostrais classificadas como mosaico, como

pode observado na Tabela 9. Assim sendo, em áreas ambíguas foto-interpretadas como floresta

mista fechada em conjugação tanto com floresta de resinosas fechada e vegetação arbustiva,

aparecerão representadas no mapa produzido como floresta mista fechada.

A classe de vegetação arbustiva (34) possui amostras ambíguas com praticamente todas as outras

classes de ocupação do solo. No entanto, destaca-se a ambiguidade com a classe de vegetação

herbácea (35) e floresta mista aberta (332). Esta ambiguidade está relacionada com o facto de por

vezes ser complicado por parte do foto-intérprete conseguir discriminar o porte de ambas estas

classes, aspecto determinante para se optar por ou por outra classe. A ambiguidade com a classe de

floresta mista aberta, está relacionada com o facto dos povoamentos mistos abertos possuírem

também no sub-coberto vegetação arbustiva. Assim, os utilizadores em áreas ambíguas foto-

interpretadas como floresta mista aberta e vegetação herbácea deverão esperar que estas áreas

surjam no mapa como vegetação arbustiva.

Em relação à classe de vegetação herbácea (35), passa-se o oposto ao anteriormente referido para a

classe de vegetação arbustiva (34). No entanto, é de salientar um número mais elevado de unidades

amostrais que foram também foto-interpretadas como vegetação arbustiva, mas que foram

classificadas como vegetação herbácea (16 amostras). Assim sendo, será de esperar que em áreas

foto-interpretadas como vegetação herbácea e como vegetação arbustiva surjam classificadas no

mapa como vegetação herbácea.

Conclusão e recomendações

95

5. CONCLUSÃO E RECOMENDAÇÕES

Ao finalizarmos este trabalho interessa tecer algumas considerações acerca dos elementos

metodológicos que levaram à consecução dos objectivos a que nos propusemos inicialmente. Este

trabalho resulta da fusão de vários estudos paralelos, que consistentemente integrados, permitiram

uma análise mais aprofundada da origem, tratamento e eliminação de erros temáticos em cartografias

de ocupação do solo. De forma a reportar sumariamente as dificuldades sentidas ao longo da

elaboração deste trabalho e os principais resultados obtidos, abordamos de seguida passo a passo

as conclusões de cada etapa da abordagem metodológica que adoptamos.

Em relação à base de dados de referência, o facto de termos utilizado uma amostragem estratificada

com um elevado número de amostras, esteve relacionada com a pretensão de conseguirmos obter

valores de exactidão estatisticamente sólidos e válidos. Este elevado número de amostras que

tiveram de ser foto-interpretadas requereu um elevado esforço logístico (tempo e recursos), o que

nem sempre é possível. De toda a pesquisa bibliográfica realizada neste trabalho relacionada com a

avaliação da exactidão temática de cartografias de ocupação do solo, pudemos verificar que esta

base de dados destaca-se de grande parte dos trabalhos realizados pela sua dimensão. No entanto,

este elevado esforço apresenta para além da vantagem de permitir calcular os índices de exactidão

temática com intervalos de confiança reduzidos, o elevado número de amostras permite também uma

amostragem bem distribuída geograficamente pelo território de Portugal Continental. Assim sendo,

este último aspecto permitiu para além de uma análise das proporções de cada classe de ocupação

do solo no território de Portugal Continental, uma análise de quais destas classes foram foto-

interpretadas com maior ou menor certeza, a sua localização e inserção na paisagem portuguesa,

como também as que constituem mosaicos. Assim sendo, para além desta base de dados poder ser

utilizada para a avaliação da exactidão temática de cartografias de ocupação do solo, poderá também

vir a ser utilizada para estudos de fenómenos sociais, económicos e ambientais.

Após a analise global da base de dados de referência, verificamos que as classes mais

representadas, são as classes de mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais,

mosaico de vegetação e vegetação arbustiva. Nomeadamente as classes de mosaicos mais

representadas reflectem a elevada heterogeneidade e fragmentação das classes de ocupação do

solo em Portugal Continental. No entanto, é necessário referir que, como demonstrado por Carrão

(2002), a representação da paisagem portuguesa surge mais fragmentada quando são utilizadas

UMC inferiores a dez hectares, o que também pode ajudar a explicar esta elevada percentagem das

classes de mosaicos, pois para a elaboração da base de dados utilizamos uma UMC de nove

hectares. Assim sendo o maior ou menor número de mosaicos está dependente da escala de

representação da cartografia, indicando também que a nomenclatura adoptada, a esta escala não

garante uma discriminação aceitável das unidades de paisagem. Neste contexto, é assim necessário

para a utilização da nomenclatura LANDEO em cartografia derivada de imagens MERIS, fazer um


96

ajuste das classes de ocupação do solo utilizadas tendo em vista alcançar uma exactidão temática

mais precisa e que sirva melhor os utilizadores.

Abordando agora a análise do índice de certeza, pudemos verificar que a maior parte das amostras

foram classificadas com pouca confiança. A elevada frequência de mosaicos, pode estar assim

relacionada com uma maior incerteza na classificação por parte da equipa de foto-interpretação.

Para além deste aspecto a utilização de imagens uni-temporais, pode não ser a mais adequada para

a foto-interpretação de determinadas classes (e.g. culturas de sequeiro, culturas de regadio,

vegetação herbácea), devido à sua elevada dinâmica num único ano. É assim aconselhável que para

a elaboração de futuras bases de dados de referência sejam incluídas abordagens multi-temporais.

Relativamente aos índices de localização, estes inicialmente tinham o propósito de detectar possíveis

erros derivados da diferença de localização entre a base de dados de referência e a cartografia

produzida. No entanto, quando analisada a relação deste índice com as classes de ocupação do solo,

concluímos que este índice pode ser também utilizado para determinar se uma classe de ocupação

do solo se encontra inserida em áreas do território mais fragmentadas, lineares ou homogéneas.

Assim sendo, as classes inseridas em zonas mais fragmentadas correspondem às classes de áreas

artificiais descontínuas e agrícolas com excepção dos arrozais que apresenta maior tendência para

áreas lineares, tal como a classe de resinosas fechada. As classes inseridas em áreas homogéneas

são relativas às áreas artificiais contínuas e floresta de folhosas aberta. A utilização deste índice,

pode ser assim muito útil para estudos de cariz social, económico e ambiental. Exemplificando, este

índice pode ser utilizado para determinar se uma paisagem protegida está cada vez mais isolada

devido à fragmentação da sua envolvente, podendo haver o risco de esta se extinguir. Por outro lado,

estudando a linearidade da paisagem, podemos verificar se por exemplo os corredores ecológicos

abrangidos pela lei da REN continuam a apresentar um continuum natural, fundamental para o fluxo e

manutenção da biodiversidade, ou então se esta continuidade está a ser posta em causa devido à

sua fragmentação.

Já a análise das classes de mosaicos da base de dados de referência, revelou que as classes de

áreas artificiais descontínuas, culturas de regadio, culturas permanentes e floresta mista fechada,

apresentam uma elevada frequência de mosaicos.

No que respeita à análise exploratória das imagens de satélite, pudemos verificar que a imagem de

Agosto é a que permite uma melhor separação entre classes de ocupação do solo. Mais

concretamente é a imagem que permite obter uma menor variabilidade intra-classe, uma maior

distância entre classes de ocupação do solo e obter o melhor ratio intra e inter classe entre classes

de ocupação do solo. As classes de ocupação do solo com menor variabilidade intra classe são as

relativas às classes de solo nú, áreas artificiais contínuas, culturas de sequeiro, arrozais, culturas

permanentes de folha caduca, floresta de folhosas fechada e floresta de resinosas fechada. As

classes de áreas artificiais contínuas, áreas artificiais descontínuas classes de culturas de regadio e


97

de arrozais, foram as classes com o melhor ratio intra e inter-classe. Através da análise da distância

entre classes, pudemos verificar que a imagem do mês de Agosto permite uma maior distância entre

classes de ocupação do solo e consequentemente a formação de um maior número de grupos de

classes de ocupação do solo. Futuramente, seria interessante desenvolver um estudo em que fossem

treinadas e estudadas as classes de mosaicos em termos da sua reflectância, e tentar desenvolver

metodologias que permitissem realizar uma posterior classificação automática destas classes.

Comentando agora a avaliação da exactidão temática da cartografia produzida, verificamos que

obtivemos valores globais de exactidão muito reduzidos. Este aspecto é mais evidente quando

utilizamos apenas uma classe de ocupação do solo para cruzar com a classificação da cartografia

produzida. Contudo, tal como demonstrado no trabalho de Carrão et al. (2007), não treinando as

classes de culturas permanentes e de povoamentos florestais abertos e agregando as classes de

vegetação arbustiva, vegetação herbácea, vegetação esparsa e solo nu, a exactidão global sobe para

os 62%, sendo já este um valor bastante razoável. No entanto, podemos verificar que existem classes

com uma exactidão do produtor bastante aceitável, como são os casos das classes de áreas urbanas

descontínuas, culturas de sequeiro, culturas de regadio, floresta de resinosas fechada e vegetação

arbustiva. Por outro lado, as classes de culturas permanentes de folha perene, culturas permanentes

de folha caduca, floresta de resinosas aberta, floresta mista aberta, vegetação herbácea, vegetação

esparsa e solo nú, apresentam uma exactidão reduzida. Estes reduzidos valores de exactidão, têm

uma clara relação com o facto de estas classes apresentarem elevada frequência de mosaicos, de

terem uma elevada frequência de unidades amostrais classificadas com pouca confiança ou estarem

localizadas em áreas heterogéneas. De facto as unidades amostrais com mosaico, heterogéneas e

com pouca confiança, revelaram ter uma exactidão inferior relativamente às amostras classificadas

sem mosaico, em áreas homogéneas ou no limite, com muita confiança ou com assinaturas

espectrais semelhantes a outras classes. Podemos assim afirmar que os erros estão directamente

ligados com os aspectos anteriormente referidos.

Referindo-nos agora à avaliação da qualidade da cartografia produzida, através de funções fuzzy,

pudemos verificar que relativamente à distribuição e natureza dos erros, com a função RIGHT

conseguimos obter melhores resultados do que só utilizando a função MAX. Ou seja, quando é

utilizada a classe de ocupação do solo alternativa em vez de se utilizar apenas a classe mais

provável, existe uma melhoria na exactidão global. As classes com uma evidente melhoria são as

classes relativas de áreas artificiais descontínuas, floresta de folhosas aberta, vegetação arbustiva,

vegetação herbácea e solo nú. Adicionalmente, conseguimos também demonstrar que a utilização

destas duas funções em conjunto, torna-se uma ferramenta mais útil do que analisar os resultados

destas duas funções em separado. O utilizador é assim informado de que os resultados podem não

ser tão negativos, como a função MAX deixa transparecer.

A magnitude dos erros, revelou que as classes de culturas permanentes, floresta mista aberta,

vegetação esparsa e solo nú, são as que têm erros mais graves. Mais uma vez este facto, deve-se a


98

estas classes possuírem uma elevada frequência de unidades amostrais classificadas com pouca

confiança, em áreas heterogéneas, ou como mosaico e que também possuem assinaturas espectrais

semelhantes às de outras classes. Assim, o utilizador da cartografia está informado das classes

temáticas com erros mais graves e pode verificar se a cartografia produzida corresponde às suas

necessidades ou não.

Similarmente ao abordado anteriormente, mas agora em relação à origem dos erros, verificamos

através da função MEMBERSHIP que as unidades amostrais classificadas com uma única classe

apresentaram no geral melhores resultados, à excepção das classes de culturas permanentes,

povoamentos florestais abertos, vegetação herbácea, vegetação esparsa e solo nú, o que indica que

estas classes em termos espectrais são difíceis de discriminar. No entanto, os povoamentos florestais

abertos têm maior exactidão em unidades amostrais nas quais surgem em conjunto com outra classe,

estando este facto relacionado com o sub-coberto que poderá também conter outra classe que seja

acertada nessa mesma localização. Com as classes de vegetação herbácea, vegetação esparsa e

solo nú, verifica-se o mesmo, mas nestes casos deve-se à dificuldade por parte do foto-intérprete em

optar por uma destas classes, devido à dificuldade em determinar o limiar de percentagem entre

estas classes. Assim sendo, estas classes deverão ser sempre foto-interpretadas com confiança

parcial ou pouca confiança, pois são classes que pela sua natureza surgem em conjunto com outras.

Assim, para uma posterior disponibilização desta cartografia, o seu produtor deverá ter em atenção

que deverá desenvolver metodologias, para lidar com as áreas mais heterogéneas, com a finalidade

de obter um produto mais fiável.

Através dos resultados da função CONFUSION, verificamos que as classes de culturas permanentes,

floresta de folhosas aberta, povoamentos florestais mistos, vegetação herbácea e vegetação esparsa

são as pior classificadas, tanto em situações em que surgem como classe de ocupação do solo

principal, ou como classe de ocupação do solo alternativa. Já as classes mais ambíguas, são

relativas às classes de áreas artificiais descontínuas, culturas de regadio, floresta de folhosas aberta

e floresta mista aberta. O utilizador deverá ter em atenção que estas classes, apesar de estarem bem

classificadas, possuem outra classe de ocupação do solo e decidir se para cumprirem os seus

objectivos, necessitam de classes puras ou com alguma ambiguidade.

Fazendo agora uma reflexão final, sobre este trabalho, verificamos que os nossos objectivos foram

atingidos. Através de uma metodologia relativamente simples, conseguimos fornecer mais informação

ao utilizador sobre a cartografia produzida, do que se tivesse sido apenas implementada uma

avaliação da exactidão tradicional. Para além disso, o produtor pode também melhorar os métodos

utilizados na produção de cartografias de ocupação do solo, pois agora está mais informado sobre a

origem do erro da cartografia produzida.

Através destes métodos, conseguimos discernir e descrever a “realidade” com maior rigor e aferir

sobre esta. Esta metodologia poderá ser assim implementada em futuros projectos ligados à


99

avaliação da exactidão de cartografias de ocupação do solo, sendo uma mais valia nos processos de

tomada de decisão. Os actores intervenientes neste processo estarão assim mais conscientes do erro

e incerteza inerente ao processo de elaboração das cartografias de ocupação do solo. Este trabalho é

assim uma boa base para que no futuro se possam desenvolver índices de exactidão standard,

utilizando esta metodologia, e assim possibilitar a comparação entre outras cartografias, pois esta é

uma área ainda muito pouco desenvolvida e que necessita de mais investigação.

Referências bibliográficas

100

REFERÊNCIAS BIBLIOGRÁFICAS

Anderson, J. R., E. E. Hardy, J. T. Roach, and R.E. Witmer, 1976. A Land Use and Land Cover

Classification System for Use with Remote Sensor Data, Prof. Paper 964, US Geological Survey,

Reston, VA.

Araújo, A., and M. Caetano, 2006. Exploring MERIS images through temporal map algebra for land

cover mapping: first results, Proceedings of the 2nd EARSeL SIG Workshop on Land Use & Land

Cover, 28 - 30 September 2006, Bonn, Germany, unpaginated CD-ROM.

Araújo, A., e M. Caetano, 2006. Nomenclatura de Ocupação do solo LANDEO. Instituto Geográfico

Português (IGP), Lisboa, Janeiro 2006, 33 p.

Aronoff, S., 1982. Classification Accuracy: A User Approach, Photogrammetric Engineering & Remote

Sensing, 48(8):1299-1307.

Aronoff, S., 1985. The Minimum Accuracy Value as an Index of Classification Accuracy,

Photogrammetric Engineering & Remote Sensing, 51(1):99-111.

Bishop, Y., S. Fienberg and P. Holland, 1975. Discrete Multivariate Analysis: Theory and Practice, MIT

Press, Cambridge, MA.

Burrough, P. A., and R. A. McDonnell, 1998. Principles of Geographical Information Systems, Oxford

University Press Inc., New York, 333 p.

Caetano, M., 2004. Apontamentos de Mestrado e Pós-Graduação em Ciência e Sistemas de

Informação Geográfica, ISEGI, UNL, Lisboa, 168 p.

Caetano, M., T. Santos, and L. Gonçalves, 2002. Cartografia de Ocupação do Solo com Imagens de

Satélite: Estado da Arte. Actas do VII Encontro de Utilizadores de Informação Geográfica

(ESIG'2002), Novembro 2002, Oeiras, unpaginated CD-ROM.

Caetano, M., F. Mata, and S. Freire, 2006. Accuracy assessment of the Portuguese CORINE Land

Cover Map. in Global Developments in Environmental Earth Observation from Space (A. Marçal,

editor), Millpress, Rotterdam, pp. 459-467.

Carrão, H., 2002. Caracterização da Estrutura da Paisagem: Modelação e Avaliação das

Transformações na Representação da Ocupação do Solo, Estágio final da Licenciatura em Eng.ª

Biofísica, Universidade de Évora, Évora, 138 p.


101

Carrão, H., 2006. Land Cover Cartography Accuracy Assessment: An approach in the framework of

LANDEO project, IGP, Lisboa.

Carrão, H., M. Caetano, and P. Coelho, 2007. Sample Design and Analysis for Thematic Map

Accuracy Assessment: An Approach Based on Domain Estimation for the Validation of Land Cover

Products, Proceedings of the 32nd International Symposium on Remote Sensing of Environment, San

Jose, Costa Rica.

Carrão, H., P. Gonçalves, & M. Caetano, 2006. MERIS Based Land Cover Characterization: A

Comparative Study, Proceedings of the ASPRS 2006 Annual Conference - Prospecting for Geospatial

Information Integration, 1-5 May 2006, Reno, Nevada, USA, unpaginated CD-ROM.

Carrão, H., P. Sarmento, A. Araújo, and M. Caetano, 2007. Retrieving land cover information from

MERIS and MODIS data: a comparative study for landscape characterization in Portugal”,

Proceedings of the 2007 International Geoscience and Remote Sensing Symposium (IGARSS´2007).

Chuvieco, E., 1996. Fundamentos de Teledetección Espacial, Ediciones Rialp, Alcalá, Madrid, 568 p.

Clevers, J., H. Bartholomeus, S. Mücher, and A. Wit, 2004. Land Cover Classification with the Medium

Resolution Imaging Spectrometer (MERIS), Proceedings of the 24thSymposium of the European

Association of Remote Sensing Laboratories, 25-27 May 2004, Dubrovnik, Croatia, 3(3):354-362.

Cochran, W. G., 1977. Sampling Techniques, Wiley, New York, 428 p.

Congalton, R.G., 1988. A comparison of sampling schemes used in generating error matrices for

assessing the accuracy of maps generated from remotely sensed data, Photogrammetric Engineer

and Remote Sensing, 54(5):593-600.

Congalton, R. G., 1991. A review of assessing the accuracy of classifications of remotely sensed data,

Remote Sensing of Enviornment, 37:35-46.

Congalton, R. G., and K. Green, 1993. A Practical Look at the Sources of Confusion in Error Matrix

Generation, Photogrammetric Engineering & Remote Sensing, 59(5):641-644.

Congalton, R. G., and K. Green, 1999. Assessing the Accuracy of Remotely Sensed Data: Principles

and Practices, Lewis Publishers, Boca Raton, Florida, 137 p.

Dicks, S. E., and T.H.C. Lo, 1990. Evaluation of Thematic Map Accuracy in a Land-Use and Land-

Cover Mapping Program, Photogrammetric Engineering & Remote Sensing, 56(9):1247-1252.


102

ESA, 2005. URL: http://earth.esa.int/object/index.cfm?fobjectid=1665 (last date accessed: 15 March

2007)

ESA, 2006. URL: http://earth.esa.int/category/index.cfm?fcategoryid=60 (last date accessed: 18 March

2007)

ESA, 2006. URL: http://envisat.esa.int/object/index.cfm?fobjectid=3768 (last date accessed: 18 March

2007)

Foody G. M., 2002. Status of land cover classification accuracy assessment, Remote Sensing of

Environment, 80:185-201.

Freire, S., H. Carrão, e M. Caetano, 2002. Produção de Cartografia de Risco de Incêndio Florestal

com Recurso a Imagens de Satélite e Dados Auxiliares, Actas do VII Encontro de Utilizadores de

Informação Geográfica (ESIG'2002), 13 - 15 Novembro, Oeiras, unpaginated CD-ROM.

Gerlach, R., L. Skinner, A. Luckman, and C. Schmullius, 2005. Deriving Land Cover Information over

Siberia: Comparing Results from MERIS and MODIS, Proceedings of the MERIS and (A)ATSR 2005

User Workshop, 26–30 September, Frascati, Italy, Published on CDROM, p.46.1.

Gopal, S., and C. Woodcock, 1994. Theory and Methods for Accuracy Assessment of Thematic Maps

Using Fuzzy Sets, Photogrammetric Engineering & Remote Sensing, 60(2):181-188.

Goodchild, M. F., C. Lin, and Y. Leung, 1993. Visualization in Geographic Information Systems, John

Wiley & Sons, London, 167 p.

Gonçalves, P., H. Carrão, A. Pinheiro, & M. Caetano, 2006. Land cover classification with Support

Vector Machine Applied to MODIS imagery, Global Developments in Environmental Earth Observation

from Space (A. Marçal, editors), Millpress, Rotterdam, pp. 517-526.

Hadipriono, F. C., J. G. Lyon, and L. Thomas, 1991. Expert opinion in satellite data interpretation,


Hashemian M.S., A.A. Abkar, & S.B. Fatemi, 2004. Study of sampling methods for accuracy

assessment of classified remotely sensed data, Proceedings of the 20th International Society for

Photogrammetry and Remote Sensing Congress, 12-23 July, Istanbul, Turkey, unpaginated CD-ROM.

Hunter, G. J., M. Caetano, and F. Goodchild, 1995. A Methodology for Reporting Uncertainty in

Spatial Database Products, Journal of the Urban and Regional Information Systems Association,

7(2):11-21.


103

Liu, W., S. Gopal, and C. E. Woodcocck, 2004. Uncertainty and Confidence in Land Cover

Classification Using a Hybrid Classifier Approach, Photogrammetric Engineering & Remote Sensing,

70(8):963-971.

Lunetta, R. S., R. G. Congalton, L. K. Fenstermaker, J. R. Jensen, K. C. McGwire, e L. R. Tinney,

1991. Remote Sensing and Geographic Information System Data Integration: Error Sources and

Research Issues, Photogrammetric Engineering & Remote Sensing, 57(6):677-687.

Mata, F., G. Cavaco, e M. Caetano, 2004. Validação de cartografia temática produzida por

classificação de imagens obtidas por detecção remota: estado da arte, Actas do VIII Encontro de

Utilizadores de Sistemas de Informação Geográfica (ESIG'2004), 2 - 4 Junho 2004, Oeiras,

unpaginated CD-ROM.

Milla, R. Z., J.P.G.W. Clevers, M. E. Schaepman, & A. J. Plaza, 2005. Retrieving sub-pixel land cover

composition through an effective integration of the spatial, spectral and temporal dimensions of

MERIS imagery, Proceedings of the 9th International Symposium on Physical Measurements and

Signatures in Remote Sensing, 17-19 October 2005, Beijing, China, unpaginated CD-ROM.

Moisen G.G., T.C.Jr. Edwards, & D.R. Cutler, 1994. Spatial sampling to assess classification accuracy

of remotely sensed data, Environmental Information Management and Analysis: Ecosystem to Global

Scales. (W.K. Michener, J.W. Brunt, & S.G. Stafford, editors), Taylor & Francis, London, pp. 159-176.

Reese H. M., T. M. Lillesand, D. E. Nagel, J.S. Stewart, R.A. Goldmann, T.E. Simmons, J. W.

Chipman, P. A. Tessar, 2002. Statewide land cover derived from multiseasonal Landsat TM data - A

retrospective of the WISCLAND project, Remote Sensing of Environment, 82: 224-237.

Robinson, V. B., 1988. Some implications of fuzzy set theory applied to geographic databases,

Computers, Enviornment, and Urban Systems, 12:89-97.

Robinson, A., R. Sale, e J. Morrison, 1978. Elements of Cartography, John Wiley & Sons, Inc, 448 p.

Rosenfield, G. H., K. Fitzpatrick-Lins, and H. S. Ling, 1982. Sampling for Thematic Map Accuracy

Testing, Photogrammetric Engineering & Remote Sensing, 48(1):131-137.

Sarndal, C. E., B. Swensson, and J. Wretman, 1992. Model-Assisted Survey Sampling, Springer-

Verlag, 694 p.


104

Siegert, F., e S. Huang, 2004. Large-Scale Forest Fires in Siberia Analysed by MODIS, MERIS and

ASTER Multiresolution Satellite Imagery, Proceedings of the 2004 Envisat & ERS Symposium, 6 – 10

September 2004, Salzburg, Austria, unpaginated CD-ROM.

Stehman, S. V., 1992. Comparison of Systematic and Random Sampling for Estimating the Accuracy

of Maps Generated from Remotely Sensed Data, Photogrammetric Engineering & Remote Sensing,

58(9):1343-1350.

Stehman, S. V., 1997. Selecting and Interpreting Measures of Thematic Classification Accuracy,

Remote Sensing of Environment, 62:77-89.

Stehman, S. V., 1999. Basic probability sampling designs for thematic map accuracy assessment,

International Journal of Remote Sensing, 20(12):2423-2441.

Stehman, S. V., 2001. Statistical Rigor and Practical Utility in Thematic Map Accuracy Assessment,


Stehman, S.V., J.D. Wickham, J.H. Smith, and L. Yang, 2003. Thematic accuracy of the 1992 National

Land-Cover Data for the eastern United States: Statistical methodology and regional results, Remote

Sensing of Environment, 86: 500-516.

Stehman, S.V., J.D. Wickham, L. Yang, and J.H. Smith, 2000. Assessing the Accuracy of Large-Area

Land Cover Maps: Experiences from the Multi-Resolution Land Cover Characteristics (MRLC) Project,

Proceedings of the 4th International Symposium on Spatial Accuracy Assessment in Natural

Resources and Environmental Sciences, July 2000, Amsterdam, pp. 601-608.

Stehman, S.V., and L. Czaplewski, 1998. Design and Analysis for Thematic Map Accuracy

Assessment: Fundamental Principles, Remote Sensing of Environment, 64:331-344.

Story, M., and R. G. Congalton, 1986. Accuracy Assessment: A User’s Perspective, Photogrammetric

Engineering & Remote Sensing, 52(3):397-399.

Strahler, S. H., Boschetti L., Foody G. M., Friedl M.A., Hansen M. C., Herold, M., Mayaux P.,

Morissette J. T., Stehman S. V., and Woodcock C. E., 2006. Global Land Cover Validation:

Recommendations for Evaluation and Accuracy Assessment of Global Land Cover Maps, Technical

Report, Joint Research Centre, Ispra, in press.

Wel, F. J. M., 2000. Assessment and Visualisation of Uncertainty in Remote Sensing Land Cover

Classifications, M. A. dissertation, University of Utrecht, Utrecht, Netherlands, 187 p.


105

Wickham J. D., S.V. Stheman, J.H. Smith, and L. Yang, 2004. Thematic accuracy of the 1992 National

Land-Cover Data for the western United States, Remote Sensing of Environment, 91:452-468.

Woodcock, C. E., S. Gopal, and W. Albert, 1996. Evaluation of the Potential for Providing Secondary

Labels in Vegetation Maps, Photogrammetric Engineering & Remote Sensing, 62(4):393-399.

Woodcock, C. E., and S. Gopal, 2000. Fuzzy set theory and thematic maps: accuracy assessment

and area estimation, International Journal of Geographical Information Science, 14(2):153-172.

Wulder M. A., S. E. Franklin, J.C. White, J. Linke, and S. Magnussen, 2006. An accuracy assessment

framework for large-area land cover classification products derived from medium-resolution satellite

data, International Journal of Remote Sensing, 27(4):663-683.

Zadeh, L. A., 1965. Fuzzy Sets, Information and Control, 8(3):338-353.

Anexos

106

ANEXOS

Anexos

I

Anexo 1

Artigos científicos elaborados no âmbito da conferência IGARSS2007

Anexos

II

Anexos

III

Anexos

IV

Anexos

V

Anexos

VI

Anexos

VII

Anexos

VIII

Anexos

IX

Anexo 2

Artigo científico elaborado no âmbito da conferência ENVISAT Symposium 2007

Anexos

X

Anexos

XI

Anexos

XII

Anexos

XIII

Anexos

XIV

Anexos

XV

Anexo 3

Exemplo de cada classe de ocupação do solo

Classe 11

Classe 12

Classe 21

Classe 22

Classe 23

Classe 241

Classe 242

Classe 25

Classe 311

Classe 312

Classe 321

Classe 322

Anexos

XVI

Classe 331

Classe 332

Classe 34

Classe 35

Classe 36

Classe 37

Classe 38

Classe 41

Classe 5

Classe 6

Classe 7

Anexos

XVII

Anexo 4

Distribuição das unidades amostrais pelo território de Portugal Continental

Anexos

XVIII

Anexo 5

Artigo científico com as fórmulas de cálculo dos índices de exactidão para a amostragem estratificada

Anexos

XIX

Anexos

XX

Anexos

XXI

Anexos

XXII

Anexo 6

Mapa de ocupação do solo produzido com base na imagem MERIS de Agosto de 2005

Documents

TFC_Pedro_Sarmento