16
49 林業研究季刊 33(1)49-64, 2011 1. 國立中興大學實驗林管處育林組 組長 Specialist, Experimental Forest Management Office, Chung-Hsing University. 2. 農委會林務局森林企劃組 組長 Chief, Forest Planning Section, Forest Bureau, Council of Agriculture. 3. 國立中興大學森林學系 教授,通訊作者 Professor, Dept. of Forestry, National Chung-Hsing University, Corresponding Author, e-mail: [email protected] 研究報告 決策樹與區別分析模擬測繪木荷之空間分布型態 羅南璋 1 張偉顗 2 黃凱易 3 【摘要】木荷 (Schima superba var. superba) 是常綠喬木,為優良闊葉樹種之一,廣泛分布於全台灣 中低海拔 300-2,300 m。木荷具有防火樹種特性亦為造林樹種之一,且 GIS 多用於珍稀物種,而少 用於廣泛分布樹種,故選定為探討之對象。本研究係利用 GIS 疊合 GPS 定位木荷圖層與 DEM 出海拔、坡度、坡向、坡面位置加上 SPOT-5 衛星影像導出植生指標等五項預測變數圖層,結合多 變量統計決策樹 (Decision Tree, DT) 及區別分析 (Discriminant Analysis, DA) 模擬並測繪木荷潛在生 育地之空間分布,並根據推測準確度與執行效率評比兩者的預測能力。研究結果顯示 DT 模式推測 準確度明顯高於 DA 模式;在建模和驗模執行效率上,兩者難分軒輊,惟在繪製全區木荷潛在生育 地,DT DA 略顯繁瑣。更重要的是,模式於初期模擬即由全區篩選出 4-7 % 之高潛力區,大幅縮 小後續地面調查之面積,從而節省龐大的經費與人力。因此,這兩模式皆可應用在木荷潛在生育地 之模擬,惟 DT 法遠優於 DA 法。SPOT-5 影像導出植生指標無法提升模式預測能力,乃因其空間與 光譜解像力不夠細緻,無法分辨複雜而散生之林相。後續將融合高空間解像力、高光譜影像及光達 資料,期能提昇模式預測能力。目前木荷樣株都來自東峰溪流域,難免空間自相關或樣本不足之顧 慮,後續將增添關刀溪流域樣本,以再確認模式之可靠性。 【關鍵詞】地理資訊系統、遙感探測、全球定位系統、數值高程模型、決策樹、區別分析、潛在生 育地。 Research paper Modeling and Mapping the Spatial Distribution Pattern of Schima superba Via Decision Tree and Discriminant Analysis Nan-Chang Lo 1 Wei-I Chang 2 Kai-Yi Huang 3 AbstractChinese guger-tree (Schima superba var. superba, CGT) is one of the fine broad-leaf tree species, widely distributed in central Taiwan with elevation ranging from 300-2,300 m. Chinese guger- tree has good fitment, with excellent fire resistance characteristics, and thus is one of major species of forestation. Many studies have applied a geographic information system (GIS) with statistical methods to

決策樹與區別分析模擬測繪木荷之空間分布型態 · 3. 國立中興大學森林學系 教授,通訊作者 Professor, Dept. of Forestry, National Chung-Hsing University,

  • Upload
    others

  • View
    13

  • Download
    0

Embed Size (px)

Citation preview

49林業研究季刊 33(1):49-64, 2011

1. 國立中興大學實驗林管處育林組 組長 Specialist, Experimental Forest Management Office, Chung-Hsing University.2. 農委會林務局森林企劃組 組長 Chief, Forest Planning Section, Forest Bureau, Council of Agriculture.3. 國立中興大學森林學系 教授,通訊作者 Professor, Dept. of Forestry, National Chung-Hsing University, Corresponding Author, e-mail: [email protected]

研究報告

決策樹與區別分析模擬測繪木荷之空間分布型態

羅南璋1 張偉顗

2 黃凱易

3

【摘要】木荷 (Schima superba var. superba) 是常綠喬木,為優良闊葉樹種之一,廣泛分布於全台灣

中低海拔 300-2,300 m。木荷具有防火樹種特性亦為造林樹種之一,且 GIS 多用於珍稀物種,而少

用於廣泛分布樹種,故選定為探討之對象。本研究係利用 GIS 疊合 GPS 定位木荷圖層與 DEM 導出海拔、坡度、坡向、坡面位置加上 SPOT-5 衛星影像導出植生指標等五項預測變數圖層,結合多

變量統計決策樹 (Decision Tree, DT) 及區別分析 (Discriminant Analysis, DA) 模擬並測繪木荷潛在生

育地之空間分布,並根據推測準確度與執行效率評比兩者的預測能力。研究結果顯示 DT 模式推測

準確度明顯高於 DA 模式;在建模和驗模執行效率上,兩者難分軒輊,惟在繪製全區木荷潛在生育

地,DT 較 DA 略顯繁瑣。更重要的是,模式於初期模擬即由全區篩選出 4-7 % 之高潛力區,大幅縮

小後續地面調查之面積,從而節省龐大的經費與人力。因此,這兩模式皆可應用在木荷潛在生育地

之模擬,惟 DT 法遠優於 DA 法。SPOT-5 影像導出植生指標無法提升模式預測能力,乃因其空間與

光譜解像力不夠細緻,無法分辨複雜而散生之林相。後續將融合高空間解像力、高光譜影像及光達

資料,期能提昇模式預測能力。目前木荷樣株都來自東峰溪流域,難免空間自相關或樣本不足之顧

慮,後續將增添關刀溪流域樣本,以再確認模式之可靠性。

【關鍵詞】地理資訊系統、遙感探測、全球定位系統、數值高程模型、決策樹、區別分析、潛在生

育地。

Research paper

Modeling and Mapping the Spatial Distribution Pattern of Schima superba Via Decision Tree and Discriminant Analysis

Nan-Chang Lo1 Wei-I Chang2

 Kai-Yi Huang3

【Abstract】 Chinese guger-tree (Schima superba var. superba, CGT) is one of the fine broad-leaf tree species, widely distributed in central Taiwan with elevation ranging from 300-2,300 m. Chinese guger-tree has good fitment, with excellent fire resistance characteristics, and thus is one of major species of forestation. Many studies have applied a geographic information system (GIS) with statistical methods to

50 決策樹與區別分析模擬測繪木荷之空間分布型態

model the habitat of the rare species, but not for the widely distributed tree species. Therefore, the species was chosen as a target for this study. GIS technique was applied to overlay the tree samples collected with GPS on the layers of elevation, slope, aspect, terrain position, and vegetation indices derived from SPOT-5 images for modeling the tree’s habitat. Decision tree (DT) and discriminant analysis (DA) models were developed to predict and map the tree’s potential sites in the Huisun study area, and to determine the optimum in terms of accuracy and efficiency. The accuracy of the DT model was much higher than that of the DA model; both were highly efficient in model development and validation, but DA was more convenient than DT for mapping the CGT potential sites over the study area. More importantly, the two models can be applied to model the tree’s potential habitat because they greatly reduced the area of field survey to 4-7 % of the entire study area at the first stage, but DT was much better than DA. Vegetation indices derived from two-date SPOT-5 images could not improve the predicting ability of models for the widely distributed species because of SPOT imagery lacking fine spectral resolution and spatial resolution. Fusion of high spatial resolution imagery, hyperspectral data and LIDAR data will be used in follow-up studies to improve the predicting ability of models. The conclusions remain further confirmed with independent samples chosen from the Guan-Dau watershed far from the Tong-Feng watershed where currently used samples were chosen due to considerations of spatial autocorrelation and insufficiency of tree samples.【Key words】Geographic Information System (GIS), Remote Sensing, Global Positioning System (GPS), Digital Elevation Model (DEM), Decision Tree (DT), Discriminant Analysis (DA), Potential Habitat.

一、前言傳統的植群生態研究上,極為倚重人工

現場調查,並依據數量有限的小塊樣區或測站

觀測環境因子的資料加以推論。因此,傳統研

究方法所引起之疑慮通常是樣區對整個大研究

區的代表性及可能導致的統計偏差 (bias)。其

次,調查作業往往係或由不同的人員,或在不

同的時間,或在不同的地區,或以不同的方法

實施調查,且同等重要的問題是樣區與樣木空

間定位座標常含有甚大的誤差,導致調查資料

整合分析困難,故其推論會因樣本的偏頗或誤

差,而多有衝突與矛盾 (黃凱易等,2000)。近十多年來,感測、測繪及電腦軟硬體

等獲取與處理地球空間資訊的技術大幅躍進,

使過去傳統植群生態研究原本被認為是窒礙難

行,在相對上轉變成較為可行。地理資訊系統 (Geographic Information System, GIS)、全球定

位系統 (Global Positioning System, GPS) 及遙感

探測 (Remote Sensing, RS) 近年已融合形成一

完整的 3S 體系,而地球空間資訊則是藉由此 3S 體系所產生。因此,利用 3S 技術相對上可

對植群實施較為周全的調查、精確的定位,再

結合 GIS 與多變量統計做整合分析,能夠有效

降低傳統植群生態研究所遭遇的困難,並且能

夠忠實完整地呈現植群之空間分布特性 (羅南

璋,2010)。運用 3S 技術結合多變量統計方法預測動

植物的適生育地,以有效地保護瀕危稀有物

種,已漸成為重要之趨勢。目前國外已有許

多研究將 3S 技術應用於動植物適生育地分析

及模擬,例如 De,ath and Fabricius (2000) 利用

分類迴歸樹 (Classification and Regression Tree, CART) 或稱決策樹 (Decision Tree, DT) 分析澳

洲大堡礁珊瑚生育地調查資料,並指出 CART 相當適合分析生態資料,因為 CART 具有以下

優點: (1) 應變數型式具有較大彈性,包含數

值性及類別性型式﹔(2) 對於自變數交互作用

之解釋、描述及預測有較佳能力﹔(3) 易於建

51林業研究季刊 33(1):49-64, 2011

構且穩固之樹狀結構﹔(4) 樹狀結構較易於解

釋﹔(5) 對於自變數或應變數之漏失值 (missing value) 處理能力佳。

使用 CART (或 DT) 多變量統計法之類

似後續研究扼要摘述如下。Felicísimo and Gómez-Muñoz (2004) 運用 GIS 技術,結合 DT 模式,有效而精準地預測西班牙伊比利半島內

三種櫟屬樹種的潛在生育地分布。Bourg et al. (2005) 以 GIS 整合海拔、坡度、林型及火災頻

率等環境變數圖層,結合 CART 預測位於美

國維吉尼亞州西北部喬治華盛頓國家森林中之

稀有草本植物火雞芒 (turkeybeard, Xerophyllum asphodeloides) 生育地,其結果顯示 CART 能有效且準確地辨別火雞芒的適生育地。O,Brien et al. (2005) 以 CART 及邏輯思複迴歸 (Logistic Multiple Regression, LMR) 於 GIS 內建立地景

層次模式,推測美國西南部及墨西哥地區珍稀

瀕危叉角羚 (Sonoran pronghorn) 潛在生育地,

以作為新族群移居地,其結果顯示 CART 模式

無論在建模及驗模樣本的準確度皆優於 LMR 模式。Landenburger et al. (2008) 結合改良式決

策樹,藉由 GIS 整合 Landsat ETM+ 影像及大

量白皮松 (whitebark pine, Pinus albicaulis) 林木

參考資料,有效模擬並測繪大黃石生態系統內

白皮松的空間分布圖。

區別分析 (Discriminat Analysis, DA),或稱

判別分析、鑑別分析,為參數式多變量統計,

因有三個基本參數假設,在使用上多所限制 (Hair et al., 2006;吳明隆,2008),故其應用

在動植物適生育地預測之研究相對上較 DT 為少,茲簡要摘錄如後所述。Lowell (1991) 運用

區別分析在 GIS 空間環境下模擬位於美國密蘇

里州 Boone 郡的 BWREC 野生生物研教中心之

長期森林演替狀況,其結論指出 DA 法在空間

環境下對檢視長期時間現象甚為有用。Marnell (1998) 利用區別分析判別陸地和水體的環境因

素,對在愛爾蘭的蠑螈以及常見的蛙類的棲

地加以區分。陳永寬等 (1998) 利用海拔、坡

向、坡度、土壤和地質等五項環境因子透過

判別分析、因素分析和群聚分析進行林地分

級,求導出臺灣杉適生育地。李培芬等 (2005) 利用 GIS 整合約 50 幅生態與環境因子圖層,

包括到達海拔 3,000 m 及其以上區域之 近距

離、坡度、數值地形模型 (DTM)、溫度因子、

森林分布及規整差植生指標 (NDVI) 等,並以

區別分析及其他四種方法來預測全台灣八色鳥 (Pitta nympha) 之棲地。Riordan et al. (2009) 以區別分析測繪美國加州一種低灌木叢植物群落 (sage scrub) 空間分布圖。本研究將使用決策樹

及區別分析多變量統計法模擬與測繪涵蓋惠蓀

林場試區內之木荷適生育地,而區別分析是用

來作為與決策樹相互比較的對象。

木荷為山茶科常綠大喬木,胸高直徑可達 1.5 m,樹高可達 40 m,分布於中國浙江、福

建、兩廣、安徽、四川等省份,也廣泛分布於

全台灣,惟在新竹以南較多,且多出現在中低

海拔 300-2,300 m 的闊葉樹林中,大多數呈散

生狀態,甚少有形成大面積群落者,其材質緻

密不易蟲蛀,處理後即為家具用之良材 (許榮

章,1993;劉業經等,1994)。根據中興大學

實驗林管處研究人員多年觀察經驗得知,惠蓀

林場內之木荷多生長在較寬且平坦的稜脊上或

日照充足且土壤較為陰濕處。近年來,木荷的

森林防火特性為林業學者所重視,由於木荷葉

片含水量較高,一般森林火災耐何不了它;樹

冠高大且葉子濃密,形成了天然的防火牆;未

來推廣木荷等耐火性樹種栽植於松、杉、樟等

造林地,以改變為針闊葉混交結構之林相,發

揮局部阻火的作用 (楊建生等,2005)。除了因

為木荷具有森林防火特性之外,又因為 3S 技術過去多應用在瀕危珍稀物種,相對上反而較

少應用在如木荷之廣泛分布物種,故選擇木荷

為本次研究探討之對象。

在遙測應用上,於同一地區採多階、多

譜及多時方式採集資料可提高其實效性和成功

機率 (Lillesand et al., 2008)。在「多階」方法

上,衛星資料分析可結合高低空的航遙測及地

面實測資料。每一個空間層次的接續上,較低

52 決策樹與區別分析模擬測繪木荷之空間分布型態

層次資料來源可提供較小區域更詳細的資訊。

在較低層次得到較小區域的觀測資料可作為外

推較高層次觀測而涵蓋較大區域的依據。因

植物隨氣候或季節變遷所形成生理和外貌的改

變,「多譜」和「多時」遙測方法可用以觀測

其所導致光譜反射的變化,從而分辨不同植

物。依此概念,本研究係利用 GIS 疊合 GPS 定位木荷之地面實測資料與不同高度層次的遙

測資料包括從航測產生 DEM 並導出的海拔、

坡度、坡向、坡面位置及兩期衛星影像導出植

生指標圖層,並統計分析木荷於此五項因子之

空間分布特性。本研究的目標是藉由多變量統

計決策樹、區別分析分別建立預測模式,用以

推測與繪製涵蓋整個惠蓀林場木荷之適生育

地,並比較二者的推測準確度與執行效率,從

而決定最佳模式。其次,本研究將評估兩期衛

星影像導出植生指標,即夏秋兩季近中紅外波

段差值比,對於模式預測能力改善的功效。

二、研究區域惠蓀林場在行政區域上隸屬南投縣仁愛

鄉,為中興大學所有四個實驗林場之一,其位

置約在東經 121°0´-121°8´,北緯 24°2´-24°7´ 之間,略呈東北至西南走向,海拔由 454 m 至 2,419 m,其境內有五個主要集水區,從西到東

分別為蘭島溪 (629 ha)、關刀溪 (2,216 ha)、東

峰溪 (2,061 ha)、椿谷溪 (976 ha) 及合水溪 (715 ha) ,流向均由南向北,匯流入北港溪,加上

數個小集水區 (有計入但未列出面積),總面積

約 7,477 ha。惠蓀林場全區氣候溫潤,植物種

類繁多,為台灣中部地區極具代表性之森林。

本研究為配合使用衛星影像,故採長方形區

域,涵蓋整個不規則形狀之惠蓀林場,分析模

擬係根據該長方形區域實施。現階段目標樹種

木荷的地面定位調查區域是在東峰溪流域,而

後續調查將移往關刀溪流域,並將其流域樣本

納入模式分析,兩個主要集水區之相關位置如

圖 1 所示。

圖 1. 惠蓀林場研究區域位置圖

Fig. 1. Location map of the Huisun study area

53林業研究季刊 33(1):49-64, 2011

三、材料與方法本研究共分為六項主要步驟,茲分項條列

並搭配圖 2 之研究流程詳述如後。

(一) 資料蒐集

本研究資料蒐集的項目,包括數值高程

模型 (Digital Elevation Model, DEM) 資料檔,

農航所製作像片基本圖 (1/10,000)、赴現場以 GPS 搭配 5 m 伸縮型加長天線桿及雷射測距系

統測繪木荷樣株資料。另外,本研究向中央大

學太空及遙測研究中心選購九幅 SPOT-5 衛星

影像,採第二級正射糾正處理,並將座標系統

設定為 TWD67 基準及橫麥卡托投影經差二度

分帶 (TM 2°),最後以最近鄰法重取樣為 5 m × 5 m。本研究由九幅影像之中再篩選出品質

最佳兩幅,作為求導夏秋兩季季差植生指標之

用。這兩幅影像之雲覆概量皆要求在 15 % 以下,入射角或視角皆在 ± 15° 以內,其影像的

基本資料如表 1 所示。

圖 2. 本研究的流程圖

Fig. 2. The flowchart of this study.

54 決策樹與區別分析模擬測繪木荷之空間分布型態

表 1. 惠蓀林場研究區 SPOT-5 衛星影像基本資料

Table 1. The basic information of SPOT-5 satellite images over the study area

影像編號 季節 接收日期 視角 (°) 平均雲量 (%) 方位角 (°) 高度角 (°)

I0009406 夏 2004/07/10 -7.8 11 90.7 70.8

I0009409 秋 2005/11/11 -13.2 3 155.9 45.4

(二) 資料處理

1. 稜谷線數化

本研究使用 Calcomp Drawing Board III (A0 尺寸) 的高精度數化板將研究區內所涵蓋 1/10,000 像片基本圖上之稜谷線加以數化及建

檔,而其數化結果將用於後續求導與建立坡面

位置圖層。

2. 地文因子圖層建立

應用 ERDAS Imagine 影像處理及分析軟

體模組從 DEM 資料產生海拔圖層,並求導與

建立坡度、坡向圖層。方位角採 360° 為圓周

式循環數列,而非直線數列,不利於比較,故

在納入資料分析前,應予以轉換處理 (Chang, 2010)。本研究實施行前預備測試,分別採用 360° 方位角、坡向分為八級 (每級 45°)、坡向

度數轉換為餘弦等三種計量方式,所得結果實

質上均無差異,故決定坡向採用 360° 方位角

的計量方式,以維持坡向與海拔及坡度皆為比

率或間距式數值變數之本質 (比率或間距變數

的資料含量大於級序與類別變數)。3. 坡面位置圖層建立

一般而言,生育地在山坡上之相對位置,

對於土壤性質及林木生長深具關係 (劉棠瑞

等,1983)。求導及建立坡面位置圖層,首先

需將數化的稜脊線與山谷線分別轉換為網格

檔,並依據 Skidmore (1990) 所提相對位置計算

式子,計算每一網元至最鄰近稜線與谷線的歐

幾里得距離 (Euclidean distance),並求出該網

格點之相對位置比例 P i j,其公式如下所示:

P i j = PV / (PV + PR) ........................................(1)PV = P 點到與最鄰近山谷線的歐幾里得距離;

PR = P 點到與最鄰近稜脊線的歐幾里得距離;

上式中的 P 為某一檢定點 (網元),Pi j 為在 i 列,j 行之相對位置比例。本研究分別以稜脊

線及山谷為最高及最低坡面位置,到山谷線之 Pi j = 0.0,而到稜脊線之 Pi j = 1.0,再將其間分

為六級,連同稜脊線、山谷線共分為八級 (謝立忻等,2005)。4. 植生指標圖層建立

Hoffer (1978) 指出植物在夏、秋兩季,

近、中紅外光反射因葉子內部結構及含水量而

有明顯之差異,因此可作為分辨不同種類植物

的重要依據。植生指標原始構想除了源自於

植物、土壤於近、中紅外光譜反射原理及特

性,再加上植物物候之特性,在夏、秋季節葉

片細胞壁結構及含水量有甚大差異,使這兩

季的近、中紅外波段差值比可以作為樹種之間

的區別的依據。本研究由夏 (2004/07/10) 和秋 (2005/11/11) 兩期 SPOT-5 衛星影像求導出植生

指標,其求導的公式如下所示:

[(NIR-MIR) 秋 / (NIR-MIR) 夏] .......................(2)5. GPS 測繪資料處理

本研究赴試區現場獲取木荷樣株資料,

係使用 Trimble Pro XR 移動站搭配 5 m 可伸縮

加長天線予以定位,另視衛星訊號實際接收狀

況,輔以雷射測距系統協助定位。於調查結

束返回學校後,再以設置於系館建築物頂層 Trimble 基站資料融合移動站資料,做後續差

分改正,經改正後樣株位置之二維平均定位誤

差在 1 m 以內。最後,將其轉換為 ArcGIS 所能讀取及處理的 shapefile 圖層資料,木荷樣株

的分布如圖 1 內暗紅色斑點所示。

(三) 圖層疊合

將上述五項因子圖層及木荷區塊圖層,

55林業研究季刊 33(1):49-64, 2011

以 ERDAS Imagine 軟體中 Image Interpreter\Utilities\ Layer Stack 疊合形成 GIS 資料庫,

供後續取樣分析與模擬之用。再以 ERDAS Imagine 軟體中 Image Interpreter\Utilities\ Subset 分別切取目標樹種區塊 (即主體) 與該樹

種之互補區塊 (即背景)。(四) 樣本選擇與切取

本研究之目標樹種為惠蓀林場內 GPS 調查之木荷樣株。依據 Sperduto and Congalton (1996) 之研究,將背景 (非木荷生育地) 樣本

對主體 (木荷生育地) 樣本以至少三倍的比例

來選取。同時依據 Pereira and Itami (1991) 採隨機分散選取樣本,以避免樣本空間自相關 (spatial autocorrelation),分別計算主體區塊和

背景區塊在五項因子之相關統計值。本研究調

查樣本共有 122 株,全數都來自東峰溪流域。

本研究採用分割樣本建模與驗模之實驗設計方

法 (Chang, 2010),選取全數樣本中的三分之二 (即 82 株) 作為模式建立用之訓練樣本,而其

餘的三分之一 (即 40 株) 作為後續模式驗證用

之檢測樣本。

(五) 建立模式

本研究使用 SPSS 統計分析軟體進行兩種

多變量統計模式之運算,茲分述如下:

1. 決策樹

分類迴歸樹 (Classification and Regression Trees, CART) 演算法為 (Brieman et al., 1984) 所開發,Verbyla (1987) 首次運用於生態研究

上,即為決策樹的演算法之一。此方法因在統

計上無常態分布的假設,故屬於無母數統計方

法之一 (鄧家駒,2004)。決策樹同時也是一種

資料探勘 (data mining) 領域中兼具分類與預測

功能的技術,藉由分析給定的已知原始資料,

來建立適當的分類規則,且根據此規則對未

知類別的資料進行預測,以一個單一解釋 (預測) 變數函數,來建構一個二分式決策樹。樹

狀圖形頂端的節點稱為根節點 (root node),最

下方的節點則稱為葉節點 (leaf node),每個葉

部節點擁有一個類別標記 (class label),如圖 3

所示。圖中 X, Y, Z 為分支,即測試之結果,

中節點代表測試條件,即輸入之解釋變數 (如海拔、坡度等環境因子),葉節點分為「0」與「1」,在本研究即分別為木荷的「非生育

地」與「生育地」。當給定的原始資料從根部

節點進入決策樹後,可應用各種不同的演算

法,來決定每筆資料該進入下一層的哪一個子

節點 (child node),此過程不斷地反覆,直到所

有的資料到達葉部節點,而停止分割的情況可

分為下列幾種 (林震岩,2008):(A) 該次群體的純度已達到 100 %,或已達到

一個事先已設定好的純度。

(B) 該次群體的觀察值數目已低於一個事先已

設定好的數目。

(C) 分割後所減少的誤差平方和低於某事先已

設定好的水準。

(D) 該次群體的誤差平方和必須大於事先已設

定好的水準。

(E) 分割後總群體數高於一個事先已設定好的

總群體數。

(F) 全部可用於分割的解釋變數皆已用罄。

從根部到每一個葉部節點都有一條獨特

的路徑,每一條路徑皆表示一個用來分類資料

的規則。當一筆未知的資料進入決策樹時,該

筆資料將會依其符合的分類規則,而得到預測

的結果 (O’Brien et al., 2005)。統計軟體 SPSS 13.0 版之後才具有 CART 分析功能,放置於 Analyze\ Classify\ Tree 功能之下的演算法。

CART 的建樹過程,必須藉由分析訓練資料集

中之資料特性,反覆地找出最適當的分類屬性

及其分岔點 (splitting point),將資料集予以分

類。分散度 (diversity) 或稱混雜度 (impurity),則是用來評估一個分隔屬性變數的衡量標準,

對於一組資料的分散度指標以 Gini (1912) 開發

吉尼指標 (Gini index) 計算其公式如下所示:

Gini index = 1-Σc2 ..........................................(3)

56 決策樹與區別分析模擬測繪木荷之空間分布型態

圖 3. 決策樹之樹狀結構示意圖

Fig. 3. The tree structure of a decision tree

其中 c 表示每一組資料的反應比例,而最

好的分隔變數是能夠降低一個資料組最多的分

散度 (De’ath and Fabricius, 2000)。模式準確度

評估 (accuracy assessment) 是將樣本分割為建

模組與驗模組資料,而以驗模組樣本進行評估 (Breiman et al., 1984)。因此,在建構 CART 模式之前,必須先選定已分類好的原始資料來

源,而資料來源通常包含了許多的紀錄,每筆

紀錄擁有相同數目的屬性及一個目標屬性。依

照資料的特性和資料探勘的目標,必須將原始

資料分割成建模組與驗模組資料,提供 CART

使用。此外,為了避免過度學習 (over-fitting) 而使 CART 樹狀結構出現過於冗長複雜的情

形,可利用 CART 驗模組模式修正其結構。

其原理係利用建模資料組建立預測模式後,再

將驗模資料組代入模式進行驗證,可經由總資

料組之中不斷選取部分資料作為建模組與驗模

組,並觀察不同樹狀結構大小分類錯誤率之變

化,來反覆修正的過程 (Breiman et al., 1984)。2. 區別分析

區別分析,或稱判別分析、鑑別分析 (Discriminant Analysis, DA) 為 Fisher (1936) 所

57林業研究季刊 33(1):49-64, 2011

創,最早應用於貸款信用評分模型以區分好

壞之貸款者;Williams (1983) 首次將此演算法

應用在生態上,便對於多個植物族群的分類獲

得很好的分類效果。區別分析是一種劃分群體

之技術,事先將已知類別的觀察值,選取具

有分類效果的樣本,利用類別變數 (grouping variable, g 類) 當反應變數,多個計量的區別

變數 (discriminant variable) 當解釋變數,建立

區別函數 (discriminant function),公式如下所

示:

y = b0 + b1x1 + b2x2 + ... + bixi + ... + bnxn .............(4)y 為 區 別 函 數 值 ( 或 稱 區 別 分 數

discriminant score),xi 為區別變數,bi 為區別

係數 (discriminant coefficient or weight),利用

區別函數將新觀察值進行適當分類 (林震岩,

2008)。如圖 4 所示,假設有兩個變數 X1 和 X2;兩橢圓代表兩個族群 I 和 II 有部份相互重

疊影響。族群 I 可能為木荷分布區域、族群 II 可能為其它鄰近木荷分布區域之樹種,其生態

環境是交疊重複難以區分開的。區別分析的原

理便是找出能劃分 I、II 兩族群的交點所連成

之直線 DF,與另一條引自原點而與直線 DF 垂直的直線 Y 交於 C 點。直線 Y 即是區別函數

圖形,線上任何一點觀測值可由 X1 和 X2 兩個

變數轉換而得;直線 Y 上的 C 點,稱為分界

點,將 Y 值分為兩部份,作為區分 I、II 兩族

群之依據。兩個族群的 X1 和 X2 變異數不同,

要使組間變異數對組內變異數比值達最大時方

能找到分界點;就可以得到每個區別變數的權

重係數,其意義與迴歸分析類似。標準化後的

區別係數值愈大,代表此區別變數對群體的區

別能力愈高 (黃俊英,2007)。本研究採用統計

軟體 SPSS之Analyze\ Classify\ Discriminant 運算資料。(b0 + b1x1 + ... + bnxn) 項乃由統計軟體 SPSS 自動疊代產生之線性判別式。

區別分析在應用上需遵守三個前提假設:

(1) 一個區別變數不能是其它別變數的線性組

合,會有複共線性問題。

(2) 各類組間組內變異數皆要相等。

圖 4. 區別分析的幾何圖形觀念

Fig. 4. The concept of geometry for discriminant analysis

(3) 各組區別變數之間具有多變量常態分配。

由於赴現場調查相當耗工耗時,在進行

統計分析時略過前提假設檢定,改以事後檢定

的方式,採多組獨立樣本回推驗證模式的可靠

性。此外區別分析不只停留在描述各類組間變

異上的關係,還能夠對未知所屬之類組加以區

別分類,故本研究較重視後者預測木荷空間分

布的情形,與前提假設違反並無直接相關。但

為避免複共線性會有不利分類的影響,採逐步

估算法 (step-wise estimation),逐漸加入新的解

釋變數,將不適合的剔除直到模式合理為止。

後續研究也將擴增樣本數,以更多獨立樣本檢

測方式驗證模式並做假設檢定有無違反假設前

提。

(六) 模式驗證及評估

模式準確度評估是將推測結果與實際情

況相互比較,並計算兩相符合之正確百分比

率,其中應包含整體準確度、kappa 相符係數 (coefficient of agreement)、主體 (目標) 推測準

確度、背景推測準確度。惟因採全區逐格做像

元對像元之比對殊為不可能,故採抽樣方式兩

58 決策樹與區別分析模擬測繪木荷之空間分布型態

兩比對。由全區抽取樣本除須符合統計取樣原

則外,所選總樣本通常分為建模用之訓練樣本

與驗模用之檢核樣本兩組,再分別實施模式準

確度評估,此方法普遍應用在多光譜遙測影像

分類之準確度評估,旨在避免建模樣本自身評

估所隱含之偏頗與降低外推 (extrapolation) 之可能風險 (Jensen, 2005; Lillesand et al., 2008)。

SPSS 統計軟體 DT 與 DA 模組具準確度評

估功能,「建模組」訓練樣本於輸入樣本建立

模式之時一併完成準確度評估。DT 與 DA 的「驗模組」與「建模組」的準確度評估是於 SPSS 軟體 DT 與 DA 模組執行時一併完成;此

二模組的木荷潛在生育地全區預測圖皆需藉由 ERDAS Imagine 軟體 Spatial Modeler 的協助,

來完成繪圖工作。

四、結果與討論(一) 木荷空間分布特性之統計分析

本研究之試區為長方形,其左上角之 TM 2° 分帶座標為 (248,845.500, 2,668,192.500),右下角座標為 (264,590.500, 2,657,317.500),涵蓋面積約為 17,136.0 ha (其中包含惠蓀林場

不規則區域面積為 7,477 ha)。本研究所用之 DEM 網格資料,是根據前列長方形區域的座

標,以 ERDAS Imagine 的 Interpreter\ Utilities\ Subset 功能切取出來,其範圍大小為 3,150 行 (columns) × 2,176 列 (rows),總共有 6,854,400 個像元,像元尺寸為 5 m × 5 m。

本研究以 GPS 搭配伸縮加長天線及雷射

測距系統來定位木荷樣株,總共調查 122 株,

並以 shapefile 向量檔儲存。再由其中選 82 株作為「建模」用之訓練樣本,其餘 40 株作為

「驗模」用之檢測樣本。惟在轉換為網格檔資

料後,有若干株因間距小於一個網元尺寸 5m而遭合併,故「建模」用之樣本實際上為 78 個網元,而「驗模用」則為 38 個網元。

木荷樣株在五項環境因子之相關統計值如

表 2 所示。木荷樣株海拔分布範圍 1,157-2,096 m,較一般傳統生態調查分布範圍 300-2,300 m窄了許多,乃因朝東峰溪谷往下之調查路線末

段並未發現其蹤跡,且全區最低海拔 454 m,

高於 300 m。表 2 顯示木荷分布所在平均坡度

為 20°,坡度眾數為 9°,遠低於全區平均坡度

34° 及全區坡度眾數 37°。從現場觀察得知,

木荷多數生長在寬平稜線帶上或近稜線兩側下

方平台上,顯示木荷有傾向生長在土壤含水量

較高、土層較厚且較肥沃之處,此結果與表 2顯示木荷出現的坡面位置多落在「7」的結果

相吻合。木荷所在的坡向統計值與全區坡向統

計值相比較,看不出它有特別偏好之處。本

研究分別採用 360° 方位角、坡向分為八級,

每級 45°、坡向度數轉換為餘弦等三種計量方

式來進行測試,所得結果均無差異,故決定坡

向採用 360° 方位角的計量方式。木荷在植生

指標上之分布與坡向相同,亦未呈現明顯之傾

向。

表 2 木荷及全區於五項環境因子之相關統計值

Table 2. The statistic of five variables for the study area and Chinese guger tree sites

統計值

全     區 木     荷

海拔(m)

坡度(°)

坡向(°)

坡面位置

植生指標

海拔(m)

坡度(°)

坡向(°)

坡面位置

植生指標

平均值 1314 34 186 5 25 1787 20 187 6 24眾 數 1239 37 127 6 22 2051 9 191 7 22最大值 2418 89 361 8 119 2096 46 359 8 47最小值 445 1 1 1 5 1157 1 2 2 20

註:在 ERDAS Imagine 軟體內,坡度 361° 是指定為平坦地。

59林業研究季刊 33(1):49-64, 2011

(二) 預測變數組合對模式準確度之影響

海拔、坡度、坡向、坡面位置及植生指

標為本研究建立模式之五個預測變數。這五

個變數有 30 種組合,扣除掉五取一、五取二

的組合後,仍有五取三、五取四、五取五等

之組合,總共還有 15 種組合,計算量仍然相

當龐大。所以,本研究運用 SPSS 套裝軟體的 LMR、DT 及 DA 模組,可從輸入的預測變數

自動篩選出最有效用之變數,以大幅減少計算

量,從而節省工作時間。在透過該軟體兩種模

組執行之後,兩者均篩選出海拔、坡度、坡面

位置為最有效用之變數,而坡向及植生指標則

被剔除。因此,本研究以此三變數建立 DT 及 DA 模式,所得之推測準確度作為比較基準。

其次,再分別將坡向、植生指標強制納入由這

三個變數形成之基準模式,所得推測準確度與

基準模式結果相互比較,可評估衛星影像導出

植生指標是否具有改善模式推測能力之效用。

表 3 顯示 DT 及 DA 模式於三種預測變

數組合下所建立模式之推測準確度。三種預

測變數組合分別是: 海拔、坡度、坡面位

置 (C1); 海拔、坡度、坡面位置、植生指標 (C2); 海拔、坡度、坡向、坡面位置 (C3)。

本研究探討重點之一是 SPOT-5 衛星影像導出

植生指標對模式預測能力之改善,而 C2 與 C1 的差別在植生指標。就「驗模」部份來看,將 DT 在 C2 與 C1 整體推測準確度相互比較,DT 在 C2 之推測準確度 (93%) 與 C1 之推測準確

度 (93%) 相等;DA 模式在 C2 與 C1 也有相等

的推測準確度 (88%),而在「建模」部份亦有

幾近相同的結果,惟 C2 因加入植生指標反而

使推測準確度略微下降。所以 SPOT-5 衛星影

像導出植生指標皆無法改善這兩模式的推測準

確度。SPOT-5 影像近紅外波段空間解像力為 10 m,而中紅外波段則為 20 m。木荷樹冠直徑

通常約 5-10 m,樹冠展開面積不足一個像元。

因此,本研究認為 SPOT-5 影像無法完整解析

單株木荷,且無法與周遭其他樹種分離隔開。

同等重要的是,上列兩個波段皆為寬頻波段,

光譜解像力不夠細緻,難以區別木荷與周遭其

他樹種之光譜反射。

同樣地,第三種組合 (C3) 添加坡向變

數,將 C3 與 C1 整體推測準確度相互比較,

不論在建模或驗模部份,坡向也都無法改善這

兩模式的推測準確度,且 C3 因加入坡向變數

反而使推測準確度略微下降。

表 3. 三種不同變數組合建立兩種模式於預測木荷潛在生育地之推測準確度

Table 3. The accuracies of predicting the potential habitat of CGTs by the two models based on three combinations of different variables

組 別 DT 模式 DA 模式

建模組C1

正確 (%)C2

正確 (%)C3

正確 (%)C1

正確 (%)C2

正確 (%)C3

正確 (%)非生育地 98 99 97 83 82 83生育地 91 82 94 89 89 87

整體正確率(%) 97 97 97 84 83 83

驗模組C1

正確 (%)C2

正確 (%)C3

正確 (%)C1

正確 (%)C2

正確 (%)C3

正確 (%)非生育地 94 96 94 87 87 86生育地 85 77 85 92 92 90

整體正確率(%) 93 93 93 88 88 87

註:C1 = 海拔、坡度、坡面位置;C2 = 海拔、坡度、坡面位置、植生指標;C3 = 海拔、坡度、坡向、 坡面位置。

60 決策樹與區別分析模擬測繪木荷之空間分布型態

(三) 兩模式預測能力之比較

根據前面預測變數組合推測準確度評比

之結果,本研究採用海拔、坡度及坡面位置

三項變數建立基準模式,進一步來評比 DT 與 DA 兩種方法。表 4 顯示以三項變數建立 DT 與 DA 模式預測木荷潛在生育地所獲得推測

準確度之比較。如表 4 所示,DT「建模組」

整體推測準確度 (97%) 高於 DA (84%),DT「驗模組」整體推測準確度 (93%) 也高於 DA (88%),而 DT 建模及驗模整體推測準確度的

平均值 95% 高於 DA 的平均值 86%。而更重

要的是 DT 在建模、驗模及兩者平均之 Kappa 值 (分別是 0.88、0.73、0.81) 也都遠大於 DA 者 (0.51、0.49、0.50)。從整體推測準確度及 Kappa 值而言,DT 的預測能力遠優於 DA。

其次再就兩模式生產者精度與使用者精度

來評比二者之優劣差別所在。為了能更清楚瞭

解其優劣差別所在,本研究以建模與驗模平均

值來簡化說明。就驗模組而言,DT 在 「非生

育地」的建驗模生產者精度平均值 (96%) 明顯

高於 DA 的 85% 約 11%,但 DT 在「生育地」 的建驗模生產者精度平均值 (88%) 反而低於 DA 的 91%。再深入檢視 DA 數據,DA「生育

地」 推測之漏授 (100% - 生產者精度 = 100% - 91%) 僅 9%,但「生育地」推測之誤授 (100% - 使用者精度 = 100% - 49%) 卻高達 51%,與

DT「生育地」 推測之誤授 21% (100% - 78%) 相較,幾達 2.5 倍。由此可見 DA 推測誤差主

要是發生在將「非生育地」(背景) 誤授為「生

育地」(主體或目標樹種—木荷),大幅犧牲背

景之準確度,來換取提高目標樹種「生育地」

之準確度。此處應特別注意的,是背景數量

在整個試區所佔的比例通常遠大於主體數量所

佔的比例,因此模式在預測非生育地時,應儘

可能優先提高背景的推測準確度,最好能維持

在 90% 以上。惟 DA 統計法產生的線性判別

式,有將「非生育地」與「生育地」兩群體均

等分割的傾向,放寬「生育地」判別之標準,

導致不少的「非生育地」被錯誤判定為「生育

地」。此即 DA 方法的缺點所在,而此缺點更

不利於找出模式尚未考量到之預測變數。因

此,從推測準確度的角度來看,DT 模式確實

遠較 DA 模式來的好。

圖 5 為兩模式推測木荷潛在生育地分布

圖,分布統計如表 5 所示。DT 模式推測木荷

潛在生育地,佔試區總面積的 5.3 %,而 DA 推測木荷潛在生育地,佔試區總面積的 4.9 %。兩模式首次推測木荷潛在生育地即可從全

區面積約 17,136.0 ha 篩選出 5-6 % 的高潛力

區,大幅減少後續地面調查之面積,從而降低

所需投入經費、時間與人力。

表 4. 海拔、坡度及坡面位置建立兩種模式預測試區木荷潛在生育地之誤差矩陣表

Table 4. The error matrix for the two models based on elevation, slope, and terrain position predicting the potential habitat of CGTs in the study area

模式 整體精度 (%) Kappa 類 別 驗證 生產者精度 (%) 使用者精度 (%)

DT

建模 97 0.88生育地

建模 91 平均88

86 平均78

驗模 93 0.73驗模 85 70

非生育地建模 98 平均

9699 平均

98平均 95 0.81 驗模 94 98

DA

建模 84 0.51生育地

建模 89 平均91

45 平均49

驗模 88 0.49驗模 92 53

非生育地建模 83 平均

8598 平均

98平均 86 0.50 驗模 87 98

平均:指建模及驗模的整體精度、Kappa、生產者精度、使用者精度的平均值。

61林業研究季刊 33(1):49-64, 2011

表 5. 海拔、坡度、坡面位置建立兩種模式預測試區區木荷潛在生育地之分布統計

Table 5. The distribution statistics of the potential habitat of CGTs in the study area predicted by the two models based on elevation, slope, and terrain position

類 別DT 模式 DA 模式

面積 (ha) 百分比例 (%) 面積 (ha) 百分比例 (%)生育地 903.91 5.3 838.60 4.9非生育地 16232.09 94.7 16297.40 95.1合 計 17136.00 100.0 17136.00 100.0

(a) DT (b) DA

圖 5. 海拔、坡度、坡面位置建立兩種模式預測木荷潛在生育地圖:(a) DT;(b) DAFig. 5. The maps for the potential habitat of CGTs in the study area generated from the two models based

on elevation, slope, and terrain position, (a) DT; (b) DA

最後是兩模式在執行效率上之比較。兩

者在 SPSS 軟體裏有個別的模組,在點選模式

各輸入參數後,皆可高度自動化執行模式之建

立與驗證,產生各式的統計參數報表及誤差矩

陣表,供模式效能評比之用,兩者可謂旗鼓

相當。惟在最後繪製木荷全區的潛在生育地

分布圖時,須跨軟體平台作業,轉到 ERDAS Imagine 軟體的 Spatial Modeler 模組上來執

行。DT 模式在 Spatial Modeler 模組下建立與

執行繪圖程序較 DA 模式略顯耗工費時。

本研究在探討統計模式的預測能力時,現

階段僅就統計方法與執行效率來加以評估。惟

影響模式的預測能力並非僅有統計方法,另也

需考量資料的品質、預測變數、樣本的數量和

分布等,而其中遙測資料的品質、所萃取的光

譜預測變數及地面樣木定位精度、數量及分布

都相當重要,皆為後續研究探討的重點。

五、結論與建議本研究從整體推測準確度與 kappa 相符係

數來看,決策樹 (DT) 模式於木荷潛在生育地

之推測表現都明顯優於區別分析 (DA) 模式。

再細究這兩模式的主體與背景使用者精度,

DT 在背景使用者精度與 DA 相等,而 DT 模式

主體使用者精度遠高於 DA。此點對於主體數

量遠少於背景數量的狀況極為重要,乃因 DA 模式將不少的「背景非生育地」誤授為「主

體生育地」,導致 DA 預測能力大幅下降,明

顯低於 DT。就模式建構、執行與驗證效率來

看,二者旗鼓相當,惟在繪製全區木荷潛在生

62 決策樹與區別分析模擬測繪木荷之空間分布型態

育地分布圖時,DT 較 DA 略顯繁瑣。經由有

效的潛在生育地模擬,可使後續地面調查有明

確方向可循,且在大幅縮減木荷潛在生育地的面

積,可節省實地調查所需龐大的經費及人力。

本研究採用衛星影像是為了跨越空間上的

阻礙,延伸擴展推估空間。然而此次所採用之 SPOT-5 衛星影像導出之植生指標幾乎沒有提

昇模式預測能力之效果,推斷乃因 SPOT-5 的近、中紅外波段為寬頻,其光譜解析度不足以

分辨樹種間細微光譜反射差異,而且空間解析

度亦不足以分辨台灣複雜、散生分布之林相,

再加上大氣效應、光照與感測儀觀測幾何效應

及地形效應所導致光譜變異之影響所致,其真

正原因有待深入探討。

影響推測準確度並非僅有所使用的方法,

也包含資料的品質、預測變數和樣本的數量和

分布等,其中遙測資料的品質、所萃取的光譜

預測變數及地面樣木數量及分布均甚為重要,

都是後續研究的重點。未來後續之研究將考慮

使用高空間解析度影像、高光譜影像及光達資

料,期望能改善模式之預測能力。

目前驗模與建模樣本都來自同一區位的

東峰溪流域,或許有空間自相關影響之顧慮,

加上驗模樣本數尚非充足,堪稱差強人意,故

上述結論仍待深入驗證。後續研究將使用與東

峰溪流域不同區位且相距甚遠如關刀溪流域之

獨立樣本,並評估加入不同之預測變數進行驗

證,以再確認模式之可靠性與可信度。

六、參考文獻李培芬、白梅玲、林瑞興 (2005) 利用遙測與

GIS 探討瀕危物種八色鳥之棲地喜好與分

布。農委會 94 年度遙測應用計畫成果發

表會專刊。第 1-10 頁。

林震岩 (2008) 多變量分析:SPSS 的操作與應

用。智勝文化。第 489-530 頁。

吳明隆 (2008) SPSS 操作與應用多變量分析實

務。五南圖書出版公司。第 134-151 頁。

許榮章 (1993) 地理資訊系統應用於木荷生育地

因子之探討。國立中興大學森林研究所碩

士論文。

陳永寬、鄭祈全、廖錦偉 (1998) 應用地理資訊

系統篩選台灣杉造林地。航測及遙測學刊 3 (2): 47-70。

黃俊英 (2007) 多變量分析,第七版。華泰文

化。第 137-163 頁。

黃凱易、黃慧欣、施勝誠 (2000) 由地文因子以 GIS 評估冷杉生育地之特性。中華林學季

刊 33(2): 231-243。楊建生、朱振宏、彭喜方、曾秋龍、彭春景

(2005),豐順縣木荷防火林帶抗火效能

及其營造技術。森林防火期刊 2005 年 1 期,取自:http://d.wanfangdata.com.cn/Periodical_slfh200501017.aspx

劉棠瑞、蘇鴻傑 (1983) 森林植物生態學。臺灣

商務印書館,第 462 頁劉業經、呂福原、歐辰雄 (1994) 台灣樹木誌。

國立中興大學農學院。第 440 頁。

鄧家駒 (2004) 多變量分析。華泰文化。第 369-394 頁。

謝立忻、羅南璋、黃凱易 (2005) 應用 3S 地球

空間技術於植群空間分布型態之探討。林

業研究季刊 27 (4): 37-46。羅南璋 (2010) 3S 技術結合多變量統計模擬測

繪林木之潛在生育地。國立中興大學森林

研究所博士論文。

Bourg, N. A., W. J. Mcshea, and D. E. Gill (2005) Putting a CART before search: successful habitat prediction for a rare forest herb. Ecology 86 (10): 2793-2804.

Breiman, L., J. H. Friedman, R. A. Olsen, and C. G. Stone (1984) Classification and Regression Trees. Chapman and Hall, New York, USA. 357 pp.

Chang, K. T. (2010) Introduction to Geographic Information Systems, 3rd ed., The McGraw-Hill Companies.

D e ’ a t h , G . a n d K . E . F a b r i c i u s ( 2 0 0 0 )

63林業研究季刊 33(1):49-64, 2011

Classification and regression trees: a powerful yet simple technique for ecological data analysis, Ecology, 81 (11): 3178-3192.

Fisher, R. A. (1936) The use of mult iple measurements in taxonomic problems. Annals of Eugenics, 7: 179-188.

Felicísimo. A. M. and Gómez-Muñoz, A. (2004) GIS and predictive modelling: a comparison of methods applied to forestal management and decision-making, Proceedings of GIS Research UK 2004, University of East Anglia, Norwich, Norfolk, UK, pp. 143-144.

Gini C. (1912) Variabilità e mutabilità, Studi economico-giuridici pubblicati per cura della Facoltà di Giurisprudenza della Regia Università di Cagliari, Anno III, parte 2, also reproduced in C. Gini (1939) op. cit.

Hair, J. F., Jr., W. C. Black, B. J. Babin, R. E. Anderson, and R. L. Tatham (2006) Multivariate Data Analysis, 6th Edition. Pearson Education, Inc., New Jersey, pp. 273-275.

Hoffer, R. M. (1978) Biological and physical considerations in applying computer-aided analysis techniques to remote sensor data. In: Swain, P. H. and S. M. Davis (Eds.), Remote Sensing: The Quantitative Approach, McGraw-Hill, Inc., New York, pp. 227-289.

Jensen, J. R. (2005) Introductory Digital Image Processing-A Remote Sensing Perspective, 3rd ed., Pearson Education, Inc, New Jersey.

Landenburger, L., R. L. Lawrence, S.Podruzny, and C. C. Schwartz, (2008), Mapping regional distribution of a single tree species: whitebark pine in the Greater Yellowstone Ecosystem, Sensors, 8: 4983-4994.

Lillesand, T. M., R. W. Kiefer, J. W. Chipman ( 2 0 0 8 ) R e m o t e S e n s i n g a n d I m a g e Interpretation, 5th Edition. John Wiley &

Sons. Inc., New York.Lowell, K. (1991) Utilizing discriminant analysis

with a geographical information system to model ecological succession spatially. Int. J. Geographical Systems 5 (2): 17-191.

Marnell, F. (1998) Discriminant analysis of the terrestrial and aquatic habitat determinants of thesmooth newt (Triturus vulgaris) and the common frog (Rana temporaria) in Ireland. Journal of Zoology London 244: 1-6.

O’Brien, C. S., S. S. Rosenstock, J. J. Hervert, J. L. Bright, and S. R. Boe (2005) Landscape-level models of potential habitat for Sonoran pronghorn. Wildlife Society Bulletin, 33 (1): 24-34.

Pereira, J. M. C., and R. M. Itami. (1991) GIS-based habitat modeling using logistic multiple regression: A study of the Mt. Graham red squirrel. Photogrammetric Engineering and Remote Sensing, 57 (11): 1475-1486.

Riordan, E. C. , and P. W. Rundel (2009) Modelling the distribution of a threatened habitat: the California sage scrub. Journal of Biogeography, 36 (11): 2176-2188

Skidmore, A. K. (1990) Terrain position as mapped from a gridded digital elevation model. International Journal of Geographical Information Science, 4: 33-49.

Sperduto, M.B., and R. G. Congalton (1996) Predicting rare orchid (Small Whorled Pogonia) habitat using GIS. Photogrammetric Engineering and Remote Sensing, 62 (11): 1269-1279.

Verbyla, D. L. (1987) Classification trees: a new discrimination tool. Canadian Journal of Forest Research, 17: 1150-1152.

Williams, B. K. (1983) Some observations of the use of discriminant analysis in ecology. Ecology, 64: 1283-1291.

64 決策樹與區別分析模擬測繪木荷之空間分布型態