Upload
manchu
View
54
Download
2
Embed Size (px)
DESCRIPTION
PDA 上圖案式智慧型搜尋方法 研究報告. 指導教授: 黃有評 大同大學 資訊工程系與石牌國小 合作方案 硬體由匯智谷科技公司提供. 動機目標. 在傳統的資訊檢索系統( information retrieval system )中,通常都是使用關鍵字( keyword )來作為搜尋相關資料的依據。但是有些時候使用者並不知道該物件正確的名稱而只記得該物件的某些特徵時,傳統上使用關鍵字來搜尋相關文章內容的資訊檢索方式便較不適合。 - PowerPoint PPT Presentation
Citation preview
PDA 上圖案式智慧型搜尋方法研究報告
指導教授: 黃有評
大同大學 資訊工程系與石牌國小合作方案
硬體由匯智谷科技公司提供
動機目標• 在傳統的資訊檢索系統( information retrieval system )中,
通常都是使用關鍵字( keyword )來作為搜尋相關資料的依據。但是有些時候使用者並不知道該物件正確的名稱而只記得該物件的某些特徵時,傳統上使用關鍵字來搜尋相關文章內容的資訊檢索方式便較不適合。
• 利用點選圖案方式即可達成資訊搜尋之系統,藉由結合倒傳遞類神經網路模型,建構一套智慧型搜尋機制,來提供使用者一個圖形式的搜尋介面,使得使用者可以透過點選或拖拉物件特徵的方式來進行資訊的檢索,利用圖案或符號點選輸入方式可避免因不知具體名稱而無法以文字或語言輸入方式之困擾。
• 系統具備圖案淺顯易懂、輸入簡單、可依不同場合或環境迅速變更搜尋模型及容易學習使用等優點,不但適合於中小學生戶外教學使用,亦可推廣至各風景名勝導覽系統或史蹟館等單位使用。
研究方法• 我們利用倒傳遞網路的模型( back propagation model )來當
作資料檢索的架構,它不但減少了記憶體的佔用,又能夠快速的得到具有彈性的檢索結果。
• 其他方式之缺點
– 以往使用於電腦上資料庫比對檢索的方式,雖然可輕易的找出結果,但是相對的必須付出極大的成本來儲存其特徵檢索值以供資料搜尋之用,這樣一來,在 PDA 有限的記憶體之下,勢必會有所侷限;而且資料庫比對的方式無法兼具有容錯的功能。
– 另一方面,若使用傳統模糊法則( fuzzy rules )推論的方式,由於在規則上我們很難去界定,以植物的葉形來說,如圓形、心形的歸屬程度值的定義;葉緣如鋸齒,波形等。
倒傳遞網路模型• 在系統設計上,由於考慮使用者對於同一項物品之主要特徵描述內容與順序可能不同,故與其使用文字輸入方式可能遭遇之困難與麻煩,本系統則採用簡便之圖案點選方式,使用者僅需使用觸控筆即可輕易地搜尋資料。
• 此外,我們亦考慮使用者搜尋資料之耐性,不能過度期望使用者輸入許多特徵才能找到所期望之資訊,故本系統後端應用程式所使用之智慧型搜尋機制,是採用倒傳遞網路( back-propagation network; BPN )來實作。
倒傳遞網路塑模輸入層 隱藏層 輸出層
...
.
.
...
.
.
1植物名稱
n植物名稱
呈現出最相關的K筆資料
呈現層
葉形
葉脈
葉緣
葉序
輸入層• 用以表現網路的輸入變數,其處理單元數目依問題
而定,使用線性轉換函數。
• 在本系統中,輸入層單元之個數等於我們事先規劃好之檢索特徵數。由於 PDA 的記憶體容量與螢幕空間的顯示限制下,目前在本系統中的特徵數是四個,分別為葉形、葉脈、葉序、葉緣。
隱藏層• 用以表現輸入處理單元間的交互影響,其處理單元數目並無標準方法可以決定,經常需以試驗方式決定其最佳數目,使用非線性轉換函數,網路可以不只一層隱藏層,也可以沒有隱藏層。
隱藏層個數
誤差
5 10 15 20 25 30 35 40 45
0.35
0.40
0.45
0.50
0.65
0
05_0.658710_0.465315_0.415420_0.415821_0.393622_0.406923_0.408924_0.423025_0.416026_0.410227_0.415528_0.402029_0.399430_0.416431_0.405632_0.407933_0.441934_1.861635_1.919940_1.919945_1.9199
1.9
輸出層• 用以表現網路的輸出變數,其處理單元數目依問題
而定,使用非線性轉換函數。
• 在本系統中,輸出層單元之個數等於檢索系統中該分類項,例如:植物,資料庫系統內建之個數。
呈現層• 由於輸出層之輸出值介於 0 與 1 之間,愈接近 1代表其符合程度愈高。
• 在本系統中,我們將倒傳遞網路增加一個呈現層用來呈現給使用者點選之輸出變數,其處理單元數目依不同場合或狀況而定,使用線性轉換函數。在本系統中,因考慮 PDA螢幕大小問題,故呈現層單元之個數以五個以內較佳。
開發環境• 由於本系統之開發牽涉到後端倒傳遞網路模型之建構,以及前端 PDA 界面之撰寫,故開發環境之所需軟硬體概述如下:
所需硬體: PC數台:撰寫倒傳遞網路程式、 PDA 程式及訓練測試系統之用。 PDA:實際上線 DMEO 之用。
開發軟體: Microsoft Visual Basic 6.0:倒傳遞網路程式之撰寫。 Microsoft Visual C++ 6.0:撰寫 PDA 程式,並作為 compiler 之
用。 資策會「手持式系統」模擬器:測試及驗證 PDA 程式。 工具程式(圖形轉換工具、資料庫轉換工具):相關特徵圖片、
資料轉換之用。
系統雛形本系統包括以下二部分:
– 倒傳遞網路訓練模型– PDA 界面之撰寫
系統架構• 本系統共分為後端倒傳遞網路模型之建構,以及前端 PDA 界
面之撰寫兩大部分,以下便是本系統的系統架構圖:
PDA 人機界面
PDA DEVICE
PDA後端資料庫
系統後端資料庫 倒傳遞網路
訓練模組
系統後端伺服器
後端系統核心
無線網路
RS232
倒傳遞網路訓練模型
PDA人機界面搜尋特徵
開始搜尋
選擇特徵
PDA人機界面
結論及未來展望• 本創意實作最主要是提出了一個 PDA 上的應用實例,所提系統結合
倒傳遞類神經網路模型,建構一套智慧型搜尋機制,來提供使用者一個圖形式的搜尋介面,使得使用者可以透過點選或拖拉物件特徵的方式來進行資訊的檢索,其特色在於使用者僅需點選介面上所提供之圖案即可達成搜尋之目的,而點選的順序並不會影響搜尋的效果,因此,所提創作系統具備了圖案淺顯易懂、輸入簡單、可依不同場合或環境迅速變更搜尋模型及容易學習使用等優點。
• 由於現今的 PDA裝置,仍有記憶體大小不足及無線傳輸速率的問題,故使用者所查詢出來的結果可用影像壓縮的技術,存取圖像的部分特徵,以節省記憶體,或待日後無線傳輸之速率提升,可直接由伺服端下載查詢結果。
• 本次利用植物來作為實驗的範例,對於資料採礦( data mining )的應用也有幫助,例如,我們可以透過所找出來的植物分析出攝取該植物養分的動物有哪些,進而了解部份食物鏈的架構。另外,藉由這套系統,日後亦可結合警方辦案,警察可藉由手中的 PDA 在第一時間內收集被害者的描述,迅速的勾勒出歹徒的特徵。