2
報告大綱報告大綱►計畫目標計畫目標►網站架構圖網站架構圖►網站內容及功能詳細說明網站內容及功能詳細說明►計畫執行進度表計畫執行進度表►計畫辦理情形計畫辦理情形►執行困難及待協調事項執行困難及待協調事項►提請同意變更部分計畫內容提請同意變更部分計畫內容
3
計畫目標計畫目標►因計畫主持人乃台中縣石岡鄉人,熟悉該縣市之民因計畫主持人乃台中縣石岡鄉人,熟悉該縣市之民
間文學,也通曉閩客語,所以預計先以台中縣為出間文學,也通曉閩客語,所以預計先以台中縣為出發點,先建置台中縣之民間文學,並將「台灣民間發點,先建置台中縣之民間文學,並將「台灣民間文學館網站」之網站架構先建立起來,以便未來能文學館網站」之網站架構先建立起來,以便未來能將其他縣市的民間文學資料陸續納入,而成為完整將其他縣市的民間文學資料陸續納入,而成為完整的「台灣民間文學館網站」。的「台灣民間文學館網站」。
►除了將文字及語音資料收入網站內容之外,並將針除了將文字及語音資料收入網站內容之外,並將針對研究、教學、推廣、典藏的目的,提供符合使用對研究、教學、推廣、典藏的目的,提供符合使用者需要的功能。者需要的功能。
5
網路教學區介面網路教學區介面以《石岡鄉客語歌謠》之〈羊咩咩〉為例 以《石岡鄉客語歌謠》之〈羊咩咩〉為例
《石岡鄉客語歌謠》之〈羊咩咩〉
羊咩咩,十八歲,坐火車(轉妹家),坐到梅樹下。看到一包米,拿來做餈(原文作「米茲」)粑。食餈粑,無糖搵,搵泥沙。
連結語音
顯示語意
連結詞彙語意詞典
連結國家數位典藏聯合目錄 連結國家文化資料庫
跨資料庫查詢文物等其他相關資料
客語詞彙
造句練習 其他例句學習評量與延伸學習
其他文本其他文本
7
網站內容及功能詳細說明 網站內容及功能詳細說明 除了網站所需具備的「網站導覽」、「使用說明」、除了網站所需具備的「網站導覽」、「使用說明」、「版權宣告」、「製作團隊」之外,網站內容的主題「版權宣告」、「製作團隊」之外,網站內容的主題分為「索引區」、「全文檢索區」、「網路教學區」分為「索引區」、「全文檢索區」、「網路教學區」三大區塊。分別說明如下:三大區塊。分別說明如下:
► 索引區索引區:分為「區域別」、「語言別」、「語音:分為「區域別」、「語言別」、「語音區」、「文體別」四個區塊,每一個區塊之下再區」、「文體別」四個區塊,每一個區塊之下再分出細目,以下拉式選單提供使用者依據使用需分出細目,以下拉式選單提供使用者依據使用需要選擇。要選擇。
8
網站內容及功能詳細說明網站內容及功能詳細說明► 全文檢索區全文檢索區:分為「詞彙音標語意詞典」、「文:分為「詞彙音標語意詞典」、「文
本全文檢索」二大區塊。本全文檢索」二大區塊。 詞彙音標語意詞典:可以選擇以全部詞彙為查詢 詞彙音標語意詞典:可以選擇以全部詞彙為查詢範圍,或將檢索條件限制在「客家話」或「福佬範圍,或將檢索條件限制在「客家話」或「福佬話」的範圍。話」的範圍。
文本全文檢索條件值:總計分為「區域別」、文本全文檢索條件值:總計分為「區域別」、「語言別」、「文體別」、「講述者」、「采錄「語言別」、「文體別」、「講述者」、「采錄者」、「采錄時間」、「采錄地點」、「篇題者」、「采錄時間」、「采錄地點」、「篇題名」、「內容」等九種選項,使用者可以選擇一名」、「內容」等九種選項,使用者可以選擇一個以上的欄位輸入檢索條件進行檢索,並提供布個以上的欄位輸入檢索條件進行檢索,並提供布林檢索功能。林檢索功能。
9
網站內容及功能詳細說明網站內容及功能詳細說明► 網路教學區網路教學區:網路教學區主要的目的是做為客家:網路教學區主要的目的是做為客家話與福佬話教學使用。閱讀文本是學習語言的方話與福佬話教學使用。閱讀文本是學習語言的方法,因此教學區分為「閱讀全文」、「詞彙音標法,因此教學區分為「閱讀全文」、「詞彙音標解釋隨選隨示」、「造句練習」、「檢索其他例解釋隨選隨示」、「造句練習」、「檢索其他例句」四個單元。為了降低閱讀的障礙,閱讀全文句」四個單元。為了降低閱讀的障礙,閱讀全文若遇到無法理解的客家話與福佬話詞彙,系統提若遇到無法理解的客家話與福佬話詞彙,系統提供「隨選隨示」(將滑鼠移到該詞彙,即自動顯供「隨選隨示」(將滑鼠移到該詞彙,即自動顯示該詞彙之語音音標及解釋)的功能。「造句練示該詞彙之語音音標及解釋)的功能。「造句練習」時,可以檢索該詞彙在其他文本的用法,以習」時,可以檢索該詞彙在其他文本的用法,以「一詞泛讀」(從一個詞彙泛讀各種文本)的理「一詞泛讀」(從一個詞彙泛讀各種文本)的理念,達到學習的目的。念,達到學習的目的。
10
網站內容及功能詳細說明網站內容及功能詳細說明► 民間文學及網站內容介紹:英文網站增加「民間民間文學及網站內容介紹:英文網站增加「民間
文學及網站內容介紹」,以幫助國外使用者了解文學及網站內容介紹」,以幫助國外使用者了解台灣民間文學。台灣民間文學。
► 網站導覽:提供完整之網站架構(網站地圖),網站導覽:提供完整之網站架構(網站地圖),幫助使用者了解網站內容。幫助使用者了解網站內容。
► 使用說明:提供網站使用說明使用說明:提供網站使用說明► 版權宣告:標註網站內容之版權及使用者之合理版權宣告:標註網站內容之版權及使用者之合理
使用規範。使用規範。► 製作團隊:計畫製作團隊製作團隊:計畫製作團隊► 除了上述功能之外,每一篇文本都可以同時顯示除了上述功能之外,每一篇文本都可以同時顯示
語音以及該文本之福佬話及客家話詞彙音標語意。語音以及該文本之福佬話及客家話詞彙音標語意。
11
計畫執行進度表 之一計畫執行進度表 之一工作項目/月次別
第1月
第2月
第3月
第4月
第5月
第6月
第7月
第8月
第9月
備註
文本資料輸入校對
於六月完成《台中縣民間文學集》三十八冊文本輸入及校對。
建立缺字對照表格
依照文建會缺字處理原則,進行圖形檔與構字式對照處理。
語音檔案剪輯
1.於七月初完成 5,061 個語音檔剪輯。2.發現語音檔不符民間文學者 3,245個。3.烏日、大里、神岡、梧棲等四個鄉鎮 218 個語音檔,在計畫限期內轉為文字檔案有困難。
建立詮釋資料
確定描述欄位後,預定十月前完成詮釋資料
12
計畫執行進度表 之二計畫執行進度表 之二工作項目/月次別
第1月
第2月
第3月
第4月
第5月
第6月
第7月
第8月
第9月
備註
網站開發由工程師處理。
資料整合預定十月前完成。
資料轉入資料庫
預定於十一月前完成
測試、除錯由工程師處理。
網站上網由工程師處理。
13
計畫辦理情形 之一計畫辦理情形 之一
►(一)文本輸入校對(一)文本輸入校對 已完成《台中縣民間文學集》三十八冊輸入及校已完成《台中縣民間文學集》三十八冊輸入及校對,其中《沙鹿鎮謎語‧諺語集》、《潭子鄉閩南對,其中《沙鹿鎮謎語‧諺語集》、《潭子鄉閩南語謠諺》二書為輸入及校對方便起見,除歌謠部分語謠諺》二書為輸入及校對方便起見,除歌謠部分外,以講述者為主,彙整多篇為一個數位文字檔案外,以講述者為主,彙整多篇為一個數位文字檔案
,總計 ,總計 1,728 1,728 個文字檔,約 個文字檔,約 117 117 萬字。萬字。►(二)著作權(二)著作權 《和平鄉泰雅族故事‧歌謠集》一書,因著作權《和平鄉泰雅族故事‧歌謠集》一書,因著作權問題未能解決,且本計畫以閩、客語為主要範圍,問題未能解決,且本計畫以閩、客語為主要範圍,故擬將此部分從本計畫中刪除。故擬將此部分從本計畫中刪除。
14
► (三)語音檔剪輯(三)語音檔剪輯 語音檔共計 語音檔共計 5,061 5,061 個,經核對,擬將從本計畫刪個,經核對,擬將從本計畫刪
除者 除者 3,463 3,463 個,共計 個,共計 373,208 373,208 秒(秒( 103 103 小時 小時 40 40 分 分 8 8 秒)秒)
不符民間文學定義者 不符民間文學定義者 3,245 3,245 個檔案予以刪除。個檔案予以刪除。 烏日、大里、神岡、梧棲等四個鄉鎮 烏日、大里、神岡、梧棲等四個鄉鎮 218 218 個語音個語音 檔,若要在計畫限期內轉為文字檔案過於困難。檔,若要在計畫限期內轉為文字檔案過於困難。 扣除以上兩類,預計上網數位語音檔 扣除以上兩類,預計上網數位語音檔 1,599 1,599 個,個, 189,189,302 302 秒(秒( 52 52 小時 小時 35 35 分 分 2 2 秒)。秒)。
改以桃園縣閩南語民間文學內容遞補,計有八德市、大改以桃園縣閩南語民間文學內容遞補,計有八德市、大園鄉、大溪鎮、中壢市、桃園市、龜山鄉、蘆竹鄉等七園鄉、大溪鎮、中壢市、桃園市、龜山鄉、蘆竹鄉等七個鄉鎮,個鄉鎮, 2,8252,825 篇, 篇, 7,1327,132 頁。頁。
計畫辦理情形 之二計畫辦理情形 之二
15
計畫辦理情形 之三計畫辦理情形 之三►(四)缺字處理原則(四)缺字處理原則 依照文建會缺字處理原則,建立文字圖形檔與構依照文建會缺字處理原則,建立文字圖形檔與構字式文字對照表,將依照【語言別→部件別】的順字式文字對照表,將依照【語言別→部件別】的順序排列顯示,持續進行中。序排列顯示,持續進行中。
►(五)英文網頁(五)英文網頁 英文網頁之網站主題介紹,將根據胡萬川教授撰英文網頁之網站主題介紹,將根據胡萬川教授撰寫之〈何謂民間文學?〉一文英譯,因譯者鄭錦全寫之〈何謂民間文學?〉一文英譯,因譯者鄭錦全院士臨時有要事,以致無法如期在期中審查時完成院士臨時有要事,以致無法如期在期中審查時完成預定之進度,請容許於八月底以前補上。預定之進度,請容許於八月底以前補上。
16
文字圖形檔與構字式文字對照範例文字圖形檔與構字式文字對照範例 計畫辦理情形 之四計畫辦理情形 之四
圖形檔字形
構字式字形
讀音 語言別 詞彙 解釋
恩 en 1 客語 恩裡、恩間方 我們
ngai5 客語 又無、教
、請 我
堂 tong5 客語 阿堂 對同姓或結拜的稱
之犀 tshi5 客語 犀豬、犀狗 殺
口束 suh4 閩南語 口束風、口束血 吸、吸吮
口罕 han 7 閩南語 哮口罕 吆喝
口留 lio3 閩南語真豐沛口留、風足透 e0口留、出家口留
擬聲字,語氣詞
17
計畫執行困難及待協調事項計畫執行困難及待協調事項 之一 之一
►(一)排除語音檔案(一)排除語音檔案 3,4633,463 個個 烏日、大里、神岡、梧棲等四個鄉鎮 烏日、大里、神岡、梧棲等四個鄉鎮 218 218 個沒有個沒有文字記載的語音檔轉為文字資料,在計畫執行上有文字記載的語音檔轉為文字資料,在計畫執行上有絕對的困難之處,計畫執行期限內恐未能如期結案。絕對的困難之處,計畫執行期限內恐未能如期結案。
另有 另有 3,245 3,245 個語音檔,因不符民間文學定義,或個語音檔,因不符民間文學定義,或內容不適於公開於網路上等等考量下,擬將此部分內容不適於公開於網路上等等考量下,擬將此部分於計畫中排除。於計畫中排除。
18
計畫執行困難及待協調事項計畫執行困難及待協調事項 之二 之二
►(二)擬定增補《桃園縣民間文學集》(二)擬定增補《桃園縣民間文學集》 計畫原訂產出文字資料 計畫原訂產出文字資料 4,964 4,964 篇,語音資料篇,語音資料 569,569,000 000 秒(秒( 158 158 小時 小時 3 3 分 分 20 20 秒)。秒)。
刪除前述資料之後,計有文字資料 刪除前述資料之後,計有文字資料 2,034 2,034 篇,語篇,語音資料 音資料 189,302 189,302 秒(秒( 52 52 小時 小時 35 35 分 分 2 2 秒)。秒)。不足之部分,擬將增補《桃園縣民間文學集》閩南不足之部分,擬將增補《桃園縣民間文學集》閩南語部分,共計三十冊, 語部分,共計三十冊, 2,8252,825 篇,篇, 7,1327,132 頁。頁。
19
提請同意變更部分計畫內容提請同意變更部分計畫內容
是否同意將所刪除不符合民間文學是否同意將所刪除不符合民間文學定義之語音資料以及有音無字資料,定義之語音資料以及有音無字資料,改由桃園縣閩南語民間文學資料之改由桃園縣閩南語民間文學資料之文字檔案遞補,提請裁示?文字檔案遞補,提請裁示?