19
陳陳陳 陳陳陳 & 陳陳陳陳 1

華語文與科技研究中心 研究 主題三:語料庫基礎研究

  • Upload
    clare

  • View
    84

  • Download
    0

Embed Size (px)

DESCRIPTION

陳浩然 英語系 & 國語中心. 華語文與科技研究中心 研究 主題三:語料庫基礎研究. Brown Corpus British National Corpus Collins Bank of English Gigaword English Google 1T Micase Base CANCODE. 著名英文語料. 語言研究 字典 編教科書 自然語言處理 數位學習. 語料的應用. 1. 華語母語語料庫、 2. 華語中介語語料庫 、 3. 多媒體影音語料庫、. 先介紹以此計畫下三部分. - PowerPoint PPT Presentation

Citation preview

Page 1: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

陳浩然英語系 & 國語中心

1

Page 2: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

Brown Corpus British National Corpus Collins Bank of English Gigaword English Google 1T Micase Base CANCODE

2

Page 3: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

語言研究 字典 編教科書 自然語言處理 數位學習

3

Page 4: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

1. 華語母語語料庫、

2. 華語中介語語料庫、

3. 多媒體影音語料庫、

4

Page 5: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

Review of current systems. Academia Sinica. Gigaword Chinese. Google Chinese 5 grams.

Sinica data: well-known but too small for collocation search.

語料庫檢索介面建置、 線上語料檢索工具研發 Web news CNA data中央社即時新聞CNA

-NEWS.COM for the collocation search tool

5

Page 6: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

6

Page 7: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

http://140.114.75.20:8002/CGW/index.htm

7

Page 8: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

8

Page 9: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

解決方法(1007) 有方法(964) 處理方法(389) 採取方法(346) 研究方法(342) 找出方法(307) 利用方法(294) 提出方法(274) 尋求方法(245) 使用方法(241) 改進方法(183) 防治方法(179)

說方法(172) 運用方法(166) 提供方法(147) 為方法(146) 檢驗方法(145) 找到方法(143) 認為方法(143) 表示方法(114) 計算方法(111) 用方法(109)

學習方法(107) 預防方法(106) 學方法(106)

9

Page 10: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

新方法(1182) 有效方法(1044) 最好方法(996) 好方法(585) 最佳方法(405) 可行方法(295) 正確方法(262) 可以方法(177)

具體方法(164) 適當方法(144) 合作方法(114) 自己方法(110) 主要方法(101)

和平方法(95) 直接方法(88) 必須方法(88) 同樣方法(86) 唯一方法(85) 簡單方法(81)

10

Page 11: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

治療方法(832) 唯一方法(306) 使用方法(251) 管理方法(197) 和平方法(120)

調查方法(92) 手術方法(90) 傳統方法(89) 交易方法(88) 統計方法(81) 教育方法(73) 分析方法(71) 訓練方法(68) 測試方法(63)

製造 方法 (55)

11

Page 12: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

華語語言教材和工具書出版兩大方向執行。應用於華語教學之實證研究,並將結果彙編成相關教材或辭典,提供實用之華語教學建議 .

搭配詞字典 相關詞彙教材

12

Page 13: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

蒐集語料建構中介語語料庫:國語中心學生作文,以及華測會學生 TOP 考試的作文語料。

進行詞性的自動標記。 ( 會標錯) 進行錯誤類型標記,中介語料庫的標記與一般母語語

料庫的標記有很大的不同,因為需要考慮學習者的錯誤,目前現有的中介語語料庫之標記沒有統一的標準,不同的語料庫往往按其目的之不同而有不同的標記,這個部分有待進一步的研究,由於中文與其他語言不同的特性有其探究的必要與價值。

學習者中介語語料庫分析及相關教材產出。如常犯錯誤手冊, 華語學習難點分析。

13

Page 14: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

14

Page 15: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

15

Page 16: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

母語來源文體功能字數類別級分 CEFR LEVEL 韓語電子信件問候近況表達歉意說明理由 273 預試 5A2...<略>...

的情形還有給你安慰,但是我現在在台灣的關係沒辦法去看你。所以我也很難過。我希望你趕快堅固起來,我會去的時候好好的見面。助你身體健康...<略>...

16

Page 17: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

Collocation errors Classifiers Synonyms Verb copying Aspect marker Le. V- 起來

17

Page 18: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

The need to help students with scaffolding tools.

The need for video-based learning materials.

The need to automatically generated subtitles.

The need to link to web dictionary.

18

Page 19: 華語文與科技研究中心 研究 主題三:語料庫基礎研究

19