14
Journal of Chinese Language and Computing 16 (4): 239-252 239 新加坡华语教材用字的频率与分布 1 王惠 新加坡国立大学中文系 [email protected] _________________________________________________________________________ 摘要 本文在一个覆盖面广泛的切分标注教材语料库基础上,对新加坡中小学课本的汉 字及分布进行全面调查分析,真实地展现了新加坡华文教育的一个重要特点:汉语是 作为第二语言的母语教学。研究结果可为新加坡华文课程设计提供一个新平台,同时 进一步引发对海外华语(World Chinese)研究的深层次思考,探索如何更好地处理 华语共性与区域特点之间的关系。 关键词 海外华语 字表 汉字频率 汉字分布 教材语料库 _____________________________________________________________________ 1 前言 新加坡是个多元种族多元文化的国家,300 多万人口中,华人约占 77%,马来人 14%,印度人占 7.6%,其他种族占 1.4%。官方语言有四种: 英语、华语(普通话)、 马来语、淡米尔语。其中英语是政府的行政语言,使用最为广泛;马来语是国语,华 语是华人的母语。 新加坡从幼稚园就开始实行双语教育,但双语教学在课程与时间的安排上是不对 等的,第一语言是英语,是最常用的语言;第二语言是母语,小学只有华文1 本研究得到新加坡教育部资助(课题名称:“新加坡常用字/词调查研究”, R-102-000-037-121)。

A Quantitative Analysis on the Chinese Characters in Singapore

Embed Size (px)

Citation preview

Journal of Chinese Language and Computing 16 (4): 239-252 239

新加坡华语教材用字的频率与分布1

王惠

新加坡国立大学中文系

[email protected]

_________________________________________________________________________

摘要

本文在一个覆盖面广泛的切分标注教材语料库基础上,对新加坡中小学课本的汉

字及分布进行全面调查分析,真实地展现了新加坡华文教育的一个重要特点:汉语是

作为第二语言的母语教学。研究结果可为新加坡华文课程设计提供一个新平台,同时

进一步引发对海外华语(World Chinese)研究的深层次思考,探索如何更好地处理

华语共性与区域特点之间的关系。

关键词

海外华语 字表 汉字频率 汉字分布 教材语料库

_____________________________________________________________________

1 前言

新加坡是个多元种族多元文化的国家,300 多万人口中,华人约占 77%,马来人

占 14%,印度人占 7.6%,其他种族占 1.4%。官方语言有四种: 英语、华语(普通话)、

马来语、淡米尔语。其中英语是政府的行政语言,使用最为广泛;马来语是国语,华

语是华人的母语。

新加坡从幼稚园就开始实行双语教育,但双语教学在课程与时间的安排上是不对

等的,第一语言是英语,是最常用的语言;第二语言是母语,小学只有“华文”与“公

1 本研究得到新加坡教育部资助(课题名称:“新加坡常用字/词调查研究”,R-102-000-037-121)。

240 Wang Hui

民与道德教育”课是用母语教学,中学只有“华文”课才用母语教学。

但新加坡华人毕竟占绝大多数,作为母语,用华语进行日常生活的口语交际还

是不错的。但是,多数人的识字量太少,难以顺利阅读,读写水平较低。口语与书面

语能力之间的这种巨大落差,是新加坡华文教育的最大特点,它既不同于中国大陆和

台湾把华文作为第一语言的母语教学,也不同于其他国家把华文作为第二语言的外语

教学,而是介于二者之间的第三种状态:汉语是作为第二语言的母语。

如何在英文作为强势语言的双语制度下,利用有限的课堂时间完成母语华文的

教学目标与任务,成为近年来新加坡举国上下都在热烈讨论的课题,汉字教育是其中

不可回避的难点与焦点,直接影响着华文的读写能力,在学界引起了越来越广泛的关

注。本文将采用语料库语言学理论与技术,对新加坡现行的华文教材的用字及其分布

进行全面考察和定量分析,从一个侧面展示海外华语教育特点,并进一步探索如何更

好地处理华语共性与区域特点之间的关系。

2 新加坡华文教育

2.1 中小学华文教材

汉字教学是新加坡华文教育最重要和最基本的内容,主要在小学与初中(共 10

年)完成。

小学阶段为 6 年,四年级末有一个分级考试,把学生分为三个源流:EM1、EM2、

EM3。成绩最优秀的学生(大约 10%)进入 EM1 源流,英文和华文均为第一语文,

修读高级华文课程。绝大部分学生进入 EM2 源流,华文是第二语文,修读普通华文

课程。成绩最差的少数学生则进入 EM3 源流(俗称“放牛班”),英文为第一语文,华

文为第三语文程度。

初中阶段一般为 4 年,分为四类课程:

• 特别课程:4 年制,华文和英语都是第一语文,修读高级华文。

• 快捷课程:4 年制,英语为第一语文,修读普通华文(快捷课程)。

• 普通学术课程:5 年制,英语为第一语文,修读普通华文(普通学术课程)。

• 普通技术课程:4/5 年制,英语为第一语文,修读普通华文(普通技术课程)。

能够修读高级华文(特别课程)的,仅有少数成绩优异的学生,大部分学生修

读普通华文(快捷课程),成绩最差的学生(大约 30%)修读普通华文(普通学术或

普通工艺课程)。

初中毕业后,大多数学生进入技术学院(Polytechnics)学习两年,然后直接就业。

只有大约 10%的学生能考入高中(初级学院),其中半数将升上大学。

高中阶段,华文不是必修课,大学入学考试也不计入总分。因此,很多学生不再

A Quantitative Analysis on the Chinese Characters in Singapore Textbook Corpus 241

修读华文课程。大学里除了中文系以外,其他院系课程也全部是用英文授课,学生们

接触华文的机会几乎为零。这造成了新加坡社会一种奇怪的现象:受教育程度越高,

华文水平越低。

通过上述简单介绍可以看到,新加坡华人学习华文的主流渠道是小学和初中的

10 年学校教育。

为了配合中小学不同等级的课程,新加坡教育部颁布了不同的华文教材:小学阶

段有高级华文课本、普通华文课本;中学阶段则有高级华文、华文(快捷课程)、华文

(普通学术课程)、华文(普通工艺课程)等 4 种课本。

2.2 小学课本的字量

小学一年级至六年级的高级华文和普通华文课本各有 203 篇课文,但高级华文

包括 2090 个字种,普通华文仅有 1832 个:

课文篇数 字符数 汉字数 字种数 共有的字 独有的字

高级华文 203 70067 58137 2090 1764 326

普通华文 203 56539 46499 1832 1764 68

总计 406 126606 104636 2158 / /

表 1 新加坡小学课本的用字量

其中, 82%的字(1764 个)在两套课本中均有出现,但同时也有 326 字只在高级

华文课本中出现,68 字只在普通华文课本中出现。后者主要传说故事中的用字,包括人

名、地名等,如:

郭、巫、喔、荆、轲、欧、朱、阶、儒、罕、络、竽、娶、狄、姆、辈、嫘、

廉、驴、央、羿、氏、催、辣、嗡、技、茧、季、娲、狱、塑、蛀、淘、埔、

荻、椒、莫、泡、暑、鳞、厦、槌、召、薯、执、嗖、冶、竖、逐、簿、罩、

煎、醋、序、晖、扭、俊、睦、滨、拘、径、驻、爪、饶、曼、陵、绊、偿

242 Wang Hui

0

500

1000

1500

2000

2500

字种 共有字 独有字

普通华文

高级华文

图 1 新加坡小学华文课本的字量

两套课本中包含不同字形的字种共计 2158 个,覆盖率分布如下(图 2):

5 16 32 59 105 173 278446

760

1069

1632

2158

0

500

1000

1500

2000

2500

10%

20%

30%

40%

50%

60%

70%

80%

90%

95%

99%

100%

图 2 新加坡小学华文课本用字覆盖率

图 2 清楚地显示了常用字集中的特点:760 个汉字就可以覆盖两套课本小学课本的

90%。这就是说,你认识前 760 个字,就可以读懂课本中 90%的文字。当覆盖率达到

95%的时候只需要 1069 个字。当覆盖率达到 99%的时候需要 1632 个字(图 2)。

2.3 中学课本的用字

A Quantitative Analysis on the Chinese Characters in Singapore Textbook Corpus 243

中学华文课本四套,共计 396 篇课文,31 万字,不同字形的字种量为 3648 个。其

中高级华文课本用字最多,达到 3474 个,华文(快捷课程)次之,为 2937 个;华文(普

通学术课程)、华文(普通工艺课程)课本的字量最少,分别仅有 2781 个和 1996 个。

课文篇数 字符数 汉字数 字种数 共有的字 独有的字

高级华文 130 128205 109206 3474 1826 601

华文(快捷课程) 102 81162 68385 2937 1826 22

华文

(普通学术课程)

84 62285 52152 2781 1826 3

华文

(普通工艺课程)

80 43880 36358 1996 1826 31

总计 396 315532 266101 3648 /

表 2 新加坡中学课本的字量

0

500

1000

1500

2000

2500

3000

3500

字种 共有字 独用字

高级华文

华文(快捷)

华文(普通学术)

华文(普通工艺)

图 3 新加坡中学华文课本的字量

从图 3 可以看出,四套课本共同的汉字只有 1826 个,占总字量的 50%。每套教材都有

一些独有的字,高级华文的独用字最多,601 个,如:

晖 冕 愈 喆 熙 腊 弼 凤 耿 癌 铙 灏 仑 桩 婉 嚎 筐

曰 痣 御 逊 顷 詹 颂 槛 潢 襟 亢 吏 棚 筠 娓 巍 褴

絮 鹰 歆 骋 荧 械 脖 揖 黛 蕴 揣 砸 茵 蔽 溯 睽

华文(快捷课程)独用字: 22

244 Wang Hui

瑾 杭 嵩 趾 诏 涵 郝 驴 俪 秤 辐 帼 骼 癫 熹 臀 阎

哝 谧 捂 仕 箧

华文(普通学术课程)独用字:3

卯 皙 噢

华文(普通工艺课程)独用字:31

吒 璋 艮 鲈 弈 彦 淇 哇 尿 舅 昵 嗯 喱 烤 靖 猾 廖 兀 蝇 砰 闽

懿 虢 沈 咛 郭 锥 镯 咚 嘟 郤

2.4 中小学课本的字量比较

(1) 普通华文

由于绝大部分学生修读“小学普通华文”和“中学华文(快捷课程)”,这是新加坡华

文教育的主流渠道,因此可以代表新加坡的华文教育水准。从字量上来看,中小学普

通华文课本共包括 3029 个汉字,其中小学 1832 个,中学 2937 个(其中 1197 个是新

字)。见表 3。

字种数 共有的字 独有的字

小学 1832 1740 92

中学 2937 1740 1197

总计 3029

表 3 新加坡普通华文课本的字量

小学课本用字的 95%(1740 个)在中学课本中仍然存在,以下 92 个例外:

秦 岳 鹿 旗 豆 俗 晖 韩 琴 亭 狐 狸 扣 匠 饼 沟 羽

蚊 稻 浇 谜 鬼 牧 辣 袖 椒 榜 郊 侄 蛙 逊 颈 鹰 螃

娃 哇 惰 尿 舅 叭 蚕 丙 喇 竽 烤 猾 榴 蚂 淳 汪 袜

蚁 冶 淹 遵 僻 戚 填 儒 耍 睦 顽 郭 乖 狡 荆 粥 瑞

蔬 丸 嗡 喔 轲 瑜 缇 萦 姆 狄 嫘 漱 歹 痰 羿 帚 勘

蛀 茧 荻 娲 埔 嗖 槌

(2) 高级华文

在新加坡,只有少数精英学生可以修读高级华文,这代表了新加坡华文教育的最

高水平。中小学课本共包含 3552 个字。其中小学阶段 2090 字,中学阶段 3474 字(其

中 1462 个是新字):

A Quantitative Analysis on the Chinese Characters in Singapore Textbook Corpus 245

字种数 共有的字 独有的字

小学 2090 2012 78

中学 3474 2012 1462

总计 3552 / /

表 4 新加坡高级华文课本的字量

小学课本中用字的 96%(2012 个)在中学课本中仍然存在,只有以下 78 个例外:

麦 嫂 乙 佗 臭 蝴 亏 桶 葡 啪 乒 乓 睬 钞 萄 帖 蚓 笆 叉 搽 锄 嵩

晾 膏 哇 菌 尿 芭 券 舅 鹦 喱 烤 猾 蝇 慎 虢 呱 霉 婴 讥 锈 甥 凹

啬 嗜 谎 蚯 舌 吝 凸 贼 蜘 鹉 呻 蛛 逵 吕 瑜 缇 萦 羸 晏 禹 漱 歹

痰 侁 帚 勘 糠 猩 荀 崂 梿 嘣 袁 侗

0

500

1000

1500

2000

2500

3000

3500

4000

小学 中学 总计

普通华文

高级华文

图 4 新加坡普通华文与高级华文课本的字量

图 4 显示,经过 10 年的中小学教育,新加坡高级华文课程比普通华文课程的汉

字量累计多出 523 个。

三、与中国大陆基础母语教育的字表比较

国家语委和国家教委于 1988 年 3 月 2 日联合发布的《现代汉语常用字表》是中

国大陆地区中小学汉语母语基础教育的依据。该字表分为一级常用字(2500 字)和二级

246 Wang Hui

次常用字(1000 字)两个部分。中国教育部颁布的《全日制义务教育语文课程标准(实

验稿) 》 明确指出,九年课程的总目标是“认识 3500 个左右常用汉字”,年级分配

如下:

第一学段(1~2 年级):认识常用汉字 1600~1800 个,其中 800~1000 个会写。

第二学段(3~4 年级):累计认识常用汉字 2500 个,其中 2000 个左右会写。

第三学段(5~6 年级):累计认识常用汉字 3000 个,其中 2500 个左右会写。

第四学段(7~9 年级):累计认识常用汉字 3500 个,其中 3000 个左右会写。

18322090

3000 3029

3553 3500

0

500

1000

1500

2000

2500

3000

3500

4000

小学 初中

普通华文

高级华文

中国大陆

图 5 新加坡华文课本与《现代汉语常用字表》(3500 字)比较

与中国大陆的基础母语教育相比,新加坡小学阶段的识字量少了 1000 多个,仅

相当于中国小学 3~4 年级的水平。中学阶段,这个差距则大大缩小,高级华文课本的

字量已达到 3553 字,达到了中国 9 年制义务教育的教学目标;普通华文课本只有 3029

字,相当于中国小学毕业水平。

从字种上看,无论新加坡中小学高级华文还是普通华文课本用字,都与 3500 常

用字表存在较大差异,见表 5。

字种数 不见于 3500 常用字表 3500 常用字

不见于华文课本

普通华文 3029 169(占 6%) 640 (占 18%)

高级华文 3553 417 (占 12%) 365 (占 10%)

现代汉语常用字表 3500

表 5 新加坡华文课本与 3500 常用字表比较

新加坡普通华文课本中有 169 个字、高级华文课本中有 417 个字不见于 3500 常

A Quantitative Analysis on the Chinese Characters in Singapore Textbook Corpus 247

用字表。在这两种课本中都出现,却不见于 3500 常用字表的,共计 119 个:

迸 殡 帛 嚓 蔡 嘈 搽 诧 婵 潺 谄 嫦 怅 炽 惆 踌 躇 辍 疵 萃 磋 眈

迪 遁 娥 彷 烽 腑 尬 尴 哽 呱 惚 徨 晖 姬 瘠 谏 拮 藉 矜 炯 赳 咎

桔 娟 抉 崛 喀 伉 瞌 叩 脍 徕 婪 镭 愣 罹 涟 羚 聆 禄 孪 嘛 蟒 髦

寐 魅 扪 冥 眸 妮 霓 哦 啪 蹒 抨 虔 樵 戎 孺 濡 啬 莎 姗 跚 嵩 缇

迢 眺 佗 哇 惟 嘻 羲 瑕 逍 潇 霄 莘 馨 栩 眩 焉 恙 曳 怡 咦 矣 诣

裔 萦 竽 瑜 芸 瘴 炙 粽 佐

相反,3500 常用字表中也有一些字不见于新加坡中小学课本:640 个字不见于

普通华文课本,365 字不见于高级华文课本,310 个字在两类课本中都没有,这主

要是在新加坡这个花园城市国家中罕见的物体或现象,包括:

一级常用字(35 个)

葵 笋 禾 秆 涝 窑 傅 剃 犁 桐 姥 挎 屯 炕 绢 杠 沈 锹 稼 熔 粱 浙

馒 坝 菠 晌 轧 雹 胳 骡 袄 螺 蒜 榆 柿

二级常用字(275 个)

缰 韭 荤 箕 鲫 冀 荚 茴 碱 磺 蒋 酵 秸 靖 鸠 隘 钾 嘿 卦 硅 憨 焊

翰 夯 蛔 壕 鹃 唬 沪 桦 淮 宦 蝗 蒿 琉 玖 咧 磷 檩 赁 翎 砾 蛉 荔

硫 馏 瘤 娄 篓 卢 菱 榔 蝌 抠 胯 傀 坤 澜 痢 琅 镐 儡 棱 楞 莉 鲤

沥 榄 茬 汞 鳖 瘪 濒 舶 渤 彪 杈 匾 碴 衩 掺 铛 椿 戳 蹭 蚌 氨 鞍

俺 拗 捌 靶 膘 梆 氮 焙 泵 荸 匕 秕 蓖 掰 芙 跺 讹 贰 筏 矾 樊 锉

凫 盹 钙 橄 肛 羔 篙 铝 麸 玷 埂 裆 蹬 嘀 嫡 掂 哆 佃 囤 碉 锭 蚪

痘 牍 墩 掸 碘 硝 檀 晤 犀 蟋 铣 锨 梧 腺 蜗 楔 蝎 芯 锌 邢 轩 舷

薇 颅 搪 笤 彤 瞳 捅 坞 鸵 靴 桅 纬 苇 猬 瓮 涡 驮 疹 辕 凿 喳 铡

乍 毡 漩 榛 蛹 吱 盅 肘 椎 锥 籽 蘸 姚 苔 汛 蚜 腌 蔫 堰 鸳 吆 淤

掖 谒 壹 胰 肄 缨 癣 鸯 坯 碳 碾 聂 镊 耙 胚 昵 硼 钠 坪 柒 嘁 脐

畦 鳍 砰 糜 姊 氯 蟆 幔 铆 楣 撵 咪 掐 闽 螟 馍 蘑 茉 拇 锰 黍 啥

杉 珊 苫 芍 笙 迄 秫 叁 庶 蟀 栓 涮 粟 嗦 虱 瘸 卤 乾 黔 嵌 呛 荞

砂 蛆 臊 瓤 攘 茸 榕 褥 飒 荠 氢

四、与对外汉语教学用的 HSK 字表相比

汉语水平考试(HSK)是专门为测量母语非汉语者外国人的汉语水平而设立的一

种标准化考试,主要依据是《汉语水平等级标准和等级大纲》和《汉语水平词汇与汉

248 Wang Hui

字等级大纲》。

该大纲的词汇范围(等级)分为 4 级:甲级词(1033 个)、乙级词(2018 个)、

丙级词(2202 个)和丁级词(3569 个),共 8822 个。

HSK 汉字库系统是由 HSK 词汇生成的。甲、乙、丙、丁四级词(8822)中共含

2864 个字。其中,除了以下 34 个字以外,都属于 3500 常用字范围内。

镑 甭 诧 谗 踌 躇 磋 阂 瑚 亢 馈 愣 珑 喽 嘛 髦 酶 镁 嗯 噢 哦 瞥

沏 淇 榷 饪 哇 惟 墟 暄 铀 曰 瞩 拽

新加坡中小学课本字表,无论普通华文(3029 字)还是高级华文(3553 字),都

超过了 HSK 字表(2864 字):

字种数 在 HSK 字表之外 HSK 字表在华文课本之外

普通华文 3029 415 250

高级华文 3553 812 124

HSK 字表 2864

表 6 新加坡华文课本与 HSK 字表比较

从数量上看,普通华文课本比 HSK 字表多 165 个字,高级华文课本比 HSK 字表

多 689 个字。

0

500

1000

1500

2000

2500

3000

3500

4000

字种数 HSK字表之外 华文课本之外

普通华文

高级华文

HSK字表

图 6 新加坡华文课本与 HSK 字表比较

A Quantitative Analysis on the Chinese Characters in Singapore Textbook Corpus 249

从字种上看,受地域文化因素影响,差异更加明显。普通华文课本中有 415 字不见于

HSK 字表,其中最高频的 50 个字是:

啊 朱 宋 秦 僧 岳 羲 匈 魏 刘 葛 粽 欧 侯 湘 羚 廷

蜊 蛤 伦 侠 莱 玛 吴 莺 晖 瑾 韩 椰 镭 丐 迪 佗 喧

祈 糯 囚 斋 潺 诺 眺 莎 遂 栩 莹 矮 尉 溢 萨 杖

高级华文课本中则有 812 字不见于 HSK 字表,其中最高频的 50 个字是:

魏 葛 粽 侯 欧 羚 赵 廷 侠 伦 莱 玛 吴 韩 莺 蔺 晖

镭 丐 虞 椰 佗 喧 冕 迪 祈 喆 糯 囚 斋 潺 熙 眺 莎

诺 琼 矮 蜀 弼 莹 禅

相反,HSK 字表中也有不见于新加坡中小学课本。不见于普通华文课本,计 250 字

癌 艾 隘 袄 捌 坝 掰 镑 雹 绷 甭 蔽 辨 脖 菠 舶 膊

簸 槽 蹭 掺 谗 馋 蝉 倡 驰 畴 疮 炊 捶 锤 窜 氮 蹬

掂 垫 刁 堵 镀 哆 舵 跺 讹 贰 阀 肪 纺 凤 傅 钙 秆

纲 杠 胳 梗 汞 棺 硅 焊 呵 禾 阂 嘿 瑚 槐 凰 蝗 贿

辑 嘉 稼 兼 碱 鉴 诫 茎 揪 灸 玖 绢 嚼 糠 亢 炕 抠

寇 挎 筐 葵 溃 馈 廓 腊 揽 廊 姥 潦 涝 棱 厘 犁 沥

隶 荔 粱 僚 淋 磷 玲 硫 瘤 珑 垄 拢 喽 赂 滤 铝 抡

啰 骡 螺 馒 酶 镁 檬 眯 泌 蔑 铭 蘑 亩 拇 穆 呐 嗯

捻 撵 拧 柠 噢 庞 赔 棚 膨 坯 屁 撇 瞥 剖 瀑 沏 柒

淇 掐 钳 嵌 锹 俏 芹 氢 蜻 顷 瘸 榷 饪 熔 腮 叁 砂

删 珊 晌 捎 绅 肾 蚀 柿 讼 颂 蒜 穗 笋 嗦 潭 碳 剃

蜓 桐 捅 屯 驮 椭 豌 桅 伪 瘟 诬 梧 勿 晤 纤 弦 宪

翔 淆 挟 械 锌 衅 杏 墟 絮 暄 靴 旬 汛 雁 秧 氧 窑

壹 译 蝇 榆 屿 御 愈 猿 曰 孕 蕴 砸 攒 凿 枣 轧 寨

瞻 彰 胀 芝 秩 宙 瞩 拽 桩 琢 咨 籽

不见于高级华文课本,计 124 字:

隘 袄 捌 坝 掰 扳 镑 雹 甭 菠 舶 蹭 掺 秤 囱 氮 蹬 掂 叼 哆 跺 讹

蛾 贰 辐 傅 钙 秆 杠 胳 汞 菇 硅 涵 焊 禾 嘿 瑚 蝗 霍 稼 茧 碱 姜

鲸 玖 绢 炕 抠 挎 葵 馈 姥 涝 棱 犁 沥 荔 镰 粱 磷 硫 瘤 喽 驴 铝

骡 螺 馒 酶 镁 蘑 姆 拇 嗯 撵 噢 刨 坯 沏 柒 淇 掐 嵌 锹 氢 瘸 熔

叁 砂 珊 晌 屎 柿 蒜 笋 嗦 汰 碳 剃 桐 捅 屯 驮 桅 巫 梧 晤 锌 靴

汛 窑 谣 液 壹 樱 铀 榆 凿 轧 辙 筝 拽 籽

250 Wang Hui

五、结语

本文在新加坡教材语料库基础上,对新加坡中小学课本用字情况进行全面调查分

析,结果发现:

a. 小学(6年)普通华文课程的字量为1832个,高级华文课程为2090个。

b. 初中(4年)普通华文课程的字量为3029个;高级华文课程为3553字。

与中国大陆基础母语教育相比,新加坡华文教育中的汉字量偏低:小学毕业时,

新加坡学生的识字量比同等程度的中国小学生少 1000 余字,仅相当于中国小学 3 年

级水平;初中毕业时,大部分学生的识字量为 3000 字,相当于中国小学 6 年级水平,

但修读高级华文课程的学生的识字量则为 3500 字,达到了中国 9 年制义务教育的教

学目标。

但与面向母语非汉语者的对外汉语教育相比,新加坡华文教育中的汉字量则偏

高,无论普通华文课程(3029 字)还是高级华文课程(3553 字),都超过了 HSK 的 4

级字表(2864 字)。

这清楚地表明了新加坡华文教育的一个重要特点:既不同于华文作为第一语言的

母语教学,也不同于把华文作为第二语言的对外汉语教学,而是介于二者之间的第三

种状态:汉语是作为第二语言的母语教学。

通过与中国《现代汉语常用字表》(3500 字)与 HSK 字表的对比,我们还发现,

随着国际交流的日趋紧密,跨国家、跨地区的常用字趋同性很高,不同的华语社团共

同使用的字比例非常高。但“大同”之下也仍存在不可忽视的“小异”,一个国家地区的

字词使用情况,受当地的文化、社会、时代等因素影响很大。因此,华文教育要立足

本地语言使用的实际状况,同时注意兼顾“共性”与“个性”。

参考文献

Gramley, Stephan, 2001, The vocabulary of world English. London : Arnold.

Lu, Yuanwen, 2002, A corpus-based study of lexical behaviour in Chinese learner English.

Thesis (Ph.D.)--Dept. of English Language & Literature, National University of

Singapore.

Ooi, Vincent Beng Yeow, 1998, Computer corpus lexicography. Edinburgh: Edinburgh

University Press.

Schmitt, Norbert, 2000, Vocabulary in language teaching. New York: Cambridge

University Press.

国家语言文字工作委员会汉字处编,《现代汉语常用字表》 ,北京: 语文出版社, 1988.

A Quantitative Analysis on the Chinese Characters in Singapore Textbook Corpus 251

国家对外汉语教学领导小组办公室汉语水平考试部,《汉语水平词汇与汉字等级大

纲》,北京: 北京语言学院出版社, 1992.

国家语言文字工作委员会,国家标准局编,《 现代汉语字频统计表》北京: 语文出版

社, 1992.

李金生, 2001, 《新加坡华文敎育原始文献叙录初编》,新加坡: 新加坡国立大学中文

图书馆.

汪惠迪, 2002, 《华文字词句》,新加坡: 玲子传媒私人有限公司.

周淸海, 1998,《华文敎学应走的路向》,新加坡: 南洋理工大学中华語言文化中心.

252 Wang Hui

A Quantitative Analysis on the Chinese Characters

in Singapore Textbook Corpus

Wang Hui

National University of Singapore, Singapore 117570

[email protected]

Abstract:

This research has carried out a full-scale corpus analysis on Singapore Chinese characters

in Primary and Secondary Schools’ levels. The resulting analysis provides a scientific and

empirically based Chinese character list for curriculum development. There are also

implications of Singapore Mandarin as part of “World Chinese”. Increasing globalization

has caused significant overlap in the most frequently-used Chinese characters of China,

Taiwan, Hong Kong, Malaysia, Singapore and other countries or territories. The small

differences are due to the specific cultures and societies. Chinese Language education

should strike a balance between the learning of common charactes as well as preserve

local flavour.

Keyword:

Singapore Mandarin, Chinese Characters teaching, textbook corpus, character frequency