40
第八章 心理与教育测验的编制与实施 李中权 博士 南京大学社会学院心理系 [email protected]

第八章 心理与教育测验的编制与实施media.njude.com.cn/pub/ZF_CPS/Courses/pdf/08202A/ch8_1_1.pdf · 测验编制 编制测验的基本 ... 的评定是一致的。 要求

  • Upload
    others

  • View
    41

  • Download
    0

Embed Size (px)

Citation preview

第八章心理与教育测验的编制与实施

李中权 博士

南京大学社会学院心理系

[email protected]

测验编制

编制测验的基本程序

确定测验目的

制定编题计划

编辑测验项目

预测与分析

合成测验

测验标准化

确定测验目的

测量对象

什么个人或团体,如16岁以上成年人

测量目标

什么内容,如能力、人格或学业成绩

测量用途

干什么,如描述、诊断、预测

制定编题计划

整体构思

全面且具有代表性的测验内容

各内容点的重要程度

用途

比照计划,核对项目

参考计分

测验建构的基础或途径

基于逻辑或内容:考虑行为的领域范围并进行相应的度量(如教育测验)

基于理论:根据一种理论编写出能够反映理论构想的题目(如Myers-Briggs Type Indicator 或MBTI基于荣格的类型论)

基于外部效标:选择那些能够将个体或群体做出区分的题目(如MMPI,CPI,罗夏墨迹测验等)

基于经验

双向细目表(table of specification)

一种标明测验所包含的内容和要测定的技能(构想)以及每一个内容、技能的相对重要程度的表格。

可能是多向的,不限于双向。

要目标明确

小学自然常识测验编题计划测验

教材 目标

内容知识 理解 应用 分析 综合 评价 合计

生物世界 3 5 6 3 2 1 20

资源利用 2 3 3 1 1 0 10

动力和机械 2 3 4 2 0 1 12

物质、物性与能量

5 6 8 3 2 1 25

气象 2 4 3 2 2 0 13

宇宙 2 5 4 1 0 0 12

地球 2 2 2 1 1 0 8

合计 18 28 30 13 8 3 100

注:表中的数字代表每一类题目所占的百分比

编辑测验项目

收集测验资料

资料要丰富

资料要有普遍性

资料要有趣味性

选择项目形式

主观题:论述题、简答题、填空题

客观题:是非题、匹配题、选择题

编写测验项目

论述题

示例 指导语:下面每道项目的答案都要写半页纸。

比较论述题与客观题的优缺点

优点: 可测受测者的组织、联系和沟通的能力 可测客观题不易评价的行为 减少编题时间 降低受测者的猜测率

缺点: 含义模糊 答题费时,内容取样有限 评分主观耗时

简答题或填空题

示例 请简要说明编制一个预测工作绩效的测验,正式的第一步

是什么?

优点 容易编制

可测比再认更高级的知识或能力

缺点 不适合测量复杂的教育目标

评分并非完全客观

是非题

示例: 指导语:如果句子正确,在T上画圈;如果句子错误,在F

上画圈。 T F 最全面的测验分类系统是心理测量年鉴上的分类系统。

优点 编制和作答容易省时

可对内容广泛取样

缺点 过分关注细节,鼓励机械记忆

无法测量更复杂的教育目标

容易受猜测的影响

匹配题

示例 指导语:在第一栏中空白处写上字母,这些字母代表

第二栏中与之相对应的正确人名。

A. 比纳(Binet) B. 达尔文(Darwin) C.高尔顿(Galton) D. 奥蒂斯(Otis) E. 皮尔逊(Pearson) G. 斯皮尔曼(Spearman) H.斯特朗(Strong) I. 武德沃斯(Woodworth)

___1 团体智力测验

___2 个别智力测验

___3 兴趣问卷

___4 人格问卷

___5 积差相关

___6 感觉运动测验

匹配题的编写注意点

优点

容易编制

包含材料更加有效

缺点

只能测量事实之类的机械记忆

必须使选项同质 ,限制能用来匹配的材料类型

指导原则

以清晰、合乎逻辑的格式安排前提和反应选项,前提写在左栏,反应选项写在右栏

如果使用6-15个前提,则反应选项应比前提多2到3个

在前提前面标好连续数字,在反应选项前面标好字母(a,b,c等等)

明确指定匹配方法

把整个项目置于同一页

选择题

示例 指导语:在每个项目左边的空白处写上代表正确选项的字

母。

基姆,八岁零四个月,其心理年龄得分是九岁零五个月。他的比率智商是多少?

A. 88 B.90 C.113 D.120

优点 施测省时,保证取样的广泛性

评分客观,阅卷方便

缺点 答案固定,无法测量组织材料的能力和创造力

编写好的项目不容易

其他:人格

是非题 我喜欢从事有冒险性的工作

李克特评定量表:5点或7点评定

朋友们通常把我看成是一个潇洒的人

使用特殊符号 用于态度调查

你对XXX电视节目有什么看法?

2 3 4 51

很不象我 非常象我

测验项目编写小结

测验项目的取样应当对欲测心理品质具有代表性

测验项目的取材范围要同编题计划所列项目范围相一致

测验项目的难度应有一定的分布范围

编写测验项目的用语要力求精炼简短

初编题目的数量要多于最终所需要的数量

测验项目的说明必须简明

预测

预测

获得被试对测验项目做何反应的资料

信息内容:质性和量化

预测的注意点:

预测对象

预测情境

预测时限

反应记录

项目分析

对预测结果进行分析:质性和量化

主要指标 分数分布

难度

区分度

选择率

……

根据项目分析结果,删除、修改和重新编制题目

多次往复的过程(试测-项目分析-项目修改)

合成测验

把经过试测以后证明有价值的项目排成有组织的测验

涉及两个问题:

测验项目的选择

测验项目的编排

合成测验

测验项目的选择

测验的性质

项目的难度

项目的区分度

合成测验

项目的编排

总的原则:由易到难

常见排列方式: 并列直进式

将整个测验按测验项目材料归为若干分测验,在同一分测验的测验项目中,则依其难度由易到难排列

混合螺旋式

先将各类测验项目依难度分成若干不同的层次,再将不同性质的测验项目予以组合,作交叉式的排列,其难度则渐次升进

编制复本

复本条件

测同一种心理特质

具有相同的内容和形式

不含重复的项目

项目数量相等,且难度和区分度大体相同

编制方法

将所有可用的项目按难度排列,并编号

采用类似ABBA的方式分配题目

试测确保复本等值

测验标准化

标准化:测验的编制、施测、评分以及解释测验分数的程度的一致性。

四个方面:

测验内容

施测过程

测验评分

测验分数解释

测验标准化

测验内容

施测相同或等值的题目

内容不同,测验结果将无法比较

施测过程

测验情境

指导语:测验目的、如何反应

测验时限

测验标准化

测验评分

评分客观性:两个或以上的评分者对同一份测验试卷的评定是一致的。

要求

对反应要及时清楚地记录

要有一张标准答案或正确反应的表格,即记分键

将受测者的反应与记分键比较

测验标准化

测验分数的解释

测验结果解释的标准化

与一定的参照标准比较

常模

鉴定测验

指标

信度

效度

测验量表与常模 测验量表:百分等级量表、标准分数量表等

常模表

编写测验说明书

包含内容

测验的目的与功用

测验的理论依据

测验内容及实施测验的方法

测验的标准答案和评分方法

有关测验信度、效度资料的说明

常模表

测验设计与编制小结

测验编制的基本程序 确定测验目的

制定编题计划

编辑测验项目

预测与分析

合成测验

测验标准化

鉴定测验

编写测验说明书

测验出版

测验实施

测验的实施过程

减少施测过程对测验分数的影响

测验的计分过程

减少评分环节对测验分数的影响

测验分数的解释过程

避免对受测者的负面影响

测验的施测

通过观察受测者在测验情境中的行为样本,推断其平日的一般行为特征

测验分数不仅决定于测量工具本身,也受测验过程的影响

影响因素:主试、受测者、测验情境

施测前的准备工作

准备好测验材料

把施测中所要用到的材料按一定顺序放置在适当的地方,使受测者易于看到和找到

熟练掌握施测手续

训练: (1)测验内容(2)施测步骤(3)记分方法(4)解释分数的技术

熟练使用测验指导语

熟记测验指导语并能用口语清楚而流利地说出来

施测过程

指导语

对测验目的的说明和对题目反应方式的解释

测验的主持者和指导语都应该保持中立的态度

标准时间限制(能力和成就测验)

测验情境

包括测验场地(通风、光线、噪音)、座位、答案纸型以及施测者的特征(行为、年龄、性别、表情)等。

标准化测验场景安排

施测过程

测验焦虑 被试因接受测验而产生的一种忧虑和紧张情绪,它会影响

测验结果的真实性。

轻微的测验焦虑会增加测验效果,但焦虑太高或毫无焦虑,则会降低测验效果

影响因素:能力、抱负水平、竞争性测验

正确做法:通过保证测验结果绝对保密或鼓励被试等方法稳定被试情绪

错误做法:(1)以测验来威胁被试,以使被试循规蹈矩;(2)警告被试一定要尽力,因为“这项测验很重要”(3)告诉被试答题要快,只有这样才能在规定的时间内答完所有题(4)恐吓被试说“如果测验失败,会有严重的不良后果。”

施测过程

与受测者建立良好的协调关系 施测者努力设法引起受测者对测验的兴趣,取得他的合作,以

保证他能够按照标准测验指导语行事 建立关系技巧

根据测验性质、受测者的年龄以及其他特点灵活掌握 鼓励为主,如“没有人能正确答出所有这些题目” 不可给提示、暗示或任何方式的帮助

评分技术 论述型测验的计分 客观题的计分 其他议题

人工计分 评分模板 机器评分

测验分数的解释

Goldman三维度的解释模型 解释测验分数的类型

叙述的解释

溯因的解释

预测的解释

评价的解释

资料处理的方法 机械的处理

非机械的处理

资料的来源 测验资料

非测验资料

解释方式:4×2×2

测验分数的解释

解释测验分数的类型

叙述的解释 描述个人的心理特征状态

溯因的解释 追溯过去以解释个人目前的发展情况

预测的解释 推估个人未来的可能发展情形

评价的解释 做价值的判断或做决定

测验分数的解释

基本原则

主试应充分了解测验的性质与功能

对导致测验结果的原因的解释应慎重,谨防片面极端

必须充分估计测验的常模和效度的局限性

解释分数应参考其他有关资料

应以“一段分数”而非“特定数值”来解释

对来自不同测验的分数不能直接加以比较

如何向受测者报告测验分数

基本原则 使用当事人能理解的语言

保证当事人知道这个测验测量或预测什么

常模参照解释应明确参照的团体

让当事人认识到分数只是个估计

使当事人知道如何运用他的分数

要考虑测验分数将给受测者带来什么影响

测验结果应对无关人员保密

对低分者的解释应谨慎小心

设法了解当事人的心理感受,并适当引导

让当事人参与分数解释

小结

测验实施的注意点

测验计分的注意点

测验分数解释的基本原则

测验分数报告的基本原则