bbs.pku.edu.cn¿ƒ理测量... · Web viewChap 1. Introduction. 概念；测验类型；量表编制程序；编制中的统计；测验使用过程中的伦理. 心理测量历史上的重大发展

心测复习材料 BBS&陈娜&孙睿 2010

Chap 1. Introduction

概念；测验类型；量表编制程序；编制中的统计；测验使用过程中的伦理心理测量历史上的重大发展 --[南朝]刘勰《新论-专学》：“使左手画方右手画圆，无一俱成。” --19 世纪：区分智力落后和精神病的需要

--Sir Francis Galton: 测量个体差异 (学生)Karl Pearson: 发展测量个体差异所需的统计方法

--James Mckeen Cattell: 反应时；量化测量--Charles Edward Spearman: 因素分析

(学生)Raymond B Cattell:16PF

David Wechsler: 韦氏智力测验发展趋势： >测验技术不断成熟，评定信效度的标准不断统一； >成为心理学家的有利工具，也产生心理测量的专业分支和职业 >统计技术和计算机技术的帮助 >跟注重效度的研究 >更注重跨文化研究和地区人群的适用性

心理测验相关概念 test 依据法侧给事物分派数字 >>不一定具有自然数系统的功能 psychological test (间接测量)

--用于测量个体那些和行为相关的性格的一系列条目


--彭凯平：“通过观察人的少数有代表性的行为，对于贯穿在人的行为活动中的心理特征，依据一定的原则进行推论和数量化的一种科学手段。”

心理测验的 5 个基本要素-行为样本 sample of behavior

-标准化 standardization

测验编制、施测、计分和测验分数解释的一致性，保证所有被试的施测条件相同，减少无关因素的影响，以便测验结果可以进行比较，从而保证测验的准确性和客观性。

标准化的过程：>有专门的测验编制者来编制测验；>有施测和计分的标准指示语；>有代表性的常模

-难度的客观测量 objective mesurement of difficulty

项目鉴别指数 D=PH-PL

“天花板效应”、“地板效应”-信度 reliability

测验结果的一致性，包括时间、内容、不同评定者之间的一致性等-效度 validity

测量结果的有效性、正确性和精确性

测验类型


achievement：成就测验，对已学过的东西的测验/测量某学科或训练的成绩，反映个体达到的能力程度

personality: 人格测验, 测量被试的情绪, 兴趣, 动机, 性格, 态度和价值观等非认知特点aptitude：性向测验/能力倾向测验，对掌握特定技能的潜力的测验/测量人潜在的某种

才能，了解其发展倾向/个体从未来训练中受益的可能intelligence 智力测验，测量人的一般能力

**比较能力测验和人格测验：能力测验和已掌握的能力和潜力有关；而人格测验和内隐、外显的个体变量有关

**比较结构化的人格测验和投射测验：结构化的人格测验通常向被试提供一些陈述，并采用自我报告法，要求被试在两个或多个选项中选择，如“true”“false”；而投射测验不是结构化的，刺激和要求的反应都是模糊的。

其它 overt/covert behavior

公开的行为——个体的可以观测到的、外显的行为/内隐的行为 test battery

成套测验，指两个或多个测验合在一起的测验 representative sample

代表性样本，由和测验要被应用于的人群在各个方面都相似的一群个体组成Chap 2. Norms and Basic Statistics for Testing

测验量表的三个重要方面（properties of scales） magnitude

“大小”，即是否能够区分被测量属性的更大、更小或相等，也就是量表有无数量意义。一切非命名的量表都有 magnitude，命名量表没有。

equal intervals


相同距离，量表上任意位置的两点间的实际距离等于另一位置有相同计量差别的两点间的实际距离。等距量表、比例量表有，命名、顺序无。

absolute 0

绝对零点是否存在。只有比例量表有绝对零点。 properties of scales 在测量中的重要性

三个 properties of scales决定了四种不同的量表——命名、顺序、等距、比例。不同种类的量表适用于不同的运算。如等距量表不能乘除。

适合不同类型量表统计方法：命名—百分比、频数、众数、卡方检验顺序—百分位数、中数、等级相关等距&等比—均值、标准差、积差相关、T、F

建立分数分布的方法为什么是可行的？ *？*

常模：常模团体的测验分数分布，我们解释测验的基础norm: 特定测验中有代表性的特定群体的表现

--全国常模、地区常模、特殊群体常模--年龄常模、标准分常模、百分位常模

norm-reference test参照常模前者将个体得分和常模比较，以确定个体在常模中的位置。常模团体：用以比较测验分数的参照团体，它是具有某种共同特征的组成的群体

**在做常模参照分数的解释时，必须考虑常模团体的组成！>如何选择常模团体：对特定群体施测，分析其表现

--群体明确；特征、团体的分布状态和差异


--代表性样本：抽样规则—简单随机、系统（K=N/n）、分组、条目（题目）抽样--取样大小（总体人数、研究需要、团体特征、试测结果（标准差/标准误）2）--常模的时间--一般常模&特殊常模

常模类型和解释发展常模（e.g. 智力年龄）--年龄、年级、发展顺序将常模建立与 notion of tracking 相联系

>tracking

个体和他的同龄人处在相同水平的趋势，eg身高&体重。>可建立不同年龄个体发展的常模，反映了体的普遍的发展趋势，对医学很有用，如果个体发展偏离了 tracking，可能就有问题。

百分位常模常模团体中低于某个分数的人数百分比

标准分常模通过均值和标准差的转换分数—线性转换、常态化--线形转化：由原始分数转换成标准分数之后，只改变了分布的平均数和标准差，并不改变分布的形态。Z=A+Bz A 为目标分布的均值，B 为标准差，z 为标准的 z 分数

>>Z 分数Z 分数可以判断一个分数在整体分布中的位置Z 分数的均值为 0，标准差为 1

--常态化：算出原始分数的累积百分比，根据所占面积求出相应的 Z 分数，再 Z=A+Bz

**当且仅当分布正态时，线形转化和常态化的结果相同 ↓


标准正态分布中，一定的 Z 分数和百分位距相对应 e.g. McCall’s T

一种把 Z 分数转换为标准分的做法原始分——Z 分数——标准分 T=10Z+50

不改变原始分的分布形状，只是标准化，而非正态化 quartiles，deciles，stanines

quartile 将分布四分的点——interquartile range 四分位距 25%到 75%之间 decile 将分布十分的点 stanines [standard nine] 标准九分九分分别对应分布中的不同百分比：4 7 12 17 20 17 12 7 4

z 分数 T 分数标准九标准十标准二十平均数 0 50 5 5 10

标准差 1 10 2 1.5 3

离差智商比率智商IQ=100+15Z IQ=MA（mental age 心理年龄）/CA（chronological age 生理年龄）**不同测验得到的分数仅在标准差相同时才有可比性

其它 descriptive/inferential statistics

描述统计/推理统计（由一小群人[样本]的观察推理一大群个体[总体]的情况） frequency distribution

频率分布，代表每一个值被观察到的频繁程度 class interval

频率分布中横轴的单位 percentile rank


有多少百分比的分数比这个分数更低 criterion reference test参照效标

后者是关于个体对特定技能的掌握情况，用以帮助个体发展，而不把个体之间的得分进行比较。结果参照分数—效标直接与测验结果的解释结合内容参照分数—被试对特定内容或技能的掌握和熟悉程度，80%-90%通过的分数为标准

Chapter3 测验的编制一般步骤

1. 确定测验目的--对象：被试及其特征（人口学特征、SES、智力、文化背景 etc）--目的：现实性/预测性--目标：即行为样本任务分析，内容分析（双向细目表）

2. 指定编题计划--通常是一张双向细目表，指出测验所包含的内容和要测定的各种技能，以及对每一

个内容、技能的重视程度3. 编辑项目或题目

--充分搜集材料；多种方式采集行为样本；质性材料；了解已有的相关量表--选择项目形式；考虑测验目的、材料性质、受测对象特点等因素--编写修订题目


4. 项目的测试和分析--记录对象；施测的过程和情境；时限；反应情形等--进行项目分析（探索性和验证性因素分析的被试不能相同）

5. 合成测验--选择、编排项目--合成复本 alternate forms（各复本必须等值！）

6. 将测验标准化--内容--施测：指示语、时限--评分：对现场反应的记录；计分键；两者比较以对反应进行分类--常模

7. 对测验的鉴定--信度 --效度

8. 编写测验说明书--测验的目的和功用--理论背景和选择题目的根据--实施方法、时限和注意事项--标准答案和评分方法--常模资料--信效度资料

相关技术>>命题的一般原则


1-题目符合测试目的 2-内容取样有代表性 3-题目格式不会导致被试误解 4-文句简明扼要 5-有不会引起争议的确定答案（人格、创造力测验除外） 6-各题目彼此独立 7-题目中不暗含本题或其他题目的答案线索 8-题目内容不超出受测团体的知识能力 9-问题尽量避免涉及社会禁忌和个人隐私 10-施测和评分方便省时

¤ 选择一个假设的构念，描述你将怎样开发一个测量方法eg LOVE

编制一个包含很多关于爱、喜欢等亲密关系的量表，来自于读各种材料将这个量表给很多学生施测，对象分别是 lover 和 friend

分别做因素分析确定维度分析对 lover 和 friend 在哪些 item 上有不同制订出成型的量表各种施测——量表和结婚可能性之间的相关，量表分数的高低和真实情境中二人爱

的表现频率的高低…… 项目鉴别--难度 0.4-0.5 左右 1)通过率 P=n 通过人数/N总人数 *100%


选择题难度校正 CP=(KP-1)/(k-1)

2)常态化分布题的难度值=均值+标准差*z

--项目鉴别指数 D=PH-PL 一般要求>.30 >.40 则很好--特征曲线（一个项目一条曲线）横坐标按得分的高中低组（或 ABCDE 等）；纵坐标在这一题上的通过比率Chap 4. Reliability—error free, accurate,consistent

测量误差 error=X-T（观测值-真实值）多次测量带来的 error 的分布是钟型的正态分布，标准误是这个分布的标准差。标准误告诉我们测量和真实分数之间的差别

随机误差（被试、任务、环境、样本代表性、计分过程）；系统误差 reliability: 测量结果的一致性、稳定性和可靠性

信度系数：观测变异（方差）中能够解释真实变异（方差）的百分比群体>.70 个体>.85 但是有些临床测量要求 0.95

重测信度——测验的稳定性将同一测验对同一群体施测两次，注意间隔时间，只适用于稳定特质※ carryover effect

第一次测验对第二次测验的影响，可能造成对信度的高估。只有当两次测验间可能的变化是随机而不是系统（所有人分数都加了 5 分）时，才用考虑 carryover effect。

Practice effect 就是 carryover effect 的例子。重测信度与分半信度的比较


分半信度是求同一份测验中两部分之间的相关，重测是一段时间之后将测验再次实测一次并求相关。※ 分半信度为何减少了实际信度，如何弥补？缩小了测验的长度，用 Spearman-Brown公式:r ’=

kr1+(k−1)r 分半时 k=2

coefficient alpha

内部一致性（internal consistency）衡量测量中的不同 item 在多大程度上测量的是同一个东西

α是对内部一致性的信度测量中，最普遍和通用的，而不是 KR20 那样仅对回答有正误之分的测量才适用

分量表之间的 α 可能不高，而分量表之内的 α 一般比较高使用 α 系数的测验必须全部完成！

信度的影响因素--测验的长度、难度（难度适当应使得分范围较大）；--测验的时间间隔和环境--项目和因素内部的同质性--样本大小

怎样增加测验的信度增加测验的题目数量

根据 domain sampling model，从 domain 中取样越多，取样误差越小，因此增加题目数量可以增加信度，但注意新加题目一定和原有题目要是同质的

过长的测验可能带来新的误差源因素分析和项目分析


因素分析以确定维度，单维度为佳，不在这个维度上的题目去除项目分析这里说的是 discriminability analysis，即做每个题目和其它题目及总分的

相关，相关太低的去除（测的不是同一东西 or 天花板地板效应出现）。其它

domain/domain sampling

domain 是和某一构念相关的极大的题目（ item）的集合，domain sampling 是从domain 中取样，用有限个 item 代表 domain，可能带来取样误差

interrater，interscorer，interobserver，interjudge reliability

都代表行为观察研究中的信度，即不同观察者之间的相关性，可用 Kappa 统计量。误差来源与信度测量方法

Source of errors 信度测量方法Time sampling 跨时间稳定重测信度Item sampling 项目等价复本信度Internal consistency 内部一致性all items measure same thing

分半信度、KR20、α

Observer differences 评价者差异 Kappa statistic

Chap 5. Validity

效度：测量工具或手段能够准确测出所需测量的事物的程度 / 所测量到的结果反映所想要考察内容的程度(从测验分数中得出的某一特定推论的准确性、真实性和有效性)

与测量目标有关的真实方差占总分方差的比率，是测验结果的准确性程度效度=与测量目标有关的真实方差/总方差

与测量目标有关的真实方差 = (总分方差- 随机误差的方差)- 系统误差方差↓


真实分数的方差信度=真实分数的方差/总方差效度分类

转化效度 translation ～表面效度 face ～内容效度 contend ～

效标关联效度 criterion-related ～同时效度 concurrent ～预测效度 predictive ～

构想效度 construct-related ～理论作用，能否证实假设汇聚效度 convergent ～与之相关的 constructs

区分效度 discriminant ～与之无关的 constructs

construct：sth built by mental synthesis *合适的翻译*

**因素分析！分析行为内部关系，找到潜在的共同因素或特质，用于构想效度的研究

内容效度行为代表明确有代表性、项目结构与行为总体结构一致、成绩不受无关因素影响是除了表面效度之外，唯一一个基于逻辑而不是统计的效度主要由专家来评定

同时效度&预测效度同时效度是测验能否预测同时施测的效标，而预测效度则是能否预测一段时间之后施测的效标※ 解释效度时要考虑的问题


找寻关系变化的可能性思考效标的意义回顾取样的选择样本大小不要将效标与预测相混淆检查效标与预测的限制范围考虑泛化的局限

Chap 6. Test Administration and Scoring

实施测验的程序标准化——反应形式；如何记录反应；时限；被试难以确定答案时的指导；例题时限——考虑测试目的和被试特点；预实验确定时间；时间段的安排实测环境——有特殊因素要记录，并在解释结果时加以考虑计算机辅助好处：标准化的测验实施，偏差较少

精确的时间控制阻止被试回去看前面的题目或提前看后面的题目可以安排个人化的独特的施测，如改变题目呈现的顺序解放了主试，主试可以做其它任务

坏处！！（可能要考，钟杰上课提到过）无经验的研究者可能会误解电脑报告的结果有些软件有问题，这些问题很难被检验

有些程序建立在过时的数据库上


主试的职责--测验前：预告测验；熟悉材料、指示语、程序；保证环境合适；防止作弊--测验中：遵从指示语；不讲无关话；对特殊问题有准备

是不是绝大多数研究证明对于白人作为主试妨碍了黑人儿童的智力测验水平？不是，绝大多数都没有证明。

测验实施者和被试之间的关系怎样影响测验分数被试对熟悉的主试，测验结果更好主试对熟悉的被试在测验和计分时都可能受到期望效应的影响

期望效应怎样影响测验分数--期望效应 expectancy effects——实验者的期望会影响测验得分--期望带来微妙的非言语的交流，对被试有鼓励作用--期望也会影响计分--不是所有关于期望效应的研究都证实了期望效应的存在

测验分数和强化特定反应之间的关系言语的鼓励（U R doing well）or外部的奖励（candy、money）都有强化作用态度上的鼓励（点头）也有强化作用反馈的不一致会极大影响测验，甚至让被试习得性无助标准化的情境下，一般不允许给被试任何反馈

哪些因素在解释测验分数的时候应该被考虑到被试的动机和焦虑

考试焦虑 test anxiety——三个成分：担忧、情绪化、缺少自信


身体状况练习因素反应定势施测方式（问卷、当面访谈、电话 etc）

chapter7. 伦理善行-为人福祉避免伤人-避免一切可能的、故意不故意的公正- 公正公平对待所有受试者及其他人利益自主权-思想&行为忠实-忠于专业，不欺骗、剥削受试者>>具体方面测验的依据；测验的使用；知情同意；测验数据的公开；（仅在法律或法庭要求下才可）测验构建；不合格者实行的评估；陈旧过时的测验结果（常模）；计分和统计；结果解释；保持测验安全性


Chap 8. 智力测验—一种一般能力倾向测验比奈和其他心理学家怎样定义 intelligence

斯皮尔曼的 g-s 因素与卡特尔的 f-c 的比较 g 因素理论

智力由一个总的因素（g）和一系列特殊的因素（s）构成支持：所有的测验任务之间都有正相关，证明它们都被 g 因素影响为证明 g 因素，斯皮尔曼开发了因素分析。g 因素就是因素分析中主成分分析法

的第一个未经旋转的因子任务越多，越广泛，g 因素越明显

gf-gc 理论 gf 流体智力，gc 晶体智力比奈测验也由最先只考虑一个因素发展到现在同时考虑 gc 和 gf

智力测验：使用标准化的量表对被试施加刺激，从其反应中测量智力的高低第一个智力量表：1905 Binet-Simon 量表（适用于儿童）

比奈关于测验构建的两个原则 age differentiation 年龄分化

年龄分化是指个体的心理能力可以达到更高年龄者的水平，也可能只能达到更低年龄者的水平

比奈把一个年龄下 2/3—3/4 的个体能完成的任务作为这个年龄可以完成的任务 mental age 心理年龄——个体相应的心理能力达到的年龄水平

general mental ability 一般心理能力


定义：智力的多个维度和元素的总和的产物比奈未界定单个智力元素，而是采用整体智力的视角

比率智商 intelligence quotient（IQ） IQ=MA/CA（mental age/chronological age）前提假设是智力发展和年龄成正比；1916版的比奈测验最先提出，心理能力的上限是 19.5，生理年龄的上限是 16

离差智商认为每个年龄儿童智商分布成正态，个体智力高低由其与同龄智力分布的离差大小决定--斯坦福-比内（2y~成人）均值 100，标准差 16

--韦氏（2~7；7~16；16 以上）均值 100，标准差 15

其它2003版（最新版）的比奈量表：5 个分测验——语言推理、数量推理、抽象-视觉推理、短时记忆、知识

（ppt 上没有“知识”这一晶体智力分测验）

编制 Wechsler scales 的动机比奈测验缺少对智力活动中的非智力因素的考虑比奈测验对成人不适用※ 缺少理论基础

包括四因素：言语理解；知觉组织；加工速度；克服分心韦氏的三大优点

用 point scale（题目按难度排列）而不是 age scale（题目按照年龄任务排列）


包括 performance scale

包括成人量表 point and performance scale concepts

point scale concepts age scale

题目按照年龄来组织，每一年龄的题目包含各个领域；若没有达到某一年龄的通过标准，完成的题目就没有意义了。

point scale

题目是按照内容和难度来组织的，而不是按照年龄来组织的；可以计算各个领域的得分每一个通过的题目都有意义，用于计算这一领域的得分。

performance scale concepts

克服了比奈量表着重语言、文化的缺点测量非语言的智力——操作智力分语言量表和操作量表

区分 verbal/performance scales

verbal 包含和语言相关的思考部分，包含 7 subtests

performance 则是和动作有关的完成动作部分，也包含 7 subtests

解释 Weschsler scales怎样决定 IQ

verbal 、performance 和 full IQ

原始分转换为标准分或测量得分（standard or scaled scores，均值 10，标准差3）

相加各个 subtests 的标准分，与常模比较（常模均值 100，标准差 15）70 以下 70-79 80-89 90-109 110-119 120-129 130 以上


智力缺陷低能边缘中下中等中上优秀极优秀※ 团体差异——性别；文化和教育（Raven）；种族；社会经济地位

其它能力测验SAT，GRE

考夫曼成套儿童测验；画图测验……etc

>>相比于 Binet 和 Wechsler 的优缺点能够测量特殊能力如运动、音乐、美术等；不依赖语言和文化能够减少体能、感知觉、语言和文化的影响※ 理论基础不够，可能过度解释※ 需参照其他标准，尤其是显示出问题时

Chap 9. 人格测验人格：个体所具有的所有品质、特性和行为等个别差异的总和，用以表述个体典型而稳

定的行为模式理论基础：精神分析、特质理论、人本主义等常用测验方法：

客观/结构化的人格评估；投射测验；访谈、行为观察、评定量表等

自陈人格调查表


编制策略：推演；实证编制方法：

内容关联 Woodworth Personal Data Sheet(e.g.晚上睡得好么)；SCL-90-R

优点：直接；缺点：被试操纵结果，反应偏向经验效标 Minnesota Multiphasic Personal Inventory;

Califonia Psychological Inventory(正常人)

因素分析 16PF; EPQ(Eysenk Personality Questionnary);NEO 人格调查表主要根据特质理论；但主成分可能影响因素的确定

理论推理 1)Myers-Briggs Type Indicator(MBTI) 作者是母女俩理论依据：荣格的人格类型理论能量倾向接受信息处理信息行动方式内向 - 外向；感觉 - 直觉；思维 - 情感；判断 - 知觉 →16 种人格类型2)Millon Clinical Multiaxial Inventory-Ⅲ米隆临床多轴调查表辅助人格障碍的诊断理论基础：Millon 的人格障碍理论

标准化人格测验的问题受试者的态度：伪装、社会赞许性（印象处理/自我欺骗）→增加说谎&社会赞许量表反应定势：极端/中庸，肯定/否定，偏离（即给出不一般的答案）个体/情景、特质/状态

MCMI-Ⅲ

175 items，T/F inventory

包括效度(4)、临床人格障碍(14)、临床症状量表(10)

分别测量：受试态度、人格障碍（Axis- *Ⅱ ）、情节症状（Axis-Ⅰ）


与 DSM-Ⅳ诊断有关常模以临床样本为根据一般在 20-30 分钟内完成信度、内外部效度高，但阳性预测力低（易误诊？）使用 Base Rate 进行诊断(35 60 75 >85)

计算机计分方便相对简单，施测方便

四个效度测试项目：Disclosure -assess frankness

Desirability -assess social desirabilityDebasement -assess self-devaluationValidity -assess random responding

解释步骤：1. Determine profile validity

(invalid if Yes to 65, 110, 157or more than 12 unanswered or double-marked;faking good/bad)2. Interpret the Personality Disorder Scales

由重到轻3. Interpret Clinical Syndrome Scales

由重到轻4. Review noteworthy responses

问卷填写过程中受试者的反应5. Provide diagnostic impressions6. Write a personality description7. Treatment implications and recommendations

MMPI 和 MMPI-2 正常人和诊断人格障碍都能使用first published in 1943 by Hathaway and McKinley

504(后增至 566)个 T/F 项目MMPI-2 重测信度达到.58-.92


MMPI-1均值 50，标准差 10 得分>70 异常；MMPI-2 使用统一的 T 分数（均值标准差同上） 65 为临界

MMPI 和 MMPI-2 上的？K and F scales

Q—unanswered >30 则作废 K—defensiveness 共 30 个 F—faking bad <10%的正常人会选的项目，共 66 个 L—lie 15 个，一般应不超过 3 个 V-valid 变量反应 VRIN（对一致内容的反应）；真实反应 TRIN（肯定/否定反应风

格）分析内容应包括： Test-taking attitude(平均完成时间 1.5小时)

General level of adjustmentBehaviors (symptoms, attitudes, defenses) that can be inferred or expectedDiagnostic labelsTreatment implications

**典型 profile**

Chap 10. Projective Tests 投射测验假设基础

个体知觉、解释材料的方式会反映出其心理机能的基本方面 --理论基础：精神分析

特点：采用非结构任务作为刺激材料，允许被试有多种反应；指导语简洁、材料模糊测量目标隐蔽；解释具有整体性；


揭示潜在的、无意识方面的特别有效※实施和计分不够标准化没有足够客观的常模信效度标准不够方便有效解释依赖主试的临床经验和技术，比较主观，可能过度解释

--Rorschach Inkblot Test （1921） 10幅墨迹图，5张灰白、2张少红色、3张彩色，均对称经验解释，非理论最新形式：美国 Exner综合系统（2001）

>施测过程：主试坐在被试的非利手一侧

“What they look like to you”、”What it might be”

自由联想，每张不超过 5 个，总共不少于 14 个记录被试的言语、情绪、抓卡片位置等各个反应询问，要求被试澄清反应的内容、位置、决定因素 >计分 location: W(whole), D(common detail), Dd(unusual detail), S(space) determinants: F(form), M/FM/m(movement), C(color), T(shading)

form quanlity: +优秀， O 平常， U罕有， -缺陷（答不上） content: H(human), A(animal), N(nature)

popular-origional 所反应概念在常人中的常见程度--Holtzman Inkblot Technique--TAT(Thematic Apperception Test) Morgan&Murray,1935

20张黑白的模糊人物或场景图


理论基础：Murray --28 needs、24 press

>施测10-12张图，舒适环境指导语根据年龄、智力情况有所不同逐字记录描述，反应时，行为情绪反应，可进行澄清式询问*无关主题、重复出现的内容很重要！

--CAT(Children’s Apperception Test)

--词汇联想测验 Word Association Test

--句子完成任务 Sentence Completion Task

--绘画技术：画人 DAP(draw a person)；房屋-树-人--游戏技术和玩具测验

Rorschach 和 TAT 之间的异同

Chap 11. 兴趣和态度的测量兴趣：个人对某种活动或职业的喜好，反映个体深层需要和人格特质 John L. Holland 职业兴趣理论：6 种霍兰德代码：三个相邻特征的字母心理学家 IAS

SCII(Strong-Compell Interest Inventory 斯特朗兴趣调查表)

前身 SVIB(Strong Vocational Interest Blank,1921)

回答喜欢 L，不喜欢 D，无区别 I

.80-.90 的重测信度预测职业满意度而非成就


KOIS（Kuder Occupational Interest Survey）库德职业兴趣调查表迫选，100题

对兴趣测验的反对意见性别&文化偏见

态度测验态度：个体对某种事物、情境、方法、概念或他人持有的稳定而持久的反应倾向克里特态度量表

考点整理没整理的不等于不考……下面是怕大家漏了的部分！1．基础知识：分的测验（如人格、智力、成就等等）=6:4 （反正前面是重点啦！！）2．编制测验的一般程序3．修订测验的一般程序（翻译回译讨论施测比较信效度考虑文化因素等等）4．项目特征曲线5．信效度关系（这个没有整理好的标准答案得大家自己理解+整理）6．伦理那一课是重点啊都要背的…… 加上理解7．各种智力测验以及它们测试的维度+内容如WISC-III 的十三个分测验都是啥……8．投射性和自陈式人格测验的异同9．MMPI 那里 15 个重新建构的内容量表都有啥……起码得能够再认10．太临床的东西不用掌握11．投射测验的结构式小结12． TAT 解释所依据的假设13．兴趣与态度测量的理论+维度霍兰德为重点


Documents

bbs.pku.edu.cn¿ƒ理测量... · Web viewChap 1. Introduction. 概念；测验类型；量表编制程序；编制中的统计；测验使用过程中的伦理. 心理测量历史上的重大发展