第一章 绪论
1. 关于测量、测验、评价的关系,下列说法中正确的是( )
A 测验与测量同义
B 测验是一种测量的工具
C 测验是一种评价方法
D 评价必须利用测验所得的资料
2. 首先提出“测验”、“心理测量”术语的学者是( )
A 冯特
B 比纳
C 卡特尔
D 高尔顿
3. 测量的两个要素是( )
A 对象和工作
B 单位和参照点
C 目标和量表
D 分数和常模
4. 发明智力测验常模量表的心理学家( )(18)
A.卡特尔
B.比纳
C.高尔顿
D.艾宾浩斯
5. 用于测量个人或团体经过某种正式教育或训练之后对知识和技能掌握的程度( )
A.能力测验
B.成就测验
C.人格测验
D.典型行为测验
第二章 心理测验的编制
1.编写学绩测验时,双向细目表中的“双向”是指( )
A 内容与题型
B 内容与技能
C 技能与题型
D 题型与难度
简答题:
2.编制测验的一般程序
第三章 测验的实施和计分
1.测量过程中由不可控制的偶然因素引起的误差称为( )
A 系统误差
B 恒定误差
C 测量误差
D 随机误差
2. 下述关于随机误差对测验影响的说法中正确的是( )
A 影响测验的信度,但不影响效度
B 影响测验的效度,但不影响信度
C 影响测验的信度,也影响其效度
D 对测验的信度、效度均无影响
3. 系统误差对测验的影响可以表述为( )
A 影响信度不影响效度
B 影响效度,不影响信度
C 既影响信度又影响效度
D 既不影响信度也不影响效度
简答题:
4. 简述由施测过程引起的误差
第四章 测验结果的解释
1. 最早采用智力年龄概念的是( )
A 比纳量表 B 瑞文推理测验
C 韦氏量表 D 斯坦福比纳量表
2. 提出“比率智商”概念的心理学家是( )
A 比纳 B 西蒙 C 推孟 D 韦克斯勒
3. 在斯坦福-比纳测验中,测得某儿童的智力年龄为8,这个结果的含意是( )
A 该儿童的智力低下
B 该儿童成绩相当于8岁儿童的平均分数
C 该儿童的智力超常
D 该儿童IQ是80
4. 以50为平均数,以10为标准差的常模参照分数是( )
A 标准九 B 标准十 C T分数 D C分数
5. T分数的平均数和标准差分别为( )(19)
A 0和1 B 50和10 C100和15 D 500和100
6. 下列导出分数中属于内容参照分数的是( )
A 掌握分数 B 比率智商 C 百分等级 D 标准九
7. 属于内容参照分数的是( )(19)
A 智龄 B百分等级 C智商 D掌握分数
8. 下列分数中属于常模参照分数的是( )
A 掌握分数 B 正确百分数
C 等级评定量表 D 标准九
9. 智商是一种( )
A 标准参照分数 B 内容参照分数
C 结果参照分数 D 常模参照分数
10. 正确百分数是一种( ).
A.内容参照分数
B.常模参照分数
C.结果参照分数
D.预期效标分数
11. 如果某同学在标准化测验中的分数位于75的百分等级,这意味着( )
A 参加测验的人中,有75%人的分数高于该同学
B 参加测验的人中,有25%人的分数低于该同学
C 参加测验的人中,有75%人的分数低于该同学
D 该同学正确回答了75%的测验题
名词解释:
12.常模
第五章 测验信度
1. 计算分半信度需要的复本个数和施测次数为( )
A 1,1 B 2,1 C 2,2 D 1,2
2. 用同一个测验先后对受测者群体施测两次,所求得的测验信度系数是( )
A 重测信度 B 复本信度 C 分半信度 D 同质性信度
3. 以时间取样为误差变异来源的信度类型是( )
A 分半信度
B 同质性信度
C 重测信度
D 评分者信度
4. 下列各项方法中,不能用来计算项目间一致性的方法是( )
A 因素分析 B 复本信度
C 克伦巴赫a系数 D 荷依特信度
5. 克伦巴赫a系数计算的信度属于( )
A 重测信度 B 分半信度
C 同质性信度 D 评分者信度
6.测量的一致性或可靠性程度称为测验的( )
A.效度 B.难度 C.区分度 D.信度
7. 如果一个测验间隔两个月后再施测于同一群体,两次结果高度一致,可以肯定该测验是()
A 可信的 B 有效的 C 统计上显著的 D 可推广的
8. 对一个测验中题目一致性的估计属于( )
A 重测信度 B 分半信度 C 同质性信度 D 评分者信度
9. 由一个受测者样本在一个测验上的得分计算得到的奇偶相关系数为0.50,则经过校正后得到的分半信度系数应该为( )
A 0.60 B 0.67 C 0.70 D 0.77
名词解释:
10.分半信度
11.评分者信度
简答题:
12.影响测验信度的主要因素
第六章 测验效度
1. 某教师的试卷经常超出授课范围,该试卷的( )一定低
A 信度 B 校标效度 C 内容效度 D 构想效度
2. 用来表示测验题目的行为领域的代表性的是( )。(18)
A.内容效度 B.构想效度 C.校标效度 D.区分效度
3. 企业使用招工测验的主要目的是预测录用人员未来工作的绩效,这类测验非常重视( )
A 内容效度 B 校标效度 C 构想效度 D 会聚效度
4. 如果一个测验与将来的实际业绩相关很高,比如机械倾向测验与汽车训练课程成绩相关很高,则这种测验的( )很高。
A 表面效度 B 校标效度 C 构想效度 D 绩效效度
5. 抑郁量表的有效性常用抑郁症患者的测验结果与精神科医生诊断的符合程度来说明,这种方法是( )
A 内容效度 B 构想效度 C 效标效度 D 评分者效度
6. 命中率所反映的测验效度属于( )
A 内容效度 B 校标效度 C 表面效度 D 结构效度
7. 运用测验所录取的合格人数与实际录取的总人数之比称作( )
A 总命中率 B 基础率 C 正命中率 D 录取率
8 衡量测验有效性的参照标准称为( )
A.效度 B.信度 C.常模 D.效标
9 测验对某一理论概念或特质测量的程度称为( )
A 内容效度 B 构想效度 C 校标效度 D实证效度
简答题:
10.确定内容效度的方法(2012)
11.内容效度与表面效度的区别
12.效标测量的条件
第七章 项目分析
1.能确切地反映预测性测验中个别项目质量的是( )
A 该项目间隔2个月后再测得分的一致性
B 该项目与其它项目的相关系数的平均值
C 项目分数与总分的相关系数
D 校标得分的低分组和高分组在该项目上通过率的差值
2.通过率衡量项目的( )
A 难度 B 区分度 C信度 D 效度
简答题:
3. 简述难度与区分度的关系
第八章 学绩测验
简答题:
1. 学绩测验的功能
第九章 智力测验
1. 最早编制出智力测验量表的心理学家是( )
A 桑代克 B 卡特尔 C 比纳 D 罗夏克
2. 吉尔福特的智力理论称为( )
A 多因素说 B 二因素说 C 三维智力结构理论 D 智力层次说
3. 以下测量工作中,最适合儿童智力跨文化研究的是( )
A 比纳-西蒙量表
B 韦氏儿童智力量表
C 丹佛发展筛选测验
D 瑞文测验
4. 在下列测验中,能计算出言语智商、操作智商和全量表智商的是( )
A 比纳-西蒙量表
B 斯坦福-比纳量表
C 韦克斯勒量表
D 瑞文标准推理测验
5. 世界上第一个智力量表是( )
A 比纳-西蒙量表
B 斯坦福-比纳量表
C 韦氏智力量表
D 瑞文标准推理测验
6. 最早采用智力年龄概念的是( )
A 比纳量表 B 瑞文推理测验
C 韦氏量表 D 斯坦福比纳量表
7.比纳与其助手西蒙合作编写世界上第一个智力量表的时间是( )
A.1879年 B.1890年 C.1905年 D.1908年
第十章 人格测验
1. 投射法主要用来研究( )
A 智力 B 人格 C 思维 D 观察力
2.下列测验中属于情境测验的是( )
A 主题统觉测验 B 卜氏儿童社会行为量表
C 品格教育测验 D 16种人格因素测验(16PF)
3. 卡特尔16种人格因素测验(16PF)是( )
A 自陈量表 B 情境测验 C 投射测验 D 评定量表
4. 下列测验中属于自陈量表的是( )
A 墨迹测验 B 主题统觉测验
C 16种人格因素测验 D 句子完成测验
5. 以下测验中属于投射测验的是( )
A 16种人格因素测验 B 主题统觉测验
C 艾森克人格问卷 D 爱德华个性偏好量表
6. 主题统觉测验是一种( )
A 自陈测验 B 投射测验 C 墨迹测验 D 情境测验
7. 下列各项测验中不适宜团体施测的是( )
A 韦氏成人智力量表 B 16种人格因素测验
C 艾森克人格问卷 D 爱德华个性偏好量表
8. 以下测验中适于团体施测的是( )
A 中国比纳测验 B 韦氏儿童智力量表
C 贝雷婴儿发展量表 D 16种人格因素测验
9.属于自陈量表的人格测验( )
A.房树人测验
B.艾森克人格问卷
C.主题统觉测验
D.罗夏克墨迹测验
简答题:
10. 自陈量表的特点
11.投射测验的评价
________________________________________________
参考答案
第一章 答案解析
1.B 2.D 3.B 4.B 5.B
第二章 答案解析
1.B
简答题:
2.编制测验的一般程序
答:测验编制的一般步骤: (1)确定测验目的并选择适当的测验材料; (2)将测验材料编成测验题形成最初的试卷; (3)试测并分析测题质量;(4)选择、编排测题,并集合成最后测验的形式; (5)测验标准化;(6)测验特征的鉴定(测验的信度和效度的确定, 求常模)编写测验使用说明书。
第三章 答案解析
1.D 2.C 3.B
简答题:
4. 简述由施测过程引起的误差
答:常见的误差来源于三个方面,测验内部,实测过程,受测者本身。在三种误差来源中,与施测过程有关的误差可能是最容易控制和检验的。具体有以下几个:
(一)物理环境
施测现场的温度。光线,声音、桌面好坏,空间阔窄等皆具有影响。
(二)主试者方面:
主试者的年龄、性别、外表,施测时的言谈举止、表情动作等均能影响测验结果。倘若不按照规定实施测验,如制造紧张气氛,给予特别协助或暗示,以及计时错误等,都会带来较大误差,特别是当测验具有复杂步骤和说明,或测验题本身是模糊不确定的形式时,当主试者在安排测验条件上有较多余地(例如个别施测)时,当测验是对幼儿,有情绪困扰者以及对测验程序不熟悉的人施测时,主试者的影响更大。
(三)意外干扰:
在测验环境复杂,特别是当受试人数较多时,容易发生出乎预料的干扰或分心事件。例如: 停电、有人生病,有人作弊,计价表停了、临时发现题目或作答纸印刷不清或装订错误等, 无论哪种情况都会引起不安和扰乱,导致成绩不准确、不一致。
(四)评分计分:
评分不客观以及计算登记分数出错等也是常见的误差。一般选择题的评分较为客观。而问答 题、论文题等自由反应型的题目,评分标准很难掌握,加之阅卷者的偏好各不相同,因而难以保证分数的一致性.
第四章 答案解析
1.A 2.C 3.B 4.C 5.B 6.A 7.D 8.D 9.D 10.A 11.C
名词解释:
12.常模
答:测验常模简称常模即指一定人群在测验所测特性上的普遍水平或水平分布状况。可分为组间常模和组内常模两大类。
第五章 答案解析
1.A 2.A 3.C 4.B 5.C 6.D 7.A 8.C 9.B
名词解释:
10.分半信度
答:分半信度是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的相关,是用于测验项目内部一致性程度的信度方法之一,可以测量相同内容或特质的程度。
11.评分者信度
答:评分者信度指的是多个评分者给同一批人的答卷评分的一致性程度。
简答题:
12.影响测验信度的主要因素
答: 一、样本的特征
(1)样本团体分数分布的影响:任何相关关系都受到团体中分数分布的影响,当分布范围增大时,其信度估计就较高;当分布范围减小时,相关系数随之下降,信度值则较低。
(2)样本团体异质性的影响:若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。样本团体平均能力水平的影响:对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。
二、测验的长度
在一个测验中增加同质的题目,可以使信度提高。测验越长,测验的测题取样或内容取样越有代表性;测验越长,被试的猜测因素影响越小。
三、测验的难度
如果一个测验对某团体而言太容易,会使所得分数都集中在高分端;当题目太困难时,得分就会集中在低分端。两种情况均会使信度样本的分数范围变窄,从而使测验变得不够可靠。
四、测验的时间间隔
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其他变因介入的可能性越大,受外界的影响越大,信度系数便越低。
第六章 答案解析
1.C 2.A 3.B 4.B 5.C 6.B 7.C 8.D 9.B
简答题:
10.确定内容效度的方法(2012)
答:答:内容效度指的是测验题目对相关内容或行为范围取样的适当性,这种测验的效度主要与测验内容有关。确定内容效度的方法有以下三种。
(1)专家判断
为了确定一个测验是否具有内容效度,最常用的方法是请有关专家对测验题目与原定内容范围的符合性做出判断。为了提高判断过程的客观性,可采用以下几个步骤:
①定义好内容总体,描绘出有关知识与技能的轮廓。
②划分细纲目,并根据重要性规定好各纲目的比例,对内容范围作尽可能详尽的描述。
③确定每个题目所测的内容与技能,并与测验编制者所列的双向细目表对照,逐题将自己的分类与编制者的分类作比较。
④制定评定量表,从测验内容所测的技能、题目对所定义的范围的覆盖率,各种题目数量和分数的比例以及题目形式对内容的适当性等方面,对测验做出总的评价。
(2)统计分析方法
内容效度可由一组被试在独立取自同样内容范围的两个测验复本上得分之相关来作数量的估计。若相关低,说明二者至少有一个缺乏内容效度;若相关高一般可推论测验有内容效度。
(3)经验法
检查不同年级的学生在测验上的得分和在每个题目上的反应情况。一般说来,测验总分和题目通过率随年级而提高,便是测验具有内容效度的证据。
11.内容效度与表面效度的区别
答:(1)定义不同
内容效度是指项目对欲测的内容或行为范围取样的适当程度。表面效度是外行对测验作表面上的检查确定的,而内容效度是专家对测验进行详尽的、系统的评价建立的。
(2)特点不同
表面效度是外行对测验作表面上的检查确定的,而内容效度是专家对测验进行详尽的、系统的评价建立的。
表面效度只考虑测验项目与测验目的之间的明显的、直接的关系,内容效度则同时考虑到测验项目与测验目的和总体内容之间的逻辑的本质的联系。表面效度高的题目内容效度不一定高,表面效度低的项目内容效度也不一定低。
(3)侧重不同
表面效度只考虑测验项目与测验目的之间的明显的、直接的关系,内容效度则同时考虑到测验项目与测验目的和总体内容之间的逻辑的本质的联系。
12.效标测量的条件
答:(1)必须能最有效地反映测验的目标,即效标测量本身必须有效;(2)效标必须具有较高的信度,稳定可靠,不随时间等因素变化;(3)效标可以客观地加以测量,可用数据或等级来表示;(4)效标的测量的方法很简单,省时省力,经济实用。
第七章 答案解析
1.D 2.A
简答题:
3. 简述难度与区分度的关系
答:(1)难度越接近0.5时,项目潜在的区分度越大
(2)难度越接近1.00或0时,项目区分度越小;
(3)为了使项目具有较高的区分能力,应该使所有项目难度都保持在0.5,但是从整体来 说,这样做会使测验所提供的信息相对减少。所以,应使项目的难度分布广一些,梯度大一些,使整个测验的难度分布呈正态分布,且平均水平保持在0.5左右。这样才能把各种水平的人都区分开来,并且分得比较细。
第八章 答案解析
简答题:
1. 学绩测验的功能
(1)反馈功能
(2)评价功能
(3)研究工具
(4)人才选拔与安置
第九章 答案解析
1.C 2.C 3.D 4.C 5.A 6.A 7.C
第十章 答案解析
1.B 2.C 3.A 4.C 5.B 6.B 7.A 8.D 9.B
简答题:
10. 自陈量表的特点
答:(1)自陈量表的题量比较大,多数用于测量人格的若干特质;
(2)自陈量表通常采用纸笔测验的形式,可以团体施测;
(3)自陈量表的项目形式一般采用是非式或选择式,它的计分规则比较客观,施测手续比较简便,测量分数容易解释,应用广泛;
(4)信度指标通常采用重测信度和内部一致性信度,信度系数不低于0.6;效度常采用构想效度,较少使用校标效度。
11.投射测验的评价
答:
优点:
(1)弹性大,被试不受限制,可以任意作出反应。
(2)材料仅为图片,因此可以对没有阅读能力的被试进行施测。
缺点:
(1)评分缺乏客观标准,测验的结果难以解释。
(2)对特定行为不能提供较好的预测。如测验上发现某人有侵犯欲望,但是实际上这个人却很少出现侵犯行为。(是否为缺点本人保留意见,毕竟有侵犯欲望并不代表具有侵犯行为,两者之间并没有必然关系)
(3)需要花费大量的时间。