标准化考试

最后更新:

一个标准化考试是任何形式的测试(1)要求所有考生回答同样的问题,或选择提问常见的银行的问题,同样的,(2)是在一个“标准”或一致的方式,这使得它可以比较的相对表现个人或组的学生。而不同类型的测试评估这个词可能以这种方式被“标准化”,它主要是与对大量学生进行的大规模测试联系在一起的,例如给一个特定州的所有八年级公立学校学生进行的多项选择测试。

除了常见的多项选择题形式外,标准化考试还可以包括是非题、简答题、问答题或多种类型的问题。虽然标准化考试传统上是在纸上进行的,用铅笔完成,而且许多考试现在仍然是这样,但越来越多的考试是在与在线程序相连的电脑上进行的(相关讨论见电脑化的测试)。虽然标准化考试的形式多种多样,但选择题和是非题形式被广泛应用于大规模考试,因为计算机可以快速、稳定和廉价地为它们评分。相比之下,开放式的作文问题需要由人类使用一套通用的指导方针或评估准则促进论文之间的一致性评价——效率较低、时间密集、成本较高的选择,也被认为是更主观的选择。(各种公司目前正在开发旨在取代人工评分的计算机化系统;尽管这些制度仍处于起步阶段,但它们正成为越来越多的全国辩论的对象。)

虽然标准化考试在美国是争论的主要来源,但许多考试专家和教育工作者认为它是一种公平和客观的评估学生学业成绩的方法,主要是因为标准化的形式,加上计算机评分,减少了偏袒和偏见的可能性,或主观评价。另一方面,主观的人类判断进入测试过程的各个阶段,例如。,in the selection and presentation of questions, or in the subject matter and phrasing of both questions and answers. Subjectivity also enters into the process when test developers set passing scores—a decision that can affect how many students pass or fail, or how many achieve a level of performance considered to be “精通有关这些问题的更详细讨论,请参阅测量误差,测试设施,测试的偏见分数膨胀

标准化考试可用于各种各样的教育目的。例如,它们可以用来确定一个小孩是否为上幼儿园做好了准备,确定哪些学生需要特殊教育服务或特殊教育学术支持,将学生安排在不同的学术项目或课程水平,或授予文凭和其他教育证书。以下是一些最常见的标准化考试形式的典型例子:

  • 成就测验旨在衡量学生在学校学到的知识和技能,或确定他们在一段时间内取得的学术进步。考试也可以用来评估学校和教师的有效性,或确定学生的适当的学术安置。什么课程或项目被认为是最合适的,或者他们可能需要什么形式的学术支持。成绩测试是“向后看的”,因为它们衡量的是学生学到了他们应该学的东西有多好。
  • 能力倾向测试通过评估数学能力、语言能力、抽象推理能力、运动协调能力或音乐天赋,预测学生在智力或体力方面取得成功的能力。能力倾向测试具有“前瞻性”,因为它们通常试图预测或预测学生在未来的教育或职业设置中表现如何。能力倾向测试经常引起争论,因为许多人质疑其预测的准确性和价值。
  • 大学入学测试用于决定哪些学生将被大学录取的过程中。尽管关于大学入学考试的准确性和实用性存在大量争论,许多高等教育机构不再要求申请人参加这些考试,但这些考试被用作智力和学术潜力的指标,有些人可能会认为他们可以预测申请人在高等教育项目中的表现。
  • 国际比较测试定期对包括美国在内的一些国家的有代表性的学生样本进行管理,目的是监测各个国家的成就趋势,并比较各国的教育表现。一些广泛使用的国际比较测试的例子包括国际学生评估项目(PISA)国际阅读素养研究进展) (PIRLS (),国际数学与科学研究趋势(TIMSS)。
  • 心理测试它被用来衡量一个人的认知能力以及智力、情感、发展和社会特征。这些测试通常由训练有素的专业人员(如学校心理学家)负责,这些测试可能要求学生执行一系列任务或解决一系列问题。心理测试经常被用来识别有学习障碍或其他特殊需要的学生,使他们有资格获得专门服务。

改革

根据各州和联邦旨在改善学校和教师表现的各种法律、政策和法规,标准化成绩测试已经成为美国公立学校越来越重要的一部分。当着眼于改革学校和提高学生成绩时,标准化测试主要用于以下几个方面:

  • 让学校和教育工作者对教育结果和学生表现负责。在这种情况下,测试分数被用作有效性的衡量标准,而低分数可能会对学校和教师造成各种后果。有关更详细的讨论,请参见高风险测试
  • 评估学生是否学到了他们应该学的东西,如他们是否遇到了状态学习标准。在这种情况下,考试成绩被视为学生成就的代表性指标。
  • 识别差距在学生学习和学术进步方面。在这种情况下,可以使用考试成绩和其他有关学生的信息来诊断学习需求,以便教育工作者可以提供适当的服务、指导或学术支持
  • 识别的差距在不同的学生群体中,包括有色人种学生、英语不熟练的学生、来自低收入家庭的学生,以及有身体或学习障碍的学生。在这种情况下,暴露和突出成绩差距可以被视为努力教育所有学生的重要第一步,这可以导致更大的公众意识和教育政策和项目的变化。
  • 确定教育政策是否如预期的那样有效。在这种情况下,民选官员和教育政策制定者可能会依靠标准化考试的结果来确定他们的法律和政策是否有效,或者比较学校与学校、州与州之间的教育表现。他们也可能利用这些结果来说服公众和其他民选官员,他们的政策符合儿童和社会的最佳利益。

辩论

虽然关于标准化考试的争论范围广泛、细致入微,有时还充满感情色彩,但许多争论往往集中在使用这种考试的方式,以及它们对学生学习的评估是可靠还是不可靠,而不是关于标准化考试本身是好是坏(尽管在这个话题上肯定也有争论)。例如,大多数测试开发人员和测试专家都对使用标准化测试分数作为教育表现的唯一衡量标准持谨慎态度,尽管许多人也认为,如果使用得当和明智,测试分数可以成为一种有价值的表现指标。一般来说,当考试成绩被用来对教育政策、学校、教师和学生做出相应的决定时,标准化考试更有可能成为争论和争议的对象。当这些测试被用来诊断学习需求并为学生提供更好的服务时,它们不太可能引起争议——尽管在实践中,这两个目的之间的界限是出了名的模糊(因此,争论仍在继续)。

虽然关于标准化测试辩论的详尽讨论超出了本资源的范围,但以下问题将说明一些在美国经常讨论和辩论的主要问题:

  • 标准化考试的数字分数是否会误导学生学习的指标,因为标准化考试只能使用固有的有限方法来评估狭窄范围的成绩?还是这些分数提供了学校、教师或学生表现的准确、客观和有用的证据?(标准化考试并不能衡量学生在学校里要学的所有东西。测试50多项选择题的问题,例如,不可能衡量所有学生学习的知识和技能,或将学习,在一个特定的领域,这是一个原因为什么有些教育工作者和专家警告使用教育的标准化测试分数作为唯一指标性能和成功。)
  • 标准化考试是否对所有学生都公平,因为每个学生都参加同样的考试,以同样的方式进行评估?这些测试是否存在固有的偏见,可能使某些群体处于不利地位,比如有色人种学生、不熟悉美国文化习俗的学生、英语不熟练的学生或可能影响其表现的残疾学生?
  • 标准化考试的使用是否提供了教育者和学校领导可以用来提高教学质量的有价值的信息?是否普遍过度使用测试实际上占用了宝贵的教学时间,而这些时间本可以用来更好地教授学生更多的内容和技能?
  • 做标准化的好处testing-consistent学校和学生成绩数据,可用于通知努力改善学校和teaching-outweigh成本——的钱花在开发测试和分析结果,教学时间老师准备的学生,或学生考试的时间吗?
  • 例如,数学和阅读测试分数是否提供了关于学校、老师和学生表现的全面和准确的描述?标准化考试是否只局限于少数几门学科?
  • 标准化考试评估的学术内容范围狭窄,是否导致教师过于关注备考和少数学科(一种被称为“应试教育”的做法),而牺牲了其他有价值的教育追求,如艺术、音乐、健康、体育,或其他21世纪技能例如,?
  • 标准化考试以及伴随低分而来的后果是否使学校、教育者和学生达到更高的标准,并提高公共教育的质量?这些考试是否创造了破坏有效教育的条件,如作弊、不健康的竞争形式或对公立学校的不公正的负面看法?
  • 公共教育中一些最重要的决定——比如是否减少或增加学校资金或解雇教师和校长——应该完全或主要地基于考试分数来做出吗?标准化考试的分数可能会产生误导或不准确,但作为一种衡量标准,它是否太过有限,不能作为这种后果性决定的依据?