测量误差

最近更新时间:

测量错误一般在教育中指(1)测试得分指出的差异与学生的实际知识和能力或(2)在收集和计算与学校和学生相关的数据的统计数据时引入的差异。

由于某些程度的测量误差在测试和数据报告中是不可避免的,教育研究人员,统计学家,数据专业人员和测试开发人员通常会公开承认高中毕业率或高校入学率,例如高中毕业率或高校率并不完全可靠(它们may even report the “margin of error” for a given statistic or finding) or that test scores don’t always accurately reflect what students know or can do—i.e., that there is no such thing as a perfectly reliable test of student knowledge and skill acquisition.

测试中的测量误差可能由各种各样的因素造成,例如学生在测试期间的精神和情绪状态或测试执行的条件。例如,学生可能会异常疲劳、饥饿或情绪沮丧,或分心,如噪音、干扰同伴,或技术问题可能会对考试成绩产生不利影响。儿童的测试成绩通常被认为特别容易出现测量误差,因为儿童的注意力持续时间往往较短,他们可能无法充分理解测试的重要性,并认真对待它。此外,年龄相同或年级相同的儿童在社会、认知和情感发展方面可能处于非常不同的阶段,如果一个儿童经历了快速的发育增长,测试结果可能很快就会过时,因此不准确。

以下是一些额外因素和问题的代表性清单,可能会导致测试中的测量误差:

  • 含糊不清的措辞或不准确的答案。
  • 测试项目,问题和问题可能无法解决材料学生实际教授。
  • 性能水平和截止分数,例如被认为是“通过”或在特定测试中“熟练”的那些,可能存在缺陷,校准不良,或歪曲。
  • 评分过程可能设计不佳,人类的分机和计算机评分系统都可能犯错误。
  • 测试管理员可以给学生提供错误的指示,帮助学生作弊,或者未能创造平静和有利的测试条件。
  • 测试结果数据可能是不准确的记录和报告的。

教育数据和统计数据报告中的测量误差是常见的,并且在更大或更短的程度上,预期和不可避免。虽然人为错误可能导致报告不准确,但数据系统和过程是内在的限制 - 即,即,由于系统在规模和范围的增长而产生完美的数据系统或收集数据是不可能的。N.ational or statewide data systems—e.g., systems administered by government agencies to track important educational data such as high school graduation rates—are especially prone to measurement error, given the massive complexities entailed in collecting data from thousands of schools on the performance of hundreds of thousands or millions of students. For this reason, most large-scale education data are openly qualified as estimates.

以下是一些额外因素和问题的代表性清单,可能会导致教育数据中的测量错误:

  • 导致报告,记录,数字和统计数据缺陷,不精确或管理的数据收集过程。
  • 没有明确和可理解的规则,指导方针和数据收集和报告过程的标准,或产生误解和错误的含糊不清的指导。
  • 小型样本大小 - 例如在农村学校,可能有小学生人口和少数少数民族学生 - 可能扭曲某些时间段,毕业课或学生团体的表现的看法。
  • 不同的数据收集和数据报告过程 - 例如由各种国家开发的唯一数据收集系统和要求 - 这可能导致产生错误的歪曲比较或系统不兼容。
  • 高校系统 - 例如,瞬态工人的儿童的高速转移 - 这使得能够准确地追踪学生的入学地位更加困难。
  • 在适当的数据收集和 - 负责在学校,地区和国家级收集和报告数据的人中,缺乏适当的培训,经验或技术专业知识。
  • 故意歪曲学生表现和注册,例如可能陪伴的人高赌注测试

改革

虽然某些程度的测量错误 - 且可能始终是不可避免的,许多教育工作者,学校,地区,政府机构和测试开发人员正在采取措施减轻测试和数据报告中的测量误差。

在测试中,测量误差通常被认为是低赌注测试 - 即,当测试结果不用于对学生,教师或学校做出重要决定时,对低赌注测试的一个相对较小的问题。然而,随着测试性能上升的赌注,测量误差变得更严重,因为测试结果可能会引发各种后果。测量误差是许多测试开发人员和测试专家建议使用单一测试结果来进行重要教育决策的一个原因。例如,教育和心理测试标准- 由美国教育研究协会,美国心理协会和全国教育委员会联合开发的拟议指南 - 建议“在小学或中学教育,决策或表征中,这将对测试产生重大影响接受者不应根据单一测试得分自动进行。“

以下是教育工作者和测试开发人员可能用于降低测试中的测量误差的一些代表性战略:

  • 测试开发人员可以仔细审查问题测试偏见和公平性,并删除或修改可能对不同种族,文化群体或家庭人的学生表现产生不利影响的物品。
  • 测试开发人员可以进行导频测试,以获得有关难度级别,措辞和偏见的反馈,然后在管理之前修改测试。
  • 为了减少无法被计算机被评分的问题的人为评分的错误,例如开放式响应和论文问题,两个或更多的得分手可以获得每个项目或文章。如果他们不同意,可以将该项目传递给额外的评分器。
  • 学校可以收紧安全实践,以便通过管理和参加考试的人来防止作弊。
  • 决策者可以降低或消除测试结果以最小化所产生的后果分数通货膨胀并降低操纵结果的动机。
  • 学校不能依靠一个可能不准确的措施,通过使用多种方法来评估学生的成就和学习增长,可以获得更全面的信息。

在教育数据收集和报告中,测量误差也可能成为一个重要问题,特别是当学校资助水平,处罚或对绩效的看法受到公开报告的数据的影响,例如辍学率或毕业率。出于这些和其他原因,提高了数据系统,收集过程和报告要求的质量和准确性,已成为学校,政策制定者和政府机构的优先事项,以及各种组织和举措,如数据质量运动普通教育数据标准,正在努力提高教育数据的质量,一致性和可靠性。

以下是一些代表性的策略,教育者和数据专家可以用于减少数据报告中的测量错误:

  • “独特的学生标识符”,如国家分配的代码或社会安全号码,可用于促进个人学生的跟踪,并增加数据可靠性,因为它们从等级到年级或学校到学校。
  • 可以开发常见的数据收集和 - 报告标准以提高数据的可靠性,并允许跨学校和国家进行性能比较。
  • 冗余进程 - 多个系统和人员检查错误 - 可用于提高报告准确性。
  • 可以提供更清晰的准则和更好的培训,可以向编译和计算数据提供。
  • 改进的技术和兼容或互操作系统的使用可以促进数据质量和不同学校,组织和国家之间的数据交换。