聚合数据

最后更新:

聚合数据指的是(1)从多个来源和/或根据多个度量、变量或个人收集的数字或非数字信息;(2)编制成数据摘要或摘要报告,通常用于公开报告或统计分析,即。,研究趋势、进行比较,或揭示当孤立地看待数据元素时无法观察到的信息和见解。例如,关于个别学生是否高中毕业的信息可以聚合即,编译和汇总为一个毕业班或学校的单个毕业率,然后可以将每年的学校毕业率汇总为地区、州和国家的毕业率。

虽然大多数汇总教育数据是数值 - 例如,毕业和辍学率,平均值标准化测试分数对于一个学校或地区,一个州每个学生的平均投入金额,等等——汇总非数字信息是可能的,也是常见的。例如,一个学区的教育工作者、学生和家长可能就某一主题接受调查,然后这些调查中的信息和评论可以“汇总”成一份报告,显示被调查个人对该问题的一般想法和感受。在投票、访谈和焦点小组中收集的信息可以以类似的方式聚合。

进一步说明聚合数据的概念,以及它如何可能用于公共教育,考虑学校入学的500名学生,这意味着学校保持500学生记录,每一个都包含各种信息登记学生为例,第一个和最后一个名字、家庭住址、出生日期、性别、种族或民族、注册日期和期间、所修课程和完成的课程、取得的课程成绩、考试成绩等(收集和维护的有关个别学生的信息通常称为学生级数据,以及其他术语)。每年一到两次,学区可能被要求向他们的州教育部门提交学生注册报告。然后,该地区的每一所学校将编制一份报告,记录学校和每个年级当前注册的学生人数,这要求管理人员汇总所有学生个人记录的数据,以生成注册报告。这个地区现在有总计的学校学生的注册信息。未来五年,学区可以利用这些年度报告来分析全区招生、每所学校或每个年级招生的增加或减少情况。然而,该学区无法根据从学校收到的总体数据确定白人和非白人学生的入学率是增加了还是减少了。为了制作一份报告,显示不同种族和民族的不同招生趋势,地区学校将需要无组织的种族和民族亚组的注册信息。

聚合对分列的数据

汇总数据是指对数据进行汇编和总结;分解数据是将聚合的数据分解成组成部分或更小的数据单元。虽然汇总数据和分类数据之间的区别看起来很简单,但这里有一个细微之处值得讨论:教育领域的许多“分类”数据实际上是技术上的数据聚合在某种程度上,这是根据学生个人的记录。例如,毕业率被广泛认为是“合计数据”,而不同学生亚组的毕业率——比如不同种族和民族的学生——通常被认为是“合计数据”。然而,要产生按种族和民族分列毕业率的报告,实际上必须对个别学生的数据进行“汇总”,才能得出不同种族子群体的毕业率。最可能的原因是,从历史上看,只有学校范围、地区范围或州范围的教育表现的汇总数据才容易获得或公开获得。当调查或报道诸如汇总数据或者分列的数据,重要的是要准确地确定术语在特定上下文中是如何使用的。

改革

在2000年代初期之前,大多数州教育机构和地区只收集了纳入公立学校的学生的总数据。然而,今天,美国的所有50个州都有国家级系统,收集和维持学生级数据,而不仅仅是汇总记录,允许国家教育机构在学校和学生中产生汇总和分列的报告(公立学校地区通常从学校收集学生级别数据,并州从地区收集学生级数据)。

而聚合数据,如高中毕业率或平均成绩能产生多种重要的见解,大量的学校领导,研究人员,教育改革者和政策制定者近年来倡导的重要性将数据暴露潜在趋势和等问题成就差距,机会的差距,学习的差距, 和别的不平等在公共教育系统中。例如,如果唯一可获得的毕业率是个别学校的年毕业率,那么这一综合数据可能会掩盖低收入家庭学生、有色人种学生、残疾学生或英语不熟练的学生在毕业率方面的显著差异。一所学校的总体毕业率可能看起来很高——比如说90%——但当数据根据不同的学生群体进行分类时,分类可能会显示,例如,该校超过50%的非洲裔美国人和西班牙裔学生未能毕业。

一般来说,收集和报告总数据的主要目的是提供有关公立学校和公立学生对那些正在监测学校或努力改进它们的人的绩效的有用信息。虽然总数据对于了解公共教育系统如何工作,但总数据报告通常仅限于确定更广泛的趋势和教育模式;当涉及在不同种族和种族的学生中诊断更深层次的潜在问题时,它们并不是有用的。

辩论

在公共教育中,汇总数据被广泛收集和公开报道了几十年。在大多数情况下,汇总数据的使用在公共教育中并不是一个有争议的话题,这主要是因为与收集、分享和使用特定学生的数据和个人信息相比,汇总数据对学生安全和隐私的担忧要少得多。尽管如此,近年来,与教育中使用综合数据相关的各种争论已经出现,主要是针对(1)使用公共报告,通常被称为“学校成绩单”,旨在为家庭和公众提供对个别学校表现的总结评估,(2)在对教育工作者的工作表现进行评估时,使用学生平均考试分数和其他综合措施。

学校成绩单和其他形式的全州范围内对个别公立学校表现的报告,可能会因为各种各样的原因而成为争论的对象或引起争议——原因太多,无法在此进行全面讨论。然而,举一个说明性的例子,一个共同的争论点是,位于高度贫困或少数族裔社区的学校,在州成绩单上的分数明显较低的趋势。这些学校往往服务于有更高需求的学生群体,他们有更大的学习缺陷,资金不足(与较富裕的地区相比),教师缺乏经验或技能较低,并且要面对一系列导致性能降低的额外障碍——但是州报告卡中显示的汇总数据可能不能提供这种上下文信息。一个相关话题的争论是“羞辱”学校坐落在极端贫困还是high-minority社区是最好的方法来提高那些参加学校或更好的服务学生,因为他们的大部分性能可以归因于因素超出了控制教育工作者在学校工作。那些提倡使用州成绩单的人可能会争辩说,不管学校面临着怎样的挑战,家长、家庭和公众都有权了解所在州和社区的公立学校的表现,在学校表现方面增加透明度将带来政策和改革,最终将提高学生的教育质量。

在行政人员和教师的工作表现评估中使用综合数据也可能成为一个争论的话题,原因多种多样,其中许多反映了与学校成绩单有关的争论。例如,许多教育工作者和教师工会认为,教师的工作保障和工资不应该基于学生的表现,因为许多影响学术成就的因素超出了他们的控制范围:例如,父母教育水平低、家庭环境不支持或功能失调、营养不足和压力等因素都会对教育成就产生不利影响,更不用说开学时学业成绩明显落后了。那些反对在工作绩效评估中使用综合数据的人通常认为,使用综合数据来评估个别的教育工作者往往是错误的和不公平的。相关讨论请参见增值措施