去识别的数据

最近更新时间:

在教育领域,去识别的数据通常是指所有的数据个人身份信息已被删除-i.e.,有关个人学生,教师或管理员的数据,通过剥离任何允许人们确定个人身份的信息来呈现匿名。个人身份信息的常见形式包括第一和姓氏,家庭地址,社会安全号码和其他类型的信息,可以在给定的数据集中揭示或无意中揭示或不经意地 - 个人的身份。“去识别”数据的主要原因是保护与数据相关的个人的隐私或身份。

DE-EDETIDIED数据通常用于教育中的研究目的。例如,州教育机构可能雇用组织或大学学习教育政策的结果或影响,例如最近的国家补贴前幼儿园计划的扩张。然后,研究人员将要求他们需要进行研究的数据(例如,显示在十年期间注册的幼儿园计划中纳入的学生人数的记录),而教育机构将组装必要的数据集。然而,在将数据文件释放到研究人员之前,原子能机构将使用“去识别过程”以防止在向外部研究人员提供的信息中揭示各个身份。在许多情况下,教育机构和研究组织还将签署正式协议,规定了如何使用数据以及一旦研究完成后如何处理文件。

当教育机构、地区或学校与未被授权访问或查看个人信息的外部组织和个人(例如,为地区和学校提供专门服务的顾问和公司)共享信息时,数据也可能被删除。

值得注意的是,即使数据看似不包含个人身份信息,某些数据集也可以间接地揭示特定学生或个人的身份。例如,一些小型的农村学校有很小的少数民族学生人口 - 或许只有一两个学生在整个学校的颜色。如果州或学校记录含有,例如,考虑到各种种族亚组的测试分数或毕业率,即使数据是“匿名”的数据,也可以无意中揭示各个非洲裔美国,人,西班牙裔或亚洲学生的身份。出于这个原因,当子组足够小时,各国和学校可能不会公开报告或共享某些数据,以潜在地将否则匿名数据递给特定的学生。

去识别数据的最常见的策略正在删除数据文件中的所有个人信息,并且“抑制”或“屏蔽”一系列数据,使得其剩余信息不能用于识别个体。有关更详细的讨论,请参阅数据屏蔽agent.yabovip168

另外,一些去识别的数据集可能包含通常称为“重新识别代码” - 或分配给已被剥离个人可识别信息的单个记录的随机数。例如,重新识别代码可能允许研究人员在进行研究时匹配两个匿名数据集。说国家教育机构向研究人员提供一套数据文件,研究人员是否为学生造成了学术奖励。在进行研究时,研究人员确定需要额外的数据来完成分析。然后,教育机构可以使用重新识别代码“识别”学生在原始数据集中(仍然屏蔽其个人身份),然后将这些学生记录链接到新数据集中的同一学生。