编者按:美国学校正使用文本分析和数据挖掘技术分析学生纪律报告,研究学生的测验成绩。
作为路易斯安娜州拉福什教区(Lafourche Parish)学校的学监,克里斯·鲍曼(Chris Bowman)希望了解学生们是怎样惹出麻烦以及事后他们是如何被处理的。鲍曼为此进行了一番头脑风暴:他搜集了去年全年老师和管理员们写下的3.3万份学生纪律报告,利用该学校区的数据挖掘系统专门进行分析。
鲍曼认为,通过分析报告,不仅可以找出学生各种违纪问题,比如迟到、着装违规、打架、毁坏公物等问题的根源,而且还能为学校提供有效的处理方式以及如何公正地推行维护纪律。这些报告通常包括常规的统计信息,如学生的年级和年龄,还有一段描述违纪详情的文字。
“我确信这些报告是一座信息宝库,”鲍曼说,“在这些数据里,在这些描述里,包含着我希望获得的信息。”描述包括对违纪的详细说明,还有老师和管理员怎样应对和最后的惩戒处理。“我不想只看这些花哨的表面证据,我得好好研究一下实际的数据模式,”他表示。
整个校区系统包括30个学校里的1.5万名学生,几年来一直在用SPSS数据挖掘软件分析学生的测验成绩。去年管理人员就用SPSS的文本分析对450多位教师、管理员和其他学校员工提供的调查进行统计以获得调查结果。
这个试验给鲍曼以启发,可以用同样的技术来分析纪律报告。鲍曼用文本分析搜索和关键字分类的方式,看是否有可循的模式。如搜索关键字“制服”,可以显示教师或学校在执行着装标准时是否有过于严格,搜索“迟到”可以找出经常性迟到的学生。这样鲍曼可以搜索某个学生、学校或整个地区的记录。
鲍曼把这种搜索方式与基本数据组合起来以期寻找额外的模式。“我试着从这些表面的处罚里,找出导致这些问题的隐秘因素。”他表示。例如,是否因为这些孩子来自低收入家庭而经常触犯了着装规定。
其中一个鲍曼想探究的问题是,不起眼的违规,如着装和粗口会怎样演变成日后的严重违规。他还非常关注老师们处分决定的有效性,这些处分包括留堂或处分退学,寻求能基于学生的违规频率而不仅仅只是触犯哪条规定来制定处罚方式。
拉福什教区的学校使用这种文本分析和数据挖掘的方式是少有的,而许多学校是用数据挖掘工具研究学生的测验成绩。
SPSS正和分析聚合与挖掘技术公司(Analytic Focus and Reveal Technologies)一起合作,为阿拉巴马州、科罗拉多州、爱荷华州、明尼苏达州和纽约州六个校区的学校开发预测学生K-12成绩的系统。这个项目背后的驱动力就是“消除落伍生行动”(No Child Left Behind Act)的严格目标。
鲍曼是在上个学年中期开始使用SPSS软件的,当时学校的纪律报告达1.7万份,过去一年中他检阅了所有的报告数据。
现在,鲍曼正在进一步提炼分析报告,目前结果还只是在初级阶段,但已经有证据显示有在校学生没有获得平等待遇。(译/朱筱丹)
(信息周刊)