同时身为教授和家长,我一直想像着找到一种软体可以帮助每一个学生如何写出很好的文章。这样的软体可以作为一种永不倦怠的指导者,标示出文法、标点以及选字上的问题,但同时点出如何作出更好的结论和清晰度。
超出预期地,为了减轻改考卷的人力负担而作出的努力,也许有助於让我的梦想更接近现实。每学年结束前由各州举办的标准化测验通常都有一项作文写作,要求由人工一份一份批改。今(2012)年春天,William and Flora Hewlett 基金会赞助了一个竞赛,试图了解由专业的资料分析科学家和业余的统计天才可以正确地预测人工批改者所打出的分数到甚麽程度。上个月冠军公布了,其所编写的运算法竟然奇特的准确。
这场竞赛是由Kaggle所举办的,一个专门为客户举办预测性模型竞赛的网站-也因为这样他们旗下有着来自全世界的资料分析科学家帮他们工作。该网站宣称它,「从来没有一次没打破先前的准确度门槛,而且都是很精采地破纪录。」
Kaggle网站的广告词是「我们要让资讯科学变成一项运动赛事」。该网站的部分客户提供可观的奖金来交换得奖模型的智慧财产权。举例而言,Heritage Health 奖 (「用历史的医疗险求偿资料,辨识出在明年之内会入院的病人。」)就将颁给研发出最好运算法的团队美金300万元的奖金。刚刚完结的批改作文的竞赛只提供了美金6万元给第一名,却吸引了159队参赛。同时间,Hewlett基金会赞助了一个对现有由商业卖家所提供的自动作文批改引擎的评估研究。研究者发现这些产生的分数和人工批改的成绩在统计上有效地相近。
Hewlett基金会的教育计画主任Barbara Chow说:「我们已经听过有人说机械运算法跟人工批改者一样地厉害,但我们想要创造一个中性而且公平的平台来评估贩售者所宣称的各种效果。结果显示它们的宣称并非毫无根据。」
Chow女士说,如果说用运算法取代人工批改的念头让人反感,考量这个想法:在各州的标准化测验当中,每天作文通常都由两名批改者批改,机械批改只取代其中一个。此外,真人也通常不是理想的批改者,他们对每篇文章只提供三分钟的注意力而已。我们在处理的只是一种非常化约的评分,也就是给每篇文章如七年级生的文章,一个综合的分数,并不是要给一个大四生创意写作专题里所使用的隐喻下评语。软体大幅地降低了批改这些作文的成本 - 这是一件重要的事,因为许多州已经开始(为了樽节支出)废弃作文这个考试项目。
俄亥俄州艾克朗大学(University of Akron in Ohio)教育学院的院长Mark D. Shermi说:「几年前,几乎每一州都用等第评分法来测验写作,藉此要求学生实际训练写作能力。但是有几州,因为成本的关系,不是改回只用选择题的方式测验就是根本地废弃跟写作相关的考试。」Shermis教授说:随着作文自动批改的统计模型逐渐地改良,目前每篇作文每人次美金2元或 3元的支出就可以被节约下来,至少在理论上是如此。
而当批改作文的软体越来越成熟以後,就可以运用到课堂上一学年当中任何的写作作业上,而不只是年终的一次性考试。软体也可以取代教师批改时候所写下的标记和写作建议。软体可以轻易地提供附有详细解释及进一步练习的批改意见,同时提供分数。
Tom Vander Ark,OpenEd Solutions,一间和Hewlett基金会合作的顾问公司的执行长说,目前商业批改论文软体...