每年高考,被吐槽最多的恐怕就数第一天语文考试科目的作文题。几乎每年各省高考作文题一公布,调侃、讽刺和批评作文题目的文章或段子就开始流传。今年也不例外。
6月7日上午语文科目考试一结束没多久,各省语文科目考试的作文题就很快成为新闻热点。像安徽省语文科目考试的作文题目为材料作文,大意是根据显微镜下的蝴蝶翅膀本没有颜色,只是因为具有特殊的微观结构,才会在光线的照射下呈现出缤纷的色彩来作文。题目刚一公布,就有生物学专业人士指出作文素材是在造谣。
根据某著名科普网站刊发的《蝴蝶翅膀本无色?安徽高考作文题扯淡了》的文章,蝴蝶翅膀的颜色来源包含了翅膀鳞片的化学色和结构色。安徽高考作文题显然是错误地将结构色误认为是构成蝴蝶翅膀颜色的全部来源。
去年高考作文题公布后,我曾经写过一篇文章来批评高考作文考试,《高考作文一直都是失败的考试》。认为从心理测量学的角度,高考作文考试既缺乏信度,也缺乏效度。
命题人既要避免被押中考题而偏偏不循常理思考,又要通过考题彰显和引导考生意识形态的“先进性”与“正确性”,导致每年频频出现缺乏现实性和生态意义的偏题、怪题。阅卷老师的偏见和价值倾向性直接影响了对考生的作文评分。更重要的是,无论中学写作训练还是高考作文考试,反映的往往不是考生的写作能力,而更多的是考生对僵化语文教育体制的适应水平。
设计一种技术上成功的考试,从心理测量学角度,必须满足三个基本的要素:效度、信度和标准化。
所谓效度,也即是考试的题目是否反映了通过考试想了解的学生能力或知识掌握方面,如果考题所能够反映的能力或知识掌握,与试图通过考试想了解的不一致,那么就是一门低效度的考试。
所谓信度,指的是一种考试的稳定性、一致性及可靠性。稳定性高的考试,每一次考试都能得到相对稳定的考试结果;一致性高的考试,无论是哪个阅卷老师按要求评阅出来的分数应该大体一致;可靠性高的考试,考生不同时候来接受测试应该得到大体相似的分数反映。
所谓标准化,则要求考试题目设计含义清晰,既不能模糊,也不能引发歧义。标准化的题目应当使所有考生都能清楚明白题目要求,并能按照题目要求作答;同时,标准化的题目应当有标准化的评分手册,使所有阅卷人能清楚明白且理解无误地遵循同等的评分标准和尺度。
如果一个考试既缺乏必要的效度,也缺乏必要的信度,题目和评阅也缺乏标准化的起码要求,那么就可以从心理测量学角度来判断这是一个失败的考试。如果仅仅满足于能够将考生甄别开来,那么抛硬币也能有效地把考生甄别为“合格”、“不合格”两类,而且后者不仅简单、便宜,而且相当“公平”。一个在心理测量学上失败的考试,其效用与抛硬币没有本质的区别。
高考作文考试,试图通过命题作文来了解考生的思考、分析能力,以及语言表达、思维缜密、阅读积累等综合能力,那么作文命题能够反映出来的考生能力是否就是希望了解到的能力呢?这就是所谓的效度问题。
一般来说,写作可以粗略地分为应用文的写作和文学的写作,前者要求使用精准的语言和有效的逻辑以使文章清晰明了;后者则要求想象力和创造性的文字表达能力。
事实上,经过高中语文教育,以及在高考作文考试中取得较好的分数的大学生中,仍然有相当比例的学生写作既缺乏逻辑,也缺乏想象,凭此难以认可高考作文考试是一种有效的考试。
高考作文命题往往具有极大的偶然性而非普适性,能写好去年度的高考作...