教育评价,无论是评整体(学校、学科、专业),还是评个体(教师、学生),人们宁愿相信自己的感觉,而不采信精确的数据。这是为什么?
在回答这个为什么之前,先判断一下:人们的感觉灵吗?如果不灵,进一步深究显然没有任何意义。实践证明,人们的感觉往往八九不离十,至少远比精确的数据靠谱。
从科学上讲,实现对教育(如个体或整体的实力和水平)的精确评价,至少要满足三个前提(科学上叫假设):
1. 实力和水平是可以被精确定量评价的;
2. 评价者是懂评价的,设置的考题或指标体系能够精确测试出实力和水平;
3. 被评价对象的答卷或呈现的指标是诚实和真实的。
假设1目前看来没法检验,但我们一直在做(例如对学生考试、对教师算工分),姑且算作一种无法摆脱的公设。假设2和3,人所共知,有无数案例可以证明它们不成立。
关于假设2,笔者忍不住插个故事。
几年前,笔者参加高中同学餐聚,班主任老师把我们当年每次月考的成绩册带来了。有位同学的闺女看笔者生物成绩28分,问笔者如此低分怎么也能考上大学。笔者心想,我们当年高考,如果生物满分不是设定为30分,而且与语文反过来,即语文满分30分,生物满分120分,那么笔者就可上更好大学了。
进一步,即使语文满分120分,但如果不考拼音、古文等内容(笔者的语文是由村里的民办教师用家乡土话启蒙的),笔者的考分也会有不少提升。
站在更前沿的量子科技上看,把教育评价类比为量子测量,那么就更容易理解了。众所周知,教育的对象(学生)有独特性,教育的目标有多样性,而教育评价的最大威力是同质化、标准化。教育家们早有真知灼见:你只能得到你评价的东西(You get what you measure)。这与量子测量的结果如出一辙。
可以说,教育系统就像量子系统,本来是一个由大量本征态组合而成的叠加态,但是,你一测量,就只得到一种状态——坍缩态,也就是说,把一切皆有可能变成只有一种可能。我们现在反对“唯分数”“唯论文”等教育领域的各种“唯”做法,其背后的科学或逻辑或许也在于此。
你只考或加大权重考语文,你得到了语文好的人,但同时排除了像笔者这样生物好而语文不好的人;你若只考或加大权重考生物,笔者就发了。这就像观察薛定谔的猫,不评,是死是活,又死又活,等等一切皆有可能;一评,或死或活,你死我活。
费曼在其《QED:光和物质的奇妙理论》一书中说:“如果你粗略地进行计算,这个理论(量子电动力学)能给你相当合乎逻辑的结果。但要是想进行更精确的计算,你会发现修正值事实上竟然是无穷大!原来,这个理论不允许你把任何一个量计算得超过一定的精度。”
教育是可以评价的,但正如量子系统一样,是不可以精确评价的,如果精确评价,看似客观公正,实则精之毫厘、谬之千里。更要命的是,精确评价可能导致整个系统坍塌。教育如果非评不可,那么最好的评价竟然是人们的感觉。可能有人担心感觉这玩意儿会因立场、情感等因素而变,但那显然是另一个问题。