我们或许都讨厌给我们的⼯作带来⽆尽压⼒的关键绩效指标(KPI),以及完不成KPI的痛苦。但是,组织者却常常认为,必须要有⼀些东⻄来衡量、评估⼯作,实现“科学管理”。但KPI这种东⻄——包括⼯作上的各种指标——真的是科学的吗?
近年来,“唯指标论”正盛⾏于各⼤公司、政府机构和慈善组织。在过去,对⼀件事情好坏的专业判断往往来⾃个⼈经验和才能;⽽现在,⼈们相信这些判断可以被定量的绩效评估取代。新的评估建⽴在⼀系列标准化的指标上。⽼板们认为,根据这些指标来奖励或惩罚员⼯的表现,或许是激励组织员⼯的最好⽅式。奖励可以是钱,⽐如绩效⼯资;也可以是声誉,⽐如⼤学排名、医院评级、外科⼿术报告单(能够显示⼀个医⽣做某项⼿术的成功率。)
虽然这种⽅式看似优势显著,但也有很多弊端。唯指标论最显著的负⾯影响,是它很可能会⿎励耍花招⾏为的出现:它会让⼈们⼀味地追求指标的最⼤化,即使它与组织的⼤⽬标不⼀致也在所不惜。举个例⼦:如果将⼀个地区的重⼤犯罪率当做提拔警察的标准,就可能使⼀些警官违反正规操作:不如实记录下辖区内发⽣的案件,或把犯罪⾏为从重罪降为轻罪。
除了警察,在其他的⾏业中,也会出现类似的情况,以外科医⽣为例:当⼿术成功率这个指标会影响他们的声誉和收⼊时,⼀些外科医⽣会便拒绝给疑难杂症患者做⼿术,因为这些⼿术更可能失败,影响指标提升。
当奖励与可量化的表现挂钩,那么唯指标论就会引起这种耍花招⾏为。但即使不这样,唯指标论也会带来各种更微妙的、意外的反作⽤。
其中⼀个叫做“⽬标置换”,它有很多种表现⽅式:当绩效通过⼏项指标来确定,并且关系到重要利益时(不丢⼯作,加薪,或者在优先认股权被授予时提⾼股票价格),⼈们会关注如何满⾜这些指标——通常意味着牺牲其他更重要但没纳⼊组织体系的⽬标。
这是⼀种普遍的现象,最着名的例⼦就是所谓“应试教育”,“指标”在教育中的应⽤,已经让美国的很多学校⾛了样:2001年,美国引⼊了“有教⽆类法案”,该法案引⼊了⼀系列指标,例如教师的资格证明、学⽣的考试成绩等,作为评判教育⽔平的标准,⽽这更是会关系到教师的去留和学校的存续。于是⽼师们会强调要进⾏标准化考试的重点科⽬(数学和英语);⽽不考的科⽬,包括公⺠教育、艺术和历史,则会被忽视。
这种⽬标置换在经济学⾥⼜被称为“古德哈特定律”:⼀项指标⼀旦成为政策制定的依据,便⽴刻不再有效。政策制定者会牺牲其他⽅⾯来强化这个指标,使得这个指标不再具有指示整体情况的作⽤。
像GDP这样的某个特定衡量标准,⼀旦被⽤作⼀个复杂系统(⽐如⼀个国家的经济状况)的性能指标,政府便可能会关注这个衡量的指标,以国家的其他⽅⾯为代价来提⾼这个指标的增⻓——⽐如牺牲消费、⿎励基建投资,数字是上去了,但在衡量更⼴义的经济和国家财政健康状况时,它变得不再那么有效。
同样的,如果你想开发⼀个AI聊天机器⼈,将⽬的设为“能和⼈类聊上5分钟”,那么开发者就会⽤各种奇怪的花招把这个5分钟填满,然后聊天的时⻓就不再能够体现AI的智能度。短视则是唯指标论的另⼀个负⾯因素。在1936年,美国社会学家罗伯特·K·默顿曾提到可量化的绩效会⿎励“利益的当下暴政……让⾏动者只关⼼可预⻅的眼下后果,⽽不考虑更远的或者其它层⾯的后果。”总之,推进短期⽬标达成,意味着牺牲⻓期利益。
这个问题在上市公司中普遍存在,这些公司会牺牲⻓远的研究投⼊和发展、以及员⼯的发展,来换取季度报告中被认为必要的好看数据。
唯指标论还有另⼀个问题:测算它需要成本。编纂和处理指标已经意味着很多雇员开销了,更不要说真的去读这些指标所花的时间。
正如管理咨询师伊芙·莫留和彼得·托尔曼在《六个简单规则》⼀书中指出的那样,唯指标论会让员⼯耗费更⻓时间、⼯作更劳累,⽽这些⼯作对组织的实际⽣产⼒⼏乎没有积极作⽤,还消磨了他们的热情。为了排除各种花招、欺骗和⽬标转移带来的指标错误,组织通常会制定⼀连串的规则,⽽遵守这些规则会进⼀步减慢机构的运作,降低效率。举个例⼦:美国医疗体系曾经将“再⼊院率”作为评价重症护理医院的重要指标,并与医⽣的绩效挂钩。
然⽽,那些再⼊院率⾼的医院,往往是负责攻克难症的研究型医学院,或者那些服务弱势群体的医院。为了弥补这个缺陷,“⻛险调整”被纳⼊了绩效体系中,但对⻛险的评估、如何应对⼈为操纵,⼜让制定者陷⼊了麻烦。英国也有同样的窘境。2016年《柳叶⼑》上发表的⼀项研究指出,英国国⺠健康体系中的“质量和结果框架”——世界上最⼤的医疗绩效评估体系——对英国病⼈的死亡率降低并没有显著贡献。
与“绩效⼯资激励⼈们⼯作”的常识相反,⽤绩效指标来衡量⽣产⼒的尝试,反⽽会降低主动性,阻碍创新,让⼈不敢冒险。没有冒险,就可能会错失良机:最终找到本·拉登的情报分析家,在这件事上花了很多年。如果在此期间的任何时候来评估他们的⼯作,得出的结论肯定是⽣产⼒为零。年复⼀年⽉复⼀⽉,他们的失败率为100%——直到最后成功。
从上级的⻆度来看,让分析师⻓时间参与这个项⽬是要冒很⾼的⻛险的,时间上的投资可能⽆法兑现。然⽽,真正伟⼤的成就往往取决于这些冒险本身。
问题的根源在于,当⼈们的成绩通过绩效指标判断时,他们会更愿意做那些指标能衡量的事,⽽指标衡量的东⻄都是些既定的⽬标(例如处理了三张报表,或者写了两个⽅案之类)。但这会阻碍创新,因为创新就是做⼀些⽆法⽤既定⽬标来衡量的东⻄,实际上是根本就没⼈试过的东⻄。创新需要实验,⽽实验是有可能、甚⾄很有可能失败的。
还有,⽤可衡量的绩效来奖励个⼈,会减少集体共同的⽬标感,阻碍促进合作和效率提升的社会联系。
这些激励常常会反⽽导致内部竞争。强迫组织中的⼈将努⼒仅仅集中可衡量的那⼏个指标上,会让⼯作体验变得糟糕。⼈们被绩效指标缚住⼿脚,仅仅把眼光聚焦在⼏个有限的⽬标上;⽽这些指标和⽬标的制定者可能并不理解这些⼈的⼯作。如果⼀个⼈不能⾃⼰决定要解决什么问题、⽤怎样的⽅式解决,那就会缺乏⼼理上的刺激,变得迟钝,也不会有激情去探索未知的领域——未知的领域当然没有绩效来衡量。
⼈们的创造本性就这样被唯指标论给扼杀了。
被指标所捆绑的组织,会让其中有才华、有⾸创精神的员⼯和成员逐渐脱离其主流⽂化:优秀的⽼师从公共学校离开、投奔私校;⼤公司的⼯程师离职、加⼊⼩公司;⽽有事业⼼的政府雇员则成为咨询师。这些现象当然也有积极⼀⾯,但不可否认的是,我们社会中的⼤型组织会因为把最可能创新的员⼯赶⾛⽽遭受损失。越是纠结绩效、把衡量⼯作成果变成往条条框框⾥打钩打叉,就越没法留住那些有能⼒跳脱条条框框的⼈。
以哈佛⼤学的戴尔·约根森为代表的、专⻔计量经济⽣产率的经济学家们,报告说近年来美国经济整体停滞,唯⼀的例外——实现全要素⽣产率增加的唯⼀⼀个经济部⻔——是信息技术⽣产⾏业。接下来要问的问题就是,⼜花时间精⼒、⼜消磨创新、⼜造成短视的“计量⽂化”本身,需要为经济的停滞负责吗?