我们发明验证码是为了反机器，12306却用它来反人类

想必大家最近都被12306坑爹的验证码刷屏了，在这紧张的抢票节奏里，还要忍受验证码对智商的考验，生活也真是不容易。看到网站上的奇葩验证码，网友们纷纷献计献策，我个人觉得难度最大的应该是下面这种了。然而，吐槽归吐槽，在这小小的验证码背后，其实有着许多有趣的故事。屏幕上的方寸之间，其实有着智力上的激烈交锋。在验证码不断发展的背后，是一场场来势汹汹的技术变革。而这场变革，我们每个人都身在其中。

验证码的起源想必很多人都觉得12306的验证码“反人类”，但其实，“反人类”的验证码最初是用来"反机器"的。

1998年，康柏电脑公司（Compaq Computer Corporation）的四位程序员马克·李李布瑞吉（Mark D. Lillibridge），马丁·阿巴迪（Martin Abadi），克瑞斯那·巴拉特（Krishna Bharat）和安德雷·布罗德（Andrei Broder）向美国专利局提交了一份专利。

在这份专利里，他们提出了一种选择性限制计算机系统访问的办法（Method for selectively restricting access to computer systems）。他们提出这个方法的主要目的，是为了防止脚本机器人（bot）自动向他们的搜索引擎提交网址。区分人与机器的验证码想必大家一定见过类似上面的验证码图案。

而熟悉的验证码技术背后，隐藏的是这样一个很深奥的问题：如何区分真人和机器？——即如何证明坐在电脑前的是一个活人而不是一段程序呢？在这个问题上，一种解决方案是“图灵测试”，即“人类向计算机提问”。而验证码恰好相反，是“机器提问人类解答”，因而验证码也被认为是“反图灵测试”。

2003年，路易斯·冯·安（Luis von Ahn）等人提出了“全自动区分计算机和人类的公开图灵测试”，即CAPTCHA（Completely Automated Public Turing test to tell Computers and Humans Apart）。这个短语，正是验证码的名字。

程序员们智力的角逐早期的验证码可能只是一串简单的ASCII字符，比如黑客们用|-|3|_|_() )-(3££0”代表“HELLO”。这个后来发展成了火星文（leetspeak），o(╯□╰)o。后来验证码变成了图片显示字符串或者数字的形式，这也是我们最常见的验证码。早期的验证码采用扭曲字符和梯度背景，然而好景不长，这样的验证码很快就被破解了。

验证码的未来“反人类”的验证码，从始至终对抗的就不是人类，而是有着庞大计算能力却在模式识别、抽象思维上很弱的计算机。然而，随着人工智能技术的进步，计算机在模式识别上也越来越强大，验证码也不得不走上越来越“扭曲”、“复杂“、“反人类”的不归路。验证码难度的提升，本质上反应了人工智能技术的进步。而目前，无论我们多么吐槽12306的验证码，但至少，我们还能够通过它证明我们是真人，而不是机器。

这在某种程度上反应了人类在智能上的优越性，至少现在，我们还是比机器智能优越。