12306启用的图形验证码能防住抢票软件吗?

作者: 果壳

来源: 果壳网

发布日期: 2015-03-17

本文讨论了12306图形验证码的防破解能力,分析了验证码的构成和破解方法,以及可能的技术限制和应对策略。

12306启用的图形验证码能防住抢票软件吗?这种带有含义的图片验证码涉及到一个问题和答案图片库丰富程度的问题。比如问题是太阳能,那后台数据库中会存储若干种太阳能图片,每次挑出2、3个出来,在加上几种错误答案当做干扰,合成一张验证码图片发给用户。

对应的破解办法可以大量请求验证码,找出所有的问题和答案图片的对应关系,比如问题是太阳能,通过大量请求验证码图片,把所有12306作为答案用的图片“穷举”出来,人工找出太阳能图片,之后每张图片计算一个特征值记录下来。登陆时碰到问太阳能答案的问题然后查看12306给出的各个验证码图片的特征值,和已知答案的特征值匹配,就能破解。但是这种方法的限制在于预先“穷举”答案库时对验证码接口的访问压力比较大。

如果12306那边问题和答案图片的丰富程度很高,就会让穷举时候的请求数目大幅上升,而大量请求验证码也是一个反常的行为容易触发网站的防护策略,很容易导致网站对爬虫进行封禁。其他“低级的”破解方法不了解,识别图片含义再像人一样把验证码挑出来的这种技术要求太高,一般的黄牛党也用不起(你就想挂上去抢个票更用不起)。

对了,补充一下有打码平台这种玩意,一个验证码几分钱,需要识别的人把图片发给平台,平台提供接口给后面一帮人的人肉识别输码,然后把结果反会给你。以前有些人爆破撞库时候会用到这东西。这要看图片是来自于哪里 如果是图片网量购买的 那还是有被攻破的可能性。只要遍历图片网建立图像识别数据库就行了 只要有钱赚 肯定会有技术人员去做的 吃黄牛的饭肯定赚钱 不是么。

这个东西不光春运用 一年365天都在用 时间不是压力。实际操作中 需要下载图片 在网络上找匹配 看这个图库出自哪里 商业图库的可能性很大 找到后也买一个 或者编写一个程序 在线遍历各个目录的图片 把这些图片的指纹信息都记录下来。登陆12306后 出去分析验证码里的图片 把得到的特征和库里的比对 就可以得到结果。

破解的办法则是在图片上增加干扰 比如说略微修改颜色 加入一些少量彩色的噪声 条纹 或者轻微扭曲图片 颠倒 翻转图片 增加识别难度 让他即使有很高的识别率 也不能做到高速的抢票。不宜对试探错误次数过多进行惩罚。另外 我想说的是 如果是农民 不知道图片里的 巧克力 储存卡怎么办? 还有残障人士怎么读取图片也是问题 最好是能提供语音配合。

UUID: f1e4890a-dcb4-4090-8301-f194fe11019c

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2015/2015-03-17_12306启用的图形验证码能防住抢票软件吗?.txt

是否为广告: 否

处理费用: 0.0027 元