龙空技术网

烦人的验证码怎么还没被淘汰?

万物BB机 1606

前言:

现时朋友们对“验证码一直变”大概比较着重,兄弟们都需要剖析一些“验证码一直变”的相关资讯。那么小编在网络上收集了一些有关“验证码一直变””的相关内容,希望咱们能喜欢,朋友们一起来了解一下吧!

验证码:互联网极客善恶斗争的见证者。

首先我们需要区分一个概念。短信验证码和网站的图形验证码并不是一回事。

当你在手机上注册APP账号,点击获取验证码,网站后台会生成验证码内容,将你的手机号和验证码内容发送给短信服务商,他们会判断验证码内容是否合规,手机号码是否正确,然后将内容提交给短信运营商。最后以短信形式下发到你的手机。

短信验证码,是在判断你是不是你。

但互联网上的网站验证码,则并没有这么简单。

先来说说为什么要有验证码。

2000年啊。那会各种社交软件都还没出现,人类经常用伊妹儿沟通,真正做到海内存知己,天涯若比邻。然而一帮好死不死的骗子,批量注册邮箱,大规模群发诈骗邮件。试想一下,一打开邮箱,满屏幕都是卖大力丸和壮阳药的广告,感觉很不爽吧?

就连邮箱服务提供商,雅虎公司都莫得办法分辨,注册邮箱的是人还是鬼。

来自危地马拉的计算机天才,路易斯·冯·安(Luis von Ahn)提出一个划时代的解决方案,在注册邮箱时,安排一个判定环节。也就是让用户输入一串扭曲、重叠、盖了油污的字母或数字。

这个工作,人类是很容易做到的,但对于当时的机器来说,根本办不到。

这套系统,叫做CAPTCHA,即完全自动化的把机器和人类区分开的公共图灵测试。严格来说,验证码应该叫“反向图灵测试”,因为它的本质是由机器判断你是不是人。

阻止骗子恶意注册的问题,暂时被解决了,但又带了一个新问题,填验证码,太费时了。我们简单算一笔账。假设填一次验证码花10秒,加起来所有人每天就要浪费20多亿秒,也就是63.4年。有这时间干点什么不好?

安天才又开始思考,能不能让这段时间被高效的利用?他把目光瞄准了那些亟待被电子化的海量图书。如果人工输入这些图书,无疑,非常耗时,用电子扫描,也基本都是糊成一片。

为了解决这个痛点,他又重新设计了名为reCAPTCHA的验证码系统。

这个系统由两部分组成。

第一部分和之前一样,是自动生成的内容,用来检测你是不是人。而第二部分,就是机器无法识别的文本。如果第一部分你输入正确了,机器就会假设第二部分也是正确的,通过验证,然后把录入结果返回到主机。

别担心,主机会把第二部分的内容发送给多个用户,进行交叉验证,确保不会出错。

所以说,其实我们不知不觉,为人类的文明做出了巨大贡献!自推出至今,reCAPTCHA系统已经数字化了1300万篇文章,2500万本图书。今天,全世界每天约有2亿个字符被reCAPTCHA录入,这相当于一个高级打字员,上24小时的班,连上2年半的工作量。

然而,在人类通过验证码创造价值的同时,骗子也没闲着,他们想出各种办法对付验证码。

第一个办法,就是把填验证码的工作外包给大量的人类劳工。比如说在印度,每填写1000个验证码可获得0.8-1.2美元的收入。如果你一天能填3000个,报酬就差不多和印度南部一些流水线加工厂的日薪持平了。

而更为高级的办法,就是使用人工智能。

2017年,美国人工智能公司Vicarious就提出用人工智能技术,破解验证码。这套方法,也叫递归皮质网络。翻译为人话,就是给机器看一定数量的图片,它就可以自己总结出规律,识别验证码中变形的图案。

所以,极客们不得不再想出更厉害的验证码。

在谷歌收购了reCAPTCHA系统后,他们推出了一种没有验证码的验证码,即“I'm not a robot”。

这套验证码背后,同样有强大的人工智能做支撑。当你在移动鼠标的时候,它们会收集大量的信息,包括IP地址,来判断你平时的浏览习惯,包括反应时间、拖拽鼠标的速度和轨迹等等。

以此来判断你到底是不是人。

那你一定要问了,既然技术这么厉害了,为什么还会碰上下图这些验证码呢?

其实,这是为了训练人工智能。

人类识别的这些图片,会变成标注好的数据,用来给人工智能用作训练算法模型。数据标注越准确、数量越多、模型的效果也就越好。所以,人工智能需要海量的标注数据,最好的办法,自然是让人类一起参与这一工作,也叫“众包”。

比如给车辆、摩托车、自行车打边框,这类图片就是用来训练智能摄像头的识别能力。

再比如分辨建筑物的边缘,就是用来提升自动驾驶系统对周边环境的认知能力。

任何一种天才的设想,都代表着人类无穷无尽的创意和智慧。技术给了我们新的便利和可能,却也会让恶者破坏生态和美好。但人类总是能用创造性的手段,把文明拉回正确的赛道。这才是我们生而为人的骄傲。

编辑:张语格

编导:基德A

排版:新桐

参考资料:

1:新闻实验室:《验证码的故事:互联网的一个缩影》;

2:硅星人:《你以为自己在填验证码,其实是在给谷歌做义务劳动》,2018年;

3:造就Talk:《人人都讨厌验证码,但我们为什么离不开它》,2019年;

4:新浪科技:《是谁设计了让人亦爱亦恨的验证码》,2015年;

5:新浪科技:《人工智能:真的需要不少“人工”》,2017年;

6:CAPTCHA - Wikipedia;

7:The Surprisingly Devious History of CAPTCHA | Mental Floss;

8:CAPTCHA: The story behind those squiggly computer letters;

9:CAPTCHA: A brief history - HeX Productions。

标签: #验证码一直变