没想到,从人工智能手上救下愚蠢的人类的,竟然是.... 验证码???

赞赏 2017-08-01

​小编最近在科学上网的过程中注册了一些国外的门户账号,发现注册过程中总是出现一个框框让人勾选才能完成注册:




港真,我是机器人我也能勾啊,有差吗?



但是小编作为一个好奇宝宝,深入研究了一下这玩意儿。妹想到,这样一个简简单单的勾选项,竟然是目前对付人工智能的最终极武器...


这事要从这玩意儿说起——




2003年,卡内基梅隆大学的 Luis von Ahn 发明了验证码。虽然我们一般所见的验证码都只是几个扭曲的字符,但千万别小看了它们。


验证码原名 CAPTCHA,全称为Completely Automated Public Turing Test to Tell Computers and Humans Apart (全自动区分计算机和人类的图灵测试),简单来说这就是当机器人假扮人类进入我们的团体当内鬼的时候,我们的照妖镜啊!!


初代验证码是即是我们常见的图形验证码、语音验证码。


一般来说,这些扭曲的文字点阵等等都是用来防止自动刷的(比如刷票等等)。基于机器难以处理复杂的计算机视觉及语音识别问题,而人类却可以轻松的识别来区分人类及机器。这一代验证码初步利用了人类知识容易解答,而计算机难以解答的机制进行人机判断。



后来,我们也创造出一些升级版的验证码,都是基于第一代验证码的核心思想(通过人类知识可以解答,而计算机难以解答的问题进行人机判断)而产生的创新的交互优化型验证码。第二代验证码基于第一代验证码的核心原理:人机之间知识的差异,拓展出大量创新型验证码。


比如12306的验证码...



现在每天都有上百万的人为了购买门票或者注册邮箱在网上填写验证码,那von Ahn 又想,这件事能不能用来干点啥?

Luis von Ahn


然后他搞了一套系统,让机器学习人类辨认那些难以被机器辨认的字符,以帮助我们数字化书籍。


他们将大量的书通过OCR技术扫描,将纸质文本转化为电子文本,挑选出程序无法识别的字符,然后放到验证码图库上让真实的人类解开。当足够多的人确认了这个单词的意思,机器也就自动学习了,并上传到电子书字库里,在下一次扫描到这个词的时候就能够准确地识别出来。



这个项目被 von Ahn 命名为 reCAPTCHA,他们的宗旨是:Stop Spam,Read Books(别乱bb,多读书)。目前,每天有一亿个 reCAPTCHA 被输入,相当于每年250万本书。


到了09年,谷歌把这个reCAPTCHA收购了,这个项目大大地帮助了谷歌图书。后来,谷歌又把谷歌地图上那些难以辨认的路牌号码放到库里,通过这个项目帮助谷歌地图打标签。



这件事情看起来很美好,但其实问题也很多:


  1. 图像和语音验证码给视觉障碍和听力障碍者构成了巨大的不便。

  2. 开始有一些付费的破戒验证码服务出现——他们在世界上一些贫困的地区设立了 “验证码” 农场,用低廉的人工填写验证码然后输送到你的客户端。

  3. 最后一个问题就是——包括谷歌自己在内的计算机视觉项目发展得太快了!这些验证码直接通过程序破解变得越来越容易


piapia打自己脸??


有一些一根筋的工程师想:把验证码搞得更扭曲点不就好了!然后出现了...


这样的


这样的


还有这样的...

结果经过一系列的发展,谷歌自己的图像识别技术辨别这些验证码的准确率是99.8%


U Know What...


愚蠢的人类只有大约33%...


好吧... reCAPTCHA 的科学家们终于转换了一下思路,搞出了这个东西——


噢不对,是这个东西——



NO CAPTCHA reCAPTCHA

(无验证码验证码)


当你点击一下,你的ip地址,国家,时间戳,和你挪动鼠标的的动作、点击前拉动滚动条的方式等就被记录下来并发送给服务器作记录(谷歌会保密的请大家放心戳!)。这些记录会被谷歌的风险学习引擎处理,机器人们很难模仿人类磨磨唧唧的动作,所以大部分时候,引擎都能识别出真人和机器人。


这种“无知识型验证码”是基于人类固有的生物特征以及操作的环境信息综合决策,来判断是人类还是机器。无知识型验证码最大特点即无需人类思考,从而不会打断用户操作,进而提供更好的用户体验。


阿里巴巴的滑动验证也是这种类型~


所以说,转发这篇文章给你身边所有愚蠢的人类看,让大家都多给验证码库传传数据,很快 AI 们又能把新型的验证码攻克啦~~~

登陆后阅读全文
阅读 1841 赞赏 0 有用 4 没用 0 收藏 0 分享

   



0 条留言

ESTRELA的头像

ESTRELA

架构师之路

有料推荐

这世界欠我一个这样的老公!

高校学生模仿“世界名画”摆拍,可以说是戏精本精了

iPhone X 跌破发行价,苏宁200亿入股恒大 | 财经日日评

果然是高手!这次在日本,特朗普竹杠敲得不是一般狠

资深黄牛现身说法:iPhone X价格秒变不停,就像炒股一样

长一样的双胞胎也能识别?蚂蚁金服发布「眼纹识别」技术

苏联是怎么被阿富汗拖垮的?

美团或入局「分时租赁」共享汽车,王兴要大笔投入「泛出行」领域了? | 36氪独家

你或许被“一盘番茄炒蛋”刷屏了,但有人辛酸,有人质疑

iPhone X发售前夜,黄牛与苹果公司的不安

他的文章

漫画:如何破解MD5算法?

漫画:什么是MD5算法?

Node也许不是构建大型服务的最佳选择——Node之父Ryan Dahl访谈录

7个有益的编程习惯

58技术部线上操作与线上问题排查实战

不看任何数学公式的情况下理解傅里叶分析

多对多业务,数据库水平切分架构一次搞定

没想到,从人工智能手上救下愚蠢的人类的,竟然是.... 验证码???

或许你不知道的10条SQL技巧((sql 优化 sql索引优化))

怎样才能生成一亿个不重复的随机数 | 算法

手机扫一扫
分享文章