他们找到一位当时刚刚21岁的天才——Luis von Ahn。 而Luis Von Ahn给出的方案,就是这个让人民群众微微皱眉,但是让计算机耸肩挠头的验证码。计算机辨识技术还很落后,对于经过扭曲、污染的文字,无法辨识。而人类却可以轻松认出这些文字。这是一个简单而巧妙的设计,计算机先是产生一个随机的字符串,然后用程序把这个字符串的图像进行随机的污染,扭曲,再显示给显示器前的人或者机器。凡是能够辨识这些字符的,即为人类。
故事还没完,Luis Von Ahn是那种追求完美的科学家。当全世界数以十亿计的人每天都会浪费几秒钟的时间参与辨认文字这一简单活动的时候,他开始思考,其中浪费的人脑智力是否能得到更好的应用呢?Luis Von Ahn的最终设计是,让人们用这些脑力解决一些计算机无法解决的“图书数字化”。
因此,2002年,luis Von Ahn开始让验证码引用各种无法被计算机辨识的文字图像,目前,已经有上万网站采用他的新一代验证码。每天帮助辨识数以百万计的古老文档。问题在于,对于最初的验证码来说,计算机实际上是知道答案的。而Luis希望人们辨识的文字,计算机实际上是不知道答案的,那如何能验证返回的答案到底是不是真的呢?
再要网上追根述源,现在许多网站采用的验证码技术都来源于谷歌在2009年推出的一个项目,直到现在,仍有许多网站还在使用由 Google 提供的 reCAPTCHA 服务(link)。不过和许多网站提供的词库不同的是,谷歌希望在保障用户信息安全的同时也能让用户的这部分行为不至于做白用功,所以谷歌在图库中特别提供了一些辨识度不高或者有污渍的验证码,然后把验证数据收集起来,以便将来使用电脑程序自动辨识受损文献或者模糊的图片。
老网民们大概都记得,刚开始上网的时候,是不存在验证码(captcha)这么一种东西的。这造成的结果是,垃圾评论和垃圾邮件可以轻松通过任何一个网站的注册程序,通过各种方式轰炸人民群众的眼球。
最先想要解决这一问题的是雅虎——作为互联网时代早期最重要的免费邮件提供商,他们一方面要解决用户们每天遇到的数以百计的垃圾邮件轰炸,另一方面,他们自己的免费邮箱,恰恰又是垃圾邮件的最爱——耗费无数资源所阻止的垃圾邮件,都来自于自己的服务器。这让雅虎开始认真考虑如何解决人机辨识问题。
他们找到一位当时刚刚21岁的天才——Luis von Ahn。 而Luis Von Ahn给出的方案,就是这个让人民群众微微皱眉,但是让计算机耸肩挠头的验证码。计算机辨识技术还很落后,对于经过扭曲、污染的文字,无法辨识。而人类却可以轻松认出这些文字。这是一个简单而巧妙的设计,计算机先是产生一个随机的字符串,然后用程序把这个字符串的图像进行随机的污染,扭曲,再显示给显示器前的人或者机器。凡是能够辨识这些字符的,即为人类。
故事还没完,Luis Von Ahn是那种追求完美的科学家。当全世界数以十亿计的人每天都会浪费几秒钟的时间参与辨认文字这一简单活动的时候,他开始思考,其中浪费的人脑智力是否能得到更好的应用呢?Luis Von Ahn的最终设计是,让人们用这些脑力解决一些计算机无法解决的“图书数字化”。
转载圆或者引用本文的见内容五请注约明来源于芝士回答
在计算机时代以前,印刷术已经存在了数百年,但这些印刷术所产生的书本和报纸等等,对于计算机来说都是模拟信号,仅以图像的形式存在,而非以数字化的形式存在。但是,早期的印刷术并不精确,文字大小不一,形象有差别。而且因为印刷品年代久远,拥有各种细微的缺损和污染。这对人眼来说不是什么大问题,但对计算机来说就麻烦了。
因此,2002年,luis Von Ahn开始让验证码引用各种无法被计算机辨识的文字图像,目前,已经有上万网站采用他的新一代验证码。每天帮助辨识数以百万计的古老文档。问题在于,对于最初的验证码来说,计算机实际上是知道答案的。而Luis希望人们辨识的文字,计算机实际上是不知道答案的,那如何能验证返回的答案到底是不是真的呢?
解决这个问题的方法依然体现了Luis一贯的简洁和优美,他让人们每次辨识两个,而非一个验证码,其中一个来自于计算机随机生成的字符串,而另一个则是从文档中选取的计算机不认识的字符图像。只要人们对前一个字符串给出的答案是正确的,那么就判定,人们对后一个验证码的辨识是正确的。
用这一方法,luis的验证码2.0 已经帮助完成了整个纽约时报130年的报纸存档数字化——这一本可能花费无数时间和资源的工程,在几个月之内就由各位网友们完成了。
创意天才!!一些此风车,务示书千历。
在 12306 上买过火车票的人,大概都领会过 12306 的花式验证码。被验证码虐过的人应该不在少数。12306 的验证码经历了数字、字母、加减法、闪烁变形字母、干扰线变形字母、图片等变化,更可怕的是,图形码的数量已经多达 581 种,可细分为十二个品类。按照每次输入两个关键词的登录规则,用户将面临 336980 道不同的验证码,而一次性输入正确的概率仅为 8%!说实话,8% 的输入成功率一般没有哪家公司敢这么玩,12306 敢这么任性就是因为该网站具备垄断的权力,网上购火车就这一个渠道,你不忍也得忍。不过鉴于 12306 的这套花式验证码都是为了对付可恶的黄牛,我们也没什么好抱怨的。除了 12306,似乎所有 App 在操作的时候总要发验证码进行验证,这又是为何呢?手机短信的唯一用途成了花式接收验证码。不知从何时起,生活中的一切操作都被无穷无尽的验证码所占据,我们似乎已经记不起来,自己也曾度过一段没有验证码的生活。互联网发展最初是没有验证码的。那时候在论坛上发帖留言,只需一个回车键就能搞定。但这样的日子并没有安稳多久,因为网络黑客发现自己要是写个程序自动发消息,就能刷爆论坛,甚至直接让服务器崩溃,好好玩的样子。他们编写了一种能够大量、重复编写信息的程序,伪装成人类用户,肆无忌惮地朝网络上倾倒大量的、无意义的“僵尸”信息,垃圾邮件、垃圾广告、垃圾评论到处乱飞。这都还只是恶作剧,更恶劣的是让程序用穷举方式盗取别人的账号密码,然后非法谋取利益。不只是影响到了用户,就连提供商也收到了不少的牵连,这其中当属电子邮件提供商最惨。黑客每天用电子邮件供应商的免费邮箱发垃圾邮件,用户每天邮箱里躺着的不是工作邮件,而是成百上千的垃圾邮件。这些邮件供应商还拿这些黑客没一点办法,不审查吧,无法保证自己的服务质量,用户怨声载道;挨个审查邮件吧,工作量大到怀疑人生,而且又有不尊重用户隐私的嫌疑,真是被黑客玩得没一点脾气了。难道没有任何手段约束程序机器人吗?有。此前有一个人叫图灵,著名的图灵测试就来自于他:图灵采用“问”与“答”模式,即观察者通过控制打字机向两个测试对象通话,其中一个是人,另一个是机器。要求观察者不断提出各种问题,从而辨别回答者是人还是机器。比如——问:你会下国际象棋吗?答:是的。问:你会下国际象棋吗?答:是的。问:请再次回答,你会下国际象棋吗?答:是的。不用想,面前这位是很大概率是一台笨机器。问: 你会下国际象棋吗?答:是的。问:你会下国际象棋吗?答:是的,我不是已经说过了吗?问:请再次回答,你会下国际象棋吗?答:你烦不烦,干嘛老提同样的问题。那么你面前的这位,大概是一个活生生的人。从上述两种对话可以看出:第一个回答者只是单纯从知识库里提取简单的答案,第二种则具有分析综合的能力。这一实验给了一位叫路易斯·冯·安的 21 岁大学生很大灵感。路易斯·冯·安是一个计算机天才,17岁进入卡内基梅陇大学。在大学时期,他凭借良好的表现获得了导师曼纽尔·布鲁姆的赏识,傲人履历让雅虎向他伸出橄榄枝——Yahoo(雅虎)在当时还是最有实力的邮件提供商,他们下定决心要解决网络黑客问题。路易斯·冯·安从图灵实验中受到启发,没多久就给出了独特的解决方案:路易斯发现,人类的肉眼可以轻易识别图片里的文字信息,但机器不能,尤其是在那个 AI 一点都不发达的年代里。只要在邮箱注册和发送前加一道验证码来验证,就能立刻辨别出对方是人还是机器了。有了路易斯·冯·安的奠基,验证码的种类也就越来越多了。比如 12306 “人神共愤”的加减法、干扰线变形字母、图片验证码……在那个年代,验证码实实在在地解决了问题,但在当今时代,验证码还能那么好用吗?也不见得。比如我们最常见的短信验证码,其实很容易被手机病毒盗取,被不法之徒拿去进行恶劣的电信诈骗等违法活动。因此金融类 App 在你转账的时候,会想方设法验证你究竟是不是本人,连续输错三次账户就会被锁定。
防止机器恶意注册.
验证码的作用:有效防止这种问题对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试,实际上是用验证码是现在很多网站通行的方式(比如招商银行的网上个人银行,腾讯的QQ社区),我们利用比较简易的方式实现了这个功能。虽然登陆麻烦一点,但是对社区还来说这个功能还是很有必要,也很重要。但我们还是提醒大家主要保护自己的密码,尽量使用混杂了数字、字母、符号在内的6位以上密码,不要使用诸如1234之类的简单密码或者与用户名相同、类似的密码。 不要因为只是来iclub问问问题,就随意设置密码,保护你自己的密码也是保护你自己,免得你的账号给人盗用给自己带来不必要的麻烦。 ~
(1).验证码一般是防止批量注册的,人眼看起来都费劲,何况是机器。二像百度贴吧未登录发贴要输入验证码大概是防止大规模匿名回帖的发生目前,不少网站为了防止用户利用机器人自动注册、登录、灌水,都采用了验证码技术。所谓验证码,就是将一串随机产生的数字或符号,生成一幅图片, 图片里加上一些干扰象素(防止OCR),由用户肉眼识别其中的验证码信息,输入表单提交网站验证,验证成功后才能使用某项功能。
未经空芝月士回答允许不得转载本也文便内容,否则较将视为侵权
(2).一般注册用户ID的地方以及各大论坛都要要输入验证码
(3).常见的验证码
1,四位数字,随机的一数字字符串,最原始的验证码,验证作用几乎为零。2,CSDN网站用户登录用的是GIF格式,目前常用的随机数字图片验证码。图片上的字符比较中规中矩,验证作用比上一个好。没有基本图形图像学知识的人,不可破!可惜读取它的程序,在CSDN使用它的第一天,好像就在论坛里发布了,真是可怜!
3,QQ网站用户登录用的是PNG格式,图片用的随机数字+随机大写英文字母,整个构图有点张扬,每刷新一次,每个字符还会变位置呢!有时候出来的图片,人眼都识别不了,厉害啊…4,MS的hotmail申请时候的是BMP格式, 随机数字+随机大写英文字母+随机干扰像素+随机位置。
5,Google的Gmail注册时候的是JPG格式,随机英文字母+随机颜色+随机位置+随机长度。
6,其他各大论坛的是XBM格式,内容随机。
(4)意义:不少网站为了防止用户利用机器人自动注册、登录、灌水,都采用了验证码技术。所谓验证码,就是将一串随机产生的数字或符号,生成一幅图片,图片里加上一些干扰象素(防止OCR),由用户肉眼识别其中的验证码信息,输入表单提交网站验证,验证成功后才能使用某项功能。
离考研还有不到90天了,全国学子在不分昼夜地复习的同时,也开始准备各种报名事项了。前两天是考研预报名的日子,但是成都大学的一位大四女生在填写网站登录验证码时,竟然出现了“别考”字样的验证码。这难道……是冥冥之中自有天意?
芝小士回答,版权越必究,未经许矿可他,强不得转载
要种着好它利头资规收再土记织除。
这种饱含来自官方的恶意的验证码似乎不止一个,还有网友后来曝光自己的看到的验证码是“任输”。所以这届考研是怎么回事?这才刚报名就已经开始疯狂打击考生了吗?
有一个是意外,这有两个了,难道真的是这届考研特别难,天意要考生知难而退吗?
理内看命者直北完,持书矿列克层。
其实啊,这种验证码背后都是有一个专门词库的,会出现“别考”“任输”这种词,并不是词库已经智能到能分析你的智商和复习成果从而进行劝退,而是背后调皮的程序员大哥把这种词放进了词库中,然后不幸被这两位考生碰到了。
话说回来,验证码原本是一种区分用户是计算机还是人的公共全自动程序,可以防止恶意破解密码、刷票、论坛灌水等。现在你在几乎所有网站登录都需要输入验证码,大多数网站的验证码都比较亲切,搞个ABC123就可以了,有些比较复杂的是输入汉字。
再麻烦一点的就是以问答形式来进行填写的验证码,这种丧心病狂的验证码,相信大家在12306上已经看到不少了。还记得2015年这种超高难度的验证码还让不少买票用户开始怀疑人生,怀疑是不是以后文盲都不准回老家了。
其实这种奇葩验证码不逛让国内用户抓狂,人家老外碰上了一样心态要崩。
看到这里估计又网友要问了,这么反人类的验证码机制,留着干嘛?正常用户都不方便进行验证了,到底防的是谁啊?
然而用户要怪,还真不好说具体要怪谁,毕竟大多数网站都没那个精力自己去搞验证码技术或者每天更新背后图库,就会把相关工作外包给其他技术公司,比如12306的验证码其实就是外包给杭州微触科技有限公司,所以大家冤有头债有主,千万别再乱扎12306的小人啦。
再要网上追根述源,现在许多网站采用的验证码技术都来源于谷歌在2009年推出的一个项目,直到现在,仍有许多网站还在使用由 Google 提供的 reCAPTCHA 服务(link)。不过和许多网站提供的词库不同的是,谷歌希望在保障用户信息安全的同时也能让用户的这部分行为不至于做白用功,所以谷歌在图库中特别提供了一些辨识度不高或者有污渍的验证码,然后把验证数据收集起来,以便将来使用电脑程序自动辨识受损文献或者模糊的图片。
举例来说,一开始机器扫描一本古籍,出来的是这样的图片。
然后人工智能再进行初步处理,但是这阶段大多生成出来的东西都会让开发者觉得自己开发的不是人工智能,而是人工智障……
但是如果有了广大用户提供的验证数据,最后呈现的文字虽然可能仍有一点小错误,但比起原版可就变得清楚多了。
这种技术如果能被应用在识别受损古籍碑文上,那用户的每次输入验证码,将不光是给自己的信息增添一道安全锁,更是为人类做贡献啊!
有一个风险控制吧,一个减轻压力,一个是又加了一道关卡,安全性也高了
如果没有验证码,就再也没人给我发手机短信了。
防止黑客攻击。那种简单手输的,会识别是人为的还是机器操作的。其次短信和邮件验证码,但是不安全,容易被黑客截获。现在有谷歌身份验证器APP,需要平台部署密钥用户可以用它绑定,不好的地方是密钥丢失了找不回。有个比它方便的叫做二次验证,是小程序,无需下载就能用,还能找回丢失的密钥。
1、为了防止机器冒充人类做暴力破解
2、防止大规模在线注册滥用服务
3、防止滥用在线批量操
版权归美芝士存回管答边网站或原作布者所有
4、防止自动发布
5、防止信息被大量采集聚合
可以起到安全做用,还可以防止偷盗