我们可以发现现在的验证码已经不仅仅是曾经的噪点加一些数字图像,他们现在有更多的是通过文字来体现这个方式,那他们为什么要这样做呢?
因为有网友做过计算,全世界的网民一天共要输上一次验证码,这样会大大的浪费大家处理工作的时间。但这样的现象我们只能理解为存在即合理,然后于是现在为了避免这样的无效工作,很多的公益组织将旧书籍扫描成电子版时,经常出现无法识别的图像,书籍的内容大部分都是文本。
这个时候把它上传到验证码上,让用户去输入,让用户识别就相当于把这样的无效的工作,让大家一起帮助去完成了。
那他又是如何去辨别用户,输入的东西是不是正确的呢?原因是它会提供两个单词来让用户来识别,这两个单词都是属于数据中的一部分,有一个是已经可以识别的,正确的另一个是用来计算机暂时无法识别的。
第1种方式是用现有的技术去识别机器和真人的区别,而第2种方式则是用来收集用户的信息。
它采用的是数据统计的方法,当有10个人输入了同样的答案,这个答案就会被当作是正确的答案,靠这种方式形式验证码系统每年能够成功将230多万本旧书成功的数字化。你这样虽然可以大大提高工作效率,但是它还是有一定的弊端的,因为用户在输入验证码的时候,系统一定会收集到用户的一些数据的,这样就不能避免一些数据的泄露和信息的收集。
所以输入验证码在我们看似之前麻烦,到现在可以提供一种新的思路,但它仍然是一个双刃剑,因为它会有信息泄露的隐含风险。
但是我们又不能规避这个风险,我们只能允许这样的事情存在,因为它可以大大的帮我们降低垃圾邮件的满天飞的现象,它存在还是有它自己一定的意义的。