reCAPTCHA下一步要帮助Google Images还是Google Street View?

注册过网络服务,下载网络文件的人肯定见过reCAPTCHA验证码。该服务在2009年四月顶住了4chan高手自动刷票机的阴谋(但没挡住人肉刷票),在同年9月被Google收购。至此之后,reCAPTCHA的提问难度越发变态,并且逐步成为Google最强大的机器训练源。

Google收购reCAPTCHA后延续了它原来的图书电子化事业,在2010年把纽约时报20年的老存档给OCR(光学字符识别)了;此外Google Books的扫描工作也应该与reCAPTCHA的题目密切相关。

不过最近几天reCAPTCHA有了新的变化,Google似乎对图片里的数字产生了浓厚兴趣。上图均为用户收集到的reCAPTHA提问,以明显的路牌与门牌号加传统的reCAPTCHA文字为组合。

如果只是普通的OCR训练,为什么这么专注在路牌与门牌号的图片上?如果这是Google Street View默认会屏蔽的隐私文字,Google扫描这个的原因是什么?唯一可以确认的是,有全球这么大基数的网民在下载文件并快乐的解着验证码,reCAPTCHA有能力培养出新的Google Overlord。

某程度上,为下载文件而忠诚服务于机器学习的网民们,不已经是Overlord的奴隶了吗?一两个“捣蛋者”恐怕难以颠覆这种“众数算法”。

Author: 店长

The Master of BitInn

16 thoughts on “reCAPTCHA下一步要帮助Google Images还是Google Street View?”

  1. 其实对于reCAPTCHA原来背后的意义个人是相当佩服,只是现在变成了门牌号…真的不禁令人担心Google日后的Pattern Recognition有多可怕。

Comments are closed.