他發明的驗證碼 讓網友無償打工不間斷

一名來自瓜地馬拉的理工男,發明了能讓電腦分辨是真人或機器的驗證碼技術,他更透過這項技術,讓網友輸入驗證碼時,能順便識別珍貴古書內容,讓全世界一起為人類文明出一份力。

郝廣才


▲2000年,年紀輕輕的馮安設計出一套系統,解決了讓雅虎頭大的駭客問題,其他廠商見狀後,也開始推出類似程式。不久後,reCAPTCHA就成了網路上常見的驗證方法。

為什麼浴室的水會流向排水孔?因為浴室地板有一比一百的段差,段差很小,所以表面很平,看不出有斜坡,水會順著斜坡流進排水孔。很多事不是表面看到的那麼簡單,當我們探索背後複雜的原理,一切都不一樣。現在再看到浴室地板,它多了靈光與趣味,變成了人類的智慧!

二○○七年五月二十七日,reCAPTCHA第一個版本上線, 那是什麼? 全名「 全自動區分電腦和人類的公開圖靈測試」(Completely Automated Public Turing test to tell Computers and Humans Apart),俗稱「驗證碼」。

網路購物、登記帳戶密碼,我們都曾花五秒鐘辨識一串扭曲的英文或數字,以回傳驗證碼。驗證碼是誰發明的?背後的運作是什麼?

看圖說故事 揪出惡意機器人

發明人叫路易斯. 馮安(Luis von Ahn),一九七九年生在瓜地馬拉。那時小孩夢想得到「任天堂」,八歲的馮安也吵著要,媽媽買了「康懋達六四」家用電腦,他只好把電腦當玩具,從不懂玩到透澈。

儘管家庭環境不差,但國家大環境差,幾十年內戰,時時發生綁架、暗殺、種族屠殺。馮安離開家鄉去美國,十八歲進入杜克大學數學系,他發現數學家親密的伙伴是書桌,整天困在幾百年解不開的難題中。他決定跳出這個迷宮,轉入資工系。

二○○○年,馮安參加雅虎的座談,聽到有個難題沒辦法解決,就是雅虎讓用戶申請免費電子信箱,有駭客大量申請,寄出巨量的垃圾信件。駭客的慣用伎倆是寫程式,讓電腦二十四小時自動產生信件,防不勝防。馮安心想,如果能辨認誰是人類,誰是機器人?就能揪出惡意的機器。

他與伙伴布盧姆(Manuel Blum)利用圖靈測試, 那是二戰破解德軍密碼的英雄圖靈(Alan Turing)提出的思想實驗,測試機器有沒有跟人同等的智慧。他們把方向倒過來,用電腦做不到,但人能做到,反過來測試是不是機器人?

人會分辨圖像,大象不會看成馬、馬不會看成鹿,這個能力連三歲小孩都會。而電腦不會看圖,他們設計一串變形的文字,要使用者回答,答不出來的就是機器。系統上線後,果然有用,各大平台紛紛跟進。
馮安運用同一原理,2005年開發出遊戲ESP(Extrasensory perception),這個「第六感」心電感應遊戲怎麼玩?玩的人在網上隨機配對,兩分三十秒看十五張圖,每張圖給答案,看兩人合不合拍。比如出現火車月台的圖片,你輸入「月台」,我輸入「旅客」,你我不合拍,感應失敗。如果你輸入「月台」,我也輸入「月台」,感應成功,過關看下一張圖。

這個遊戲在幹嘛?馮安用遊戲誘使玩的人標註圖片,ESP發出三十五萬張圖,幾萬名玩家輸入內容,一張圖得到許多共同答案,就是正確答案。電腦透過文字對應圖片,當我們搜尋「月台」,圖片就跳出來。利用玩家無償替他做工,上線四個月收集到一百萬筆標註,使用權最後賣給谷歌。我們能上網搜尋圖片,全都是靠網友所輸入的標註。

網友當義工 助《紐時》電子化

2006年, 二十七歲的馮安獲得「麥克阿瑟天才獎」,獎金五十萬美元。有錢投入研究,他發現「驗證碼」有缺點,它會浪費五秒的時間。全世界那麼多人的五秒,合計起來不得了。之後他開發新的reCAPTCHA,有減少秒數嗎?相反,新版驗證碼給你兩組扭曲文字,五秒加倍,要花十秒。這樣算是升級?

馮安反向思考,既然要浪費,不如多浪費一點,把時間收集起來,投注在需要「時間」才能完成的計畫!

《紐約時報》從一八五一年創報以來,累積上千萬篇文章,以前只有印刷,沒有電子檔,如果請人打字,工程太費時;若用OCR(光學字元辨識)會有兩成無法辨識,這兩成還分散在文章各部分。reCAPTCHA有兩組驗證碼,第一組維持原來的圖靈測試;第二組是報紙上的單字,用圖片發給我們。當我們輸入時,等於幫《紐約時報》當工讀生,善用全世界舉手之勞,幾個星期後就完成不可能的大業!2009年,谷歌買下reCAPTCHA,後來用在谷歌街景辨識門牌。

2011年,馮安再推出「多鄰國」(Duolingo)線上免費語言學習平台。Duo的意思是兩個,Lingo是語言,代表你學外語,同時要貢獻自己的母語。他把全球五億用戶組織成語言互學的細胞體,快速建立平台的課程,並與CNN、BuzzFeed合作,讓用戶翻譯網路文章,多鄰國從中獲利。

當你下次輸入驗證碼時,本來單純打幾個字,此後不再普通。驗證碼在我們手中,變成有意義的輸入、偉大的輸入。大海因我們的一滴水,又變大了一點,我們也能成為偉大的一部分!

閱讀完整內容
今周刊第1279期

本文摘錄自‎

他發明的驗證碼 讓網友無償打工不間斷

今周刊

2021/第1279期