聲控經濟崛起,跑最快的三個台灣人【封面故事-商業周刊】

PTT大神做「雅婷一號」,連台灣國語都通


不像一般辦公室,台灣人工智慧實驗室的門口沒設電話分機,想拜訪這家公司,我必須站在門邊的電視前,看著自己的五官在螢幕上被標示出來,並喊出:「我找杜奕瑾。」

直到人工智慧(AI)助理語音辨識出人名、記錄了我的長相,向人稱「PTT創世神」(PTT電子布告欄創辦人)的老闆杜奕瑾確認後,門才自動打開。

曾任微軟人工智慧首席亞太區研發總監的杜奕瑾,是聊天機器人(Chat Bot)概念發想者,曾參與設計搜尋引擎Bing,催生微軟語音助理Cortana。二○一七年四月,他回台宣布創立台灣人工智慧實驗室。

這是目前台灣人工智慧最強的團隊之一,成員三分之一來自海外。由於大國擁有的數據量較大,所以台灣好的人工智慧人才都往美國或中國流動,但他的團隊擁有來自英國、法國、矽谷等人才。他想證明,在台灣,也可以養出好的軟體公司。

這個門禁系統只是杜奕瑾的小實驗,員工們都以臉部辨識打卡進出,「系統記錄你在公司時間一超過法定工時,就會提醒該回家了。」他說,人工智慧是可以普及化、變成全民使用的!

他為這家公司訂出三大研發方向:醫療、智慧城市,與人機新介面。語音,就是他眼中最可能取代觸控的新介面。

台商機會:把本土腔調辨識做精

行政院數位政委唐鳳,為了提倡政府資訊公開,隨身帶著一位每分鐘打三百五十字的速錄師薛雅婷,為每場參與的會議提供逐字稿。但唐鳳拜訪台灣人工智慧實驗室時,該公司的語音AI讓她印象深刻。

「我們笑說,這樣會不會害雅婷失業?所以打算把這個可以語音辨識的系統叫作雅婷一號。」杜奕瑾說。
「雅婷一號」是這個實驗室只花兩個多月就做出來的原型產品。用來自PTT、痞客邦的文字資料,運用YouTube、公共電視的影音,讓雅婷一號聽得懂台灣國語,能跟鄉民同步掌握到網路新創語彙。

就像華碩Zenbo講的是京片子,Siri聽不懂「踹共」。「在人臉、語音辨識等AI基礎建設,中、美大廠並未針對台灣特色的數據與需求去優化,」之初創投創始合夥人林之晨觀察,台灣人工智慧實驗室只用了半年,就在很多指標上打敗大廠。

杜奕瑾分析,熱門語言如英文、(中國)中文語音辨識的通用型應用,國際大公司已做得很好,台商機會是在,把本土的腔調、特殊用語做深、做精。

台灣人說話,經常有混用英語、日語、台語的跨語言習慣,「我們把台灣自己的語言辨識處理好,同樣know-how可以去做義大利文等市場擴展。」杜奕瑾說,把最熟悉的市場做起來,就會發現,軟體是最沒有國界的。

主攻軟體,不想再當歐美打工仔

在他眼裡,物聯網的設備如智慧音箱,只是眼、耳、鼻與手腳,但判斷與溝通的「大腦」,是背後軟體大廠的雲端與AI技術。「所以台灣要有自主性夠強的大腦,把需求帶出來,將硬體兜進來。」杜奕瑾說,台灣過去擅長做四肢,獲取的價值就很少。

台灣擁有全世界最大的BBS(電子布告欄)社群,曾有亞洲最早的搜尋引擎蕃薯藤,早年的遊戲能外銷到韓國。只是,「沒有策略思維去把全球當市場。」他說,不夠重視軟體產業,導致像他自己這樣的人,只能出國當歐美大廠打工仔。

杜奕瑾打算帶頭示範,把所研發的產品半開放提供給台灣業界免費使用。他說,現在大家觀念需要改變了,唯有掌握軟體,我們才有可能走出去。

「現在已經變成軟體公司主導,面對客戶、了解需求後,在設計軟體應用時,指定要把哪些硬體廠商兜進來。」他說。對於具體的獲利模式,杜奕瑾並未多談。他只說:「我們股東很有實力,願意細水長流,希望做出很創新的做法,並能做出對人類有貢獻的事。我們對小錢沒興趣,小軟體公司會為了賺小錢變成包案公司。」

採訪時,「雅婷一號」同時把我們的對話整理成文字,一看,辨識率真的超高,只有不到三%的錯誤率,看來,記者跟秘書們的部分工作已可被取代了。

杜奕瑾說,在網路時代,人們開始知道知識量不可能贏得過Google,有需要,再搜尋就可以了。到了AI時代,人們會開始相信電腦辨識得比自己還準。想要真正帶來改變,「就把瑣事交給AI,把自己的時間留在咖啡廳、藝廊,做真正有創造力的事!」…閱讀完整內容

台灣人工智慧實驗室

成立:2017 年

創辦人:杜奕瑾

主要產品: 醫療大數據與影像判讀、智慧城市、語音與圖像等新介面
把自己的語言辨識問題處理好,把最熟悉的市場做起來,就會發現,軟體是最沒有國界的。——杜奕瑾
商業周刊第1575期

本文摘錄自‎

聲控經濟崛起 跑最快的3個台灣人

商業周刊

2018/1月第1575期