20年一遇的新機會與新挑戰
十一月二十八日,美國西岸時間早上七點,賭城拉斯維加斯。
亞馬遜網路服務(AWS)開發者大會第一個主題演講正要開始。多數與會人士仍睡眼惺忪,「全世界大概只有亞馬遜會排這種時間,」一旁的台灣媒體嘀咕著。
但當應邀出席的著名兒童援救機構棘刺(Thorn)執行長柯度娃(Julie Cordua)開始演講,她丟擲過來的冷硬事實,讓所有人瞬間清醒。
「在這個國家,每個小時都有數百個小孩,被迫在網路上性交易。」
她在螢幕上秀出一張剪報。「這是一個十五歲女孩,離家去見一個自稱十七歲的網友。此人真實身分卻是個三十六歲、剛出獄的逼良為娼前科犯。四十八小時之內,她被迫上網刊登援交廣告,自稱十八歲。」
然後悲劇戛然而止。「棘刺及時通知當地警察,四十八小時之內,女孩被救出。」
棘刺與亞馬遜合作開發的AI系統,能從網路上的數千則色情廣告中,篩出有「被逼迫、未成年」氣息的幾則。因此,在過去兩年半時間,讓六千個未成年受害者逃出虎口。柯度娃一說完,滿堂觀眾頓時大力鼓掌。
十一月初,英特爾執行長科再奇在里斯本Web Summit的主題演講,也介紹英特爾與美國聯邦政府合作的拯救失蹤兒童計劃(Intel Inside, Safer Children Outside)。他說,這是「用人工智慧行善」(AI for Good)的首例,同樣贏得滿堂彩。
中國微軟則與吉林省的民間尋人組織「寶貝回家」合作,比對失蹤兒童與全中國各地收容所的一萬三千張兒童照片,順利找到一個失蹤四年的廣州唐氏症男孩,並在二○一六年登上一個尋人電視節目。
爸爸抱著已經十七歲的兒子,在全中國千萬觀眾面前痛哭失聲。
這些科技企業樂意暢談他們如何用最先進的AI技術協尋失蹤兒童,理由容易理解。第一,感人。第二,不會有人因為工作被取代而憤怒。
最重要的是,效果實在好到令人難以置信。與棘刺合作的部份警政單位,破案效率大幅提升六五%。
與英特爾合作的半官方機構——美國國家失蹤與受虐兒童援助中心(NCMEC),找到失蹤小孩的平均時間,從三十三天大幅縮短到驚人的一天。
▲北京微軟總部的270度環景螢幕,顯示微軟如何用科技協助打造智慧城市。微軟人員指出,未來用機器學習來分析,甚至可以進一步預測、預防塞車、車禍甚至犯罪事件。
圖像辨識
揪出人眼看不到的小細節
這些小孩與他們的家人,堪稱這一波「深度學習」革命,最早也最特別的一批受惠者。
AlphaGo轟轟烈烈的兩場棋王大戰,讓全世界都記住「深度學習」,也知道它是這一波AI革命的核心技術。
但其實,在圍棋之外的若干專業領域,深度學習激起的變革,甚至更早、衝擊更大。例如,電腦視覺領域的AlphaGo時刻,便出現在二○一二年。
該年,史丹佛大學AI實驗室主辦的ImageNet圖像辨識比賽,出現驚人大突破,多倫多大學深度學習大師辛頓(Geoffrey Hinton)麾下兩位博士生所組團隊,辨識成功率竟一舉達到第二名的接近兩倍。
該團隊首度採取的深度學習方法,快速被Google、臉書等全世界最傑出的研究團隊跟進,整個領域進步神速。到了一五年,位在北京的微軟亞洲研究院團隊發表論文,首度讓電腦視覺達到超越人眼辨識的水準。在ImageNet的五萬張測試圖片,辨識錯誤率降低到四.九四%,超越人類的五.一%。
微軟將這個位居全球最頂尖之林的演算法,用在人臉辨識,可以分析二十七個不同臉部特徵,從不同角度、光線、表情的照片,識別出同一人;甚至連長大幾歲、容貌已改變不少的失蹤兒童,都可以認出。
經過海量訓練數據,「我們的系統自動學習到,哪些人臉區域和相貌特徵不會隨著年齡改變,」負責人臉識別核心算法的微軟亞洲研究院資深研究員陳博表示。
英特爾大變身:進軍電影、汽車,還會救小孩
英特爾的拯救失蹤兒童計劃成員、資料中心事業群首席資料科學家羅傑斯(Bob Rogers)讓《天下》記者嘗試從一張失蹤男孩(真實案例,已找到)的大頭照,去人工比對資料庫隨機挑出的幾十張和他一樣是褐髮、黑眼特徵小男孩的照片。
「裡頭有一張是他被找到時的模樣,」羅傑斯說。
哪一張?記者花了大半天挑了幾張,都被打槍。實在太難了,髮型、攝影角度、體型,有太多變數干擾。
羅傑斯接著執行英特爾的辨識程式,不到一秒時間,馬上找出正確答案。
這個程式,現在忙著處理臉書等網站業者每天主動傳送給NCMEC、平均兩萬多筆的可疑線報。
這些線報裡頭,相當大部份是網站刊登的色情與援交廣告或訊息。英特爾的深度學習軟體,會將裡頭的圖片臉孔,與NCMEC資料庫裡頭數十萬筆失蹤小孩的照片比對。
如此複雜的工作,過去光靠該組織二十五個分析師整天靠肉眼比對,根本無法負荷。
金髮、高大的英特爾資料中心事業部副總裁兼IT變革事業部總經理戴維斯(Lisa M. Davis)親自負責這個專案。她曾在美國聯邦法警局擔任資訊長,兩年前,她的前上司、前聯邦法警局局長克拉克(John F.Clark),轉到NCMEC擔任總裁,問她:「英特爾可以幫忙嗎?」
這個詢問來得正是時候。英特爾為了迎接AI時代,整個營運方式開始轉型,開始走出去,為客戶提供諮詢服務,如同微軟、IBM二十年前在網路時代降臨時做的轉型。
老字號的英特爾開發者大會(IDF)今年甚至停辦。取而代之的,是分散世界各地的中型研討會,例如《天下》參加十一月在紐約召開的首屆Shift大會,到場的是數百個金融業、媒體與醫療業的客戶,個個西裝楚楚,與過去多是穿著牛仔褲的工程師大不相同。
「英特爾過去說的常是:CPU要多快?」羅傑斯說,「現在則是:幫助顧客搞清楚,這東西對我的意義是什麼?我的角色是什麼?把顧客的需求連結到我的產品線。」
「我們現在也是一家解決方案公司(Solution Company),」戴維斯對《天下》記者說。
例如,英特爾用來尋找失蹤兒童的人臉辨識技術,也可用來幫老電影公司活化舊資產。華納兄弟便使用這個技術,去辨識該公司瀚海般的老電影庫存,讓電腦精確找出每個演員的所有演出片段,方便剪出各式各樣的懷舊電影片段集錦。
英特爾近年來致力跟上AI浪潮。一連串併購,包括高價收購自駕車晶片先驅Mobileye,以及低功耗晶片公司Movidius,都是電腦視覺相關公司,只是分別專注在自駕車、無人機與VR裝置等不同的應用場景。
這家矽谷元老的諸多轉型努力,華爾街看在眼裡。十一月開始,接連發布的外資報告力挺英特爾。大和證券認為英特爾在AI領域的能力「被市場低估」。
《霸榮週刊》在十一月初,喊出英特爾股價未來一年可漲二五%。
英特爾的市值在七月到十一月這一波足足漲了四五%,又重新超過台積電,奪回全球半導體市值龍頭的寶座。
電腦視覺感知 掀起新風暴
小辭典
人工智慧(AI)
任何一種可以讓電腦模仿人類智能的技術。
機器學習
人工智慧的一支,用統計技術讓電腦可藉由累積經驗改善能力。
深度學習加持下的電腦視覺,因為應用廣泛,已在醫療(見一○二頁)、安控(見一○六頁)、無人機以及工業應用等領域,掀起變革波瀾。
▲輝達在開發者大會介紹用在城市的臉部辨識功能。傳統的安控加上用AI強化的臉部辨識,將讓罪犯無所遁形,但也引發侵犯隱私的爭議。(GettyImages提供)
斯迪富融資公司分析師卡西迪(Kevin Cassidy)認為,整個電腦視覺晶片市場,包括用在無人機、安控攝影機、機器人、汽車市場,會在二○二一年達到三十億美元規模,年均複合成長率超過三○%。
更關鍵的一點,被看好將在幾年後大爆發的無人車浪潮,最核心的技術之一,也是電腦視覺。二○一八年將在世界各地上市的大改款奧迪旗艦車A8,便採用英特爾旗下Mobileye 視覺技術。
好像回到一九九五:這次,衝擊將大過網路
這是世界第一款擁有歐規第三級自駕能力的量產汽車。遇到塞車、停停走走時,駕駛可以將雙手放開方向盤,看手機或報紙,電腦會自動剎車、加速,甚至急轉變換車道。
美國科技六強的AI佈局
《天下》採訪團隊於三個月期間,走訪紐約、西雅圖、北京、拉斯維加斯,直擊亞馬遜、微軟、英特爾三大科技巨頭,最新的AI佈局。
在這些現場,許多人臉上帶著情不自禁的喜悅,辦公室的空氣都洋溢著興奮的氣息,這個氣氛很眼熟,不少資深業界人士都回想到,網路科技剛出現的時期。
「很像一九九五年的時候,」曾任微軟人工智慧部門亞太研發總監、回台灣創立AI實驗室的杜奕瑾說。
為何是一九九五年?原來該年史上第一個純網路股網景上市,一天之內大漲二○八%,引爆之後浩浩蕩蕩的「.com」熱潮。
杜奕瑾是台灣網路先驅,學生時代架設著名的批踢踢實業坊(PTT),更參與創立當時台灣最大的蕃薯藤網站。
日後到美國,又因緣際會投入AI,屬於微軟語音助理Cortana研發團隊的核心成員。
他說,AI的應用層面極廣,「我看到的是一片藍海無限可能,看到所有產業,包括醫療、金融都可以做,那不就跟當年的.com一樣?」
另一個也在最近離開大企業創業的AI重量級人物、前百度首席科學家吳恩達,在《時代雜誌》採訪時說,他認為深度學習的衝擊,甚至將大過網際網路,「就像一百年前,電力改變了每一個產業,AI也會一樣。」
深度學習加持 繞過「波蘭尼悖論」
因為,深度學習解決了AI領域的一個百年難題。
人類有很多複雜的能力,都是「憑感覺」執行,自己無法清楚描述、歸納,因此也無法寫成程式,用電腦複製這個能力。
麻省理工史隆管理學院主任研究科學家麥卡菲(Andrew McAfee)與該校管理學教授合作的新書《機械、平台、群眾》解釋了這一點:
「人類的許多能力中存在這樣的不自知,從在車流中駕駛汽車,到辨識一張面孔。對於這一個特別現象,匈牙利出生的哲學家、科學家波蘭尼(Michael Polanyi)有精彩的概括,他說,『我們知道的,比我們講得出來的還多。』這種現象後來就被稱為『波蘭尼悖論』(Polanyi’s Paradox)。」
深度學習另闢蹊徑,繞過這個理論限制。只要灌入海量的註記過資料,電腦就可從這些資料當中,自行找出這些細微的模式,「學會」人類最精巧的技藝。
這麼厲害的科技,為什麼直到最近,才開始為世人所用呢?
▲即將上市的大改款奧迪旗艦車A8,全車裝滿感測器、光學雷達,這是世界第一款擁有歐規第三級自駕能力的量產汽車。遇到塞車、停停走走的時候,該款車的駕駛可以切換到「塞車導航」模式,將駕駛權交給電腦。(達志影像/路透社提供)
「大家都說,是因為網路累積的大數據,」前Google北京研究院副院長、宏達電資深副總張智威,在台灣人工智慧年會演講時自問,「但是大數據已經講了十年了,為什麼到最近兩、三年,深度運算才受到矚目?」
原因是,學界後來發現,原來「量變會帶來質變」。當輸入電腦模型的資料集從原先的數十萬份,增加到百萬甚至於千萬份時,電腦模型預測的精確度,會跳躍性地提高一○%、二○%,大幅增加預測的可信度。
「產業發現AI再也不是可有可無,而成為企業生死存亡的關鍵時,」張智威說,「整個產業就井噴了。」
各大科技企業紛紛擁抱AI。Google執行長皮蔡在一年前宣示,企業目標從「行動優先」,轉向「人工智慧優先」(AI First)。
納德拉(Satya Nadella)三年前接任微軟執行長以來,多次提及公司目標是「行動與雲端優先」。但最近出爐的二○一七年微軟年報,AI也取代行動業務,成為優先之一,且年報中六度提到AI,反觀去年則隻字未提。
連過去力挺物聯網的台積電董事長張忠謀,都在最近改口:「台積電在未來十年,會大力投入AI。」
自然語音 引爆電腦介面革命
一六年,微軟語音辨識團隊,首度達到與人一樣水平的辨識精度。
於是,繼電腦視覺之後,自然語音成為第二個百家爭鳴的新商機。
「語音,將是機械學習造就的下一個顛覆!」
洪厚聲音傳自美國拉斯維加斯最大的室內場地,美高梅大花園體育館擠滿將近兩萬名來自世界各地的工程師、記者,專注聆聽亞馬遜技術長威格爾(Werner Vogels)一年一度的主題演講。這是AWS開發者大會的重頭戲。
高壯、理著大光頭、穿著西雅圖著名搖滾樂團「幽浮一族」黑色T恤上台的威格爾,繼續他的下一個預言:「自然語音,將是二十一世紀新一代電腦系統的主要介面。」
亞馬遜夠資格這樣說。因為靠著大熱賣的智慧喇叭Echo,全美已經有超過一千萬家庭,回家後可以邊解開領帶邊說,「Alexa!播放五月天的最新專輯。」便能即時享受音樂舒壓。甚至可以靠語音開燈、開冷氣,因為開利的空調、飛利浦的智慧燈具,也都內建語音助理Alexa。
亞馬遜已在短短兩年內,打造出全球最大的語音生態系,成功攻佔美國家庭的客廳。逼得蘋果、Google甚至微軟,也都跟著推自己的智慧喇叭。
亞馬遜的下一步是什麼?當然是攻佔辦公室了。
威格爾隨即發表「Alexa企業版」,只要放一台Echo喇叭在會議室中間,就能輕鬆命令電腦「關燈、播放投影片」,發現會議室被佔了,也可直接問Alexa,「哪裡還有空的會議室?」
他一再強調,語音是溝通最自然的方式。
事實上,美國已經有不少金融機構與亞馬遜合作,推出語音銀行的服務。例如,前身是通用汽車金融部門的純網路銀行Ally Bank。(見一一○頁)在電腦視覺、語音介面之外,深度學習將更進一步走入每個企業內部,改善營運流程。例如,最近微軟亞洲研究院與香港一家大型航運集團戰略合作,用AI改善物流效率。結果才進行一個多月,一年已經可省下接近一千萬美元。
「他們很驚訝,結果跟我們買了更多雲端服務,」亞洲研究院副院長劉鐵岩說。
另一個合作,則是與北京一個國際級的大型私募基金,做AI操盤的模擬研究。(中國並未開放純人工智慧的基金進入金融市場)
擔憂1:AI造成新貧富差距?
劉鐵岩導入最新的「符號學習」技術,結果效果好到他想回頭去檢查,算式是不是出問題,「太可怕了,真的有這樣的secret formula(獨門祕方),收益就太高了。」
這些,引發一個全新的擔憂。由於機器學習人才已成為稀有財,許多人擔心,如果這些人都被大科技企業席捲一空,改善效果又如此顯著,企業間的貧富差距,豈不一夕間被放得更大?
美國《連線》雜誌訪問的一家AI新創公司執行長就抱怨,Google、臉書、亞馬遜、微軟加上英特爾,「五家雇走所有的PhD,也擁有所有PhD科技。」
令人意外的是,奉行儉樸哲學,常被Google、微軟人笑「小氣」、「像軍校」的亞馬遜,竟砸最多錢挖人。根據薪資研究機構Paysa今年四月的調查,亞馬遜一年投資二.二八億美元來做AI人才招聘,比第二名Google、第三名微軟的總和還多。
花這麼多錢儲備人才,為什麼在各式各樣的AI學術競賽,例如ImageNet等,都看不到亞馬遜研究員的名字?AWS人工智慧總經理伍德(Matt Wood)笑了出來,他說,「我們的哲學跟其他公司有點不大一樣。」
他強調,亞馬遜一切以顧客的需求為出發點,雖然有上千個AI科學家,但都跟工程師與產品團隊緊密合作,解決顧客的實際問題。「我們是故意這樣做的,我們不會打造巨大象牙塔,上千個人在那裡空想,我們的人會出去真正幫助顧客,這是很大的不同。」
亞馬遜的務實哲學,體現在十一月發表的一系列AI輔助開發工具。例如大幅簡化機器學習訓練流程的SageMaker,甚至還有一台具備深度學習功能的無線攝影機「DeepLens」,供開發者實際操練深淺不一的電腦視覺模型。
亞馬遜的目標是「讓人工智慧權力下放」(Democratizing AI),讓更多新創或是技術水平不高的公司,也能開發自己的AI技術。
「我們希望讓一般開發者可以具備資料科學家一樣的能力,」AWS全球行銷副總凱爾曼(Ariel Kelman)強調。
擔憂2:這次會不會又是泡沫?
然而,看到這麼多大小企業都高喊投入AI,見識過二○○○年網路泡沫的資深軟體人,都不免有點擔心。
「我覺得現在有點過熱了,」專長是電腦視覺、與輝達產學合作的台大資工教授徐宏民說。
尤其是,網路泡沫時期常見的「過度承諾」不幸事件,也在AI領域發生。而且,還是這個領域元老中的元老——IBM寄予厚望的「華生」系統。
今年二月,IBM華生與鼎鼎大名的休士頓安德森癌症中心宣布拆夥。原來,雖已合作研究長達五年,雙方卻沒有開發出一個可以用在病人身上的工具。安德森癌症中心主任因此去職。
七月,一位《Forbes》專欄作家甚至寫著,「華生是否是個笑話?」
外界普偏批評,之前IBM對華生的效果宣傳太過頭。早在一三年,就宣稱「電腦運算的新時代已經出現了」,還在該年的《Forbes》報導中過度樂觀地說華生「現在可以進行臨床實驗」、「幾個月內就能被用在病人身上」。
影響所致,在全球科技高歌凱進之過去一年,IBM這個「AI老字號」卻始終股價低迷,本益比更一路下探十三倍,與Google、微軟的三、四十倍完全不成比例。顯示投資人對其前景毫無信心。
不少資深科技人提到IBM,都直接說:「它沒跟上這一波。」
傑富瑞投資銀行分析師基斯納(James Kisner)指出,最嚴重的結構問題,在於IBM在最熱門的深度學習、大數據領域的人才投資,根本就不足。例如,亞馬遜公布的AI相關領域招聘職位,便高達IBM的十倍。
在全新AI科技掀起的典範轉移,稍一不留神,即便是本來的領先者,都可能被後浪擠走。
IBM是一例,台灣科技業也不能不慎…
閱讀完整內容
本文摘錄自
AI大震撼沒跟上,就淘汰
天下雜誌
2017/12月第638期
相關