說話從幼稚園變大學生 ChatGPT 為何這麼神?

解密最新AI聊天機器人


用莎士比亞風格寫一首詩,談比特幣的重要性……,AI最新突破——ChatGPT 席捲全球,會寫論文、能跟你瞎聊,更關鍵的是它背後技術,將有如現在Google雲端一樣重要。

文—楊孟軒 攝影—邱劍英

聊天機器人死板回答問題的時代已經過去了。十二月初,美國新創OpenAI推出的聊天機器人ChatGPT,能創作、翻譯、寫程式及大學等級的論文,五天吸引超過百萬人註冊。

最近,全球網友持續試探它的能力極限,「使用英王詹姆士欽定版聖經風格,解釋如何從錄影機中拿出花生醬三明治」、「用莎士比亞風格,寫一首比特幣有多麼重要的詩」,甚至讓ChatGPT寫出串接虛擬貨幣交易所API(應用程式介面)的程式碼,自動交易下單。

當世人還在體驗樂趣,已有專業人士在使用ChatGPT以及背後的技術。

例如線上課程平台「孵大學」創辦人謝昆霖,就按照網友分享的教學,申請OpenAI的API服務,將OpenAI研發的語言模型產品串接到Line,只花半小時就做出類似ChatGPT的聊天機器人,「人人自己做一個AI助理的時代來了,」他在臉書寫著。

「不會寫程式也能做出來,有資訊背景的十分鐘就能完成,」謝昆霖實測後告訴《天下》。

OpenAI提供每名用戶十八美元的免費額度,之後根據用戶所選的語言模型,每七五○字收取○.○○○四到○.○二美元的費用。謝昆霖開放所有人加聊天機器人好友,免費額度一天就用完,他加碼再花五十美元讓大家體驗。

謝昆霖同時告訴《天下》,他認為ChatGPT短期內會成為企業的行銷工具,作為品牌曝光的投資。下一步企業將準備產業資料來訓練它,最終可能取代客服與助理的功能。


▲「哈囉,想知道什麼,盡量問!」ChatGPT讓人見識到實力大勝過去聊天機器人。

它強大的祕密:基礎模型

ChatGPT之所以這麼神,關鍵是背後名為GPT-3.5的基礎模型(foundation model)。

過去AI主流是像AlphaGo這樣,被訓練成解決單一任務的專家,但每次訓練AI學習新應用,都要耗費大量時間與資源。

因此近年新概念,是先讓AI學習大量廣泛數據,培養出基本能力,成為通才般的「基礎模型」。接著只要經過使用者微調,就能讓AI快速勝任不同任務,變得更靈活、通用。「這是AI領域近年新的典範轉移,」台大電機系副教授李宏毅說。

以ChatGPT為例,翻譯、糾錯、創作都難不倒它,正是背後的基礎模型GPT-3.5,已先經過網路上的文章、維基百科、書籍和論文等大量文本訓練,熟悉人類語言系統架構,便能很快學會語言相關的各式技能。

不過ChatGPT能如此像人,關鍵還是龐大資料量。OpenAI尚未公開GPT-3.5模型數據,但光是前一代GPT-3資料量就相當驚人,共有一七五○億個參數、五七○GB的文本量。

最早的基礎模型,是微軟創辦人之一艾倫創立的AI2實驗室在二○一七年訓練出的ELMo,只有九四○萬個參數,和GPT-3差距近兩萬倍。李宏毅比喻,ELMo模型參數量若是一把三十公分的尺,那GPT-3的高度就是台北一○一。

讓人人成為AI服務提供者

「ChatGPT跟過去的聊天機器人相比,是大學生跟幼稚園的差異,完全不會感到和你對話的是機器人,」訊能集思智能科技創辦人張宗堯說。

張宗堯是麻省理工博士、鴻海第一個全額贊助獎學金的留學生,訊能集思更曾被選為全球二十大潛力AI公司。他認為,基礎模型的出現,對AI發展有重要意義,能夠降低使用門檻、加速應用發展。「基礎模型會像雲端一樣,變成底層架構,協助企業開發出有價值、很厲害的應用,」張宗堯比喻。

過去幾年,可以看到許多網路新創公司沒有能力興建機房,便將服務架在AWS、GoogleCloud等雲端平台上,而能快速發展。假如沒有雲端服務出現,這些新創可能難以生存。

基礎模型如今也扮演同樣角色,讓許多新創和企業不用自己訓練,也有能力成為AI服務的提供者。

目前GPT-3.5尚未對外開放,但眾多企業已經將自家的AI應用服務,架構在它的前一代,二○ 年六月推出的GPT-3之上。

例如,軟體公司Viable將顧客意見作為文本來訓練GPT-3,讓大公司從每年上萬筆顧客意見中,快速理解多數顧客的需求。

今年A輪募得一千萬美元的新創Regie.ai,則用超過千萬封郵件與銷售預測來訓練GPT-3,生成客戶專屬的商業文案,吸引AT&T成為客戶;Elicit則訓練GPT-3從學術論文庫中找關鍵資料,協助學生快速從公開的論文期刊獲得有用資訊。

就連知名的舊金山新創、筆記軟體Notion,今年十一月也推出實驗性質的產品Notion AI,能自動寫文案、信件和部落格文章,背後採用的正是GPT-3模型。
訓練一個要四億台幣

基礎模型有強大實力,但訓練成本極高。李宏毅分析,假如用Google Cloud訓練出一個GPT-3,要一千兩百萬美元(近四億台幣)。由此可知,訓練基礎模型需要龐大資金及運算資源,只有少數企業甚至國家能負擔。

而OpenAI是其中翹楚,由馬斯克在內的矽谷投資人在一五年創立,初期是非營利組織,一九年成立營利的子公司,並獲得微軟十億美元投資。根據路透社報導,OpenAI目前估值高達兩百億美元。

其他AI巨頭也都積極訓練語言基礎模型,Google今年六月推出LaMDA聊天機器人;中國則有北京智源人工智能研究院開發出的「悟道2.0」,參數量據稱是GPT-3的十倍。
將如同基礎設施,但恐遭壟斷

基礎模型能加速AI的應用,許多人也預見可能風險。

張宗堯就提醒,最終這些掌握關鍵技術的AI大公司會成為霸權,「我們就像必須依靠它提供的水電來存活。」

尤其許多企業生意都建構在基礎模型之上,假如基礎模型的資源被抽走,生意可能一夕歸零。

「宏觀來看,AI就是一種戰略資源,是國際局勢談判籌碼,誰掌握這技術,對別的國家就有更多話語權。掌握底層技術,就能掐住全世界,」他強調。

謝昆霖也指出,目前OpenAI背後的中文資料可能多來自中國,「一個AI的訓練資料集,會決定它的行為,」他擔心,如果AI被植入真假難辨甚至錯誤訊息,將可能成為認知戰的武器。

ChatGPT目前仍是一個未完的實驗品,資料只更新到二一年,還會理所當然地給出錯誤資訊。但它的出現再次點醒世人,AI顛覆產業的時間點不遠了。 閱讀完整內容
天下雜誌2023/1月 第764期

本文摘錄自‎

說話從幼稚園變大學生 ChatGPT 為何這麼神?

天下雜誌

2023/1月 第764期