科技發展史的重要時刻
文/林宏達
從二○二三年開始,當看到一張奇特的照片,人們會開口問:「這是AI創造的嗎?」從這一年開始,創造內容不再是人類的專利。
這是生成式AI帶給我們的新世界。在這次調查中,包括長春集團總裁林書鴻、日月光研發副總洪志斌都看好生成式AI的影響力;聯發科董事長蔡明介更曾表示,AI將對產業和社會帶來重大改變,進而帶動半導體成長。
▲ChatGPT帶動大語言模型風潮後,多模態AI基礎模型是產業界追求的下一個發展目標。達志
進化:從單一任務到跨領域工作
其實,ChatGPT剛被創造出來時,就是一個強大的「接話機器人」,它能從訓練模型中,猜出如果前一個字是A,後一個字要如何接,最符合人類的習慣。用這個方式,生成式AI學會模仿人類寫作、創造圖像、音樂和影片。
目前,我們已能感受到AI的力量對工作和生活方式帶來的大幅改變。例如,有人用來設計名為Ai Pin的終端裝置,只要你說一句話,就能將你要的資訊投影在手上,或是替你撥電話、拍照,大有取代觸控螢幕的架式。或是當你的祕書,把工廠裡每天生成的海量資料濃縮成一頁報告,告訴你今天有哪些待處理的狀況,但不用多久工廠也可以換成手機、PC或任何裝置,它們都能完成你交辦的事項。在製藥業,甚至可以「推論」出新藥的蛋白質該如何設計。
未來幾年,生成式人工智慧還會有什麼樣的新發展?多模態AI基礎模型發展將是其中之一。以前訓練模型,都是訓練一個單獨的小模型,讓它做一個單獨的工作,如判讀X光片或幫自駕車辨識障礙物等。
但大模型不是為完成特定任務訓練的,訓練完成後,只要微調就能完成各式各樣的工作。只是一般的大模型多半只為處理語音或視覺設計,讓語音模型處理文字又得再增加一個模型;而多模態基礎模型則能橫跨語言、視覺和語音等多種工作,各種任務都可以用一個大模型統一理解、統一處理。
鴻海研究院人工智慧研究所所長栗永徽曾表示,多模態模型發展到最後的目的,是要發展出「非常接近像人一樣,具有多模態理解和認知,跟嘗試推理的模型;如果能做到這一點,AGI通用人工智慧的世界,就可能即將到來」。
栗永徽所講的通用人工智慧,是這個領域長期追求的聖杯,因為,要讓人工智慧像人一樣,不但能創作文章、拍攝影片、演講,還要能開車、打籃球、煮飯,對現有的生成式AI來說,能力上仍有相當大的距離;但未來透過發展多模態基礎模型,串接各種能力,希望藉此模擬更接近真人的能力。
除此之外,向外串連會是人工智慧技術接下來的發展方向。如RA G檢索增強技術現在正當紅,因為過去單靠模型推論結果,當得到不夠即時,或是有錯誤的答案,新的技術會把使用者的問題,加入外界搜尋得到的內容,和模型產生的內容一起計算。
願景:下個階段是互動式AI
DeepMind的共同創辦人蘇萊曼(Mustafa Suleyman)曾表示:「生成式AI只是過渡,下一個階段是互動式AI。」他認為,現在的人工智慧還停留在把資料分門別類處理的階段,但接下來當各種能力可以整合在一個模型裡,就不再需要滑鼠和鍵盤,而只需要和AI對話,給它一個大概的目標,就能由人工智慧為你調動各種軟體,甚至和其他人工智慧對話來完成目標。
但這也代表AI的安全性將愈來愈受到重視,因為當你希望讓AI獨立完成愈來愈多的工作,做更多的判斷,就代表你要賦予AI更大的權力,讓AI有自主的意見。「這是人類技術發展歷史上一個重要的時刻,」蘇萊曼說,「如果你願意,AI將有自由來採取行動,我們正在創造有這種可能性的工具。」但他對AI的發展十分樂觀,「我們完全有能力監管AI,就像監管網路上的不良內容一樣,人類也可以用同樣的方法控制AI」。
閱讀完整內容
本文摘錄自
生成式AI與大型語言模型 科技發展史的重要時刻
《財訊》
2024/2月 第705期
相關