科技發展史的重要時刻

文／林宏達

從二○二三年開始，當看到一張奇特的照片，人們會開口問：「這是AI創造的嗎？」從這一年開始，創造內容不再是人類的專利。

這是生成式AI帶給我們的新世界。在這次調查中，包括長春集團總裁林書鴻、日月光研發副總洪志斌都看好生成式AI的影響力；聯發科董事長蔡明介更曾表示，AI將對產業和社會帶來重大改變，進而帶動半導體成長。

▲ChatGPT帶動大語言模型風潮後，多模態AI基礎模型是產業界追求的下一個發展目標。達志

進化：從單一任務到跨領域工作

其實，ChatGPT剛被創造出來時，就是一個強大的「接話機器人」，它能從訓練模型中，猜出如果前一個字是Ａ，後一個字要如何接，最符合人類的習慣。用這個方式，生成式AI學會模仿人類寫作、創造圖像、音樂和影片。

目前，我們已能感受到AI的力量對工作和生活方式帶來的大幅改變。例如，有人用來設計名為Ai Pin的終端裝置，只要你說一句話，就能將你要的資訊投影在手上，或是替你撥電話、拍照，大有取代觸控螢幕的架式。或是當你的祕書，把工廠裡每天生成的海量資料濃縮成一頁報告，告訴你今天有哪些待處理的狀況，但不用多久工廠也可以換成手機、PC或任何裝置，它們都能完成你交辦的事項。在製藥業，甚至可以「推論」出新藥的蛋白質該如何設計。

未來幾年，生成式人工智慧還會有什麼樣的新發展？多模態AI基礎模型發展將是其中之一。以前訓練模型，都是訓練一個單獨的小模型，讓它做一個單獨的工作，如判讀Ｘ光片或幫自駕車辨識障礙物等。

但大模型不是為完成特定任務訓練的，訓練完成後，只要微調就能完成各式各樣的工作。只是一般的大模型多半只為處理語音或視覺設計，讓語音模型處理文字又得再增加一個模型；而多模態基礎模型則能橫跨語言、視覺和語音等多種工作，各種任務都可以用一個大模型統一理解、統一處理。

鴻海研究院人工智慧研究所所長栗永徽曾表示，多模態模型發展到最後的目的，是要發展出「非常接近像人一樣，具有多模態理解和認知，跟嘗試推理的模型；如果能做到這一點，ＡＧＩ通用人工智慧的世界，就可能即將到來」。

栗永徽所講的通用人工智慧，是這個領域長期追求的聖杯，因為，要讓人工智慧像人一樣，不但能創作文章、拍攝影片、演講，還要能開車、打籃球、煮飯，對現有的生成式AI來說，能力上仍有相當大的距離；但未來透過發展多模態基礎模型，串接各種能力，希望藉此模擬更接近真人的能力。

除此之外，向外串連會是人工智慧技術接下來的發展方向。如ＲＡＧ檢索增強技術現在正當紅，因為過去單靠模型推論結果，當得到不夠即時，或是有錯誤的答案，新的技術會把使用者的問題，加入外界搜尋得到的內容，和模型產生的內容一起計算。

願景：下個階段是互動式AI

DeepMind的共同創辦人蘇萊曼（Mustafa Suleyman）曾表示：「生成式AI只是過渡，下一個階段是互動式AI。」他認為，現在的人工智慧還停留在把資料分門別類處理的階段，但接下來當各種能力可以整合在一個模型裡，就不再需要滑鼠和鍵盤，而只需要和AI對話，給它一個大概的目標，就能由人工智慧為你調動各種軟體，甚至和其他人工智慧對話來完成目標。

但這也代表AI的安全性將愈來愈受到重視，因為當你希望讓AI獨立完成愈來愈多的工作，做更多的判斷，就代表你要賦予AI更大的權力，讓AI有自主的意見。「這是人類技術發展歷史上一個重要的時刻，」蘇萊曼說，「如果你願意，AI將有自由來採取行動，我們正在創造有這種可能性的工具。」但他對AI的發展十分樂觀，「我們完全有能力監管AI，就像監管網路上的不良內容一樣，人類也可以用同樣的方法控制AI」。閱讀完整內容

快讀

生成式AI與大型語言模型科技發展史的重要時刻

科技發展史的重要時刻

本文摘錄自‎

生成式AI與大型語言模型科技發展史的重要時刻

《財訊》

2024/2月第705期

相關

科技發展史的重要時刻

本文摘錄自‎

生成式AI與大型語言模型 科技發展史的重要時刻

《財訊》

2024/2月 第705期

相關

相關文章

生成式AI與大型語言模型科技發展史的重要時刻

2024/2月第705期