先從回顧開始。以最大的尺度觀察歷史,歷史似乎展現一連串明顯的成長模式,每次都比前一次更加快速。這樣的模式預示了另一波(更快速的)成長模式。然而,我們並不打算著重這個觀察結果。本書的主旨並不是探討「技術加速」或「指數成長」,或是那些五花八門、偶爾會集結在「技術奇點」(注:singularity,根據科技發展史總結出的觀點,認為人類正在接近一個使現有科技被完全拋棄、或人類文明被完全顛覆的事件點,事件點過後的事件完全無法預測)標題下的概念。本章我們將回顧人工智慧的歷史,並探索此領域的現有能力。最後我們將看看近期專家的意見,深刻檢討我們對未來進展時間表的忽略。
人類的成長模式和大歷史
不過幾百萬年前,我們的祖先還在非洲的樹蔭下盪來盪去。不管是在地理、甚至演化的時間尺度上,智人(Homo sapiens)從與黑猩猩的最後共同祖先分支出來,發生得十分突然。我們發展出直立站姿、對生拇指,以及最關鍵的 ── 相比之下較小的腦尺寸和神經組織 ── 讓我們的認知能力大幅躍進。如此一來,人類可以抽象思考、溝通複雜思想,並透過文化一代代累積情報,效果遠比地球上任何一種物種都還要好。
這些能力讓人類發展出愈來愈有效率的生產技術,也讓我們的祖先遠遠遷離雨林和草原。特別是開展農業後,總人口數增加,人口密度也提高了。人愈多,想法就愈多;更大的密度,代表想法更容易流通,也讓某些人得以投身研發專業的技能。這些發展增進了經濟生產和技術能力的成長率。日後與工業革命相關的發展,再一次帶來了不遑多讓的成長率劇變。
成長率的變化結果十分重大。幾十萬年前,早期人類(或原始人)的成長實在是慢得不得了,他們的生產力大約要花上100萬年,才能再多讓100萬人口維持生存水平。到了西元前5000年,農業革命後成長率大幅提升,要達到同樣的成長量只需200年。如今,工業革命後,全球經濟成長平均每90分鐘就可以達成同樣生產量。1
長久維持現在的成長率能帶來可觀的結果;若全球經濟持續以過去50年的速度成長,那麼到2050年,全球將比現在富有4.8倍,而在2100年更會達到34倍。2
但如果全世界經歷另一場規模堪比農業革命和工業革命的成長率劇變,目前這種持續以穩定指數成長的前景也將相形見絀。經濟學家羅賓.韓森(Robin Hanson)根據歷史上的經濟和人口資料估計,若以一個更新世的獵人/採集社會來算,全球經濟倍增所需的時間為224,000年;以農業社會來算,是909年;以工業社會來算,則是6.3年(在韓森的模型中,當代是農業與工業成長模式的混合體 ── 全球整體的經濟尚未以每6.3年翻一倍的速度成長)。3如果真能轉型至下一個全新的成長模式,且其規模接近前兩次的改變,那麼產生的全球經濟成長模式將以每兩星期一次的速度倍增。
以現在的眼光來看,這種成長簡直不可思議。但過往的觀察家可能也說過「未來的全球經濟將在人一輩子中翻倍數次」這種簡直不可理喻的推測之言。然而,如今的我們卻習以為常。
韋那.文吉(Vernor Vinge)開創性的論文開啟了「技術奇點即將到來」的想法,雷.克茲威爾(Ray Kurzweil)等人接續著述,如今已廣為人知。4然而,世人不明就裡,以各種字面意義來使用「技術奇點」一詞,從而打造了一股具有「技術烏托邦」意味的邪惡光環(幾乎有如千禧年主義)。5既然這些字面意義和我們的論點毫不相干,那麼以更精準的術語來取代「技術奇點」一詞,應該有助於釐清事實。
關於「技術奇點」的想法,在此值得一提的是智慧爆炸的可能性,特別是機器超智慧的前景。也許有些人會被圖一那種指出「下一場不亞於農業革命或工業革命的成長模式劇變,很可能發生」的成長圖給說服,但他們接下來可能就會說,全球經濟如果只要幾星期就成長一倍,想必得要有一個速度和效率都比我們人類高上許多的心智來主導。但其實,認真看待機器智慧革命前景的態度並不需要仰賴曲線圖,或是從過去的經濟成長來推論。我們將會看到,我們有更充分的理由該採取謹慎的看法。
(a) 就算我們拉近到近1萬年,模式基本上仍以垂直90度角上升。
(b) 要到過去100年,這條曲線看起來才像有離開底端。(圖中的不同線段,對應著不同的資料組,因此預測略有出入。)6
遠大前程
自從1940年代電腦發明以來,世人殷殷期盼總有一天,機器能達到人類的一般智慧 ── 也就是具有常識和有效的學習與邏輯思考能力,並能在具象和抽象的各種領域中解決複雜資訊問題的計劃能力。當時世人認為,這種智慧機器將在二十年後誕生。7但從那時到現在,世人對於那一天的到來大約每過一年就再延後一年;如今,關注通用人工智慧(artificial general intelligence)可能性的未來學家一般相信,智慧機器的誕生還需要好幾十年。8
二十年是占卜家預言劇變的甜蜜點:近到引人注意又息息相關,同時遠到可以假設現在還是空想的一絲突破屆時可能發生。與更短的時間尺度相比,大多數五到十年內會對世界有極大影響的科技,已有少量付諸實用;而十五年內會重新改造世界的技術,目前都還在實驗室的原型階段。占卜家的生涯年限差不多就是二十年,就算瞎編預測,時間也已經過了太久,砸不了招牌。
然而,儘管過去有人對人工智慧的預測過了頭,並不代表人工智慧不可行,或人類永遠開發不出人工智慧。9人工智慧的進展不如預期的主要理由,在於打造智慧機器的技術難度比先驅者所預料的還要高。至於難度究竟有多高、何時能一一克服,則都還是未定之數。有些一開始看起來複雜到令人絕望的難題,結果居然有驚人的簡單答案(不過,一般狀況往往與此相反)。
下一章,我們將探索有可能讓機器智能達到人類水準的不同途徑。但我們得先注意到一點:不論從現況到達人類水準的機器智慧(human-level machine intelligence)之間有多少站,最後一站都不會是終點。再過去不遠的下一站,就是超人類水準的機器智慧(super-human-level machine intelligence)。這班車不會在「人類」這一站就停下來,連減速都不會。它很有可能過站不停。
二戰期間擔任艾倫.圖靈(Alan Turing)解碼團隊首席統計學家的數學家厄文.約翰.古德(Irving John Good)可能是第一個描述此景明確面貌的人。他在這段寫於1965年、常被引用的文章提到:
我們先將超智慧機器定義為:超智慧機器能超越人(無論有多聰明)所有的智慧活動。既然這台機器的設計也是人類智慧活動的一部分,那麼這個超智慧機器便能設計出超越其上的機器;接著毫無疑問會出現「智慧爆炸」,人類的智慧將被遠遠拋在後頭。於是,第一台超智慧機器會是人類需要打造的最後一項發明,前提是這台機器夠溫和,願意讓我們知道如何控制它。10
顯然,這樣的智慧爆炸會產生重大的生存危機,因此我們必須以最認真的方法檢驗前景,即便通過檢驗的機會目前仍然相當渺茫。然而,由於人工智慧的先驅迫切想要發展出人類水準的人工智慧,他們多半從未深思「人工智慧可能會超越人類」一事。就好比他們的沉思肌肉在構思機器達到人類智慧的可能性時,就耗盡了所有的力量,使他們無力再往前推論 ── 去設想機器接下來還可以成為超智慧。
大多數的人工智慧先驅根本不認為自己的事業暗藏風險。11針對人工智慧以及「電腦主宰」的安全顧慮和道德疑慮,他們甚至連一些空話都沒提過,更遑論認真思考。這樣的匱乏即便在當時批判性技術評估(critical technology assessment)的標準還不怎麼高的背景下,也相當令人吃驚。12我們必須期待,當這門事業最終變得更可行之際,我們不但得到了啟動智慧爆發的技術熟練度,同時還擁有更高水準的掌控能力,好讓人類在這場爆發中存活下來。
進入下一部分之前,我們且先一瞥迄今為止的機器智慧史,應該會有所幫助。
希望與絕望的季節
1956年夏天,十位對神經網路、自動機理論(automata theory)和智慧研究有興趣的科學家在達特茅斯學院(Dartmouth College)召開了一場為期六週的工作坊。這項「達特茅斯夏季計劃」可說是人工智慧領域研究的黎明。許多參與者日後都被視為人工智慧的創始人。
這群人的樂觀展望反映在他們交出去的提案中(收件者為出資的洛克斐勒基金會〔Rockefeller Foundation〕):
我們提議進行一項為期兩個月、投入十人的人工智慧研究……這項研究進行基於下述推測:學習的每一面向或任何一種智慧的特徵,基本上都可以精準描述,並由一組機器來模擬。我們將找出讓機器能使用語言、產生抽象概念、解決人類問題,以及自我增進的方法。我們認為,若能精選出一組科學家共事一夏,上述問題(至少一個以上)會有長足的進展。
如此盛氣凌人的開場之後,人工智慧領域就在一段段炒作、期待、挫折和失望之間,交替了將近一甲子的歲月。
第一個令人興奮的時期始於達特茅斯會議,也就是日後約翰.麥卡錫(John McCarthy)所謂的「媽媽,你看我沒用手!」時期。當時,懷疑論的主張非常普遍(像是「絕對沒有機器能做到××!」),早期研究者打造的機器往往是為了反駁這類主張而生。為此,人工智慧研究者打造了小型系統,在「微型世界」裡達成目標(在一個定義明確且設限清楚的範圍內,讓一個減量版的行動成立),藉此提供概念證據,證明原則上機器是可以做到××的。一個叫做「邏輯理論家」(Logic Theorist)的早期系統,能證明阿爾弗雷德.諾斯.懷特海德(Alfred North Whitehead)和伯特蘭.羅素(Bertand Russell)合著的《數學原理》(Principia Mathematica)第二章中大多數的定理,甚至能想出更優雅的證據,破解了機器「只能數字化思考」的概念,展示機器也能演繹並創造邏輯證明。13
接下來,一個名為「一般問題解決器」(General Problem Solver)的程式,原則上解決了各種形式單一明確的問題。14接著,有人寫出可以解決大一微積分課程的問題、某些智力測驗出現的視覺類比問題,以及簡易言語代數問題的程式。15 「沙基」機器人(Shakey robot,運作時會震動)確立了邏輯推理可與知覺統整,並用來計劃及控制物理活動。16「艾莉莎」(ELIZA)計劃則展示了電腦模仿採取個人中心治療(注:Rogerian,以創始人卡爾.羅哲斯為名的治療,強調當事人的正面成長與發展,而非治療技巧)的精神治療師。17 1970年代中期,SHRDLU程式展現了一個處於模擬幾何塊狀世界中的模擬機器手臂,手臂能根據指示,以英語回答使用者輸入的問題。18接下來幾十年打造的系統證明,機器可以用各種古典作曲家的風格譜曲。在某些臨床診斷工作上,機器甚至表現得比資淺醫生還要好。機器也可以自動開車,或做出能獲得專利的發明物。19甚至還有人工智慧會說原創笑話20(這並不是說它有多幽默 ── 「帶著精神物穿過視覺器官,會得到什麼?一個洞見。」 ── 據小孩子說,它的雙關語還滿有趣的)。
但後來事實證明,這些早期實作系統的成功途徑很難延展到更多樣或是更難的問題上。其中一個理由在於,可能的「組合爆量」(combinatorial explosion)多到系統得仰賴窮舉搜尋法來進行。這種方法在問題簡單時可以運作得不錯,但要是問題變得複雜,就不管用了。舉例來說,在一個有一條推理規則和五個邏輯公理的演繹系統中,若要證明某個有五行證明的假說,我們可以輕易算出共有3,125種組合,接著一條條檢查,就能得出預期的結論。窮舉搜尋在證明只有六、七行時也能運作,但當問題的難度愈來愈高,沒多久窮舉搜尋就會故障。若要用窮舉搜尋做一道五十行的證明,所花的時間不是比五行多十倍,而是需要組合550 ≈ 8.9×1034種可能的序列 ── 就算用最快的超級電腦,計算上都不可行。
克服組合爆量問題所需的演算法,得要能在目標範圍內找出結構,並藉由啟發式搜索、計劃和靈活的抽象表現來善用先驗知識。這些能力在早期的人工智慧系統中,功能還很薄弱。此外,這些早期系統也因為不善於掌握不確定性、仰賴不穩定且基礎貧弱的象徵性表徵、缺乏數據,以及硬體記憶能力與處理速度的嚴重受限等等因素而窒礙難行。到了1970年代中期,研究者更注意這些問題,認清人工智慧計劃終究無法貫徹最初目標後,第一個「人工智慧冬天」便降臨了:這段緊縮期間,贊助減少,懷疑增加,人工智慧也退了流行。
1980年代初期終於大地回春;日本開展了「第五代電腦系統計劃」,是一個資金充沛的國家與私人共同計劃,目標是發展大規模並列計算架構做為人工智慧平台,來一口氣提高技術水準。此事發生的背景在日本「戰後經濟奇蹟」的最高熱潮,當時西方政府及企業領袖都渴望探求日本經濟成功背後的祕方,好在自己國內仿效。日本一決定大幅投資人工智慧,眾多國家也跟著下注… 閱讀完整內容