傾聽科技,就知道未來
我在一九九○年代撰寫的書籍中,預測了當時令人難以置信的(大型科技公司)贏家全拿的法則、免費增值經濟和收穫遞增法則等動向。我預估,二十年後的富豪排行中,將有許多因為這些法則而賺大錢的科技業者入榜。十幾年過去,當時的預測已經成為現實了。
因此,曾經有人問我:「該如何思考,才能夠這麼分析呢?」我平時留意的,就是傾聽科技,把科技當成生物般看待,詢問「科技想要什麼?」並且留意如何協助科技想做的事。
我完全站在科技的視角觀看世界。讓世界變化、進步的主要力量便是科技,那就像是必然的發展,就像只要發明了電力,接著必定會發明電波。在這個宇宙中,無論是哪個星球上的文明,只要發明了電力,接著就是電波。而接下來就是 Wi-Fi 的誕生了。譬如說我以前曾在著作《必然》中提過,自動化是無可避免的趨勢。
當然,決定其特性的選項——譬如說,由誰規範、持有,持有物是否公開,商用與否,或者僅限於國內或跨國——藉由選擇其中何種做法,名為自動化的科技將成為完全不同的東西。可是我們並沒有餘裕選擇是否採用自動化。同樣地,關於人工智慧(AI)也沒有選擇的自由。懷孕時似乎能操控基因,當然甚至能夠改變人類本身的面貌,關於這點將在之後詳述。不過我們有餘裕選擇該如何執行,而選擇的結果將產生大幅的變化。
這種情況與人類成長類似。譬如,身為人類誕生、成長的話,我們無法選擇是否成為青少年。就算得以選擇成為何種青少年,終究也只能成為青少年。
同樣地,也能這麼形容文明。倘若我們移居到其他星球,該處的地形和重力與地球類似的話,文明就會與現代社會是非常類似的模式。
來自各國,一百萬人於虛擬中一起工作的世界
未來五十年內,人工智慧將成為與自動化和工業革命匹敵、更大的潮流吧?
人工智慧等科技發展,可說以後工作的型態將大幅改變。我所看見的未來,是來自各種不同的地方,一百萬人同時在一個專案中工作的可能。那是什麼樣的工作,為此需要的科技是什麼,我接著來說明。
為了讓百萬人同時工作,需要現在尚未問世的新型工具。舉例而言,像是裝設擴增實境(AR)功能的智慧眼鏡。擴增實境是雙方一起工作時,讓人容易實際作交流的科技。
戴上這種眼鏡後,與遠方的人可以遠端呈現狀態(Telepresence,指與相隔兩地的人當場面對面的狀態),一邊共享設計和尺寸,一邊攜手進行車用物品規模的工作(順道一提,雖然尚未普及,不過微軟於二○一六年推出擁有擴增實境功能的智慧眼鏡「HoloLens」。已有人在倉庫或工廠配戴 HoloLens 工作,或者接受訓練)。
除此以外需要的工具,就是為了讓參與者互相合作,採納某個人提出的主意,使其進化,逐漸改良的東西。舉例來說,把這種工作或專案當做生意集資、收款的情況,必須有種方法讓原本的提案者也可以抽成。我認為,支付一些報酬的需要也會出現,但在這種場合,現在因比特幣等加密資產而蔚為話題的區塊鏈這類技術就能派上用場。
另外,也一定得談到即時自動翻譯的大規模進步。尤其其他語言轉換成英語幾乎為免費的翻譯的話,以往未曾有的大規模團體工作就變得容易進行。雖然世界各地有許多人才,但那些人不見得會說英語。因此倘若有翻譯功能,過去被排除在外的人就變得能夠以有意義的形式參與專案或工作。
在程式設計的世界中,能思考到用開放原始碼(指免費公開軟體程式,任何人都能使用)製造的自動駕駛電動車的例子。將有人設計出為了(協力製造車子而必要的)存取這種程式的便宜智慧眼鏡,在市場上推出,一起致力於普及。這些事情全都能夠在遠端團體工作下進行。
幾年前,電子布告欄 Reddit 曾在非常短期內,召集了百萬人做藝術團體工作的實驗。將百萬張照片以像素的形式並排,每個人能夠控制自己的像素,讓整幅畫產生變化。有人雇用其他人畫畫,有人和其他人一起在畫作上繪圖,有點像是像素戰爭遊戲的狀態。
這個例子不過是在玩耍,不過開始新事物時,必須從開心的事情開始下手才行呢。由這種人打造的,如虛擬實境遊戲般的世界,某種遊戲專用平台,以後也可能作為一種可能性存在吧?
什麼是鏡像世界?
近幾年我所提倡,「鏡像世界」即接近的AR世界(擴增實境的世界),也是深入團體工作所需的場所。
鏡像世界是耶魯大學大衛.格萊特教授率先推廣的術語。在鏡像世界中,如導演史蒂芬.史匹柏拍攝的電影《一級玩家》中出現,虛擬的世界覆蓋在現實世界上。
這是好幾百萬人參與,世界規模的某種類型的層(layer)。雖然人類在現實世界中各自住在不同的地方,卻同時與住在其他場所的人一起經營地球規模的虛擬世界。
鏡像世界的最基本的說明,是「重疊於現實世界上,透過那個場所的資訊層觀看世界的方法」。虛擬實境(VR)是外界看不見目鏡中的虛擬世界,而擴增實境是透過智慧眼鏡看著現實世界。接著虛擬的影像或文字會與現實的風景重疊出現。
譬如,戴上智慧眼鏡,造訪坐落某個古老房子的場所。透過眼鏡觀看那間老房子,便能夠看見重疊的虛擬影像,顯現那裡過去是何種模樣的形象影像。
擴增實境也能用在現實世界的導覽上。譬如,一邊戴著智慧眼鏡一邊走路,在某個場所,顯現眼前該走哪一條路的藍色箭頭。或者出現某個角色在眼前領路參觀街道。或者出現友人事前留下的訊息,或出現廣告等說明。他們以前來到此處時,留下給你的留言,留言就一直放在該處。
另外,我們也能夠想像,與人見面時,可以在人的胸前看見虛擬名牌般的欄位,告訴你名字。
我還能夠想到下述這種例子。當你打算修理構造複雜的機械時,會出現導覽的箭頭,指引應該螺絲起子碰哪個部分。或者,宛如有人跟在後面一樣,與你用同樣的視角認知機械,也會出現聲音指引你應該如何修理。這些例子都是重疊影像運用的情況呢。
在鏡像世界中,歷史成為動詞
在鏡像世界中,歷史會「變成動詞」。譬如,以下說明或許是種付費服務,不過只要伸出手,快速揮舞滑動空間,就可倒轉時間,叫出那個場所以前有的景象。當你走在東京的街上時,便能夠選擇一百年、兩百年前東京街角的模樣,重疊觀看。只要向裝設在智慧眼鏡上的人工智慧詢問「這裡一百年前是什麼樣子呢」即可。而再稍微往前走,想看兩百年前的模樣而調整維度後,就會變成那個時代的風景。也能夠看見那個建築物從過去一路如何變化至今的模樣。
將這種技術運用在觀光網站上,也能展現價值。譬如前往羅馬,詢問某個建築物在變成廢墟前是什麼模樣的話,以前的模樣就會重疊在建築物周圍顯示,能夠從過去的羅馬樣貌親身感受歷史。這種資訊,只要由一般人做成軟體,賣給對歷史感興趣的旅客就好。相對的,這個場所一百年以後的風景,由藝術家繪製科幻般的影像或許也挺好的。就像這樣,鏡像世界在某種意義上,可說是在三次元空間加入時間要素的4D世界吧。
也有一種構想是,在世界上任何一處,就存在與實體同樣尺寸的虛擬「數位分身(digital twin)」,僅戴上智慧眼鏡的時候才會投影在實物上。在這種場合配戴的智慧眼鏡,某種意義而言是取代智慧型手機功用的新型態裝置,端末也不會一直放在口袋中,而是戴在身上,用於顯示畫面的穿戴型裝置。
想顯示畫面或打電話時,虛擬的影像便會投影在客廳。另外,也能映照出虛擬的友人和公司同事,與他們「會面」。你只要坐在自己房間的椅子上就好了。接著各種不同的資訊,會重疊在應當的場所。在不久後的將來,現實世界中的道路、房間、建築物等所有東西的數位分身都會在鏡像世界裡出現吧。
屆時,就能夠運用在如我方才說明的遊戲、導覽、上課和訓練等各種不同的場合。順道一提,深受世界上好幾億人喜愛的遊戲「寶可夢GO」,是拿著智慧型手機對準現實中的場所,虛擬角色就會出現在畫面上,因此顯示了鏡像世界到來的徵兆。遊戲時常是培養科技的場所。
另外,由於新冠肺炎疫情,因此約二十年前出現的視訊會議系統(如 Zoom 等)變得實用化了。視訊會議系統本身是約二十年前就有的科技,而且並沒有多大的變化,不過變得非常便宜,容易使用,因此任何人都能用得上手。
這是比預期中還更有用處的工具,這個發現讓許多人感到很吃驚。多虧了視訊會議系統變得普及,朝著眼前平面的螢幕上映出的人說話、說明的行為變得普及。我認為這就是實現鏡像世界的先驅。
在社群媒體後,「嶄新巨大平台」來臨
所謂鏡像世界,意指可以透過機械認知(讀取)的世界。第一個平台——網際網路,將世界上的資訊數位化,讓人得以搜尋,尋找答案。那正是我們現在也在用的網路。
次世代的大型平台,則是掌握人類的行動和關聯性,將人類彼此的關係數位化的平台。我們稱之為「社群」,機械變得能夠認知人際關係,人工智慧和演算法變得適用於人際關係和行動。第二個大型平台(社群媒體)出現了。
緊接著,第三個大型平台,是在物理層面上將全世界數位化的平台(鏡像世界)。搜尋現實世界或關聯性,運用這些資訊創造新事物,人工智慧和演算法也適用。其優秀的地方,在於不僅能夠看見,也能將辨識對象數位化,因此機械可以讀取這些資訊。
鏡像世界經常被稱為「空間網」,那是因為擁有三次元的廣度。由於在現實世界中變得可運用空間的世界,我們所製作的各式各樣的人工物必須成為其中一部分的架構。
那就是「映射(mapping)」,譬如製作某個房間或房屋的(位置關係的)地圖,在鏡像世界中標示位置。「由於這間房屋通往外面,因此和隔壁房屋沒有相連……」顯示諸如此類關聯性的資訊,是具有語意(semantic)的關聯,那是種具有實體的呈現。
我們從很久以前,就一直針對物聯網談論過類似的嘗試。物聯網是將鑲有微小晶片的標籤,貼在所有瓶子、椅子或書上,以無線網路連結這些物品,也提供電力的機制。不過,以物理的形式連結並不容易,長期以來,能夠定義為有意義關係的網路「語意網(semantic web)」,被認為不可能實現。比起過去的嘗試,由人工智慧認知影像等現實空間中的物體,將所有東西以擁有語意的方式連結,會更加順利運作。
譬如,假設你戴上智慧眼鏡,身處語意網的世界。此時看向桌子,有個裝水的杯子。透過觀看的行為,人工智慧主動檢測到杯子,重新映射在這個世界。而結果,知道具體配置的人工智慧收到報告,人工智慧將杯子個別分離,以判斷該處有個杯子。
我注意到桌上有個杯子,理解杯子從上週就一直放在那裡、移動杯子的話會發生何事,或拿起杯子後引起相互作用。人工智慧也會告知那個杯子的種類,以及是誰做的。
因此某個意義上,這個杯子處在連結的狀態。那並非透過晶片、電流,而是有意義的連結,其對象和其他一切物體之間的關係而決定了位置,其意義(定位)是透過人工智慧進行的。
基本上,人工智慧會看著我的房間,認知每一個物體,甚至認知了品牌或產品編號,該物品是何時來到家裡的?如何販賣的?我們會實際上了解那到底是什麼東西。現實上,那並非以透過附設電池晶片的電器產品彼此連結的形式,而是有意義的連結。 閱讀完整內容