《必然》Google、Apple、Facebook……為什麼都只出現在美國?

必然:掌握形塑未來30年的12科技大趨力 Photo by Clay Banks on Unsplash

文/凱文.凱利

在紐約大學任教的經濟學家羅默專攻經濟成長的理論,他說真正可維持的經濟成長並非來自新的資源,而是來自現有的資源,重新整理過後變得更有價值;成長來自重新混合。聖塔菲研究所的經濟學家亞瑟則專精科技成長的動力學,他說所有新的科技都衍生自現有科技的組合。早期的原始科技重新組織混合後,加以組合,就是現代的科技。既然我們可以把幾百種簡單的科技和幾十萬種更複雜的科技結合在一起,新科技的數量就沒有極限—─但全都是重新混合的結果。經濟和科技成長是這樣,數位成長自然也是。在這個時期,重新混合非常有成效。創新人士重新結合早期的媒體流派與後來比較複雜的類型,製作出不可計數的新媒體體裁。新的體裁愈多,愈能重新混合出更新式的類型。可能的組合飛快成長,擴展了文化與經濟。

我們處於新媒體的黃金時代。過去幾十年來,出現了數百種媒體類型,從舊的體裁中重新混合出來。之前的媒體包括新聞報導、30分鐘的電視情境喜劇或四分鐘的流行歌,這些體裁還在,也非常受歡迎。但數位科技把這些形式拆解成元素,可以用新的方法重新組合。最新的類型包括網路上的清單形式報導(清單體)或一百四十個字元的Twitter旋風。有些重組的形式現在很健全,可以當作新的體裁。接下來的幾十年內,這些新類型本身也會重新混合、分拆、再重新組合成其他新的類型。有些已經成為主流─它們至少有上百萬名創作者,還有好幾億讀者。

舉例來說,每本暢銷書背後都有一大群粉絲自己寫續集,把最愛的作者創造出的人物放入稍微改換過的時空背景。這些充滿想像力的擴寫敘事,叫做同人小說。非正式─未得到原始作者的合作或贊同─還可能混合了好幾本書或好幾個作者的元素。主要讀者是其他一樣狂熱的粉絲。到目前為止,一個同人小說檔案庫,已經有一百五十萬篇粉絲的創作。

用手機拍的超短影片(最多6秒),可以用Vine這種應用程式輕鬆分享,轉發分享出去。6秒足以讓笑話或災難如病毒般快速散播。這些短短的片段可以編輯,以求最強的效果。一連串6秒長的Vine影片匯集起來,是很受歡迎的觀看模式。2013年,每天發到Twitter上的Vine短片有一千兩百萬部,到了2015年,觀賞人次累計每天有十五億。有些明星在Vine上的追蹤者高達百萬。但還有一種更短的影片:動畫gif,看似靜態圖片,一而再、再而三循環播出少量的動作。循環一次只要一、兩秒,所以也算一秒長的影片。任何動作都可以循環。Gif或許是不斷重複的古怪表情、電影裡知名的場景,或重複的圖案。無窮無盡的重複讓我們可以細看gif,直到昇華成更重要的東西。現在當然也有專門提倡gif的網站。

這些例子只是冰山一角,無法清楚說明未來數十年內,新形式的爆發與全然的狂熱。隨便拿一種形式,加以繁衍,然後結合並任意搭配。我們可以看見新形式初生的模樣。用手指把電影裡的物品拉出來,重新混合到我們自己的相片裡。在手機的相機上按一下,拍攝風景,然後用文字顯示當地的歷史,加上影像的注釋。文字、聲音、動作持續出現。有了新工具,我們就能隨時創造出心中的幻想。只要幾秒就能產生湖水綠玫瑰的影像,很真實,上面的露珠閃閃發光,插在鑲金邊的花瓶裡─或許比我們寫這些字的時間還短。而且那只是開場。

數位位元的可替代性非常卓越,因此形式能輕鬆轉變、改變和雜交。位元的快速流動,讓某個程式能模擬另一個。模擬其他形式,正是數位媒體原本就有的功能。這種多重性無法倒退。媒體選擇的數目只會增加。類型的種類和子類會繼續爆發。當然,有些大受歡迎,有些卻沒落,但只有少數幾種才會完全消失。過了一個世紀,仍有喜愛歌劇的人。但也會有數十億個電玩迷和幾億個虛擬實境的世界。

在接下來的30年,位元愈來愈快的流動性會繼續趕過媒體,推動大規模的重新混合。

同時,便宜且通用的創作工具(超高像素的手機相機、YouTube Capture、iMovie),快速降低創作動態影像所需的精力,也擾亂了所有媒體固有的不對稱。意思是:讀一本書比寫一本書簡單,聽一首歌比做一首歌簡單,去看舞台劇比製作舞台劇簡單。正片長度的經典電影,長久以來尤其因為這種使用者不對稱性而吃虧。悉心照料化學處理的膠捲,然後黏貼成電影,需要許多人通力合作,所以看電影比拍電影容易多了。好萊塢鉅片製作可能要上百萬個工時,卻只要兩小時就能看完。專家很有信心,觀影人可以躺著看電影,就不會想起身,但他們現在卻非常迷惑,近年來,上千萬人花了無數個小時製作自己設計的電影。他們已經有觀眾,有數十億人願意幫忙,還有好多種創作的模式可以選擇。有了新的消費者器具、社群訓練、同儕鼓勵及聰明得不得了的軟體,製作影片現在幾乎和寫作一樣容易。

當然,這不是好萊塢拍電影的方法。賣座強片是人手打造出來的巨大產物。就像西伯利亞老虎,會吸引我們的注意力─但也非常稀有。每年在北美洲約發行六百部劇情片,也就是一千兩百個小時的動態影像。今日,每年製作的動態影像,高達數億個小時,相較之下,一千兩百個小時微不足道,簡直是不起眼的進位誤差。

我們以為老虎是動物界的代表,但事實上就統計來說,蝗蟲是更真實的動物範例。手工打造的好萊塢影片就是稀有的老虎,不會消失。但如果要探討電影的未來,我們必須研究地面上成群移動的小蟲子─YouTube、獨立影片、電視連續劇、紀錄片、商業廣告、資訊廣告,以及蟲子大小的極短版和集錦,亂七八糟的一堆─不光是老虎這塊小小的頂點。YouTube影片一個月的觀賞次數,超過一百二十億。觀看次數最多的影片已經看了幾十億次,比任何強片都多。每天都有一億多部短片被分享到網路上,即使看的人不多。光從影片的數量和這些影片全體獲得的注意力來看,這些短片已經變成人類文化的中心。製作技術差異很大。有些和好萊塢電影一樣豪華,但大多數則由年輕人在自家廚房裡用手機拍攝。如果好萊塢在金字塔頂端,最底下就是這些還沒有根基的活動,電影的未來也從這裡開始。

非出自好萊塢的製作,大多仰賴重新混合,因為透過重新混合,創作也變得更容易。業餘人士用網路上找到的原聲帶,或在臥室裡自行錄製、修剪和重新排列場景,疊上新的故事或新穎的觀點。重新混合商業廣告正在熱頭上。每種體裁通常都有固定的格式。

用重新混合的電影預告片來舉例。電影預告片本身是新的藝術形式。很簡短,敘事緊湊,所以能輕鬆剪成不一樣的故事─比方說虛構電影的預告片。不知名的業餘人士能把喜劇轉成恐怖片,反之亦然。常有人重新混合預告片的原聲帶,來製作短片集錦。有些粉絲混搭流行歌原聲帶和晦澀的熱門邪典電影,創作MV。或者從最喜歡的電影或最喜歡的影星演的電影裡剪出場景,編輯後和一首搭不上關係的歌配起來。他們的作品變成虛幻宇宙的MV。流行樂團的狂熱粉絲會在自己最喜歡的歌曲影片上,加入字體很大的歌詞。後來這些歌詞片大受歡迎,有些樂團甚至開始發行有歌詞的MV。歌詞配合聲音,在影片上播出來,實實在在就是文字與影像的重新混合─讀影片,看音樂。

重新混合影片,甚至能變成集體活動。全世界各地有數十萬動漫迷,在重新混合日本的動畫片(當然是在網路上碰頭)。他們把動畫剪成小塊,有些才幾個影格長,然後用影片編輯軟體重新排列,配上新的原聲帶與音樂,通常也會配上英文對話。這麼做影片,可能比畫出原本的動畫更費事,但30年前要創作出簡單的短片才更難。創作出來的動畫影片訴說全新的故事。在這種次文化裡,真正的成就是贏得「編輯鐵人」大賽。就和電視上的烹飪大賽《料理鐵人》一樣,編輯鐵人必須在觀眾前火速重新混合影片,同時和其他編輯者競爭,表現出卓越的圖像素養。最棒的編輯混合影片的速度,就和一般人打字一樣快。

事實上,製作集錦的習慣,來自文字素養。你可以在頁面上剪下貼上字詞。你一字不差地引用專家的話。你把動人的措詞用自己的話說出來。你會加上在其他地方找到的細節。你借用作品裡的結構,當成自己的使用。你移動影格,就和移動詞組一樣。現在你要在動態影像上施加這些書面的動作,用全新的視覺語言。

當影像存在隨身碟上,而不是電影膠片時,影像的流動性讓它可以接受改造,彷彿圖片是文字,而不是相片。盧卡斯等好萊塢獨行俠,很早就接納數位科技(盧卡斯創立了皮克斯動畫工作室),率先推出更流暢的製片法。在他的《星際大戰》電影中,盧卡斯發明的製片法比較像寫書和作畫,而不是傳統的電影攝製。

在傳統的電影攝製中,電影按場景規畫;拍攝場景(通常不只一次);從過量的場景中組出電影。有時候導演必須回頭,拍攝「接續鏡頭」,因為已有的膠捲可能說不出最終的故事。然而,數位科技讓電影有了流暢性,電影場景更容易塑形─就像作家筆下的段落,一直修改。場景不用拍攝(不像拍照片),而是逐漸累積,像顏料,也像文字。一層層視覺和聽覺精修,加到動作的粗略草圖上,混合的成果一直在流動、一直都能改變。盧卡斯最新的《星際大戰》電影,就用這種作家的方法疊上去。為了找到正確的步調和時機,盧卡斯先用粗略的模型錄製場景,然後加入更多細節,提高解析度,修改到滿意為止。光劍及其他效果都用數位方法一層層畫上去。在電影的最終版本裡,每個影格全經過處理。基本上,他的電影是一個像素、一個像素寫出來的。的確,在今日高預算的好萊塢動作片裡,每個影格都加上了許多額外的細節,其實比較像動態畫作,而不是動態照片。

在影像創作的偉大集體心智中,靜態照片已經有了轉變。每分鐘都有幾千名攝影師把最新的照片傳到Instagram、Snapchat、WhatsApp、Facebook和Flickr等網站或應用程式上。目前的照片數目超過一萬五千億,涵蓋所有你想得到的主題;我出的題目到目前為止還沒難倒它們,想找的影像都能找到。光是舊金山的金門大橋,Flickr就提供五十多萬張影像。金門大橋任何想得到的角度、光線條件和觀點都已經拍照上傳。如果你想把金門大橋的影像用在影片或電影裡,真的不需要自己去拍照。已經拍好了。你只需要一個很簡單的方法,來找到你要的影像。

3D模型也有類似的進展。在SketchUp軟體產生的3D模型資料庫裡,你可以找到精細無比的3D虛擬模型,世界上大多數知名建築物都涵蓋在內。需要紐約的街道?這裡有一組可以拍攝的虛擬街景。需要虛擬的金門大橋?有,而且細緻到超乎想像,每根鉚釘都在正確的位置。有了強大的搜尋和規格工具,世界各地橋梁的高解析度短片,都可以運算放進公共的視覺字典裡,方便重複使用。現成的「字句」可以組出一部影片,從已經拍好的短片或虛擬場景裡混搭出來。媒體理論家曼諾維奇稱之為「資料庫電影」。組件影像的資料庫,已經變成動態影像的新語法。

畢竟,作家就是這樣。我們瀏覽有限的資料庫,裡面都是現存的字詞,叫做詞典,然後把找到的詞重組成之前沒人看過的文章、小說和詩句。樂趣在於重新組合。的確,一定要發明新詞的作家不多。就連最偉大的作家在施展法力時,主要也在重新混合之前用過、常有人分享的字詞。我們會怎麼咬文嚼字,就會怎麼操弄影像。

懂得這種新電影語言的導演,就連最逼真的場景也會逐個影格調整、重製和改寫。電影製作因此脫離了攝影術的束縛。用昂貴的膠捲拍攝一、兩次就想捕捉真實很難,但再也不需要氣餒了,你可以從手邊有的東西創造出幻想世界。這裡的現實(其實是想像)一次用一個像素蓋起來,就像作家一次寫一個字,最後寫成一本小說。攝影術提升了世界的現況,而這種新的拍攝模式就像協作和繪畫,要探索世界的可能性。

能輕鬆製作電影還不夠,就像用古騰堡的活字印刷術能輕鬆製作書本,仍無法完全釋放文字。真正的文字素養需要一長串創新和技術,讓平凡的讀者與作者運用文字,發揮文字的力量。比方說,引號可以指出某個人從另一位作者那邊借用了文字。現在在電影裡還沒有平行符號,但我們很需要。面對冗長的文件,你需要目錄才能找到你要看的地方。所以要有頁碼。有人在13世紀發明了。影片裡的頁碼是什麼?更長的文本需要按字母排序的索引,由希臘人發明,後來發展成書本的圖書館。不久後,我們可以用人工智慧在影片的完整內容上加上索引。約莫在12世紀發明的注腳,把離題的資訊顯示在主要文本的主軸之外。影片能加注腳的話也很有用。(13世紀發明的)文獻引述讓學者和懷疑論者能有系統查閱影響內容的消息來源,或釐清內容。可以想想看,有引述的影片是什麼樣子。現在我們已經有超連結,把一段文字連到另一段,還有標籤,利用選定的字詞來分類,以便之後可以排序。

識字的人可以用這些發明剪下貼上想法、用自己的思路加注釋、連結到相關的想法、在作品庫裡搜尋、快速瀏覽主題、重新排列文本的順序、重新混合想法、引述專家,以及品味喜愛藝術家的點點滴滴。這些工具超越了閱讀,為文字素養奠定基礎。

如果文字素養代表能解析和運用文字,那麼新的媒體流暢力,表示能一樣輕鬆地解析和運用動態影像。但到目前為止,這些視界性的「讀者」工具尚未接觸到群眾。比方說,如果我要視覺比較最近的銀行倒閉與歷史上類似的事件,介紹你看經典電影《風雲人物》裡的擠兌,卻很難確切找到那一幕(幾個連續鏡頭裡的哪一個?哪幾個鏡頭?)。我可以這麼做,提到那部片的名字。或許我能指向那一幕的分記(YouTube的新功能)。但我不能把這個句子只連到線上電影裡的確切「分節」。電影的超連結還沒發明。如果電影素養很高,我就能引用電影裡的特定影格,或影格裡的特定項目。假設我是對異國服飾很有興趣的歷史學家,我要談論電影《北非諜影》裡某個人戴的土耳其氈帽。我應該能在帽子「移動」穿過許多影格時連結到帽子的影像,建立與土耳其氈帽本身的關聯(而不是戴帽子的那顆頭),就像我能輕鬆連結到文字中提到的土耳其氈帽。更好的話,我希望能用其他電影裡的土耳其氈帽短片當作參考,來注釋這頂氈帽。

有了成熟的視界性,我就能用其他的物體、影格或電影剪出的短片,來注解電影裡所有的物體、影格或場景。我應該可以搜尋電影的視覺索引,或瀏覽視覺的目錄,或掃過全場電影的視覺摘要。但現在要怎麼做到?怎麼能像翻書一樣翻過一部電影?

印刷術發明後,過了幾百年,文字素養的消費者工具才成形,但最早的視覺素養工具已經出現在研究實驗室裡和數位文化的邊緣上。舉個例子,要怎麼瀏覽全長的電影?一個快速掃過的方法,是用幾分鐘的時間快轉過兩個小時。另一個方法則是整理成縮短的版本,就像電影預告片一樣。這兩種方法都能把時間從幾個小時壓縮到幾分鐘。但有方法能把電影內容縮減成一看就懂的意象嗎?就像看了一本書的目錄,大概就知道書裡在說什麼。

學術研究已經產生幾種有趣的影片摘要原型,但不能取代整部電影。有些網站上面有不少電影,很受歡迎(例如色情網站),他們發明了一種方法,讓使用者能幾秒鐘就掃完一部全長電影的內容。使用者按下電影的標題影格,視窗從一個關鍵影格跳到下一個,變成快速的幻燈秀,有如電影的翻頁電子書。縮短的幻燈秀把幾小時的電影摘要在幾秒鐘裡。專業軟體可以用來識別影片裡的關鍵影格,增強摘要的效用。

視界性的聖杯則是尋獲度─像Google搜尋網路一樣,搜尋電影資料庫的能力,在其中挖掘出特殊的焦點。你可以輸入關鍵字,或只要說:「腳踏車和狗。」就可以找到電影裡同時有狗和腳踏車的場景。一眨眼,你就可以在《綠野仙蹤》裡找到女巫嘉麗小姐騎車載走小狗托托的時刻。更棒的是,你也能要Google找到所有電影裡的類似場景。這種能力快要成真了。

Google的雲端人工智慧正在快速獲取視覺智力。我和其他人都會上傳個人的快照,已經有幾十億張了,它能認得並記住相片裡所有的物品,簡直不可思議。給它一張相片,裡面是個男生在土路上騎摩托車,人工智慧會加上標籤「男生在土路上騎摩托車」。它給一張照片的標題是「爐子上有兩塊披薩」,答對了。Google和Facebook的人工智慧看了照片,就能告訴你影中人的姓名。

現在,處理一張影像的方法也可以用在動態影像上,因為電影就是排成一長串的靜態影像。感知電影更耗費處理能力,因為多了時間這個緯度(攝影機移開了,物體還在嗎?)。再過幾年,透過人工智慧搜尋影片就會變成家常便飯。同時,我們也會開始探索動態影像能不能全部數位化,就像古騰堡計畫收集的作品。「我覺得影像和影片裡的像素資料,就是網際網路的暗物質,」李飛飛說,她是史丹佛大學人工智慧實驗室的主任。「我們要照亮它們。」

動態影像的創作、儲存、注釋、結合複雜敘事都變得愈來愈容易後,觀眾要重新運用也較以前簡單。如此一來,影像就有了一種很像文字的流動性。流動的影像會快速流到新的螢幕上,準備移進新的媒體及滲入舊有的媒體。就像字母位元,可以擠進連結或放大來配合搜尋引擎和資料庫。靈活的影像和文字一樣,便於創作和使用,給參與者滿足的感覺。

除了尋獲度,媒體內另一項正在進行的革命可說是「可倒帶性」。在口述時代,有人講話你得認真聽,因為話一旦說出口就沒了。在錄音技術出現前,沒有備分,沒辦法捲回去聽你漏了什麼。

從口述到書面的偉大歷史轉變,出現在幾千年前,聽眾(讀者)可以重讀文字,捲回「演說」的開頭。

必然:掌握形塑未來30年的12科技大趨力

本文摘錄自

必然:掌握形塑未來30年的12科技大趨力

凱文.凱利/著,嚴麗娟/譯

由 貓頭鷹出版 提供