從智財角度 談生成式AI的著作權大戰

都是AI惹的禍


文/馮震宇  圖片提供/達志影像
重點摘要

1. 由於生成式AI是從網路上或其他大型資料庫取得海量資料,也使得AI 創作引發法律保護與責任之討論聲浪。

2. 許多人運用生成式AI快速且大量進行創作,但這些創作是否受著作權保護?我國《著作權法》所保護的對象是人,AI不屬於法人或自然人,因此純AI 作品很難根據現行法在我國受到保護。

3. 目前國際上已出現多起生成式AI所衍生的訴訟案件,凸顯整體智慧財產權法制的不足。在法規尚未明確之際,AI平台業者紛紛轉向契約模式,以契約來規避可能的法律責任。

4. 回顧《著作權法》發展史,其實是因應技術發展演進而生。相信未來《著作權法》也勢必會將AI技術納入著作權的範疇,並成為著作權持續發展的動力。

在全球正面臨數十年最嚴重通貨膨脹威脅之際,卻出現了人類歷史上影響深遠的變化,那就是生成式人工智慧(Generative AI)的大爆發,它不但讓2023年成為生成式AI元年,也讓2023年成為AI訴訟元年。

在ChatGPT、DALL.E、Midjourney、Stable Diffusion、Copilot 等的領軍之下,生成式AI一舉突破過去數十年人工智慧發展的瓶頸,讓使用者不必學習程式語言,就可以用自然語言與AI互動。其互動的結果,不僅能讓使用者立即獲得回覆,還能快速生成令人目不暇接的各種圖片、影片、音樂、文本、程式碼、甚至書籍等內容。也因為如此,ChatGPT在推出第一周就達到百萬用戶,兩個月的註冊用戶就達到1 億人,成為歷史上增長最快的消費應用軟體,也讓推出ChatGPT 的開發商OpenAI的估值達到創紀錄的290 億美元,成為價值最高的獨角獸。在此熱潮下,只要與生成式AI有關的各國股票都紛紛大漲,不但讓生成式AI成為資本市場的熱點,也打趴元宇宙、NFT與區塊鏈,未來像電影《鋼鐵人》那樣,以說話方式和AI互動的場景,也將不再是遙不可及了。

然而在擁抱AI 之前,還得要先跨越一道法律的門檻,那就是AI創作所引發的法律保護與責任之爭。生成式AI與過往AI技術不同之處,在於其運用大規模的語言模型(LLM),從網路上或其他大型資料庫取得海量資料進行訓練,並讓使用者得以用自然語言和AI互動,AI則根據使用者所提出的問題或指令,自動加以回答或生成各式各樣的內容。

但是對生成式AI所自動產生的內容是否會有著作權問題呢?我們可以隨意使用嗎?誰又能取得權利或是應負侵權之責呢?若真有侵權疑慮,能否主張合理使用來免除責任呢?因為這些問題,目前已經出現多件訴訟案件,將生成式AI所衍生的法律疑義推上風口浪尖,也凸顯目前整體智慧財產權法制(特別是著作權法)的不足。

AI 突破性發展 挑戰傳統創作模式

AI的發展可追溯到1950年。當時號稱計算機科學與人工智慧之父愛倫圖靈(A. M. Turing)在期刊上發表了一篇劃時代的論文(Computing Machinery and Intelligence),並提出了「機器可以思考嗎」(Can Machines Think) 這個重要的問題,為AI 研究揭開了序幕。

爾後,AI 發展日新月異,聊天機器人應運而生,機器學習技術讓機器去自己學習並尋求答案,讓AI出現實質性的突破。Google在2017年提出文字處理新理論架構(也就是轉化器Transformer)與突破,讓機器可同時學習大量的文字,大幅提高學習效率,也成為後來自然語言學習模型的基礎。例如Google在2018年的Google I/O開發大會,就展示可自行打電話到餐廳訂位的AI語音系統;而開發出ChatGPT的OpenAI 也是基於Transformer 模型並加以改良,並在2018年發表生成式預訓練轉化器(Generative Pre-trained Transformer, GPT) 通用語言模型。

和過去任務導向型模型(如AlphaGo 專注於下棋,或專注於語音識別、人臉辨識等AI)最大的不同在於,GPT模型在訓練AI 時,不需要人工標註,也不需要為AI準備相關的資料,而是讓AI 擷取人類所生成的現有資料去進行強化訓練並產生內容,因此可以節省大量的成本,並加速AI 的學習。而ChatGPT正是一種基於GPT-3所開發出來的聊天機器人,其中最神奇之處,在於不用教使用者如何學程式語言去讓電腦執行,而是讓人能用自然語言與電腦溝通互動,這種即時互動的特性,讓ChatGPT一炮而紅,將AI帶入一個新的境界。

這波生成式AI 風潮除了ChatGPT外, 尚有自動圖形生成的DALL.E、自動程式生成工具OpenAI Codex,而生成式圖形AI像是Imagen、Midjourney、Stable Diffusion 等;在影片自動生成AI 方面, 則有Meta的Make-A-Video以及Phenaki; 在文字轉圖形轉音樂方面則有MusicM 與基於Stable Diffusion 的Rifussion等。在此快速發展趨勢下,生成式AI將會對人類產生顛覆性的影響。而發展更快的是,許多人運用生成式AI 快速且大量的進行創作。根據媒體的報導,南韓的Snowfox Books出版社在2023年2月推出一本完全由AI 撰寫、翻譯、編輯校對與封面設計的書籍《尋找人生目標的45種方法》。另根據《路透社》報導,截至 2023年2月中旬,亞馬遜Kindle 商店中已有200 多本電子書將 ChatGPT 列為作者或合著者;而知名的Shutterstock、AdobeStock等圖片網站也允許販售 AI生成圖片。此外網路媒體BuzzFeed則更進一步,裁掉12%的員工, 並啟用ChatGPT 來負責互動欄目Quizzes以生成個性化的內容,反而讓股價在5天內大漲250%。
AI 生成內容是否受著作權保護?

AI各式各樣的應用與發展,除了引發AI是否會取代人類的疑慮外,更引發由AI所生成之內容是否能受到保護?若能受保護由誰取得權利?他人得否任意加以使用?甚至若有侵權問題由誰負責等問題。

根據目前世界各國的《著作權法》規定,能夠獲得保護的創作,除了要具備原創性(Originality) 與表達(Expression) 等基本要件之外,還必須是由「人類」(Human) 所創作,才能成為著作人(Author)。由於AI並不是人,因此若現行法制沒有修改,AI的作品並無法受到保護。由於無法受到保護,理論上就屬於公共領域內的作品,可以由公眾加以利用。

為此,美國Thaler 教授嘗試突破法規的限制,在2018 年就以自己開發的AI 系統DABUS創作出《最近進入天堂》(A Recent Entrance to Paradise),並向美國著作權局提出著作權登記,卻遭拒絕;為此Thaler 對著作權局決定提起上訴,但仍在2023年2月被駁回。同樣的,美國著作權局在2023年2月也撤銷了藝術家Kashtanova 用Midjourney創作的漫畫《Zarya of the Dawn》的著作權登記。

就我國而言,《著作權法》第1 條明文規定:「為保障『著作人』著作權益,調和社會公共利益,促進國家文化發展,特制定本法。本法未規定者,適用其他法律之規定。」《著作權法》第3 條則定義著作人為「創作著作之人」,很清楚著作權法所保護的對象是「人」。雖然我國法所稱的人包括自然人與法人,但AI兩者都不是,因此純AI作品也將很難根據現行法在我國受到保護。

值得思考的是,目前生成式AI所生成的作品仍須由人下達指令由電腦完成,而要完成一件滿意的作品可能需要輸入大量的指令或加以不斷的修改,這些指令與修改往往需要有一定經驗與能力的人才能完成,因此就指令本身與經人類修改完成的作品而言,仍有可能符合《著作權法》的保護要件而受到保護。


▲生成式AI讓使用者可以用自然語言與其互動,並且能快速生成各種圖片、影片、音樂、文本、畫作等內容,對人類傳統的創作模式產生顛覆性的影響。

訴訟爭議頻傳 誰該為侵權負責?

隨著生成式AI的快速突破,不但引發其生成內容能否受著作權保護的法律爭議,更引發法律風險的問題。例如Google就推遲其音樂生成機器人MusicM模型的推出,因為Google發現MusicM所輸出的音樂作品中會有1%的內容重製其訓練資料。

2023年更被外媒喻為AI訴訟元年。多名程式設計師在2022 年底向法院提起集體訴訟,指控微軟旗下的GitHub平台運用OpenAI Codex 所開發AI編碼工具Copilot侵害程式人員的著作權。其主張Copilot 未經同意就從網路上大型公共資料庫取用大量受著作權保護的程式碼來訓練AI系統自動生成程式碼,且未標明來源出處,構成著作權的侵害,並請求90億美元的損害賠償,也讓Copilot成為全球首宗AI侵權的訴訟案。

繼Copilot被告後,廣泛為AI藝術工作者所運用的圖形生成AI系統的開發公司Midjourney與Stability AI(開發Stable Diffusion)和大型圖庫DeviantAr也被3位藝術家控告。這些藝術家指控這三家公司所開發的AI系統未經同意,即透過網路抓取數以億計的圖像進行AI訓練,並藉此進行二次創作生成衍生作品,因而侵犯了他們以及其他廣大藝術家的權利。

這些接二連三侵權案件的出現,或許只是冰山的一角,未來隨著生成式AI的日趨普及,類似的案件將只會更多。這也不可避免的產生另一個重要的法律問題,那就是誰應該就可能的侵權責任負責?是開發AI系統的業者如OpenAI、Midjourney或Stability AI等公司嗎?還是蒐集網路上資料建構資料庫並以授權方式提供給AI業者的大型資料庫如Reddit、DeviantArt、LAION (Large-scale Artificial Intelligence Open Network)?或是訓練這些AI的訓練人員(因為他們在訓練過程中會接觸有著作權之圖片或文字等)?還是使用者? 閱讀完整內容
能力雜誌2023/4月 第806期

本文摘錄自‎

從智財角度 談生成式AI的著作權大戰

能力雜誌

2023/4月 第806期