Fair or Unfair? It is a difficult question – 以Stable Diffusion爭議為例

2023 / 11 / 06
作者：國際瞭望

2023 / 11 / 06
Author : 國際瞭望

分類：發展, 社群
Tags： AI人工智慧, 國際瞭望, 專題文章, 法律

Categories : 發展, 社群
Tags : AI人工智慧, 國際瞭望, 專題文章, 法律

余若凡／國際通商法律事務所合夥律師

引言

AI歷經數次發展及泡沫，2022年再次成功吸引大眾注意。相較於之前AI主要是在專業技術圈內討論並使用，這次透過生成式AI的快速發展，任何人都可以快速使用AI技術，甚至進一步創作，此項發展無疑對法律造成爆炸性的衝擊。

人工智慧在歷經數次發展及泡沫，2022年又成功地再次重新吸引大眾的注意。但不同的是，相較於之前人工智慧主要是在專業技術人員圈內討論並使用，這次透過生成式AI的快速發展，即使是不會編寫程式的電腦小白，都可以快速地使用人工智慧技術，甚至進一步創作。此發展無疑對法律造成爆炸性的衝擊，而隨之而來對於公平議題的討論，更是方興未艾。

由AI產生圖像的爭議

關於AI產生圖像的爭議，於2023年1月、由三位藝術家Kelly McKernan、Karla Ortiz和Sarah Andersen對Midjourney、Stability AI、DeviantArt在加州提起著作權等訴訟，而揭開了序幕[1]。三位藝術家指控Midjourney、Stability AI及Deviant Art侵犯了他們作品的著作權，Stability AI所使用訓練其人工智慧模型Stable Diffusion的資料庫LAION，是從網頁擷取、儲存內容，且未經過網站所有人或圖片著作人允許。

依據該藝術家的統計，LAION中約47%的圖像是從約100個網域擷取來，包括Getty Images、Shutterstock、Adobe Stock、及購物網站如Pinterest，而約有330萬圖像是從Deviant Art擷取。Midjourney、Stability AI、Deviant Art產品利用Stable Diffusion來生成與藝術家作品風格非常相似的衍生作品，與藝術家在市場上競爭，也沒有公開藝術家之姓名。Midjourney、DeviantArt、Stability AI 則表示，他們沒有侵犯任何人的著作權，他們的人工智慧模型是使用大量公共數據集訓練的，其中包括來自網路和社交媒體的圖像。

Getty Images也於2023年初開始對Stability AI在英國、美國法院提起訴訟[2]。Getty Images 是一家專業圖片交易及授權公司，擁有數百萬張照片的著作權。他們指控 Stability AI 未經授權使用其超過1,200萬張圖片來訓練人工智慧模型，而且違反他們的使用者條款。

利用他人著作訓練人工智慧模型，不違法？

在藝術家Kelly McKernan等提起之著作權訴訟，雙方主要爭執者為Stability AI等公司是否有利用藝術家的著作來訓練其人工智慧模型？

該三位藝術家稱Stable Diffusion模型是重建訓練圖庫的副本，以達到最大的精準度及真實性，其產生的著作為衍生著作，是基於用戶下的指令、經由資料庫產生的圖像，雖然產生的圖像不會與訓練圖庫中之任何特定影像緊密對應，但均為有著作權保護著作的衍生著作。Stability AI則稱Stable Diffusion並沒有儲存任何資料，「訓練是涉及開發及重新研究數百萬個參數，來共同定義事物的樣子，此技術目的並非使模型重新產生訓練圖庫中的圖像，若用戶想要重製圖像，有更簡單的方式可以做，如使用Photoshop去編輯，此技術的目的是要讓用戶透過指令創作一個全新且獨特的圖像[3]」。

依Wikipedia的說明，Stable Diffusion是一種深度生成神經網絡，主要用於根據文字描述生成詳細圖像。Stable Diffusion的工作原理是使用一種潛在擴散模型的技術，核心使用U-Net的神經網絡。U-Net是一個卷積神經網絡，其中包括編碼器（VAE）。VAE將圖像從高維空間壓縮到低維潛在空間，並經過添加和去除高斯噪聲的過程，最後將最終的去噪輸出解碼到像素空間中。Stable Diffusion還使用一種稱為文字編碼器的神經網絡，文字編碼器將文字描述轉換為一個向量，這個向量與潛在表示一起使用來生成圖像。Stable Diffusion的應用包括：根據文字描述生成圖像、修復損壞的圖像、添加圖像的內容、從一個圖像生成另一個圖像的風格、生成新的創意圖像等[4]。

依據上揭說明，Stable Diffusion技術似乎係以編碼器辨識圖像中之特徵，來訓練模型（例如：辨識狗、樹等），而並非儲存圖像訓練人工智慧模型、以產生特定著作的衍生著作。現行著作權法就電腦程式或美術著作的著作權人，主要係保護其重製、改作、散布等權利。所謂重製，指的是以印刷、複印等方法直接、間接、永久或暫時的重複製作[5]，改作指的則是以改寫等方法就原著作另為創作[6]。在Stable Diffusion並非就原著作進行重製、改作的情形下，似乎該技術並無涉及著作權法所指的重製、改作等，因此著作人要依目前著作權法主張權利，可能會遇到不少困難。

想當然耳，傳統著作權法在考量不同之利益分配時，並無法預見目前人工智慧發展的技術、也因此未將此情境納入考量。究竟如同Midjourney創辦人David Holz曾回應，Midjourney「任何一幅圖像都包含了模型訓練的無限小的片段，就像藝術家所感知的每一個視覺效果（每一張臉、日落、繪畫）和作家讀過的每一篇文本都包含了其想像力的內容和圖像的一小部分一樣」，因此模型訓練不應該被認為違反著作權法？還是著作權法應重新思考人工智慧模型與著作人間的關係？若是後者，在人工智慧模型包含數以千、億萬計著作的片段或特徵，那又應如何保護？或說應該保護誰呢？

利用公開網站上之資料及數據訓練人工智慧模型，不違法？

Midjourney創辦人David Holz曾回應，我們「只是從網路上大量擷取。我們使用已發布的開放資料集並對其進行訓練。我想說這是100%的人都會做的事。我們並不頑皮」（It is just a big scrape of the internet. We use the open data sets that are published and train across those. And I’d say that’s something that 100% of people do. We weren’t pucky.[7]）

在上揭加州訴訟中，Midjourney、Stability AI均主張其利用訓練模型的資料，是來自大量的公共資料集，包括來自網路和社交媒體的圖像。首先須釐清的是，公開網路上的圖像是否沒有著作權？答案為否，著作人對於其完成的著作，均有著作權，不論是他發布在公開網站上、或是發布在非公開的場合。

但他人是否可以或如何利用公開網站上的圖片，就要看著作人是否有授權他人利用。依據Pinterest的商業使用條款[8]，圖片著作人是授予Pinterest和其他的用戶非專屬、免權利金、可轉讓、可再授權、全球性的授權，去使用、儲存、展示、複製、保存、修改、創作衍生作品，並在主要是為了運作、開發、提供和使用Pinterest 服務的目的內使用內容，而所謂Pinterest服務目的，依照該使用條款，是圖片著作人允許Pinterest使用著作來履行其使命，「為人們帶來靈感，創造他們熱愛的生活」。依據Instagram的商業使用條款[9]，圖片著作人則授予Instagram非專屬、免權利金、可轉讓、可轉授權的全球授權，可以使用著作，但其他用戶則必須取得Instagram的書面同意，才能修改、創造衍生作品等。

依此，在過往似乎就他人是否可以直接利用公開網站上的圖片訓練人工智慧模型及如何使用，網站所有人在擬定商業使用條款時均未清楚著墨。但隨著創作人及圖片網站對於此爭議的關切，預計網站的使用條款也將如Getty Images使用條款[10]、Deviant Art使用條款[11]一般，開始清楚明訂網站圖片供機器學習、人工智慧模型訓練的規則。但另一個問題是，當人工智慧模型就如同Midjourney創辦人所講，所使用的公共資料圖庫集高達數十億筆的圖像時，創作人及（中小型）網站所有人又如何能辨識出他人訓練模型的圖庫包括其圖片／圖庫？

以AI方式創作，仿效他人的風格，不違法？

在上述藝術家所提出的訴訟中，藝術家主要訴求也包括：用AI模型產生的圖片，仿效他們的風格，導致造成藝術家經濟上的損失。

在使用Midjourney，其中最有趣的功能之一，就是可以以特定藝術家的風格來創作圖片。如：可以在提示中添加「以畫家梵谷的風格」、「以攝影家漢姆特．紐頓的風格」，AI模式就可以以該藝術家的風格產生圖片。

但著作權法保護藝術家的風格嗎？現行著作權法顯然並無保護藝術家的風格，其保護的是表達（expression）、及他人不得透過接觸藝術家的著作、而重製或改作該藝術家的著作。若是著作內容不同，只是風格相同或近似，除非有冒名原藝術家的情形，否則現行著作權法亦不會加以保護。

在學習繪畫時，大家通常會先透過模仿或臨摹的方式學習並創作，因此仿效他人的風格，顯然是非常普遍的現象，也不會被認定是侵害著作權的行為。而梵谷的真跡與市井小民模仿梵谷風格繪製的圖畫，即使完全相同，市場價值也是天壤之別，因此，藝術家主張用人工智慧模型仿效他人風格會造成藝術家經濟上的損失，或許為誇大之詞。但我們進一步思考，以前人透過模仿或臨摹學習並創作時，通常須購買或接觸原圖或特定藝術家的作品，但當人工智慧模型可以直接無償擷取特定藝術家的風格特徵、他人可以直接在提示中指明某特定藝術家的風格來產生圖片，此是否合理、公平？似乎也是一個值得繼續討論的議題。

由AI產生圖像的爭議，僅是一個開端，我們已經可以看到由AI產生文字、由AI產生語音、由AI產生音樂等種種爭議，如雨後春筍般地出現，而涉及的議題更多更廣，不僅包括著作權，更包括人格權、肖像權、個人資料等爭議。在希臘神話中，普羅米修斯為了讓人類獲得光明，從太陽神阿波羅處盜走火種，人類文明因而開始發展，後宙斯神又降下暴雨，用洪水滅絕人類，人工智慧對人類究竟是火種還是洪水，實尚需待人類的智慧解決。

本文內容純屬筆者個人意見，並不代表TWNIC立場

[1] Kelly McKernan、Karla Ortiz和Sarah Andersen v. Stability AI, Inc., etc., 3:23-cv-00201-WHO。

[2] Getty Images (US), Inc. v. Stability AI, Inc., 1:23-cv-00135-GBW。

[3] 參見Stability AI於其加州訴訟中於2023年4月18日提起之訴狀第一頁。

[4] https://zh.wikipedia.org/zh-tw/Stable_Diffusion (last visited on Oct 1, 2023)

[5] 參見著作權法第3條第1項第5款。

[6] 參見著作權法第3條第1項第11款。

[7] https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the-creative-economy/?sh=4d91ec5d2d2b

[8] https://business.pinterest.com/business-terms-of-service/

[9] https://help.instagram.com/581066165581870

[10] https://www.gettyimages.com/eula

[11] https://www.deviantart.com/about/policy/service