AI與畫家智財訴訟案例系列3：美國畫家告Midjourney生成式AI工具著作侵權案 --原告首戰程序判決吞敗

關鍵字：()；；；()；；；；；；；；()；()；

瀏覽次數：6927｜歡迎推文：

科技產業資訊室(iKnow) - 陳家駿發表於 2024年3月8日

圖、AI與畫家智財訴訟案例系列3 美國畫家告Midjourney生成式AI工具著作侵權案 --原告首戰程序判決吞敗

自ChatGPT崛起造就AIGC (AI Generated Content)的百花齊放，導致許多新創公司站在AI浪尖上聲名大噪，像Midjourney和Stability AI推出的穩定擴散(Stable Diffusion)圖像生成（還有OpenAI的DALL-E），可讓使用者以文生圖、以圖生圖，自動產生媲美專業畫家的圖像，讓Midjourney夯到不行，是目前業界頂尖的龍頭代表。

但也正因太火而產生智財爭議訴訟，美國三位藝術家對Stability AI、DeviantArt和Midjourney所開發之生成式AI工具，於2023年1月向北加州聯邦地院提告著作侵權 [1]，而各被告都提出駁回原告起訴之動議（motion to dismiss，被告於案發初始階段，主動要求法院直接駁回起訴，目的在省卻曠日費時之冗長程序，如成功即可提早終結官司），業經法院於2023年10月底，做成中間判決性質之程序裁定。本刊前已介紹Stability AI和DeviantArt部分，本文續對Midjourney進行分析。

本案涉及之Midjourney產品
Midjourney公司總部位於舊金山，其於2022年7月推出的Midjourney產品，初期以測試版形式問世隨後轉型為商業產品。Midjourney的AI工具能根據文本提示(prompt)生成專業水準的圖像。起初是在Discord社群建立機器人，隨後快速轉向商業應用，短短半年內吸引超過千萬付費註冊帳戶，成為引人矚目年營收達1億美元的企業（但這家傳奇性的公司正式員工僅11人）。

原告聲稱，Midjourney產品是一款線上AI圖像生成器，透過不同迭代版本使用穩定擴散技術，根據文本提示生成圖像。目前版本是在圖像子集上使用穩定擴散進行訓練，該圖像產生器以文本提示輸入，生成數位圖像輸出，係完全依賴穩定擴散作為其生成圖像的基礎軟體引擎，再向網路聊天系統Discord的線上使用者及透過應用程式之提供來收費。Midjourney的執行長曾表示，該公司使用大型開放數據集，已「暗示」使用LAION數據集進行訓練，2022年8月Midjourney發布使用穩定擴散之測試版。

本案涉及之擴散技術原理
原告起訴狀指出，「擴散」(diffusion)是一種特定機器學習應用的模型技術，以軟體生成與訓練數據中圖像相似之輸出圖像，該模型存儲訓練數據集中每個項目的壓縮副本。此擴散技術係由史丹佛大學Jascha Sohl-Dickstein領導的一組研究人員於2015年發明，並在其論文中介紹「使用非平衡熱力學(Nonequilibrium Thermodynamics)的深度非監督式學習 (Deep Unsupervised Learning)」，該技術可應用於任何類型的數據，但該論文是集中在數位圖像之應用。

擴散分二個階段進行，第一階段是攝取圖像，並透過系列步驟逐漸向其添加更多雜訊（noise即噪聲，指看到的而非聽到的東西，係混亂和無結構的隨機波動(random fluctuations)），在每個步驟中，程式會添加噪聲（addition of noise，即「加噪」）來改變圖像；到最後一步驟，圖像已經「擴散」成本質上隨機式的噪聲(random noise)。第二階段與第一階段相似但次序相反，透過眾多步驟將特定圖像變成噪聲的過程後再回溯運行，亦即，將隨機噪聲以相反順序應用這些步驟，隨著逐漸去除噪聲數據（denoises，即「去噪」），程式最終還原重新組合成該原來之圖像。起訴狀中摘自Sohl-Dickstein論文，使用螺旋圖像作為訓練數據說明擴散過程的二個階段如下圖。

圖、使用螺旋圖像作為訓練數據說明擴散過程的二個階段

第一行（藍色螺旋）從左到右讀取，描繪擴散第一階段，噪音逐漸添加到螺旋圖像中(其未顯示當中的每個步驟)。中間的圖像顯示擴散過程中途的螺旋，最右邊的圖像顯示擴散過程結束- - 螺旋變成一隨機噪聲場域。

第二行（紅色螺旋）從右到左讀取顯示相反過程：隨機噪聲（最右邊的圖像）逐漸取消擴散，透過反轉第一階段學習步驟的次序來「去噪」。中間的圖像顯示中途點(halfway point)的去噪過程，第二行最左邊的圖像，顯示去噪過程的最終結果：原始螺旋再次回復出現。

原告指控被告之AI生成工具，即以上述運作方式複製其著作權圖像來自動生成侵權圖像。

原告對Midjourney直接侵權之指控
原告指控：Midjourney的訂閱者可透過造訪其Web應用程式，然而問題在於，它是依賴盜用藝術家創作之數百萬張圖像，並將這些圖像用作訓練圖像，因此是從他人受著作權保護的作品中，重新混合組裝和拼貼產生侵權圖像。當被問及Midjourney如何使用數據集時，Midjourney的執行長僅回答：「這是網路上的一個大規模掃描，我們使用已發布的開放數據集進行訓練。」

原告針對Midjourney的直接侵權理論為：
(1) 透過抓取（即複製）受保護的作品，用於為Midjourney產品訓練圖像所製作出圖像，而構成直接侵權；
(2) 透過發行包含訓練圖像壓縮副本的穩定擴散，作為Midjourney產品的一部分而構成直接侵權；
(3) 透過製作和發行Midjourney產品而構成直接侵權，該Midjourney產品本身就是侵權之衍生作品；
(4) 生成並發行屬於侵權衍生作品的輸出圖像。

針對原告指控Midjourney工具訓練數據集用來輸出圖像，包含接受訓練之受著作權保護作品的壓縮副本，但Midjourney反駁這是不合理而難以置信的，因為50億張圖像龐大，不可能被壓縮到一個可執行的程式。針對第一個理論，與關於同案被告Stability AI在LAION中的角色，以及Stability AI抓取然後在穩定擴散中，使用訓練圖像做聯繫的詳細指控不同請參本刊：美國畫家控告Stability AI生成式AI工具著作侵權之程序判決出爐，原告對於Midjourney為其品進行哪些訓練，竟然並無任何事實之陳述。唯一提及的是Midjourney首席執行官的評論，即Midjourney是使用開放數據集（原告假設這些數據集來自LAION），並且在這些數據集上進行訓練。然而，原告宣稱Midjourney所使用穩定擴散之方式，如：「穩定擴散已在多個程式中被用作軟體庫(software library)，包括Midjourney產品」；「作品是指用於訓練任何穩定擴散版本的任何圖像，該圖像由被告直接提供或合併到另一個產品中」云云。

北加州地院對直接侵權之程序裁定
但法院認為以上說法，就原告究竟是基於Midjourney使用穩定擴散，還是基於Midjourney自己獨立使用訓練圖像來訓練產品，還是二者兼而有之？其主張都太含混不明需要澄清。因此，法院認為原告對Midjourney的直接侵權指控不夠清楚，原告也未提供事實說明Midjourney對其AI平台進行哪些訓練，因此在缺乏事實的情況下，法院無法確定Midjourney是否不當使用原告受著作權保護的圖像。另外，原告對Midjourney的衍生作品責任理論也有缺陷，原因與法院在討論DeviantArt案時所指出的原因相同請參本刊：美國畫家控告DeviantArt生成式AI著作侵權首輪程序判決被告占上風。據此，法院核准Midjourney所聲請駁回直接侵權的動議，但允許原告可予以修改(with leave to amend)。

法院進而表示，原告除應添加被告產品使用受著作權保護之壓縮副本的事實外，Midjourney將來可能會對直接侵權主張進行更針對性的攻擊。例如，不清楚的是，穩定擴散是否僅包括可應用於建立圖像的演算法和指令，而這些圖像只含有受著作權保護之訓練圖像的一小部分元素(a few elements)；當Midjourney僅透過其應用程式和網站，將穩定擴散作為「文庫」(library)提供客戶使用時，其為何需要負直接侵權之責？凡此種種法院都認為不確定。然而，法院並未完全排除原告可辯護這一指控的可能性，特別指出原告如能合理地主張，被告的AI產品可讓使用者，透過引用原告姓名的作品來創作新作品，以及原告受保護的內容究竟係如何、以及有多少留在穩定擴散中被AI最終產品所使用的，則其立論可能會更堅強。

原告對Midjourney代理侵權之指控
原告指控，使用者透過被告AI圖像工具，輸入原告姓名後就會產生冒充藝術家原作的圖像，這些使用者可謂是「冒名頂替者」，而其依賴藝術家的原作品，輸入含有特定藝術家姓名的提示回應，所產生的冒充圖像就是「偽造品」。因此，被告應知悉其AI工具的功能容易用來生成偽造品。冒名頂替者出售偽造品使原告因受損，因而被告從AI工具中，直接或間接地從冒名頂替者的侵權行為中獲利，故其應對第三者的侵權行為，承擔代理侵權(vicarious infringement)責任。

但法院認為，法律上要對代理侵權行為負著作侵權責任，原告必須指控被告（1）擁有監督侵權行為的權利和能力(right and ability to supervise)，以及（2）在侵權活動中獲具有直接的經濟利益。參Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d 788, 802 (9th Cir. 2007)。但問題在於，本案原告針對三位被告之起訴，無分軒輊地將其看成一體、籠統指控其全都構成代理侵權，但具體上哪個被告基於第三人的何種行為，得以構成代理侵權卻並未明確指出，且其起訴狀中對不同被告間無區別的指控，常將三位被告混為一談，難以釐清每個被告究竟誰實際從事何項確切行為，導致法律上可造成間接侵害，完全混淆不明。

Midjourney因而抗辯，原告指控其代理責任之主張應被駁回，因為依Sound & Color, LLC v. Smith案例，No. 222CV01508ABASX, 2023 WL 2821881, at *16 (C.D. Cal. Feb. 28, 2023)，被告不能對自己的直接侵權，承擔間接侵權中之次級責任(secondary liability)。因而，當使用被告的生成式AI產品構成侵權時，只有在對每個被告提出的直接侵權主張充分表達後，法院才能確定，原告是試圖讓被告對自己的直接侵權承擔次級侵權之代理責任，還是讓被告對他人使用其產品的直接侵權來負間接侵權之責，凡此，原告之主張都含糊不清應被駁回。

北加州地院對代理侵權之程序裁定
法院認為，原告基於「冒名頂替者」使用被告工具產生「偽造品」的代理侵權主張，還存有其他重要問題。因原告的訴狀中未能指控，被告以原告作品製作出基於該作品實際存在的「偽造品」為何。反之，原告自己起訴狀中還承認：「根據擴散過程的運作原理，一般而言，對於特定文本指令提示所回應產生由穩定擴散輸出的圖像，不太可能與訓練數據中的任何特定圖像相匹配而近似(close match)」。亦即原告無法舉出被告AI工具，能生成任何「實際上」與其構成相同或近似的「偽造品。可見得，原告已不依賴具體作品之實質相似理論，只能轉而攻擊所有輸出圖像都是衍生侵權作品，然後再補充指控：被告輸出圖像與原告畫作的「風格」(in the styles)或藝術認同(artistic identities)相似關於風格相似是否侵權請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲？-- 圖形影像篇」，以至於亦構成「偽造品」。

由於原告並未能對Midjourney提出充分之直接侵權的主張，而有待之後的修改，則法律上即無從對其提起代理侵權的主張，因為代理責任需要直接侵權行為存在做為基礎。參見 Perfect 10, Inc. v. Yandex N.V., 962 F.Supp.2d 1146, 1158 (N.D. Cal. 2013), as amended (Sept. 6, 2013)。法院指出，由於原告未能釋明被告AI平台，如何被第三方以侵權方式使用，以致該代理侵權之主張仍存有缺陷。因此，針對原告指控代理侵權之主張被法院駁回，但法官也網開一面，允許原告進行修正以澄清其理論。

法院特別要求原告修正其理論時，針對這些副本如何在提供給第三方的Midjourney產品中，以違反著作權法保護權利的方式呈現、存在或引用，原告必須提供明確和合理的指控，敘明Midjourney對其產品被第三方使用而承擔代理責任的情況。例如，就他人使用被告AI工具生成偽造品時，被告為何因此會間接侵權而產生代理責任。此外，法院還提醒原告修改時，應列出每個被告就其所從事的行為詳細陳述，而不能再將所有的「被告」混為一談。

此外，Midjourney在其動議聲請中力爭，不應允許原告就其依著作權法中，所規定的表演權之違反請求提出修正，因為在圖畫作品中不存在所謂之表演權，且原告在反對意見中未反對Midjourney之駁回聲請。而庭審中，原告請求允許保留其表演侵權理論之指控，法院雖允許但也明示，在接下來可能的駁回動議中，法院將不會像在這一輪那樣慷慨地允許修正，法院希望對每項指控及支持指控的每個被告行為，提供更具體的資訊。

本案原告提交修改後之起訴狀
為回應法院的糾正，原告於2023年11月底提交修改的起訴狀，但已和與原來起訴大相逕庭，增加七名新的個人原告和一名被告：Runway AI（另一家生成式AI工具公司），原告重新架構新的主張，刪除著作代理侵權指控(vicarious copyright infringement claim)，代之以著作誘導侵權請求(inducement of copyright infringement claim)；還刪除公開權(right of publicity)和不公平競爭之請求，並添加二項商標法《蘭納姆法Lanham Act》請求 - - 虛假認可(false endorsement) [2]和替代理企業外觀侵權(vicarious trade-dress infringement)。修改後的起訴書，還提供有關原告聲稱穩定擴散包含「壓縮副本」或「受保護表達內容」的更多細節，並提供學術論文和Stability AI人員的引用，聲稱這些內容支持原告主張，即模型包含受著作權保護的表達。

結論一 - - AI擴散模型對著作侵權認定帶來新的挑戰
最後，就法院對本案三位被告所下的程序判決，總結一些觀點。

擴散模型在圖像、視頻和語音生成領域受到廣泛應用，其技術原理如前述，就是將一副畫慢慢透過高斯噪聲(Gaussian noise)，逐步以添加雜訊方式消除該畫面中的細節（即加噪），使原來清晰的圖畫一直拆解到最後變成純噪聲，而無法辨識原圖案的情況，然後再逆向操作這種分解過程，由後向前回溯慢慢再透過去除雜訊方式（即降噪或去噪），逐漸導引還原為當初原始清晰的圖案，運行這種反向操作過程，AI就會掌握所有雜訊的特徵，透過訓練神經網絡完全掌握畫作中的所有相關數據，從而可任意自噪聲中合成數據，畫出任何所需要的圖像，因為所有資訊特徵都已被AI提取而盡入其囊中。

但也因此，所畫出的東西可能會與原作不相同，但卻又可能保留原畫中一些風格上的相似，本案擴散模型的運用，就是產生看似不同但風格相近的圖案，除了訓練過程中進行之中間複製外，也會涉及著作權另二項核心議題 -- 1. 風格上相似是否可能構成實質相似而侵權；2. 此種擴散模型被告可否主張構成合理使用而不侵權。

換言之，和傳統著作侵權類型大相逕庭，因為AI運作下之生成創作，已產生新興科技所帶來前所未見的衝擊，因此如何舊酒裝新瓶是一大挑戰，尚待法院進一步認定。然而對業界言，著作權法在被修改前，仍必須按照既有遊戲規則，因此設計AI工具就不能出於僥倖，而應注意如何在過程中多布幾道防線避免踩到侵權地雷。反過來看，如被告能針對新興科技之應用，創造出符合公共利益促進人類福祉的「轉化性的合理使用」(Transformative Fair Use)，依美國過去如第二巡迴上訴法院Authors Guild v. Google, Inc.案、最高法院Google v. Oracle America案，仍可能豁免於侵權，但究竟是否可以構成，業者必須要有足夠睿智來判斷以免承擔法律責任請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲？-- 圖形影像篇」。

結論二 - - 北加州地院連續二個AI官司原告都踢到鐵板
值得觀察的是本案之後，同樣北加州地院針對生成式AI的著作侵權案Kadrey, Silverman & Golden v. Meta Platforms, Inc.請參本刊：美國作家集體訴訟控告Meta生成式AI工具LLaMA著作侵權之程序判決出爐，原告第一回合程序上也吃了敗仗。

這二案原告之所以首戰皆鎩羽而歸，似乎犯了一些錯誤！例如著作權登記，一般作者可能不會每完成一件作品後都去登記，但當決定起訴時，此基本前提應妥善準備。本案三位原告的畫作眾多，但最終卻只有其中一位的16幅畫適格作為審理依據！其次，本案原告起訴狀中雖洋洋灑灑，卻未詳細說明每一被告究竟何處又如何構成侵權？其具體行為如何？針對三位被告的侵權說明含混不清，由此可見，對他人起訴確不容易。

本案程序判決中法院似想要釐清：被告可否區分為：參與抓取、複製和使用受著作權保護的作品，來訓練AI模型的公司像Stability；以及將擴散模型程式整合到自己產品中，但卻未參與抓取、複製經註冊訓練圖像的公司像DeviantArt和Midjourney；抑或是該後二者也實際參與複製等行為（此皆待釐清）；再來則是，此三者法律上為何可能構成間接侵權，凡此種種，應是嗣後任何生成式AI侵權訴訟所必須面對的重要課題。

最後要強調的是，AI新興科技所衍生的侵權態樣，和傳統的型態雖有不同！但即便如此，傳統訴訟所要求的舉證方式，並不會因為是AI而有所改變。換言之，原告起訴必須具體說明被告究竟產出何種作品，侵害原告哪些著作的哪些內容，而且在原作和侵權品之間，需建構實質相似性，這是所有著作侵權案件的鐵律，原告不應誤以為在AI的浪潮下，可繞道避開這方面的舉證！當然，如原告在起訴狀中所提，被告生成式AI產出的圖像，不會和原告原來畫作相似，則原告只能將焦點置於訓練過程中的大量複製行為，但此仍取決於最終生成結果是否屬於合理使用，如肯定則該過程中的複製亦不構成侵權！(6160字；圖2)

作者資訊：
陳家駿律師台灣資訊智慧財產權協會理事長

註解：

[1] 除了著作權侵害、違反《數位千禧年著作權法》刪除著作權管理資訊(CMI: copyright management information)之外，原告還對被告提告：違反實定法的公開/肖像權(Statutory Right of Publicity)；違反普通法之公開/形像權(Common Law Right of Publicity)；不公平競爭；確認性救濟(declaratory relief)。形象權被看成是一種個人身分或人格權，目的在防止為了商業利益而盜用個人的姓名、肖像或其他個人身分標記（例如暱稱、筆名、聲音、簽名、肖像或照片），聯邦法無此規範而係源普通法。參INTA, https://www.inta.org/topics/right-of-publicity/

[2] 根據《蘭納姆法案》第 43(a)條，當個人的身分與一項產品或服務相連結，以致消費者可能誤以為該人支持或核可該產品或服務產生誤解時，就會發生虛假認可。 https://itlaw-fandom-com.translate.goog/wiki/False_endorsement?_x_tr_sl=en&_x_tr_tl=zh-TW&_x_tr_hl=zh-TW&_x_tr_pto=sc

參考資料：
Andersen et al v. Stability AI Ltd. et al, Docket No. 3:23-cv-00201 (N.D. Cal. Jan 13, 2023), Complaimt
Andersen et al v. Stability AI Ltd. et al, ORDER ON Motions to Dismiss and Strike
Tal Dickstein & Edward Delman, Andersen v. Stability AI Ltd., Oct. 30, 2023
Recent Rulings in AI Copyright Lawsuits Shed Some Light, but Leave Many Questions. PerkinsCoie, 2023/12/14.
Generative AI and Copyright Infringement: Federal Judge in Stability AI Distinguishes ‎‎Between AI Model Creators and Users – For Now. Locke Lord, 2023/11/28.

相關文章：
1. Cooler Master控告銀欣科技、保銳科技及深圳昂湃侵害CPU水冷散熱器相關專利
2. AI與畫家智財訴訟案例系列2：畫家控訴DeviantArt生成式AI著作侵權首輪程序判決被告占上風
3. AI與畫家智財訴訟案例系列1：美國畫家控告Stability生成式AI工具著作侵權之程序判決出爐
4. 蘋果手錶禁售的案例，讓Oura更關注三星智慧戒指是否侵權
5. USITC判定台積電未取得Daedalus Prime訴訟相關專利的授權，雙方和解結束相關訴訟
6. 智慧局112年12月智慧財產權統計

歡迎來粉絲團按讚！

--------------------------------------------------------------------------------------------------------------------------------------------