︿
Top

AI與畫家智財訴訟案例系列3:美國畫家告Midjourney生成式AI工具著作侵權案 --原告首戰程序判決吞敗

瀏覽次數:3137| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 陳家駿 發表於 2024年3月8日
facebook twitter wechat twitter

圖、AI與畫家智財訴訟案例系列3 美國畫家告Midjourney生成式AI工具著作侵權案 --原告首戰程序判決吞敗

自ChatGPT崛起造就AIGC (AI Generated Content)的百花齊放,導致許多新創公司站在AI浪尖上聲名大噪,像Midjourney和Stability AI推出的穩定擴散(Stable Diffusion)圖像生成(還有OpenAI的DALL-E),可讓使用者以文生圖、以圖生圖,自動產生媲美專業畫家的圖像,讓Midjourney夯到不行,是目前業界頂尖的龍頭代表。

但也正因太火而產生智財爭議訴訟,美國三位藝術家對Stability AI、DeviantArt和Midjourney所開發之生成式AI工具,於2023年1月向北加州聯邦地院提告著作侵權 [1],而各被告都提出駁回原告起訴之動議(motion to dismiss,被告於案發初始階段,主動要求法院直接駁回起訴,目的在省卻曠日費時之冗長程序,如成功即可提早終結官司),業經法院於2023年10月底,做成中間判決性質之程序裁定。本刊前已介紹Stability AI和DeviantArt部分,本文續對Midjourney進行分析。

本案涉及之Midjourney產品
Midjourney公司總部位於舊金山,其於2022年7月推出的Midjourney產品,初期以測試版形式問世隨後轉型為商業產品。Midjourney的AI工具能根據文本提示(prompt)生成專業水準的圖像。起初是在Discord社群建立機器人,隨後快速轉向商業應用,短短半年內吸引超過千萬付費註冊帳戶,成為引人矚目年營收達1億美元的企業(但這家傳奇性的公司正式員工僅11人)。

原告聲稱,Midjourney產品是一款線上AI圖像生成器,透過不同迭代版本使用穩定擴散技術,根據文本提示生成圖像。目前版本是在圖像子集上使用穩定擴散進行訓練,該圖像產生器以文本提示輸入,生成數位圖像輸出,係完全依賴穩定擴散作為其生成圖像的基礎軟體引擎,再向網路聊天系統Discord的線上使用者及透過應用程式之提供來收費。Midjourney的執行長曾表示,該公司使用大型開放數據集,已「暗示」使用LAION數據集進行訓練,2022年8月Midjourney發布使用穩定擴散之測試版。

本案涉及之擴散技術原理
原告起訴狀指出,「擴散」(diffusion)是一種特定機器學習應用的模型技術,以軟體生成與訓練數據中圖像相似之輸出圖像,該模型存儲訓練數據集中每個項目的壓縮副本。此擴散技術係由史丹佛大學Jascha Sohl-Dickstein領導的一組研究人員於2015年發明,並在其論文中介紹「使用非平衡熱力學(Nonequilibrium Thermodynamics)的深度非監督式學習 (Deep Unsupervised Learning)」,該技術可應用於任何類型的數據,但該論文是集中在數位圖像之應用。

擴散分二個階段進行,第一階段是攝取圖像,並透過系列步驟逐漸向其添加更多雜訊(noise即噪聲,指看到的而非聽到的東西,係混亂和無結構的隨機波動(random fluctuations)),在每個步驟中,程式會添加噪聲(addition of noise,即「加噪」)來改變圖像;到最後一步驟,圖像已經「擴散」成本質上隨機式的噪聲(random noise)。第二階段與第一階段相似但次序相反,透過眾多步驟將特定圖像變成噪聲的過程後再回溯運行,亦即,將隨機噪聲以相反順序應用這些步驟,隨著逐漸去除噪聲數據(denoises,即「去噪」),程式最終還原重新組合成該原來之圖像。起訴狀中摘自Sohl-Dickstein論文,使用螺旋圖像作為訓練數據說明擴散過程的二個階段如下圖。

圖、使用螺旋圖像作為訓練數據說明擴散過程的二個階段
 
第一行(藍色螺旋)從左到右讀取,描繪擴散第一階段,噪音逐漸添加到螺旋圖像中(其未顯示當中的每個步驟)。中間的圖像顯示擴散過程中途的螺旋,最右邊的圖像顯示擴散過程結束- - 螺旋變成一隨機噪聲場域。

第二行(紅色螺旋)從右到左讀取顯示相反過程:隨機噪聲(最右邊的圖像)逐漸取消擴散,透過反轉第一階段學習步驟的次序來「去噪」。中間的圖像顯示中途點(halfway point)的去噪過程,第二行最左邊的圖像,顯示去噪過程的最終結果:原始螺旋再次回復出現。

原告指控被告之AI生成工具,即以上述運作方式複製其著作權圖像來自動生成侵權圖像。

原告對Midjourney直接侵權之指控
原告指控:Midjourney的訂閱者可透過造訪其Web應用程式,然而問題在於,它是依賴盜用藝術家創作之數百萬張圖像,並將這些圖像用作訓練圖像,因此是從他人受著作權保護的作品中,重新混合組裝和拼貼產生侵權圖像。當被問及Midjourney如何使用數據集時,Midjourney的執行長僅回答:「這是網路上的一個大規模掃描,我們使用已發布的開放數據集進行訓練。」

原告針對Midjourney的直接侵權理論為:
(1) 透過抓取(即複製)受保護的作品,用於為Midjourney產品訓練圖像所製作出圖像,而構成直接侵權;
(2) 透過發行包含訓練圖像壓縮副本的穩定擴散,作為Midjourney產品的一部分而構成直接侵權;
(3) 透過製作和發行Midjourney產品而構成直接侵權,該Midjourney產品本身就是侵權之衍生作品;
(4) 生成並發行屬於侵權衍生作品的輸出圖像。

針對原告指控Midjourney工具訓練數據集用來輸出圖像,包含接受訓練之受著作權保護作品的壓縮副本,但Midjourney反駁這是不合理而難以置信的,因為50億張圖像龐大,不可能被壓縮到一個可執行的程式。針對第一個理論,與關於同案被告Stability AI在LAION中的角色,以及Stability AI抓取然後在穩定擴散中,使用訓練圖像做聯繫的詳細指控不同請參本刊:美國畫家控告Stability AI生成式AI工具著作侵權之程序判決出爐,原告對於Midjourney為其品進行哪些訓練,竟然並無任何事實之陳述。唯一提及的是Midjourney首席執行官的評論,即Midjourney是使用開放數據集(原告假設這些數據集來自LAION),並且在這些數據集上進行訓練。然而,原告宣稱Midjourney所使用穩定擴散之方式,如:「穩定擴散已在多個程式中被用作軟體庫(software library),包括Midjourney產品」;「作品是指用於訓練任何穩定擴散版本的任何圖像,該圖像由被告直接提供或合併到另一個產品中」云云。

北加州地院對直接侵權之程序裁定
但法院認為以上說法,就原告究竟是基於Midjourney使用穩定擴散,還是基於Midjourney自己獨立使用訓練圖像來訓練產品,還是二者兼而有之?其主張都太含混不明需要澄清。因此,法院認為原告對Midjourney的直接侵權指控不夠清楚,原告也未提供事實說明Midjourney對其AI平台進行哪些訓練,因此在缺乏事實的情況下,法院無法確定Midjourney是否不當使用原告受著作權保護的圖像。另外,原告對Midjourney的衍生作品責任理論也有缺陷,原因與法院在討論DeviantArt案時所指出的原因相同請參本刊:美國畫家控告DeviantArt生成式AI著作侵權首輪程序判決被告占上風。據此,法院核准Midjourney所聲請駁回直接侵權的動議,但允許原告可予以修改(with leave to amend)。

法院進而表示,原告除應添加被告產品使用受著作權保護之壓縮副本的事實外,Midjourney將來可能會對直接侵權主張進行更針對性的攻擊。例如,不清楚的是,穩定擴散是否僅包括可應用於建立圖像的演算法和指令,而這些圖像只含有受著作權保護之訓練圖像的一小部分元素(a few elements);當Midjourney僅透過其應用程式和網站,將穩定擴散作為「文庫」(library)提供客戶使用時,其為何需要負直接侵權之責?凡此種種法院都認為不確定。然而,法院並未完全排除原告可辯護這一指控的可能性,特別指出原告如能合理地主張,被告的AI產品可讓使用者,透過引用原告姓名的作品來創作新作品,以及原告受保護的內容究竟係如何、以及有多少留在穩定擴散中被AI最終產品所使用的,則其立論可能會更堅強。

原告對Midjourney代理侵權之指控
原告指控,使用者透過被告AI圖像工具,輸入原告姓名後就會產生冒充藝術家原作的圖像,這些使用者可謂是「冒名頂替者」,而其依賴藝術家的原作品,輸入含有特定藝術家姓名的提示回應,所產生的冒充圖像就是「偽造品」。因此,被告應知悉其AI工具的功能容易用來生成偽造品。冒名頂替者出售偽造品使原告因受損,因而被告從AI工具中,直接或間接地從冒名頂替者的侵權行為中獲利,故其應對第三者的侵權行為,承擔代理侵權(vicarious infringement)責任。

但法院認為,法律上要對代理侵權行為負著作侵權責任,原告必須指控被告(1)擁有監督侵權行為的權利和能力(right and ability to supervise),以及(2)在侵權活動中獲具有直接的經濟利益。參Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d 788, 802 (9th Cir. 2007)。但問題在於,本案原告針對三位被告之起訴,無分軒輊地將其看成一體、籠統指控其全都構成代理侵權,但具體上哪個被告基於第三人的何種行為,得以構成代理侵權卻並未明確指出,且其起訴狀中對不同被告間無區別的指控,常將三位被告混為一談,難以釐清每個被告究竟誰實際從事何項確切行為,導致法律上可造成間接侵害,完全混淆不明。

Midjourney因而抗辯,原告指控其代理責任之主張應被駁回,因為依Sound & Color, LLC v. Smith案例,No. 222CV01508ABASX, 2023 WL 2821881, at *16 (C.D. Cal. Feb. 28, 2023),被告不能對自己的直接侵權,承擔間接侵權中之次級責任(secondary liability)。因而,當使用被告的生成式AI產品構成侵權時,只有在對每個被告提出的直接侵權主張充分表達後,法院才能確定,原告是試圖讓被告對自己的直接侵權承擔次級侵權之代理責任,還是讓被告對他人使用其產品的直接侵權來負間接侵權之責,凡此,原告之主張都含糊不清應被駁回。

北加州地院對代理侵權之程序裁定
法院認為,原告基於「冒名頂替者」使用被告工具產生「偽造品」的代理侵權主張,還存有其他重要問題。因原告的訴狀中未能指控,被告以原告作品製作出基於該作品實際存在的「偽造品」為何。反之,原告自己起訴狀中還承認:「根據擴散過程的運作原理,一般而言,對於特定文本指令提示所回應產生由穩定擴散輸出的圖像,不太可能與訓練數據中的任何特定圖像相匹配而近似(close match)」。亦即原告無法舉出被告AI工具,能生成任何「實際上」與其構成相同或近似的「偽造品。可見得,原告已不依賴具體作品之實質相似理論,只能轉而攻擊所有輸出圖像都是衍生侵權作品,然後再補充指控:被告輸出圖像與原告畫作的「風格」(in the styles)或藝術認同(artistic identities)相似關於風格相似是否侵權請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲?-- 圖形影像篇」,以至於亦構成「偽造品」。

由於原告並未能對Midjourney提出充分之直接侵權的主張,而有待之後的修改,則法律上即無從對其提起代理侵權的主張,因為代理責任需要直接侵權行為存在做為基礎。參見 Perfect 10, Inc. v. Yandex N.V., 962 F.Supp.2d 1146, 1158 (N.D. Cal. 2013), as amended (Sept. 6, 2013)。法院指出,由於原告未能釋明被告AI平台,如何被第三方以侵權方式使用,以致該代理侵權之主張仍存有缺陷。因此,針對原告指控代理侵權之主張被法院駁回,但法官也網開一面,允許原告進行修正以澄清其理論。

法院特別要求原告修正其理論時,針對這些副本如何在提供給第三方的Midjourney產品中,以違反著作權法保護權利的方式呈現、存在或引用,原告必須提供明確和合理的指控,敘明Midjourney對其產品被第三方使用而承擔代理責任的情況。例如,就他人使用被告AI工具生成偽造品時,被告為何因此會間接侵權而產生代理責任。此外,法院還提醒原告修改時,應列出每個被告就其所從事的行為詳細陳述,而不能再將所有的「被告」混為一談。

此外,Midjourney在其動議聲請中力爭,不應允許原告就其依著作權法中,所規定的表演權之違反請求提出修正,因為在圖畫作品中不存在所謂之表演權,且原告在反對意見中未反對Midjourney之駁回聲請。而庭審中,原告請求允許保留其表演侵權理論之指控,法院雖允許但也明示,在接下來可能的駁回動議中,法院將不會像在這一輪那樣慷慨地允許修正,法院希望對每項指控及支持指控的每個被告行為,提供更具體的資訊。

本案原告提交修改後之起訴狀
為回應法院的糾正,原告於2023年11月底提交修改的起訴狀,但已和與原來起訴大相逕庭,增加七名新的個人原告和一名被告:Runway AI(另一家生成式AI工具公司),原告重新架構新的主張,刪除著作代理侵權指控(vicarious copyright infringement claim),代之以著作誘導侵權請求(inducement of copyright infringement claim);還刪除公開權(right of publicity)和不公平競爭之請求,並添加二項商標法《蘭納姆法Lanham Act》請求 - - 虛假認可(false endorsement) [2]和替代理企業外觀侵權(vicarious trade-dress infringement)。修改後的起訴書,還提供有關原告聲稱穩定擴散包含「壓縮副本」或「受保護表達內容」的更多細節,並提供學術論文和Stability AI人員的引用,聲稱這些內容支持原告主張,即模型包含受著作權保護的表達。

結論一 - - AI擴散模型對著作侵權認定帶來新的挑戰
最後,就法院對本案三位被告所下的程序判決,總結一些觀點。

擴散模型在圖像、視頻和語音生成領域受到廣泛應用,其技術原理如前述,就是將一副畫慢慢透過高斯噪聲(Gaussian noise),逐步以添加雜訊方式消除該畫面中的細節(即加噪),使原來清晰的圖畫一直拆解到最後變成純噪聲,而無法辨識原圖案的情況,然後再逆向操作這種分解過程,由後向前回溯慢慢再透過去除雜訊方式(即降噪或去噪),逐漸導引還原為當初原始清晰的圖案,運行這種反向操作過程,AI就會掌握所有雜訊的特徵,透過訓練神經網絡完全掌握畫作中的所有相關數據,從而可任意自噪聲中合成數據,畫出任何所需要的圖像,因為所有資訊特徵都已被AI提取而盡入其囊中。

但也因此,所畫出的東西可能會與原作不相同,但卻又可能保留原畫中一些風格上的相似,本案擴散模型的運用,就是產生看似不同但風格相近的圖案,除了訓練過程中進行之中間複製外,也會涉及著作權另二項核心議題 -- 1. 風格上相似是否可能構成實質相似而侵權;2. 此種擴散模型被告可否主張構成合理使用而不侵權。

換言之,和傳統著作侵權類型大相逕庭,因為AI運作下之生成創作,已產生新興科技所帶來前所未見的衝擊,因此如何舊酒裝新瓶是一大挑戰,尚待法院進一步認定。然而對業界言,著作權法在被修改前,仍必須按照既有遊戲規則,因此設計AI工具就不能出於僥倖,而應注意如何在過程中多布幾道防線避免踩到侵權地雷。反過來看,如被告能針對新興科技之應用,創造出符合公共利益促進人類福祉的「轉化性的合理使用」(Transformative Fair Use),依美國過去如第二巡迴上訴法院Authors Guild v. Google, Inc.最高法院Google v. Oracle America案,仍可能豁免於侵權,但究竟是否可以構成,業者必須要有足夠睿智來判斷以免承擔法律責任請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲?-- 圖形影像篇」。

結論二 - - 北加州地院連續二個AI官司原告都踢到鐵板
值得觀察的是本案之後,同樣北加州地院針對生成式AI的著作侵權案Kadrey, Silverman & Golden v. Meta Platforms, Inc.請參本刊:美國作家集體訴訟控告Meta生成式AI工具LLaMA著作侵權之程序判決出爐,原告第一回合程序上也吃了敗仗。

這二案原告之所以首戰皆鎩羽而歸,似乎犯了一些錯誤!例如著作權登記,一般作者可能不會每完成一件作品後都去登記,但當決定起訴時,此基本前提應妥善準備。本案三位原告的畫作眾多,但最終卻只有其中一位的16幅畫適格作為審理依據!其次,本案原告起訴狀中雖洋洋灑灑,卻未詳細說明每一被告究竟何處又如何構成侵權?其具體行為如何?針對三位被告的侵權說明含混不清,由此可見,對他人起訴確不容易。

本案程序判決中法院似想要釐清:被告可否區分為:參與抓取、複製和使用受著作權保護的作品,來訓練AI模型的公司像Stability;以及將擴散模型程式整合到自己產品中,但卻未參與抓取、複製經註冊訓練圖像的公司像DeviantArt和Midjourney;抑或是該後二者也實際參與複製等行為(此皆待釐清);再來則是,此三者法律上為何可能構成間接侵權,凡此種種,應是嗣後任何生成式AI侵權訴訟所必須面對的重要課題。

最後要強調的是,AI新興科技所衍生的侵權態樣,和傳統的型態雖有不同!但即便如此,傳統訴訟所要求的舉證方式,並不會因為是AI而有所改變。換言之,原告起訴必須具體說明被告究竟產出何種作品,侵害原告哪些著作的哪些內容,而且在原作和侵權品之間,需建構實質相似性,這是所有著作侵權案件的鐵律,原告不應誤以為在AI的浪潮下,可繞道避開這方面的舉證!當然,如原告在起訴狀中所提,被告生成式AI產出的圖像,不會和原告原來畫作相似,則原告只能將焦點置於訓練過程中的大量複製行為,但此仍取決於最終生成結果是否屬於合理使用,如肯定則該過程中的複製亦不構成侵權!(6160字;圖2)

作者資訊:
陳家駿律師  台灣資訊智慧財產權協會理事長 
 


註解:  

[1] 除了著作權侵害、違反《數位千禧年著作權法》刪除著作權管理資訊(CMI: copyright management information)之外,原告還對被告提告:違反實定法的公開/肖像權(Statutory Right of Publicity);違反普通法之公開/形像權(Common Law Right of Publicity);不公平競爭;確認性救濟(declaratory relief)。形象權被看成是一種個人身分或人格權,目的在防止為了商業利益而盜用個人的姓名、肖像或其他個人身分標記(例如暱稱、筆名、聲音、簽名、肖像或照片),聯邦法無此規範而係源普通法。參INTA, https://www.inta.org/topics/right-of-publicity/

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。