AI與畫家智財訴訟案例系列1：美國畫家控告Stability生成式AI工具著作侵權之程序判決出爐

關鍵字：()；；()；；()；()；()；

瀏覽次數：7647｜歡迎推文：

科技產業資訊室(iKnow) - 陳家駿發表於 2024年2月17日

圖、美國畫家控告Stability生成式AI工具著作侵權之程序判決出爐

ChatGPT於2022年底推出後，標誌著AI領域的一項重大突破。隨著ChatGPT 4.0問世，所有文字、圖形、影像、聲音、視頻和程式碼等各種內容，都能透過AI演算自動生成。然而，這一科技史上巨大進步也引起許多智財爭議，在科技最發達的美國，短短一年以來即發生多起生成式AI (Generative AI)著作侵權訴訟。這其中，最受人矚目的如開源碼、文字書籍和圖形影像等領域，是否構成著作侵權成為焦點。

由於圖形影像是人們工作、生活和娛樂中廣泛使用的工具，而AI自動生成圖像技術的應用，帶來與傳統著作權不同的爭議範疇。引起關注的案例之一是Andersen等三位藝術家，於2023年1月向北加州聯邦地院，對Stability AI、Midjourney和DeviantArt三家生成式AI工具公司，提起著作權侵害訴訟[1]，這三位被告都使用「穩定擴散」(Stable Diffusion)工具，它是Stability AI基於擴散模型生成圖像推出的AI產品，其將圖像生成引擎嵌入軟體中，包括由Stability AI公司開發的DreamStudio、Midjourney公司開發的Midjourney產品以及DeviantArt公司開發的DreamUp皆然。

被告隨即聲請「駁回起訴之動議」，北加州地院William Orrick法官於2023年10月底，對二造第一回合的交鋒，做出一項中間判決性質之程序裁定，成為就生成式AI挑戰在訴狀階段，第一位作出裁決的聯邦法官。法院駁回大部分原告的訴訟請求，僅一名畫家原告針對Stability AI 提出的直接侵權訴訟得以存續，但法院准許原告修改大部分之起訴內容(granted leave to amend the complaint)。雖然本案是以集體訴訟方式對三家公司起訴，但由於每個被告的行為事實略有不同，法院雖然合併在一個判決內處理，卻對三位被告的行為態樣，分別進行評價。因此，本文將先介紹共通部分，然後探討各別被告的爭議點，就法院對其中特別著墨之層面予以分析。

本案當事人與著作權註冊之爭議
本案三位原告Sarah Anderson住在俄勒岡州，是一名卡通畫家和插畫家；Kelly McKernan住在田納西州，是一名水彩和丙烯水粉畫的藝術家；Karla Ortiz住在加州，是一名知名屢獲殊榮的藝術家。被告Stability AI Ltd.係一家英國人工智慧新創公司，以其生成式AI影像工具穩定擴散(Stable Diffusion)廣為人知，被告Stability AI Inc.則係一家美國公司。

基本上，世界各國多採著作權創作發生主義，不需要登記就可擁有著作權，且許多國家已廢除註冊制度，但仍有若干國家如美國或中國，仍保留著作權之登記，並且將此當作「起訴之前提要件」，亦即權利人對他人提告前，必須先向該國之著作權主管機關註冊，否則訴訟將被駁回。

本案原告主張遭被告複製用作其AI工具訓練圖像的作品，Andersen宣稱創作包含200多件著作權，並已註冊擁有16個著作權註冊；McKernan擁有30多件著作權；Ortiz則擁有至少12件著作權。然而被告辯稱，McKernan和Ortiz的著作權主張必須被駁回，因為其等從未註冊；至於Andersen，被告則聲請應限制其主張範圍，僅得依已註冊的16件作品來論定。由於McKernan或Ortiz未爭論被告所抗辯提告不適格之主張，因此法院對其提告判定「不可再訴的駁回」(dismissed with prejudice)[2]。同樣的，法院也判定原告的著作權主張範圍，僅限於其已註冊的作品。

本案侵權作品之認定
起訴狀中Anderson（即原告）聲稱，其擁有訓練數據中包含200多部作品的著作權權益，且訓練數據中包含她的作品，可在此找到：https://haveibeentrained.com/?search text'sarah%20andersen.cites。但被告辯稱應要求原告具體指認，已註冊的哪幾幅作品曾被複製到LAION數據集中，最終成為被穩定擴散作為訓練圖像之用，否則不得進行著作侵權指控。而且由於原告未明確指出其被使用之作品，只是依賴“haveibeentrained.com”網站上搜尋她名字的輸出結果，來支持其作品被用於LAION數據集和穩定擴散訓練；並聲稱其搜尋的輸出頁面，即可證實她註冊的一些作品被用作訓練圖像，被告則辯稱認為這些指控不充分。

但法院認為這是讓其得以進行著作權主張的依據，尤其考慮到本案性質，即LAION抓取50億張圖像來創建訓練圖像數據集。在這一階段法院的推論是，原告所有註冊在線上的作品，都被抓取到訓練數據集中[3]。關於她對“haveibeentrained”網站搜尋的結果可以支持這一推論，使得其主張似乎是合理。雖然被告抗辯，原告對“haveibeentrained”網站上搜索結果的引用不充分，因為輸出頁面顯示數百件未被特定藝術家識別的作品，但法院認為，被告在嗣後之證據開示程序(discovery)中，可再測試原告的主張。

本案涉及之穩定擴散模型
Stability AI在2022年8月，創建並發布一款作為「使用者界面」之DreamStudio產品，可造訪使用穩定擴散的訓練版本。原告指「擴散」(diffusion)是一種軟體，可用於生成與其訓練數據中圖像相似之輸出圖像的技術。關於穩定擴散模型，請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲？-- 圖形影像篇」該穩定擴散是以「允許開源授權」(permission open-source license)的「通用」軟體程式，而DreamStudio的使用，係按照建立圖像的積分套餐(in packages of credits)方式計費。

為了訓練穩定擴散，Stability AI透過一個組織：「大規模AI開放網路」(LAION: LargeScale Artificial Intelligence Open Network[4])的服務，在未經授權的情況下，從網路上抓取超過50億張受著作權保護的圖像副本，作為「訓練圖像」用於建立其穩定擴散模型。Stability的首席執行長，曾公開承認使用授權訓練圖像的重要性，並表示穩定擴散的未來版本，將基於經『完全授權』的訓練圖像，但對於目前版本則未採取任何措施來獲取適當的授權。

原告指控該穩定擴散是一個「軟體庫」(software library)，為被告製作和維護的產品以提供「圖像生成服務」，包括共同被告之三項AI產品。消費者透過程式中輸入文本提示(text prompts)，用此產品可建構出以某些「藝術家風格」(“in the style” of artists)為基礎的圖像。這些圖像是透過一種以原告作品作為訓練圖像之「數學過程」所創建，系統中的每個輸出影像，都從潛在圖像（latent images，詳下述）中所延伸而獲得的，而這些潛在圖像是受著作權保護之原始圖像的副本。基於此原因，原告指控被告AI生成工具所吐出的每個混合圖像，都必然是基於原告作品的一項衍生作品[5]。

潛在圖像補值之技術運作
原告指控，2020年12月由Jonathan Ho領導的加州柏克萊大學研究人員，在其論文Denoising Diffusion Probabilistic Models中描述擴散技術的改進。首先所謂「漸進式有損壓縮」(progressive lossy compression)，是一種擴散模型得以更有效存儲訓練數據，而不影響其重建高品質訓練數據副本的方法。這些訓練圖像的壓縮版本，即為前述潛在圖像之展示，是訓練數據集中圖像的另一副本。

其接著展示如何對一潛在圖像進行補值（interpolation，或稱插值）-- 也就是說在數學上進行混合（或疊加）-- 以產生新的衍生圖像，但並未就逐個像素(pixel by pixel)組合二個圖像（因為如此產生的結果不具吸引力），而是展示如何將訓練圖像作為潛在圖像存儲在擴散模型中，然後作為新的潛在圖像進行補值，然後將此補值潛像轉換回標準之基於像素的圖像。

下圖係起訴狀摘自Ho此過程之工作原理，展示補值像素(interpolating pixels)和補值潛在圖像(interpolating latent images)間的結果差異。

圖、補值像素(interpolating pixels)和補值潛在圖像(interpolating latent images)間的結果差異

上圖中，兩張照片正在混合：左側圖像標為“Source x₀”，右側圖像標為“Source x‘₀”，中間紅色框中圖像已被依逐個像素(pixel by pixel)補值，標記為像素空間補值（pixel-space interpolation，一種內插法補值的演算）。這種像素空間補值看來，就像二個半透明的人臉影像互相堆疊在一起，不是一張令人信服的人臉。而上層綠色框中標記為「去噪補值」(denoised interpolation)，其圖像生成方式不同，二個源圖像(source images)已轉換為潛在圖像，透過彎曲的黑色箭頭指向標籤「擴散來源」(diffused source)所顯示。

一旦這些潛在圖像被補值（綠色線表示），新的補值潛在圖像（由較小的綠點表示），其像素已被重建（由向下指向較大綠點的彎曲綠色箭頭表示之過程)，此過程產生綠色框架中的圖像。與像素空間補值相比有明顯差異：去噪混合補值(denoised blended interpolation)看來才像令人信服的人臉，而非兩個人臉圖像的疊加組合。下面顯示兩個補值圖像的放大細節。

圖、兩個補值圖像的放大細節

儘管結果不同，但這二種補值模式是相同的：都是從源圖像生成之衍生作品。在像素空間補值（紅框）中，源圖像本身被直接補值製作出衍生圖像。在「去噪補值」（綠框）中：
(1) 源圖像被轉換為潛在圖像，這是損失壓縮的副本(lossy-compressed copies)；
(2) 對這些潛在圖像進行補值以生成衍生潛在圖像(derivative latent image)；
(3) 然後將此衍生之潛在圖像，解壓縮回復以像素為基礎的圖像。
以上的技術運作說明，對系爭AI工具在侵權認定可否構成近似性之參考。

被告提出駁回起訴之程序動議
依美國聯邦民事訴訟法FRCP 12(b)(6)，原告起訴程序上必須具備「足夠事實來陳述表面上合理的救濟主張」，若起訴狀未能陳述足以授予法律救濟的主張，在被告聲請之下法院應駁回起訴，參見Bell Atl. Corp. v. Twombly, 550 U.S. 544, 570 (2007)。簡言之，原告陳述的事實，需足以「讓法院合理推論，使被告對被指控的不當行為負責」方可，參見Ashcroft v. Iqbal, 556 U.S. 662, 678 (2009)。雖然法院不要求「強化事實陳述的具體細節」，但仍必須有「不僅僅是被告可能非法行為的可能性」，原告尚須陳述足夠的事實，以「使救濟權提升至推測水平之上」，參上述Twombly案, 550 U.S. at 555, 570。質言之，原告應使法院得以合理推斷被告應對其被指控的不法行為負責，不能僅係空泛猜測或抽象臆測其可能是非法，以確保起訴之主張有實質基礎。

而在判斷原告是否提出可獲得救濟的主張時，法院會先暫予接受原告的陳述，並合理對原告做出有利推斷，參見Usher v. City of Los Angeles, 828 F.2d 556, 561 (9th Cir. 1987)。然而，法院並不需接受「僅僅是結論性、無根據的事實推論或不合理推論的指控」，參見In re Gilead Scis. Sec. Litig., 536 F.3d 1049, 1055 (9th Cir. 2008)。再者，如果法院駁回起訴，「即使原告未提出修改起訴狀的請求，法院也應允許修改，除非法院透過其他事實的陳述，確定無法完全糾正起訴狀存在的缺陷」，參見Lopez v. Smith, 203 F.3d 1122, 1127 (9th Cir. 2000)。因此法院在做決定時，應考慮：「是否存在不當拖延、惡意、拖延動機、之前修訂未能糾正缺陷的重複失敗、對對方當事人的不當偏見以及修正是否無效」，參見Moore v. Kayport Package Express, 885 F.2d 531, 538 (9th Cir. 1989)。

總之，在駁回動議階段，原告只需提出足夠事實來合理陳述，法院會得出有利於原告的合理推論；至於指控的真實性和證據，甚至是核心議題如是否構成合理使用等抗辯，在駁回動議階段法院都不會處理。

法院否決被告對Stability AI直接侵權之駁回動議
原告主張直接侵權的主要理論，是基於Stability AI創建和使用從網路上抓取到「訓練圖像」，並將其納入LAION數據集用於訓練穩定擴散。原告已充分指控直接侵權，Stability AI未經授權下載，或以其他方式獲取數十億張受著作權保護圖像的副本，來創建穩定擴散，並使用這些訓練圖像來訓練穩定擴散，並使這些圖像以壓縮副本形式，存儲併入到穩定擴散中。針對原告指控，被告AI工具訓練數據集用來輸出圖像：「包含接受訓練之受著作權保護作品的壓縮副本」，Stability AI強烈反駁，認為這是不合理而難以置信的，因為50億張圖像龐大，不可能被壓縮到一個可以執行的程式。

以上，Stability AI雖反對原告主張的真實性，然而法院認為，Stability AI在訓練或運作穩定擴散的過程中，鑒於有關其對抓取、複製和使用訓練圖像來訓練穩定擴散的指控，原告已充分主張其得構成直接侵權，而是否發生抄襲的侵權行為，此問題在動議階段無從解決，是否有事證支持需待嗣後二造攻防，但原告之指控從形式觀之確係「有的放矢」，且Stability AI亦未反對原告有關訓練圖像之直接侵權主張的充分性。因此，基於有可能是直接侵權，Stability AI聲請之駁回起訴的動議遂被法院駁回，這是原告在第一回合碩果僅存唯一未被駁回的請求。

智財權間接侵害之代理侵權
其次，原告也指控Stability AI構成代理侵權。按智財權領域中之侵權態樣，除直接侵害外尚有間接侵害，而間接侵害又包括輔助侵權(Contributory Infringement)、引誘侵權(Inducing Infringement)和代理侵權(或稱替代侵權Vicarious Infringement)。按被告如自己實施複製等侵權行為，即屬直接侵權，反之，如其係導致、假手他人或引誘或幫助他人完成侵害行為，雖未親力親為法律仍課予間接侵權之責，此稱為次級責任(secondary liability)。

本案中原告指控被告除直接侵權之外，也構成代理侵權。就被告訓練過程中自己所為之重製，性質上屬於直接侵權，但對最終AI自動生成之結果如構成侵權，基於其經由使用者之手或提供其他下游業者使用工具，而導致侵害結果，就會衍生工具提供者是否構成間接侵權之議題。目前美國所有生成式AI的著作權訴訟中，原告都會主張被告除了直接侵權外也構成代理侵害。

代理侵權理論源於美國案例法中，即使沒有雇傭關係，要被告對他人侵害行為負代理侵害責任，原告必須指控被告（1）擁有監督侵權行為的權利和能力(right and ability to supervise)（2）從該侵害行為中獲有直接的經濟利益，參見Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d 788, 802 (9th Cir. 2007)。

原告指控Stability AI之代理侵權
原告指控，使用者透過被告AI圖像工具，輸入特定藝術家的姓名後，依賴藝術家之前的作品，就會產生冒充藝術家原創作品的「偽造品」圖像，這些使用者可謂是「冒名頂替者」。況且，被告AI工具，對含有特定藝術家姓名的提示能做出回應，其應知悉此一功能容易用來生成偽造品。冒名頂替者在許多地方出售偽造品使原告受損，而被告從AI工具中，直接或間接地從「冒名頂替者」的侵權行為中獲利，故應對冒名頂替者的侵權行為承擔代理侵權之責。

但問題是，以上原告針對三位被告之起訴，係將其看成一體籠統加以指控，但具體上基於哪個被告或第三人的哪一行為，得以構成代理侵權，尤其起訴狀中對不同被告之間無區別的指控，常將三位被告混為一談。這很難弄清楚被控訴之每個被告，究竟是誰所實際從事的何項確切行為，導致法律上其主張之間接侵害混淆不明。

北加州地院之程序裁定
因為起訴狀未提供有關穩定擴散中訓練圖像的「壓縮副本」，以及這些副本如何在DreamStudio中呈現的合理事實。法院指出，由於原告未能識別被告的AI平台如何被第三方以侵權方式使用，該代理侵權主張存在缺陷。關於原告指控Stability AI代理侵權的主張，法院因此核准被告所提駁回起訴之動議請求，但也網開一面，允許原告得進行修正訴狀以澄清其理論。

法院特別提醒原告修改時，不應再將「被告」混為一談。反之，其應列出每個被告的姓名並就其所從事的行為詳細陳述。並應添加被告有關穩定擴散中使用受著作權保護之「壓縮副本」的合理事實，以及Stability AI如何在提供給第三方的DreamStudio產品中，以違反著作權法保護的方式呈現、存在或被利用。原告必須提供明確和合理的指控，才能使DreamStudio被第三方使用而承擔代理責任的情況，諸如，當第三方使用被告AI工具生成偽造品時，被告為何因此會間接侵犯原告著作權而產生代理責任。

總之，法院判定，原告需澄清其理論，尤其是原告的訴狀中，還未任何指控以原告的任何作品用來製作出所謂的「偽造品」為何。

接下來請參：AI與畫家智財訴訟案例系列2
畫家控訴DeviantArt生成式AI著作侵權首輪程序判決被告占上風
（6176字；圖3）

作者資訊：
陳家駿律師台灣資訊智慧財產權協會理事長

註解：

[1] 除了著作權侵害、違反《數位千禧年著作權法》刪除著作權管理資訊(CMI: copyright management information)之外，原告還對被告提告：違反實定法的公開/肖像權(Statutory Right of Publicity)；違反普通法之公開/形像權(Common Law Right of Publicity)；不公平競爭；確認性救濟(declaratory relief)。形象權是一種個人身分或人格權，目的在防止為了商業利益而盜用個人的姓名、肖像或其他個人身分標記（例如暱稱、筆名、聲音、簽名、肖像或照片），聯邦法無此規範而係源自普通法。參INTA, https://www.inta.org/topics/right-of-publicity/

[2] dismissed with prejudice指，該民事案件將永遠結束，不得再就同一事件提告，性質上是最終判決，相對的，dismissed without prejudice則僅係暫時性，被駁回的案件仍可再告。

[3] 從網路上抓取的作品範圍，以及聲稱被用來創建訓練圖像，使本案與被告所引用的案件有所區別。例如，Bespaq Corp. v. Haoshen Trading Co., No. C 04-3698 PJH, 2005 WL 14841, at *2 (N.D. Cal. Jan. 3, 2005)，該案由於原告未能指明，在註冊目錄中的哪些既已存在的作品，包含有微型家具圖片已被被告侵害，因此該案被駁回但允許原告修改。在Cutler v. Enzymes, Inc., No. C 08-04650 JF(RS), 2009 WL 482291, at *3 (N.D. Cal. Feb. 25, 2009)，該案涉及三本受著作權保護的書籍，且除了所有權主張之外，起訴狀沒有任何與已出版作品，和涉及侵犯著作權相關的其他具體事實。

[4] 原告謂其是一家位於德國漢堡的非營利組織，包含4億張文字說明訓練圖像的數據集，都是未經圖像所有者或網站運營商同意情況下，從網頁或其他來源複製抓取的。其既定目標是向公眾提供大規模機器學習模型、數據集和相關代碼，其所有項目都免費提供。

[5] 美國法典第17章§101：「『衍生作品』是基於一個或多個既有作品而生的作品，例如翻譯、音樂編排、戲劇化、虛構化、電影版、錄音、藝術複製品、刪節、濃縮或任何其他形式作品可以被重新塑造、改造或改編。由編輯修改、註釋、闡述或其他修改組成的作品，作為一個整體，呈現作者屬性的原創作品就是衍生作品。」

參考資料：
Andersen et al v. Stability AI Ltd. et al, Docket No. 3:23-cv-00201 (N.D. Cal. Jan 13, 2023), Complaimt
Andersen et al v. Stability AI Ltd. et al, ORDER ON Motions to Dismiss and Strike
Sarah Andersen et al v. Stability Ai Ltd. et al, Plaintiffs' Opposition To Defendant Midjourney, Inc.'S Motion To Dismiss Plaintiffs' Complaint And To Strike Class Claims
Tal Dickstein and Edward Delman, Andersen v. Stability AI Ltd., 2023/10/30.
Recent Rulings in AI Copyright Lawsuits Shed Some Light, but Leave Many Questions. Perkins Coie, 2023/12/14.

相關文章：
1. 蘋果手錶禁售的案例，讓Oura更關注三星智慧戒指是否侵權
2. USITC判定台積電未取得Daedalus Prime訴訟相關專利的授權，雙方和解結束相關訴訟
3. 智慧局112年12月智慧財產權統計
4. 美國作家集體訴訟控告Meta生成式AI工具LLaMA著作侵權之程序判決出爐
5. 一場血氧技術的訴訟失敗，可能延緩蘋果手錶未來的計畫
6. WIPI 2023與近5年我國產業申請商標案件趨勢分析

歡迎來粉絲團按讚！

--------------------------------------------------------------------------------------------------------------------------------------------