︿
Top

AI與畫家智財訴訟案例系列1:美國畫家控告Stability生成式AI工具著作侵權之程序判決出爐

瀏覽次數:6009| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 陳家駿 發表於 2024年2月17日
facebook twitter wechat twitter

圖、美國畫家控告Stability生成式AI工具著作侵權之程序判決出爐

 
ChatGPT於2022年底推出後,標誌著AI領域的一項重大突破。隨著ChatGPT 4.0問世,所有文字、圖形、影像、聲音、視頻和程式碼等各種內容,都能透過AI演算自動生成。然而,這一科技史上巨大進步也引起許多智財爭議,在科技最發達的美國,短短一年以來即發生多起生成式AI (Generative AI)著作侵權訴訟。這其中,最受人矚目的如開源碼、文字書籍和圖形影像等領域,是否構成著作侵權成為焦點。

由於圖形影像是人們工作、生活和娛樂中廣泛使用的工具,而AI自動生成圖像技術的應用,帶來與傳統著作權不同的爭議範疇。引起關注的案例之一是Andersen等三位藝術家,於2023年1月向北加州聯邦地院,對Stability AI、Midjourney和DeviantArt三家生成式AI工具公司,提起著作權侵害訴訟[1],這三位被告都使用「穩定擴散」(Stable Diffusion)工具,它是Stability AI基於擴散模型生成圖像推出的AI產品,其將圖像生成引擎嵌入軟體中,包括由Stability AI公司開發的DreamStudio、Midjourney公司開發的Midjourney產品以及DeviantArt公司開發的DreamUp皆然。

被告隨即聲請「駁回起訴之動議」,北加州地院William Orrick法官於2023年10月底,對二造第一回合的交鋒,做出一項中間判決性質之程序裁定,成為就生成式AI挑戰在訴狀階段,第一位作出裁決的聯邦法官。法院駁回大部分原告的訴訟請求,僅一名畫家原告針對Stability AI 提出的直接侵權訴訟得以存續,但法院准許原告修改大部分之起訴內容(granted leave to amend the complaint)。雖然本案是以集體訴訟方式對三家公司起訴,但由於每個被告的行為事實略有不同,法院雖然合併在一個判決內處理,卻對三位被告的行為態樣,分別進行評價。因此,本文將先介紹共通部分,然後探討各別被告的爭議點,就法院對其中特別著墨之層面予以分析。


本案當事人與著作權註冊之爭議
本案三位原告Sarah Anderson住在俄勒岡州,是一名卡通畫家和插畫家;Kelly McKernan住在田納西州,是一名水彩和丙烯水粉畫的藝術家;Karla Ortiz住在加州,是一名知名屢獲殊榮的藝術家。被告Stability AI Ltd.係一家英國人工智慧新創公司,以其生成式AI影像工具穩定擴散(Stable Diffusion)廣為人知,被告Stability AI Inc.則係一家美國公司。

基本上,世界各國多採著作權創作發生主義,不需要登記就可擁有著作權,且許多國家已廢除註冊制度,但仍有若干國家如美國或中國,仍保留著作權之登記,並且將此當作「起訴之前提要件」,亦即權利人對他人提告前,必須先向該國之著作權主管機關註冊,否則訴訟將被駁回。

本案原告主張遭被告複製用作其AI工具訓練圖像的作品,Andersen宣稱創作包含200多件著作權,並已註冊擁有16個著作權註冊;McKernan擁有30多件著作權;Ortiz則擁有至少12件著作權。然而被告辯稱,McKernan和Ortiz的著作權主張必須被駁回,因為其等從未註冊;至於Andersen,被告則聲請應限制其主張範圍,僅得依已註冊的16件作品來論定。由於McKernan或Ortiz未爭論被告所抗辯提告不適格之主張,因此法院對其提告判定「不可再訴的駁回」(dismissed with prejudice)[2]。同樣的,法院也判定原告的著作權主張範圍,僅限於其已註冊的作品。


本案侵權作品之認定
起訴狀中Anderson(即原告)聲稱,其擁有訓練數據中包含200多部作品的著作權權益,且訓練數據中包含她的作品,可在此找到:https://haveibeentrained.com/?search text'sarah%20andersen.cites。但被告辯稱應要求原告具體指認,已註冊的哪幾幅作品曾被複製到LAION數據集中,最終成為被穩定擴散作為訓練圖像之用,否則不得進行著作侵權指控。而且由於原告未明確指出其被使用之作品,只是依賴“haveibeentrained.com”網站上搜尋她名字的輸出結果,來支持其作品被用於LAION數據集和穩定擴散訓練;並聲稱其搜尋的輸出頁面,即可證實她註冊的一些作品被用作訓練圖像,被告則辯稱認為這些指控不充分。

但法院認為這是讓其得以進行著作權主張的依據,尤其考慮到本案性質,即LAION抓取50億張圖像來創建訓練圖像數據集。在這一階段法院的推論是,原告所有註冊在線上的作品,都被抓取到訓練數據集中[3]。關於她對“haveibeentrained”網站搜尋的結果可以支持這一推論,使得其主張似乎是合理。雖然被告抗辯,原告對“haveibeentrained”網站上搜索結果的引用不充分,因為輸出頁面顯示數百件未被特定藝術家識別的作品,但法院認為,被告在嗣後之證據開示程序(discovery)中,可再測試原告的主張。


本案涉及之穩定擴散模型
Stability AI在2022年8月,創建並發布一款作為「使用者界面」之DreamStudio產品,可造訪使用穩定擴散的訓練版本。原告指「擴散」(diffusion)是一種軟體,可用於生成與其訓練數據中圖像相似之輸出圖像的技術。關於穩定擴散模型,請參本刊Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲?-- 圖形影像篇該穩定擴散是以「允許開源授權」(permission open-source license)的「通用」軟體程式,而DreamStudio的使用,係按照建立圖像的積分套餐(in packages of credits)方式計費。

為了訓練穩定擴散,Stability AI透過一個組織:「大規模AI開放網路」(LAION: LargeScale Artificial Intelligence Open Network[4])的服務,在未經授權的情況下,從網路上抓取超過50億張受著作權保護的圖像副本,作為「訓練圖像」用於建立其穩定擴散模型。Stability的首席執行長,曾公開承認使用授權訓練圖像的重要性,並表示穩定擴散的未來版本,將基於經『完全授權』的訓練圖像,但對於目前版本則未採取任何措施來獲取適當的授權。

原告指控該穩定擴散是一個「軟體庫」(software library),為被告製作和維護的產品以提供「圖像生成服務」,包括共同被告之三項AI產品。消費者透過程式中輸入文本提示(text prompts),用此產品可建構出以某些「藝術家風格」(“in the style” of artists)為基礎的圖像。這些圖像是透過一種以原告作品作為訓練圖像之「數學過程」所創建,系統中的每個輸出影像,都從潛在圖像(latent images,詳下述)中所延伸而獲得的,而這些潛在圖像是受著作權保護之原始圖像的副本。基於此原因,原告指控被告AI生成工具所吐出的每個混合圖像,都必然是基於原告作品的一項衍生作品[5]


潛在圖像補值之技術運作
原告指控,2020年12月由Jonathan Ho領導的加州柏克萊大學研究人員,在其論文Denoising Diffusion Probabilistic Models中描述擴散技術的改進。首先所謂「漸進式有損壓縮」(progressive lossy compression),是一種擴散模型得以更有效存儲訓練數據,而不影響其重建高品質訓練數據副本的方法。這些訓練圖像的壓縮版本,即為前述潛在圖像之展示,是訓練數據集中圖像的另一副本。

其接著展示如何對一潛在圖像進行補值(interpolation,或稱插值)-- 也就是說在數學上進行混合(或疊加)-- 以產生新的衍生圖像,但並未就逐個像素(pixel by pixel)組合二個圖像(因為如此產生的結果不具吸引力),而是展示如何將訓練圖像作為潛在圖像存儲在擴散模型中,然後作為新的潛在圖像進行補值,然後將此補值潛像轉換回標準之基於像素的圖像。

下圖係起訴狀摘自Ho此過程之工作原理,展示補值像素(interpolating pixels)和補值潛在圖像(interpolating latent images)間的結果差異。

 
圖、補值像素(interpolating pixels)和補值潛在圖像(interpolating latent images)間的結果差異
 
上圖中,兩張照片正在混合:左側圖像標為“Source x0”,右側圖像標為“Source x‘0”,中間紅色框中圖像已被依逐個像素(pixel by pixel)補值,標記為像素空間補值(pixel-space interpolation,一種內插法補值的演算)。這種像素空間補值看來,就像二個半透明的人臉影像互相堆疊在一起,不是一張令人信服的人臉。而上層綠色框中標記為「去噪補值」(denoised interpolation),其圖像生成方式不同,二個源圖像(source images)已轉換為潛在圖像,透過彎曲的黑色箭頭指向標籤「擴散來源」(diffused source)所顯示。

一旦這些潛在圖像被補值(綠色線表示),新的補值潛在圖像(由較小的綠點表示),其像素已被重建(由向下指向較大綠點的彎曲綠色箭頭表示之過程),此過程產生綠色框架中的圖像。與像素空間補值相比有明顯差異:去噪混合補值(denoised blended interpolation)看來才像令人信服的人臉,而非兩個人臉圖像的疊加組合。下面顯示兩個補值圖像的放大細節。

 
圖、兩個補值圖像的放大細節
 
儘管結果不同,但這二種補值模式是相同的:都是從源圖像生成之衍生作品。在像素空間補值(紅框)中,源圖像本身被直接補值製作出衍生圖像。在「去噪補值」(綠框)中:
(1) 源圖像被轉換為潛在圖像,這是損失壓縮的副本(lossy-compressed copies);
(2) 對這些潛在圖像進行補值以生成衍生潛在圖像(derivative latent image);
(3) 然後將此衍生之潛在圖像,解壓縮回復以像素為基礎的圖像。
以上的技術運作說明,對系爭AI工具在侵權認定可否構成近似性之參考。


被告提出駁回起訴之程序動議
依美國聯邦民事訴訟法FRCP 12(b)(6),原告起訴程序上必須具備「足夠事實來陳述表面上合理的救濟主張」,若起訴狀未能陳述足以授予法律救濟的主張,在被告聲請之下法院應駁回起訴,參見Bell Atl. Corp. v. Twombly, 550 U.S. 544, 570 (2007)。簡言之,原告陳述的事實,需足以「讓法院合理推論,使被告對被指控的不當行為負責」方可,參見Ashcroft v. Iqbal, 556 U.S. 662, 678 (2009)。雖然法院不要求「強化事實陳述的具體細節」,但仍必須有「不僅僅是被告可能非法行為的可能性」,原告尚須陳述足夠的事實,以「使救濟權提升至推測水平之上」,參上述Twombly案, 550 U.S. at 555, 570。質言之,原告應使法院得以合理推斷被告應對其被指控的不法行為負責,不能僅係空泛猜測或抽象臆測其可能是非法,以確保起訴之主張有實質基礎。

而在判斷原告是否提出可獲得救濟的主張時,法院會先暫予接受原告的陳述,並合理對原告做出有利推斷,參見Usher v. City of Los Angeles, 828 F.2d 556, 561 (9th Cir. 1987)。然而,法院並不需接受「僅僅是結論性、無根據的事實推論或不合理推論的指控」,參見In re Gilead Scis. Sec. Litig., 536 F.3d 1049, 1055 (9th Cir. 2008)。再者,如果法院駁回起訴,「即使原告未提出修改起訴狀的請求,法院也應允許修改,除非法院透過其他事實的陳述,確定無法完全糾正起訴狀存在的缺陷」,參見Lopez v. Smith, 203 F.3d 1122, 1127 (9th Cir. 2000)。因此法院在做決定時,應考慮:「是否存在不當拖延、惡意、拖延動機、之前修訂未能糾正缺陷的重複失敗、對對方當事人的不當偏見以及修正是否無效」,參見Moore v. Kayport Package Express, 885 F.2d 531, 538 (9th Cir. 1989)

總之,在駁回動議階段,原告只需提出足夠事實來合理陳述,法院會得出有利於原告的合理推論;至於指控的真實性和證據,甚至是核心議題如是否構成合理使用等抗辯,在駁回動議階段法院都不會處理。


 法院否決被告對Stability AI直接侵權之駁回動議 
原告主張直接侵權的主要理論,是基於Stability AI創建和使用從網路上抓取到「訓練圖像」,並將其納入LAION數據集用於訓練穩定擴散。原告已充分指控直接侵權,Stability AI未經授權下載,或以其他方式獲取數十億張受著作權保護圖像的副本,來創建穩定擴散,並使用這些訓練圖像來訓練穩定擴散,並使這些圖像以壓縮副本形式,存儲併入到穩定擴散中。針對原告指控,被告AI工具訓練數據集用來輸出圖像:「包含接受訓練之受著作權保護作品的壓縮副本」,Stability AI強烈反駁,認為這是不合理而難以置信的,因為50億張圖像龐大,不可能被壓縮到一個可以執行的程式。

以上,Stability AI雖反對原告主張的真實性,然而法院認為,Stability AI在訓練或運作穩定擴散的過程中,鑒於有關其對抓取、複製和使用訓練圖像來訓練穩定擴散的指控,原告已充分主張其得構成直接侵權,而是否發生抄襲的侵權行為,此問題在動議階段無從解決,是否有事證支持需待嗣後二造攻防,但原告之指控從形式觀之確係「有的放矢」,且Stability AI亦未反對原告有關訓練圖像之直接侵權主張的充分性。因此,基於有可能是直接侵權,Stability AI聲請之駁回起訴的動議遂被法院駁回,這是原告在第一回合碩果僅存唯一未被駁回的請求。


智財權間接侵害之代理侵權
其次,原告也指控Stability AI構成代理侵權。按智財權領域中之侵權態樣,除直接侵害外尚有間接侵害,而間接侵害又包括輔助侵權(Contributory Infringement)、引誘侵權(Inducing Infringement)和代理侵權(或稱替代侵權Vicarious Infringement)。按被告如自己實施複製等侵權行為,即屬直接侵權,反之,如其係導致、假手他人或引誘或幫助他人完成侵害行為,雖未親力親為法律仍課予間接侵權之責,此稱為次級責任(secondary liability)。

本案中原告指控被告除直接侵權之外,也構成代理侵權。就被告訓練過程中自己所為之重製,性質上屬於直接侵權,但對最終AI自動生成之結果如構成侵權,基於其經由使用者之手或提供其他下游業者使用工具,而導致侵害結果,就會衍生工具提供者是否構成間接侵權之議題。目前美國所有生成式AI的著作權訴訟中,原告都會主張被告除了直接侵權外也構成代理侵害。

代理侵權理論源於美國案例法中,即使沒有雇傭關係,要被告對他人侵害行為負代理侵害責任,原告必須指控被告(1)擁有監督侵權行為的權利和能力(right and ability to supervise)(2)從該侵害行為中獲有直接的經濟利益,參見Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d 788, 802 (9th Cir. 2007)


 原告指控Stability AI之代理侵權 
原告指控,使用者透過被告AI圖像工具,輸入特定藝術家的姓名後,依賴藝術家之前的作品,就會產生冒充藝術家原創作品的「偽造品」圖像,這些使用者可謂是「冒名頂替者」。況且,被告AI工具,對含有特定藝術家姓名的提示能做出回應,其應知悉此一功能容易用來生成偽造品。冒名頂替者在許多地方出售偽造品使原告受損,而被告從AI工具中,直接或間接地從「冒名頂替者」的侵權行為中獲利,故應對冒名頂替者的侵權行為承擔代理侵權之責。

但問題是,以上原告針對三位被告之起訴,係將其看成一體籠統加以指控,但具體上基於哪個被告或第三人的哪一行為,得以構成代理侵權,尤其起訴狀中對不同被告之間無區別的指控,常將三位被告混為一談。這很難弄清楚被控訴之每個被告,究竟是誰所實際從事的何項確切行為,導致法律上其主張之間接侵害混淆不明。


北加州地院之程序裁定
因為起訴狀未提供有關穩定擴散中訓練圖像的「壓縮副本」,以及這些副本如何在DreamStudio中呈現的合理事實。法院指出,由於原告未能識別被告的AI平台如何被第三方以侵權方式使用,該代理侵權主張存在缺陷。關於原告指控Stability AI代理侵權的主張,法院因此核准被告所提駁回起訴之動議請求,但也網開一面,允許原告得進行修正訴狀以澄清其理論。

法院特別提醒原告修改時,不應再將「被告」混為一談。反之,其應列出每個被告的姓名並就其所從事的行為詳細陳述。並應添加被告有關穩定擴散中使用受著作權保護之「壓縮副本」的合理事實,以及Stability AI如何在提供給第三方的DreamStudio產品中,以違反著作權法保護的方式呈現、存在或被利用。原告必須提供明確和合理的指控,才能使DreamStudio被第三方使用而承擔代理責任的情況,諸如,當第三方使用被告AI工具生成偽造品時,被告為何因此會間接侵犯原告著作權而產生代理責任。

總之,法院判定,原告需澄清其理論,尤其是原告的訴狀中,還未任何指控以原告的任何作品用來製作出所謂的「偽造品」為何。


接下來請參:AI與
畫家智財訴訟案例系列2
畫家控訴DeviantArt生成式AI著作侵權首輪程序判決被告占上風

(6176字;圖3)

作者資訊:
陳家駿律師  台灣資訊智慧財產權協會理事長
 

註解:

[1] 除了著作權侵害、違反《數位千禧年著作權法》刪除著作權管理資訊(CMI: copyright management information)之外,原告還對被告提告:違反實定法的公開/肖像權(Statutory Right of Publicity);違反普通法之公開/形像權(Common Law Right of Publicity);不公平競爭;確認性救濟(declaratory relief)。形象權是一種個人身分或人格權,目的在防止為了商業利益而盜用個人的姓名、肖像或其他個人身分標記(例如暱稱、筆名、聲音、簽名、肖像或照片),聯邦法無此規範而係源自普通法。參INTA, https://www.inta.org/topics/right-of-publicity/
[2] dismissed with prejudice指,該民事案件將永遠結束,不得再就同一事件提告,性質上是最終判決,相對的,dismissed without prejudice則僅係暫時性,被駁回的案件仍可再告。
[3] 從網路上抓取的作品範圍,以及聲稱被用來創建訓練圖像,使本案與被告所引用的案件有所區別。例如,Bespaq Corp. v. Haoshen Trading Co., No. C 04-3698 PJH, 2005 WL 14841, at *2 (N.D. Cal. Jan. 3, 2005),該案由於原告未能指明,在註冊目錄中的哪些既已存在的作品,包含有微型家具圖片已被被告侵害,因此該案被駁回但允許原告修改。在Cutler v. Enzymes, Inc., No. C 08-04650 JF(RS), 2009 WL 482291, at *3 (N.D. Cal. Feb. 25, 2009),該案涉及三本受著作權保護的書籍,且除了所有權主張之外,起訴狀沒有任何與已出版作品,和涉及侵犯著作權相關的其他具體事實。
[4] 原告謂其是一家位於德國漢堡的非營利組織,包含4億張文字說明訓練圖像的數據集,都是未經圖像所有者或網站運營商同意情況下,從網頁或其他來源複製抓取的。其既定目標是向公眾提供大規模機器學習模型、數據集和相關代碼,其所有項目都免費提供。

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。