以ChatGPT檢索專利可行評估及其法律風險
科技產業資訊室(iKnow) - 陳家駿、許正乾 發表於 2023年6月27日
圖、以ChatGPT檢索專利可行評估及其法律風險
隨著ChatGPT (Generative Pre-trained Transformer,GPT)的問世,AI聊天機器人已成熱門話題,其優異之自然語言處理(NLP)和文本分析應用,備受各行業關注和討論,大家都在研究ChatGPT如何為企業或個人提高工作效率和準確性,以降低有形的營運成本和無形的時間成本。
本文即針對ChatGPT是否能在專利檢索方面,提供科學化檢索的可行性。所有專利從業者都知道,傳統的專利檢索是一件曠日廢時的工作,相當依賴人們對於產業或技術的主觀認知,由從業者輸入關鍵詞以手動檢索和篩選,而其檢索技巧也因人而異,最後得到的檢索結果可能很有限,而GPT-4雖才問世不久,但因其可高效自動處理文本數據、提取和分析資訊,立即為專利界帶來希望。
試想,如果在ChatGPT中輸入技術內容或專利公開號,就可自動完成專利文獻的檢索,而不需由人為進行,那豈不太方便?然而,ChatGPT 大神真的可以用於檢索嗎?其能力究竟如何?因此專家呼籲:如不了解專利檢索原理、不分析技術內容,就便宜行事將技術文本交給ChatGPT檢索,結果可能會出現問題,畢竟ChatGPT目前在這方面的調校稱不上成熟。
針對此,筆者實地針對GPT-4與GPT-3.5進行實測,結果發現雖尚不能直接、完全取代人為檢索,但透過適當指令提示(prompting)「循循善問」下,倒還真的是個檢索的得力助手。依據筆者截至今年6月底前的實測結果,目前GPT-3.5對於專利檢索的幫助遠比GPT-4來得好,因為GPT-4經常會回應「我沒有即時的專利數據庫存取能力,我無法提供特定的專利號碼或專利名稱」之類的回答。推測這原因大概是,GPT-4對法律服務方面的問答系統尚未優化到位[1],但這遲早都是會被解決的事,因此以下的實測就暫以GPT-3.5版本為主,預期未來GPT-4被優化後,其在專利檢索方面的問答能力將比GPT-3.5更加強大才是,值得期待。
以ChatGPT檢索專利可行性之評估
首先第一步驟,根據ChatGPT的指令集邏輯來看,要能夠讓ChatGPT針對問題具體回答內容,不外乎三個原則:1. 給定人設;2. 描述問題的背景、特徵或需求要盡可能明確;以及3. 指示欲輸出的內容或格式。
把握以上三個原則,通常都有還不錯的回應。根據以上原則,筆者設計了一種「檢索浸潤式微影技術」的情境進行實測(註:以下所提的技術特徵與技術功效,只是為了實測而綜合許多公開技術文獻內容而虛構出的問題),以下即是「專利檢索指令一」。在問答過程中有一個小技巧,就是將欲提問的重點予以引號,這樣更能讓ChatGPT理解要問的重點是什麼。
『若你是一位「專利檢索分析師」,我會提供本案的技術特徵與可以達成的技術功效,而你的工作就是協助找出與該技術特徵類似至少三件專利文獻號碼與名稱。我的第一個技術特徵就是「一種半導體製程,利用浸潤式微影技術並採用5奈米製程,透過一種高折射率液體,特別是對水的折射率為1.44具有最佳效果,並在極紫外光(EUV)波長100奈米的條件下,對晶圓(wafer)做曝光」。我的第一個技術功效在於,晶圓上的單位面積上可以放更小、更多的電晶體。』
結果,ChatGPT的回應如圖一所示,的確給出三個專利文獻號碼與名稱,妙的是ChatGPT還會幫忙分析出相似原因。然而經過驗證,這三個專利文獻號碼都與微影技術無關,第1、3專利文獻號碼與生物科技相關,而第2專利文獻號碼與無線通訊相關。難道這意味著 ChatGPT不能用於專利檢索?
圖一、ChatGPT根據「專利檢索指令一」而得出專利文獻號碼與名稱
有趣的事發生了!仔細進一步看「專利名稱」與「相似原因」,反而和筆者想檢索的目標一致,可見ChatGPT在專利檢索工作上並非完全無用。這時就想到ChatGPT的背後原理,它的強項不正是搜尋網路上的巨量文本後,再進行重組、語意分析、關鍵詞提取與擴展,最後自動生成新摘要嗎!所以,ChatGPT目前對專利檢索與專利文獻號碼間關聯性的擷取,可能還不擅長,但日後其AI訓練師應能將此缺陷彌補才是。
接著進行第二步驟,既然ChatGPT對語意分析、關鍵詞的提取與擴展能力有很強的表現,那麼筆者就嘗試將指令修改成「專利檢索指令二」,並明確指示ChatGPT給出一個中文檢索式,其內容如下:
『若你是一位「專利檢索分析師」,我會提供本案的技術特徵與可以達成的技術功效,而你的工作就是從技術功效和技術特徵中提取關鍵詞,並從關鍵詞中找出擴展詞,以建立一個中文專利檢索式。我的第一個技術特徵就是一種「半導體製程,包含浸潤式微影技術、5奈米製程、高折射率液體、折射率1.44、波長100奈米、晶圓」。而第一個技術功效為晶圓上的單位面積上可以放更小、更多的電晶體。』
圖二、ChatGPT根據「專利檢索指令二」而得出簡體中文之結果
結果,ChatGPT突然出現大陸常用的技術用語「集成電路」。ChatGPT的確偶爾會突然用簡體中文回答,此時只要對ChatGPT下指令說「請用繁體中文」就出現如圖三的繁體中文回答。
圖三、ChatGPT根據「專利檢索指令二」而得出繁體中文之結果
圖三顯示出的繁體中文,會自動地將大陸的技術用語「集成電路」,翻譯成台灣慣用的「積體電路」。接著,仔細看一下ChatGPT回應的內容,其包含關鍵詞、擴展詞以及中文專利檢索式也一併產生。然後,筆者就把中文專利檢索式複製下來,並貼到台灣智財局的檢索官網後就產生如圖四的檢索結果。
圖四、利用「專利檢索指令二」所得出的中文專利檢索式而得到的檢索結果
圖四所顯示的檢索結果只有1件專利,更進一步去看其檢索後的專利名稱,卻是「放射線圖像攝影裝置、及放射線圖像攝影方法」,顯然這檢索結果不太合理。由於目前ChatGPT在法律服務方面仍未臻完善,但它強大的檢索和分析能力仍不可置疑,因此,筆者再回去重新審視為何會有此不太合理的檢索結果,遂發現中文專利檢索式中的「AND (密度)」,針對本案而言並非重要的關鍵詞,所以予以刪除重新再問ChatGPT試試看,結果發現如圖五所示,這一次的檢索結果有26筆,且光看專利名稱就比前一次的檢索版本更合理些,再繼續抽樣幾篇的專利並閱讀之,發現也比較貼近本次的專利檢索目標。
圖五、修正中文專利檢索式後而得到的檢索結果,更貼近檢索目標
也許有人會問,以上都是用中文問答,若改用英文來問專利這種具有專業性的問題,是否就會給出不同的回答。筆者乃加以實測,結論是不論中文或英文問ChatGPT,雖然給出的專利文獻號碼與名稱可能不盡相同,但其輸出格式卻相同,而且關鍵詞與其擴展詞也對檢索工作相當有幫助。
就以上實測結果來看,目前ChatGPT對於專利檢索功能的直接幫助比較有限,但若從技術特徵和功效的角度切入來看,透過輸入關鍵詞進行檢索,就會給出技術的擴展詞與簡單的檢索式,其實可算是堪用。在此必須提醒的是,使用ChatGPT進行專利檢索時,仍需結合專家的經驗進行「人機協作」,至少在這方面給出一個較科學化、有效率的檢索方式。此外,雖然ChatGPT目前還無法完全取代專利工程師或專利師的工作,不過隨著OpenAI陸續公開API,其法律服務方面的人工智慧化潛力甚值得期待,也許未來應可提升法律人的工作效率。
以ChatGPT檢索專利之法律風險
以ChatGPT檢索專利首要之法律風險,即輸入檢索時是否會觸動自我公開或揭露,而使專利申請失效?以美國申請為例,依美國專利商標局之《專利審查程序手冊》,如果一項參考資料或文件對一位普通熟練技術人員(an ordinarily skilled artisan)而言,是可獲得並找到的,則將被視為習知技術的公開文獻(prior art publication)。問題是,用ChatGPT檢索專利時所輸入的指令(propmting),是否就形成所謂之公開揭露?法律上可能有爭議。因為ChatGPT隸屬於一私人機構Open AI,對其餵入指令表面上並非立即向大眾公開(不似刊物對外公開發表)。
惟輸入ChatGPT的雖只是幾個簡單的關鍵詞,但如這些詞彼此間可以延伸形成一些突破性的重要技術概念,甚或是所輸入的已經是重要的技術特徵或技術思想的一段文字時,因文字本身就富有專利價值,此種輸入當然就有其危險性!因為該幾個關鍵詞本身之組合,在輸入ChatGPT之後它就可能會被加以訓練;再者,所輸入技術思想的一段文字,理論上會被ChatGPT作為訓練資料的一種素材,該段文字雖然不見得會被「原原本本」地吐出去給別的使用者,但基於它特殊的演算法學習消化資料與統整能力,這些重要的思想或概念,難保不被ChatGPT以某種形式,在他人向它提問時,不經意地以「不同文字但類似觀念」方式吐出去,這當然就會構成一項法律上的風險!
理論上,一旦將資訊輸入ChatGPT,即導致該內容成為其資料庫中的一部分,但究竟他人是否直接或間接看到或用到所輸入的資訊內涵?沒人能保證ChatGPT不可能「意外洩露敏感資訊」,這對專利申請人自然造成困擾,因其發明可能被洩露給ChatGPT。在此情況下,專利律師因有法定之違反保密義務[2],當然不希望因使用之工具(無論其效能多麼強大),而被某種方式導致其發明思想被公開成為先前技藝,甚或出現在他人提交的專利申請中。
所以用ChatGPT做專利檢索時,為保護專利申請人的核心技術思想,並避免過度揭露專利重要內容,建議可針對欲輸入做模糊化關鍵詞,這樣可減少對具體技術思想的揭露。ChatGPT有一個強大的優勢,就是即便所輸入之關鍵詞屬於一般較通用的術語,但在找尋相關專利文獻時,仍會藉由關鍵詞而一併找尋其擴展詞。此外,也要避免在ChatGPT的對話內提及專利申請人的全名或簡稱,不過稍微提及該專利申請人的發明技術領域或產業類別,這不僅可行且還能提升ChatGPT檢索相關前案的準確度。
綜上所述,ChatGPT目前仍無法自動完成專利檢索的任務,當然也就不會造成專利檢索人員的失業。另一方面,ChatGPT能否作為專利工作者的檢索工具並提高檢索效率?目前看來仍屬有限。此外,ChatGPT具有更好的關鍵詞的擴展能力,雖然一般專利數據庫也有此功能,表現也不錯。從這個意義上說,使用ChatGPT進行專利檢索工作的好處,在於關鍵詞的擴展與自動生成檢索式。
需注意的是,使用ChatGPT做專利檢索時還面臨以下風險:
(1)不正確的回答:由於ChatGPT並不到位,仍可能會生成錯誤的答案,就像之前說的專利文獻號碼與專利名稱之間發生無關聯的情況;以及
(2)安全和隱私風險:ChatGPT可能涉及處理敏感的專利和客戶資訊。總的來說,專利工作者在使用ChatGPT檢索時,應認識到這些風險並採取相應措施,而對於ChatGPT自動生成的結果亦應謹慎,並用專業判斷來確保資訊的準確性和合規性。
看來,目前最好的方式仍是「人機合一」協作,ChatGPT的問世對專利檢索工作來說,提供了一個科學化的檢索參考流程,至少不用憑藉著過去根據每位專利工作者對產業、技術、布林邏輯(Boolean logic)使用等認知上的不同,使得每個人做出來的結果或品質都大相逕庭。(4143個字;圖6)
註解:
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。
|