曾使用ChatGPT的人可能發現,它偶爾會亂說話,編造假資訊。如你以玩樂心態操作,看到它一本正經地「說出」失實答案,還真是幾搞笑的;但當這些假資訊牽涉到有名有姓的真實人物,當事人就覺得一點都不好玩了。另一方面,OpenAI從互聯網抓取數據來訓練AI模型,當中難免包含受版權保護的內容,讓眾多作家深感不滿。因此,愈來愈多知名人士、作家對該公司提起誹謗、侵權訴訟。面對這波訴訟浪潮,被譽為「ChatGPT之父」的奧特曼要如何應對呢?

ChatGPT捏造案件面臨誹謗訴訟

槍械刊物《AmmoLand》的主編弗雷德·里爾(Fred Riehl)在2023年5月撰寫一篇「第二修正案基金會(SAF)訴訟 Robert Ferguson」案件的報道,要求ChatGPT提供案件摘要。根據ChatGPT所述,SAF創辦人艾倫·戈特利布(Alan Gottlieb)起訴喬治亞州電台主持人馬克·沃爾特斯(Mark Walters),涉嫌以SAF財務長的職權非法挪用基金會的資金。

里爾致電給戈特利布查問是否真有其事,結果對方證實ChatGPT產出的內容完全是錯誤的。事實上,沃爾特斯既不是「Robert Ferguson」案件的當事人,亦從未任職於第二修正案基金會。沃爾特斯得知此事後,於2023年6月5日決定向OpenAI提起誹謗訴訟。這是全球首宗針對ChatGPT的誹謗索償起訴,象徵著誹謗法例同樣適用於生成式AI領域。

ChatGPT 胡亂捏造他人犯法已非首次。2023年4月,澳洲維多利亞省赫本郡(Hepburn Shire)市長萊恩·胡德(Brian Hood)發現,ChatGPT錯誤地把他列為2011年澳洲印鈔公司(Note Printing Australia)海外賄賂案的犯人,因賄賂而入獄,讓他擔心自己的聲譽會因此受損。

胡德的代表律師指出,其客戶確實曾受僱於澳洲印鈔公司,但卻是舉報高層向外國官員行賄以獲取貨幣印刷合約的吹哨人,而不是犯案者。他表示,已向OpenAI發出律師信,要求對方修改有關其客戶的錯誤,否則便會考慮提出誹謗訴訟。

胡德的代表律師指出,胡德本人作為赫本郡市長,聲譽對他至關重要。如果有市民在ChatGPT上看到有關他的錯誤資訊,將給他帶來巨大的負面影響。(圖片來源:Brian Hood臉書專頁)

8,000作家要求AI公司付版權費

面對外界指責ChatGPT編造假資訊,OpenAI執行長山姆·奧特曼(Sam Altman)坦承,生成式AI有「資訊幻覺」(Hallucination)是一個需要解決的問題,其團隊現正積極開發可以減少不實資訊產生的新模型。

喬治亞州電台主持人沃爾特斯表示,自己是ChatGPT產生「幻覺」下的受害者。(圖片來源:Mark Walters臉書專頁)

除誹謗官司外,OpenAI還遭受侵權指控。2023年7月,逾8,000名作家發表連署公開信,要求OpenAI、微軟(Microsoft)、Google、Meta等科技公司,為AI所用的版權內容付費。這封由美國最大作者組織作家協會(Authors Guild)發起的公開信指控,用於訓練AI模型的書籍內容,大部分來自一些盜版網站,而這些公司未經作者同意,擅自取用其著作的內容,更沒有支付過一分錢。

作家協會主席瑪雅·尚巴格·朗(Maya Shanbhag Lang)指出,生成式AI輸出的內容本質上是衍生物——這是AI吸收人類作家的著作內容後,再重組內容而產出的衍生作品。作家寫作內容來「餵養」AI,讓它學習和進化,因此而獲得補償是公平的。

作家協會主席尚巴格·朗直言,AI產出的內容本質上只是人類作家的衍生作品。(圖片來源:IG@ mayaslang)

公開信中列出對科技公司的3項要求:一、獲得生成式AI模型所用的版權內容許可;二、為過往或現在AI模型中所用到的作品給予作者公平補償;三、為AI生成內容中所用到的作品給予作者公平補償。尚巴格·朗強調,任何作品不得在未經同意、署名、報酬的情況下使用,三者缺一不可,惟公開信中未有提到任何法律行動。

小說家向OpenAI提起侵權訴訟

不過,有部分作家早已按捺不住,決意訴諸法律行動。2023年6月28日,美國小說作家保羅·特倫布萊(Paul Tremblay)、莫娜·阿瓦德(Mona Awad)對OpenAI提告,控訴OpenAI在沒有獲得版權授權下,利用他們的作品來訓練AI模型。兩位作家指出,ChatGPT能夠精確地為其小說撰寫摘要,代表著他們的作品已被複製到AI模型中,屬於侵權行為。該訴訟代表全美國版權所有者,尋求一筆數額不詳的賠償金。

特倫布萊是一位美國小說作家,擅長撰寫黑暗奇幻和科幻小說,代表作有《世界盡頭的小屋》(The Cabin at the End of the World)。(圖片來源:X.com@BookCougars帳戶)

阿瓦德是一位加拿大小說家,以黑色喜劇小說作品而聞名,代表作包括《兔子》(Bunny)和《看待胖女孩的13種方式》(13 Ways of Looking at a Fat Girl)。(圖片來源:Amazon)

目前AI模型是在大量文本數據上進行訓練,惟OpenAI從未透露ChatGPT所用的訓練數據來源,只表示通常會從互聯網抓取資料,包括維基百科、網上檔案圖書等。兩位作家認為,書籍是訓練AI的理想材料,因為內裏結集了精心編製的高質文章,匯聚人類思想的精華。根據起訴書所述,估計OpenAI的訓練數據包含逾30萬本書,其中包括版權歸屬不明、或未獲授權的版權書籍。

書本被認為是訓練AI模型的最佳材料,因為書中輯錄了高質、有深度的長篇文章,儲存了人類思想的精華。(圖片來源:Pexels圖庫)

可是,要證明ChatGPT是怎樣採集、在哪裏採集這些書本內容,以及相關作者是否需承受經濟損失,卻是非常困難。除書籍外,ChatGPT也運用了大量網上訊息作數據訓練,例如網民在社交媒體上對這些書的討論貼文。因此,就算ChatGPT寫出的書籍摘要,跟作品的內容一模一樣,亦未必可以證明AI模型內包含了書籍內容。

英國修適士大學(University of Sussex)知識產權法講師安德烈斯·瓜達穆斯(Andres Guadamuz)表示,這是首宗針對ChatGPT的侵權訴訟,有助於探討生成式AI領域內行為合法性的問題。美國范德堡大學(Vanderbilt University)法律系教授丹尼爾·賈維斯(Daniel Gervais)預估,未來會有愈來愈多涉及生成式AI的侵權官司出現。

OpenAI擅取個人信息再遭訴訟

同樣是6月28日,OpenAI也遭到另一宗性質有點不同的集體訴訟:一群匿名人士指控OpenAI竊取大量個人信息,用於訓練其AI模型。克拉克森律師事務所(Clarkson Law Firm)向法院提交的訴狀中表示,原告的名字以姓名首字母縮寫作為標識。

這群匿名人士指出,OpenAI透過互聯網抓取了3,000億個單詞,當中包括個人信息、以及來自 X.com (Twitter) 和 Reddit 等社交媒體平台的貼文。雖然用戶的個人信息在社交媒體上是公開的,但如果數據被擅自複製到其他平台使用,卻屬於侵犯私隱行為。

他們估計,受害人數可能高達數百萬,涉及30億美元(約234億港元)的潛在損失。該訴訟不但尋求金錢賠償,更要求法院提高 OpenAI 數據收集和處理、使用個人數據的損害和賠償、以及用戶選擇退出數據收集機制的透明度。

華盛頓大學法律學者Inyoung Cheong認為,法院在審判時,要權衡AI技術使用這些內容時所帶來的各種風險與益處,故此相關案件可能需要數年時間始能結案。

OpenAI向傳媒業界遞出橄欖枝

當然,科技公司亦已意識到訓練AI模型所涉及的法律風險。如要解決版權問題,跟內容出版商達成協議,取得內容使用許可,可能是最好方法。奧特曼曾經表示,願意為某些領域的高質內容數據付出高昂代價。

最近OpenAI陸續向傳媒及出版業界遞出橄欖枝。2023年7月,OpenAI跟美聯社(Associated Press)達成為期2年的授權協議,將取得美聯社部分新聞報道的使用授權,內容甚至可以追溯至1985年的新聞。同月,OpenAI宣布向非牟利組織美國新聞計劃(American Journalism Project)提供500萬美元(約3,900萬港元)資金,用於建立一個工作室,幫助地方新聞網站使用AI技術來改善營運。

更有消息指,OpenAI、微軟、Google近幾個月會晤了新聞業高層,討論生成式AI工具使用新聞內容的版權問題。美國新聞集團(News Corp)、《紐約時報》集團(New York Times)、英國《衛報》(The Guardian)、以及德國報業集團斯普林格(Axel Springer)等,均至少與一家科技公司商討合作的可能性。

雙方的討論方向主要圍繞著版權費的定價與收費方式。較簡單的方式是「按年收費」,有業者開出的價碼是介乎500萬至2,000萬美元(約3,900萬至1.56億港元)的授權年費。另有傳媒業高層傾向採用「按量計價」,只要AI模型使用了新聞內容一次,就要付一次錢;但這種收費方式卻需要科技公司披露AI模型對內容的使用狀況,目前AI業界還沒有人這樣做。

FTC對OpenAI展開深入調查

在抵禦訴訟浪潮的同時,奧特曼一直試圖影響政府和立法者,如何制定監管AI的新法例。早前他周遊列國向全球各國政府示好,努力為利好AI發展的監管環境打好基礎。可惜事與願違,美國聯邦交易委員會(Federal Trade Commission,FTC)於2023年7月決定對OpenAI展開深入調查。這是該公司目前遇到最強力的監管行動。

OpenAI執行長奧特曼早前走訪世界各國,拜會當地政府官員和立法者,討論AI前景和威脅。2023年6月,他會晤了韓國總統尹錫悦和當地約100家初創企業。(圖片來源:X.com@sama帳戶)

聯邦貿易委員會表示,OpenAI將民眾個人聲譽和私隱暴露於危險中,涉嫌觸犯消費者保護法,因此必須介入調查。FTC要求OpenAI提供多種公司文件以協助調查,包括:ChatGPT的營銷計劃、廣告部署、訓練方法、怎樣收集訓練AI模型的資料、怎樣防止假資訊扭曲個人形象、以及怎樣防止AI模型洩露個人資料等。奧特曼強調,OpenAI的技術具有高度安全性,並以消費者為重,並表示樂意配合FTC的調查。

奧特曼聲稱,自己是從新聞得知FTC對OpenAI進行調查,認為此舉無助建立雙方信任,惟他表示,OpenAI仍會與FTC合作協助調查。(圖片來源:X.com@sama帳戶)

OpenAI遭到FTC調查,意味著不止美國國會,甚至連聯邦政府也開始加快對AI的監管步伐。盡管不少人質疑這些規管將窒礙AI發展,但適度監管卻可以防止AI造成的安全風險,並可以保護公眾私隱和作者版權。由是觀之,如何平衡AI發展與公眾利益,將成為各國政府未來的重要課題。

