新聞信息到底屬於誰?這是一個一直在爭論卻不會有結果的話題。《紐約時報》去年年底正式對OpenAI和微軟提告,指控兩家公司在未經授權情況下,使用《紐約時報》文本訓練生成式人工智能技術。這種官司一般曠日持久,隨時幾年才有結果,但其結果非常有象徵意義。今天OpenAI面對的問題,較早前的面書(Facebook),乃至更早的新聞媒體本身,都曾經面對過:那就是新聞信息本身屬於誰?誰可以從中獲益?
《紐約時報》今次開美國主要媒體先例,指控OpenAI和微軟利用其百萬篇文字作品訓練AI,侵犯其版權,接著又反過來與《紐時》競爭可信資訊來源地位。其實除了眾多媒體可能效仿,還有作家、攝影師可能都會是潛在的提告者。美國女性單口喜劇演員莎拉.西爾弗曼(Sarah Silverman)較早前就指控Meta與OpenAI以她的回憶錄作為訓練AI的文本。小說家的強納森・法蘭森(Jonathan Franzen)等更多的人也提告。大圖庫網Getty Images也控告一家AI公司使用其版權視覺圖像來生成影像。
生成式人工智能技術,本來就是要靠大量的信息「餵養」來成長的,因此過程中必然要用大量的文本、圖片乃至視頻,否則AI本身不可能無中生有地組織大量的文字和圖像內容。如果說AI公司所有「餵養」的原材料都要付費來購買,那這些AI公司都要破產了。
但AI公司並非沒有反擊的手段。OpenAI先前曾回應另一起侵權集體訴訟表示,訓練模型是依照「合理使用」原則。OpenAI的律師團聲稱,許多法院已經詮釋合理使用原則意味著「創新者以變革性方式使用版權素材並不違反版權」。何謂「合理使用」呢?這涉及不同地方的法律原則,一般而言,新聞信息本身是沒有版權的,例如俄羅斯發生了一起恐襲事件,任何一家通訊社或新聞媒體,乃至任何一個人都可以報道和傳播這則新聞信息,沒有任何人可以宣稱擁有這則新聞的版權。但如果是帶有個人原創性質的內容,例如小說、詩歌一類,就擁有版權。但如果是用作教育或非牟利的用途,仍然可以用「合理使用」來作辯解。
所以問題的癥結在於錢。現在OpenAI和其他人工智能公司,以網絡上的新聞等各種文本訓練機器人,再加以商用,已經吸引天量的投資。OpenAI本身市值已經近千億,怎能不令傳統媒體眼紅呢?
事實上,媒體是更早利用信息去賺錢的一方,也曾經受到質疑。例如香港人喜歡睇的八卦新聞,一個女星的個人私隱被媒體爆出來了,大肆炒作,媒體從中拉廣告賺了不少錢。但作為事件本身的主角、受害者——該女星本身,是不能分到任何收入的。緋聞主角賺不到錢,反而被傳播信息的媒體拿去賺錢了。但也有人反其道而行,主動造假去製造緋聞炒作自己,利用媒體去拉抬自己的商業價值。到底是誰佔了誰的便宜?很難說得準。要視乎你從哪個視角看問題。
今天媒體與AI的扯皮也是一樣的道理。媒體說AI侵權,但隨著技術發展,將來人們獲取和組織信息必然越來越依賴AI。今天人們拿信息「餵養」AI,將來AI將會反過來「餵養」全人類。單一媒體如果與AI鬧翻了,AI以後不用該媒體來訓練,該單一媒體將會在不久的將來被邊緣化,無人問津了。
原圖:Pixabay
https://pixabay.com/illustrations/ai-generated-network-technology-8619465/
文章純屬作者個人意見,並不代表本報立場
投票已截止,多謝支持