Connect with us

觀點

方可成:為何科技巨頭的發展 依賴新聞媒體的貢獻

發佈於

【明報文章】很長時間以來,人們對科技企業的印象是:依靠技術創新獲得生產力的提升,它們創造的財富都來自先進科技。

但是,隨着人們對科技企業的認識更加全面和深刻,一些此前被忽略的事實也逐漸變得清晰起來:原來,科技巨頭創造的財富神話,其實並不止來自技術創新,也可能來自另一些更為傳統的做法。比如,蘋果公司的利潤中包括了對富士康工人的剝削;美團外賣的成功,建立在不需要跟外賣員簽訂正式的僱傭合同、毋須提供社會保障的基礎上——這些都與技術進步無關。

最近一兩年,另一個事實逐漸被揭示出來,那就是:包括搜索引擎、社交媒體平台、AI(人工智能)公司在內的科技巨頭,它們的發展其實都有賴於以免費或者極其低廉的價格,使用新聞媒體創造的內容。

換言之,新聞媒體支持了科技巨頭的發展,但並未得到合理回報。

搜索引擎:媒體內容提升用戶體驗

我們先來看搜索引擎。從用戶的視角出發,我們可以通過Google搜索到極為豐富的內容,這似乎完全應該感謝Google的偉大技術。

但是,Google做的只是爬取各個網頁上的信息並排序,它並不是這些信息的生產者。如果沒有人花費時間和資源提供網頁內容,那麼即便搜索引擎的技術再強大,都沒有任何用處。

在最近發表的一篇研究報告中,瑞士一個研究團隊嘗試衡量媒體生產的內容,對於Google的價值。他們招募了超過1500人參與一個實驗,這些人被隨機分到兩個小組當中,他們都被要求利用Google尋找信息,但其中一組使用的Google是搜不出任何媒體網頁的;另一組使用的Google,則是包含了媒體內容的正常版本。

在完成一系列搜索任務後,他們被要求回答對搜索引擎的滿意程度。以滿分5分為標準,使用了包含媒體內容的搜索引擎那一組給出4.1分,並有60%人表示將會繼續使用Google搜索信息;而搜索結果中不包含媒體內容的那一組只給出3.9分,只有55%人表示會繼續使用Google。

研究者還虛構了一款「Google付費訂閱」產品,詢問受試者是否有意願掏錢支持。結果,使用了完整版Google那一組的付費意願,比另一組高出16%。

這些數據都表明:新聞媒體提供的內容,實實在在地提升了Google用戶的使用體驗,讓他們更願意選擇Google。也正因為如此,Google才能通過廣告方式在他們身上掙到更多的錢。

根據這個研究團隊的測算,Google應該給瑞士的媒體支付1.54億瑞士法郎(約合13.7億港元)報酬,才算是對媒體內容給搜索體驗帶來的貢獻給予合理補償。

在這個議題上,搜索引擎公司經常提出的論述是:是搜索引擎為媒體網站帶來流量。然而這個研究發現,有超過半數(53%)用戶其實並不會點擊搜索結果的鏈接,而是留在Google頁面上閱讀搜索結果。這說明,搜索引擎給媒體帶來的好處是被誇大了。反過來,媒體給搜索引擎帶來的好處卻被有意低估,甚至忽略了。

人工智能:用媒體文章訓練機器

過去半年多,以ChatGPT為代表的AI大語言模型,是人們熱議的話題。在令人感到神奇的對話能力背後,此類大語言模型的開發都離不開海量原材料,那就是作為「訓練數據」的「語料庫」。

根據OpenAI等公司的說法,它們此前用來訓練AI的語料庫來自互聯網公開數據,包括媒體文章、維基百科詞條、社交媒體內容、論壇帖子、博客文章等。如果不是因為輸入了這些數據,那麼ChatGPT是不會擁有這樣高的對話能力。若把ChatGPT比作一輛汽車,那麼包括媒體文章在內的語料庫,就是它的汽油。

這裏自然就產生了著作權問題——在使用這些語料訓練AI的時候,科技公司並未徵得媒體記者、維基百科編輯者、社交媒體用戶等的同意。儘管這些內容的確在互聯網上公開可見,但這並不意味AI公司得到授權,可以在對AI的訓練中使用這些數據。

最近,Google向監管機構提出方案:希望明確可以使用互聯網上的公開內容,除非發表內容的人和機構明確表示不允許。顯然,這是為了給它利用這些內容訓練AI,掃除法律上的障礙。這一提案引來很多爭議,《紐約時報》很快就修改了自己的服務條款,直接寫明:禁止使用我們的內容來訓練AI系統。

媒體這樣的緊張反應,完全可以理解。AI公司在使用媒體投入大量資源生產的內容來訓練機器之後,反過來又可能用這些機器搶走媒體的生意——當AI可以毫不費力地自動生成內容的時候,媒體的生存當然會進一步受到威脅。對媒體來說,這就不僅是為他人作嫁衣裳,更是直接為威脅自己生存的對手提供免費助力了。它們當然要憤而抗議。

如何實現更公正的利益分配

在這種顯而易見的不公背景下,媒體機構與科技公司之間的談判已經開始。上個月,美聯社(AP)與OpenAI達成協議,正式授權後者使用美聯社從1985年至今的文本數據,以訓練AI大語言模型。作為回報,OpenAI會向美聯社支付費用,不過雙方沒有透露具體金額。此外,OpenAI也會為美聯社在新聞報道中探索使用生成式AI技術提供協助。

像《紐約時報》和美聯社這樣的大牌媒體,當然可以直接拒絕科技公司,或者與它們談判爭取利益;但對於千千萬萬中小型媒體來說,它們在科技巨頭面前的力量就要弱得多了。為了得到更公正的分配,它們需要聯合起來爭取自身權益。

上周,美國和歐洲一批數以千計的媒體機構就聯合發出公開信,要求對AI公司使用媒體生產的內容施以監管和行業行動。它們提出的要求包括:清晰列出開發AI模型所用到的所有語料數據;在使用之前,徵得知識產權所有人的許可;讓媒體機構可以跟AI公司集體談判,商議出補償媒體機構的具體方式,等等。

這些媒體機構在信中說,如果不及時干預AI公司對媒體內容的無償使用,「後果將是媒體的多樣性大幅減弱,媒體公司不再願意投入資源做新聞報道,這也將進一步減少公眾獲取高質量和值得信賴的信息的機會」。

這並非危言聳聽式的恐嚇。過去十幾年,我們已經見證了全球範圍內新聞業的衰落,而其中相當重要的一個原因就是:新型科技公司借助新聞媒體內容取得大批用戶,但並未向媒體提供恰當補償。

好在,如今人們愈來愈認識到媒體內容對新技術發展起到的作用。這種認識上的改變,是通向更公正的利益分配制度的第一步。

作者是香港中文大學新聞與傳播學院助理教授

(本網發表的時事文章若提出批評,旨在指出相關制度、政策或措施存在錯誤或缺點,目的是促使矯正或消除這些錯誤或缺點,循合法途徑予以改善,絕無意圖煽動他人對政府或其他社群產生憎恨、不滿或敵意)

[方可成]

繼續閱讀
贊助商