觀點

方可成：為何科技巨頭的發展依賴新聞媒體的貢獻

發佈於

3 年前

2023 年 8 月 17 日

明報

【明報文章】很長時間以來，人們對科技企業的印象是：依靠技術創新獲得生產力的提升，它們創造的財富都來自先進科技。

但是，隨着人們對科技企業的認識更加全面和深刻，一些此前被忽略的事實也逐漸變得清晰起來：原來，科技巨頭創造的財富神話，其實並不止來自技術創新，也可能來自另一些更為傳統的做法。比如，蘋果公司的利潤中包括了對富士康工人的剝削；美團外賣的成功，建立在不需要跟外賣員簽訂正式的僱傭合同、毋須提供社會保障的基礎上——這些都與技術進步無關。

最近一兩年，另一個事實逐漸被揭示出來，那就是：包括搜索引擎、社交媒體平台、AI（人工智能）公司在內的科技巨頭，它們的發展其實都有賴於以免費或者極其低廉的價格，使用新聞媒體創造的內容。

換言之，新聞媒體支持了科技巨頭的發展，但並未得到合理回報。

搜索引擎：媒體內容提升用戶體驗

我們先來看搜索引擎。從用戶的視角出發，我們可以通過Google搜索到極為豐富的內容，這似乎完全應該感謝Google的偉大技術。

但是，Google做的只是爬取各個網頁上的信息並排序，它並不是這些信息的生產者。如果沒有人花費時間和資源提供網頁內容，那麼即便搜索引擎的技術再強大，都沒有任何用處。

在最近發表的一篇研究報告中，瑞士一個研究團隊嘗試衡量媒體生產的內容，對於Google的價值。他們招募了超過1500人參與一個實驗，這些人被隨機分到兩個小組當中，他們都被要求利用Google尋找信息，但其中一組使用的Google是搜不出任何媒體網頁的；另一組使用的Google，則是包含了媒體內容的正常版本。

在完成一系列搜索任務後，他們被要求回答對搜索引擎的滿意程度。以滿分5分為標準，使用了包含媒體內容的搜索引擎那一組給出4.1分，並有60%人表示將會繼續使用Google搜索信息；而搜索結果中不包含媒體內容的那一組只給出3.9分，只有55%人表示會繼續使用Google。

研究者還虛構了一款「Google付費訂閱」產品，詢問受試者是否有意願掏錢支持。結果，使用了完整版Google那一組的付費意願，比另一組高出16%。

這些數據都表明：新聞媒體提供的內容，實實在在地提升了Google用戶的使用體驗，讓他們更願意選擇Google。也正因為如此，Google才能通過廣告方式在他們身上掙到更多的錢。

根據這個研究團隊的測算，Google應該給瑞士的媒體支付1.54億瑞士法郎（約合13.7億港元）報酬，才算是對媒體內容給搜索體驗帶來的貢獻給予合理補償。

在這個議題上，搜索引擎公司經常提出的論述是：是搜索引擎為媒體網站帶來流量。然而這個研究發現，有超過半數（53%）用戶其實並不會點擊搜索結果的鏈接，而是留在Google頁面上閱讀搜索結果。這說明，搜索引擎給媒體帶來的好處是被誇大了。反過來，媒體給搜索引擎帶來的好處卻被有意低估，甚至忽略了。

人工智能：用媒體文章訓練機器

過去半年多，以ChatGPT為代表的AI大語言模型，是人們熱議的話題。在令人感到神奇的對話能力背後，此類大語言模型的開發都離不開海量原材料，那就是作為「訓練數據」的「語料庫」。

根據OpenAI等公司的說法，它們此前用來訓練AI的語料庫來自互聯網公開數據，包括媒體文章、維基百科詞條、社交媒體內容、論壇帖子、博客文章等。如果不是因為輸入了這些數據，那麼ChatGPT是不會擁有這樣高的對話能力。若把ChatGPT比作一輛汽車，那麼包括媒體文章在內的語料庫，就是它的汽油。

這裏自然就產生了著作權問題——在使用這些語料訓練AI的時候，科技公司並未徵得媒體記者、維基百科編輯者、社交媒體用戶等的同意。儘管這些內容的確在互聯網上公開可見，但這並不意味AI公司得到授權，可以在對AI的訓練中使用這些數據。

最近，Google向監管機構提出方案：希望明確可以使用互聯網上的公開內容，除非發表內容的人和機構明確表示不允許。顯然，這是為了給它利用這些內容訓練AI，掃除法律上的障礙。這一提案引來很多爭議，《紐約時報》很快就修改了自己的服務條款，直接寫明：禁止使用我們的內容來訓練AI系統。

媒體這樣的緊張反應，完全可以理解。AI公司在使用媒體投入大量資源生產的內容來訓練機器之後，反過來又可能用這些機器搶走媒體的生意——當AI可以毫不費力地自動生成內容的時候，媒體的生存當然會進一步受到威脅。對媒體來說，這就不僅是為他人作嫁衣裳，更是直接為威脅自己生存的對手提供免費助力了。它們當然要憤而抗議。

如何實現更公正的利益分配

在這種顯而易見的不公背景下，媒體機構與科技公司之間的談判已經開始。上個月，美聯社（AP）與OpenAI達成協議，正式授權後者使用美聯社從1985年至今的文本數據，以訓練AI大語言模型。作為回報，OpenAI會向美聯社支付費用，不過雙方沒有透露具體金額。此外，OpenAI也會為美聯社在新聞報道中探索使用生成式AI技術提供協助。

像《紐約時報》和美聯社這樣的大牌媒體，當然可以直接拒絕科技公司，或者與它們談判爭取利益；但對於千千萬萬中小型媒體來說，它們在科技巨頭面前的力量就要弱得多了。為了得到更公正的分配，它們需要聯合起來爭取自身權益。

上周，美國和歐洲一批數以千計的媒體機構就聯合發出公開信，要求對AI公司使用媒體生產的內容施以監管和行業行動。它們提出的要求包括：清晰列出開發AI模型所用到的所有語料數據；在使用之前，徵得知識產權所有人的許可；讓媒體機構可以跟AI公司集體談判，商議出補償媒體機構的具體方式，等等。

這些媒體機構在信中說，如果不及時干預AI公司對媒體內容的無償使用，「後果將是媒體的多樣性大幅減弱，媒體公司不再願意投入資源做新聞報道，這也將進一步減少公眾獲取高質量和值得信賴的信息的機會」。

這並非危言聳聽式的恐嚇。過去十幾年，我們已經見證了全球範圍內新聞業的衰落，而其中相當重要的一個原因就是：新型科技公司借助新聞媒體內容取得大批用戶，但並未向媒體提供恰當補償。

好在，如今人們愈來愈認識到媒體內容對新技術發展起到的作用。這種認識上的改變，是通向更公正的利益分配制度的第一步。

作者是香港中文大學新聞與傳播學院助理教授

（本網發表的時事文章若提出批評，旨在指出相關制度、政策或措施存在錯誤或缺點，目的是促使矯正或消除這些錯誤或缺點，循合法途徑予以改善，絕無意圖煽動他人對政府或其他社群產生憎恨、不滿或敵意）

[方可成]

Up Next

陳帆川：社交媒體獎勵制度有多「邪惡」？

不要錯過

雷競璇：「軟對抗」故事兩則

繼續閱讀

贊助商

明報新聞網

方可成：為何科技巨頭的發展 依賴新聞媒體的貢獻