觀點

陳帆川：DeepSeek是山寨貨還是真功夫？

發佈於

1 年前

2025 年 2 月 6 日

明報

【明報文章】DeepSeek-R1人工智能模型橫空出世，震撼全球。到底它是抄襲GPT的山寨貨，還是貨真價實的創新模型？

無論是DeepSeek網頁版還是手機程式版，都毫無疑問地跟ChatGPT的界面極為相似。至於其對答方法和給出答案的口脗，也跟ChatGPT幾乎一樣，予人的感覺類似iPhone與小米、亞馬遜與淘寶、ICQ與QQ、Google與百度。

跟所有其他取材自外國品牌的中國產品一樣，DeepSeek「平靚正」。OpenAI的旗艦推理模型o1索價26美元的工序，DeepSeek-R1僅收4美元。即使後者能力稍遜，但性價比驚人，連OpenAI金主微軟，都一邊批評DeepSeek竊取GPT數據，一邊將DeepSeek引入旗下的雲計算平台（註），供客戶選用。

DeepSeek的3個過人之處

DeepSeek除了跟其他國貨一樣主打性價比，還有三大過人之處。

第一，坊間印象從來是西方企業公開透明，中國企業封閉神秘，這次卻恰恰相反。DeepSeek採用開源技術、公開研究論文，用戶甚至可以將整個模型下載來免費使用，跟OpenAI由開源走向閉源的做法大相徑庭。

第二，正因為它公開，專家可以詳細檢驗葫蘆裏賣的是什麼藥，杜絕陰謀論。著名科技分析師Ben Thompson在題為「DeepSeek FAQ」的文章中，詳細分析了DeepSeek很大機會確如他們所言，以創新而「節儉」的方法，利用次一等晶片和極低成本，訓練出能夠跟GPT匹敵的模型。

第三，擁有外國學歷和經驗，一直在內地被視為高人一等，但DeepSeek創辦人梁文鋒自己就沒有海外留學經歷，招聘時也鍾情本地年輕畢業生，真真正正「中國製造」。他本人作風低調，鮮有接受訪問；新聞報道所轉載的照片，來來去去都是他出席一個官方座談會的側面相。這種對技術的專注，別樹一幟。

DeepSeek當然不是沒有爭議。第一，其平台的界面猶如ChatGPT翻版，難免予人「山寨」的感覺。第二，OpenAI和微軟聲稱能夠證明它以「蒸餾」方法竊取GPT答案作訓練之用，即使他們在技術上有所突破，也難以否認其產品本身很大程度是建基於GPT。第三，用戶無法剔除聊天紀錄作訓練模型之用，而且他們被爆出聊天紀錄外泄，對私隱的保障成疑。

比較少人談論的是，DeepSeek生成中文的能力似乎遠勝GPT。對香港人來說，它可能是繼淘寶和北上消費之後的又一祖國「福利」。

註：”DeepSeek R1 is now available on Azure AI Foundry and GitHub”, Jan 29 2025.

作者是新聞工作者、文化評論人

（本網發表的時事文章若提出批評，旨在指出相關制度、政策或措施存在錯誤或缺點，目的是促使矯正或消除這些錯誤或缺點，循合法途徑予以改善，絕無意圖煽動他人對政府或其他社群產生憎恨、不滿或敵意）

[陳帆川]

Up Next

蔡曉瑩：玩具也轉型——從Jellycat看身分認同及情感需求

不要錯過

聞風筆動：特朗普關稅戰背後圖謀金融界高人拆解／文：李先知

繼續閱讀

贊助商

明報新聞網

陳帆川：DeepSeek是山寨貨還是真功夫？

DeepSeek的3個過人之處

作者是新聞工作者、文化評論人

[陳帆川]

猜你喜歡