觀點
陳帆川:DeepSeek是山寨貨還是真功夫?
【明報文章】DeepSeek-R1人工智能模型橫空出世,震撼全球。到底它是抄襲GPT的山寨貨,還是貨真價實的創新模型?
無論是DeepSeek網頁版還是手機程式版,都毫無疑問地跟ChatGPT的界面極為相似。至於其對答方法和給出答案的口脗,也跟ChatGPT幾乎一樣,予人的感覺類似iPhone與小米、亞馬遜與淘寶、ICQ與QQ、Google與百度。
跟所有其他取材自外國品牌的中國產品一樣,DeepSeek「平靚正」。OpenAI的旗艦推理模型o1索價26美元的工序,DeepSeek-R1僅收4美元。即使後者能力稍遜,但性價比驚人,連OpenAI金主微軟,都一邊批評DeepSeek竊取GPT數據,一邊將DeepSeek引入旗下的雲計算平台(註),供客戶選用。
DeepSeek的3個過人之處
DeepSeek除了跟其他國貨一樣主打性價比,還有三大過人之處。
第一,坊間印象從來是西方企業公開透明,中國企業封閉神秘,這次卻恰恰相反。DeepSeek採用開源技術、公開研究論文,用戶甚至可以將整個模型下載來免費使用,跟OpenAI由開源走向閉源的做法大相徑庭。
第二,正因為它公開,專家可以詳細檢驗葫蘆裏賣的是什麼藥,杜絕陰謀論。著名科技分析師Ben Thompson在題為「DeepSeek FAQ」的文章中,詳細分析了DeepSeek很大機會確如他們所言,以創新而「節儉」的方法,利用次一等晶片和極低成本,訓練出能夠跟GPT匹敵的模型。
第三,擁有外國學歷和經驗,一直在內地被視為高人一等,但DeepSeek創辦人梁文鋒自己就沒有海外留學經歷,招聘時也鍾情本地年輕畢業生,真真正正「中國製造」。他本人作風低調,鮮有接受訪問;新聞報道所轉載的照片,來來去去都是他出席一個官方座談會的側面相。這種對技術的專注,別樹一幟。
DeepSeek當然不是沒有爭議。第一,其平台的界面猶如ChatGPT翻版,難免予人「山寨」的感覺。第二,OpenAI和微軟聲稱能夠證明它以「蒸餾」方法竊取GPT答案作訓練之用,即使他們在技術上有所突破,也難以否認其產品本身很大程度是建基於GPT。第三,用戶無法剔除聊天紀錄作訓練模型之用,而且他們被爆出聊天紀錄外泄,對私隱的保障成疑。
比較少人談論的是,DeepSeek生成中文的能力似乎遠勝GPT。對香港人來說,它可能是繼淘寶和北上消費之後的又一祖國「福利」。
註:”DeepSeek R1 is now available on Azure AI Foundry and GitHub”, Jan 29 2025.
作者是新聞工作者、文化評論人
(本網發表的時事文章若提出批評,旨在指出相關制度、政策或措施存在錯誤或缺點,目的是促使矯正或消除這些錯誤或缺點,循合法途徑予以改善,絕無意圖煽動他人對政府或其他社群產生憎恨、不滿或敵意)
[陳帆川]
