此外,隨著訓練成本降低,AI 服務的資本門檻也可能下降。在全球 AI 產業競爭加劇的情況下,對運算能力的需求不太可能下降,反而可能持續成長。為了在人工智慧競賽中保持領先,中國仍需要精密高端晶片的持續供應。
在此意義上,擴展定律(Scaling Law)依然適用於 AI 產業。DeepSeek 的成功只表明 AI 模型的訓練(至少在數學層面上),仍有降低資本投入門檻的空間,即使用較少的硬體資源實現更有效率的運算,這對整體 AI 產業來說是有利的。而如果DeepSeek在成本效益上的突破證明可行,美國的AI公司也沒有理由無法跟進採用。
重點四:中國 AI 價格戰席捲全球的可能情境
那麼,美國及其盟國究竟應該擔心什麼呢?關鍵問題在於:如果中國的 AI 服務能夠以較低的價格提供媲美美國對手模型的性能,會發生什麼事?DeepSeek 展示一個可能的發展情境——中國正在全球範圍內發起一場 AI 服務的價格戰(即便目前看起來像是一場意外),而這場戰爭在中國國內已經開打。
2025 年 2 月 3 日
中國的AI衝擊?DeepSeek的顛覆性影響及侷限
作者:黃凱紳
DeepSeek(深度求索)的橫空出世引發全球科技政策的激烈辯論。其訓練成本究竟有多高,與美國的先進模型的開發路徑是否具有可比性?是否涉及使用禁用的高階晶片?這些問題仍有待持續追蹤並進一步驗證。然而,可以確定的是,DeepSeek不僅帶有定價低廉的優勢,還能提供與其競爭對手不相上下的表現,成為其在AI服務市場上具有強大競爭力的重要技術基礎。
從科技政策的角度來看,DeepSeek的出現可能預示著未來全球AI服務市場將進入價格戰階段。這樣的發展背後,有兩個戰略風險值得關注:首先,DeepSeek的低定價策略可能對其他國家AI產業的發展構成衝擊,尤其是那些無法承受如此低價格或缺乏相應技術支持的國家和企業;同時,使用中國AI服務可能帶來隱私問題與內容操控等安全風險。
原文網址:
https://thediplomat.com/2025/01/chinas-ai-shock-what-deepseek-disrupts-and-doesnt/
——
2024 年 12 月,總部位於杭州的 AI 公司 DeepSeek 發布其 V3 模型,引發全球的高度關注,被稱為「中國 AI 衝擊」。如果DeepSeek所述為真,它的 V3 模型能以更低的成本達到與美國競爭對手相當的性能,動搖美國在 AI 領域的主導地位,也挑戰長期以來業界優先考量硬體資源堆積算力的產業模式。而美國針對先進晶片的出口管制政策所打擊的,正是以該模式運行的中國公司。
如美國總統川普所言,DeepSeek 的出現不僅是對美國科技產業的「警鐘」,更是美國及其盟友重新評估科技政策策略的關鍵時刻。
DeepSeek 到底顛覆了什麼?它在成本效率上的突破令人矚目:以V3模型為例,其總訓練成本僅 557.6 萬美元,僅為 GPT-4(約1 億美元)成本的 5.5%。該模型訓練時僅使用 2,048 顆 NVIDIA GPU,效率是美國企業(通常需要 16,000 顆 GPU)的 8 倍。更值得關注的是,DeepSeek 宣稱並未使用最先進的 H100 GPU,而是宣稱使用較低階的 H800 GPU,卻仍然有相匹配的性能表現。
因此,DeepSeek 的低成本模型挑戰業界傳統認知,即大型 AI 模型的優越性必須建立在龐大運算資源的累積之上。這一發展可能削弱中國對美國 AI 晶片的依賴,進而對美國以高階運算能力為核心的出口管制政策構成挑戰。
重點一:成本不透明
然而,關於 DeepSeek-V3 模型的成本仍有許多疑點需要進一步釐清。V3 模型的性能與 GPT-4 相當,而 2025 年 1 月發布的 R1 模型則對應 OpenAI 的進階模型 o1。值得注意的是,DeepSeek-V3(非R1模型)的訓練成本才是各路報導中的 557.6 萬美元。此外,該數字不包含完整的訓練成本,例如架構開發、資料收集與前期研究等費用。
V3 模型的訓練過程使用內部版本的 R1 模型生成的資料,這種方法的目的是結合 R1 生成的高準確度推理資料,並兼具清晰簡潔的標準數據。然而, R1 的資料及架構開發費用及其它相關的成本紀錄並未公開。 V3 的總體成本該如何計算,這個問題的答案並不清楚。
重點二:漸進式創新,而非革命性突破
從技術競爭的角度來看,DeepSeek 在基礎大型語言模型(LLM)技術方面有進步,尤其是在多頭潛在注意力(Multi-head Latent Attention, MLA) 和混合專家模型(Mixture-of-Experts, MoE)的應用,確實提升模型的運算效率。但這些技術並非機密,因此各國政府不必過度擔憂。
然而,DeepSeek 的技術仍具備一定的創新性。MLA 技術透過低秩壓縮 Key-Value(KV)矩陣,改進傳統注意力機制,使 KV 快取大小減少 6.3 倍,顯著降低記憶體使用量,進而降低訓練與推理成本。此外,DeepSeek 似乎也是首家在訓練超大規模稀疏 MoE 模型上取得成功的企業,展現出其提升模型效率與降低傳輸成本的能力。
雖然這些發展令人矚目,但它們更像是 AI 領域的漸進式創新,而非足以改變全球技術競爭格局的革命性突破。
儘管DeepSeek確實還無法代表該技術領域的顛峰。但他們這次展現的技術優勢在於可以提供與先進AI模型相近效能的前提下,大幅壓低成本。這當然使人質疑美國科技界大量堆砌運算能力這種奢侈的開發方式是否是種浪費。
然而,擁有豐富先進資源的技術領先者往往就是承擔創新科技高成本的一方。任何創新在初期都會伴隨巨大成本。但隨著降低成本上的技術創新,成本就會降低,使後來者,尤其是來自中國的後來者,可以迅速採用這些新技術,以較低的成本追趕領先者。
重點三:美國晶片制裁的有效性受到挑戰?
DeepSeek 透過低成本訓練模型的策略,突顯了後發者的優勢,並引發關於 AI 訓練是否必須依賴龐大算力的辯論。部分觀點質疑中國是否仍需依賴美國的高端晶片,進而挑戰以高階計算能力為核心的美國出口管制政策。如果使用較低階的晶片就能夠達到相近的性能,那麼高階晶片的溢價可能並不合理。
然而,這種觀點可能是誤解。高階晶片通常能提供更高效率,如果 DeepSeek 能獲得更高階的晶片,他們不太可能刻意選擇低階晶片。
此外,隨著訓練成本降低,AI 服務的資本門檻也可能下降。在全球 AI 產業競爭加劇的情況下,對運算能力的需求不太可能下降,反而可能持續成長。為了在人工智慧競賽中保持領先,中國仍需要精密高端晶片的持續供應。
在此意義上,擴展定律(Scaling Law)依然適用於 AI 產業。DeepSeek 的成功只表明 AI 模型的訓練(至少在數學層面上),仍有降低資本投入門檻的空間,即使用較少的硬體資源實現更有效率的運算,這對整體 AI 產業來說是有利的。而如果DeepSeek在成本效益上的突破證明可行,美國的AI公司也沒有理由無法跟進採用。
重點四:中國 AI 價格戰席捲全球的可能情境
那麼,美國及其盟國究竟應該擔心什麼呢?關鍵問題在於:如果中國的 AI 服務能夠以較低的價格提供媲美美國對手模型的性能,會發生什麼事?DeepSeek 展示一個可能的發展情境——中國正在全球範圍內發起一場 AI 服務的價格戰(即便目前看起來像是一場意外),而這場戰爭在中國國內已經開打。
DeepSeek-V3 和 R1 模型的實際訓練成本仍不明確。外界對於這些模型是否僅憑低階 H800 GPU 即能達成如此高效能,所知甚少,其可行性仍有待驗證。然而,關鍵在於不能將成本與價格混為一談。DeepSeek 的實際成本並不透明,且尚不清楚該公司是否曾利用美國模型來訓練自家模型,並以可能違反使用條款的方式獲取技術。確定的是,DeepSeek 目前以極低的價格提供其 AI 服務。
例如,DeepSeek-R1 在使用快取資料時每百萬個輸入Token僅收費 $0.14,而每百萬個輸出Token則收費 $2.19。相較之下,OpenAI 的 o1 模型每百萬個快取輸入Token的費用為 $1.25,而每百萬個輸出Token則為 $10.00。這表示,DeepSeek-R1 的輸入Token成本幾乎是 OpenAI o1 的九分之一,而輸出Token成本則約為其四分之一。
DeepSeek具競爭力的低價可以說是在國際上呈現了2024年中國國內AI服務價格戰的情況。例如,阿里巴巴在去年5月將其Qwen-Long的價格降低了97%,並在12月進一步調降降其視覺語言模型Qwen-VL的價格達85%。然而,不同於DeepSeek,許多中國AI公司降價是因為其模型缺乏競爭力,難以與美國對手匹敵。即便進行了這些降價措施,仍難以吸引高品質客戶。相比之下,這次DeepSeek 提供的性能可與競爭產品相媲美,同時使其價格真的具有吸引力,而這才是問題所在。
對於民主國家而言,在近期主權AI倡議的背景下,中國推出經濟實惠又高效的人工智慧服務,引發了兩大主要的戰略風險。首先是國家安全風險,特別是資料隱私以及可能的結果操控。其次,中國在人工智慧服務上的激進定價策略,對其他國家人工智慧產業的發展構成威脅,類似於中國過去在歐美地區太陽能板及電動車所見的傾銷行為。
如果這一情況出現,必須認識到,中國在人工智慧方面的價格優勢不太可能只歸因於較低的訓練成本,因為其他公司可能很快也會採納這種做法;還應關注類如政府補貼等這類中國經常採用的非市場機制,這可能在未來賦予中國產業進一步的競爭優勢。
相關文章
贏得馬拉松,而非短跑:《科技與大國崛起》作者Jeffrey Ding訪談
作者:賴又豪
2025 年 1 月 10 日
川普2.0 半導體產業政策動態(3):DSET訪問馬修・特平(Matthew Turpin)
作者:趙芳儀
2025 年 1 月 10 日
抖音禁不禁?台灣的自由主義管制困境
作者: 黃凱紳
2025 年 1 月 9 日