《華盛頓郵報》近日報導中國最新 AI 模型 DeepSeek,並引用 DSET 研究員的評論。
DeepSeek 推出的新型聊天機器人被視為 ChatGPT 的競爭對手,號稱能以更低成本實現相當效能;此外,DeepSeek 採用開源策略,使較小型的企業得以運用其技術,進一步影響當前由美國與中國主導的 AI 市場格局。
DSET 民主治理組組長黃凱紳在報導中受訪指出,DeepSeek 憑藉其價格與效能,已成為 AI 市場中的強勁競爭者。他表示:「DeepSeek 的定價策略可能在全球市場帶來顛覆性的影響。」
《華郵》在報導中指出,在 DeepSeek 於 AI 產業迅速崛起後,各界對其相關主張提出諸多討論。該公司聲稱,其 AI 模型的訓練成本僅 560 萬美元,遠低於美國企業訓練相應模型所需的費用,並挑戰了過去 AI 開發需投入巨額資金的主流觀點,導致美國股市劇烈震盪,也引發了對 AI 產業未來競爭力的質疑。
然而,《華郵》揭露,DeepSeek 的母公司 High-Flyer 實際上建造了一座價值 1.39 億美元的超級電腦。此外,DeepSeek 的總投入接近 13 億美元,包括相關技術研發、硬體設備及材料成本等因素。這座超級電腦為 DeepSeek 開發 AI 助理模型提供了關鍵支持,顯示其所宣稱的 560 萬美元成本,並未完全反映訓練該模型所需的全部支出。
此外,部分專家對 DeepSeek 是否透過 OpenAI 的模型進行蒸餾學習,或是否規避了美國對 Nvidia 高階晶片的出口限制提出質疑。
《華郵》也引述其 AI 專家看法,認為 DeepSeek 的崛起代表 AI 產業競爭態勢的重大變化。儘管美國政府試圖透過禁止中國取得關鍵晶片來延緩其 AI 發展,High-Flyer 早在 2021 年便大量採購相關晶片,趕在 2022 年美國正式實施禁令前完成購置,此舉對 DeepSeek 的成功至關重要。
同時,研究人員也駁斥了 DeepSeek「憑空出現」的說法。憑藉 High-Flyer 超級電腦的運算能力及一支專業 AI 研究團隊,DeepSeek 能夠充分運用多年累積的技術資源,最終成功推出該模型。
DSET 將持續追蹤DeepSeek 討論發展,並提出進一步觀察。
報導連結:https://www.washingtonpost.com/technology/2025/01/31/deepseek-ai-china-us-nvidia/