《華盛頓郵報》報導中國 AI 模型 DeepSeek，引述 DSET 研究員評論

《華盛頓郵報》近日報導中國最新 AI 模型 DeepSeek，並引用 DSET 研究員的評論。

DeepSeek 推出的新型聊天機器人被視為 ChatGPT 的競爭對手，號稱能以更低成本實現相當效能；此外，DeepSeek 採用開源策略，使較小型的企業得以運用其技術，進一步影響當前由美國與中國主導的 AI 市場格局。

DSET 民主治理組組長黃凱紳在報導中受訪指出，DeepSeek 憑藉其價格與效能，已成為 AI 市場中的強勁競爭者。他表示：「DeepSeek 的定價策略可能在全球市場帶來顛覆性的影響。」

《華郵》在報導中指出，在 DeepSeek 於 AI 產業迅速崛起後，各界對其相關主張提出諸多討論。該公司聲稱，其 AI 模型的訓練成本僅 560 萬美元，遠低於美國企業訓練相應模型所需的費用，並挑戰了過去 AI 開發需投入巨額資金的主流觀點，導致美國股市劇烈震盪，也引發了對 AI 產業未來競爭力的質疑。

然而，《華郵》揭露，DeepSeek 的母公司 High-Flyer 實際上建造了一座價值 1.39 億美元的超級電腦。此外，DeepSeek 的總投入接近 13 億美元，包括相關技術研發、硬體設備及材料成本等因素。這座超級電腦為 DeepSeek 開發 AI 助理模型提供了關鍵支持，顯示其所宣稱的 560 萬美元成本，並未完全反映訓練該模型所需的全部支出。

此外，部分專家對 DeepSeek 是否透過 OpenAI 的模型進行蒸餾學習，或是否規避了美國對 Nvidia 高階晶片的出口限制提出質疑。

《華郵》也引述其 AI 專家看法，認為 DeepSeek 的崛起代表 AI 產業競爭態勢的重大變化。儘管美國政府試圖透過禁止中國取得關鍵晶片來延緩其 AI 發展，High-Flyer 早在 2021 年便大量採購相關晶片，趕在 2022 年美國正式實施禁令前完成購置，此舉對 DeepSeek 的成功至關重要。

同時，研究人員也駁斥了 DeepSeek「憑空出現」的說法。憑藉 High-Flyer 超級電腦的運算能力及一支專業 AI 研究團隊，DeepSeek 能夠充分運用多年累積的技術資源，最終成功推出該模型。

DSET 將持續追蹤DeepSeek 討論發展，並提出進一步觀察。

報導連結：https://www.washingtonpost.com/technology/2025/01/31/deepseek-ai-china-us-nvidia/

分享此文

最新消息

《華盛頓郵報》報導中國 AI 模型 DeepSeek，引述 DSET 研究員評論