上週我寫了兩篇文章——一篇是 GLM-5 技術報告解讀,一篇是 Anthropic 蒸餾戰爭

寫完之後,我一直在想一件事:如果 GLM-5 真的沒有蒸餾,而且全華為晶片訓練,而且 API 價格只有 Opus 的五分之一——那這代表什麼?

不是技術突破的故事。技術突破已經寫過了。

這是一個商業模式的故事。


從「賣商品」到「賣 Token」

過去三十年,中國出海的主旋律是商品——從 T-shirt、電子零件,到 TikTok、SHEIN、Temu。賣的是實體商品、軟體、用戶體驗、流量。

2026 年,出海的東西變了。不再是商品,是 Token

什麼意思?

鉅亨號二月的報導給了一個驚人的數字:2026 年 2 月的 Token 呼叫量是 2025 年 2 月的 13 倍。呼叫量前三名全是中國模型——MiniMax、Kimi、GLM。中國第一次在生產型 Token 呼叫量上反超美國。

這不是實驗室數據,是真金白銀的 API 呼叫。有人在付錢買這些 token,而且買的量超過了美國模型。

我覺得這件事的意義被低估了。

過去我們談 AI 競賽,焦點永遠在 Benchmark:誰的 SWE-bench 高、誰的推理能力強。但 Benchmark 是技術指標,不是商業指標。商業指標是:誰的 token 被更多人買。

而現在答案是中國。


成本結構:為什麼中國能便宜這麼多

先看定價。2026 年 2 月的 API 價格對比:

模型 等級 輸入 $/M tokens 輸出 $/M tokens
Claude Opus 4.5 Frontier $5.00 $25.00
GPT-5 Frontier $1.25 $10.00
DeepSeek R1 推理型 $0.55 $2.19
GLM-5 Frontier 開源 ~$1.00 ~$3.20
DeepSeek V3.2 通用型 $0.27 $1.10

GLM-5 跟 Opus 4.5 比,輸入便宜 5 倍,輸出便宜 8 倍。跟 GPT-5 比也便宜不少。

但重點不是「便宜」這兩個字。重點是:為什麼能便宜?

Token 的生產成本可以拆成這個公式:

Token 價格 ≈ 硬體折舊 + (能耗 × 電價 × PUE) + 工程維運 + 合規成本

中國在每一項都有結構性優勢。


第一張牌:電力

The Diplomat 去年的分析指出,中國工業電價約 $0.08/kWh,美國約 $0.18/kWh。中國便宜 56%

這不是一次性的匯率優勢,是結構性的——中國政府對化石燃料和綠能的補貼規模都是美國的三倍。Fortune 去年八月一篇報導的標題更直白:「AI 專家從中國回來後震驚:美國電網太弱了,比賽可能已經結束。」

對 AI 推理來說,電力成本是持續性支出。訓練只燒一次電,但推理是每一個 token 都在燒。Token 出海賣的是推理能力,電價優勢會持續放大

粗估:如果 token 生產成本中,電力佔 30-40%,光電價差異就能帶來 15-20% 的成本優勢


第二張牌:開源人才 + 工程效率

DeepSeek 用限制版的 H800(而非 H100)訓練出 R1,能耗效率是美國模型的 10-40 倍。這不是開玩笑——同樣的推理能力,中國團隊用更少的算力跑出來。

為什麼?我覺得跟人才結構有關。

中國開源社群的密度和活躍度在過去兩年暴增。智譜的 Slime RL 框架、DeepSeek 的 MoE 架構優化、Kimi 的 Agent Swarm——這些不是抄來的(至少智譜不在蒸餾指控名單上),是工程師一行一行寫出來的。

而且中國 AI 工程師的薪資結構跟矽谷不同。不是說便宜等於好,但同樣投入的人力成本,能產出更多的工程優化。


第三張牌:硬體自主

這是 GLM-5 最被低估的訊息。

GLM-5 的 744B 參數,全部在 10 萬張華為昇騰 910B 上訓練完成。零 NVIDIA 依賴。使用的是華為 MindSpore 框架。

這意味著什麼?

美國的出口管制(NVIDIA H100/H200 禁售中國)本來是要掐住中國 AI 的算力咽喉。但 GLM-5 證明了:用國產晶片,可以訓練出 frontier 等級的模型。

而且華為已經公布了三年的 AI 晶片路線圖。昇騰 910C、920 都在計畫中。如果晶片效能持續追趕,而且不受禁令影響——中國的硬體成本會進一步下降。

這三張牌疊在一起:電力便宜 56% + 工程效率高 + 硬體自主不受禁令

結論是:中國可以用大約 80% 的成本,生產出 SOTA 90% 等級的 token。


GLM-5 為什麼是指標性案例

我在之前的文章裡從技術角度分析了 GLM-5。這裡換商業角度。

GLM-5 同時滿足了 Token 出海的所有條件:

1. 技術自主可行——沒被指控蒸餾

Anthropic 的蒸餾指控名單上有 DeepSeek、Moonshot AI(Kimi)、MiniMax,但沒有智譜

在那篇文章裡我寫過:「居然沒有 GLM。或許代表他們真的在做自己的事情吧。」

這不只是道德問題,是商業問題。如果你的模型被指控是蒸餾的,海外客戶會擔心法律風險。但如果你能證明技術自主——開源程式碼、公開技術報告、MIT 授權——客戶的信任成本就低很多。

2. 品質夠用——SWE-bench 打贏 GPT-5.2

GLM-5 在 SWE-bench Verified 拿到 77.8%,贏過 GPT-5.2 的 76.2%,只輸 Opus 4.6 三個百分點。

對大多數企業客戶來說,SOTA 跟 SOTA-3% 的差別幾乎感受不到。但價格差 5-8 倍是感受得到的。

3. 全華為訓練——硬體不受制於人

這代表 GLM-5 的推理基礎設施可以全部用國產硬體。不需要擔心 NVIDIA 斷供、不需要走灰色市場買晶片。供應鏈穩定,成本可預測。

4. MIT 開源——兩條路都能走

MIT 授權意味著海外開發者可以下載、微調、私有化部署。這是 Stack-as-a-Standard 路徑——不只賣 token,還輸出技術標準。

同時智譜也提供 API 服務,這是 Token-as-a-Service 路徑。

兩手都打,生態就建起來了。


兩條出海路徑

鉅亨號的報導把 Token 出海分成兩條路徑,我覺得分析得很到位:

路徑 A:Token-as-a-Service(推理即服務)

海外用戶通過 API 直接呼叫中國模型。Token 在中國境內或中資海外節點被「生產」出來。

優勢:

  • 技術門檻最低(調 API 就好)
  • 邊際成本隨規模下降
  • 中國電力優勢直接體現

挑戰:

  • 延遲(跨境網路)
  • 合規(數據主權問題)
  • 跨境支付
  • 地緣政治風險(萬一被制裁?)

路徑 B:Stack-as-a-Standard(標準即生態)

海外開發者下載中國開源模型,在自己的基礎設施上微調部署。

優勢:

  • 沒有延遲問題
  • 沒有數據主權問題
  • 建立生態系統和技術標準

挑戰:

  • 無法直接從電力優勢獲利
  • 需要長期社群經營
  • 開源模型的商業化困難

2025 年的數據顯示,中國 OSS 模型的週 token 佔比在部分時段已經逼近 30%

我認為真正厲害的玩家(比如智譜)會兩條路都走。API 賺短期收入,開源建長期生態。等生態建起來,就算別人想換,轉換成本也太高了。


這像什麼?——製造業出海的 AI 翻版

如果你覺得這個模式聽起來很熟悉,那是因為它就是中國製造業出海的翻版。

維度 傳統製造出海 Token 出海
賣什麼 實體商品 推理能力(Token)
成本優勢來源 勞動力 + 供應鏈 電力 + 硬體 + 工程效率
品質定位 「夠用就好」→ 逐步升級 SOTA 90% → 逐步追趕
出海路徑 OEM 代工 → 自有品牌 API 服務 → 開源生態
護城河 規模效應 規模效應 + 開源鎖定

三十年前,中國賣的是 T-shirt 和電子零件。 十年前,賣的是手機和 App。 現在,賣的是 Token——可計量的智力。

而且跟實體商品不同,Token 沒有物流成本、沒有關稅(目前)、沒有庫存。一旦模型訓練完成,邊際成本只有推理的電費和硬體折舊。

這是一門毛利可以非常高的生意。


坦白說:風險與不確定性

照慣例,講完好處要講風險。

1. 地緣政治是最大變數

如果美國對中國 AI API 實施制裁(類似 TikTok 的邏輯),Token-as-a-Service 路徑會直接被掐斷。Stack-as-a-Standard 路徑比較安全,但也可能面臨「安全審查」。

2. 品質差距可能拉大也可能縮小

目前 SOTA-3% 的差距看起來很小。但如果 Anthropic 或 OpenAI 在下一代模型上實現突破(比如 Opus 5 或 GPT-6),差距可能重新拉開。不過反過來說,開源社群的迭代速度也在加快。

3. 合規成本被低估

GDPR、數據本地化、AI Act——歐洲市場的合規成本不低。中國企業在這方面的經驗相對薄弱。合規做不好,token 再便宜也進不去高價值市場。

4. 智譜不在蒸餾名單上 ≠ 永遠不會被質疑

沒被指控不代表清白,只代表目前沒有證據。如果未來有新的指控,信任成本會瞬間飆高。


關鍵洞察

1. Token 出海是成本結構的故事,不是技術競賽的故事

中國模型不需要贏 Benchmark。只要達到 SOTA 90%,然後便宜 5-8 倍,市場就會買單。這跟中國製造業的邏輯一模一樣——品質夠用,價格殺到見骨。

2. 電力是被忽略的戰略資源

大家都在談算力(晶片),但電力才是推理經濟的持續性成本。中國 $0.08 vs 美國 $0.18,這個差距不會短期消失。

3. GLM-5 的全華為訓練是里程碑

它證明了中國 AI 可以完全脫離美國硬體生態。這不只是技術成就,是商業護城河——供應鏈不受制裁影響,成本可預測,產能可規劃。

4. 開源 + API 雙軌制是最聰明的策略

短期用 API 賺錢,長期用開源建生態。智譜的 MIT 授權不是慈善,是戰略。

5. 對台灣企業的啟示

如果你在做 AI 應用,中國 token 的性價比已經不能忽視了。不是說要全面切換,但至少應該評估:你的場景真的需要 Opus 等級的模型嗎?還是 SOTA 90% 就夠用了?

省下的 80% 成本,可以拿來做更多事。