Token 出海：中國 AI 不再賣商品，開始賣 Token

上週我寫了兩篇文章——一篇是 GLM-5 技術報告解讀，一篇是 Anthropic 蒸餾戰爭。

寫完之後，我一直在想一件事：如果 GLM-5 真的沒有蒸餾，而且全華為晶片訓練，而且 API 價格只有 Opus 的五分之一——那這代表什麼？

不是技術突破的故事。技術突破已經寫過了。

這是一個商業模式的故事。

從「賣商品」到「賣 Token」

過去三十年，中國出海的主旋律是商品——從 T-shirt、電子零件，到 TikTok、SHEIN、Temu。賣的是實體商品、軟體、用戶體驗、流量。

2026 年，出海的東西變了。不再是商品，是 Token。

什麼意思？

鉅亨號二月的報導給了一個驚人的數字：2026 年 2 月的 Token 呼叫量是 2025 年 2 月的 13 倍。呼叫量前三名全是中國模型——MiniMax、Kimi、GLM。中國第一次在生產型 Token 呼叫量上反超美國。

這不是實驗室數據，是真金白銀的 API 呼叫。有人在付錢買這些 token，而且買的量超過了美國模型。

我覺得這件事的意義被低估了。

過去我們談 AI 競賽，焦點永遠在 Benchmark：誰的 SWE-bench 高、誰的推理能力強。但 Benchmark 是技術指標，不是商業指標。商業指標是：誰的 token 被更多人買。

而現在答案是中國。

成本結構：為什麼中國能便宜這麼多

先看定價。2026 年 2 月的 API 價格對比：

模型	等級	輸入 $/M tokens	輸出 $/M tokens
Claude Opus 4.5	Frontier	$5.00	$25.00
GPT-5	Frontier	$1.25	$10.00
DeepSeek R1	推理型	$0.55	$2.19
GLM-5	Frontier 開源	~$1.00	~$3.20
DeepSeek V3.2	通用型	$0.27	$1.10

GLM-5 跟 Opus 4.5 比，輸入便宜 5 倍，輸出便宜 8 倍。跟 GPT-5 比也便宜不少。

但重點不是「便宜」這兩個字。重點是：為什麼能便宜？

Token 的生產成本可以拆成這個公式：

Token 價格 ≈ 硬體折舊 + (能耗 × 電價 × PUE) + 工程維運 + 合規成本

中國在每一項都有結構性優勢。

第一張牌：電力

The Diplomat 去年的分析指出，中國工業電價約 $0.08/kWh，美國約 $0.18/kWh。中國便宜 56%。

這不是一次性的匯率優勢，是結構性的——中國政府對化石燃料和綠能的補貼規模都是美國的三倍。Fortune 去年八月一篇報導的標題更直白：「AI 專家從中國回來後震驚：美國電網太弱了，比賽可能已經結束。」

對 AI 推理來說，電力成本是持續性支出。訓練只燒一次電，但推理是每一個 token 都在燒。Token 出海賣的是推理能力，電價優勢會持續放大。

粗估：如果 token 生產成本中，電力佔 30-40%，光電價差異就能帶來 15-20% 的成本優勢。

第二張牌：開源人才 + 工程效率

DeepSeek 用限制版的 H800（而非 H100）訓練出 R1，能耗效率是美國模型的 10-40 倍。這不是開玩笑——同樣的推理能力，中國團隊用更少的算力跑出來。

為什麼？我覺得跟人才結構有關。

中國開源社群的密度和活躍度在過去兩年暴增。智譜的 Slime RL 框架、DeepSeek 的 MoE 架構優化、Kimi 的 Agent Swarm——這些不是抄來的（至少智譜不在蒸餾指控名單上），是工程師一行一行寫出來的。

而且中國 AI 工程師的薪資結構跟矽谷不同。不是說便宜等於好，但同樣投入的人力成本，能產出更多的工程優化。

第三張牌：硬體自主

這是 GLM-5 最被低估的訊息。

GLM-5 的 744B 參數，全部在 10 萬張華為昇騰 910B 上訓練完成。零 NVIDIA 依賴。使用的是華為 MindSpore 框架。

這意味著什麼？

美國的出口管制（NVIDIA H100/H200 禁售中國）本來是要掐住中國 AI 的算力咽喉。但 GLM-5 證明了：用國產晶片，可以訓練出 frontier 等級的模型。

而且華為已經公布了三年的 AI 晶片路線圖。昇騰 910C、920 都在計畫中。如果晶片效能持續追趕，而且不受禁令影響——中國的硬體成本會進一步下降。

這三張牌疊在一起：電力便宜 56% + 工程效率高 + 硬體自主不受禁令。

結論是：中國可以用大約 80% 的成本，生產出 SOTA 90% 等級的 token。

GLM-5 為什麼是指標性案例

我在之前的文章裡從技術角度分析了 GLM-5。這裡換商業角度。

GLM-5 同時滿足了 Token 出海的所有條件：

1. 技術自主可行——沒被指控蒸餾

Anthropic 的蒸餾指控名單上有 DeepSeek、Moonshot AI（Kimi）、MiniMax，但沒有智譜。

在那篇文章裡我寫過：「居然沒有 GLM。或許代表他們真的在做自己的事情吧。」

這不只是道德問題，是商業問題。如果你的模型被指控是蒸餾的，海外客戶會擔心法律風險。但如果你能證明技術自主——開源程式碼、公開技術報告、MIT 授權——客戶的信任成本就低很多。

2. 品質夠用——SWE-bench 打贏 GPT-5.2

GLM-5 在 SWE-bench Verified 拿到 77.8%，贏過 GPT-5.2 的 76.2%，只輸 Opus 4.6 三個百分點。

對大多數企業客戶來說，SOTA 跟 SOTA-3% 的差別幾乎感受不到。但價格差 5-8 倍是感受得到的。

3. 全華為訓練——硬體不受制於人

這代表 GLM-5 的推理基礎設施可以全部用國產硬體。不需要擔心 NVIDIA 斷供、不需要走灰色市場買晶片。供應鏈穩定，成本可預測。

4. MIT 開源——兩條路都能走

MIT 授權意味著海外開發者可以下載、微調、私有化部署。這是 Stack-as-a-Standard 路徑——不只賣 token，還輸出技術標準。

同時智譜也提供 API 服務，這是 Token-as-a-Service 路徑。

兩手都打，生態就建起來了。

兩條出海路徑

鉅亨號的報導把 Token 出海分成兩條路徑，我覺得分析得很到位：

路徑 A：Token-as-a-Service（推理即服務）

海外用戶通過 API 直接呼叫中國模型。Token 在中國境內或中資海外節點被「生產」出來。

優勢：

技術門檻最低（調 API 就好）
邊際成本隨規模下降
中國電力優勢直接體現

挑戰：

延遲（跨境網路）
合規（數據主權問題）
跨境支付
地緣政治風險（萬一被制裁？）

路徑 B：Stack-as-a-Standard（標準即生態）

海外開發者下載中國開源模型，在自己的基礎設施上微調部署。

優勢：

沒有延遲問題
沒有數據主權問題
建立生態系統和技術標準

挑戰：

無法直接從電力優勢獲利
需要長期社群經營
開源模型的商業化困難

2025 年的數據顯示，中國 OSS 模型的週 token 佔比在部分時段已經逼近 30%。

我認為真正厲害的玩家（比如智譜）會兩條路都走。API 賺短期收入，開源建長期生態。等生態建起來，就算別人想換，轉換成本也太高了。

這像什麼？——製造業出海的 AI 翻版

如果你覺得這個模式聽起來很熟悉，那是因為它就是中國製造業出海的翻版。

維度	傳統製造出海	Token 出海
賣什麼	實體商品	推理能力（Token）
成本優勢來源	勞動力 + 供應鏈	電力 + 硬體 + 工程效率
品質定位	「夠用就好」→ 逐步升級	SOTA 90% → 逐步追趕
出海路徑	OEM 代工 → 自有品牌	API 服務 → 開源生態
護城河	規模效應	規模效應 + 開源鎖定

三十年前，中國賣的是 T-shirt 和電子零件。十年前，賣的是手機和 App。現在，賣的是 Token——可計量的智力。

而且跟實體商品不同，Token 沒有物流成本、沒有關稅（目前）、沒有庫存。一旦模型訓練完成，邊際成本只有推理的電費和硬體折舊。

這是一門毛利可以非常高的生意。

坦白說：風險與不確定性

照慣例，講完好處要講風險。

1. 地緣政治是最大變數

如果美國對中國 AI API 實施制裁（類似 TikTok 的邏輯），Token-as-a-Service 路徑會直接被掐斷。Stack-as-a-Standard 路徑比較安全，但也可能面臨「安全審查」。

2. 品質差距可能拉大也可能縮小

目前 SOTA-3% 的差距看起來很小。但如果 Anthropic 或 OpenAI 在下一代模型上實現突破（比如 Opus 5 或 GPT-6），差距可能重新拉開。不過反過來說，開源社群的迭代速度也在加快。

3. 合規成本被低估

GDPR、數據本地化、AI Act——歐洲市場的合規成本不低。中國企業在這方面的經驗相對薄弱。合規做不好，token 再便宜也進不去高價值市場。

4. 智譜不在蒸餾名單上 ≠ 永遠不會被質疑

沒被指控不代表清白，只代表目前沒有證據。如果未來有新的指控，信任成本會瞬間飆高。

關鍵洞察

1. Token 出海是成本結構的故事，不是技術競賽的故事

中國模型不需要贏 Benchmark。只要達到 SOTA 90%，然後便宜 5-8 倍，市場就會買單。這跟中國製造業的邏輯一模一樣——品質夠用，價格殺到見骨。

2. 電力是被忽略的戰略資源

大家都在談算力（晶片），但電力才是推理經濟的持續性成本。中國 $0.08 vs 美國 $0.18，這個差距不會短期消失。

3. GLM-5 的全華為訓練是里程碑

它證明了中國 AI 可以完全脫離美國硬體生態。這不只是技術成就，是商業護城河——供應鏈不受制裁影響，成本可預測，產能可規劃。

4. 開源 + API 雙軌制是最聰明的策略

短期用 API 賺錢，長期用開源建生態。智譜的 MIT 授權不是慈善，是戰略。

5. 對台灣企業的啟示

如果你在做 AI 應用，中國 token 的性價比已經不能忽視了。不是說要全面切換，但至少應該評估：你的場景真的需要 Opus 等級的模型嗎？還是 SOTA 90% 就夠用了？

省下的 80% 成本，可以拿來做更多事。