Token 出海:中國 AI 不再賣商品,開始賣 Token
上週我寫了兩篇文章——一篇是 GLM-5 技術報告解讀,一篇是 Anthropic 蒸餾戰爭。
寫完之後,我一直在想一件事:如果 GLM-5 真的沒有蒸餾,而且全華為晶片訓練,而且 API 價格只有 Opus 的五分之一——那這代表什麼?
不是技術突破的故事。技術突破已經寫過了。
這是一個商業模式的故事。
從「賣商品」到「賣 Token」
過去三十年,中國出海的主旋律是商品——從 T-shirt、電子零件,到 TikTok、SHEIN、Temu。賣的是實體商品、軟體、用戶體驗、流量。
2026 年,出海的東西變了。不再是商品,是 Token。
什麼意思?
鉅亨號二月的報導給了一個驚人的數字:2026 年 2 月的 Token 呼叫量是 2025 年 2 月的 13 倍。呼叫量前三名全是中國模型——MiniMax、Kimi、GLM。中國第一次在生產型 Token 呼叫量上反超美國。
這不是實驗室數據,是真金白銀的 API 呼叫。有人在付錢買這些 token,而且買的量超過了美國模型。
我覺得這件事的意義被低估了。
過去我們談 AI 競賽,焦點永遠在 Benchmark:誰的 SWE-bench 高、誰的推理能力強。但 Benchmark 是技術指標,不是商業指標。商業指標是:誰的 token 被更多人買。
而現在答案是中國。
成本結構:為什麼中國能便宜這麼多
先看定價。2026 年 2 月的 API 價格對比:
| 模型 | 等級 | 輸入 $/M tokens | 輸出 $/M tokens |
|---|---|---|---|
| Claude Opus 4.5 | Frontier | $5.00 | $25.00 |
| GPT-5 | Frontier | $1.25 | $10.00 |
| DeepSeek R1 | 推理型 | $0.55 | $2.19 |
| GLM-5 | Frontier 開源 | ~$1.00 | ~$3.20 |
| DeepSeek V3.2 | 通用型 | $0.27 | $1.10 |
GLM-5 跟 Opus 4.5 比,輸入便宜 5 倍,輸出便宜 8 倍。跟 GPT-5 比也便宜不少。
但重點不是「便宜」這兩個字。重點是:為什麼能便宜?
Token 的生產成本可以拆成這個公式:
Token 價格 ≈ 硬體折舊 + (能耗 × 電價 × PUE) + 工程維運 + 合規成本
中國在每一項都有結構性優勢。
第一張牌:電力
The Diplomat 去年的分析指出,中國工業電價約 $0.08/kWh,美國約 $0.18/kWh。中國便宜 56%。
這不是一次性的匯率優勢,是結構性的——中國政府對化石燃料和綠能的補貼規模都是美國的三倍。Fortune 去年八月一篇報導的標題更直白:「AI 專家從中國回來後震驚:美國電網太弱了,比賽可能已經結束。」
對 AI 推理來說,電力成本是持續性支出。訓練只燒一次電,但推理是每一個 token 都在燒。Token 出海賣的是推理能力,電價優勢會持續放大。
粗估:如果 token 生產成本中,電力佔 30-40%,光電價差異就能帶來 15-20% 的成本優勢。
第二張牌:開源人才 + 工程效率
DeepSeek 用限制版的 H800(而非 H100)訓練出 R1,能耗效率是美國模型的 10-40 倍。這不是開玩笑——同樣的推理能力,中國團隊用更少的算力跑出來。
為什麼?我覺得跟人才結構有關。
中國開源社群的密度和活躍度在過去兩年暴增。智譜的 Slime RL 框架、DeepSeek 的 MoE 架構優化、Kimi 的 Agent Swarm——這些不是抄來的(至少智譜不在蒸餾指控名單上),是工程師一行一行寫出來的。
而且中國 AI 工程師的薪資結構跟矽谷不同。不是說便宜等於好,但同樣投入的人力成本,能產出更多的工程優化。
第三張牌:硬體自主
這是 GLM-5 最被低估的訊息。
GLM-5 的 744B 參數,全部在 10 萬張華為昇騰 910B 上訓練完成。零 NVIDIA 依賴。使用的是華為 MindSpore 框架。
這意味著什麼?
美國的出口管制(NVIDIA H100/H200 禁售中國)本來是要掐住中國 AI 的算力咽喉。但 GLM-5 證明了:用國產晶片,可以訓練出 frontier 等級的模型。
而且華為已經公布了三年的 AI 晶片路線圖。昇騰 910C、920 都在計畫中。如果晶片效能持續追趕,而且不受禁令影響——中國的硬體成本會進一步下降。
這三張牌疊在一起:電力便宜 56% + 工程效率高 + 硬體自主不受禁令。
結論是:中國可以用大約 80% 的成本,生產出 SOTA 90% 等級的 token。
GLM-5 為什麼是指標性案例
我在之前的文章裡從技術角度分析了 GLM-5。這裡換商業角度。
GLM-5 同時滿足了 Token 出海的所有條件:
1. 技術自主可行——沒被指控蒸餾
Anthropic 的蒸餾指控名單上有 DeepSeek、Moonshot AI(Kimi)、MiniMax,但沒有智譜。
在那篇文章裡我寫過:「居然沒有 GLM。或許代表他們真的在做自己的事情吧。」
這不只是道德問題,是商業問題。如果你的模型被指控是蒸餾的,海外客戶會擔心法律風險。但如果你能證明技術自主——開源程式碼、公開技術報告、MIT 授權——客戶的信任成本就低很多。
2. 品質夠用——SWE-bench 打贏 GPT-5.2
GLM-5 在 SWE-bench Verified 拿到 77.8%,贏過 GPT-5.2 的 76.2%,只輸 Opus 4.6 三個百分點。
對大多數企業客戶來說,SOTA 跟 SOTA-3% 的差別幾乎感受不到。但價格差 5-8 倍是感受得到的。
3. 全華為訓練——硬體不受制於人
這代表 GLM-5 的推理基礎設施可以全部用國產硬體。不需要擔心 NVIDIA 斷供、不需要走灰色市場買晶片。供應鏈穩定,成本可預測。
4. MIT 開源——兩條路都能走
MIT 授權意味著海外開發者可以下載、微調、私有化部署。這是 Stack-as-a-Standard 路徑——不只賣 token,還輸出技術標準。
同時智譜也提供 API 服務,這是 Token-as-a-Service 路徑。
兩手都打,生態就建起來了。
兩條出海路徑
鉅亨號的報導把 Token 出海分成兩條路徑,我覺得分析得很到位:
路徑 A:Token-as-a-Service(推理即服務)
海外用戶通過 API 直接呼叫中國模型。Token 在中國境內或中資海外節點被「生產」出來。
優勢:
- 技術門檻最低(調 API 就好)
- 邊際成本隨規模下降
- 中國電力優勢直接體現
挑戰:
- 延遲(跨境網路)
- 合規(數據主權問題)
- 跨境支付
- 地緣政治風險(萬一被制裁?)
路徑 B:Stack-as-a-Standard(標準即生態)
海外開發者下載中國開源模型,在自己的基礎設施上微調部署。
優勢:
- 沒有延遲問題
- 沒有數據主權問題
- 建立生態系統和技術標準
挑戰:
- 無法直接從電力優勢獲利
- 需要長期社群經營
- 開源模型的商業化困難
2025 年的數據顯示,中國 OSS 模型的週 token 佔比在部分時段已經逼近 30%。
我認為真正厲害的玩家(比如智譜)會兩條路都走。API 賺短期收入,開源建長期生態。等生態建起來,就算別人想換,轉換成本也太高了。
這像什麼?——製造業出海的 AI 翻版
如果你覺得這個模式聽起來很熟悉,那是因為它就是中國製造業出海的翻版。
| 維度 | 傳統製造出海 | Token 出海 |
|---|---|---|
| 賣什麼 | 實體商品 | 推理能力(Token) |
| 成本優勢來源 | 勞動力 + 供應鏈 | 電力 + 硬體 + 工程效率 |
| 品質定位 | 「夠用就好」→ 逐步升級 | SOTA 90% → 逐步追趕 |
| 出海路徑 | OEM 代工 → 自有品牌 | API 服務 → 開源生態 |
| 護城河 | 規模效應 | 規模效應 + 開源鎖定 |
三十年前,中國賣的是 T-shirt 和電子零件。 十年前,賣的是手機和 App。 現在,賣的是 Token——可計量的智力。
而且跟實體商品不同,Token 沒有物流成本、沒有關稅(目前)、沒有庫存。一旦模型訓練完成,邊際成本只有推理的電費和硬體折舊。
這是一門毛利可以非常高的生意。
坦白說:風險與不確定性
照慣例,講完好處要講風險。
1. 地緣政治是最大變數
如果美國對中國 AI API 實施制裁(類似 TikTok 的邏輯),Token-as-a-Service 路徑會直接被掐斷。Stack-as-a-Standard 路徑比較安全,但也可能面臨「安全審查」。
2. 品質差距可能拉大也可能縮小
目前 SOTA-3% 的差距看起來很小。但如果 Anthropic 或 OpenAI 在下一代模型上實現突破(比如 Opus 5 或 GPT-6),差距可能重新拉開。不過反過來說,開源社群的迭代速度也在加快。
3. 合規成本被低估
GDPR、數據本地化、AI Act——歐洲市場的合規成本不低。中國企業在這方面的經驗相對薄弱。合規做不好,token 再便宜也進不去高價值市場。
4. 智譜不在蒸餾名單上 ≠ 永遠不會被質疑
沒被指控不代表清白,只代表目前沒有證據。如果未來有新的指控,信任成本會瞬間飆高。
關鍵洞察
1. Token 出海是成本結構的故事,不是技術競賽的故事
中國模型不需要贏 Benchmark。只要達到 SOTA 90%,然後便宜 5-8 倍,市場就會買單。這跟中國製造業的邏輯一模一樣——品質夠用,價格殺到見骨。
2. 電力是被忽略的戰略資源
大家都在談算力(晶片),但電力才是推理經濟的持續性成本。中國 $0.08 vs 美國 $0.18,這個差距不會短期消失。
3. GLM-5 的全華為訓練是里程碑
它證明了中國 AI 可以完全脫離美國硬體生態。這不只是技術成就,是商業護城河——供應鏈不受制裁影響,成本可預測,產能可規劃。
4. 開源 + API 雙軌制是最聰明的策略
短期用 API 賺錢,長期用開源建生態。智譜的 MIT 授權不是慈善,是戰略。
5. 對台灣企業的啟示
如果你在做 AI 應用,中國 token 的性價比已經不能忽視了。不是說要全面切換,但至少應該評估:你的場景真的需要 Opus 等級的模型嗎?還是 SOTA 90% 就夠用了?
省下的 80% 成本,可以拿來做更多事。