Fable 5 被關門了，然後呢？——當「路徑驗證」成為 AI 產業最強的加速器

6 月 9 日，Fable 5 上線。6 月 13 日，全球下架。

Anthropic 在 6 月 9 日發布了 Claude Fable 5——第一個「Mythos 級」模型，SWE-Bench Pro 自報 80.3%，比 Opus 4.8 高了 11 個百分點。

四天後，美國政府的出口管制指令下來，Fable 5 和 Mythos 5 全球暫停存取。

看到這個消息的時候，我跟很多人一樣覺得可惜。才用了四天，手感正好，就被收回去了。

但接下來發生的事情，比 Fable 5 本身更值得寫。

關門後的 72 小時

Fable 5 下架的同一週，發生了什麼？

6 月 12 日：OpenRouter 正式發布 Fusion API——把多個模型的回答丟給 judge 模型做分析和合成，生成一個新的回答。三個便宜模型（Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro）組成的 Budget Panel，在 DRACO benchmark 上拿到 64.7%，打贏了單獨跑的 GPT-5.5（60.0%）和 Opus 4.8（58.8%）。

6 月 13 日：智譜發布 GLM-5.2——1M context window、744B MoE 參數、全華為 Ascend 晶片訓練、MIT 開源。

6 月 14 日之後：社群已經在用 OpenRouter Fusion 的自訂面板跑各種組合，有人把 Fable 5 發布前的存量 API call 混進 panel，跑出了 DRACO 69.0% 的成績——比 Fable 5 單獨跑的 65.3% 還高。

一扇門關了，好幾扇窗同時打開。

Fable 5 最大的貢獻不是 Fable 5 本身

我現在的看法是：Anthropic 最重要的貢獻，可能不是做出了 Fable 5，而是證明了這種級別的模型是可以被訓練出來的，而且周期並沒有大家想像得那麼長。

一旦路徑被驗證，OpenAI 會跟，Google 會跟，國產廠商也會跟。Fable 5 關門當然能延緩擴散，但關不住方向。

在科技史上，最難的往往並非複製。就像原子彈、就像 ChatGPT——一旦行業知道了這條路能通，資金、算力和人才就會瘋狂湧入。領先者的成功消除了不確定性風險，後來者不再需要把資源浪費在試錯和懷疑上，開發周期自然會大幅縮短。

這個觀點，我以前會持保留態度。但看完 Fable 5 下架後這一週的爆發，我的想法有了變化。

數據在說話：追趕速度是指數級的

把時間線拉開來看，「路徑驗證 → 快速複製」的模式已經不是理論推演，是正在發生的事實。

MMLU 開源 vs 閉源差距：

2023 年底：17.5 個百分點
2026 年初：0.3 個百分點

兩年，差距從顯著到統計雜訊。

具體追趕案例：

模型	發布時間	關鍵能力	跟 frontier 的差距	價格
DeepSeek V4	2026/04	SWE-bench 80.6%	接近 Claude Opus	Opus 的 1/29
GLM-5.1	2026/03	宣稱 Opus 4.6 的 94.6%	5.4%	遠低於 Opus
GLM-5.2	2026/06	1M context，MIT 開源	未知（無 benchmark）	~$0.98/M input
OpenRouter Fusion Budget	2026/06	DRACO 64.7%	贏過單獨 Opus 4.8	約 Fable 5 的 1/2

最後一行是最驚人的。三個次等模型的組合體，打贏了單獨的 frontier 模型。 不是靠更強的單一模型，而是靠架構創新——panel + judge + synthesizer 的三階段管線。

這意味著「追趕」已經不只是「造出一樣強的模型」了。追趕的方式本身也在進化。

OpenRouter Fusion：一個更有趣的訊號

如果只是「別的公司也造出強模型」，那只是老故事的重演。但 OpenRouter Fusion 代表的是一個不同層次的突破。

先看架構：

第一步（Panel）： 同一個 prompt 平行送給 1-8 個模型，每個模型都可以做 web search。

第二步（Judge）： 一個 judge 模型讀取所有回答，產出結構化分析——哪些是共識點（高信心）、哪些是矛盾、哪些是某個模型獨有的洞見、哪些是所有模型都沒注意到的盲區。

第三步（Synthesizer）： 最終模型根據 judge 的分析寫出一個新的回答——不是投票，不是選最好的一個，而是綜合所有模型的推理去合成一個新答案。

DRACO 的結果很有意思：

Opus 4.8 單獨跑：58.8%
Opus 4.8 跟自己 Fusion（同一個模型跑兩次）：65.5%
三個便宜模型 Budget Panel：64.7%

同一個模型跟自己 Fusion，都能提升 6.7 個百分點。 這說明 Fusion 的價值不只是「模型多樣性」，合成過程本身就在創造新的品質。

對從業者來說，這個數據的意義是：你不需要等下一個 Fable 5 才能獲得 Fable 5 級別的能力。用現有模型的聰明組合，就能逼近甚至超越。

這代表什麼？情況會越來越好

把這些事件串在一起看，有一個清晰的趨勢：

2023 年： 你需要 OpenAI 級別的資源才能做 frontier model。ChatGPT 獨佔市場，沒有替代品。

2024 年： 開源追趕開始（Llama、Mistral），但差距仍然明顯。

2025 年： DeepSeek 證明小團隊也能做 frontier-class 模型。開源差距快速縮小。

2026 年上半年： GLM-5 證明不用 NVIDIA 也能做。OpenRouter Fusion 證明不需要 frontier model 也能得到 frontier 級結果。Fable 5 關門後一週內，替代方案從四面八方湧出。

趨勢方向是確定的：AI 能力的取得門檻正在指數級下降。

這裡面有幾個具體的驅動力：

算力基礎設施的多元化：華為 Ascend 已經能跑 frontier 訓練，不再是 NVIDIA 獨佔。15% 的效能差距在持續縮小。
蒸餾和微調技術的成熟：小模型能從大模型學到越來越多東西。DeepSeek V4 的 49B active parameters 做到了接近 Opus 水準。
架構創新的民主化：OpenRouter Fusion 的三階段管線不是什麼黑科技，任何開發者都能用現有的 API 組裝。
開源生態的正反饋循環：MIT 授權的模型越多，基於這些模型的工具和優化就越多，又吸引更多人開源。

我的判斷

管四的核心觀點我現在完全同意：Fable 5 最大的貢獻是證明了方向可行，而不是 Fable 5 本身。

Phoenix Yin 的延伸也是對的：路徑驗證消除不確定性，加速所有後來者。

Fable 5 關門了四天，但方向已經被驗證了。GLM-5.2 用華為晶片跑出 frontier-class 的開源模型，OpenRouter Fusion 用三個便宜模型打贏了單獨的 Opus 4.8。

一扇門關了，好幾扇窗已經打開。而且這些窗戶只會越開越多。

關鍵數據速查

事件	數據	意義
Fable 5 SWE-Bench Pro	80.3%（自報）	設定了 Mythos 級別的性能標竿
Fable 5 在線天數	4 天（6/9-6/13）	路徑已驗證，即使產品被關
OpenRouter Fusion Budget Panel	DRACO 64.7%	三個便宜模型打贏單獨 Opus 4.8（58.8%）
Fusion 最佳組合	DRACO 69.0%	比 Fable 5 單獨（65.3%）還高
GLM-5.2	1M context，MIT 開源	100% 華為晶片訓練的 frontier-class 模型
DeepSeek V4 vs Claude 價差	1/29 價格	benchmark 接近，成本差一個數量級
MMLU 開源 vs 閉源	17.5 → 0.3 百分點	2 年追平
OpenRouter 估值	$13 億（B 輪）	模型路由/融合本身是大生意
OpenRouter 週處理量	25 兆 tokens	多模型生態已成規模