發生了什麼

3 月 2 日,Qwen 團隊發布了 Qwen 3.5 小模型系列,我當天寫了一篇技術拆解。3 月 4 日,技術負責人 Junyang Lin 就在 X 上告別了:

“me stepping down. bye my beloved qwen.”

同事 Chen Cheng 證實:「leaving wasn’t your choice」——不是自己想走的。隨後確認至少 3-4 位核心骨幹離開,包括 Binyuan Hui、Kaixin Li 等,全是扛著模型從訓練到發布的人。

從各方回應拼出的原因:阿里雲拿 DAU 這類消費級指標考核基礎模型團隊,空降新管理層架空原技術負責人。一個做基礎模型研究的團隊,被當成做 App 的來管。Qwen 在 Hugging Face 上影響力巨大,但在阿里雲的評價體系裡,這些不算 KPI。

多位業內人士判斷:Qwen3 系列可能是很長一段時間內的最後傑作,之後可能轉向封閉商業化路線。

完整事件細節,推薦看寶玉老師的整理:https://x.com/dotey/status/2028904169986203703


對我們選用開源模型的啟示

這件事讓我重新思考了一個問題:當我們在企業裡選用開源模型的時候,我們到底在押注什麼?

1. 你押注的不只是模型,是團隊

我之前在企業級地端 LLM 架構裡寫過,選開源模型要看授權、看性能、看生態。但今天這件事告訴我,還要看團隊穩定性

一個開源模型的持續演進能力,取決於背後那群人。人走了,模型不會自己進化。

Qwen 3.5 的技術很強,但如果核心團隊散了,Qwen 3.6、4.0 還會不會來?會不會維持同樣的品質和開源承諾?這些都變成了問號。

2. 開源 ≠ 永續

Apache 2.0 授權保證了你可以自由使用現有的模型。但授權不能保證未來會有新版本、會有 bug fix、會有安全更新。

這跟用 Linux 或 PostgreSQL 不一樣——那些項目有分散式的社群維護機制。但 Qwen、LLaMA、Gemma 這類大模型,核心研發高度集中在一家公司的一個團隊手裡。公司的一個人事決策,就能讓整個開源路線轉向。

3. 多模型策略更重要了

如果你的 AI 基礎建設只綁定一個模型系列,那你的風險就集中在那個團隊身上。

今天是 Qwen,明天可能是別的模型。合理的做法是:

  • 推理框架要抽象化——不要硬綁 Qwen 的 API 格式,用 vLLM、Ollama 這類通用框架
  • 模型要能熱切換——今天用 Qwen 3.5-9B,明天要能無痛切到 Gemma 3 或 LLaMA 4
  • 關鍵場景要有 fallback——不能只靠一個模型

這不是什麼新觀點,但今天這件事讓它從「最佳實踐」變成了「血淋淋的教訓」。


坦白說

1. 我兩天前還在誇這個團隊

是的,我兩天前寫了一整篇文章分析 Qwen 3.5-9B 的架構有多厲害。今天我在寫這個團隊可能要散了。

這不矛盾。技術成就是真的,團隊危機也是真的。但這確實提醒我:寫技術分析的時候,不能只看技術本身,還要看技術背後的組織和人。

2. 信息來源的侷限

今天這篇文章的信息,主要來自 X 上的公開討論——當事人的告別帖、同事的回應、業內人士的分析。阿里巴巴官方沒有發表聲明。

也就是說,我們看到的是單方面的故事。阿里雲內部的考量、決策邏輯、對 Qwen 未來的規劃——這些我們不知道。

可能阿里雲有他們的道理。可能商業化壓力確實很大。可能 Qwen 的開源策略在內部確實無法說服董事會。

但「被離開」這件事本身——不管理由是什麼——對開源社群的信心傷害是即時的、可量化的。X 上的討論幾乎一邊倒。

3. 這件事的真正教訓

Nathan Lambert 稱 Qwen 團隊的成績是「legendary run」(傳奇之旅)。Hugo Pinheiro 問了一個很多人想問的問題:為什麼商業決策者總是在事情做得好的時候把它毀掉?

答案其實很殘酷:因為在大公司的評價體系裡,「做得好」的定義不是你做的。

Qwen 團隊覺得「在 Hugging Face 上成為最受歡迎的開源模型」是做得好。阿里雲管理層可能覺得「DAU 追不上豆包」是做得不好。

這不是對錯的問題,是座標系不同的問題。

而這個座標系衝突,不只發生在阿里巴巴。它發生在每一家試圖用開源策略建立影響力、同時又要向股東交代商業回報的科技公司裡。

Qwen 團隊的技術毫無疑問是頂尖的。但頂尖的技術救不了錯位的 KPI。


延伸閱讀


一句話總結: Qwen 3.5 的技術是傳奇的,但傳奇是人寫的。當做出傳奇的人被 KPI 逼走,開源社群學到的教訓是:你押注開源模型的時候,不只要看 benchmark,還要看背後的團隊能不能留住。