AI Coding 半年回顧：開發並沒有變快，我們只是把瓶頸從寫 Code，轉移到了 QA 跟需求收集

這半年，AI Coding 工具全面爆發。從 Cursor、Claude Code 到各種 Agent framework，討論聲量沒停過。

但我以一個在 Production 環境實戰 AI Coding 快三年（從 2023 就開始用 ChatGPT 複製貼上）的工程師視角，想分享一個反直覺的觀察：

AI Model 的進步，其實對效率沒有太多影響

其實早在一年多前，AI 就已經足夠會寫 Code 了。

從 GPT-4、Claude Sonnet 3.5 開始，只要需求夠清楚，AI 產出 90–95% 可用程式碼早就不是問題。而且這個比例這一年幾乎沒變。

AI Model 更加聰明，其實沒有影響太多。

這一年 AI Coding Tool 真正的進步在於：取得 Context 更容易。

Claude Code 為什麼強？因為它能跨檔案、跨任務理解整個專案結構。

所以你看到的工具演進，其實都在解同一題：

AI 不是不會寫，是不知道你在幹嘛。

而最難取得的上下文，從來不是 code，是需求。

我有一個專案，裡面資深 PM 已經在專案裡面三年了，還是常因為客戶黑話、隱性業務邏輯而誤解需求。

這不是特例。

根據我的 PM 團隊大量的體感，第一次訪談，需求準確率 60–80% 已經算不錯。

這不是誰能力不夠，而是需求本來就是一個「客戶跟 PM 兩個腦袋對齊」的過程。

在 PM 界這有一個特殊名詞叫做「通靈」。有通靈技能的 PM 可是 SSR 的存在。

需求釐清沒效率，就是以前 TDD/BDD 遇到的問題，也是現在 SDD 很難普及的主要原因。

AI 可以幫你寫 PRD，但它沒辦法幫你通靈。

我現在聽到很多 Vibe Coding 課程在談「怎麼寫」，但很少人認真談一件事：怎麼驗收？

產出可以很快，但如果沒有人定義「什麼算對、什麼算錯」，AI Coding 速度只是在無限制地放大風險。

這就是為何「AI Coding 在現實專案，很多時候並沒有變快」的原因。

那為何 Prototype/POC 可以變快？因為不需要驗收呀，大哥。

Coding 的效率瓶頸，只是從寫 Code 轉移到 QA。

很多人問我怎麼做。我不是 QA 專業，但可以先從三件事開始：

1. 把需求 PRD 寫成「可驗收條件」

不用懂語法，但一定要能回答：什麼情況算做對？什麼情況算失敗？

2. 先用 AI 對 PRD 展開 Edge Case

AI 針對一般 test case 展開 Edge Case 的速度超快的。

3. Start small — small is way better than null

Test Case 鐵律：不完整的 test case 遠好過沒有。

有了 test case list，AI Coding 就可以快速幫你寫 unit test、automation test…等等，這又走到 AI 的舒適區了。

AI Coding 的進步，確實讓更多人能參與開發。工具變好用了，門檻降低了。

但核心難題沒有被解決。

那些屬於「人」的問題——需求理解、業務判斷、品質驗收——仍然需要人來負責。

AI 很強，但真正的瓶頸，早就不在 Coding 本身。

延伸閱讀：