AI 寫程式的終極悖論：你越依賴它，越需要人類思考

AI 不是越聰明就越好用。研究顯示，當 context 達到 32k tokens，多數模型效能會降到 50% 以下。

Stack Overflow 2025 年調查指出：雖然 84% 開發者正在使用 AI 工具，但信任度首次下降，從 2023-2024 年的 70% 以上降到 60%。更驚人的是，METR 研究顯示，資深開發者主觀認為 AI 讓他們快 20%，但客觀測試結果是慢了 19%。

這不是生產力提升，而是虛假繁榮。

問題不只在模型，而在 Context 工程

17 歲時在 NASA JPL 協助研究人員建立月球導航工具的 Dex Horthy，之後在 Replicated 工作 7 年，協助 Hashicorp、DataStax 等團隊交付複雜系統，並於 2023 年創立 HumanLayer（YC F24）。

他的觀點是：

AI 寫程式的問題不是模型太笨，而是你不懂 Context 工程。

Context 工程可視為管理 AI 的工作記憶：

Chroma Research 指出，號稱 200k tokens 的模型，實務上通常在 130k 左右就開始不穩定。

每個任務都應通過以下檢查：

沒有程式碼片段的計畫，通常只是感覺，不具執行力。

Sub-agents 不是擬人化角色，而是資訊分片工具。

這能讓主 Agent 維持敏捷，聚焦核心推理。

AI 的價值在於放大：

根據統計，AI 產生 46% 程式碼，但僅約 30% 會被開發者直接接受，代表約 70% 建議會被拒絕或修改。

當 RPI 一再失敗，就是訊號：當前複雜度已超過 AI 可控範圍，必須回到白板由人類重整邏輯。

未來 99% 程式碼可能由 AI 生成，但頂尖與普通開發者的差距，在於誰能在 AI 時代保有思考主權。

你要當教 AI 思考的人，還是被 AI 牽著走的人？