CLI 重點整理

一句話總結

高效的 Agent 架構關鍵，不是更強的模型，而是把「確定答案」的工作從 LLM 移到 CLI / CPU。

也就是：

LLM 負責思考
CLI 負責執行

這篇文章的核心主軸

1. Context Window 是最珍貴的資源

Token = Memory
Memory = Cost
Cost = Latency

如果沒有良好管理 Context：

Agent 會變慢
成本會變高
幻覺會變多

因此：

不要把所有事情都交給 LLM。

三個核心元件定位（MCP / Skills / CLI）

這三者不是互相取代，而是：

三層責任分工

1️⃣ MCP（Model Context Protocol）

定位

Production / Security / Standard Interface

特點

官方支援
有權限管理
有 schema
安全性高
適合企業環境

缺點

啟動成本高
Context 使用量大
較重

適用情境

需要安全
需要權限控管
需要穩定 production 系統

例如：

GitHub API
Database access
Cloud service
Payment system

2️⃣ Agent Skills

定位

Custom Tool / Internal Workflow

本質：

Markdown + Instruction

特點

可封裝流程
可封裝知識
彈性高
開發成本低

缺點

還是依賴 LLM 解讀
non-deterministic

適用情境

沒有現成 MCP
沒有 CLI
內部專用工具

例如：

deploy_service
backup_database
analyze_log
release_pipeline

3️⃣ CLI（Command Line Interface）

定位

Deterministic Execution Engine

這篇最重要的觀點

CLI 是 Token Efficiency 的核心工具。

特點

CPU
fast
cheap
deterministic

為什麼 CLI 很強

因為它：

有真實輸出
沒有幻覺
結果可驗證

例如：

gh issue create
docker build
pytest
ffmpeg
curl

LLM 只需要：

read stdout

而不是：

guess result

核心概念：Execution Offloading

傳統 Agent

LLM:
  read file
  parse
  calculate
  summarize
  decide

全部用 GPU。

新一代 Agent（Harness 思維）

LLM:
  decide

CLI:
  execute
  calculate
  fetch
  validate

這叫：

Execution Offloading

或：

Deterministic Pipeline

Progressive Disclosure（Skills 的關鍵技術）

問題：MCP 很吃 Context

一次載入整個工具說明

例如：

OpenAPI schema
function spec
documentation

Skills 的解法

Progressive Disclosure

流程：

先載入 metadata
需要時才載入 SKILL.md

結果：

節省 context
提升速度
降低成本

為什麼 CLI 正在崛起

不是因為 CLI 新。

而是因為：

LLM 太貴

CLI 的三個關鍵優勢

1. Deterministic

成功 或 失敗
沒有模糊地帶

2. Token Free

不消耗 context

3. CPU Cheap

成本遠低於 GPU

Tool Absorption（工具被模型內化）

這是一個長期趨勢：

工具 → 模型能力

例如：

過去

GitHub MCP

現在

gh CLI

未來

model 直接會 Git

正確的實務策略（作者建議）

不是選一個
而是三個並行

Decision Table（實戰決策表）

情境	使用工具
需要安全 / 權限 / production	MCP
沒有現成工具 / 自訂流程	Skill
標準操作 / 基礎任務	CLI

最佳實務架構（推薦）

                LLM
                 │
        ┌────────┼────────┐
        │        │        │
       MCP      Skill     CLI
        │        │        │
   secure API   custom    execution
                logic      engine

Harness Engineering 的真正本質

不是：

用更多工具

而是：

減少 LLM 的工作量

最重要的工程原則

If the answer is deterministic
→ use CLI

If the answer needs reasoning
→ use LLM

一句話收斂（Final Takeaway）

真正高效的 Agent，不是更聰明，而是更少用腦。

Keyboard shortcuts

Jason's Notes