總覽
HAAO(Hybrid AI-Agile Orchestrator)是 AI 軟體代理的治理層。Claude 將以自然語言描述的需求拆解成可測試的原子工單;較便宜的本地模型負責執行程式碼;兩道人工關卡讓人保持對最終交付的掌控。
核心論點:前沿模型應節制地用於高槓桿的推理(拆解、審查),而非用來逐行硬寫。本地開放權重的編程模型如今已足夠勝任大量的執行工作,既便宜又私密。HAAO 就是那個協調層,把對的工作交給對的模型,並在關鍵處插入人類判斷。
快速開始
複製 repo 並建立虛擬環境:
python3 -m venv .venv
. .venv/bin/activate
pip install -r requirements.txt
cp .env.example .env
設定 CLAUDE_API_KEY 供 Tech Lead 拆解與審查使用,並將 LMSTUDIO_BASE_URL 指向你本地的 LM Studio 伺服器。接著執行並檢查健康狀態:
uvicorn orchestrator.main:app --reload
curl http://127.0.0.1:8000/health
pytest
角色
HAAO 將 Scrum 角色對應到一支混合的 AI 工作團隊。不直覺的選擇是:人類是 Product Owner,而不是 Scrum Master——流程機制自動化,產品判斷保留給人。
| Scrum 角色 | 由誰擔任 | 職責 |
|---|---|---|
| Product Owner | 你(人類) | 定義需求、排序、核可待辦、驗收成果。 |
| Tech Lead | 雲端模型(Claude) | 拆解成原子工單、撰寫可機器驗證的 DoD、執行技術審查。 |
| Scrum Master | 協調器(軟體) | 派發、路由、控管 WIP、重試、升級——全自動。 |
| 開發團隊 | 本地 LLM(LM Studio) | 讀取脈絡、撰寫程式、執行測試、回報。 |
原子工單
原子工單是雲端 Tech Lead 與本地編程者之間的交接格式,由 JSON Schema 定義。三個特性讓它成立:
可機器讀取——本地模型無需猜測意圖即可解析。自我完備——相關程式碼直接內嵌進工單,而非以檔名引用,因此小的有效參數模型不必去尋找或記住任何東西。可驗證的 Definition of Done——DoD 是一組帶有預期結果的測試指令,所以「完成」是測試結果,不是主觀判斷。
混合成本路由
工作預設留在本地且免費。重試額度管控自我修正;只有當本地嘗試用盡時,工單才會升級到雲端。便宜的機器檢查擋在昂貴的雲端審查之前,因此你絕不會為了讀每一個 diff 付前沿模型的錢。真正重要的指標是「每張驗收工單的成本」。
架構
你(Product Owner)
寫需求 │ │ 核可 / 驗收
▼ ▲
┌────────────────────────────────┐
│ 協調器(Scrum Master) │ 狀態機 · 路由 · 重試
└───┬───────────┬───────────┬────┘
│ 拆解+審查 │ 派發 │ 跑測試
┌───▼────┐ ┌───▼────────┐ ┌▼───────────────┐
│ Claude │ │ 本地 LLM │ │ pytest/npm test│
│(Tech │ │(LM Studio) │ │(驗證) │
│ Lead) │ │ 開發團隊 │ └────────────────┘
└────────┘ └────────────┘
技術堆疊:Python · FastAPI · SQLite · React · Tailwind · LM Studio(本地推論)· Claude API(雲端)。
流程
一個需求走過單一條流程:
- 輸入——PO 寫下需求;Tech Lead 將它拆解成原子工單;PO 檢視並核可(關卡 1)。
- 執行——協調器將每張工單派發給其本地模型,由它撰寫程式並執行工單的測試。
- 自我修正——失敗時,工作者在額度內重試;用盡則升級給 Tech Lead。
- 審查——Tech Lead 自動依 DoD 檢查 diff。
- 驗收——PO 驗收,或附上回饋退回(關卡 2)。
企業方案
對於受規範、傾向地端,或對成本敏感的組織,HAAO 設計為可完全在你自己的基礎設施上運行。執行留在本地,程式碼不離開你的機器;雲端模型只看得到工單範圍與供審查的 diff,且被擋在重試額度之後。
企業部署加入 SSO 與角色權限、政策與防護設定(代理可動哪些東西)、自帶推論,以及優先支援。與我們聯絡 來規劃部署。

