文件 — HAAO

總覽

HAAO(Hybrid AI-Agile Orchestrator)是 AI 軟體代理的治理層。Claude 將以自然語言描述的需求拆解成可測試的原子工單;較便宜的本地模型負責執行程式碼;兩道人工關卡讓人保持對最終交付的掌控。

核心論點:前沿模型應節制地用於高槓桿的推理(拆解、審查),而非用來逐行硬寫。本地開放權重的編程模型如今已足夠勝任大量的執行工作,既便宜又私密。HAAO 就是那個協調層,把對的工作交給對的模型,並在關鍵處插入人類判斷。

快速開始

複製 repo 並建立虛擬環境:

python3 -m venv .venv
. .venv/bin/activate
pip install -r requirements.txt
cp .env.example .env

設定 CLAUDE_API_KEY 供 Tech Lead 拆解與審查使用,並將 LMSTUDIO_BASE_URL 指向你本地的 LM Studio 伺服器。接著執行並檢查健康狀態:

uvicorn orchestrator.main:app --reload
curl http://127.0.0.1:8000/health
pytest

新手或非技術背景?從 repo 裡的 Operator's Guide 開始。想了解設計緣由?閱讀技術設計文章。

角色

HAAO 將 Scrum 角色對應到一支混合的 AI 工作團隊。不直覺的選擇是:人類是 Product Owner,而不是 Scrum Master——流程機制自動化,產品判斷保留給人。

Scrum 角色	由誰擔任	職責
Product Owner	你(人類)	定義需求、排序、核可待辦、驗收成果。
Tech Lead	雲端模型(Claude)	拆解成原子工單、撰寫可機器驗證的 DoD、執行技術審查。
Scrum Master	協調器(軟體)	派發、路由、控管 WIP、重試、升級——全自動。
開發團隊	本地 LLM(LM Studio)	讀取脈絡、撰寫程式、執行測試、回報。

原子工單

原子工單是雲端 Tech Lead 與本地編程者之間的交接格式,由 JSON Schema 定義。三個特性讓它成立:

可機器讀取——本地模型無需猜測意圖即可解析。自我完備——相關程式碼直接內嵌進工單,而非以檔名引用,因此小的有效參數模型不必去尋找或記住任何東西。可驗證的 Definition of Done——DoD 是一組帶有預期結果的測試指令,所以「完成」是測試結果,不是主觀判斷。

混合成本路由

工作預設留在本地且免費。重試額度管控自我修正;只有當本地嘗試用盡時,工單才會升級到雲端。便宜的機器檢查擋在昂貴的雲端審查之前,因此你絕不會為了讀每一個 diff 付前沿模型的錢。真正重要的指標是「每張驗收工單的成本」。

架構

        你(Product Owner)
   寫需求 │           │ 核可 / 驗收
          ▼           ▲
   ┌────────────────────────────────┐
   │   協調器(Scrum Master)         │  狀態機 · 路由 · 重試
   └───┬───────────┬───────────┬────┘
       │ 拆解+審查  │ 派發      │ 跑測試
   ┌───▼────┐  ┌───▼────────┐  ┌▼───────────────┐
   │ Claude │  │ 本地 LLM    │  │ pytest/npm test│
   │(Tech   │  │(LM Studio) │  │(驗證)          │
   │ Lead)  │  │ 開發團隊    │  └────────────────┘
   └────────┘  └────────────┘

技術堆疊:Python · FastAPI · SQLite · React · Tailwind · LM Studio(本地推論)· Claude API(雲端)。

流程

一個需求走過單一條流程:

輸入——PO 寫下需求;Tech Lead 將它拆解成原子工單;PO 檢視並核可(關卡 1)。
執行——協調器將每張工單派發給其本地模型,由它撰寫程式並執行工單的測試。
自我修正——失敗時,工作者在額度內重試;用盡則升級給 Tech Lead。
審查——Tech Lead 自動依 DoD 檢查 diff。
驗收——PO 驗收,或附上回饋退回(關卡 2)。

企業方案

對於受規範、傾向地端,或對成本敏感的組織,HAAO 設計為可完全在你自己的基礎設施上運行。執行留在本地,程式碼不離開你的機器;雲端模型只看得到工單範圍與供審查的 diff,且被擋在重試額度之後。

企業部署加入 SSO 與角色權限、政策與防護設定(代理可動哪些東西)、自帶推論,以及優先支援。與我們聯絡來規劃部署。