總覽

HAAO(Hybrid AI-Agile Orchestrator)是 AI 軟體代理的治理層。Claude 將以自然語言描述的需求拆解成可測試的原子工單;較便宜的本地模型負責執行程式碼;兩道人工關卡讓人保持對最終交付的掌控。

核心論點:前沿模型應節制地用於高槓桿的推理(拆解、審查),而非用來逐行硬寫。本地開放權重的編程模型如今已足夠勝任大量的執行工作,既便宜又私密。HAAO 就是那個協調層,把對的工作交給對的模型,並在關鍵處插入人類判斷。

快速開始

複製 repo 並建立虛擬環境:

python3 -m venv .venv
. .venv/bin/activate
pip install -r requirements.txt
cp .env.example .env

設定 CLAUDE_API_KEY 供 Tech Lead 拆解與審查使用,並將 LMSTUDIO_BASE_URL 指向你本地的 LM Studio 伺服器。接著執行並檢查健康狀態:

uvicorn orchestrator.main:app --reload
curl http://127.0.0.1:8000/health
pytest
新手或非技術背景?從 repo 裡的 Operator's Guide 開始。想了解設計緣由?閱讀技術設計文章。

角色

HAAO 將 Scrum 角色對應到一支混合的 AI 工作團隊。不直覺的選擇是:人類是 Product Owner,而不是 Scrum Master——流程機制自動化,產品判斷保留給人。

Scrum 角色由誰擔任職責
Product Owner你(人類)定義需求、排序、核可待辦、驗收成果。
Tech Lead雲端模型(Claude)拆解成原子工單、撰寫可機器驗證的 DoD、執行技術審查。
Scrum Master協調器(軟體)派發、路由、控管 WIP、重試、升級——全自動。
開發團隊本地 LLM(LM Studio)讀取脈絡、撰寫程式、執行測試、回報。

原子工單

原子工單是雲端 Tech Lead 與本地編程者之間的交接格式,由 JSON Schema 定義。三個特性讓它成立:

可機器讀取——本地模型無需猜測意圖即可解析。自我完備——相關程式碼直接內嵌進工單,而非以檔名引用,因此小的有效參數模型不必去尋找或記住任何東西。可驗證的 Definition of Done——DoD 是一組帶有預期結果的測試指令,所以「完成」是測試結果,不是主觀判斷。

混合成本路由

工作預設留在本地且免費。重試額度管控自我修正;只有當本地嘗試用盡時,工單才會升級到雲端。便宜的機器檢查擋在昂貴的雲端審查之前,因此你絕不會為了讀每一個 diff 付前沿模型的錢。真正重要的指標是「每張驗收工單的成本」。

架構

        你(Product Owner)
   寫需求 │           │ 核可 / 驗收
          ▼           ▲
   ┌────────────────────────────────┐
   │   協調器(Scrum Master)         │  狀態機 · 路由 · 重試
   └───┬───────────┬───────────┬────┘
       │ 拆解+審查  │ 派發      │ 跑測試
   ┌───▼────┐  ┌───▼────────┐  ┌▼───────────────┐
   │ Claude │  │ 本地 LLM    │  │ pytest/npm test│
   │(Tech   │  │(LM Studio) │  │(驗證)          │
   │ Lead)  │  │ 開發團隊    │  └────────────────┘
   └────────┘  └────────────┘

技術堆疊:Python · FastAPI · SQLite · React · Tailwind · LM Studio(本地推論)· Claude API(雲端)。

流程

一個需求走過單一條流程:

  1. 輸入——PO 寫下需求;Tech Lead 將它拆解成原子工單;PO 檢視並核可(關卡 1)。
  2. 執行——協調器將每張工單派發給其本地模型,由它撰寫程式並執行工單的測試。
  3. 自我修正——失敗時,工作者在額度內重試;用盡則升級給 Tech Lead。
  4. 審查——Tech Lead 自動依 DoD 檢查 diff。
  5. 驗收——PO 驗收,或附上回饋退回(關卡 2)。

企業方案

對於受規範、傾向地端,或對成本敏感的組織,HAAO 設計為可完全在你自己的基礎設施上運行。執行留在本地,程式碼不離開你的機器;雲端模型只看得到工單範圍與供審查的 diff,且被擋在重試額度之後。

企業部署加入 SSO 與角色權限、政策與防護設定(代理可動哪些東西)、自帶推論,以及優先支援。與我們聯絡 來規劃部署。