Kashi · token optimization · model routing
サブエージェントの中身(生成・監査・派生)を、難しさに応じて haiku / sonnet / opus に自動で振り分ける。重い判断だけ opus、機械的な作業は haiku。あなたが毎回モデルを選ぶ必要はない。
| モデル | 入力 / 出力 | opus比 | 役割 |
|---|---|---|---|
| Fable 5 | $10 / $50 | 2.0× | 知能の天井・最遅。“節約”の逆。最適化には使わない。 |
| Opus 4.8 | $5 / $25 | 1.0× | 判断系の天井(fidelity・冷読・関連性vet・統合) |
| Sonnet 4.6 | $3 / $15 | ~0.6× | 速度/コスト両立。生成・量産(種・本文・仕上げ) |
| Haiku 4.5 | $1 / $5 | ~0.2× | 単純分類/抽出/テンプレ(監査・派生)。200K context |
相対コスト: haiku ≈ opus の 1/5・sonnet ≈ 1/1.7・fable = 2倍。
| 重さ | モデル | 工程(stage) |
|---|---|---|
| 軽 — 機械的/抽出/テンプレ | haiku | doc(禁止語監査) · crf(AI臭リント) · derive(各SNS派生) · extract/dedup/整形 |
| 中 — 生成 | sonnet | seed(種) · body(本文) · finalize(仕上げ) · discover(検索+実在検証) · distill · analyze |
| 重 — 判断 | opus | fid(研究を盛らない) · rdr(当事者recognition冷読) · vet(関連性判断) · synth(統合) |
| 臨界 — 稀 | fable | 既定では不使用。最高判断が要る一発のみ手動で model:'fable' |
model:'fable' を指定する。量産・監査・派生には絶対に使わない。
振り分けは エンジン生成器に埋め込み済み。LLM トリアージ専用エージェントは作っていない(=それ自体の追加コストを回避)。単一の真実源は workspace/scripts/discovery-leads/model_policy.py。
| 生成器 | 体数 | 振り分け |
|---|---|---|
| make_engine.py(JP note 認識記事) | 7体/源泉 | seed/body/final=S · fid/rdr=O · doc/crf=H |
| make_engine_en.py(EN 認識記事) | 7体/源泉 | 同上 |
| make_engine_study.py(study-forward) | 8体/cluster | 上記 + derive=H |
| make_scout_wf.py(研究スカウト) | 9トピック×2段 | discover=S · vet=O |
| seed | body | fid | doc | rdr | crf | final | derive |
|---|---|---|---|---|---|---|---|
| S | S | O | H | O | H | S | H |
opus 2 体(重い判断)+ sonnet 3 体(生成)+ haiku 3 体(機械作業)。旧 8体opus一律 ≈ 8.0 単位 → 今 ≈ 2.0 + 1.8 + 0.6 = 約4.4 単位(〜45%減)。記事は派生なしの 7体で同様に〜50%減。
/model はあなたの判断でOK — 雑務は /model haiku、通常は default(opus)。