WHATISAI｜第4章

レバー③分割
── サブエージェントと、多エージェントの最前線

第2章で「文脈は腐る」と見ました。なら、対策はこうです ── 一つの文脈に全部を詰めない。大きな仕事を小さく刻み、別々のエージェントに分けて、文脈を汚さない。これが分割レバー。そしてその先に、いま最も熱い最前線があります。

まず原則大きく頼むほど、失敗する

「このアプリ全部作って」と一息で頼むと、エージェントは途中で文脈を見失い、早すぎる完了宣言をし、整合性が崩れます（序章の "doom loop"）。Anthropic が実証した長期エージェントの鍵は、逆でした ──

「一度に一機能」という制約が、「全部を一気に片づけようとして空転する」のを防ぐ鍵になる。 — Anthropic "Effective Harnesses for Long-Running Agents"（要約）

世界トップクラスの実務者がAIに渡すのは、大きなひと塊の依頼ではなく、小さく・直線的で・検証できる単位です。これは前章の検証レバーと地続き ── 小さく割るほど、各単位に検証ループを掛けやすい。

仕組みを見るサブエージェントで、文脈を「隔離」する

分割のいちばん強い道具がサブエージェントです。調査・実装・レビューを別エージェントに分けると、各自が独自のコンテキストウィンドウを持つ。だから一つの会話に全部積み上げたときの「膨張・混線」が起きない。下で見てください。

触って確かめる：1体に全部 vs 3体に分割同じ仕事を「1体のエージェントに全部」任せるか、「調査・実装・レビューを別エージェントに分ける」か。文脈の詰まり具合を見てください。

1体のエージェントの文脈

92%

調査も実装もレビューも、ぜんぶ同じ文脈に積み上がる ── 膨張し、肝心の指示が腐り、混線する。

※ 概形デモ。Anthropic のマルチエージェント構成は、文脈の隔離により単一エージェント比で大きな改善を報告。Claude Code では .claude/agents/ に役割別エージェントを定義し、各自が独自のコンテキストウィンドウ・ツール・モデルを持つ。

Claude Code での具体

.claude/agents/ に役割別エージェントを定義する（例: researcher / implementer / reviewer）。各エージェントは独自のコンテキスト・ツール・モデルを持てる。前章の「生成者≠評価者」も、この分割で実現される ── 実装役とレビュー役を別エージェントにするだけ。

まず予想してみる

3つの独立した技術調査を、Claude Code に任せたい。速くて文脈も汚さないのは？

最前線①「1体を使う」から、「艦隊を率いる」へ

分割を突き詰めると、いま最も動いている前線に出ます ── 多エージェントのオーケストレーション。Karpathy は複数の並列エージェントを指揮し、DHH は高速・高性能の2モデルを並走させ、積み上がった250件のPRのうち100件を90分で処理した、と報告されています。「1体のAIを上手に使う」から「多数のエージェントを率いる」へ、実務者の仕事が移りつつある。

発展発展：多エージェントの設計と、その落とし穴▼ 数式が苦手な方は飛ばしてOK

① 標準化の前線：エージェントに外部ツールをつなぐ規格に続き、エージェント同士をつなぐプロトコル（A2A 系）が立ち上がりつつある。"使う"から"束ねる"への土台。

② ステートレスなハーネス：Anthropic のマネージドエージェント設計は「ハーネスをに保ち、各実行環境を単なるツール呼び出しとして扱う」。これで複数エージェントが複数環境にタスクを配れる。

③ 落とし穴（正直に）：多エージェントは魔法ではない。エージェント間の通信オーバーヘッド・競合・・調整コストがある。実務者からは「単純なタスクは、1体の方が速い」という声も。分割は目的でなく手段 ── 独立性が高く並行で得する仕事にだけ効く。

⚠ 時点依存・議論中：A2A 等のプロトコルは黎明期、標準は流動的（2026年なかば時点）。マルチエージェントの調整コストの定量化も発展途上。普遍なのは「文脈は隔離すると劣化を防げる」という構造。出典: Anthropic（マルチエージェント／マネージドエージェント）、Karpathy、TeamDay "Agentic Coding 2026"。

第4章のひとこと

大きく頼まず、小さく割って、隔離する。
その延長に、艦隊を率いる未来がある。

── 次にエージェントが大きな仕事で空転したら、疑ってください。「タスクが大きすぎて、文脈が腐っている」のかも。割って、サブエージェントに渡す。