WHATISAI|第4章
レバー③分割
── サブエージェントと、多エージェントの最前線
第2章で「文脈は腐る」と見ました。なら、対策はこうです ── 一つの文脈に全部を詰めない。 大きな仕事を小さく刻み、別々のエージェントに分けて、文脈を汚さない。これが分割レバー。そしてその先に、いま最も熱い最前線があります。
まず原則大きく頼むほど、失敗する
「このアプリ全部作って」と一息で頼むと、エージェントは途中で文脈を見失い、早すぎる完了宣言をし、整合性が崩れます(序章の "doom loop")。Anthropic が実証した長期エージェントの鍵は、逆でした ──
「一度に一機能」という制約が、「全部を一気に片づけようとして空転する」のを防ぐ鍵になる。 — Anthropic "Effective Harnesses for Long-Running Agents"(要約)
世界トップクラスの実務者がAIに渡すのは、大きなひと塊の依頼ではなく、小さく・直線的で・検証できる単位です。これは前章の検証レバーと地続き ── 小さく割るほど、各単位に検証ループを掛けやすい。
仕組みを見るサブエージェントで、文脈を「隔離」する
分割のいちばん強い道具がサブエージェントです。調査・実装・レビューを別エージェントに分けると、各自が独自のコンテキストウィンドウを持つ。だから一つの会話に全部積み上げたときの「膨張・混線」が起きない。下で見てください。
調査も実装もレビューも、ぜんぶ同じ文脈に積み上がる ── 膨張し、肝心の指示が腐り、混線する。
※ 概形デモ。Anthropic のマルチエージェント構成は、文脈の隔離により単一エージェント比で大きな改善を報告。Claude Code では .claude/agents/ に役割別エージェントを定義し、各自が独自のコンテキストウィンドウ・ツール・モデルを持つ。
.claude/agents/ に役割別エージェントを定義する(例: researcher / implementer / reviewer)。各エージェントは独自のコンテキスト・ツール・モデルを持てる。前章の「生成者≠評価者」も、この分割で実現される ── 実装役とレビュー役を別エージェントにするだけ。 3つの独立した技術調査を、Claude Code に任せたい。速くて文脈も汚さないのは?
最前線①「1体を使う」から、「艦隊を率いる」へ
分割を突き詰めると、いま最も動いている前線に出ます ── 多エージェントのオーケストレーション。Karpathy は複数の並列エージェントを指揮し、DHH は高速・高性能の2モデルを並走させ、積み上がった250件のPRのうち100件を90分で処理した、と報告されています。「1体のAIを上手に使う」から「多数のエージェントを率いる」へ、実務者の仕事が移りつつある。
発展発展:多エージェントの設計と、その落とし穴▼ 数式が苦手な方は飛ばしてOK
① 標準化の前線:エージェントに外部ツールをつなぐ規格 に続き、エージェント同士をつなぐプロトコル(A2A 系)が立ち上がりつつある。"使う"から"束ねる"への土台。
② ステートレスなハーネス:Anthropic のマネージドエージェント設計は「ハーネスをに保ち、各実行環境を単なるツール呼び出しとして扱う」。これで複数エージェントが複数環境にタスクを配れる。
③ 落とし穴(正直に):多エージェントは魔法ではない。エージェント間の通信オーバーヘッド・競合・・調整コストがある。実務者からは「単純なタスクは、1体の方が速い」という声も。分割は目的でなく手段 ── 独立性が高く並行で得する仕事にだけ効く。
⚠ 時点依存・議論中:A2A 等のプロトコルは黎明期、標準は流動的(2026年なかば時点)。マルチエージェントの調整コストの定量化も発展途上。普遍なのは「文脈は隔離すると劣化を防げる」という構造。出典: Anthropic(マルチエージェント/マネージドエージェント)、Karpathy、TeamDay "Agentic Coding 2026"。
大きく頼まず、小さく割って、隔離する。
その延長に、艦隊を率いる未来がある。
── 次にエージェントが大きな仕事で空転したら、疑ってください。「タスクが大きすぎて、文脈が腐っている」のかも。割って、サブエージェントに渡す。