WHATISAI｜実践編Ⅱ

コードの外へ
── あらゆる業務に効く、4本のレバー

ここまでは「コードを書く」話でした。でも、4本のレバー（文脈・検証・分割・舵）はコードに固有のものではありません。その正体は、不安定だが有能な知能を、信頼できる仕事に変える汎用装置。法務・マーケ・営業・CS・財務・人事・経営 ── あらゆる知的業務で、成功する組織と事故る組織を分けているのは、同じ4本でした。2025〜26年の実ケースで確かめます。

⚠ この章の社名・数値は2025-26年時点の公表値（各社の自社発表や、期待値を含む調査を含む）。点線の語はタップで意味が出ます。

再定義ハーネスは、エンジニアだけのものではない

第1章の式を思い出してください ── Agent = Model + Harness。モデル（不安定な知能）は、どの業務でも同じものです。契約書を読むのも、メールを書くのも、財務を分析するのも、裏で動くのは同じ"推測機械"。だとすれば、差を生むのは、それを取り巻くハーネスのほう。これは職種を選びません。

コードでの「テストを実行して検証」は、業務では「出典に当たって事実を照合」。形は違っても、引くレバーは同じです。だから、あなたがコードを一行も書かない管理職でも ──AIを部下に持つマネジャーとして、4本のレバーを引けます。

この章の直感

4本のレバーにとって、コードは応用先のひとつにすぎない。本体は「不安定だが有能な知能を、信頼できる仕事に変える」装置です。だから ──契約書でも、広告でも、採用でも、引くレバーは同じ。違うのは、それを業務の言葉に翻訳できているかどうかだけ。

マッピング4本のレバーを、業務の言葉に翻訳する

各レバーが、コードと業務で「同じこと」をしているのが見えます。左（コード）＝右（業務）で読んでください。

①文脈

型・規約を CLAUDE.md に＝案件資料・社内規程・過去事例を与える（RAG）。無関係は積まない

②検証

テスト緑まで反復・別エージェントでレビュー＝出典・事実を照合し、別の人／AIがファクトチェック（生成者≠評価者）

③分割

調査・実装・レビューをサブエージェントに＝業務を工程に割り、専門エージェント／担当に分ける

④舵

permissions・人間ゲート・最小特権＝最終判断と責任は人。高リスク（法・財務・人事）は必ず人が握る

実証①：効いた現場レバーが効くと、こうなる

2025〜26年、レバーを効かせた組織の成果です。共通点は、丸投げでなく文脈を与え・検証を分け・工程を割り・人が舵を握ったこと。

業務	組織・ツール	成果（公表値）	レバー
法務（契約）	Robin AI ×ケンブリッジ大	150頁のLPA審査が 8〜12時間→5〜10分	①②③
法務（全般）	Harvey × Repsol	弁護士1人週4〜6時間節約・部門採用率96%	①③
金融調査	Hebbia ×投資会社	SECファイリング分析が 6時間→30分	①③
全社文書	JPMorgan LLM Suite	23万人が利用・AI投資≒年間削減各約20億ドル（CEO発言）	①
監査	KPMG 取引スコアリング	取引を 100%チェック（従来は5〜10%抽出）	②③
不正検知	Suncoast信組 × UiPath	不正損失を 2年で75%削減・全件自動レビュー	②③
マーケ	JPMorgan × Persado	コピーのCTRが最大+450%（人間案とA/B比較）	①②
営業/CS	Salesforce 社内	4.3万リード処理・$170万パイプライン・人間対応は1%	③④

特に効いているのは②検証です。Persado は「良いコピー」を推測でなくA/Bテスト（実データ）で決め、KPMG は抽出でなく全件を機械チェックする。第3章「検証ループが作れる仕事ほど任せられる」が、そのまま業務で起きています。

実証②：手放した代償舵か検証を手放した、実際の事故

同じ2025〜26年、逆の現場です。これらは「AIが悪い」のではなく、②検証や④舵を省いた結果。コードの失敗カタログ（付録）と、原因は完全に同じです。

法廷のAI架空判例 ── 制裁が続出弁護士がAI生成の存在しない判例を提出し制裁。2026年3月の連邦控訴審では2名に計約3万ドル＋相手方費用。AI起因の架空引用事案は2026年4月時点で約1,348件と1年で約15倍に急増。裁判所いわく「提出前に自ら引用を読んで検証する義務がある」。抜けたレバー: ②検証＋④舵

Air Canada ── チャットボットの誤案内で賠償命令遺族割引について誤情報を出し、企業に賠償命令（2024年2月確定）。「AIは別の主体」という責任回避を裁判所が却下 ──企業は自社AIの全出力に責任を負う。抜けたレバー: ②検証（出力の事実確認）

Klarna ── AI-First の揺り戻しAIでCSの月230万件・解決時間「11分→2分未満」を達成も、CEO が「コストを重視しすぎ品質が低下」と認め、人間の再採用＝ハイブリッドへ転換（2025年5月）。複雑・感情・紛争の案件で品質が落ちた。抜けたレバー: ④舵（人へのエスカレーション設計）

Workday ── 採用AIの差別が集団訴訟に採用スコアリングAIが年齢・人種・障害で不利に働いたと問われ、米国で集団訴訟が認定（2025年5月）。採用の最終権限を実質スコアに委ねた構造が争点。抜けたレバー: ④舵（最終判断と説明責任は人）

保険請求のAI否認 ── 人間レビューの形骸化米保険大手のシステムが、医師の実質レビューなしに請求を一括否認。ある訴訟では2か月で30万件超を否認したと主張（係争中）。「ループ内の人間」が形だけになった。抜けたレバー: ④舵

ブランド／編集 ── Coca-Cola・新聞のAI事故AI生成のクリスマス広告が「魂がない」と炎上（2024/11）。新聞の夏の読書特集ではAIが15冊中10冊を架空の本として掲載（2025/5）。抜けたレバー: ②検証＋④舵

線引きの地図どの業務から、任せるか

第5章と同じ2軸 ──検証しやすさ × リスクで、業務ごとの任せ方は決まります。あなたの仕事で当ててみてください。タップすると、効かせるレバーと実ケースが出ます。

業務の地図 ── 検証しやすさ × リスクで、任せ方は決まるタテがリスク、ヨコが検証しやすさ。右下（検証しやすく低リスク）ほど任せやすく、左上（検証しにくく高リスク）ほど人が握る。業務をタップすると処方と実ケースが出ます。

リスク高 ↑低

人が握る検証しにくい × 高リスク

検証して任せる検証しやすい × 高リスク

補助・一次対応検証しにくい × 低〜中リスク

任せる検証しやすい × 低リスク

← 検証しにくい検証しやすい →

↑ どれかタップしてください

※ 数値・事例は出典の公表値（各社の自社発表や調査の期待値を含む）で2025-26年時点。普遍なのは「検証しやすい業務ほど任せやすく、判断・価値・対人はレバー④で握る」という構造。

まず予想してみる

企業のAI導入プロジェクトの多くが、成果を出せず頓挫します。最大の理由は？

マクロの現実なぜ、多くのAI導入は頓挫するのか

個別事例の裏で、全体像も同じことを語っています。

MIT（2025/8）：企業の生成AIパイロットの約95%が、損益（P&L）への測定可能なインパクトを生んでいない。成果を出したのは5%。※「失敗率」ではなく「財務効果が測れていない率」。
Gartner（2025/6）：エージェントAIの40%超が、2027年末までにキャンセルされると予測（コスト・価値不明・リスク管理不足）。
McKinsey（2025/11）：88%が何らかの業務でAIを使うが、EBITへの貢献を認識できているのは39%（大半は5%未満）、エージェントをスケール展開できたのは23%。

診断は一つです ──ツール（モデル）を導入しただけで、ハーネス（4本のレバー）を設計しなかった。PoC止まりになるのは、検証ループと舵と文脈の設計を欠くから。裏を返せば、この4本こそが、導入の成否を分ける変数です。第1章の「engineer すべきはモデルでなく、その外側」は、組織のAI活用にもそのまま効きます。

発展発展：『ループ内の人間』が、なぜ形だけになるのか▼ 数式が苦手な方は飛ばしてOK

自動化バイアス：人はAIの流暢で整然とした出力を、実力と錯覚して過信する。研究（Springer "AI & SOCIETY" 2025 ほか）でも、AI助言によって当初正しかった判断が覆る現象が確認されている。これは付録で触れた「自信満々の流暢さ」の罠の、業務版です。

だから「人間がループ内にいる（human-in-the-loop）」は、形だけだと機能しない。保険請求の否認や、AI判例の素通りは、まさに人間のチェックが形骸化した例。真の舵とは、人格や善意でなく仕組み ── ①エビデンス（出典・実データ）を必ず要求する、②生成者と別の主体が検証する、③高リスク領域は人の承認を強制ゲートにする。第3章・第5章の結論が、職種を問わず効きます。

⚠ 時点依存：社名・数値・訴訟は2025-26年時点で、状況は変わりうる（係争中の案件を含む）。普遍なのは「検証可能性が自動化の上限を決める」「流暢さは過信を生む」という構造。出典: MIT Project NANDA "The GenAI Divide"、McKinsey "State of AI 2025"、Gartner、各社プレスリリース、裁判所文書、Springer。数値の多くは各社・調査の自己申告・期待値を含む。

実践編Ⅱのひとこと

コードを書かなくても、AIを率いるなら、
あなたはハーネス・エンジニアだ。

── レバーは、職種を選ばない。次に部署でAIを使うとき、問うてください。「文脈は与えたか・検証は分けたか・工程は割ったか・舵は誰が握るか」。その4つが、成果と事故を分けます。