WHATISAI|実践編Ⅱ
コードの外へ
── あらゆる業務に効く、4本のレバー
ここまでは「コードを書く」話でした。でも、4本のレバー(文脈・検証・分割・舵)はコードに固有のものではありません。 その正体は、不安定だが有能な知能を、信頼できる仕事に変える汎用装置。法務・マーケ・営業・CS・財務・人事・経営 ── あらゆる知的業務で、成功する組織と事故る組織を分けているのは、同じ4本でした。2025〜26年の実ケースで確かめます。
⚠ この章の社名・数値は2025-26年時点の公表値(各社の自社発表や、期待値を含む調査を含む)。点線の語はタップで意味が出ます。
再定義ハーネスは、エンジニアだけのものではない
第1章の式を思い出してください ── Agent = Model + Harness。モデル(不安定な知能)は、どの業務でも同じものです。契約書を読むのも、メールを書くのも、財務を分析するのも、裏で動くのは同じ"推測機械"。だとすれば、差を生むのは、それを取り巻くハーネスのほう。これは職種を選びません。
コードでの「テストを実行して検証」は、業務では「出典に当たって事実を照合」。形は違っても、引くレバーは同じです。だから、あなたがコードを一行も書かない管理職でも ──AIを部下に持つマネジャーとして、4本のレバーを引けます。
4本のレバーにとって、コードは応用先のひとつにすぎない。本体は「不安定だが有能な知能を、信頼できる仕事に変える」装置です。だから ──契約書でも、広告でも、採用でも、引くレバーは同じ。違うのは、それを業務の言葉に翻訳できているかどうかだけ。
マッピング4本のレバーを、業務の言葉に翻訳する
各レバーが、コードと業務で「同じこと」をしているのが見えます。左(コード)=右(業務)で読んでください。
実証①:効いた現場レバーが効くと、こうなる
2025〜26年、レバーを効かせた組織の成果です。共通点は、丸投げでなく文脈を与え・検証を分け・工程を割り・人が舵を握ったこと。
| 業務 | 組織・ツール | 成果(公表値) | レバー |
|---|---|---|---|
| 法務(契約) | Robin AI ×ケンブリッジ大 | 150頁のLPA審査が 8〜12時間→5〜10分 | ①②③ |
| 法務(全般) | Harvey × Repsol | 弁護士1人 週4〜6時間節約・部門採用率96% | ①③ |
| 金融調査 | Hebbia ×投資会社 | SECファイリング分析が 6時間→30分 | ①③ |
| 全社文書 | JPMorgan LLM Suite | 23万人が利用・AI投資≒年間削減 各約20億ドル(CEO発言) | ① |
| 監査 | KPMG 取引スコアリング | 取引を 100%チェック(従来は5〜10%抽出) | ②③ |
| 不正検知 | Suncoast信組 × UiPath | 不正損失を 2年で75%削減・全件自動レビュー | ②③ |
| マーケ | JPMorgan × Persado | コピーのCTRが 最大+450%(人間案とA/B比較) | ①② |
| 営業/CS | Salesforce 社内 | 4.3万リード処理・$170万パイプライン・人間対応は1% | ③④ |
特に効いているのは②検証です。Persado は「良いコピー」を推測でなくA/Bテスト(実データ)で決め、KPMG は抽出でなく全件を機械チェックする。第3章「検証ループが作れる仕事ほど任せられる」が、そのまま業務で起きています。
実証②:手放した代償舵か検証を手放した、実際の事故
同じ2025〜26年、逆の現場です。これらは「AIが悪い」のではなく、②検証や④舵を省いた結果。コードの失敗カタログ(付録)と、原因は完全に同じです。
線引きの地図どの業務から、任せるか
第5章と同じ2軸 ──検証しやすさ × リスクで、業務ごとの任せ方は決まります。あなたの仕事で当ててみてください。タップすると、効かせるレバーと実ケースが出ます。
↑ どれかタップしてください
※ 数値・事例は出典の公表値(各社の自社発表や調査の期待値を含む)で2025-26年時点。普遍なのは「検証しやすい業務ほど任せやすく、判断・価値・対人はレバー④で握る」という構造。
企業のAI導入プロジェクトの多くが、成果を出せず頓挫します。最大の理由は?
マクロの現実なぜ、多くのAI導入は頓挫するのか
個別事例の裏で、全体像も同じことを語っています。
- MIT(2025/8):企業の生成AIパイロットの約95%が、損益(P&L)への測定可能なインパクトを生んでいない。成果を出したのは5%。※「失敗率」ではなく「財務効果が測れていない率」。
- Gartner(2025/6):エージェントAIの40%超が、2027年末までにキャンセルされると予測(コスト・価値不明・リスク管理不足)。
- McKinsey(2025/11):88%が何らかの業務でAIを使うが、EBITへの貢献を認識できているのは39%(大半は5%未満)、エージェントをスケール展開できたのは23%。
診断は一つです ──ツール(モデル)を導入しただけで、ハーネス(4本のレバー)を設計しなかった。PoC止まりになるのは、検証ループと舵と文脈の設計を欠くから。裏を返せば、この4本こそが、導入の成否を分ける変数です。第1章の「engineer すべきはモデルでなく、その外側」は、組織のAI活用にもそのまま効きます。
発展発展:『ループ内の人間』が、なぜ形だけになるのか▼ 数式が苦手な方は飛ばしてOK
自動化バイアス:人はAIの流暢で整然とした出力を、実力と錯覚して過信する。研究(Springer "AI & SOCIETY" 2025 ほか)でも、AI助言によって当初正しかった判断が覆る現象が確認されている。これは付録で触れた「自信満々の流暢さ」の罠の、業務版です。
だから「人間がループ内にいる(human-in-the-loop)」は、形だけだと機能しない。保険請求の否認や、AI判例の素通りは、まさに人間のチェックが形骸化した例。真の舵とは、人格や善意でなく仕組み ── ①エビデンス(出典・実データ)を必ず要求する、②生成者と別の主体が検証する、③高リスク領域は人の承認を強制ゲートにする。第3章・第5章の結論が、職種を問わず効きます。
⚠ 時点依存:社名・数値・訴訟は2025-26年時点で、状況は変わりうる(係争中の案件を含む)。普遍なのは「検証可能性が自動化の上限を決める」「流暢さは過信を生む」という構造。出典: MIT Project NANDA "The GenAI Divide"、McKinsey "State of AI 2025"、Gartner、各社プレスリリース、裁判所文書、Springer。数値の多くは各社・調査の自己申告・期待値を含む。
コードを書かなくても、AIを率いるなら、
あなたはハーネス・エンジニアだ。
── レバーは、職種を選ばない。次に部署でAIを使うとき、問うてください。「文脈は与えたか・検証は分けたか・工程は割ったか・舵は誰が握るか」。その4つが、成果と事故を分けます。