過去一年の3,400コミット、そのほとんどが同じワーキングツリーで並走していた Claude Code、Codex CLI、PI、Gemini CLI、OpenCodeの何らかの組み合わせで出荷された後、 これが何であり何でないかについて強い意見が形成された。オートコンプリートではない。 「生産性ブースト」でもない。新しいコラボレーターモデルだ。オートコンプリートとして 扱っているチームは価値の大半をテーブルに残している。

オートコンプリートとは何だったか

オートコンプリートのフレーミング — Copilotの元々のピッチ、大まかに言えば — は: 君はまだエンジニアで、AIはより速いキーボードだ。考え、タイプし、補完する。 ループは密で、コンテキストはローカルで、アウトプットは行ごとだ。

それは有用だった。今は現在世代のツールがすることの小さな一部だ。

コラボレーターモデルとは何か

現代のコーディングエージェント(Claude Code、Codex、Gemini、Cursor、OpenCode、 何であれ)は君の行を補完していない。タスクを引き受けている — コンテキストに 50以上のファイルを持つことも、シェルを実行することも、数分間繰り返すことも、 本当に君が答える必要があった質問で止まることもある。

それはオートコンプリートではない。40倍の速度で働き、コードベースへの完全な 読み取りアクセスを持ち、君がミーティングにいる間90分の調査を喜んでやってくれる ジュニアからミッドレベルのエンジニアだ。

正しいアナロジーは並列で走らせるのに十分安いペアプログラマーを持つことだ。 そのアナロジーの含意は:行を補完していた頃とは異なる方法で作業を計画する必要が あるということだ。

変えた五つのこと

1. 常に実装の前にスペックを書く

私が自分でコードを書く場合、ある程度行き当たりばったりでやれる。私のベストコードの 多くは編集しながら生まれるもの — 悪いバージョンをタイプし、見て、リファクタし、 どこかいい場所に行き着く。

エージェントではそれは機能しない。曖昧なスペックを与えられたエージェントは曖昧な 実装を生成する、プラス三つのもっともらしく見える抽象を生成し、それらすべてを レビューする時間を請求する。明確さを前倒しにしなければならない。「ファイルYの この既存パターンを使って、これらの制約でXをするものを作れ、そして私が求めない 限り汎用の抽象を追加するな。」

私のスペックは今、自分でコードを書いていた頃より一桁明示的になっている。それだけで AI対話だけでなく、コードも改善された。

2. diffを丁寧に読む。毎回。

エージェントが動いているように見える500行を生成したとき、流し見して受け入れる 強い誘惑がある。流し見するな。500行には頻繁に含まれている:

  • 頼んでいない抽象。
  • 以前は違ったコードを説明するコメント。
  • コードベースの命名規則と合わない発明された関数名。
  • エージェントが自分に書いて実行しなかった「TODO」。

これらはエージェントのバグではない。委任のコストだ。規律はジュニアエンジニアの PRに適用するのと同じだ:永遠に保守しなければならないかのように読め。なぜなら そうだから。

3. 関係ないタスクに複数のエージェントを並列で走らせる

これが最大のアンロックだ。一つのtmuxペインで一つのエージェントをバックエンド リファクタに走らせ、二つ目のペインで別のエージェントをドキュメントパスに、三つ目の ペインでライブラリを評価させる。スコープをリポジトリの互いに素な部分に制限したので 衝突しない。ペイン間のスワップが実際のシニアの作業をしている場所だ — レビュー、 指示、却下、彼らの間のコンテキストの貼り付け。

ここで掛け算するスキルは作業の分解だ。三時間の本当に並列な作業 — 偽並列ではなく、 本当に並列な — を特定して三つのエージェントでセットアップすることは奇妙に特定の スキルで、誰も教えてくれなかった。今では反射的にやっている。

4. すべてのエージェントにまたがって共有スキル層を維持する

異なるCLIエージェント(Claude Code、Codex、Gemini、PI、OpenCode)は異なる癖を持つ。 共有するのはプロジェクトコンテキスト — 慣習、ルールファイル、テストコマンドだ。 その共有コンテキストを一箇所(rice-shared-skills)で維持し、すべての エージェントが次のアクティベーションでそれから引く。コーディング標準を更新すると、 すべてのエージェントが数分以内にそれを見る。

これがマルチエージェントを実行可能にするビットだ。これなしでは、各エージェントが プロジェクトの独自の特異な見方を持ち、シニアの時間をドリフトの調整に費やす。

5. 一つが詰まったときにエージェントを中途でスワップする

Claude Codeが特定のリファクタについて推論するループで詰まることがある。同じコンテキストを Codexに切り替えて状態を貼り付け、多くの場合数分でアンブロックされる。Codexが 絶対的な意味で「賢い」からではなく — すべてが大まかに匹敵する — どの個別モデルの 局所最小値も異なり、同じコンテキストを持つ別のモデルがそれから安価に脱出するからだ。

これがraiseを書いた理由の一つだ:認証の保存付きで17のAIツール間を アトミックなシンリンクスワップで切り替え、それぞれの認証と設定を手動で再設定する ことが一日を食っていたから。

これでないもの

コラボレーターモデルがでないいくつかのこと:

  • シニアの判断の代替ではない。 エージェントが生成し、君がレビューする。信頼性を 持ってレビューできなければ、本番にランダムなコードを公開している。「これをレビュー できない」のバーは「このPRは出荷しない」であるべきだ。人間の場合と同じように。
  • 無料ではない。 払っており、コストは軽くない。ペアーシートのコストを理由に LLM支援エンジニアリングを却下しているチームは、オートコンプリートのフレーミングで スプレッドシートの計算をしており、エージェントが適合するタスクで15分に2〜3時間の 作業をすることを見逃している。
  • タスクタイプにまたがって均一ではない。 エージェントはリファクタリング、ボイラー プレートの書き込み、テストの生成、不慣れなコードの説明、ドキュメントの執筆には 優れている。アーキテクチャの決定、プロダクトの判断、人間との交渉が必要なものには 中程度だ。非対称性を知れ。

CVへの含意

2026年にシニアエンジニアを採用していて、面接ループが候補者のAIツールとの作業 方法を調べないなら、実際の仕事の面接をしていない。 実際の仕事は「この人は エージェントの作業を指示し、エージェントが間違っていることを認識し、その基礎の上で 信頼性のあるコードを出荷できるか」だ。できない候補者はできる候補者より遅くなる、 四半期にまたがって複合する方法で。

静かな部分を言おう:これが私の今現在-席と席の間の帯域幅の多くが向かっている場所だ。 本物のAI支援パイプラインに本物のワークロードを走らせ、機能するものとしないものを 書き記し、パターンをより信頼できるものにするツールを出荷する。このスキルで採用 しているなら、ここにいる — そしてクレームを裏付けるコミットグラフがある。