開発のトリガーが移動する
ソフトウェア開発には常に「トリガー」がある。人間がコードを書き、人間が CI を起動し、人間が PR をレビューする。すべての起点に人間がいた。
開発のトリガーが人間からエージェントに移る。 Cursor が 2026 年 2〜3 月にリリースした一連の機能——Cloud Agents、Automations、Bugbot Autofix——は、この移行に必要な層をすべて揃えた。エージェントが自律的に動く環境、数週間に及ぶ実行時間、イベント駆動の自動起動。個々の機能はそれぞれ異なる問いに答えているが、全体を俯瞰すると浮かび上がるのは一つのパラダイムシフトだ。
Cursor CEO の Michael Truell はこれを「The Third Era of AI Software Development」と呼ぶ。第一の時代が Tab 補完(1 行ずつの提案)、第二の時代がローカルエージェント(同期的なコード生成)、第三の時代が Cloud Agents(クラウド上の自律実行)。実際、Cursor が公開した成長データがこの移行を裏付ける。2025 年 3 月には Tab 補完のユーザー数が Agent ユーザーの 2.5 倍だったが、2026 年 2 月には Agent ユーザーが Tab 補完の 2 倍に逆転した。
Cloud Agents:トリガーが生きる場所
トリガーを人間から切り離すには、まずエージェントが人間なしで生存できる環境が必要だ。Cloud Agents はその基盤を提供する。
エージェントにデスクトップ環境を含むフルの Ubuntu VM を 1 台割り当てる。 コンテナではない。仮想マシンだ。タスクごとに新規の Ubuntu VM がプロビジョニングされ、指定ブランチの HEAD からリポジトリをクローンし、セットアップコマンド(npm install 等)を実行してから作業を開始する。
VM には独立したファイルシステム、ターミナル、ネットワーク、パッケージマネージャ、VNC 経由のリモートデスクトップ、ブラウザが揃っている。エージェントはこの VM 上で、ターミナルでコマンドを実行し、ブラウザで Web ページを開き、マウスでボタンをクリックする。後述する Grind Mode により、数時間から数週間、人間の介入なしに動き続ける。
ただし、VM の CPU コア数やメモリ等のスペックは公式には非公開だ。 Cursor フォーラムでの質問に対し、Cursor 社員は「top や lscpu を実行して確認してほしい」と回答するにとどめている。Enterprise プランでは「リソース制限の引き上げをリクエスト可能」とされており、標準プランにはリソース上限がある。
| 観点 | 従来の Agent | Cloud Agent |
|---|---|---|
| 実行環境 | ローカルマシン | 専用 Ubuntu VM |
| 実行時間 | 同期的(数分) | 非同期(数時間〜数週間) |
| 出力 | コード diff | 動画、スクリーンショット、ログ含むアーティファクト |
| テスト | CLI 実行のみ | ブラウザ操作、GUI 操作も可能 |
| 人間の関与 | リアルタイム監視 | 非同期レビュー |
画面を見て操作するエージェント
Cloud Agents が従来の CLI ベースのエージェントと決定的に異なるのは、エージェントが画面を「見て」操作できる点だ。VM 上のスクリーンショットを撮り、画面の内容を理解し、マウスの座標を指定してクリックし、キーボードでテキストを入力する。Cursor はこの VM 上で、Anthropic が「Computer Use」と呼ぶ技術を採用している。これは LLM がスクリーンショットを解析して GUI 操作を生成する仕組みで、人間がデスクトップ上で行う操作をほぼそのまま再現できる。
Web ページの閲覧、フォーム入力、UI のクリック操作、dev サーバーの起動とブラウザでの動作確認、セッション全体の動画録画など、対象は幅広い。
ただし制約もある。Dockerfile や environment.json スナップショットを使用するリポジトリでは動作しない。また、デフォルトのネットワーク許可リストにより、Google Fonts など外部ドメインへのアクセスがブロックされるケースが報告されている。
Grind Mode:トリガーの持続時間を数分から数週間へ
ローカルエージェントのトリガーは数分で尽きる。Grind Mode はこの持続時間を数週間にまで引き延ばす。
公式にはセッション時間の上限は明示されていない。 個々のターミナルコマンドには 10 分のタイムアウトがあるが、エージェントセッション全体の制限は公開されていない。Grind Mode では計画フェーズで開発者とエージェントが方針を合意し、その後エージェントが単独で実行を続ける。定期的な「フレッシュリスタート」で視野狭窄を防ぎ、「Judge Agent」がサイクル境界で継続・中止を判断する。
| ソース | 規模 | タスク |
|---|---|---|
| Cursor 公式ブログ | 約 1 週間 | Web ブラウザのビルド(100 万行以上) |
| Cursor 公式ブログ | 3 週間以上 | Solid→React マイグレーション |
| Cursor 公式ブログ | 14,600 コミット | Windows 7 エミュレータ(120 万行) |
| サードパーティ報告 | 52 時間以上 | 自律コーディングタスク |
Cursor 社内で作成される PR の 30% 以上が、すでに自律エージェントによるものだという。起動ポイントもエディタに限らず、Web(cursor.com/agents)、Slack、GitHub/GitLab のコメント、Linear、API、モバイル(iOS/Android PWA)から起動できる。
Automations:トリガーが人間の手を離れる
Cloud Agents はエージェントが動く場所を変えた。Automations はエージェントを起動する主体を変える。これが今回のリリースで最も重要な機能だ。
Slack、Linear、GitHub、PagerDuty、Webhook、Cron をトリガーソースとして、エージェントが**常時稼働(always-on)**で待機する。イベントが発生すると自動的に起動し、コードベースにアクセスし、作業を実行する。
ビルトインテンプレートとして、PR のセキュリティレビュー、コード変更に基づく自動レビュワーアサイン、PagerDuty アラートに基づくインシデント初動対応、リポジトリの週次サマリー生成などが用意されている。過去の実行結果から学習する Memory Tool も搭載されており、単なるスクリプト自動化とは質的に異なる。
この機能はエディタを開かなくても動作する。 Slack メッセージをトリガーにコードベースを分析するエージェントは、エディタの中にいる必要がない。ここに本質的な転換がある。Cursor の競合はもはや VS Code でも JetBrains でもない。Automations は GitHub Actions や Jenkins と、Cloud Agents は Devin や Factory と競合する。Cursor は「どのエディタが書きやすいか」の競争から離脱し、「どのプラットフォームがエンジニアリング組織全体の生産性を最大化するか」の競争に移った。
Bugbot Autofix:コードレビューもエージェントが起動する
トリガーの移行はコードレビューにも及ぶ。Bugbot Autofix は、PR が作成されるとエージェントが自動的にバグを検出・修正する。従来の linter や SAST との違いは、Bugbot が実際にコードを実行してテストする点にある。
GA 版のメトリクスとして、解決率はベータ時の 52% から 76% に向上している。そのうち 35% 以上の修正提案がそのまま(または軽微な修正で)マージされる——つまり人間の介入が完全にゼロのケースだ。PlanetScale は導入により「フルタイムエンジニア 2 名分」のレビュー工数を削減したと報告している。
コスト:$20 は入り口に過ぎない
Cloud Agents は Pro($20/月)以上の全プランに含まれている。 VM 単位や minute 単位の課金はなく、コストは月額に含まれる API クレジットプールからトークン消費として差し引かれる。
| プラン | 月額 | 含まれる API クレジット |
|---|---|---|
| Pro | $20 | $20 相当 |
| Pro+ | $60 | 約 $70 相当 |
| Ultra | $200 | 約 $400 相当 |
ただし、Cloud Agents は必ず Max Mode で動作するため、通常の API レートに 20% が上乗せされる。さらに、トークン消費にはコード生成だけでなく、画面キャプチャの継続的な処理、VM 監視、動画録画のすべてが含まれる。Max Mode (+20%) でこれらを数時間動かし続ければ、$20 のクレジットで収まるはずがない。
含まれるクレジットを使い切ると従量課金に移行する。Cursor のファウンダー自身が Latent Space のインタビューで「高度に並列化されたエージェントフリートの世界では、1 人あたり月に数千ドルを使う段階にすでに達している」と語っている。$20 は試すための価格であり、本格的に使うための価格ではない。
分析
Claude Code との比較
同時期に Anthropic の Claude Code も似た方向に進化している。worktree 隔離、Agent Teams、/loop コマンドによる定期実行など。
| 観点 | Cursor | Claude Code |
|---|---|---|
| 基盤 | IDE (VS Code fork + JetBrains) | Terminal (CLI) |
| 並列実行 | Cloud VM + worktree | ローカル worktree + Agent Teams |
| 自律実行 | Automations (イベント駆動) | /loop (cron 的) |
| テスト | Computer Use (ブラウザ操作) | Bash tool (CLI 内実行) |
| 価格帯 | $20-200/月 + 従量課金 | $20-100/月 |
Cursor は IDE-native、Claude Code は Terminal-native。どちらが勝つかという問いより、開発者がエージェントフリートをどこから管理するかが本質的な問いだ。Cursor の強みは Computer Use による GUI 操作と Automations によるイベント駆動。Claude Code の強みはシェル環境との直接統合と透明性の高いツール実行。組織のワークフローが GUI 検証を多用するなら Cursor、CLI ベースの開発が中心なら Claude Code に分がある。
カスケード障害という未解決問題
Truell のブログで印象的だったのは、エージェントフリートにおける「カスケード障害」への言及だ。あるエージェントの breaking change が他のエージェントのビルドを壊し、修正エージェントが起動して元の変更を巻き戻し、連鎖的に破綻する。分散システムで 30 年以上研究されてきた一貫性の問題が、AI エージェントの文脈で再浮上している。
コストの不透明さ、エージェントがコードベース全体にアクセスするセキュリティリスク。これらは Cursor だけでなく、すべてのエージェントプラットフォームが答えなければならない問いだ。
今後の注目点
Automations と画面操作の組み合わせがどう進化するか。PagerDuty アラートをトリガーにエージェントが起動し、ブラウザでエラー画面を確認し、修正 PR を作成し、テストを実行してマージする。このワークフローが実用的な品質に達したとき、ソフトウェア開発の定義が変わるだろう。