Cursor が見せた未来：開発のトリガーが人間からエージェントに移るとき

開発のトリガーが移動する

ソフトウェア開発には常に「トリガー」がある。人間がコードを書き、人間が CI を起動し、人間が PR をレビューする。すべての起点に人間がいた。

開発のトリガーが人間からエージェントに移る。 Cursor が 2026 年 2〜3 月にリリースした一連の機能——Cloud Agents、Automations、Bugbot Autofix——は、この移行に必要な層をすべて揃えた。エージェントが自律的に動く環境、数週間に及ぶ実行時間、イベント駆動の自動起動。個々の機能はそれぞれ異なる問いに答えているが、全体を俯瞰すると浮かび上がるのは一つのパラダイムシフトだ。

Cursor CEO の Michael Truell はこれを「The Third Era of AI Software Development」と呼ぶ。第一の時代が Tab 補完（1 行ずつの提案）、第二の時代がローカルエージェント（同期的なコード生成）、第三の時代が Cloud Agents（クラウド上の自律実行）。実際、Cursor が公開した成長データがこの移行を裏付ける。2025 年 3 月には Tab 補完のユーザー数が Agent ユーザーの 2.5 倍だったが、2026 年 2 月には Agent ユーザーが Tab 補完の 2 倍に逆転した。

Cloud Agents：トリガーが生きる場所

トリガーを人間から切り離すには、まずエージェントが人間なしで生存できる環境が必要だ。Cloud Agents はその基盤を提供する。

エージェントにデスクトップ環境を含むフルの Ubuntu VM を 1 台割り当てる。 コンテナではない。仮想マシンだ。タスクごとに新規の Ubuntu VM がプロビジョニングされ、指定ブランチの HEAD からリポジトリをクローンし、セットアップコマンド（npm install 等）を実行してから作業を開始する。

VM には独立したファイルシステム、ターミナル、ネットワーク、パッケージマネージャ、VNC 経由のリモートデスクトップ、ブラウザが揃っている。エージェントはこの VM 上で、ターミナルでコマンドを実行し、ブラウザで Web ページを開き、マウスでボタンをクリックする。後述する Grind Mode により、数時間から数週間、人間の介入なしに動き続ける。

ただし、VM の CPU コア数やメモリ等のスペックは公式には非公開だ。 Cursor フォーラムでの質問に対し、Cursor 社員は「top や lscpu を実行して確認してほしい」と回答するにとどめている。Enterprise プランでは「リソース制限の引き上げをリクエスト可能」とされており、標準プランにはリソース上限がある。

観点	従来の Agent	Cloud Agent
実行環境	ローカルマシン	専用 Ubuntu VM
実行時間	同期的（数分）	非同期（数時間〜数週間）
出力	コード diff	動画、スクリーンショット、ログ含むアーティファクト
テスト	CLI 実行のみ	ブラウザ操作、GUI 操作も可能
人間の関与	リアルタイム監視	非同期レビュー

画面を見て操作するエージェント

Cloud Agents が従来の CLI ベースのエージェントと決定的に異なるのは、エージェントが画面を「見て」操作できる点だ。VM 上のスクリーンショットを撮り、画面の内容を理解し、マウスの座標を指定してクリックし、キーボードでテキストを入力する。Cursor はこの VM 上で、Anthropic が「Computer Use」と呼ぶ技術を採用している。これは LLM がスクリーンショットを解析して GUI 操作を生成する仕組みで、人間がデスクトップ上で行う操作をほぼそのまま再現できる。

Web ページの閲覧、フォーム入力、UI のクリック操作、dev サーバーの起動とブラウザでの動作確認、セッション全体の動画録画など、対象は幅広い。

ただし制約もある。Dockerfile や environment.json スナップショットを使用するリポジトリでは動作しない。また、デフォルトのネットワーク許可リストにより、Google Fonts など外部ドメインへのアクセスがブロックされるケースが報告されている。

Grind Mode：トリガーの持続時間を数分から数週間へ

ローカルエージェントのトリガーは数分で尽きる。Grind Mode はこの持続時間を数週間にまで引き延ばす。

公式にはセッション時間の上限は明示されていない。 個々のターミナルコマンドには 10 分のタイムアウトがあるが、エージェントセッション全体の制限は公開されていない。Grind Mode では計画フェーズで開発者とエージェントが方針を合意し、その後エージェントが単独で実行を続ける。定期的な「フレッシュリスタート」で視野狭窄を防ぎ、「Judge Agent」がサイクル境界で継続・中止を判断する。

ソース	規模	タスク
Cursor 公式ブログ	約 1 週間	Web ブラウザのビルド（100 万行以上）
Cursor 公式ブログ	3 週間以上	Solid→React マイグレーション
Cursor 公式ブログ	14,600 コミット	Windows 7 エミュレータ（120 万行）
サードパーティ報告	52 時間以上	自律コーディングタスク

Cursor 社内で作成される PR の 30% 以上が、すでに自律エージェントによるものだという。起動ポイントもエディタに限らず、Web（cursor.com/agents）、Slack、GitHub/GitLab のコメント、Linear、API、モバイル（iOS/Android PWA）から起動できる。

Automations：トリガーが人間の手を離れる

Cloud Agents はエージェントが動く場所を変えた。Automations はエージェントを起動する主体を変える。これが今回のリリースで最も重要な機能だ。

Slack、Linear、GitHub、PagerDuty、Webhook、Cron をトリガーソースとして、エージェントが**常時稼働（always-on）**で待機する。イベントが発生すると自動的に起動し、コードベースにアクセスし、作業を実行する。

ビルトインテンプレートとして、PR のセキュリティレビュー、コード変更に基づく自動レビュワーアサイン、PagerDuty アラートに基づくインシデント初動対応、リポジトリの週次サマリー生成などが用意されている。過去の実行結果から学習する Memory Tool も搭載されており、単なるスクリプト自動化とは質的に異なる。

この機能はエディタを開かなくても動作する。 Slack メッセージをトリガーにコードベースを分析するエージェントは、エディタの中にいる必要がない。ここに本質的な転換がある。Cursor の競合はもはや VS Code でも JetBrains でもない。Automations は GitHub Actions や Jenkins と、Cloud Agents は Devin や Factory と競合する。Cursor は「どのエディタが書きやすいか」の競争から離脱し、「どのプラットフォームがエンジニアリング組織全体の生産性を最大化するか」の競争に移った。

Bugbot Autofix：コードレビューもエージェントが起動する

トリガーの移行はコードレビューにも及ぶ。Bugbot Autofix は、PR が作成されるとエージェントが自動的にバグを検出・修正する。従来の linter や SAST との違いは、Bugbot が実際にコードを実行してテストする点にある。

GA 版のメトリクスとして、解決率はベータ時の 52% から 76% に向上している。そのうち 35% 以上の修正提案がそのまま（または軽微な修正で）マージされる——つまり人間の介入が完全にゼロのケースだ。PlanetScale は導入により「フルタイムエンジニア 2 名分」のレビュー工数を削減したと報告している。

コスト：$20 は入り口に過ぎない

Cloud Agents は Pro（$20/月）以上の全プランに含まれている。 VM 単位や minute 単位の課金はなく、コストは月額に含まれる API クレジットプールからトークン消費として差し引かれる。

プラン	月額	含まれる API クレジット
Pro	$20	$20 相当
Pro+	$60	約 $70 相当
Ultra	$200	約 $400 相当

ただし、Cloud Agents は必ず Max Mode で動作するため、通常の API レートに 20% が上乗せされる。さらに、トークン消費にはコード生成だけでなく、画面キャプチャの継続的な処理、VM 監視、動画録画のすべてが含まれる。Max Mode (+20%) でこれらを数時間動かし続ければ、$20 のクレジットで収まるはずがない。

含まれるクレジットを使い切ると従量課金に移行する。Cursor のファウンダー自身が Latent Space のインタビューで「高度に並列化されたエージェントフリートの世界では、1 人あたり月に数千ドルを使う段階にすでに達している」と語っている。$20 は試すための価格であり、本格的に使うための価格ではない。

分析

Claude Code との比較

同時期に Anthropic の Claude Code も似た方向に進化している。worktree 隔離、Agent Teams、/loop コマンドによる定期実行など。

観点	Cursor	Claude Code
基盤	IDE (VS Code fork + JetBrains)	Terminal (CLI)
並列実行	Cloud VM + worktree	ローカル worktree + Agent Teams
自律実行	Automations (イベント駆動)	/loop (cron 的)
テスト	Computer Use (ブラウザ操作)	Bash tool (CLI 内実行)
価格帯	$20-200/月 + 従量課金	$20-100/月

Cursor は IDE-native、Claude Code は Terminal-native。どちらが勝つかという問いより、開発者がエージェントフリートをどこから管理するかが本質的な問いだ。Cursor の強みは Computer Use による GUI 操作と Automations によるイベント駆動。Claude Code の強みはシェル環境との直接統合と透明性の高いツール実行。組織のワークフローが GUI 検証を多用するなら Cursor、CLI ベースの開発が中心なら Claude Code に分がある。

カスケード障害という未解決問題

Truell のブログで印象的だったのは、エージェントフリートにおける「カスケード障害」への言及だ。あるエージェントの breaking change が他のエージェントのビルドを壊し、修正エージェントが起動して元の変更を巻き戻し、連鎖的に破綻する。分散システムで 30 年以上研究されてきた一貫性の問題が、AI エージェントの文脈で再浮上している。

コストの不透明さ、エージェントがコードベース全体にアクセスするセキュリティリスク。これらは Cursor だけでなく、すべてのエージェントプラットフォームが答えなければならない問いだ。

今後の注目点

Automations と画面操作の組み合わせがどう進化するか。PagerDuty アラートをトリガーにエージェントが起動し、ブラウザでエラー画面を確認し、修正 PR を作成し、テストを実行してマージする。このワークフローが実用的な品質に達したとき、ソフトウェア開発の定義が変わるだろう。