GoogleがGemini 3.5 Flashを発表|前世代ProをすべてのAIエージェント指標で上回る高速・低コストモデル—Antigravity 2.0とManaged Agentsで日本のAI開発が変わる
Googleは2026年5月19日のGoogle I/O 2026で、新世代AIモデルファミリー「Gemini 3.5」の第一弾としてGemini 3.5 Flashを一般公開しました(出典:Google公式・TechCrunch)。前世代のGemini 3.1 Proをすべての主要AIエージェント・コーディングベンチマークで上回りながら、API価格は3.1 Proより約40%安い入力$1.50・出力$9(百万トークンあたり)、キャッシュ入力$0.15で提供されます(出典:llm-stats.com)。他の最前線モデルと比較して出力速度が4倍速いことも測定されており(出典:Google公式)、「高性能・高速・低コスト」の3条件を同時に満たすエージェント特化モデルとして即日一般提供が開始されました。
何が起きたか
主要ベンチマーク:前世代Proをすべての指標で超える
- Terminal-Bench 2.1:76.2%—ターミナル操作・エージェントタスクの達成率で Gemini 3.1 Pro を上回る(出典:Google公式)
- MCP Atlas:83.6%—Model Context Protocolのツール使用ベンチマークでティア首位(出典:Google公式)
- GDPval-AA:1656 Elo—実タスク完遂を評価するエージェント総合指標(出典:Google公式)
- CharXiv Reasoning:84.2%—マルチモーダルのチャート・画像理解(出典:Google公式)
Antigravity 2.0:複数エージェントを並列実行できる新開発環境
Google I/O 2026では、エージェント開発に特化したスタンドアロンデスクトップアプリ「Antigravity 2.0」も同時発表されました(出典:Google公式)。動的サブエージェントによる並列ワークフロー・スケジュールタスクによるバックグラウンド自動化・Google AI Studio/Android/Firebaseとのエコシステム統合が特徴です(出典:Google公式)。デモではGemini 3.5 Flash が93のサブエージェント・15,000回超のモデルリクエストを用いてOSを丸ごと構築し、APIクレジットのコストは1,000ドル未満だったと報告されています(出典:TechCrunch)。なおAntigravity上では期間限定でFlashが通常比12倍速で動作する最適化が適用されています(出典:Google公式)。
Managed Agents API:1回の呼び出しで自律エージェントが起動
Gemini APIに追加された「Managed Agents」は、1回のAPI呼び出しだけで自律エージェントが起動する新機能です(出典:Google公式)。エージェントは隔離されたLinuxコンテナ内で推論・ツール使用・コード実行を自律的に実行するため、従来のように複雑なオーケストレーションロジックを自前実装する必要がなくなります(出典:Google公式)。エンタープライズ向けには「Gemini Spark」という24時間365日稼働のAIエージェントも発表されており、Gmail・Googleドキュメント・SharePoint・Salesforce・ServiceNowをまたいだマルチステップ業務ワークフローを自律実行できます(出典:Epinium)。
日本への影響・ビジネス活用ヒント
- Gemini 3.1 Proユーザーは性能・コスト両面で即日移行を検討:Gemini 3.5 Flashは3.1 Proよりベンチマーク性能が高く、かつ価格が約40%安い設定です(出典:llm-stats.com)。現在Gemini 3.1 ProのAPIを利用している日本企業・開発チームは、同一プロンプトでFlashに切り替えて出力品質とコストを比較検証することを推奨します(推測)。大量処理・高頻度呼び出しのユースケースではコスト削減効果が特に大きいと見られます(推測)。
- Managed AgentsでAIエージェント開発の工数を削減:自前でオーケストレーターを実装していた開発チームは、Managed Agentsに移行することで実装・メンテナンス工数を削減できると見られます(推測)。隔離Linuxコンテナでの実行はセキュリティ面でも有利で、社内データ処理ロジックと外部ツール呼び出しを分離しやすい設計です(推測)。まずGoogle AI Studioで試験的にManaged Agentsを構築し、自社ユースケースへの適合性を評価することを推奨します(推測)。
- Gemini SparkはMicrosoft/Google混在環境にも対応:日本の大企業・官公庁ではMicrosoft 365(SharePoint・Teams)とGoogle Workspaceを並行利用するケースが少なくないと見られます(推測)。Gemini SparkがSharePointやSalesforceをまたいでワークフローを自律実行できる点は、混在環境での業務自動化を検討している組織にとって有力な選択肢となります(推測)。導入にあたっては既存のデータ管理ポリシーとの整合性確認を先行させることを推奨します(推測)。
- 「93エージェント・1,000ドル未満」が示すPoCコストの現実化:大規模な並列エージェント実験はこれまでコスト面で現実的でないケースが多かったと見られますが(推測)、Antigravity 2.0上でのデモ実績は小規模PoCから並列エージェントを試せるコスト水準に達しつつあることを示しています(出典:TechCrunch)。国内のAI開発チーム・スタートアップがAntigravity 2.0を活用して早期に実験知見を積み上げることが、今後の競争優位につながると見られます(推測)。
