GoogleがGemini 3.5 Flashを発表|前世代比40%安・推論コスト60〜80%削減でエージェントAI時代へ—日本企業のクラウドAI基盤選択が変わること
Googleは2026年5月19日、年次開発者会議「Google I/O 2026」にて新モデル「Gemini 3.5 Flash」を発表しました(出典:VentureBeat、TechCrunch)。前世代フラッグシップの「Gemini 3.1 Pro」をコーディング・エージェント系ベンチマークで上回る性能を、約40%低コストで実現したモデルです。Google CEOのSundar Pichai氏は「1日1兆トークンを処理するユーザーがFlashにワークロードの80%を移行すれば、年間10億ドル以上のコスト削減が可能」と言明しており(出典:VentureBeat)、企業のAIコスト管理に大きな転換点をもたらすと見られます。Google Cloudを活用している日本企業にとっても、AI基盤の見直しを検討する具体的な理由になります。
何が起きたのか
Gemini 3.5 Flashの主要スペック:推論コスト60〜80%削減・スループット2〜3倍
Gemini 3.5 Flashの主な特徴は以下のとおりです(出典:VentureBeat、TechCrunch)。
- 性能:コーディング・エージェント系ベンチマークでGemini 3.1 Pro超え
- コスト:Gemini 3.1 Pro比で約40%安く、推論コストは60〜80%削減
- スループット:エージェント処理速度が2〜3倍に向上
- 価格:入力$1.50/Mトークン・出力$9.00/Mトークン、キャッシュ済み入力は90%オフ
GoogleはFlashを「チャットボットではなくエージェント向けのモデル」と位置づけており(出典:TechCrunch)、複数ステップのタスクを自律的にこなすエージェントAIの基盤として設計されています。さらに高性能な「Gemini 3.5 Pro」は2026年6月中のリリースが予定されていると報じられています(出典:VentureBeat)。
「チャットボットからエージェントへ」—GoogleのAI戦略の転換
Google I/O 2026ではGemini 3.5 Flashとともに、AI戦略の重点が「チャットボット」から「エージェント(自律的に複数タスクをこなすAI)」へ移行することが明確に示されました(出典:TechCrunch)。この方向性はOpenAI CodexやAnthropicのAgent SDKと同一であり、2026年後半から2027年にかけて主要AIプロバイダーがエージェント機能を競う時代に入ることを意味します。日本のRPA活用企業や業務自動化プロジェクトにとって、従来のRPAとAIエージェントの役割を改めて整理する契機になると見られます。
日本への影響・ビジネス活用ヒント
- Google CloudやVertex AI利用企業はGemini 3.5 Flash移行の試算を今月中に行う:推論コストが60〜80%削減されるモデルが利用可能になった以上、現在Gemini 3.1 ProやGemini 2.0系を本番運用している企業はコスト試算が必須です。特にAPIコール数が多いバッチ処理・要約・分類タスクは、Flashへの移行だけで大幅なコスト圧縮が期待できます。まずVertex AI Studio上でFlashを試験利用し、既存ワークロードとの精度差を確認することを推奨します。
- RPAで自動化している業務をAIエージェントに置き換える検討を始める:GeminiがエージェントAIに特化して進化していることは、「ルールベースのRPA」から「状況に応じて判断するAIエージェント」への移行を後押しします。Google WorkspaceとGemini 3.5 Flashを組み合わせると、メール分類・スプレッドシート集計・議事録作成などを1つのエージェントが横断的に処理できます。まず社内の繰り返しタスクを棚卸しし、RPAとAIエージェントのどちらが適切かを評価することが第一歩です。
- 競合AIとのコスト・性能比較をアップデートする:Claude 3.5 SonnetやGPT-4oなどと比較したGemini 3.5 Flashのコスト優位性は、Google Cloud採用企業にとって現実的な選択肢を広げます。一方で、タスクの種類によってはClaude・GPTシリーズの方が出力品質が高い場合もあります。社内AI活用の目的別にベンチマーク比較を実施し、最適なモデル選択ができる体制を整えることが長期的なコスト最適化につながります。
