Gemini 3.5 FlashがAPI提供開始|入力$1.50/Mトークンで大量処理が低コストに—日本の中堅企業が始めるべき3つのユースケース
GoogleはGoogle I/O 2026(2026年5月19日)で、コスト効率重視の高速推論モデル「Gemini 3.5 Flash」を正式発表しました(出典:Google公式)。Google AI StudioとVertex AIのAPIを通じて既にリリース済みで、入力$1.50・出力$9/Mトークンという料金体系が特徴です(出典:Google公式)。同シリーズのフラッグシップ「Gemini 3.5 Pro」(限定プレビュー中)の約10分の1のコストで、大量リクエストを日次処理する実務用途への適用が現実的になりました。
何が起きたか
FlashとProの使い分け
Gemini 3.5シリーズは「Pro(フラッグシップ)」と「Flash(高速・低コスト)」の2ラインで構成されます(出典:Google公式)。Proは200万トークンのコンテキストウィンドウとDeep Think推論が特徴で、高精度な法務・研究用途向けです。一方Flashは応答速度とコスト効率に最適化されており、1日数万〜数百万リクエストが発生するカスタマーサポート・分類タスク・コードレビュー自動化などに適しています(出典:Google公式)。テキスト・画像・動画を横断するマルチモーダルにも対応しており(出典:Google公式)、画像を含む問い合わせ処理にも活用できます。
コスト試算
Flashの料金は入力$1.50・出力$9/Mトークンです(出典:Google公式)。1日1万件の問い合わせを平均200トークンで処理した場合、月間コストは入力側だけで約$90(約13,500円)と試算されます(推測)。同等のリクエスト量をProや他社フラッグシップモデルで処理した場合と比較して、コストを大幅に削減できる可能性があります(推測)。複雑な推論・長文処理・高精度が要求されるユースケースでは、ProやClaude Opus 4.8との比較評価を推奨します(推測)。
日本への影響・ビジネス活用ヒント
- カスタマーサポートの自動化コストを削減:EC・金融・通信など問い合わせ量が多い業種では、Flashを使ったFAQ自動応答・チケット分類の導入でサポートコストを削減できる可能性があります(推測)。Google AI Studioで無料評価を始め、まず自社問い合わせ上位20件での精度確認から着手することを推奨します。
- 社内文書の分類・ルーティングを自動化:経費申請・稟議書・問い合わせメールなど大量の非構造化文書を宛先・カテゴリ・優先度に自動仕分けするユースケースに適しています。既存のGoogle Workspace環境があれば連携コストも低く抑えられると見られます(推測)。
- CI/CDパイプラインへのコードレビューを低コストで組み込み:プルリクエストごとにFlashがコメント要約・テスト提案・静的解析を自動実行する仕組みを構築することで、レビューの属人化を抑えながら開発コストを削減できます(推測)。GitHub ActionsやCloud Buildとの組み合わせでの実装が想定されます(推測)。
