株式会社ヒカリ
福岡県久留米市
NEWS / お役立ち情報

Googleがオープンソース「Gemma 4 12B」を発表|16GBノートPCで音声・動画・画像を処理できる新AI—APIコスト0円・データ外部送信なし、久留米・福岡の中小製造業・士業・医療が検討すべき3つの理由

2026.06.17お役立ち情報

Googleは2026年6月3日、オープンソースAIモデル「Gemma 4 12B」をApache 2.0ライセンスで公開しました(出典:Google公式・VentureBeat)。約120億パラメータ(正確には11.95B)でありながら、エンコーダーを一切持たない独自の「Unified(統一)アーキテクチャ」を採用することでテキスト・画像・音声・動画を1つのモデルで処理し(出典:Google公式)、標準的な16GB VRAMの企業向けノートPC上でも完全オフライン動作が可能です(出典:Google公式)。OpenAIやAnthropicのクラウドAPIとは異なり(推測)、Gemma 4 12BはApache 2.0ライセンスにより商用利用・自社製品への組み込み・改変がすべて無制限で認められており(出典:Google公式)、月次のAPI利用料が発生しないまま自社のPC・サーバー・工場の端末上でAIを稼働させることができます(推測)。

何が起きたか

Gemma 4 12Bとは—16GBノートPCで動く120億パラメータのオープンソースAI

Gemma 4 12BはGoogleが発表したGemma 4シリーズの新しいモデルで、2026年6月3日に一般公開されました(出典:Google公式)。Gemma 4ファミリーはもともと2B・4B・26B・31Bの4サイズで構成されていましたが(出典:Google公式)、12BはノートPC上での動作を主眼に設計された新サイズとして追加されました(出典:VentureBeat)。最大の特徴は必要なGPUメモリが16GB VRAMであることで(出典:Google公式)、多くの企業向けノートPCに搭載されているNVIDIA RTX 4060・RTX 4070クラスのグラフィックスやApple Silicon(M2以降)の統合メモリでも動作できます(推測)。ChatGPT・ClaudeのAPIを業務に使う場合は利用量に応じて毎月課金が継続しますが(推測)、Gemma 4 12Bを手元のPCで動かせば推論コストはゼロになります(推測)。

Unifiedアーキテクチャ—エンコーダーなしで音声・動画・画像を直接処理

Gemma 4 12Bの技術的な核心は「Unified(統一)アーキテクチャ」です(出典:Google公式)。従来のマルチモーダルAIはテキスト処理のLLMに加えて画像認識用・音声認識用のエンコーダーを別々に持ち、各モジュールが処理した結果をLLMに統合する設計が一般的でした(推測)。Unifiedアーキテクチャでは音声の生波形(raw audio waveform)と映像・画像のビジュアルパッチを直接LLMのバックボーンに入力するため(出典:Google公式)、中間エンコーダーによるレイテンシとVRAM消費がなく、テキスト・画像・音声・動画を1回のモデル呼び出しで一括処理できます(出典:Google公式)。このアーキテクチャが生む実用上のメリットは3点です(出典:Google公式・VentureBeat)。①低レイテンシ:エンコーダーを経由しないためマルチモーダルタスクの応答時間が短縮されます(出典:VentureBeat)。②必要VRAMの削減:複数のエンコーダーモジュールを持たないため同等機能の従来モデルより少ないVRAMで動作します(出典:VentureBeat)。③ファインチューニングの一元化:マルチモーダル系全体を1回のトレーニングパスでまとめて追加学習できるため、自社データでのカスタマイズコストも下がります(出典:VentureBeat)。

ベンチマーク性能—2倍以上のパラメータ数を持つGemma 3 27Bを超える

Gemma 4 12Bはそのサイズを大きく上回る性能を発揮しています(出典:Google公式)。一般的な知識・推論テスト「BBEH」ではスコア53を記録しており、2倍以上のパラメータ数(27B)を持つGemma 3 27Bの約18を大幅に上回ります(出典:Google公式)。科学系難関テスト「GPQA Diamond」では78.8を達成し(出典:Google公式)、文書理解ベンチマーク「DocVQA」でもGemma 4 26B MoE(94.9)と僅差のスコアを記録しています(出典:Google公式)。「パラメータ数は小さいが性能は大きなモデルに近い」という高い費用対効果が確認されており(推測)、16GBのノートPCで動くにもかかわらず企業の実務タスクに十分な精度を発揮できる可能性があります(推測)。

日本への影響・ビジネス活用ヒント

  • APIコスト0円でAI活用の継続費用が消える:ChatGPTのAPIは入力・出力トークン数に応じた従量課金が毎月積み上がりますが(推測)、Gemma 4 12Bを自社PCやオンプレミスサーバーで稼働させれば推論コストはゼロです(推測)。「生成AIを試したいが毎月のランニングコストが読めない」という理由で導入を見送っていた日本の中小企業にとって、予算固定でAI活用を開始できる現実的な手段になります(推測)。
  • データが外部に出ないため機密情報を扱う業種でも安全に活用できる:医療記録・法律相談の内容・未公開の設計仕様書・顧客の個人情報など、クラウドAPIに送信できないデータを扱う場合でも(推測)、オンプレミスで動作するGemma 4 12Bなら情報が外部に一切送信されません(推測)。個人情報保護法・医療法などの情報管理要件をクリアしながらAI活用を進めることができます(推測)。
  • Apache 2.0ライセンスで自社製品・サービスへの組み込みが無制限:Gemma 4 12BはApache 2.0のため(出典:Google公式)、自社システム・アプリ・SaaSへの組み込みや社内配布が制限なく可能です(推測)。自社データでのファインチューニングにより業界専門用語・自社製品知識に特化したAIの開発も法的に問題ありません(推測)。

久留米・福岡の中小企業様へ—自社PC・サーバーでAIが動く時代に何が変わるか

久留米の製造業・精密機械メーカー・農業機械メーカー・建設業では、「工場や現場でAIを使いたいがクラウドにデータを送るとセキュリティが心配」「ネットワークが不安定な現場でAIを稼働させたい」という声が多くあります(推測)。Gemma 4 12Bの場合、16GBのVRAMを持つノートPCやデスクトップPCを工場内に1台置くだけで(推測)、カメラ映像と音声をリアルタイムに処理するAIシステムをオフライン動作で構築できます(推測)。例えば久留米の精密部品メーカーでは、検査台のカメラ映像をGemma 4 12Bに入力して「製品表面の傷・異物混入・寸法ずれ」を検出するシステムをクラウドAPI料金なし・月次コストゼロで運用できます(推測)。また久留米の農業機械メーカーではフィールドエンジニアのタブレット上でGemma 4 12Bをオフライン動作させ、「現場で撮影した機械の故障写真と音声説明をもとに修理手順を提案する」活用が現実的な水準に近づいています(推測)。ヒカリでは久留米・筑後地区の製造業・農業・建設業向けに、Gemma 4 12Bを活用したオンプレミスAI構築の設計・導入支援を提供しています。

福岡の士業(税理士・社労士・弁護士・行政書士)・医療機関・調剤薬局・福祉事業者では、取り扱うデータの機密性が高く「クラウドAIに情報を送れない」という制約が導入のネックになっているケースが多くあります(推測)。Gemma 4 12Bを事務所や院内のPCにインストールすれば、「顧問先の決算書・申告書を入力してAIが今期の課税ポイントと節税提案の下書きを生成」「患者の電子カルテデータを参照して投薬の注意事項をチェック」「顧客からの問い合わせメールに対する返信文の自動ドラフト生成」といった業務を、データが外部に出ない環境で実現できます(推測)。また福岡の中小IT企業・受託開発会社にとっても、Gemma 4 12BはApache 2.0のためクライアント向け自社AI製品のベースモデルとして組み込んで販売でき、ライセンスリスクがない点が強みです(推測)。「Gemma 4 12Bで何ができるか試したい」「自社業務に特化させる方法を相談したい」という段階からでも、ヒカリがAI導入設計をご一緒します。

次の一歩を、ご一緒に。

AI導入・DX推進・資金調達・キャリア支援——どんなご相談もヒカリにお任せください。

お問い合わせ