Gemma 4 12B モデル登場！QAT 技術による高速・軽量なローカルAI エージェント運用へ

AI 最前線ウォッチ

2026.06.08

Google DeepMind より、Gemma 4 に関する新しいモデルと技術のリリースが発表されました。今回の更新では、メモリ消費を抑えた新しい 12B モデルの追加と、モデルの動作効率を高める新しい手法（QAT）が導入されています。

新しく追加された 12B モデルの詳細
1. 各種アプリケーションでの利用方法
動作を最適化する QAT 技術の導入
1. 利用可能な QAT モデルの一覧
今回のアップデートのメリット
まとめ

新しく追加された 12B モデルの詳細

新たにリリースされた 12B モデルは、メモリ 16GB を搭載したノート PC 上で、ローカルエージェントを動作させることを目的として設計されています。このモデルは、26B モデルに近い高度な推論能力を備えており、複雑なステップを伴う推論やエージェントとしてのワークフローを実現します。

各種アプリケーションでの利用方法

以下のアプリから、新しい 12B モデルを試すことができます。

Claude Code:

ollama launch claude --model gemma4:12b

Codex App:

ollama launch codex-app --model gemma4:12b

Hermes Agent:

ollama launch hermes --model gemma4:12b

OpenClaw:

ollama launch openclaw --model gemma4:12b

一般的なチャット利用:

ollama run gemma4

さらなる連携については、Ollama のモデルページを確認してください。

動作を最適化する QAT 技術の導入

Gemma 4 のすべてのモデルにおいて、新しい QAT（Quantization-Aware Training）を用いた重みが利用可能になりました。QAT とは、モデルの軽量化を行うプロセスを学習段階から組み込む手法です。

従来の軽量化手法とは異なり、品質の低下を抑えつつ、メモリ使用量の削減と出力速度の向上を同時に実現しています。この新しい重みは、Apple、AMD、Intel、NVIDIA、Qualcomm といった幅広いハードウェアプラットフォームにおいて、より高速な動作が期待できます。

利用可能な QAT モデルの一覧

以下のコマンドを使用して、各モデルの取得が可能です。

E2B:

ollama pull gemma4:e2b-it-qat

E4B:

ollama pull gemma4:e4b-it-qat

12B:

ollama pull gemma4:12b-it-qat

26B:

ollama pull gemma4:26b-a4b-it-qat

31B:

ollama pull gemma4:31b-it-qat

今回のアップデートのメリット

今回のリリースには、以下のようなユーザーにとっての利点があります。

メモリ 16GB 程度のノート PC を使用しているユーザーでも、高性能な AI エージェントをローカル環境で動かせるようになります。
QAT 技術の導入により、AI の回答速度が向上し、よりスムーズな利用が可能になります。
幅広いハードウェアに対応しているため、さまざまな環境での効率的な活用が期待できます。

まとめ

Gemma 4 は、新しいモデルと最適化技術によって、より手軽で強力なツールへと進化しました。

※ 本記事は、Ollama から届くメールをトリガーとして、n8n とローカル LLM（Ollama / gemma4:26b）を連携させ、Mac mini M4（32GB）上で記事生成を自動化した実験の記録です。生成プロセス〜公開において人間による確認と微調整は行っていますが、内容に誤りを含む可能性があるため、正確な情報は必ず公式情報をご確認ください。

MacBook Pro M5 Max

最大 614GB/s のメモリ帯域幅！ Mac Studio (M3 Ultra) の 819GB/s のメモリ帯域幅に近づく性能・・・気になる！！

Apple 2026 MacBook Pro 18コアCPU、32コアGPUのM5 Maxチップ搭載ノートパソコン：AIのために設計、14.2インチLiquid Retina XDRディスプレイ、36GBユニファイドメモリ、2TBのSSDストレージ - スペースブラック

Apple(アップル)

スピードの遺伝子 — M5 ProまたはM5 Maxチップを搭載した14インチMacBook Proが、次世代のスピードとパワフルなオンデバイスAI体験をもたらします。毎日のあれこれも、プロやクリエイティブのタスクも思いのままです。一日中使えるバッテリー*。息をのむほど美しいLiquid Retina XDRディスプレイ。どこから見ても、プロにふさわしいProです。

Amazonの商品レビュー・口コミを見る

Amazon

楽天

NVIDIA DGX Spark

NVIDIA の AI スーパーコンピューター。NVIDIA GB10 Grace Blackwell Superchip、128GB のユニファイドメモリ、4TB NVMe M.2 搭載。メモリ帯域幅は最大 273 GB/s。基本は法人向けモデルだと思いますが、個人も購入できそう。90万円〜100万円と高額ですが。