Google DeepMind より、Gemma 4 に関する新しいモデルと技術のリリースが発表されました。今回の更新では、メモリ消費を抑えた新しい 12B モデルの追加と、モデルの動作効率を高める新しい手法(QAT)が導入されています。
新しく追加された 12B モデルの詳細
新たにリリースされた 12B モデルは、メモリ 16GB を搭載したノート PC 上で、ローカル エージェントを動作させることを目的として設計されています。このモデルは、26B モデルに近い高度な推論能力を備えており、複雑なステップを伴う推論やエージェントとしてのワークフローを実現します。
各種アプリケーションでの利用方法
以下のアプリから、新しい 12B モデルを試すことができます。
Claude Code:
ollama launch claude --model gemma4:12bCodex App:ollama launch codex-app --model gemma4:12bHermes Agent:ollama launch hermes --model gemma4:12b
OpenClaw:
ollama launch openclaw --model gemma4:12b一般的なチャット利用:ollama run gemma4さらなる連携については、Ollama のモデルページ を確認してください。
動作を最適化する QAT 技術の導入
Gemma 4 のすべてのモデルにおいて、新しい QAT(Quantization-Aware Training)を用いた重みが利用可能になりました。QAT とは、モデルの軽量化を行うプロセスを学習段階から組み込む手法です。
従来の軽量化手法とは異なり、品質の低下を抑えつつ、メモリ使用量の削減と出力速度の向上を同時に実現しています。この新しい重みは、Apple、AMD、Intel、NVIDIA、Qualcomm といった幅広いハードウェアプラットフォームにおいて、より高速な動作が期待できます。
利用可能な QAT モデルの一覧
以下のコマンドを使用して、各モデルの取得が可能です。
E2B:
ollama pull gemma4:e2b-it-qat
E4B:
ollama pull gemma4:e4b-it-qat12B:ollama pull gemma4:12b-it-qat26B:ollama pull gemma4:26b-a4b-it-qat
31B:
ollama pull gemma4:31b-it-qat
今回のアップデートのメリット
今回のリリースには、以下のようなユーザーにとっての利点があります。
- メモリ 16GB 程度のノート PC を使用しているユーザーでも、高性能な AI エージェントをローカル環境で動かせるようになります。
- QAT 技術の導入により、AI の回答速度が向上し、よりスムーズな利用が可能になります。
- 幅広いハードウェアに対応しているため、さまざまな環境での効率的な活用が期待できます。
まとめ
Gemma 4 は、新しいモデルと最適化技術によって、より手軽で強力なツールへと進化しました。
※ 本記事は、Ollama から届くメールをトリガーとして、n8n とローカル LLM(Ollama / gemma4:26b)を連携させ、Mac mini M4(32GB)上で記事生成を自動化した実験の記録です。生成プロセス〜公開において人間による確認と微調整は行っていますが、内容に誤りを含む可能性があるため、正確な情報は必ず公式情報をご確認ください。




















