当サイトは広告を設置しています

Gemma 4 の動作が最大 2 倍に高速化!macOS (MLX) および Ollama Cloud で MTP を導入

源勝 AI 実験室 AI 最前線ウォッチ

Ollama において、Gemma 4 の生成速度を大幅に向上させるアップデートがリリースされました。

広告

Gemma 4 の動作高速化について

Ollama を使用した Gemma 4 の動作が、大幅に高速化されました。一度に複数のトークン(文字のまとまり)を予測する Multi-Token Prediction(MTP)という技術の導入により、生成速度が最大 2 倍に向上しています。この機能は、Ollama のクラウド環境および macOS 環境の両方で利用可能です。

広告

アップデートの技術的な詳細

macOS 環境においては、Apple Silicon に最適化された MLX というフレームワークを通じて、MTP をネイティブにサポートしています。また、Ollama のクラウド上でも同様に高速化を実現しています。

クラウド環境での実行方法

クラウド上で高速化された Gemma 4 を実行するには、以下のコマンドを使用します。

ollama run gemma4:31b-cloud

特定のツールを起動するためのコマンドも用意されています。

ollama launch claude --model gemma4:31b-cloud
ollama launch openclaw --model gemma4:31b-cloud
ollama launch hermes --model gemma4:31b-cloud

macOS 環境での実行方法

macOS 環境で MTP を利用して実行する場合は、以下のコマンドを使用します。

ollama run gemma4:31b-coding-mtp-bf16
広告

このアップデートによるメリット

  • macOS(Apple Silicon)を利用しているユーザーは、ローカル環境での AI 生成速度を大幅に向上させることができます。
  • クラウド経由の利用においても、応答待ち時間が短縮され、よりスムーズな対話が可能です。
  • 高速なテキスト生成により、コーディングやエージェント機能の利用効率が向上します。
広告

最新情報の確認方法

詳細な情報は、Ollama の Gemma 4 モデルライブラリのページから確認できます。フィードバックについては、メールへの返信や Discord チャンネルを通じて提供することが可能です。

Ollama Gemma 4 モデルライブラリ

※ 本記事は、Ollama から届くメールをトリガーとして、n8n とローカルLLM(Ollama / gemma4:26b)を連携させ、Mac mini M4(32GB)上で記事生成を自動化した実験の記録です。生成プロセス〜公開において人間による確認と微調整は行っていますが、内容に誤りを含む可能性があるため、正確な情報は必ず公式情報をご確認ください。

タイトルとURLをコピーしました