当サイトは広告を設置しています

Ollama 0.30 リリース:GGUF 互換性の向上とパフォーマンスの改善

源勝 AI 実験室 AI 最前線ウォッチ
広告

Ollama 0.30 の概要

Ollama 0.30 が新たにリリースされました。

今回のアップデートでは、llama.cpp を通じた GGUF モデルとの互換性が向上し、パフォーマンスが大幅に改善されています。

これにより、Apple Silicon 上の MLX エンジンを補完し、より幅広いハードウェアで多くのモデルを実行できるようになります。

広告

ハードウェア性能の向上と対応範囲の拡大

NVIDIA 製のハードウェアにおいて、処理パフォーマンスが最大 20% 高速化されました。

これは NVIDIA および llama.cpp のチームが行った最適化による成果です。

Vulkan による幅広い GPU サポート

Vulkan がデフォルトで有効になりました。

これにより、AMD や Intel のデバイスを含む、より広範なハードウェアへの GPU 加速の適用が可能です。

ユーザーはベンダー固有のライブラリを個別にインストールすることなく、標準的な状態で GPU を活用できるようになります。

広告

モデル互換性の拡大と利用手順

GGUF エコシステムとの互換性が拡張されたことで、より多くのモデルをそのまま実行できるようになりました。

具体的には、LFM や Prism といったモデルファミリーに加え、Unsloth が公開している微調整済みモデルなどもサポート対象に含まれます。

GGUF モデルの導入方法

新しいモデルを使用するには、まず GGUF ファイルまたはそれを含むディレクトリをダウンロードしてください。

次に、GGUF ファイルへのパスを指定した Modelfile を作成します。

FROM ./my-model.Q4_K_M.gguf

その後、以下のコマンドを実行してモデルの作成と起動を行います。

ollama create -f Modelfile my-model
ollama run my-model
広告

エージェント機能への対応

使用するモデルが「ツール呼び出し(tool calling)」に対応している場合、その機能を Ollama でもそのまま利用できます。

これにより、お好みのコーディングエージェントやパーソナルアシスタントと連携して、単一のコマンドで実行することが可能です。

  • Claude Code
  • Hermes Agent
  • OpenClaw

モデルがツール呼び出しをサポートしているかどうかは、以下のコマンドで確認できます。

ollama show my-model
広告

今回のアップデートによるメリット

  • NVIDIA GPU ユーザー:推論の処理速度が向上し、より効率的な動作が期待できます。
  • AMD や Intel GPU ユーザー:追加の設定なしで、手軽に GPU 加速を利用できるようになります。
  • モデル開発者・利用者:GGUF 形式で公開された最新の多様なモデルを、容易に Ollama 環境へ取り込めます。
広告

まとめ

Ollama 0.30 は、パフォーマンスとモデルの互換性を同時に向上させる重要なアップデートです。

ハードウェアの制約を減らし、より多くのユーザーが最新の AI モデルを最大限に活用できる環境が整いました。

参考情報:Improved performance and model support with GGUF

※ この記事は、Mac mini M4(32GB)環境で ローカル LLM(Ollama / gemma4:26b)と n8n を組み合わせて生成した実験的な記事です。内容は確認していますが、誤りが含まれる可能性があります。正確な情報は公式情報をご確認ください。

タイトルとURLをコピーしました