ローカル LLM の実行環境として日々進化を続ける Ollama ですが、そのアップデートの速さには驚かされるばかりです。
最近では Gemma 4 の MTP 対応 による劇的な高速化や、一度は導入された Claude Desktop 連携がわずか数日で非対応(仕様変更) になるといった動きがありました。
こうした重要な変更を正確に把握し、自分なりの知識として積み上げておきたいと感じたのが、このログを始めたきっかけです。
そこで当サイトでは、v0.23.1 あたりから、できる範囲で Ollama のバージョン履歴を追いかけていこうと考えています。
公式のリリースページだけでは見落としてしまうような詳細な改善を拾うため、GitHub のソースコードやコミット履歴を NotebookLM に読み込ませ、情報の要約と検証を行っています。
単なる翻訳ではない、技術的な背景まで踏み込んだログを「源勝の一言コメント」と共に残していきます。
ソース(参考情報)
Ollama v0.24.0
Ollama v0.24.0 では、開発体験をさらに拡張する OpenAI Codex App との統合が大きな目玉となっています。この統合により、ローカルおよびクラウド上のあらゆる Ollama モデルをデスクトップアプリ内で利用し、コーディング、ブラウジング、コードレビューを行うことが可能になりました。特にアプリ内の組み込みブラウザでは、ローカルサーバーを立ち上げてサイトを確認しながら直接変更を依頼できるほか、レビューモードでコードへのコメントや修正の反復をシームレスに行えるようになっています。
技術的な側面では、Apple Silicon 環境における MLX サンプラーの再構築が行われました。これにより、Mac 上での生成品質が向上しており、より精度の高いレスポンスが期待できます。また、このバージョンでは、高度なコーディングやエージェントタスク向けに kimi-k2.6 や glm-5.1 といったモデルが推奨されているほか、ローカル環境での利用には gemma4:31b や qwen3.6 などが適しているとされています。
.png)
Ollama を v0.24.0 にアップデートして、早速 Codex App を試してみよう!
関連記事
Ollama v0.23.4
Ollama v0.23.4 では、ビジョンモデル(画像認識モデル)の利便性を高めるための機能強化が行われました。特に ollama launch における opencode 統合において画像モダリティ(image modalities)が追加されたことで、視覚情報を扱うモデルがより活用しやすくなっています。
また、Anthropic(Claude)モデルを使用する際のプロンプト整形処理にも改善が入りました。具体的には、ツール実行時に返されたローカルの画像パス情報をレンダラー側で正しく保持するように修正されています。これにより、画像を含んだ指示をツール経由でやり取りする際の整合性が保たれ、より安定した動作が可能になりました。
.png)
画像(Vision)に関連する実用的なアップデートが中心の様子。opencode で画像モダリティがサポートされたことで、コード生成だけでなく、画像解析を組み合わせた高度なワークフローがさらに捗るのかもしれません。
Ollama v0.23.3
Ollama v0.23.3 では、システムの安定性と信頼性を高めるための重要な修正が行われました。特に Apple Silicon Mac(MLX)環境において、長時間の推論中にステータス確認がタイムアウトし、サーバーが 500 エラーを返してしまう問題が解消されています。これは、メモリサンプリングの仕組みを改善し、推論処理の裏側でキャッシュされたステータスを効率よく返すようにしたことで、重い処理の最中でもサーバーが「不健全」と誤判定されるのを防ぐ仕組みです。
モデルの管理面では、safetensors ベースのモデルを並列でプッシュ(アップロード)する際のアルゴリズムが見直されました。これにより、通信速度が不安定な環境でも信頼性が向上し、全体的なスループットも改善されています。また、アプリ自体のアップデートフローも強化され、Windows や Mac における更新処理の堅牢性が高まりました。
その他、将来の macOS 26 SDK を見据えたビルド設定の修正や、画像生成時におけるスレッド割り当ての最適化、低速なシステムでのテストの安定化など、足腰を鍛えるような堅実なアップデートが数多く含まれています。
.png)
今回はちょっと内容が難しい。新機能の追加というよりも、システムの安定性向上や細かな不具合修正が中心のアップデートという感じでしょうか。
Ollama v0.23.2
Ollama v0.23.2 では、API のパフォーマンスが大幅に向上しました。具体的には、/api/show レスポンスをキャッシュするようになったことで、レイテンシの中央値が約 6.7 倍改善し、VS Code などの外部ツールとの連携時の読み込みが速くなっています。
機能面では、Claude Desktop の統合に変更がありました。サードパーティ製の統合が Anthropic モデルに限定されているため、デフォルトの ollama launch からは除外されていますが、コマンドを使用すれば以前の状態に復元することも可能です。
また、インテグレーションを管理する際のバックアップ処理の利便性が向上したほか、ollama launch におけるプランに応じたモデルの制御機能も強化されています。MLX ランナーについても、画像生成時のレイアウトがより整理され、クリーンな構成になりました。
.png)
Ollama で Claude Desktop が使えるようになった!と思ったら2日後には使えなくなったようで残念。Anthropic モデルに限定されているのが問題だったのでしょうね。
関連記事
Ollama v0.23.1
Ollama v0.23.1 では、特に Mac ユーザーにとって大きな恩恵があるパフォーマンスの向上が行われました。Apple Silicon を搭載した Mac 上の MLX ランナーにおいて、Gemma 4 モデル向けの「MTP(マルチトークン予測)」による投機的デコードがサポートされています。これにより、Gemma 4 31B モデルを使用したコーディングタスクなどで、2倍以上の速度向上が実現しました。
モデル作成に関する機能も拡張されており、ollama create コマンドで safetensors ベースのドラフトモデルをインポートできるようになりました。これに合わせて、Modelfile 内でドラフトモデルを指定するための DRAFT コマンドや、ドラフトモデルを量子化するための新しいフラグも導入されています。これらは、前述の投機的デコードを効率的に実行するための仕組みとして機能します。
技術的な基盤の面では、内部で使用されている Go 言語のバージョンが 1.26 に更新されました。また、MLX および MLX-C においてスレッド処理に関する修正が実施されており、Mac 環境での動作の安定性がさらに高められています。
.png)
Multi-token Processing 気になる技術です。今後、さまざまなモデルでこのような技術が使え、高速化していくことに期待したいところです。
関連記事












