ローカルLLMツール「LM Studio」0.4.13リリース——MacのMLXエンジン更新でQwen 3.5/3.6・Gemma 4の推論性能が向上

ローカルで大規模言語モデル（LLM）を動作させるGUIツール「LM Studio」が5月13日、バージョン0.4.13をリリースした。PC Watchが詳細を報じている。

今回のアップデートの核心：Mac向けエンジンの強化

最大の変更点はAppleシリコン向けエンジン「mlx-engine」のバージョン1.8.1への更新だ。AppleのMLXフレームワークを活用するこのエンジンに、並列予測（Speculative Decoding）機能が追加された。対応モデルはQwen 3.5/3.6およびGemma 4といった「Vision（視覚処理）対応モデル」となる。

並列予測とは何か

並列予測（Speculative Decoding）は、メインモデルより小さな「ドラフトモデル」がトークンを先読みし、メインモデルが並列でそれを検証することでスループットを高める推論高速化手法だ。特に長文生成やVisionモデルのような重い処理で体感差が出やすく、ローカル実行環境の快適さに直結する改善といえる。

PC Watchの報告によれば、テスト環境としてMacBook Pro（10コアGPU/24GBメモリ）が使用されており、Appleシリコン搭載モデルでの効果が期待できる。

バグ修正とセキュリティ強化

今回のリリースには実用面での修正も含まれている。PC Watchが報じているところでは、チャット入力欄へのペースト時に改行が詰められてしまうバグが修正されたとのこと。加えてセキュリティ強化も盛り込まれており、開発チームは全ユーザーに対してアップデートを推奨している。

日本市場での注目点

LM Studioは完全無料で提供されており、macOS・Windows・Linuxに対応している。今回の改善はMac側に集中しているが、これはAppleシリコンのMLXフレームワークが成熟しつつあり、ローカルLLMの実行基盤として急速に整備されていることを示している。

QwenはAlibabaが開発したモデルシリーズで、サイズあたりの性能とコストパフォーマンスに優れ、世界的に注目されている。Gemma 4はGoogleのオープンモデルシリーズの最新作だ。どちらもHugging Faceから無料でダウンロード可能で、日本語対応も一定水準を保っている。

日本でも「社内データをクラウドに送りたくない」「ランニングコストを抑えたい」というニーズを背景に、ローカルLLMの活用シーンは広がっている。LM Studioはその入口として機能的にまとまったツールであり、今回のアップデートでMac環境での使い勝手はさらに向上したといえる。

筆者の見解

ローカルLLMは「クラウドに送れないデータを扱う」「コストゼロで24時間回す」というユースケースに確かな強みがある。Speculative Decodingのような推論高速化技術がOSSツールにまで浸透してきたことは、着実な技術的進歩だ。

ただ、現時点でのローカルLLMは「試す・学ぶ」フェーズと「実務で使い倒す」フェーズの間に、まだ開きがある。「ローカルで動く」こと自体が目的になりすぎると、本来やるべき「AIを使って成果を出す」実践から離れてしまう。まずはどのモデルを使うにせよ、自分の課題を解決する体験の積み重ねが先決だ。LM Studio 0.4.13は、その体験をより快適にする一歩として素直に評価できる。セキュリティ強化も含まれている以上、既存ユーザーはアップデートを先延ばしにする理由はない。

今回のアップデートの核心：Mac向けエンジンの強化#

並列予測とは何か#

バグ修正とセキュリティ強化#

日本市場での注目点#

筆者の見解#

関連製品リンク#

今回のアップデートの核心：Mac向けエンジンの強化

並列予測とは何か

バグ修正とセキュリティ強化

日本市場での注目点

筆者の見解

関連製品リンク