llama.cpp アーカイブ - AIハードウェア図鑑

ローカルLLM推論エンジン比較｜Ollama・llama.cpp・LM Studio・vLLMの選び方

Ollama, llama.cpp, LM Studio, vLLMの4大ローカルLLM推論エンジンを、速度・手軽さ・マルチGPU対応の3軸で徹底比較。RTX 5080+5060 Ti環境での実測データも交え、LM Studioのテンソル並列対応がもたらす影響や、あなたの環境に最適なエンジンの選び方を解説します。

2026.06.12

AIハードウェア図鑑編集部

GPU・グラフィックボードローカルAI環境ローカルLLM

llama.cppのGemma 4でRAMが枯渇する原因｜VRAM余裕でもOOMする仕組みと回避策【2026年】

VRAM 32GBのGPUにモデルを載せた。VRAM使用量はまだ余裕がある。なのに数回プロンプトを送っただけでプロセスが強制終了される——原因はGPUではなく、システムRAMの枯渇だった。海外のRedditコミュニティ（r/LocalLL...

2026.04.17

AIハードウェア図鑑編集部

GPU・グラフィックボードローカルAI環境ローカルLLM