GPU・グラフィックボード VRAM 16GBで動かすローカルLLM完全ガイド|モデル別の早見表と「収まる・あふれる」の境界を実測で解説 VRAM 16GBのGPUで動くローカルLLMを、モデル別の早見表で整理。量子化を前提にすれば7B〜14B級は快適、32B級は条件次第、70B級は16GB単体では厳しい。RTX 5080実機の実測値をもとに、収まる・あふれる・動かないの境界を解説します。 2026.06.23 AIハードウェア図鑑 編集部 GPU・グラフィックボードPC構成ローカルAI環境