「このAIを動かすには、どれくらいのスペックが必要か」を用途別に引ける早見表です。ローカルAIで最初に効くのはVRAM容量なので、VRAMを起点に、システムメモリの目安と関連記事への入口をまとめました。まずは下の4レベルで全体像を、続く用途別表で具体的な目安を確認できます。
AI用途で最初に効くのはGPUのメモリ容量(VRAM)。何を・どのモデルで動かすかで必要量が決まります。
7〜14B級のLLMやSDXLなど多くの用途は16GB級が実用ゾーン。30B級以上のLLMや高品質・大型の動画は24〜32GB以上、またはマルチGPUが視野に入ります。
はじめての方向け・全体の目安(4レベル)
| レベル | GPU/VRAM | システムRAM | 動かせるAIの例 |
|---|---|---|---|
| Lv.1 クラウドAI中心 | 不要(内蔵GPU可) | 16GB | ChatGPT・Claude・Claude Code |
| Lv.2 軽量ローカルAI | VRAM 8GB | 32GB | Ollama(7〜8B)・SD 1.5 |
| Lv.3 本格ローカルAI | VRAM 12〜16GB | 32〜64GB | Ollama(14B+)・SDXL・ComfyUI・Flux |
| Lv.4 開発・研究/大型 | VRAM 16GB+(マルチGPU) | 64GB+ | ファインチューニング・30B+・動画 |
用途別 必要スペック早見表
表の見方 / 最低VRAM:起動・軽い利用の下限目安 / 推奨VRAM:実用的に使いやすい目安 / システムRAM:CPUオフロードや画像・動画処理を含めた目安
前提:この表は、当サイトの実測記事・各モデルの公開仕様・一般的な量子化条件をもとに、用途別の目安を整理したものです。実際の必要VRAMは、モデル・量子化方式・解像度・コンテキスト長・同時に起動するアプリによって変わります。
| 用途 | 最低VRAM | 推奨VRAM(GPU目安) | システムRAM | 関連記事 |
|---|---|---|---|---|
| ■ ローカルLLM(テキスト推論) | ||||
| 7〜8B | 6GB | 8GB(8GBクラス) | 16GB | Ollama入門・必要スペック |
| 13〜14B | 10GB | 16GB(RTX 5060 Ti/5070 Ti 16GB) | 32GB | 16GB級LLMの選び方 |
| 30〜34B | 22GB | 24GB級、または 16GB×2(デュアルGPU) | 64GB | 35B-A3Bを2枚目で約1.9倍 |
| 70B級 | 約44GB | 48GB以上(マルチGPU) ※約44GBは推定(当サイト実機の32GBでは動かせず未測定) |
96GB | 巨大モデルの必要メモリ早見 |
| ■ 画像・動画生成・学習(ComfyUI 系) | ||||
| 画像生成 SDXL 等 | 8GB | 12〜16GB | 16〜32GB | ComfyUI推奨スペック |
| 画像生成 Flux.1 dev 等 | 16GB | 24GB(余裕を持つ場合) | 32GB | FP16/BF16 精度とVRAM |
| 画像生成 FLUX.2 Klein 9B 等(Q8・大型) | 16GB | 16GB以上(Q8) | 32GB以上 | FLUX.2 Klein 9B 実測 |
| 動画生成 LTX 1 等(軽量2B) | 12GB | 16GB(LTX系の軽量・商用量産)/高品質・最新の動画モデルは32GB級以上 | 32GB以上 | LTX 1 を16GBで商用量産 |
| 4Kアップスケール(ESRGAN 等) | 16GB | 16GB(システムRAM次第) | 64GB以上 | RAM67GB→1.4GBにする方法 |
| LoRA学習(小型2B級) | 6GB | 12〜16GB | 32GB | Anima 2B(6GB VRAM〜) |
| ■ AIコーディング | ||||
| Claude Code | GPU不要 | クラウドLLM利用時・回線品質次第 ※ローカルLLM併用時は下段の30B級を参照 |
16GB | Claude Code PC選定 |
| ローカル30B級(qwen3-coder 等) | 22GB | 24GB級、または 16GB×2(デュアルGPU) | 64GB | qwen3-coder:30b 実測 |
読み取りの注意
- 量子化で大きく変わります。 表は実用的な Q4_K_M(LLM)/fp8(画像)基準です。例:SDXL は fp8 で 6.7GB、bf16 で 13.7GB(RTX 5080 実測)と倍ほど差が出ます。
- VRAMに収まらない分はシステムRAMへ退避し、速度が急落します。 長いコンテキストの推論では特にシステムRAM消費が増えます。
- ノートPC版GPUは同名でもデスクトップ版より15〜30%低いことがあります。 表はデスクトップ前提です。
- 「16GB×2(デュアルGPU)」は当サイトの実機構成です。 大型MoEモデルでは2枚目が効き、例として qwen3.5:35b-a3b が2枚目で約1.9倍に伸びました(実測)。
この早見表を軸に、さらに詳しく
- VRAM 16GBで動かすローカルLLM完全ガイド(モデル別早見表)
- VRAM 16GB GPUを選ぶなら|AI用途別に比較
- ローカルLLMの量子化|Q4_K_M・Q8・FP16のVRAMと速度
- VRAMとは|AI用途で必要な容量の目安
関連ガイド
数値の検証環境
本表の実測値は当サイトの検証機材によるものです:Intel Core i7-14700F/96GB DDR5/RTX 5080(16GB)+RTX 5060 Ti(16GB・Oculink DEG1接続)。測定条件の詳細は 検証環境ページ をご覧ください。