ComfyUI推奨スペック|VRAM 8GB・12GB・16GBとメモリ・CPUを実測と目安で解説

ComfyUI推奨スペック|VRAM 8GB・12GB・16GBとメモリ・CPUを実測と目安で解説 アイキャッチ GPU・グラフィックボード

2026年にComfyUIで画像生成を始めるなら、VRAM 8GBが実用上の出発点。ただし快適に使いたければ12GB以上が現実的な選択肢になる。「自分のGPUでComfyUIは動くのか」「何GBあれば足りるのか」——この疑問に対して、当サイトではRTX 5080・RTX 4070 Super・RTX 5060 Tiの3つのGPUで実際にComfyUIを動かし、生成速度とVRAM使用量を計測した。スペック表の数字だけでは見えない「実際のところ」を、このデータから読み解いていく。

はじめに本記事の立てつけを断っておくと、実機で計測したのは3GPUでのSDXL生成と、RTX 5080でのFlux.1 Dev FP8(いずれも速度・VRAM、2026年6月11日)。8GB GPU単体や動画生成、各GPUの価格については、その実測値とComfyUI公式のワークフロー要件・市場相場を突き合わせて整理した「目安」として扱う。測った部分と、目安の部分を区別しながら読んでほしい。

この記事の要点

  • ComfyUIはfp8量子化でモデル重み由来のVRAMを大きく削減できる。SDXLを実用的に扱う目安はVRAM 8GB以上
  • 快適運用(LoRA+ControlNet併用)には12GB以上。Flux.1 FP8は実測でVRAMピーク約15.4GB(RTX 5080)=16GB級が必要。高解像度・長尺の動画生成も16GB以上が安心(モデル・解像度・設定で変わる)
  • VRAM容量だけでなく演算性能(CUDAコア数)が生成速度を左右する(本記事の条件ではRTX 5080 6.1秒対RTX 5060 Ti 12.3秒・約2倍の差)
  • 最近のComfyUIは既定の動的VRAMでメモリを自動でやりくりするため、起動オプションは「足りないとき」に段階的に使う
  • GPU/VRAMが主役だが、見落としやすいのがシステムRAM(公式は8GB以上・16GB推奨、編集部目安はSDXLで32GB・動画や4Kアップスケールは64GB以上)とストレージ(モデルが大きいためSSD推奨)。PC全体で揃える

※本記事のVRAM 8GB/12GB/16GBの階層はComfyUI公式の推奨ではなく、公式要件・公式ワークフロー例・編集部実測から整理した購入目安です(8GB GPU単体は未実測の推定)。

ComfyUIが必要とするVRAMの基本構造

ComfyUIは、AI画像生成ソフトの中でもVRAM(Video RAM=GPUに搭載された専用メモリ)の使い方が効率的なツールとして知られている。その理由は、ノードベースのワークフロー設計にある。

ComfyUIの既定のメモリ管理では、動的VRAMやsmart memoryにより、ワークフローと空きVRAMに応じてモデルをGPU上に保持したりRAMへ退避したりする。常に即時アンロードされるわけではなく、--highvramでは使い終わったモデルもGPUに保持されやすい。ノードベースでロードと退避を制御しやすいぶん、ワークフローによってはVRAM使用量を抑えやすい。

さらに大きいのが、fp8量子化(モデルデータの精度を32ビットや16ビットから8ビットに圧縮する技術)への対応。当サイトの検証環境(RTX 5080 / i7-14700F / 96GB RAM)で計測したところ、SDXL生成時のVRAM使用量はbf16(16ビット浮動小数点)の13.7GBからfp8量子化で6.7GBへと半分以下に減った(本サイト環境での参考値)。この差は、8GBのGPUでSDXLが動くかどうかを分ける大きなポイントになる。

ここで、精度(データ型)の違いも簡単に整理しておく。

  • FP32(32ビット):最も高精度だが容量も最大。画像生成では通常使わない。
  • FP16/BF16(16ビット):標準的な精度で、VRAMはFP32の約半分。BF16はFP16より表現範囲が広く、計算が安定しやすい。
  • FP8(8ビット):さらに半分。VRAMを大きく節約でき、SDXLでは画質差も小さい(筆者環境の目視確認。定量評価は未実施)。低VRAM運用の主役。

ざっくり「ビットが半分になるほどVRAMも概ね半分」。各形式のVRAM消費をRTX 5080で実測した詳細は、ComfyUIの精度設定ガイドで扱っている。

もうひとつ知っておきたいのが、起動オプションによる制御。ComfyUIには --lowvram(VRAM節約系)や --gpu-only(すべての処理をGPUで行う高速系)といったオプションが用意されており、自分のGPU環境に合わせた調整ができる。後半に一覧表でまとめている。

VRAM使用量の内訳 — 何にどれだけ消費されるか

「VRAM 8GBで足りるか」を判断するには、ComfyUIがVRAMを何に使っているかを知る必要がある。以下は当サイトの検証環境で計測した、SDXL(fp8量子化時)の特定モデル・特定解像度でのVRAM使用量の参考内訳。モデルやControlNet・LoRAの種類、解像度、ComfyUIバージョンで変動するため、概算として読んでほしい。

構成要素 VRAM消費量(参考概算) 備考
チェックポイント(モデル本体) 約2.5GB fp8量子化時。bf16では約5GB
KSampler実行時 +約1〜2GB 解像度・ステップ数で変動
ControlNet追加 +約1〜2GB モデル1つあたり。種類で変動
LoRA追加 +約0.3〜0.5GB LoRA 1つあたり

この表の読み方はシンプルで、自分が使いたい機能の数値を足し算すればおおよその見当がつく。たとえばSDXLのfp8チェックポイント(2.5GB)+ KSampler(2GB)+ ControlNet 1つ(1.5GB)= 合計約6GBという計算になる。LoRAをさらに2つ追加すると約7GB。VRAM 8GBのGPUならギリギリ収まるが、余裕はほぼないという見立てになる。

見ておきたいのは、fp8量子化を使わない場合のチェックポイントサイズ。bf16のままだと約5GBを消費するため、それだけでVRAM 8GBの半分以上を占めてしまう。そのため、VRAM 12GB未満でSDXLを扱うなら、fp8やCPUオフロードといった省メモリ手段が現実的な選択肢になる。

VRAM容量別|ComfyUIでできること・できないこと

ここからが本題。VRAM容量ごとに、ComfyUIで具体的に何ができて何ができないのかを整理した。下表は本記事の3GPUでのSDXL実測と、ComfyUI公式のワークフロー要件・編集部の推定を組み合わせた購入目安であり、ComfyUI公式が定める推奨スペックそのものではない。各行の「根拠」列で、実測した範囲と未実測の推定を分けて示す。

VRAM容量 用途の目安 根拠 主な制約・備考
6GB SD 1.5(512×512)中心 編集部推定(未実測) SDXLは設定次第で動くが余裕は乏しい。動作保証ではない
8GB SD 1.5快適、SDXL(fp8量子化が前提) 編集部推定(未実測) ControlNet併用は厳しめ。省メモリ設定で調整
12GB SDXL快適、LoRA+ControlNet併用可能 SDXL速度は実測(RTX 4070 Super)/併用はVRAM内訳からの推定 Flux.1はメモリ不足の可能性。高解像度バッチは制限あり
16GB Flux.1(FP8)対応、複雑なワークフロー、バッチ処理 SDXLとFlux.1 FP8は実測(RTX 5080)、SDXLは5060 Tiでも実測/動画は公式要件+推定 一部の動画生成も視野に入る。本格運用の推奨ライン
24GB 大規模バッチ、複数モデルを扱う余裕、多くの動画生成 編集部推定(未実測) 自由度は高いが、重い動画では足りない場面もある

この表はあくまで目安であり、解像度やステップ数、同時に使うノードの数によって実際の消費量は変動する。ただし、大枠としての判断材料にはなるはず。

8GB — 多くの人が最初に当たる壁

VRAM 8GBは、ComfyUIで最も相談の多い容量帯。なお本記事では8GB GPU単体での実測は行っておらず、ここから先はVRAM内訳と一般的な挙動からの目安として読んでほしい。SDXL(Stable Diffusionの高解像度版)は、fp8量子化を使えば動かせる見込み。「動かない」と詰まるケースの多くは、fp8ではないチェックポイントを読み込んでいるか、ControlNetやLoRAを盛りすぎているかのどちらか。

先ほどのVRAM内訳表で計算してみると見えてくる。SDXLのfp8チェックポイント(約2.5GB)にKSampler実行時の上乗せ(約2GB)を足すと、画像を1枚生成するだけなら約4.5GB。ここにControlNetを1つ(約1.5GB)足して6GB、さらにLoRAを2つ重ねて約7GB。8GBのカードでも数字の上では収まるが、解像度を上げたりバッチ枚数を増やすと、残り1GBの余裕はあっという間に消える。単純加算はあくまで初期見積もりで、実際のピークは動的VRAM・解像度・バッチ・各ノードの実装で変わるため、最終判断は自環境のピークをnvidia-smiで確認したい。

もうひとつ知っておきたいのが、ComfyUIの動的VRAM(dynamic VRAM)。公式のStartup FlagsによればNVIDIA環境では既定で有効とされ、VRAMが逼迫したときのメモリのやりくりを自動で行う(対象環境やバージョンで挙動は異なる)。このため、昔ほど手動で--lowvramを指定する必要はなく(むしろ--lowvramは動的VRAMが有効だと効果がない)、8GBで「とりあえず動く」ことも見込める。それでもメモリ不足(OOM)で落ちる場合に、--reserve-vram--novramなどで調整していく、という順序になる(起動オプションの一覧は後述)。

VRAM 8GBでSDXLが落ちるときは、まずfp8対応のチェックポイントを使っているか確認したい。bf16のままだとチェックポイントだけで約5GBを占有し、ControlNetを足した時点でメモリ不足になりやすい。fp8版に差し替えるのが先決で、起動オプションでの節約はその次。

総じて、8GBは「動かせるが快適ではない」という位置づけになりやすい。趣味で1枚ずつ生成するなら十分だが、ControlNetやLoRAを重ねた作り込みに踏み込むと、すぐに上の容量が欲しくなる。

12GB〜16GB — SDXL・Flux.1が実用圏に入るライン

VRAM 12GBは、ComfyUIの快適ラインと呼べる容量。SDXLをfp8量子化で動かしつつ、ControlNet 1〜2個とLoRA数個を同時に使えるだけの余裕が生まれる。趣味でAI画像生成を楽しむなら、12GBで十分な場面が多いだろう。

16GBに到達すると、選択肢は一気に広がる。Flux.1のような次世代モデルでは、16GBはFP8チェックポイントや省メモリ設定でのローカル運用が現実的な目安になる(フル版やt5xxl_fp16を併用する場合は、より大きなVRAM/RAMやCPUオフロードが必要)。加えて高解像度(1920×1080以上)での生成、バッチ処理(複数画像の連続生成)も現実的になる。動画生成はモデルによる幅が大きく、ComfyUI公式のWan2.2 5Bのようにオフロード前提で8GB級に収まるワークフローがある一方、高解像度・長尺・14B級などの重い生成では16GB以上、場合によっては24GB以上を見込む。本格的に複数の用途を回すなら16GBが扱いやすい推奨ラインだが、公式テンプレートごとの要件確認は欠かせない。

24GB以上 — 動画生成・大規模バッチが視野に入る領域

24GBのVRAMがあれば、複数モデルを扱う余裕が大きく増える(複数モデルを同時にGPU保持できるかは、モデルサイズや--highvramなどのVRAMモード、ワークフロー構成による)。ただし、必要VRAMはモデル規模・解像度・フレーム数で変わるため、24GBでも重い動画生成では足りない場面はある。

価格面では、24GB帯のGPUは相応に高い。24GBのRTX 4090(GDDR6X)は旧世代のカードで、新品在庫は販路によって限られる場合がある(購入時は新品/中古・保証・価格を個別に確認したい)。32GBまで伸ばすなら現行のRTX 5090(32GB GDDR7)だが、2026年前半はメモリ価格の高騰もあって実勢70万円前後と一段高い。中古のRTX 3090(24GB)も24GBの選択肢になるが、世代が古くCUDAコアあたりの効率では現行に劣る。費用対効果を考えると、多くのユーザーにとっては16GBが現実的な上限になりやすい。

実測で見るGPU別ComfyUI生成速度

「VRAMが足りていれば生成速度は同じ」と思っていないだろうか。実はそうではない。当サイトの検証環境(CPU: i7-14700F / RAM: 96GB)でSDXLの画像生成速度を計測した結果が以下の通り(同一環境での参考値。ComfyUI/PyTorch/ドライバのバージョンやモデル・設定で変わるため、絶対値より相対差を見てほしい)。

GPU VRAM CUDAコア数 生成時間(Warm) VRAM増分(idle比) GPU温度
RTX 5080 16GB GDDR7 10,752 6.1秒(fp8) 6.7GB 50°C
RTX 4070 Super 12GB GDDR6X 7,168 8.2秒(fp8) 9.4GB 58°C
RTX 5060 Ti 16GB GDDR7 4,608 12.3秒(fp8) 4.1GB 45°C

計測条件: SDXL 1280×720、fp8量子化、20ステップ、Euler、cfg=7.5、sd_xl_base_1.0チェックポイント。RTX 5080とRTX 5060 Tiは2026年6月11日に同一環境で各3回(cold 1回+warm 2回)計測し、表の生成時間はwarmの平均(初回ロードは除外)。各回ともseedを変えてキャッシュ再利用を避けている。RTX 4070 Superは現在オンライン構成から外しているため、2026年4月の実測値を併記した(別時点・別ソフトウェア条件の参考値で、5080/5060 Tiとの厳密比較ではない)。VRAM使用量はidle状態から生成ピークまでの増分(nvidia-smiのMiB表示を概算でGB換算)で、GPU温度はケース・室温・カード個体に依存する参考値。各回ともnvidia-smiでGPU上に実行・VRAM配置されていることを確認している。使用モデルはSDXLが sd_xl_base_1.0.safetensors、FluxがComfyUI公式ワークフローで案内される flux1-dev-fp8.safetensors(FLUX.1-devをFP8量子化したチェックポイント)。なお測定はいずれも2026年6月11日時点で、ComfyUI本体・PyTorch・ドライバの厳密な版やモデルのdigestまでは記録していないため、以下は同一サイト環境での参考比較であり、厳密な再現用ベンチではない。その後ComfyUIはv0.25.0(6月16日)・v0.25.1(6月18日)が公開されており、新しい版ではVRAM管理や速度が変わる可能性がある。

興味深いのが、RTX 5060 TiとRTX 4070 Superの比較。VRAM容量はRTX 5060 Tiの16GBが上回っているにもかかわらず、生成速度はRTX 4070 Super(8.2秒)がRTX 5060 Ti(12.3秒)を大きくリードしている。

CUDAコア数 vs VRAM容量 — 速度を決めるのはどちらか

この速度差に大きく効いていると考えられるのが、CUDAコア(GPU内部の演算ユニット)の数。RTX 4070 Superは7,168コア、RTX 5060 Tiは4,608コアで、約1.55倍のコア数差がある。本記事の条件(SDXL/fp8/20ステップ)では、コア数の多いGPUほど速いという関係がはっきり出た。

ただし、生成速度はCUDAコア数だけで決まるわけではない。GPUの世代、クロック、Tensorコア、メモリ帯域、ドライバやComfyUI/PyTorchの実装も影響する。今回は3機種・1条件での傾向で、各要素の寄与度までの要因分解は実施していないが、それでも「VRAMさえ多ければ速い」という認識は誤りで、VRAM容量と演算性能の両方を見て判断する必要がある、という結論は変わらない。

GPU選びで最も誤解されやすいのが、ここ。RTX 5060 Ti 16GBは「VRAM 16GB」という数字だけ見ればRTX 5080と同じに見える。しかし本記事の実測では、同じSDXL生成でRTX 5080が6.1秒、RTX 5060 Tiは12.3秒と約2倍の差がついた。VRAMの数字は「動くかどうか」の上限を決めるが、「速いかどうか」は演算性能で差が出る(本記事の条件ではCUDAコア数が大きく寄与したが、世代・メモリ帯域・ソフトウェア実装も影響する)。16GBという容量に釣られて速度を見落とすと、生成のたびに倍の時間を待つことになりかねない。
VRAMと演算性能の役割の違いVRAMは「動くか」の上限を決め、演算性能は「速いか」を左右する。演算性能はCUDAコア数だけでなくクロック・世代・メモリ帯域なども影響する。同じVRAM 16GBでも演算性能の高いRTX 5080はRTX 5060 Tiの約2倍速。VRAM と 演算性能 — 役割が違うVRAM(容量)「動くか」の上限モデルが載るかの天井足りないと、そもそも生成できない(OOM)演算性能(計算力)「速いか」を左右生成スピードに直結速さはCUDAコア数だけでなく、クロック・世代・メモリ帯域なども影響する同じVRAM 16GBでも、演算性能の高いRTX 5080はRTX 5060 Tiの約2倍速。容量の数字(GB)だけでは、速さは決まらない。
図:VRAMは「動くか」の上限、演算性能(CUDAコア・クロック等)は「速いか」を左右する(本文の要約)

もうひとつ押さえておきたいのが、fp8量子化の効果。RTX 5080でbf16(13.7GB)からfp8(6.7GB)に切り替えると、VRAM使用量が半分以下に。しかも生成速度はbf16の6.2秒に対してfp8が6.1秒とほぼ同等だった。画質については本記事で定量評価はしていないが、SDXLの同一条件の目視比較では大きな差は見つけにくかった。VRAMを大きく節約できて速度はほぼ変わらないため、SDXLではfp8が扱いやすい。ただしFP8はモデルやワークフローによって品質差が出る場合があり、特にFlux系では公式の作例でもフル精度版よりわずかに品質が落ちると示されている点には留意したい。

2026年6月11日には、同じ環境でFlux.1も実測した。RTX 5080でFlux.1 Dev FP8(1280×720)はwarm 20.5秒・cold 69.6秒で、生成中のVRAMピーク(総使用量)は約15.4GB(測定対象は上記 flux1-dev-fp8.safetensors=量子化版で、ライセンス同意と品質差は後述FAQを参照)。16GBのカードをほぼ使い切る水準で、これが「Flux.1には16GBが要る」ことの実測の裏付けになる。VRAM 12GBではこのピークに届きにくく、メモリ不足や大幅なCPUオフロードが避けにくい。

本記事の条件では、ComfyUIの画像生成速度は演算性能(CUDAコア数)の影響が大きかった。VRAMが足りている前提なら、予算の許す範囲で演算性能の高いGPUを選ぶのが速度改善の近道。CUDAコアの詳しい仕組みについては別記事で解説している。

用途別おすすめGPUの選び方

ComfyUIの用途は人によって大きく異なる。趣味で画像を生成したい人と、LoRAやControlNetを駆使して作品制作に取り組む人では、必要なスペックが違って当然。ここでは用途別に推奨GPUの方向性を整理した。

用途から選ぶ必要VRAMの目安(判断フロー)SDXLで画像生成なら8〜12GB、LoRAとControlNetで作り込むなら12GB以上、Flux.1や動画生成・本格運用なら16GB以上が目安。同じVRAMでも速さは演算性能で変わる。用途から選ぶ — 必要VRAMの目安ComfyUIで何をしたいか → 必要VRAMの目安SDXLで画像生成(基本・シンプル)VRAM 8〜12GBLoRA+ControlNetで作り込みVRAM 12GB以上Flux.1・動画生成・本格運用VRAM 16GB以上※目安。同じVRAMでも、速さは演算性能(CUDAコア・クロック・世代など)で変わる。重い動画はさらに大容量を見込む。
図:用途から選ぶ必要VRAMの目安(SDXL実測とComfyUI公式要件から整理)

趣味の画像生成(SDXL中心、シンプルなワークフロー)の場合、VRAM 8〜12GBが目安。ただし2026年前半はGPU価格全体が高止まりしており、8GBのRTX 4060でも実勢8万円前後(2026年6月上旬の編集部確認)。あと1〜2万円でVRAM 16GBのRTX 5060 Tiが見えてくるため、これから新規で買うなら8GBにこだわらず16GBを狙う方が長く使える。中古でコストを抑えるなら、RTX 3060 12GBが比較的安価な選択肢になるが、CUDAコア数が3,584と少ないため生成速度は遅め。

LoRA+ControlNet活用(複雑なワークフロー)の場合、VRAM 12GB以上が現実的。生成速度も重視するなら、CUDAコア数7,168のRTX 4070 Super 12GB(中古流通品)や、CUDAコア数8,960のRTX 5070 Ti 16GBが候補に上がる。

Flux.1・動画生成・本格運用の場合、VRAM 16GBは確保したい。RTX 5080 16GBはCUDAコア10,752で、本記事で測定した3機種では最速だった(RTX 5090など未測定GPUを含む全体比較は別途要確認)。予算を抑えるならRTX 5060 Ti 16GBでもVRAM容量は同じだが、速度は約半分になる点に注意。実勢価格は記事末尾の価格表(2026年6月上旬確認)で確認してほしい。

ノートPC搭載のGPUはデスクトップ版と性能が異なる。たとえば「RTX 4060 Laptop GPU」と「RTX 4060」は別物で、ノート版はクロック周波数やTGP(GPUの電力枠)が制限されている。同じGPU名でもPCごとのTGP設定で速度が変わるため、NVIDIAのLaptop GPU仕様と各PCメーカーのTGP表で確認したい。ノートPCでComfyUIを使う場合は、必ず電源に接続した状態で実行すること。バッテリー駆動ではGPU性能が大幅に制限される。

デスクトップPCでGPUをアップグレードする場合は、電源ユニットの容量も確認が必要。NVIDIA公式が推奨する必要電源(Required System Power)はRTX 5080で850W、RTX 5070 Tiで750W。必要電源は構成全体で変わるため、GPUメーカーとPSUメーカーの仕様を確認したい。電源容量に余裕がないと、GPU負荷時の瞬間的な電力スパイクでPCが落ちることがある。

AMD製GPU(RX 9070シリーズなど)はVRAM容量あたりの価格が魅力的。2026年に入ってComfyUIはAMD ROCm対応が進み、以前のDirectML頼みから状況は改善している。ただしComfyUI公式のSystem Requirementsでは、AMDはLinuxがROCm 7.2(stable/nightly)、Windows/LinuxはRDNA 3/3.5/4世代に限定したExperimental(実験的)対応とされており、対応世代や手順は変わりやすい。AMDで使うなら、購入前にComfyUI公式の最新インストール手順とAMDのWindows対応表を必ず確認したい。ただし一部のワークフローやGGUFモデルで不安定・性能を出し切れないというコミュニティ報告もあり、CUDAに最適化されたノードやカスタムワークフローを重視するなら、現状はNVIDIA GPUの方が無難。

GPU以外も見落とさない|ComfyUIに必要なPC全体のスペック

ここまではVRAMとGPUの話だったが、ComfyUIは「GPUさえ良ければ快適に動く」というものでもない。システムRAMやストレージが最低ラインを割ると、生成が始まる前のモデル読み込みで待たされたり、アップスケールや動画でメモリ不足に陥ったりする。ComfyUI公式の要件(Desktop FAQとSystem Requirements)と当サイトの実測を突き合わせて、PC全体の推奨構成を整理しておく。

パーツ 最低ライン 標準(SDXL快適) 快適(Flux.1・動画)
GPU / VRAM 8GB(fp8前提) 12GB 16GB以上
システムRAM 16GB(公式最低8GB) 32GB 64GB以上(動画・4Kアップスケール)
CPU 6コア級(第12世代Core i5/Ryzen 5相当) 同左で十分 多コアでも生成速度は伸びにくい
ストレージ SSD推奨・空き50GB SSD 256GB以上 SSD 1TB(モデル多数)

下表は編集部の実用目安。土台にしたのはComfyUI公式の数値(Desktop FAQ:システムRAMは8GB以上・16GB推奨、単体インストールは最低4.85GB)と、SDXLチェックポイント1つで6〜7GBという実際のモデルサイズ。公式が具体的な数値を出していないCPUや、GPU/VRAMの階層は本記事の実測と相場からの推定で、GPU/VRAMの行はVRAM容量別ガイドと対応している(公式が明示するDesktop要件はRAM 8GB以上・16GB推奨、ディスク4.85GB。CPU・SSD容量・32/64GB RAMは編集部目安)。

システムRAM — VRAMの「次の詰まりどころ」

意外と見落とされるのがシステムRAM(メインメモリ)。ComfyUIはモデルをいったんRAMに読み込んでからVRAMへ転送するため、RAMが少ないとモデルのロードやスワップで足を引っ張られる。さらに--lowvram--disable-smart-memoryでCPUオフロードを使う構成では、VRAMから退避した分がRAMに乗るため、RAMの余裕がそのまま安定性に効いてくる。

公式(Desktop FAQ)の要件はRAM 8GB以上・16GB推奨。ただし複数モデルやバッチ処理まで回すなら、編集部としては32GBを勧めたい。これはAI用途でRAMの推奨が増えてきた全体の流れ(Windows 11のゲーミングPC推奨RAMが32GBへ)とも重なる(Copilot+ PCの公式最小要件は16GBで、32GBはあくまで本記事の編集部目安)。とくに動画やアップスケールは桁が変わり、当サイトの実測ではComfyUI内で4K動画アップスケールを実行するとVRAMではなくシステムRAMを67GBまで消費したComfyUIのアップスケールはRAMを67GB食う)。重い後処理まで見据えるなら64GB以上が安心ライン。メモリの選び方はAI用PCのメモリ選びガイドで詳しく扱っている。

CPUとストレージ — 過不足のない選び方

CPUは、生成そのものがGPU側で動くため、ハイエンドにこだわる必要は薄い。第12世代Core i5やRyzen 5クラスの6コア級があれば、モデルのロードやVAEのデコード、テキストエンコーダのCPU実行(--lowvram時)といった場面で不足を感じにくい。生成速度を上げたいなら、CPUよりGPUに予算を回す方が効く。

ストレージは、容量よりまずSSD(できればNVMe)であることが重要。モデルの読み込みが速くなり、初回ロードの待ち時間が縮む。容量の見積もりは、ComfyUI本体の単体インストールが公式で最低4.85GB、SDXLチェックポイントが1つ6〜7GB、Flux.1系は12〜24GBと大きい。LoRAやControlNet、VAEを集め始めると数十GBはすぐ埋まるため、本格的に使うならモデル用に最低でも空き50GB、コレクションを増やすなら1TB級を見ておきたい(AI用PCのSSD選び方)。

ComfyUIのPC構成は「GPU/VRAMが主役、システムRAMが次の詰まりどころ、CPUとストレージは最低ラインを満たせば十分」というバランス。予算が限られるなら、CPUやストレージを盛るよりGPUのVRAMと演算性能に配分する方が、ComfyUIの体感は良くなりやすい。

VRAM不足を補うComfyUIの最適化テクニック

「今使っているGPUのVRAMが足りない」と感じたとき、すぐにGPUを買い替える前に試せる対策がいくつかある。

fp8量子化の活用が最も効果が大きい。前述の通り、当サイトの検証ではSDXL生成時のVRAM使用量がbf16の13.7GBからfp8で6.7GBまで減った。ComfyUIの公式ワークフローやHugging Faceで公開されているfp8版チェックポイントを使うだけで、特別な設定は不要(fp8版はStability AI公式のSDXLそのものではなく、第三者が変換・公開した版を使う場合が多い。配布元とライセンスは確認したい)。

起動オプションでのVRAM制御も覚えておきたい。現行のComfyUIはNVIDIA環境では既定で動的VRAM(dynamic VRAM)が有効とされ、通常はオプション無指定でVRAMを自動でやりくりする(対象環境は公式のStartup Flagsを確認)。足りない・あるいは余っているときに、起動時のコマンドライン引数で挙動を変えられる。よく使うものを下表に整理した(--gpu-only--highvram--lowvram--novram--cpuは相互排他で、いずれか1つを指定する)。

起動オプション 何をするか 使いどき
--lowvram テキストエンコーダなどをCPU側で動かしてVRAMを節約する(動的VRAMが有効な現行版では効果がない点に注意) 動的VRAMを切った環境などで、8GB前後の不足を抑えたいとき
--novram --lowvramでも足りないとき、VRAM使用を最小限に抑える 6GB級で無理やり動かすとき
--highvram 使い終わったモデルもCPUへ退避せずGPUに保持する VRAMに余裕があり速度を最優先したいとき(16GB以上)
--gpu-only テキストエンコーダを含め、すべての処理をGPUで行う VRAMに十分な余裕がある最速構成
--reserve-vram N OSや他ソフト用にNGBのVRAMを確保しておく 画面表示と競合してOS側のVRAMが不足するとき(ComfyUI自体のOOM対策ではない)
--disable-smart-memory モデルをVRAMに保持せず、積極的にRAMへ退避する VRAMを限界まで切り詰めたいとき
--disable-dynamic-vram 動的VRAMを無効化し、推定ベースのモデルロードに戻す 動的VRAMの挙動が合わないとき

注意したいのは、--lowvram系は「動かす」ためのオプションであって「速くする」ためのものではない点。CPUへ退避するぶん生成速度は落ちる。VRAMが足りているなら、節約系オプションはむしろ付けない方が速い。逆に余裕があるなら--highvram--gpu-onlyでCPUオフロードを減らせる可能性がある(高速化は環境・ワークフロー依存で、OOMが出る場合は使わない)。各オプションの正確な仕様はComfyUI公式ドキュメントのStartup Flagsページが一次情報になる。

ワークフローの分割も有効な手段。ControlNetとアップスケーリングを同時に実行するとVRAMを大量に消費するが、ControlNetで画像を生成した後、別のワークフローでアップスケーリングする2段階方式にすればピーク消費量を抑えられる。とくにアップスケールは見落としがちな盲点で、ComfyUI内で4K動画アップスケールを実行するとVRAMではなくシステムRAMを大量に消費するケースがある。この詰まりどころと回避策はComfyUIのアップスケールはRAMを67GB食うで実測とともに解説している。

使わないモデルの手動アンロードも覚えておきたいテクニック。ComfyUIは自動アンロード機能を備えているが、複雑なワークフローでは不要なモデルがGPU上に残ることがある。ワークフロー内で明示的にモデルをアンロードするノードを挟むことで、VRAMの空きを確保できる。

これらの対策をすべて試してもVRAMが足りない場合は、GPU買い替えを検討するタイミング。買い替えの基準は、いま実際にOOMしているワークフローのピークVRAMと、移行先で使いたいモデル・解像度の必要量。容量を増やすなら「8GB→12GB」「12GB→16GB」のように、4GB以上の明確なステップアップを意識すると体感差が出やすい。

fp8量子化は本記事のSDXL目視比較では画質の差が小さく(定量評価は未実施)、VRAM使用量を約半分に削減できた。VRAM 12GB未満のGPUでは優先的に検討したい最適化手段。VRAMの基本的な仕組みについてはVRAMとは?で解説している。

ComfyUIの導入|Desktop版とPortable版、VRAMでの違いはあるか

ComfyUIにはインストール方法が複数あり、「Desktop版」と「Portable版」のどちらにするかで迷う人が多い。先に結論を言うと、VRAMの観点で大きな差はない。どちらも基本的に同じComfyUI系のエンジンを使う。ただし同梱されるComfyUI/Python/PyTorch/CUDA・ROCmのバージョンや更新タイミングが異なる場合があり、その差で速度やVRAM消費がわずかに変わることはある。

Desktop版は、複数のComfyUIインストールの管理や更新・スナップショット・モデルのダウンロード管理を備えた公式デスクトップアプリ。セットアップが簡単で初心者向けだが、別のPCへ移すには入れ直しが必要で、Python環境を細かく触りにくいのがデメリットになる。

Portable版は、解凍するだけで動く一式フォルダ。PyTorchの差し替えや更新を自分で管理でき、フォルダごと別のWindows PCへ持ち運びやすい。中級者以上で環境を作り込みたいなら、こちらの方が扱いやすい(なお配布されるのはWindows向けで、Linuxでは手動インストールなど別手順になる)。

更新面では、Desktop版は安定版ベースで最新機能の反映が遅れる場合があり、Portable版はWindows向けで最新コミットを試しやすい。どちらを選んでも、必要なVRAMは本記事のガイドラインがおおむねそのまま当てはまるので、「Desktop版だから軽い」といった大きな差を気にせず、自分のスキルレベルと運用スタイルで選んで問題ない。

関連する実測・解説記事

まとめ

ComfyUIの推奨スペックを、実測データと公式情報に基づいて整理すると以下の結論になる(以下のVRAM階層は編集部の購入目安で、ComfyUI公式が定める推奨スペックそのものではない)。

VRAM 8GBはSDXLがfp8量子化で動かせるライン。ControlNetやLoRAの併用は厳しめで、快適とは言いがたい。VRAM 12GBでSDXL+ControlNet+LoRAの組み合わせが実用的になり、多くのユーザーにとって満足度の高い環境が得られる。VRAM 16GB以上ならFlux.1(FP8)や一部の動画生成を含む幅広いワークフローに対応しやすくなる。

そしてもうひとつ重要なのが、VRAMだけで選ばないこと。本記事の条件では、演算性能(CUDAコア数)が生成速度に大きく効いた。VRAM容量が同じ16GBでも、RTX 5080(10,752コア、6.1秒)とRTX 5060 Ti(4,608コア、12.3秒)では生成速度に約2倍の差がついた。容量の数字と速度の実力は別物だと、頭に入れておきたい。

あわせて、GPU以外のパーツも最低ラインは押さえておきたい。システムRAMはSDXL中心で32GB、動画や4Kアップスケールまで使うなら64GB以上。ストレージはモデルが大きいぶんSSD(できればNVMe)が前提になる。CPUは6コア級で足り、ここを盛るよりGPUに予算を回す方がComfyUIでは効く。

まずは自分がComfyUIで何をしたいかを具体的にしてほしい。SDXLでシンプルな画像生成を楽しむのか、ControlNetやLoRAを駆使した作品制作に取り組むのか。その答えが決まれば、上のVRAM容量別ガイドライン表から必要なスペックを割り出せるはず。

よくある質問

Q. VRAM 6GBのGPUでもComfyUIは動きますか?

起動自体は可能で、SD 1.5の512×512解像度ならおおむね実用になります。SDXLは省メモリ設定を使っても余裕が乏しく、生成速度も遅くなりがちです。AI画像生成を本格的に始めるなら、VRAM 8GB以上のGPUを用意したいところです。

Q. ComfyUIはVRAM 8GBのGPUでも動きますか?

SDXLをfp8量子化で使う前提なら、動かせる見込みです(本記事では8GB GPU単体の実測は行っておらず、VRAM内訳からの目安です)。fp8でないチェックポイントだとチェックポイントだけで約5GBを占有し、ControlNetを足した時点でメモリ不足になりやすくなります。本記事では8GB実機は未測定ですが、fp8・低バッチ・低解像度・動的VRAM前提ならtxt2img用途で実用が見込めます。ControlNetやLoRAを重ねる作り込みには12GB以上を推奨します。

Q. ComfyUIでFlux.1を使うには何GBのVRAMが必要ですか?

16GBはFP8チェックポイントや省メモリ設定でのローカル運用が現実的な目安です。本記事の実測では、RTX 5080・FP8・1280×720・特定ワークフローでFlux.1 Dev FP8のVRAMピークが約15.4GBと16GBをほぼ使い切りました(モデル構成や解像度で必要VRAMは変わります)。VRAM 12GBではこのピークに届きにくくメモリ不足になりやすく、フル版(t5xxl_fp16併用など)や高解像度・長尺ワークフローでは、より大きなVRAM/RAMやCPUオフロードが必要になります。なおFLUX.1-devの重みはHugging Face上での同意が必要で、FLUX.1 [dev] Non-Commercial Licenseの対象です。出力物・派生モデル・API経由利用の扱いは、同ライセンスとAcceptable Use Policyで確認してください(一方FLUX.1-schnellはApache-2.0)。

Q. fp8量子化を使うと画質は劣化しませんか?

当サイトの検証環境(RTX 5080)でSDXLをbf16とfp8で比較したところ、目視で判別できる差はほとんどありませんでした(画質の定量評価は実施していません)。生成速度もbf16の6.2秒に対してfp8が6.1秒とほぼ同等です。ただしFP8はモデルやワークフローによって品質差が出る場合があり、Flux系の公式作例ではフル精度版よりわずかに品質が落ちると示されています。SDXL中心なら扱いやすい一方、重要な用途では出力を見比べて判断するのが無難です。

Q. VRAMが多いGPUほどComfyUIの生成が速くなりますか?

VRAMが十分足りている状態では、生成速度を左右するのは主に演算性能です。本記事の実測では16GB VRAMのRTX 5060 Ti(12.3秒)より12GB VRAMのRTX 4070 Super(8.2秒)の方が速く、CUDAコア数の差(4,608 vs 7,168)が速度差に表れています。VRAMは「動くかどうか」、演算性能は「速いかどうか」を決める、と分けて考えると選びやすくなります。

Q. ノートPCでComfyUIは使えますか?

VRAM 8GB以上のGPUを搭載したノートPCなら、SD 1.5や軽めのSDXL構成を動かせる見込みです(本記事ではノート向け8GB GPU単体は実測していません)。ただし、ノートPC用GPU(例: RTX 4060 Laptop GPU)はデスクトップ版よりクロック周波数やTGP(電力枠)が低く、生成速度は遅くなります。また、AI画像生成はGPUに高負荷をかけるため、必ず電源に接続した状態で使用してください。バッテリー駆動ではGPU性能が制限されるうえ、バッテリーの消耗も激しくなります。

Q. ComfyUIに必要なPCスペックは、GPU以外だと何を見ればいいですか?

システムRAM・ストレージ・CPUの3つです。RAMは公式で8GB以上・16GB推奨、編集部目安としてSDXL中心なら32GB、動画やアップスケールまで使うなら64GB以上です(当サイトの実測では4K動画アップスケールでシステムRAMを67GB消費しました)。ストレージはSSD(できればNVMe)が望ましく、モデルを集めるなら空き50GB〜1TBを見ておきます。CPUは第12世代Core i5やRyzen 5クラスの6コア級で十分で、生成速度を上げたいならCPUよりGPUに予算を回すのが効果的です。

Q. ComfyUIにメモリ(システムRAM)は何GB必要ですか?

ComfyUI公式の目安は最低8GB・16GB推奨で、複数モデルやバッチ処理を回すなら32GBが快適です。SDXLの通常生成ならVRAMが主役で、システムRAMは32GBあれば困りにくいですが、動画生成や4KアップスケールはRAMを大量に消費します(当サイト実測で67GB)。そうした重い後処理まで予定しているなら64GB以上を検討してください。

本記事は AIハードウェア図鑑 編集部 が記載時点の情報をもとに執筆。実測値は本サイト環境での参考値であり、ComfyUI・PyTorch・ドライバのバージョンやモデル・設定で変動する。8GB GPU単体・動画生成・価格は目安(Flux.1はRTX 5080でのみ実測、ほかのGPUは目安)。製品アップデートや第三者ベンチマーク・価格・対応ランタイム等の変動で評価が変わる可能性があるため、一定期間経過した内容は再検証を推奨する。

VRAM階層別の代表GPUをAmazonで探す

VRAM階層 用途の目安 代表的なGPU 価格目安
8GB SD 1.5中心・制約あり RTX 4060 ¥80,000前後
(実勢価格・2026年6月時点)
12GB SDXL実用の入口 RTX 5070 ¥105,000前後
(実勢価格・2026年6月時点)
16GB SDXL・Flux.1が実用圏 RTX 5060 Ti 16GB ¥95,000前後
(実勢価格・2026年6月時点)
24GB+ 動画生成・大規模バッチ RTX 5090 ¥710,000前後
(実勢価格・2026年6月時点)

※価格は2026年6月上旬に編集部が確認した、主要ブランド新品(税込)の実勢価格の目安(参照: 価格.com 売れ筋ランキング・gazlog GPU価格チャート)。GDDR7・メモリ高騰で相場変動が大きく、リンク先のAmazon検索結果とは異なる場合があるため、購入前に各販売店で最新価格を確認してください。

当サイトはAmazonアソシエイト・プログラムの参加者です。Amazonのアソシエイトとして、当サイトは適格販売により収入を得ています。

画像生成だけでなくLoRA学習を低VRAMで試すなら、6GBから動くAnima TrainFlowの実測も併せて読みたい。

参考資料

SDXL・Flux.1 などのモデルを使う際は、各モデルカードのライセンス(SDXLはCreativeML Open RAIL++-M、FLUX.1-devは非商用ライセンス、FLUX.1-schnellはApache-2.0)と用途制限を確認したうえで利用すること。

タイトルとURLをコピーしました