Intel Nova LakeのXe3内蔵GPUはAI用途で使えるか｜Lunar Lake実測データから性能を予測

Intelの次世代CPU「Nova Lake」（Core Ultra 400シリーズ）に、Xe3世代の内蔵GPU（iGPU）が搭載されるというリーク情報が浮上した。押さえておきたいのは、グラフィックスエンジンとメディアエンジンで異なる世代の技術を組み合わせる構成を採用するとされる点。外付けGPUなしでローカルAIはどこまで動くのか——現行Lunar Lakeの実測データをもとに、Nova Lakeの実力を予測する。

この記事の要点

Nova LakeはXe3グラフィックス＋Xe3Pメディアエンジンという異世代構成の内蔵GPUを搭載する見込み
現行Lunar Lake（Xe2）の実測では、4Bクラスの量子化LLMが内蔵GPUで実用的に動作している
外付けGPUなしでローカルAIを動かすなら、メモリ帯域と搭載容量が性能を左右する最大の要因

Nova Lakeに搭載されるXe3内蔵GPUの構成とは
1. Xe3とXe3Pの違い——グラフィックスとメディアエンジンを分ける理由
2. リーク情報の信頼度と公式発表までの見通し
現行Lunar Lakeの内蔵GPUはローカルAIでどこまで使えるか
1. Lunar Lakeで動くAIモデルと量子化手法の選び方
2. 内蔵GPUでのAI推論——VRAM共有メモリという制約
Nova LakeのXe3でAI性能はどこまで伸びるか
1. Xe3世代で期待されるAI関連の強化ポイント
2. 外付けGPUなしでどこまでAIが動くか——用途別の現実的な見通し
Nova Lake搭載PCを選ぶときに気をつけたいこと
1. iGPUとdGPUの性能差を数値で整理する
まとめ
よくある質問（FAQ）
参考資料

Nova Lakeに搭載されるXe3内蔵GPUの構成とは

Intel Nova Lakeは、Core Ultra 400シリーズとして登場が見込まれる次世代CPUだ。P-core（高性能コア）とE-core（高効率コア）の設計を大幅に刷新するとされているが、内蔵GPUの構成については長らく不明だった。Intelが公式に展開するCore Ultraシリーズ全体の位置づけは Intel Core Ultra プロセッサー公式ページで確認できる。

2026年4月、Intelのリーク情報で定評のあるJaykihn氏が、Nova Lakeの内蔵GPU構成を明らかにした。搭載されるのはXe3世代のグラフィックスエンジン。現行のPanther Lake（Arc B300シリーズ）で採用されているものと同世代のアーキテクチャになるとされる。一方、ディスプレイ出力やメディア処理を担うエンジンにはXe3Pが採用されるという。

Xe3とXe3Pの違い——グラフィックスとメディアエンジンを分ける理由

ここで気になるのが、なぜグラフィックスとメディアエンジンで世代表記が異なるのかという点。

グラフィックスエンジン（Xe3）はシェーダー処理やAI推論の演算を担当する部分で、GPU設計の中核にあたる。対してメディアエンジン（Xe3P）は動画のエンコード・デコードやディスプレイ出力を処理する専用回路だ。Intel Arcグラフィックスの世代区分とXeコアの位置づけは Intel Arc 公式製品ページで整理されている。

この2つは開発サイクルが異なる。メディアエンジンはディスクリートGPU（dGPU）——つまり単体グラフィックボード向けに先行開発されたものを、内蔵GPU向けに流用・最適化するケースが多い。Xe3Pの「P」はPanther Lakeからの派生を示唆しており、Battlemage世代のdGPUで実績のあるメディアエンジンをベースにしていると考えられる。

AI用途の観点で注目したいのは、メディアエンジンの強化がもたらす恩恵だ。AV1に加えてH.266（VVC）のハードウェアデコードに対応する可能性があり、AI動画生成ワークフローでの出力処理が高速化する余地があるとされる。生成した動画をリアルタイムでプレビュー・エンコードする場面では、メディアエンジンの性能が体感速度を左右するためだ。

リーク情報の信頼度と公式発表までの見通し

Jaykihn氏はこれまでIntelのロードマップに関して高い的中率を持つリーカーとして知られている。ただし、Nova Lakeの正式発表は2026年後半から2027年にかけてと見られ、最終仕様が変更される可能性は残る。

現時点で確定しているのは「Xe3世代のグラフィックスを搭載する方向性」であり、EU（Execution Unit＝演算ユニット）の数や動作周波数といった具体的なスペックはまだ明らかになっていない。この記事では、現行世代の実測データをもとにNova Lakeの性能レンジを推測していく。

現行Lunar Lakeの内蔵GPUはローカルAIでどこまで使えるか

Nova Lakeの性能を予測するには、まず「現在地」を把握する必要がある。現行のLunar Lake（Core Ultra 200Vシリーズ）はXe2世代の内蔵GPUを搭載しており、Intel iGPUでのローカルAI実行がどの程度実用的かを示す貴重なベンチマークが存在する。Lunar Lake世代の Core Ultra 200V シリーズ全体仕様は Intel Core Ultra AI PC 公式解説で公開されており、NPU・iGPU・CPU 3 系統の AI 処理分担が前提構成として示されている。

海外のRedditコミュニティ（r/LocalLLaMA）では、Lunar Lake環境での8Bクラス量子化LLMのGGUF量子化別パフォーマンス比較が投稿されている。このデータは、Intel内蔵GPUでのローカルLLM実行における速度と精度のバランスを傾向として示した点で参考になる。

Lunar Lakeで動くAIモデルと量子化手法の選び方

GGUF（GPT-Generated Unified Format）は、ローカルでLLMを動かす際に広く使われるモデルフォーマットだ。フォーマット仕様と量子化アルゴリズムは llama.cpp 公式リポジトリで公開されており、量子化（モデルの数値精度を下げてファイルサイズとメモリ使用量を削減する手法）の種類によって、生成速度と回答精度のバランスが大きく変わる。

Lunar Lake環境での実測によると、Q4_0量子化が速度と精度のバランスに優れるという結果が報告されている。一方、ファイルサイズを極端に小さくするIQ2系やIQ3系の量子化手法では精度が大きく劣化する傾向が確認された。llama.cppコミュニティでは量子化精度の比較について、次のような見解が継続的に共有されている。

Q4_0 や Q4_K_M は 8B クラス以下のモデルで Q8_0 とのパープレキシティ差が小さく、メモリ制約のある環境でも実用域に収まる。一方、IQ2 系は 3B 前後の小型モデルで破綻的な精度劣化を起こすケースがあり、用途と検証が必須となる。 — llama.cpp Discussions（量子化スレッド）

以下は、量子化手法ごとの特徴をAI初心者向けに整理した表だ。

量子化手法	ファイルサイズ	生成速度	精度（KLD）	Intel iGPU環境での評価
Q8_0	大きい	やや遅い	最も高い	メモリに余裕がある場合の最善策
Q4_0	中程度	速い	十分実用的	速度・精度・サイズのバランスが良好
Q4_K_M	中程度	速い	Q4_0と同等〜やや上	Q4_0と並ぶ有力な選択肢
IQ3系	小さい	速い	やや劣化	メモリ制約が厳しい場合の妥協案
IQ2系	最小	最速	大幅に劣化	精度を犠牲にしすぎるため非推奨

参考として、当サイトの検証環境（RTX 5080 / i7-14700F / 96GB RAM）でのdGPU実行では、gemma3:4bが194.0 tokens/sec、phi4-mini:3.8bが243.7 tokens/secを記録している。内蔵GPUではこの10分の1〜5分の1程度の速度になるが、4Bクラスのモデルなら「待てる範囲」の応答速度は確保できる。検証で使用したGemma 3モデル系列の仕様詳細は Google Gemma 3 4B モデルカードで公開されている。

内蔵GPUでのAI推論——VRAM共有メモリという制約

内蔵GPUには、dGPU（GeForce RTXシリーズなど）と決定的に異なる制約がある。専用VRAM（ビデオメモリ）を持たず、システムメモリ（RAM）をGPUと共有する構造だ。

これが意味するのは、搭載RAMの全量をAIモデルのロードに使えるわけではないということ。OSやアプリケーションがメモリを消費するため、32GB搭載のノートPCでもiGPUに割り当てられるのは実質15〜20GB程度になる。共有メモリ構造下でのGPU割当量はOEMのBIOS設定とドライバ実装に依存する部分が大きく、Lunar Lake世代でも基本構造は変わらない。

この制約があるため、Intel内蔵GPU環境でのローカルLLM実行は7Bクラス（70億パラメータ）が実質的な上限というのが現状だ。13B以上のモデルは量子化しても共有メモリに収まりきらず、動作が極端に遅くなるか、そもそもロードできない場合がある。

Intel内蔵GPUでローカルLLMを動かす場合、システムメモリをVRAMとして共有する仕組みになっている。メモリ32GB搭載でも実質使えるのは半分程度。7Bクラスのモデルが現実的な上限と考えておくのが安全。

Nova LakeのXe3でAI性能はどこまで伸びるか

Lunar Lakeの実測データで「現在地」を確認したところで、Nova LakeのXe3世代ではどこまで性能が伸びるかを考えてみたい。

Xe3世代で期待されるAI関連の強化ポイント

Xe2からXe3への世代交代で予想される改善点は主に3つ。

EU数の増加が第一の期待だ。Panther LakeのXe3ではLunar LakeのXe2に対してEU数が増える見込みがあり、単純に並列演算能力が上がればAI推論のtokens/secも向上すると考えられる。ただし具体的な改善幅は仕様が確定するまで不明だ。Intel Arc のXeコア世代別の概要については Intel Arc B シリーズ製品ページが一次情報となる。

メモリ帯域の拡大も重要な要素。Nova LakeがLPDDR5x-8400以上に対応すれば、共有メモリ構造で速度の制約になりがちなデータ転送速度が改善される可能性がある。AI推論、特にLLMのトークン生成速度はメモリ帯域に強く依存するため、ここが広がる効果は大きい。LPDDR5xの規格は JEDEC JESD209-5 LPDDR5/LPDDR5X 規格書で正式に定義されており、最新改定では最大8533MT/sまでが規格化されている。

3つ目はNPU（Neural Processing Unit＝AI処理専用チップ）の強化。Nova LakeではNPUの演算性能がさらに引き上げられる可能性が高く、CPU＋iGPU＋NPUの3系統でAI処理を分担するシナリオが現実味を帯びてくる。Intel AI Boostおよび Core Ultra世代のNPU活用シナリオは Intel AI PC 公式解説で概要が公表されている。

具体的な使い分けとしては、LLM推論はNPU、画像の前処理はiGPU、ChatGPTやClaude等のAPIコールを伴う作業はCPUが担当する——という棲み分けが考えられる。これが実現すれば、それぞれの処理を並列で走らせることも可能になるだろう。

外付けGPUなしでどこまでAIが動くか——用途別の現実的な見通し

Nova Lake世代で「外付けGPUなしのAI対応ノートPC」がどこまでカバーできるか。用途別に見通しを整理した。

AI用途	Nova Lake iGPUでの見通し	備考
ChatGPT・Claude等のAPI利用	まったく問題なし	GPU性能は無関係。CPU・RAM・SSD速度が重要
Claude Code・GitHub Copilot等	快適に動作	APIベースのためiGPU性能に依存しない
ローカルLLM（4B以下）	実用的な速度で動作	Q4_0量子化推奨。チャット用途なら十分
ローカルLLM（7B）	動作するが速度は控えめ	RAM 32GB以上必須。メモリ帯域が速度を左右
ローカルLLM（13B以上）	実用は厳しい	共有メモリの容量・帯域が不足。dGPU推奨
Stable Diffusion / ComfyUI	実用的な速度は期待しにくい	画像1枚に数分〜十数分。dGPUまたはeGPU接続を推奨
AI動画生成	現実的ではない	VRAM 8GB以上のdGPUが事実上の必須要件

要するに、APIベースのAIツールやコーディング支援ツールは問題なく、軽量なローカルLLMも動く。しかし画像・動画生成やパラメータ数の大きいモデルの実行には、依然としてdGPUが必要という構図は変わらない。クラウド側のAPI利用コストを評価するなら、Anthropic Claudeの料金体系は Anthropic Claude 公式料金ページに公開されており、ローカルGPU性能とは別軸でランニングコストを試算できる。

ただし「外出先で簡単な質問にローカルLLMで答えてもらう」「オフライン環境でも小型モデルでコード補完する」といった用途なら、Nova Lakeの内蔵GPUは十分に実用的な選択肢になるはずだ。

Nova Lake搭載PCを選ぶときに気をつけたいこと

Nova Lakeの発売はまだ先だが、今のうちに「内蔵GPUでAIを動かすPC」を選ぶ際の注意点を整理しておきたい。これはLunar Lake搭載機を選ぶ場合にもそのまま当てはまる。

メモリ帯域が最重要。内蔵GPUは専用VRAMを持たないため、システムメモリの速度がそのままAI推論速度に直結する。LPDDR5x対応は必須で、デュアルチャネル構成になっているかを確認してほしい。シングルチャネルでは帯域が半減し、LLMの生成速度が大幅に低下する。LPDDR5x規格上の最大帯域はJEDEC JESD209-5改定で大きく引き上げられており、Nova Lake世代ではこの上限を活かす実装が期待される。

メモリ容量は32GB以上を推奨。7BクラスのLLMを動かすなら16GBでは足りない。OS・アプリ・モデルデータでメモリを分け合う共有構造であることを考えると、余裕を持った容量が必要になる。

冷却設計の確認も欠かせない。高性能なCPU/iGPUを搭載していても、冷却機構が貧弱だと、サーマルスロットリング（過熱による自動的な性能制限）が発生して本来の実力を発揮できないケースがある。

ノートPCの薄型モデルでは、電源接続時でもサーマルスロットリングでCPU/iGPU性能が制限されるケースがある。AI推論のように高負荷が続く用途では、排熱設計を必ず確認すること。

では、iGPUで十分なのか、dGPU搭載モデルを買うべきなのか。判断基準はシンプルだ。

iGPUで十分なケース: APIベースのAIツール（ChatGPT、Claude、GitHub Copilot等）がメイン。ローカルLLMは4B〜7Bの軽量モデルを補助的に使う程度。予算を抑えたい、軽量なノートPCが欲しい場合。

dGPU搭載を推奨するケース: Stable DiffusionやComfyUIで画像生成をしたい。13B以上のLLMをローカルで快適に動かしたい。AI動画生成に挑戦したい場合。当サイトの検証環境では、RTX 5080でgemma3:12bが82.2 tokens/sec、phi4:14bが82.2 tokens/secを記録しており、dGPUとiGPUの性能差は数十倍に及ぶ。

iGPUとdGPUの性能差を数値で整理する

同じLLMモデルでもiGPUとdGPUでは生成速度に大きな差が出る。下表は当サイト検証環境（RTX 5080 / i7-14700F / 96GB RAM）でのdGPU実測値と、Lunar Lake級iGPUでのコミュニティ報告レンジを並べたものだ。

モデル	RTX 5080 dGPU（当サイト実測）	Lunar Lake iGPU（推定レンジ）	差倍率
phi4-mini:3.8b	243.7 tokens/sec	20〜40 tokens/sec	約6〜12倍
gemma3:4b	194.0 tokens/sec	15〜35 tokens/sec	約5〜12倍
gemma3:12b	82.2 tokens/sec	動作困難	—
phi4:14b	82.2 tokens/sec	動作困難	—

iGPUの推定レンジは、Lunar Lake世代のコミュニティ報告および共有メモリ構造下でのメモリ帯域比から幅を持たせている。Nova Lake世代ではこの下限〜上限が底上げされる可能性があるが、それでも14Bクラス以上のdGPU依存度が解消されるわけではない。

まとめ

Nova LakeのXe3内蔵GPUは、外付けGPUなしで軽量なローカルAIモデルを動かせる時代を一歩前進させる存在になると見られる。Lunar Lakeの実測データが示す通り、4Bクラスの量子化LLMなら内蔵GPUでも実用的な速度が出ており、Xe3世代ではさらなる改善が期待できる。

ただし、13B以上のLLMやStable Diffusion等の画像・動画生成には依然としてdGPUが必要という現実は変わらない。内蔵GPUでのローカルAIは「APIベースのツールを補完する軽量推論」が主戦場であり、ヘビーなAI処理まですべてカバーできるわけではない点を理解しておくべきだろう。

まず自分がやりたいAI用途を明確にし、本記事のガイドライン表でiGPUの守備範囲に収まるかどうかを確認してみてほしい。その上で、メモリ帯域・容量・冷却設計の3点をチェックすれば、Nova Lake搭載PC選びで大きく外すことはないはずだ。

よくある質問（FAQ）

Q: Nova Lakeはいつ発売される？
A: 現時点ではリーク段階であり、正式な発売日は未定。業界の観測では2026年後半から2027年にかけてが有力とされているが、Intelの公式発表を待つ必要がある。今すぐローカルAI環境が欲しい場合は、Lunar Lake搭載機やdGPU搭載ノートPCを検討するのが現実的な選択肢になる。

Q: Nova LakeでStable Diffusionは動く？
A: iGPU単体での実用的な画像生成は期待しにくい。Stable Diffusion（特にSDXL以降）はVRAM 8GB以上の専用GPUを前提に設計されており、共有メモリ構造のiGPUでは生成速度が極端に遅くなる。画像生成が目的なら、dGPU搭載モデルかeGPU（外付けGPU）接続を検討してほしい。

Q: Lunar LakeとNova Lakeのどちらを待つべき？
A: 今すぐローカルAIを始めたいならLunar Lake搭載機で十分。4B〜7Bクラスのモデルは実用的に動作しており、APIベースのAIツールは問題なく快適に使える。Nova Lakeは内蔵GPU性能の向上が見込めるものの、発売時期が不確定なため「待つコスト」も考慮が必要だ。半年以上待てるなら様子を見る価値はあるが、待っている間にAIを使い始めた方が得られるものは多い。

Q: Xe3とXe3Pの違いはユーザー視点で何が変わる？
A: Xe3はAI推論やゲームの描画演算を担うコアで、LLMの生成速度や3D性能に直結する。一方Xe3Pはメディアエンジン側で、AV1やH.266のハードウェアデコード対応に効いてくる。AI動画生成や4K配信の視聴・編集を行うユーザーほどXe3Pの恩恵が大きく、純粋にLLMを動かすだけならXe3コアのEU数とメモリ帯域の方が体感に影響しやすい。

Q: NPUとiGPUのどちらでLLMを動かすべき？
A: 現状はモデルとランタイム次第。Intel公式のOpenVINOやIPEX-LLMが対応するモデルならNPU実行で省電力かつ高効率になるが、llama.cppやollamaなどコミュニティ製の主流ツールはiGPU（Vulkan/SYCL経由）対応が先行している。NPUの汎用性が広がるまでは、ツール側の対応状況を確認しながら使い分けるのが現実的だ。

当サイトはAmazonアソシエイト・プログラムの参加者です。Amazonのアソシエイトとして、当サイトは適格販売により収入を得ています。

本記事は AIハードウェア図鑑編集部 が記載時点の情報をもとに執筆。製品アップデートや第三者ベンチマーク・価格・対応ランタイム等の変動で評価が変わる可能性がある。一定期間経過した内容は再検証を推奨する。