Thunderbolt 5でローカルAIを外付け強化する選択肢

OWC Stack AIとは、Thunderbolt 5で接続するAIアクセラレータ兼ストレージハブである。

2026年のCOMPUTEX TAIPEI前後は、ローカルAI向けのハードウェアが相次いで姿を見せた。ゲーミングノートやワークステーション向け冷却の新製品が並ぶなか、外付け接続でローカルAIを底上げする製品としてOWCが「Stack AI」を発表しています。手元のPCがVRAM不足で大きいモデルを動かせない、という壁にぶつかった人にとって、外付けで「実効AIメモリ」を足すという切り口は気になるところ。ただし発表時点では価格も詳細スペックも公開されていません。分かっていることと、まだ分からないことを切り分けて整理します。

この記事の要点

・OWC Stack AIは既存PCのVRAMの壁を外付けで補う発想の製品。OWCが2026年5月21日に発表。対象はOWCが「select Windows/Linux」とする一部対応機種が先行し、Mac対応は将来予定
・「世界初のThunderbolt 5 AIアクセラレータ兼ストレージハブ」と訴求するが、価格・詳細スペック・実性能は未公開
・Thunderbolt 5の公称帯域は内蔵PCIe直結に大きく劣り、Oculinkとも近い水準。外付けはレイテンシとオーバーヘッドで不利になる点に注意

ローカルAIがぶつかる「VRAMの壁」とは
1. モデルサイズとVRAM容量の関係
外付けでAIメモリを拡張するという発想
1. eGPUとアクセラレータ、何が違うのか
OWC Stack AIとは何か
1. 発表時点で分かっていること・未公開のこと
Thunderbolt 5の帯域という現実
1. 内蔵直結・Oculink・Thunderbolt 5の帯域比較
ローカル保持とコストの論点
いま外付けAIアクセラレータをどう考えるか
まとめ
よくある質問
参考資料

ローカルAIがぶつかる「VRAMの壁」とは

ローカルでLLMや画像生成を動かすとき、最初に立ちはだかるのがGPUのVRAM容量です。モデルの重み（パラメータ）と推論中の中間データがVRAMに載りきらないと、そもそも起動しない、あるいはシステムメモリへあふれて極端に遅くなる。これがいわゆる「VRAMの壁」。GPU推論ではVRAM容量が大きな制約になり、VRAMの外へ退避が起きると速度や安定性が大きく悪化しやすくなります。

必要なVRAM量は、モデルのパラメータ数と量子化の度合いでおおよそ決まります。一般論として、7B（70億パラメータ）クラスのモデルを4bit前後に量子化すれば、6〜8GB程度のVRAMで動く構成が現実的。13B級になると10GB前後、量子化を弱めれば要求はさらに増えます。量子化を軽くするほど品質は保たれますが、その分VRAMを食う。このトレードオフが、ローカルAIで最初に悩むポイントです。

壁の手前と向こうでは、体感が大きく変わります。VRAMに収まっているうちは高速ですが、容量を超えた瞬間に推論速度が桁違いに落ちる。当サイトの検証環境（RTX 5080 16GB + RTX 5060 Ti 16GB / i7-14700F / RAM 96GB）でも、16GBのVRAMに収まるモデルと、容量ギリギリまで埋めるモデルでは挙動がはっきり分かれました。

モデルサイズとVRAM容量の関係

当サイトの検証環境のうちRTX 5080（VRAM 16GB）で計測したデータでは、大きいモデルほどVRAM使用量が増え、同時に速度が下がる例が見られました（容量と速度の相関であり、容量だけが原因と確定するものではありません）。7〜8B級のLlama 3.1 8B（Ollama: llama3.1:8b）はVRAM 5.5GBで139 tokens/sec、mistral:7bは5.1GBで153 tokens/secと快適（いずれもollama psで100% GPU常駐を確認）。一方、26B級のgemma4:26b（約20GB）は16GBに収まりきらず、VRAM 15.2GB＋残り約24%をCPUにオフロードして31 tokens/sec。Qwen3.5 35B-A3B（Ollama: qwen3.5:35b-a3b、MoE型・約27GB）はVRAM 14.7GB＋約45%をCPUにオフロードして18 tokens/sec。16GBの容量を超えると上記のようにCPUオフロードが入り、速度が大きく削られます。
測定条件: RTX 5080単体（CUDA_VISIBLE_DEVICES=0で5060 Tiを除外）、Ollama 0.23.3／NVIDIAドライバ610.47／Windows、num_ctx=4096・num_predict=200・temperature=0・seed=42、各3回の中央値。VRAMはollama /api/psのsize_vram、CPUオフロード率はollama psのPROCESSOR表示で確認。出力品質は本記事では未評価です。

ここで多くの人が選択を迫られます。クラウドAPIに従量課金で投げ続けるか、ローカルで動かすために上位GPUへ買い替えるか。OWCの発表では、この二択そのものに疑問を投げかけています。

OWCは発表で、多くの組織が「機密データを社外に送ってクラウドAIの費用を払い続ける」か「ローカルでAIを動かそうとして手持ちのハードウェアでは処理しきれない」かの狭間で立ち往生している、と説明しています（OWC公式発表 2026-05-21、筆者要約）。

クラウドと買い替えの間に、第三の選択肢を置こうとするのが外付けアクセラレータという発想です。

外付けでAIメモリを拡張するという発想

GPUやVRAMを外から足すアプローチ自体は、新しいものではありません。eGPU（外付けGPU）は以前から存在し、ノートPCにデスクトップ向けGPUを接続して描画やAI推論を任せる使い方が実用段階にあります。内蔵スロットの空きがない、あるいは持ち運ぶ本体は薄く保ちたい、という事情に応える手段です。

当サイトでもOculink接続のドック（MINISFORUM DEG1）を介し、外付けGPUでローカルAI推論を継続的に運用してきました。外付けでGPUを足すという発想は、すでに日常的に回せる段階にあるというのが実運用での実感です。SFF-8612（Oculink）はPCIe信号を外部へ引き出すケーブル方式で、変換のオーバーヘッドが小さい点が強み。ただし実際のPCIe世代・レーン数・速度は製品実装に依存し、PCIe 4.0 x4実装であれば外付けでも内蔵に近い帯域を保ちやすい構造です。

OWC Stack AIが掲げるのは、この発想にもう一歩踏み込んだ「実効AIワーキングメモリの拡張」という切り口。物理的にVRAMを増設するわけではなく、高速ストレージを介してGPUが扱える作業メモリ側を広げるという位置づけです。GPUそのものを外付けするというより、既存PCが扱えるAIの作業メモリを増やし、オンボードのGPUメモリだけでは載らない大きいモデルをローカルで動かせるようにする、という訴求です（いずれもOWCの主張）。ストレージハブを兼ねる点も、従来のeGPUドックとは性格が異なります。

eGPUとアクセラレータ、何が違うのか

eGPUは「外付けの汎用GPU」で、描画もAIも担える代わりに、接続規格の帯域がボトルネックになりやすい。対して一般にAIアクセラレータは、AI推論という用途に絞ってメモリやデータ供給を最適化する方向の製品群です。ただしStack AI内部のアクセラレータ仕様は未公開で、OWCが明示しているのはAIアクセラレータとアップグレード可能なストレージ、下流のThunderbolt 5／USBポートを統合する構想まで。一般論とStack AIの確定事実は分けて捉える必要があります。

外付けでVRAMの壁を越えたいだけなら、既存のeGPU+Oculinkで足りるケースも多い。Stack AIの価値はストレージ統合や手軽さに出るかどうかで、その判断は価格と実測ベンチが公開されてからになります。

統合の利点は構成のシンプルさですが、AI推論の速度を最終的に左右するのは、外付け筐体とホストPCをつなぐ接続規格の帯域とレイテンシです。ここがStack AIを評価するうえで最も重要な論点になります。

OWC Stack AIとは何か

発表内容を、事実として確認できる範囲で整理します。OWC（Other World Computing）が2026年5月21日に、「世界初のThunderbolt 5 AIアクセラレータ兼ストレージハブ」としてStack AIを発表しました（OWC公式発表）。対象はOWC発表で「select Windows and Linux PCs and laptops」（一部の対応機種）とされ、Mac対応は将来のリリースで予定。Thunderbolt 5自体にもOS要件があるため、実際の対応機種・OS条件は製品仕様の公開後に確認が必要です。初公開のデモはCOMPUTEX TAIPEIのOWCブース（R1002、4F、Nangang Hall 2）で行われる、という告知でした。

製品の狙いとしてOWCが挙げているのは三点。既存PCが使える実効AIメモリを広げて、オンボードGPUメモリでは載らない大きいモデルをローカルで動かせるようにすること。クラウドAIの継続費用を抑えること。機密データを社外に出さずローカルに保つこと。いずれも「OWCがそう訴求している」という帰属付きで読むのが正確です。

外付けアクセラレータやeGPUを、PCの動作中に予告なく取り外すと、処理中のデータやストレージ上のファイルが破損する場合があります。モデルのロード中・推論中・ストレージへの書き込み中は取り外しを避け、OSの取り外し手順を経てから接続を解除してください。

発表時点で分かっていること・未公開のこと

分かっているのは、製品名・接続規格（Thunderbolt 5）・製品種別（AIアクセラレータ＋ストレージハブ）・対応OSの先行範囲・発表日・デモ場所、そして発売時期まで。発売時期は公式製品ページが「Coming Early Q4」、OWC発表が「later this year（年内）」と案内しています（2026-06-05確認）。一方で、価格、搭載するアクセラレータの詳細スペック、ストレージ容量の構成、そして肝心の実性能（どのモデルがどれだけの速度で動くか）は、本記事執筆時点で公開されていません。

未公開の部分を推測で埋めるのは避けるべきところ。とくに「Thunderbolt 5接続で大きいモデルをローカルで高速に動かせる」という訴求は、接続規格の帯域という物理的な制約と照らして冷静に見る必要があります。次の章で、公開されている規格仕様だけを使ってその制約を確認します。

Thunderbolt 5の帯域という現実

Thunderbolt 5のリンク帯域は双方向で80Gbps、特定方向に寄せる「Bandwidth Boost」では送信120Gbps／受信40Gbpsに再配分できます（主に高解像度ディスプレイ向け）。ただしGPUやアクセラレータに効くのは、このリンク帯域の全部ではなく、その中をPCIe信号として通せる帯域です。Intelの仕様では、Thunderbolt 5のPCIeトンネリング帯域はPCIe 4.0 x4相当の64Gbps（約8GB/s）。内蔵スロットがGPUへ供給するPCIe帯域と比べると、ここに無視できない差があります。

PCIeデータ帯域の64Gbpsをバイト換算すると約8GB/s。対してPCIe 5.0 x16直結は約64GB/s、1世代前のPCIe 4.0 x16でも約32GB/s（PCI-SIG公式仕様）。内蔵GPUがフルレーンで受け取る帯域に対し、Thunderbolt 5のPCIeデータ帯域は一桁近く狭い計算になります。さらにThunderboltはPCIe信号をプロトコル変換して通すため、変換に伴うオーバーヘッドとレイテンシが上乗せされる。生のGbps値が示すよりも、実効スループットは下がるのが構造上の前提です。

外付けでGPUを引き出すもう一つの方式であるOculink（SFF-8612）と比べても、立ち位置が見えてきます。Oculinkも一般にPCIe 4.0 x4構成で約8GB/s（約64Gbps）。つまりPCIeデータ帯域で見ると、Thunderbolt 5の64GbpsとOculinkの64Gbpsはほぼ同等です。ただしOculinkはPCIe信号をほぼそのまま延長する方式で、プロトコル変換のオーバーヘッドが小さく、レイテンシ面でも素直。同じPCIe 4.0 x4でも、変換を挟むThunderbolt 5のほうが実効では不利になりやすい構造です（Oculink製品の実際の世代・レーン数・安定性はホスト・ドック・ケーブルに依存します）。

内蔵直結・Oculink・Thunderbolt 5の帯域比較

公開されている仕様値を並べると、それぞれの位置関係がはっきりします。

接続方式	公称帯域	バイト換算（目安）	特徴
内蔵 PCIe 5.0 x16 直結	—	約64GB/s	GPU本来の帯域。最速
内蔵 PCIe 4.0 x16 直結	—	約32GB/s	1世代前でも十分広い
Oculink（PCIe 4.0 x4）	約64Gbps	約8GB/s	PCIe信号を素直に延長、変換負荷が小さい
Thunderbolt 5（PCIe 4.0 x4トンネリング）	リンク80Gbps／PCIeデータ64Gbps	約8GB/s	120Gbps Boostは主に表示用途。PCIe変換のオーバーヘッドとレイテンシが上乗せ

帯域はあくまで仕様値であり、Stack AIの実性能は未実測のため断定できません。重要なのは、Thunderbolt 5は便利な汎用接続である一方、AI推論のためのデータ供給という観点では内蔵直結に大きく劣ります。表が示すとおり、外付けで「VRAMの壁を越える」訴求と、接続帯域というボトルネックは、トレードオフの関係にあります。モデルの重みを一度ロードしてしまえば毎フレーム大量のデータをやり取りするわけではないため、帯域の影響は用途によって変わる点も付け加えておきます。ここが、製品の実測値が公開されてから検証すべき焦点です。

ローカル保持とコストの論点

OWCがStack AIで強く打ち出しているのが、機密データのオンプレ保持とクラウド従量課金からの脱却です。クラウドAIに問い合わせるたびトークン費用がかさむ運用に対し、ローカルで完結させれば費用を抑えつつデータを手元に置ける、という主張。組織にとっては魅力的な訴求でしょう。

ただし「ローカルで動かす＝データが外部に一切出ない」とは無条件に言い切れません。ローカルで推論するモデル単体で完結している場合はデータが外部の推論APIへ送られませんが、外部のモデルに接続する機能やWeb検索機能を併用すれば、その経路ではデータが外へ出ます。プライバシーやセキュリティの担保は、ローカルモデルに限定し、外部接続機能を無効化し、認証・アクセス制御・ログ設計を整えてはじめて成立する条件付きの話。製品を置けば自動的に機密が守られる、という理解は正確ではありません。

コスト面も同様に、単純な比較にはなりません。クラウド従量課金は使うほど積み上がる一方、外付けアクセラレータは初期導入額が先にかかる構造。どちらが有利かは、利用頻度・モデルの規模・運用期間に左右されます。Stack AIは価格が未公開のため、具体的な損益分岐を出すことは現時点では不可能です。「導入額対継続課金」という一般的なトレードオフとして捉え、価格公開を待って試算するのが妥当なところ。

いま外付けAIアクセラレータをどう考えるか

未発売・未実測という前提に立つと、読者がいま取れる判断は限られます。それでも、ご自身の用途に当てはめて考える材料は揃っています。

すでにOculink+eGPUで運用できている人なら、VRAMの壁を越える目的そのものは現行の手段で達成可能です。Oculinkは変換負荷が小さく、外付けでも内蔵に近い帯域を保ちやすい。この構成で速度に満足しているなら、Stack AIへ乗り換える必然性は薄いでしょう。

一方で、ストレージとアクセラレータをひとつの筐体にまとめたい、配線や構成をできるだけ単純にしたい、というニーズには新しい価値が出る可能性があります。ノートPC中心で内蔵スロットを持たない環境や、複数の機材を持ち運ぶ運用では、統合された外付けの手軽さが効くかもしれません。ここは価格と実測ベンチが公開されてから判断する領域です。Thunderbolt 5接続の外付けハードウェアという観点では、AIノートPCの冷却や接続性を扱ったHonor WIN H9のローカルAI実行ガイドも、外付けでローカルAIを強化する文脈の参考になります。

煽らず淡々と結論を置くなら、現時点では「分かること」を確認し、「分からないこと」が公開されるのを待つ段階。発表は一つの選択肢が増える兆しであって、買い時のシグナルではありません。

製品名	OWC Stack AI
接続規格	Thunderbolt 5
種別	AIアクセラレータ＋ストレージハブ
対応OS	一部のWindows/Linux機（OWC表記「select」）先行、Mac対応は将来予定
発表	2026年5月21日、OWC（Other World Computing）
発売時期	公式製品ページ「Coming Early Q4」／発表「later this year」（2026-06-05確認）
価格・詳細スペック	未公開（2026-06-05時点）

まとめ

ローカルAIのVRAMの壁は、モデルの規模が容量を超えた瞬間に速度が桁違いに落ちるという、構造的な制約です。当サイトの検証環境（RTX 5080 16GB）でも、16GBの天井に貼り付くモデルは大きく速度を削られました。外付けアクセラレータはこの壁を越える一手として現実味がありますが、万能ではありません。

判断の順序を整理すると、まずご自身の用途で必要なVRAM量を把握し、次にすでにOculink+eGPUで足りていないかを確認する。そのうえでStack AIを検討するなら、Thunderbolt 5の帯域が内蔵直結に大きく劣りプロトコル変換のオーバーヘッドが乗ること、ローカル保持はモデルと構成を限定してはじめて成立する条件付きであること、価格・詳細スペック・実性能が未公開であることを踏まえてください。これらの条件を外して「外付けで全部解決」と捉えるのは早計です。最も確実なのは、価格と実測ベンチが公開されてからご自身の用途に当てはめて判断すること。それまでは選択肢が一つ増えたと捉えておけば十分でしょう。

よくある質問

Q. OWC Stack AIの価格はいくらですか？

本記事執筆時点では未公開です。OWCの2026年5月21日の発表には製品名・接続規格・種別・対応OSの先行範囲が含まれますが、価格と詳細スペック、実性能は公開されていません。具体的な費用対効果を試算するには、価格公開を待つ必要があります。

Q. Thunderbolt 5接続だと内蔵GPUより遅くなりますか？

Thunderbolt 5のリンク帯域は80Gbpsですが、GPU／アクセラレータに効くPCIeデータ帯域はPCIe 4.0 x4相当の64Gbps（約8GB/s）で、内蔵PCIe 5.0 x16直結の約64GB/sに大きく劣ります。さらにプロトコル変換のオーバーヘッドとレイテンシが加わります。ただしモデルを一度ロードした後のデータ転送量は用途で変わるため、実際の速度差は製品の実測ベンチが出てからの確認になります。

Q. 既存のOculink eGPUと何が違いますか？

Oculink（SFF-8612）はPCIe信号をほぼそのまま延長する方式で、変換負荷が小さく外付けでも帯域を保ちやすいのが特徴です。OWC Stack AIはThunderbolt 5接続でアクセラレータとストレージハブを統合する構成を狙っており、配線の単純さや統合性に価値が出る可能性があります。すでにOculink+eGPUで速度に満足しているなら、乗り換える必然性は薄いでしょう。

Q. ローカルで動かせば機密データは本当に外部に出ませんか？

ローカルのモデル単体で完結している場合は外部の推論APIへデータを送りません。ただし外部モデルへの接続機能やWeb検索機能を使えば、その経路でデータは外に出ます。プライバシー確保はローカルモデルに限定し、外部接続を無効化し、認証やアクセス制御を整えた構成が前提です。製品を置くだけで自動的に守られるわけではありません。