当サイトのベンチマーク記事・検証記事で「当サイトの検証環境」「実測」と記載している数値は、すべて以下の実機で測定したものです。各記事では測定に使ったGPUと設定(num_ctxや量子化方式など)を都度添えていますが、構成の全体像と測定方法はこのページにまとめています。
テスト機の構成
| GPU | VRAM | TDP | 接続 | 搭載位置 |
|---|---|---|---|---|
| RTX 5080 | 16GB GDDR7 | 360W | PCIe 5.0 x16 | メイン |
| RTX 5060 Ti | 16GB GDDR7 | 180W | Oculink PCIe 4.0 x4 (MINISFORUM DEG1) | Oculink外付け |
- CPU: Intel Core i7-14700F
- メモリ: 96GB DDR5
- ストレージ: 2TB x2 SSD
- 電源: メイン 850W + Oculink専用 750W(2系統独立。RTX 5060 TiはOculink専用電源で駆動するため、2枚のTDPを単純合算した消費電力にはならない)
2枚目のRTX 5060 Tiは、MINISFORUM DEG1(Oculink)でPCIe 4.0 x4接続の外付けGPUとして運用しています。メインのPCIe 5.0 x16スロットにはRTX 5080を搭載しています。
過去のテスト機材
撤去済みのGPUでも、在籍中に測定したベンチマークは実測データとして記事で引用しています。
- RTX 4070 Super(12GB GDDR6X, TDP 220W, Oculink接続。2026-04-12まで使用)
測定方法
ローカルLLMの速度・VRAM使用量は、結果がぶれないよう次の手順で計測しています。
- 複数のOllama serveが同時に動いているとVRAM配分が崩れるため、測定対象のGPU以外のserveは停止し、1つだけ起動した状態で計測する(RTX 5080は11435番、RTX 5060 Tiは11436番ポートで分離運用)
ollama psのPROCESSOR表示でモデルがGPUに100%常駐しているか(CPUオフロードが起きていないか)を確認するnvidia-smiで各GPUのVRAM実使用量を確認する- num_ctx(コンテキスト長)と量子化方式は測定ごとに記録し、記事内に明記する。VRAMに載りきらずCPUオフロードが発生した場合は、その比率(ollama psのCPU/GPU表示)も記載する
速度(tokens/sec)やVRAM使用量は「高速」などの曖昧な表現でなく、実測した具体的な数値で記載しています。実機で測っていない品質・体感などの指標は、測定値と同じ強度では述べません。
各測定の条件(モデル名・量子化方式・num_ctx・使用GPU)は記事ごとに明記し、生のベンチマークログを保管しています。OllamaやGPUドライバのバージョンは更新で変わるため、速度の絶対値は測定時点のものとして扱ってください。