検証環境｜実機ベンチマークのテスト構成と測定方法

当サイトのベンチマーク記事・検証記事で「当サイトの検証環境」「実測」と記載している数値は、すべて以下の実機で測定したものです。各記事では測定に使ったGPUと設定（num_ctxや量子化方式など）を都度添えていますが、構成の全体像と測定方法はこのページにまとめています。

テスト機の構成

GPU	VRAM	TDP	接続	搭載位置
RTX 5080	16GB GDDR7	360W	PCIe 5.0 x16	メイン
RTX 5060 Ti	16GB GDDR7	180W	Oculink PCIe 4.0 x4 (MINISFORUM DEG1)	Oculink外付け

CPU: Intel Core i7-14700F
メモリ: 96GB DDR5
ストレージ: 2TB x2 SSD
電源: メイン 850W ＋ Oculink専用 750W（2系統独立。RTX 5060 TiはOculink専用電源で駆動するため、2枚のTDPを単純合算した消費電力にはならない）

2枚目のRTX 5060 Tiは、MINISFORUM DEG1（Oculink）でPCIe 4.0 x4接続の外付けGPUとして運用しています。メインのPCIe 5.0 x16スロットにはRTX 5080を搭載しています。

撤去済みのGPUでも、在籍中に測定したベンチマークは実測データとして記事で引用しています。

ローカルLLMの速度・VRAM使用量は、結果がぶれないよう次の手順で計測しています。

複数のOllama serveが同時に動いているとVRAM配分が崩れるため、測定対象のGPU以外のserveは停止し、1つだけ起動した状態で計測する（RTX 5080は11435番、RTX 5060 Tiは11436番ポートで分離運用）
ollama psのPROCESSOR表示でモデルがGPUに100%常駐しているか（CPUオフロードが起きていないか）を確認する
nvidia-smiで各GPUのVRAM実使用量を確認する
num_ctx（コンテキスト長）と量子化方式は測定ごとに記録し、記事内に明記する。VRAMに載りきらずCPUオフロードが発生した場合は、その比率（ollama psのCPU/GPU表示）も記載する

速度（tokens/sec）やVRAM使用量は「高速」などの曖昧な表現でなく、実測した具体的な数値で記載しています。実機で測っていない品質・体感などの指標は、測定値と同じ強度では述べません。

各測定の条件（モデル名・量子化方式・num_ctx・使用GPU）は記事ごとに明記し、生のベンチマークログを保管しています。OllamaやGPUドライバのバージョンは更新で変わるため、速度の絶対値は測定時点のものとして扱ってください。