GPU・グラフィックボード RTX 5080でTTFTが速いLLM 8モデル実測|phi4-mini 1194msが最速、リアルタイム対話の選定基準 TTFTとは、ユーザー送信から最初のトークンが返るまでの時間である。チャットUIで「送信ボタンを押してから最初の文字が画面に出るまで」を短縮したいなら、見るべき指標はtok/sではなくTTFT (Time to First Token)。当... 2026.05.15 AIハードウェア図鑑 編集部 GPU・グラフィックボードローカルLLM