GPU・グラフィックボード vLLM v0.20.1リリース解説|DeepSeek V4安定化とFlashInfer/FP4変換の最適化 vLLM v0.20.1(2026年5月3日公開)を解説。DeepSeek V4ベースモデル対応、TopK=1024デッドロック修正、FlashInfer BF16/MXFP8通信とFP32→FP4変換の最適化を、PR番号と推奨アップグレード手順込みで整理。 2026.05.09 AIハードウェア図鑑 編集部 GPU・グラフィックボードローカルAI環境ローカルLLM