ROCm

GPU・グラフィックボード

vLLM v0.20.1リリース解説|DeepSeek V4安定化とFlashInfer/FP4変換の最適化

vLLM v0.20.1(2026年5月3日公開)を解説。DeepSeek V4ベースモデル対応、TopK=1024デッドロック修正、FlashInfer BF16/MXFP8通信とFP32→FP4変換の最適化を、PR番号と推奨アップグレード手順込みで整理。