~ / blog / series / Qwen3.5-122B on DGX Spark
❯ ls ~/blog/series/qwen3.5-122b-on-dgx-spark
1 篇文章
- #日期標題
- 12026-03-19[vLLM] Qwen3.5-122B 跑起來了。但只有 14 tok/s。
修完四個 SM121 NVFP4 bug 之後,Qwen3.5-122B 能跑、輸出正確。然後你看了速度:14 tok/s。沒有 flag 能修它。為什麼——以及在等什麼。
~ / blog / series / Qwen3.5-122B on DGX Spark
❯ ls ~/blog/series/qwen3.5-122b-on-dgx-spark
1 篇文章
修完四個 SM121 NVFP4 bug 之後,Qwen3.5-122B 能跑、輸出正確。然後你看了速度:14 tok/s。沒有 flag 能修它。為什麼——以及在等什麼。