~ / blog / series / gpt-oss-120B on DGX Spark
❯ ls ~/blog/series/gpt-oss-120b-on-dgx-spark
1 篇文章
- #日期標題
- 12026-03-19[vLLM] 在 DGX Spark 上跑 120B 模型到 60 tok/s——零 API 成本、六個坑
怎麼讓 gpt-oss-120B 在 DGX Spark(GB10、SM121)上以 vLLM 跑到 60 tok/s。目標是讓 openclaw agent 用本地 120B 模型,零 API 費用。路上有六個坑,其中一個靜默失效的環境變數比其他五個加起來還難找。