gpt-oss-120B on DGX Spark — 系列文章

~ / blog / series / gpt-oss-120B on DGX Spark

❯ ls ~/blog/series/gpt-oss-120b-on-dgx-spark

1 篇文章

#日期閱讀標題
12026-03-196m
[vLLM] 在 DGX Spark 上跑 120B 模型到 60 tok/s——零 API 成本、六個坑
怎麼讓 gpt-oss-120B 在 DGX Spark（GB10、SM121）上以 vLLM 跑到 60 tok/s。目標是讓 openclaw agent 用本地 120B 模型，零 API 費用。路上有六個坑，其中一個靜默失效的環境變數比其他五個加起來還難找。