~/ai-muninn
blog
github
EN
~ / blog
/
tag / llm-compressor
❯
grep -r "#llm-compressor" ~/blog
2 篇文章
日期
閱讀
標題
2026-04-28
9m
[llm-compressor] 自量化 abliterated 35B FP8 on DGX Spark:4 次 OOM、3 個 prefix bug、最終 51 tok/s
#dgx-spark
#gb10
#sm121
#llm-compressor
2026-04-07
6m
[Benchmark] 從 19 到 50 tok/s:我們搶先做了全球首個 Gemma 4 E4B NVFP4 量化
#gemma-4
#e4b
#nvfp4
#fp8
← 回到所有文章