~/ai-muninn
blog
github
EN
~ / blog
/
tag / turboquant
❯
grep -r "#turboquant" ~/blog
3 篇文章
日期
閱讀
標題
2026-04-15
5m
[LLM 深水區] 量化演算法在做什麼?從 Q4_K_M 到 TurboQuant 的三層拆解
#llm
#量化
#quantization
#k-quant
2026-04-08
5m
[Benchmark] 拯救 Gemma 4 31B:在 32GB MacBook Pro 上從 1.5 加速到 12.8 tok/s
#gemma-4
#31b
#m1-max
#ollama
2026-03-30
4m
[Benchmark] TurboQuant 實測:KV Cache 3-bit 壓縮,真的零損失?
#turboquant
#kv-cache
#quantization
#vllm
← 回到所有文章