~/ai-muninn
blog
github
EN
~ / blog
/
tag / benchmark
❯
grep -r "#benchmark" ~/blog
8 篇文章
日期
閱讀
標題
2026-04-08
6m
[Benchmark] 4 台機器、4 個模型、1 個答案:記憶體決定一切
#gemma-4
#rtx-5090
#dgx-spark
#gb10
2026-04-07
5m
[Benchmark] Gemma 4 E2B vs E4B:三台機器實測,記憶體頻寬決定一切
#gemma-4
#e2b
#e4b
#ollama
2026-04-05
5m
[vLLM] Gemma 4 26B-A4B NVFP4 跑在 DGX Spark:52 tok/s,模型只佔 16 GB
#gemma-4
#nvfp4
#vllm
#dgx-spark
2026-04-05
3m
[Benchmark] Gemma 4 31B Dense 跑在 DGX Spark:7 tok/s 和頻寬之牆
#gemma-4
#nvfp4
#vllm
#dgx-spark
2026-04-05
4m
[Benchmark] 同模型 vLLM vs Ollama:為什麼 GB10 上差 30%
#vllm
#ollama
#benchmark
#dgx-spark
2026-03-30
4m
[Benchmark] TurboQuant 實測:KV Cache 3-bit 壓縮,真的零損失?
#turboquant
#kv-cache
#quantization
#vllm
2026-03-01
4m
[Benchmark] 純 MoE vs SSM Hybrid:Context Decay 與為什麼 Agent 要在乎
#benchmark
#ssm
#moe
#dgx-spark
2026-02-19
4m
[Benchmark] DGX Spark 跑 8 個模型:找出最適合 AI Agent 的組合
#dgx-spark
#gb10
#ollama
#benchmark
← 回到所有文章