#benchmark — 技術筆記

~ / blog / tag / benchmark

❯ grep -r "#benchmark" ~/blog

27 篇文章

日期閱讀標題
2026-06-1114m
[Benchmark] Qwen3.5-122B 在 DGX Spark 加速 100%!
#qwen3.5 #dgx-spark #gb10 #gdn
2026-06-0910m
[趣味競賽] GTX 970 跑 Gemma 4 E2B：最大的量化檔反而最快（47.6 tok/s）
#gemma-4 #quantization #gtx-970 #llama.cpp
2026-06-058m
[Benchmark] NVFP4 量化砍繁中比砍英文兇兩倍：gemma-4-12B 實測
#dgx-spark #gb10 #gemma-4 #nvfp4
2026-06-046m
[Benchmark] Gemma 4 12B omni 上 DGX Spark:weight-only NVFP4 贏 W4A4,還保住多模態
#dgx-spark #gb10 #gemma-4 #nvfp4
2026-06-018m
[Benchmark] NVFP4 把影片模型砍小三分之一,速度卻一點沒快——因為 diffusion 是 compute-bound
#nvfp4 #sulphur-2 #ltx-2.3 #dgx-spark
2026-06-019m
[Benchmark] NVFP4 W4A4 在 DGX Spark 上超車 FP8:拔掉 enforce-eager,MoE 從 23 衝到 67 tok/s
#nvfp4 #w4a4 #fp8 #dgx-spark
2026-05-308m
[Benchmark] NVFP4 在 DGX Spark 比 FP8 快 1.5 倍——但贏在壓縮，不是那顆 FP4 運算單元
#nvfp4 #fp8 #dgx-spark #gb10
2026-05-219m
Round 2 EAGLE-3 retrain 沒打破天花板 — 60 小時訓練的 null result + 教訓
#gemma-4 #abliteration #eagle-3 #speculative-decoding
2026-05-1612m
Fine-tune EAGLE-3 drafter 在 abliterated Gemma 4 上 — Round 1 拉平 acceptance 曲線(+ 一個 measurement lesson)
#gemma-4 #abliteration #eagle-3 #speculative-decoding
2026-05-0913m
想用 MTP 加速 abliterated Gemma 4?vanilla draft 對不上被改過的 body
#gemma-4 #abliteration #mtp #speculative-decoding
2026-05-0611m
火箭起飛:Gemma 4 在 DGX Spark 跑出 670 tok/s 總吞吐(單流 108 tok/s)
#gemma-4 #mtp #speculative-decoding #vllm
2026-05-0414m
[實戰] Z-Image Turbo 教戰守則:換配置會崩品質嗎?LPIPS + CLIPScore 雙軸驗證
#z-image #comfyui #nvfp4 #fp8
2026-05-0411m
[實戰] Z-Image Turbo 教戰守則:6 種配置怎麼選,1.37× 加速 + 44% 省 RAM
#z-image #comfyui #nvfp4 #fp8
2026-05-0113m
[vLLM] DGX Spark 跑 Nemotron 3 Nano NVFP4：74.75 tok/s，比公開值快 11.5%
#nemotron-3 #nvfp4 #vllm #dgx-spark
2026-04-256m
[Benchmark] 繁中 LLM 實測：Qwen 3.6 35B 在 TMMLU+ 51 個子科目全勝 Gemma 4 26B
#tmmlu+#繁體中文 #qwen-3.6 #gemma-4
2026-04-217m
[Benchmark] NVFP4 在 GB10 上是陷阱：FP8 快 32%（vLLM + SGLang 雙引擎實測）
#nvfp4 #fp8 #dgx-spark #gb10
2026-04-206m
[Benchmark] 同 Scaffold、三個模型：SWE-bench Lite 16% → 38% → 48%
#swe-bench #gemma-4 #qwen-3.6 #scaffold
2026-04-1711m
[Benchmark] 26B 地端模型在 SWE-bench Lite 拿到 38.67% — 差 Claude 3.5 Sonnet 系統 0.33%
#swe-bench #gemma-4 #mini-swe-agent #vllm
2026-04-136m
[Benchmark] Gemma 4 全家桶 on DGX Spark — 哪個版本適合你？
#gemma-4 #dgx-spark #gb10 #benchmark
2026-04-088m
[Benchmark] 4 台機器、4 個模型、1 個答案：記憶體決定一切
#gemma-4 #rtx-5090 #dgx-spark #gb10
2026-04-077m
[Benchmark] Gemma 4 E2B vs E4B：三台機器實測，記憶體頻寬決定一切
#gemma-4 #e2b #e4b #ollama
2026-04-055m
[Benchmark] Gemma 4 31B Dense 跑在 DGX Spark：7 tok/s 和頻寬之牆
#gemma-4 #nvfp4 #vllm #dgx-spark
2026-04-056m
[Benchmark] 同模型 vLLM vs Ollama：為什麼 GB10 上差 30%
#vllm #ollama #benchmark #dgx-spark
2026-04-057m
[vLLM] Gemma 4 26B-A4B NVFP4 跑在 DGX Spark：52 tok/s，模型只佔 16 GB
#gemma-4 #nvfp4 #vllm #dgx-spark
2026-03-308m
[Benchmark] TurboQuant 實測：KV Cache 3-bit 壓縮，真的零損失？
#turboquant #kv-cache #quantization #vllm
2026-03-018m
[Benchmark] 純 MoE vs SSM Hybrid：Context Decay 與為什麼 Agent 要在乎
#benchmark #ssm #moe #dgx-spark
2026-02-1910m
[Benchmark] DGX Spark 跑 8 個模型：找出最適合 AI Agent 的組合
#dgx-spark #gb10 #ollama #benchmark

← 回到所有文章