#moe — 技術筆記 — ai-muninn

~ / blog / tag / moe

❯ grep -r "#moe" ~/blog

7 篇文章

日期閱讀標題
2026-06-019m
[Benchmark] NVFP4 W4A4 在 DGX Spark 上超車 FP8:拔掉 enforce-eager,MoE 從 23 衝到 67 tok/s
#nvfp4 #w4a4 #fp8 #dgx-spark
2026-05-0113m
[vLLM] DGX Spark 跑 Nemotron 3 Nano NVFP4：74.75 tok/s，比公開值快 11.5%
#nemotron-3 #nvfp4 #vllm #dgx-spark
2026-04-2814m
[llm-compressor] 自量化 abliterated 35B FP8 on DGX Spark：4 次 OOM、3 個 prefix bug、最終 51 tok/s
#dgx-spark #gb10 #sm121 #llm-compressor
2026-04-136m
[Benchmark] Gemma 4 全家桶 on DGX Spark — 哪個版本適合你？
#gemma-4 #dgx-spark #gb10 #benchmark
2026-04-088m
[LLM 101 #2] Dense、MoE、PLE、SSM — 四種 AI 模型架構，一次搞懂
#dense #moe #ple #ssm
2026-04-057m
[vLLM] Gemma 4 26B-A4B NVFP4 跑在 DGX Spark：52 tok/s，模型只佔 16 GB
#gemma-4 #nvfp4 #vllm #dgx-spark
2026-03-018m
[Benchmark] 純 MoE vs SSM Hybrid：Context Decay 與為什麼 Agent 要在乎
#benchmark #ssm #moe #dgx-spark

← 回到所有文章