Qwen3.5-397B-A17B-FP8 完整 Benchmark 总结
Qwen3.5-397B-A17B-FP8 完整 Benchmark 总结一、部署配置项目值模型Qwen3.5-397B-A17B-FP8架构MoE(512 experts, 10/token, 60 层, 48 linear + 12 full attn)量化FP8上下文256K(默认),优化后限 65K硬件4×H100 8卡(32 GPU total)TP8(单节点 8 卡一个 TP 组)

相关新闻