返回

Nemotron 3 Nano 30B

NVIDIA · 30B · MoE

NVIDIA MoE 30B — 百万 token 超长上下文,激活仅 3B 超省内存

1.0M downloads 655 likes 9mo ago 1.024M tokens
使用场景
chat reasoning
硬件评估
VRAM
速度
基于 Q4_K_M

量化选项

量化 位数 VRAM 质量 状态
Q2_K 2 9.6 GB
Q3_K_M 3 13.4 GB 中等
Q4_K_M 4 15.4 GB 良好
Q5_K_M 5 19.2 GB 良好
Q6_K 6 23.1 GB 优秀
Q8_0 8 30.7 GB 优秀
F16 16 61.5 GB 无损

你的硬件

Q4_K_M 基准评分
检测中...

安装

ollama run nemotron-3-nano:30b
从 HuggingFace 下载 GGUF

规格

参数量
30B
架构
MoE
工具调用
不支持
上下文
1.024M tokens
最低内存
16.8 GB
推荐内存
27.9 GB
系列
Nemotron
发布时间
2025-06

HuggingFace Stats

Downloads
1.0M
Likes
655