返回

Llama 3.1 8B

🔧 Tool Use ★ Popular

Meta · 8B · Dense

Meta 通用 8B 模型 — 质量与速度的完美平衡,日常任务首选

7.3M downloads 5.5K likes 1yr ago 128K tokens
使用场景
chat code reasoning
硬件评估
VRAM
速度
基于 Q4_K_M

量化选项

量化 位数 VRAM 质量 状态
Q2_K 2 2.6 GB
Q3_K_M 3 3.6 GB 中等
Q4_K_M 4 4.1 GB 良好
Q5_K_M 5 5.1 GB 良好
Q6_K 6 6.1 GB 优秀
Q8_0 8 8.2 GB 优秀
F16 16 16.4 GB 无损

你的硬件

Q4_K_M 基准评分
检测中...

安装

ollama run llama3.1:8b
从 HuggingFace 下载 GGUF

规格

参数量
8B
架构
Dense
工具调用
支持
上下文
128K tokens
最低内存
4.5 GB
推荐内存
7.5 GB
系列
Llama
发布时间
2024-07

HuggingFace Stats

Downloads
7.3M
Likes
5.5K