Llama 3.1 8B

🔧 Tool Use ★ Popular

Meta · 8B · Dense

Meta 通用 8B 模型 — 质量与速度的完美平衡，日常任务首选

HuggingFace Ollama

7.3M downloads 5.5K likes 1yr ago 128K tokens

使用场景

chat code reasoning

硬件评估

VRAM — —

速度 —

基于 Q4_K_M

量化选项

量化	位数	VRAM	质量	状态
Q2_K	2	2.6 GB	低	—
Q3_K_M	3	3.6 GB	中等	—
Q4_K_M ★	4	4.1 GB	良好	—
Q5_K_M	5	5.1 GB	良好	—
Q6_K	6	6.1 GB	优秀	—
Q8_0	8	8.2 GB	优秀	—
F16	16	16.4 GB	无损	—

你的硬件

显卡

VRAM

带宽

Q4_K_M 基准评分

检测中...

安装

ollama run llama3.1:8b

从 HuggingFace 下载 GGUF

规格

参数量: 8B
架构: Dense
工具调用: 支持
上下文: 128K tokens
最低内存: 4.5 GB
推荐内存: 7.5 GB
系列: Llama
发布时间: 2024-07

HuggingFace Stats

Downloads: 7.3M
Likes: 5.5K