返回

TinyLlama 1.1B

Community · 1.1B · Dense

社区超轻量 1.1B — 极度受限设备的最后选择

1.9M downloads 1.5K likes 2yr ago 2K tokens
使用场景
chat edge
硬件评估
VRAM
速度
基于 Q4_K_M

量化选项

量化 位数 VRAM 质量 状态
Q2_K 2 0.5 GB
Q3_K_M 3 0.5 GB 中等
Q4_K_M 4 0.6 GB 良好
Q5_K_M 5 0.7 GB 良好
Q6_K 6 0.8 GB 优秀
Q8_0 8 1.1 GB 优秀
F16 16 2.3 GB 无损

你的硬件

Q4_K_M 基准评分
检测中...

安装

ollama run tinyllama
从 HuggingFace 下载 GGUF

规格

参数量
1.1B
架构
Dense
工具调用
不支持
上下文
2K tokens
最低内存
1 GB
推荐内存
2 GB
系列
Llama
发布时间
2024-01

HuggingFace Stats

Downloads
1.9M
Likes
1.5K