概览
在 CLORE.AI GPU 上运行大型语言模型 (LLM) 以用于推理和聊天应用。
热门工具
工具
用例
难度
模型指南
最新与最佳模型
模型
参数
最适合用于
专用模型
模型
参数
最适合用于
高效模型
模型
参数
最适合用于
GPU 推荐
模型大小
最低 GPU 要求
推荐
7B (Q4)
RTX 3060 12GB
RTX 3090
13B (Q4)
RTX 3090 24GB
RTX 4090
34B (Q4)
2x RTX 3090
A100 40GB
70B (Q4)
A100 80GB
2x A100
量化指南
格式
显存使用
质量
速度
Q2_K
最低
较差
最快
Q4_K_M
低
良好
快
Q5_K_M
中等
很好
中等
Q8_0
高
优秀
较慢
FP16
最高
最佳
最慢
另请参见
最后更新于
这有帮助吗?