Llama 4(Scout & Maverick)
在 Clore.ai GPU 上运行 Meta 的 Llama 4 Scout 与 Maverick MoE 模型
主要特性
1024x1024
A100
总参数
激活参数
专家数
上下文
最小显存(Q4)
最小显存(FP16)
要求
组件
Scout(Q4)
Scout(FP16)
Maverick(Q4)
使用 Ollama 快速入门
使用 Ollama 作为 API 服务器
vLLM 设置(用于生产)
查询 vLLM 服务器
HuggingFace Transformers
Docker 快速开始
为什么 MoE 在 Clore.ai 上很重要
给 Clore.ai 用户的提示
# 使用固定种子以获得一致结果
问题
解决方案
延伸阅读
最后更新于
这有帮助吗?