# 语言模型

- [概览](/guides/guides_v2-zh/yu-yan-mo-xing/language-models.md)
- [Ollama](/guides/guides_v2-zh/yu-yan-mo-xing/ollama.md): 在 Clore.ai 的 GPU 上使用 Ollama 本地运行 LLM
- [Open WebUI](/guides/guides_v2-zh/yu-yan-mo-xing/open-webui.md): 在 Clore.ai 的 GPU 上运行 LLM 的类 ChatGPT 界面
- [vLLM](/guides/guides_v2-zh/yu-yan-mo-xing/vllm.md): 在 Clore.ai 的 GPU 上使用 vLLM 进行高吞吐量 LLM 推理
- [Llama.cpp Server](/guides/guides_v2-zh/yu-yan-mo-xing/llamacpp-server.md): 在 Clore.ai 的 GPU 上使用 llama.cpp server 进行高效 LLM 推理
- [Text Generation WebUI](/guides/guides_v2-zh/yu-yan-mo-xing/text-generation-webui.md): 在 Clore.ai 的 GPU 上运行 text-generation-webui 进行 LLM 推理
- [ExLlamaV2](/guides/guides_v2-zh/yu-yan-mo-xing/exllamav2-fast.md): 在 Clore.ai 的 GPU 上使用 ExLlamaV2 实现最高速度的 LLM 推理
- [LocalAI](/guides/guides_v2-zh/yu-yan-mo-xing/localai-openai-compatible.md): 在 Clore.ai 上使用 LocalAI 自托管兼容 OpenAI 的 API
- [Llama 3.3 70B](/guides/guides_v2-zh/yu-yan-mo-xing/llama33.md): 在 Clore.ai 的 GPU 上运行 Meta 的 Llama 3.3 70B 模型
- [Mistral 与 Mixtral](/guides/guides_v2-zh/yu-yan-mo-xing/mistral-mixtral.md): 在 Clore.ai 的 GPU 上运行 Mistral 和 Mixtral 模型
- [DeepSeek Coder](/guides/guides_v2-zh/yu-yan-mo-xing/deepseek-coder.md): 在 Clore.ai 上使用 DeepSeek Coder 实现一流的代码生成
- [DeepSeek-V3](/guides/guides_v2-zh/yu-yan-mo-xing/deepseek-v3.md): 在 Clore.ai 的 GPU 上运行具有卓越推理能力的 DeepSeek-V3
- [DeepSeek-R1 推理模型](/guides/guides_v2-zh/yu-yan-mo-xing/deepseek-r1.md): 在 Clore.ai 的 GPU 上运行开源推理模型 DeepSeek-R1
- [Qwen2.5](/guides/guides_v2-zh/yu-yan-mo-xing/qwen25.md): 在 Clore.ai 的 GPU 上运行阿里巴巴的 Qwen2.5 多语言 LLM
- [CodeLlama](/guides/guides_v2-zh/yu-yan-mo-xing/codellama.md): 在 Clore.ai 上使用 CodeLlama 生成、补全和解释代码
- [Gemma 2](/guides/guides_v2-zh/yu-yan-mo-xing/gemma2.md): 在 Clore.ai 的 GPU 上高效运行 Google 的 Gemma 2 模型
- [Phi-4](/guides/guides_v2-zh/yu-yan-mo-xing/phi4.md): 在 Clore.ai 的 GPU 上运行微软的 Phi-4 小型语言模型
- [Llama 4（Scout 与 Maverick）](/guides/guides_v2-zh/yu-yan-mo-xing/llama4.md): 在 Clore.ai 的 GPU 上运行 Meta Llama 4 Scout 和 Maverick MoE 模型
- [Gemma 3](/guides/guides_v2-zh/yu-yan-mo-xing/gemma3.md): 在 Clore.ai 上运行 Google Gemma 3 多模态模型——比 Llama-405B 小 15 倍却表现更优
- [Mistral Small 3.1](/guides/guides_v2-zh/yu-yan-mo-xing/mistral-small.md): 在 Clore.ai 上部署 Mistral Small 3.1（24B）——理想的单 GPU 生产模型
- [Qwen3.5](/guides/guides_v2-zh/yu-yan-mo-xing/qwen35.md): 在 Clore.ai 上运行 Alibaba Qwen3.5——最新前沿模型（2026年2月）
- [GLM-5](/guides/guides_v2-zh/yu-yan-mo-xing/glm5.md): 在 Clore.ai 上部署由智谱 AI 提供的 GLM-5（744B MoE）——使用 vLLM 进行 API 访问和自托管
- [GLM-4.7-Flash](/guides/guides_v2-zh/yu-yan-mo-xing/glm-47-flash.md): 在 Clore.ai 上部署 GLM-4.7-Flash（30B MoE），由智谱 AI 提供——高效语言模型，SWE-bench 性能达 59.2%
- [Kimi K2.5](/guides/guides_v2-zh/yu-yan-mo-xing/kimi-k2.md): 在 Clore.ai 的 GPU 上部署由 Moonshot AI 提供的 Kimi K2.5（1T MoE 多模态）
- [Mistral Large 3（675B MoE）](/guides/guides_v2-zh/yu-yan-mo-xing/mistral-large3.md): 在 Clore.ai 的 GPU 上运行 Mistral Large 3——拥有 41B 激活参数的 675B MoE 前沿模型
- [MiMo-V2-Flash](/guides/guides_v2-zh/yu-yan-mo-xing/mimo-v2-flash.md): 在 Clore.ai 上部署带有推测解码的 MiMo-V2-Flash（309B MoE）——超高速推理，速度达 150+ tok/s
- [Ling-2.5-1T（1 万亿参数）](/guides/guides_v2-zh/yu-yan-mo-xing/ling25.md): 在 Clore.ai 的 GPU 上运行 Ling-2.5-1T——蚂蚁集团的 1 万亿参数开源 LLM，采用混合线性注意力
- [LFM2-24B-A2B](/guides/guides_v2-zh/yu-yan-mo-xing/lfm2-24b.md): 在 Clore.ai 上部署由 Liquid AI 提供的 LFM2-24B-A2B——混合 SSM+Attention 架构，总参数 24B / 激活参数 2B
- [DeepSeek V4（1T MoE，多模态）](/guides/guides_v2-zh/yu-yan-mo-xing/deepseek-v4.md): 在 Clore.ai GPU 服务器上部署 DeepSeek V4——万亿参数多模态开源权重模型
- [TGI（Text Generation Inference）](/guides/guides_v2-zh/yu-yan-mo-xing/tgi.md): 在 Clore.ai 的 GPU 上运行 HuggingFace Text Generation Inference（TGI），用于生产级 LLM 服务
- [SGLang](/guides/guides_v2-zh/yu-yan-mo-xing/sglang.md): 在 Clore.ai 的 GPU 上部署 SGLang，利用 RadixAttention 提供高性能 LLM 服务
- [Aphrodite Engine](/guides/guides_v2-zh/yu-yan-mo-xing/aphrodite-engine.md): 在 Clore.ai 上的旧款和现代 GPU 上运行 Aphrodite Engine 进行 LLM 推理
- [LiteLLM AI Gateway](/guides/guides_v2-zh/yu-yan-mo-xing/litellm.md): 在 Clore.ai 的 GPU 上部署 LiteLLM 作为 100+ LLM 的 AI Gateway 代理
- [MLC-LLM](/guides/guides_v2-zh/yu-yan-mo-xing/mlc-llm.md)
- [PowerInfer](/guides/guides_v2-zh/yu-yan-mo-xing/powerinfer.md)
- [LMDeploy](/guides/guides_v2-zh/yu-yan-mo-xing/lmdeploy.md)
- [Mistral.rs](/guides/guides_v2-zh/yu-yan-mo-xing/mistral-rs.md)
