Phi-4

在 Clore.ai GPU 上运行微软的 Phi-4 小型语言模型

运行微软的 Phi-4 —— 一个小巧但强大的语言模型。

circle-check

在 CLORE.AI 上租用

  1. 按 GPU 类型、显存和价格筛选

  2. 选择 按需 (固定费率)或 竞价 (出价价格)

  3. 配置您的订单:

    • 选择 Docker 镜像

    • 设置端口(用于 SSH 的 TCP,Web 界面的 HTTP)

    • 如有需要,添加环境变量

    • 输入启动命令

  4. 选择支付方式: CLORE, BTC,或 USDT/USDC

  5. 创建订单并等待部署

访问您的服务器

  • 在以下位置查找连接详情: 我的订单

  • Web 界面:使用 HTTP 端口的 URL

  • SSH: ssh -p <port> root@<proxy-address>

什么是 Phi-4?

微软的 Phi-4 提供:

  • 14B 参数且性能出色

  • 在基准测试中超过更大模型

  • 强大的推理和数学能力

  • 高效推理

1024x1024

A100
参数量
显存
专长

Phi-4

14B

16GB

通用

Phi-3.5-mini

3.8B

4GB

轻量级

Phi-3.5-MoE

42B(6.6B 活跃)

16GB

专家混合(Mixture of Experts)

Phi-3.5-vision

4.2B

6GB

视觉

快速部署

Docker 镜像:

端口:

命令:

访问您的服务

部署后,在以下位置查找您的 http_pub URL: 我的订单:

  1. 前往 我的订单 页面

  2. 单击您的订单

  3. 查找 http_pub URL(例如, abc123.clorecloud.net)

使用 https://YOUR_HTTP_PUB_URL 而不是 localhost 在下面的示例中。

使用 Ollama

安装

基本用法

Phi-3.5-Vision

用于图像理解:

数学与推理

代码生成

量化推理

Gradio 界面

background = Image.open("studio_bg.jpg")

A100
GPU
每秒标记数

Phi-3.5-mini

按小时费率

~100

Phi-3.5-mini

512x512

~150

Phi-4

512x512

~60

Phi-4

2s

~90

Phi-4(4-bit)

速度

~40

基准测试

A100
MMLU
HumanEval
GSM8K

Phi-4

84.8%

82.6%

94.6%

GPT-4-Turbo

86.4%

85.4%

94.2%

Llama-3.1-70B

83.6%

80.5%

92.1%

Phi-4 表现可比或优于更大模型

# 使用固定种子以获得一致结果

"trust_remote_code" 错误

  • 添加 trust_remote_code=True 设置为 from_pretrained()

  • Phi 模型需要此项

重复输出

  • 降低温度(0.3-0.6)

  • 添加 repetition_penalty=1.1

  • 使用适当的对话模板

内存问题

  • Phi-4 高效但 14B 仍需约 8GB

  • 如有需要使用 4-bit 量化

  • 减少上下文长度

输出格式错误

  • 使用 apply_chat_template() 以获得正确格式

  • 检查你使用的是 instruct 版本,而不是 base

下载所有所需的检查点

检查文件完整性

GPU
验证 CUDA 兼容性
费用估算
CLORE.AI 市场的典型费率(截至 2024 年):

按小时费率

~$0.03

~$0.70

~$0.12

速度

~$0.06

~$1.50

~$0.25

512x512

~$0.10

~$2.30

~$0.40

按日费率

~$0.17

~$4.00

~$0.70

4 小时会话

~$0.25

~$6.00

~$1.00

RTX 3060 CLORE.AI 市场arrow-up-right A100 40GB

A100 80GB

  • 使用 竞价 价格随提供商和需求而异。请查看

  • 以获取当前费率。 CLORE 节省费用:

  • 市场用于灵活工作负载(通常便宜 30-50%)

使用场景

  • 数学辅导

  • 代码辅助

  • 文档分析(视觉)

  • 高效的边缘部署

  • 具有成本效益的推理

使用以下方式支付

  • Qwen2.5 - 可选模型

  • Gemma 2 - 谷歌的模型

  • Llama 3.2 - Meta 的模型

最后更新于

这有帮助吗?