Phi-4

Ejecuta el modelo de lenguaje pequeño Phi-4 de Microsoft en GPUs de Clore.ai

Ejecute Phi-4 de Microsoft: un modelo de lenguaje pequeño pero potente.

circle-check

Alquilar en CLORE.AI

  1. Filtrar por tipo de GPU, VRAM y precio

  2. Elegir Bajo demanda (tarifa fija) o Spot (precio de puja)

  3. Configura tu pedido:

    • Selecciona imagen Docker

    • Establece puertos (TCP para SSH, HTTP para interfaces web)

    • Agrega variables de entorno si es necesario

    • Introduce el comando de inicio

  4. Selecciona pago: CLORE, BTC, o USDT/USDC

  5. Crea el pedido y espera el despliegue

Accede a tu servidor

  • Encuentra los detalles de conexión en Mis Pedidos

  • Interfaces web: Usa la URL del puerto HTTP

  • SSH: ssh -p <port> root@<proxy-address>

¿Qué es Phi-4?

Phi-4 de Microsoft ofrece:

  • 14B de parámetros con un rendimiento excelente

  • Supera a modelos más grandes en benchmarks

  • Fuerte razonamiento y matemáticas

  • Inferencia eficiente

Variantes de modelo

Modelo
Parámetros
VRAM
Especialidad

Phi-4

14B

16GB

General

Phi-3.5-mini

3.8B

4GB

Ligero

Phi-3.5-MoE

42B (6.6B activos)

16GB

Mezcla de Expertos

Phi-3.5-vision

4.2B

6GB

Visión

Despliegue rápido

Imagen Docker:

Puertos:

Comando:

Accediendo a tu servicio

Después del despliegue, encuentra tu http_pub URL en Mis Pedidos:

  1. Ir a Mis Pedidos página

  2. Haz clic en tu pedido

  3. Encuentra la http_pub URL (por ejemplo, abc123.clorecloud.net)

Usa https://TU_HTTP_PUB_URL en lugar de localhost en los ejemplos abajo.

Usando Ollama

Instalación

Uso básico

Phi-3.5-Vision

Para comprensión de imágenes:

Matemáticas y razonamiento

Generación de Código

Inferencia cuantizada

Interfaz Gradio

Rendimiento

Modelo
GPU
Tokens/seg

Phi-3.5-mini

RTX 3060

~100

Phi-3.5-mini

RTX 4090

~150

Phi-4

RTX 4090

~60

Phi-4

A100

~90

Phi-4 (4 bits)

RTX 3090

~40

Benchmarks

Modelo
MMLU
HumanEval
GSM8K

Phi-4

84.8%

82.6%

94.6%

GPT-4-Turbo

86.4%

85.4%

94.2%

Llama-3.1-70B

83.6%

80.5%

92.1%

Phi-4 iguala o supera a modelos mucho más grandes

Solución de problemas

"trust_remote_code" error

  • Agregar trust_remote_code=True a from_pretrained()

  • Esto es requerido para los modelos Phi

Salidas repetitivas

  • Temperatura más baja (0.3-0.6)

  • Agregar repetition_penalty=1.1

  • Usar la plantilla de chat adecuada

Problemas de memoria

  • Phi-4 es eficiente pero aún necesita ~8GB para 14B

  • Usa cuantización de 4 bits si es necesario

  • Reducir la longitud del contexto

Formato de salida incorrecto

  • Usa apply_chat_template() para un formateo adecuado

  • Verifica que estés usando la versión instruct, no la base

Estimación de costos

Tarifas típicas del marketplace de CLORE.AI (a fecha de 2024):

GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Los precios varían según el proveedor y la demanda. Consulta CLORE.AI Marketplacearrow-up-right para las tarifas actuales.

Ahorra dinero:

  • Usa Spot market para cargas de trabajo flexibles (a menudo 30-50% más barato)

  • Paga con CLORE tokens

  • Compara precios entre diferentes proveedores

Casos de uso

  • Tutoría de matemáticas

  • Asistencia de código

  • Análisis de documentos (visión)

  • Despliegue eficiente en el edge

  • Inferencia rentable

Próximos pasos

  • Qwen2.5 - Modelo alternativo

  • Gemma 2 - El modelo de Google

  • Llama 3.2 - El modelo de Meta

Última actualización

¿Te fue útil?