Phi-4

Запускайте малую языковую модель Phi-4 от Microsoft на GPU Clore.ai

Запустите Phi-4 от Microsoft — небольшую, но мощную языковую модель.

circle-check

Аренда на CLORE.AI

  1. Отфильтруйте по типу GPU, объему VRAM и цене

  2. Выберите On-Demand (фиксированная ставка) или Spot (цена по ставке)

  3. Настройте ваш заказ:

    • Выберите Docker-образ

    • Установите порты (TCP для SSH, HTTP для веб-интерфейсов)

    • Добавьте переменные окружения при необходимости

    • Введите команду запуска

  4. Выберите способ оплаты: CLORE, BTC, или USDT/USDC

  5. Создайте заказ и дождитесь развертывания

Доступ к вашему серверу

  • Найдите данные для подключения в Моих заказах

  • Веб-интерфейсы: используйте URL HTTP-порта

  • SSH: ssh -p <port> root@<proxy-address>

Что такое Phi-4?

Phi-4 от Microsoft предлагает:

  • 14 млрд параметров с отличной производительностью

  • Превосходит более крупные модели в бенчмарках

  • Сильные навыки рассуждения и математики

  • Эффективный вывод

Варианты моделей

Модель
Параметры
VRAM
Специализация

Phi-4

14B

16GB

Общее

Phi-3.5-mini

3.8 млрд

4 ГБ

Лёгкая (легковесная)

Phi-3.5-MoE

42 млрд (6.6 млрд активных)

16GB

Смесь экспертов

Phi-3.5-vision

4.2 млрд

6 ГБ

Зрение

Быстрое развертывание

Docker-образ:

Порты:

Команда:

Доступ к вашему сервису

После развертывания найдите ваш http_pub URL в Моих заказах:

  1. Перейдите на Моих заказах страницу

  2. Нажмите на ваш заказ

  3. Найдите http_pub URL (например, abc123.clorecloud.net)

Используйте https://YOUR_HTTP_PUB_URL вместо localhost в примерах ниже.

Использование Ollama

Установка

Базовое использование

Phi-3.5-Vision

Для понимания изображений:

Математика и рассуждения

Генерация кода

Квантованный (квантованная) инференс

Интерфейс Gradio

Производительность

Модель
GPU
Токенов/с

Phi-3.5-mini

RTX 3060

~100

Phi-3.5-mini

RTX 4090

~150

Phi-4

RTX 4090

~60

Phi-4

A100

~90

Phi-4 (4-бит)

RTX 3090

~40

Бенчмарки

Модель
MMLU
HumanEval
GSM8K

Phi-4

84.8%

82.6%

94.6%

GPT-4-Turbo

86.4%

85.4%

94.2%

Llama-3.1-70B

83.6%

80.5%

92.1%

Phi-4 сопоставим или превосходит гораздо большие модели

Устранение неполадок

Ошибка "trust_remote_code"

  • Добавьте trust_remote_code=True до from_pretrained()

  • Это требуется для моделей Phi

Повторяющиеся ответы

  • Понизьте температуру (0.3–0.6)

  • Добавьте repetition_penalty=1.1

  • Используйте правильный шаблон чата

Проблемы с памятью

  • Phi-4 эффективен, но всё ещё требует ~8 ГБ для 14B

  • Используйте 4-битную квантизацию при необходимости

  • Уменьшите длину контекста

Неправильный формат вывода

  • Используйте apply_chat_template() для правильного форматирования

  • Проверьте, что вы используете версию instruct, а не базовую

Оценка стоимости

Типичные ставки на маркетплейсе CLORE.AI (по состоянию на 2024):

GPU
Почасовая ставка
Дневная ставка
Сессия 4 часа

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Цены варьируются в зависимости от провайдера и спроса. Проверьте CLORE.AI Marketplacearrow-up-right для текущих тарифов.

Экономьте деньги:

  • Используйте Spot рынок для гибких рабочих нагрузок (часто на 30–50% дешевле)

  • Платите с помощью CLORE токенов

  • Сравнивайте цены у разных провайдеров

Сценарии использования

  • Репетитор по математике

  • Помощь в кодировании

  • Анализ документов (зрение)

  • Эффективное развёртывание на краю

  • Экономичный инференс

Дальнейшие шаги

  • Qwen2.5 — альтернативная модель

  • Gemma 2 — модель от Google

  • Llama 3.2 — модель от Meta

Последнее обновление

Это было полезно?