MiMo-V2-Flash
Разверните MiMo-V2-Flash (309B MoE) со спекулятивной декодировкой на Clore.ai — сверхбыстрая инференция свыше 150 ток/с
Кратко
Почему MiMo-V2-Flash?
Рекомендации по GPU
Конфигурация
VRAM
Производительность
Ежедневная стоимость*
Развёртывание с SGLang (рекомендуется)
Установите SGLang
Многопроцессорная настройка с MTP
Запрос через OpenAI API
Развёртывание с vLLM
Шаблон Docker
Продвинутая настройка
Оптимизация спекулятивного декодирования
Оптимизация памяти
Пример бенчмарка
Советы для пользователей Clore.ai
Устранение неполадок
Проблема
Решение
Сравнение производительности
Модель
Размер
Скорость (8×H100)
Качество
Ресурсы
Последнее обновление
Это было полезно?