SkyReels-V3
Генерируйте видео 24 fps с SkyReels-V3, открытой видеомоделью Kunlun на основе Wan2.1, на GPU Clore.ai.
SkyReels-V3 — это модель генерации видео с открытым исходным кодом от Kunlun (SkyWork AI), построенная на архитектуре видео Wan2.1. Она генерирует плавные ролики с частотой 24 кадра/с и поддерживает как преобразование текста в видео (T2V), так и преобразование изображения в видео (I2V). Модель наследует сильную согласованность движения и временную согласованность Wan2.1, а также включает доработки обучения SkyWork для улучшения визуального качества и соответствия подсказкам.
Запуск SkyReels-V3 на Clore.ai позволяет получить доступ к 24 ГБ видеопамяти, необходимых модели, без покупки оборудования — арендуйте RTX 4090 за несколько долларов и начните генерировать.
Ключевые особенности
Вывод 24 кадра/с — плавная, вещательная частота кадров прямо из коробки.
Текст в видео — генерируйте клипы из описаний на естественном языке с хорошим соблюдением подсказок.
Изображение в видео — анимируйте эталонное изображение с управляемым движением камеры и движением объекта.
Построено на Wan2.1 — наследует проверенное временное внимание и моделирование движения архитектуры Wan.
Многоразрешенное — поддерживает генерацию в 480p и 720p в зависимости от бюджета видеопамяти.
Открытые веса — доступно по открытой лицензии для исследований и коммерческого использования.
Китайский + Английский — двуязычная поддержка подсказок через текстовый энкодер Wan2.1.
Требования
VRAM GPU
16 ГБ (480p с выгрузкой)
24 ГБ
ОЗУ системы
32 ГБ
64 ГБ
Диск
25 ГБ
50 ГБ
Python
3.10+
3.11
CUDA
12.1+
12.4
Рекомендация Clore.ai по GPU: Один RTX 4090 (24 ГБ, ≈$0.5–2/день) — оптимальный вариант: достаточно видеопамяти для генерации в 720p в полной точности. Один RTX 3090 (24 ГБ, ≈$0.3–1/день) подходит для 480p и предлагает лучшее соотношение цена/клип на рынке.
Быстрый старт
Примеры использования
Текст в видео
Изображение в видео
Предпросмотр в низком разрешении для быстрого просмотра
Советы для пользователей Clore.ai
Используйте классы конвейера Wan — SkyReels-V3 архитектурно основан на Wan2.1, поэтому он использует
WanPipeline/WanImageToVideoPipelineиз diffusers.Начните с 480p — сначала отрабатывайте подсказки на более низком разрешении, затем генерируйте финальные клипы в 720p, когда будете довольны композицией.
Выгрузка на CPU —
enable_model_cpu_offload()рекомендуется на картах с 24 ГБ для генерации в 720p, чтобы избежать OOM.Постоянное хранилище — установите
HF_HOME=/workspace/hf_cacheна постоянном томе Clore.ai; модель весит ~15–20 ГБ.Родные 24 кадра/с — не изменяйте fps при экспорте; временное внимание модели было обучено для вывода в 24 кадра/с.
Двуязычные подсказки — текстовый энкодер Wan2.1 обрабатывает и английский, и китайский; при необходимости вы можете смешивать языки.
Масштаб направляющего сигнала — лучше всего работают 4.0–6.0. Более высокие значения (>8) могут привести к пересыщению.
tmux обязателен — всегда запускайте генерацию в
tmuxсессии на Clore.ai, чтобы пережить разрывы SSH.
Устранение неполадок
OutOfMemoryError на 720p
Включите pipe.enable_model_cpu_offload(); снизьте до 480p, если все еще OOM
Модель не найдена на HuggingFace
Проверьте точное имя репозитория на странице SkyworkAI на HF — она может быть указана под вариантом имени
Дрожание или мерцание движения
Увеличьте num_inference_steps до 40; уменьшите guidance_scale до 4.0
Медленная генерация
~1–3 мин на клип ~4 сек на RTX 4090 нормально для 720p; 480p примерно в 2× быстрее
Сдвиг цвета / пересыщение
Понизьте guidance_scale до 4.0–5.0
ImportError: imageio
pip install imageio[ffmpeg]
Повторная загрузка весов при перезапуске
Подмонтируйте постоянное хранилище и установите HF_HOME переменную окружения
Последнее обновление
Это было полезно?