LTX-Video — генерация в реальном времени
Генерируйте 5-секундные видео быстрее реального времени с Lightricks LTX-Video на GPU Clore.ai.
LTX-Video от Lightricks — самая быстрая модель для генерации видео с открытым исходным кодом. На RTX 4090 она создаёт 5-секундный клип 768×512 примерно за 4 секунды — быстрее реального времени воспроизведения. Модель поддерживает как преобразование текста в видео (T2V), так и преобразование изображения в видео (I2V) через нативную поддержкой diffusers интеграцию через LTXPipeline и LTXImageToVideoPipeline.
Аренда GPU на Clore.ai даёт вам мгновенный доступ к аппаратным средствам, необходимым LTX-Video, без предварительных вложений и с почасовой оплатой.
Ключевые особенности
Быстрее реального времени — 5-секундное видео сгенерировано примерно за 4 секунды на RTX 4090.
Текст в видео — создавать клипы по описаниям на естественном языке.
Изображение в видео — анимировать статическое эталонное изображение с управлением движением и камерой.
Лёгкая архитектура — видео DiT с 2 млрд параметров и компактным латентным пространством.
Нативные diffusers —
LTXPipelineиLTXImageToVideoPipelineвdiffusers >= 0.32.Открытые веса — лицензия Apache-2.0; разрешено полное коммерческое использование.
Временной VAE — коэффициент сжатия 1:192 по пространству и времени; эффективное декодирование.
Требования
VRAM GPU
16 ГБ
24 ГБ
ОЗУ системы
16 ГБ
32 ГБ
Диск
15 ГБ
30 GB
Python
3.10+
3.11
CUDA
12.1+
12.4
поддержкой diffusers
0.32+
latest
Рекомендация Clore.ai по GPU: Один RTX 4090 (24 ГБ, ~$0.5–2/день) идеален для максимальной пропускной способности. Один RTX 3090 (24 ГБ, ~$0.3–1/день) всё ещё работает быстрее многих конкурирующих моделей при доле стоимости.
Быстрый старт
Примеры использования
Текст в видео
Изображение в видео
Скрипт пакетной генерации
Советы для пользователей Clore.ai
Тест производительности — на RTX 4090 LTX-Video генерирует 121 кадр примерно за 4 секунды; используйте это как проверку, что ваша арендованная машина работает корректно.
точность bf16 — контрольная точка обучалась в bf16; не переключайтесь на fp16, иначе рискуете ухудшить качество.
Кеширование весов — установите
HF_HOME=/workspace/hf_cacheна постоянном томе. Модель занимает ~6 ГБ; повторная загрузка при каждом запуске контейнера тратит время.Проектирование подсказок — LTX-Video хорошо реагирует на кинематографический язык: "съёмка с дрона", "замедленное движение", "золотой час", "трековая съёмка". Будьте конкретны относительно движения камеры.
Пакетная генерация ночью — LTX-Video достаточно быстр, чтобы генерировать сотни клипов в час на 4090. Очередьте подсказки из файла и дайте ему работать.
SSH + tmux — всегда запускайте генерацию внутри
tmuxсессии, чтобы разорванные соединения не прерывали долгие пакетные задания.Мониторинг VRAM —
watch -n1 nvidia-smiв втором терминале, чтобы убедиться, что вы не используете swap.
Устранение неполадок
OutOfMemoryError
Уменьшите num_frames до 81 или ширина/высота на 512×320
Модель не найдена в diffusers
Обновление: pip install -U diffusers — LTXPipeline требует diffusers ≥ 0.32
Чёрный или статичный вывод
Убедитесь, что вы передаёте negative_prompt; увеличьте guidance_scale до 8–9
ImportError: imageio
pip install imageio[ffmpeg] — бэкенд ffmpeg необходим для экспорта в MP4
Медленное первое инференсирование
Первый запуск компилирует CUDA-ядра и скачивает веса; последующие запуски быстрые
Артефакты полос цветности
Используйте torch.bfloat16 (не float16); bfloat16 имеет более широкий динамический диапазон
Контейнер перезапущен в середине задания
Установите HF_HOME на постоянное хранилище; частичные загрузки с HF автоматически возобновляются
Последнее обновление
Это было полезно?