> For the complete documentation index, see [llms.txt](https://docs.clore.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.clore.ai/guides/guides_v2-ru/generaciya-video/wan22-vbvr.md).

# Wan 2.2 VBVR (управление движением)

**Wan 2.2 VBVR** (Video-Based Video Reference) — это апрельское расширение Alibaba 2026 года для базовой модели Wan 2.2 image-to-video. Оно добавляет новую мощную возможность: вы предоставляете **эталонный видеоклип** для управления паттернами движения в сгенерированном видео, а не только начальным изображением. В результате получается согласованная, управляемая анимация — тот же персонаж, продукт или сцена повторяет траекторию движения из вашего эталонного материала.

Это руководство описывает развёртывание Wan 2.2 VBVR через ComfyUI на аренде GPU в Clore.ai.

***

## Что такое VBVR (Video-Based Video Reference)?

Традиционные модели image-to-video берут статичное изображение и генерируют движение с нуля. Движение задаётся вашим текстовым промптом, но оно может быть непредсказуемым — особенно в случае конкретных жестов, движений камеры или действий персонажа.

**VBVR меняет правила игры:** вы предоставляете:

1. A **исходное изображение** — ваш объект (персонаж, продукт, сцена)
2. A **эталонное видео движения** — короткий клип, демонстрирующий нужное вам движение
3. A **текстовый промпт** — описывающий содержимое и стиль

Модель извлекает шаблон движения из эталонного видео и применяет его к вашему исходному изображению, создавая новое видео, в котором ваш объект естественно выполняет это движение.

### Примеры применения

| Входное изображение   | Эталонное движение в видео     | Выход                                        |
| --------------------- | ------------------------------ | -------------------------------------------- |
| Фото продукта         | Рука поднимает похожий предмет | Анимация подъёма продукта                    |
| Иллюстрация персонажа | Цикл ходьбы актёра             | Ходьба персонажа                             |
| Модель на подиуме     | Кадры подиумного прохода       | Одежда в движении                            |
| Внешний вид здания    | Панорама камеры с дрона        | Кинематографический B-roll-раскрывающий кадр |

***

## Обзор модели

* **Полное название:** Wan 2.2 I2V-A14B с VBVR (Video-Based Video Reference)
* **Выпущено:** Апрель 2026 года, Alibaba / команда Wan-AI
* **Основано на:** Wan 2.2 I2V-A14B (Image-to-Video, 14B параметров, разрешение до 480p)
* **HuggingFace:** `Wan-AI/Wan2.2-I2V-A14B`
* **VBVR workflow:** распространяется через community-ноды ComfyUI Manager
* **Лицензия:** Apache 2.0

### Варианты

| Вариант  | Требуемая VRAM | Качество     | Скорость  |
| -------- | -------------- | ------------ | --------- |
| **FP8**  | 16–24 ГБ       | Высокое      | Быстрая   |
| **BF16** | 24–40 ГБ       | Максимальное | Умеренная |

Флаг **Вариант FP8** работает на RTX 3090 (24 ГБ) и может поместиться в карты с 16 ГБ при уменьшенном размере батча.  **Вариант BF16** обеспечивает лучшее качество и комфортно работает на RTX 4090 (24 ГБ) или A6000 (48 ГБ).

***

## Требования к оборудованию

| GPU        | VRAM  | Вариант        | Цена на Clore.ai |
| ---------- | ----- | -------------- | ---------------- |
| RTX 3090   | 24 ГБ | FP8 ✅          | \~$0.30/день     |
| RTX 4090   | 24 ГБ | FP8 ✅ / BF16 ✅ | \~$0.50/день     |
| A6000 48GB | 48 ГБ | BF16 ✅         | \~$1.20/день     |
| A100 80GB  | 80 ГБ | BF16 ✅         | \~$2.50/день     |

Для большинства пользователей **RTX 4090 примерно за \~$0.50/день** — это лучший баланс цены и качества, с запуском BF16 в полном разрешении 480p.

***

## Пошаговая настройка на Clore.ai

### Шаг 1: Арендуйте GPU

Посетите [clore.ai/marketplace](https://clore.ai/marketplace):

* **Бюджет**: RTX 3090 (\~$0.30/день) — только FP8
* **Рекомендуется**: RTX 4090 (\~$0.50/день) — качество BF16
* **Премиум**: A6000 (\~$1.20/день) — пакетная обработка, высокая пропускная способность

Используйте **образ Docker ComfyUI** или базовый образ CUDA (мы установим ComfyUI вручную).

### Шаг 2: Установите ComfyUI

```bash
# Клонируйте ComfyUI
git clone https://github.com/comfyanonymous/ComfyUI.git /workspace/ComfyUI
cd /workspace/ComfyUI

# Установите зависимости Python
pip install -r requirements.txt

# Установите ComfyUI Manager (для удобной установки нод)
cd custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager.git
cd ..
```

### Шаг 3: Установите пользовательские ноды VBVR через ComfyUI Manager

Запустите ComfyUI:

```bash
cd /workspace/ComfyUI
python main.py --listen 0.0.0.0 --port 8188
```

Откройте `http://YOUR_CLORE_IP:8188` в браузере. Затем:

1. Нажмите кнопку **Manager** (верхнее меню)
2. Найдите **"Wan 2.2 VBVR"** или **"WanVideo"**
3. Установите **ComfyUI-WanVideo** пакет нод
4. Перезапустите ComfyUI после установки

Либо установите ноды напрямую:

```bash
cd /workspace/ComfyUI/custom_nodes
git clone https://github.com/kijai/ComfyUI-WanVideoWrapper.git
pip install -r ComfyUI-WanVideoWrapper/requirements.txt
```

### Шаг 4: Скачайте контрольные точки модели

```bash
mkdir -p /workspace/ComfyUI/models/wan

# Скачайте базовую модель Wan 2.2 I2V (~28 ГБ)
huggingface-cli download \
  Wan-AI/Wan2.2-I2V-A14B \
  --local-dir /workspace/ComfyUI/models/wan/Wan2.2-I2V-A14B

# Скачайте веса motion encoder, специфичные для VBVR (~2 ГБ)
# Примечание: веса VBVR распространяются как community-релиз ComfyUI-WanVideoWrapper.
# Проверьте https://github.com/kijai/ComfyUI-WanVideoWrapper для актуального пути загрузки.
huggingface-cli download \
  kijai/WanVideo-motion-encoder \
  --local-dir /workspace/ComfyUI/models/wan/vbvr-motion-encoder
```

> **Совет:** Используйте `huggingface-cli download --include "*.safetensors"` чтобы пропустить необязательные файлы и сэкономить место на диске.

### Шаг 5: Скачайте VAE и текстовый энкодер

```bash
# CLIP text encoder (общий с базовым Wan 2.2)
huggingface-cli download \
  Wan-AI/Wan2.2-I2V-A14B \
  --include "xlabs_clip*" \
  --local-dir /workspace/ComfyUI/models/clip

# Текстовый энкодер T5 XXL
huggingface-cli download \
  Wan-AI/Wan2.2-I2V-A14B \
  --include "t5*" \
  --local-dir /workspace/ComfyUI/models/t5

# VAE
huggingface-cli download \
  Wan-AI/Wan2.2-I2V-A14B \
  --include "Wan2.2_VAE.safetensors" \
  --local-dir /workspace/ComfyUI/models/vae
```

***

## Построение VBVR workflow в ComfyUI

### Обзор workflow

VBVR workflow соединяет следующие группы нод:

```
[Load Image] ──────────────────────────────────┐
                                               ↓
[Load Reference Video] → [VBVR Motion Encoder] → [Wan I2V Sampler] → [VAE Decode] → [Save Video]
                                               ↑
[CLIP Text Encode] ────────────────────────────┘
```

### Загрузка workflow

1. Скачайте готовый JSON workflow VBVR из репозитория ComfyUI-WanVideoWrapper:

   ```
   custom_nodes/ComfyUI-WanVideoWrapper/workflows/wan22_vbvr.json
   ```
2. В ComfyUI: **Загрузить** → выберите `wan22_vbvr.json`

### Настройка ключевых нод

**WanVideoModelLoader**

* `model_path`: укажите путь к `Wan2.2-I2V-A14B`
* `precision`: `fp8_e4m3fn` для RTX 3090, `bf16` для RTX 4090+

**VBVRMotionEncoderLoader**

* `encoder_path`: укажите путь к `vbvr-motion-encoder`

**WanVideoSampler**

* `steps`: 25–30 (качество), 15–20 (скорость)
* `cfg`: 6.0–7.5 (выше = лучшее следование промпту)
* `motion_strength`: 0.6–0.9 (насколько точно следовать эталонному движению)
* `frames`: 25 (примерно 2 секунды при 12 кадр/с) или 49 (4 секунды)
* `resolution`: 832×480 (480p по умолчанию)

**LoadVideo (Reference)**

* Загрузите ваш эталонный клип движения (MP4, GIF или последовательность изображений)
* Рекомендуется: 2–5 секунд, примерно такая же длительность, как и у целевого результата

***

## Запуск первой генерации

### Подготовьте входные данные

1. **Исходное изображение**: 832×480 пикселей или близкое к этому. PNG или JPG. Это ваш объект.
2. **Эталонное видео движения**: в идеале 2–5 секунд, показывает нужное вам движение. Разрешение не обязано совпадать — модель извлекает векторы движения, а не пиксельный контент.
3. **Текстовый промпт**: опишите ваш объект и что он делает (например, `"бутылка продукта плавно вращается на белой поверхности, кинематографическое освещение, 4K, профессиональная фотография"`)

### Рекомендуемые настройки для первого запуска

```yaml
steps: 25
cfg: 7.0
motion_strength: 0.75
frames: 25
seed: 42 (фиксированный для воспроизводимости)
```

### Оценка времени генерации

| GPU       | Вариант | Кадры     | Время         |
| --------- | ------- | --------- | ------------- |
| RTX 3090  | FP8     | 25 кадров | \~3–5 мин     |
| RTX 4090  | BF16    | 25 кадров | \~2–4 мин     |
| RTX 4090  | FP8     | 25 кадров | \~1.5–2.5 мин |
| A100 80GB | BF16    | 49 кадров | \~3–5 мин     |

***

## Практические workflows

### Анимация персонажа

1. **Изображение**: иллюстрация или фото персонажа
2. **Эталон**: кадры актёра, выполняющего нужное действие (идёт, машет рукой, бежит)
3. **Промпт**: `"мультяшный персонаж идёт через лес, плавная анимация, единый стиль"`
4. **motion\_strength**: 0.85 (высокая точность следования эталонному движению)

### Демо продукта

1. **Изображение**: чистый снимок продукта на белом фоне
2. **Эталон**: руки распаковывают или вращают похожий продукт
3. **Промпт**: `"премиальная презентация продукта, вращение на 360°, мягкий студийный свет, коммерческое качество"`
4. **motion\_strength**: 0.70 (некоторая творческая свобода для освещения/окружения)

### Кинематографический B-roll

1. **Изображение**: фото пейзажа или фасада здания
2. **Эталон**: кадры с дрона или панорама камеры из стокового клипа
3. **Промпт**: `"аэро-кинематографический B-roll, золотой час, плавное движение дрона, качество 4K"`
4. **motion\_strength**: 0.65 (позвольте модели добавить естественное движение)

***

## Устранение неполадок

**Недостаточно памяти на RTX 3090 с BF16**

* Переключите квантование на FP8 в WanVideoModelLoader
* Уменьшите количество кадров с 25 до 17
* Отключите разбиение VAE на тайлы, если оно включено

**Движение не соответствует эталонному видео**

* Увеличьте `motion_strength` до 0.85–0.95
* Убедитесь, что эталонное видео обрезано под нужную длительность
* Используйте эталонные видео с чётким, однозначным движением (избегайте дрожания камеры)

**Сгенерированное видео мерцает или содержит артефакты**

* Увеличьте steps до 30
* Снизьте CFG до 6.0
* Используйте эталонное видео с постоянным освещением

**Медленная загрузка / таймаут HuggingFace**

* Используйте `HF_ENDPOINT=https://hf-mirror.com` переменная окружения для более быстрой загрузки из Китая
* Или скачивайте через `aria2c` с несколькими соединениями

***

## Что дальше: Wan 2.7

Alibaba's **Wan 2.7** — это следующее поколение семейства видеомоделей Wan, которое включает:

* **Генерация первого и последнего кадров**: укажите и начальный, и конечный кадр
* **Редактирование видео в видео**: изменяйте существующее видео с помощью текстовых инструкций
* **Ссылки на объект**: сохраняйте единый внешний вид конкретных объектов/персонажей между сценами

Wan 2.7 сейчас доступна через API Together AI. **Открытые веса ожидаются в середине Q2 2026 года.** Полное руководство по самостоятельному хостингу будет добавлено в этот репозиторий, когда веса будут выпущены.

***

## Итог

Wan 2.2 VBVR приносит управление движением на основе референса в open-source генерацию видео. Предоставьте исходное изображение и эталонный клип движения, и модель сгенерирует согласованное видео, в котором ваш объект естественно следует этому движению. FP8 работает на RTX 3090 24 ГБ примерно за \~$0.30/день; BF16 — на RTX 4090 примерно за \~$0.50/день — оба варианта на Clore.ai.

**→** [**Арендуйте GPU на Clore.ai**](https://clore.ai/marketplace) и начните создавать видео с управляемым движением уже сегодня.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-ru/generaciya-video/wan22-vbvr.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
