> For the complete documentation index, see [llms.txt](https://docs.clore.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.clore.ai/guides/guides_v2-ru/generaciya-video/cubecomposer-360-video.md).

# CubeComposer 4K 360° видео

> **CubeComposer** (CVPR 2026) — это спатио-временная авторегрессионная диффузионная модель, которая генерирует **нативное 4K 360° панорамное видео** из стандартного перспективного видеовхода. Построена на базовой видеомодели Wan, обучена на 11 832 клипах высокого разрешения. Это первая открытая модель, способная к нативной генерации 4K 360° — что позволяет создавать VR-контент, виртуальные туры и иммерсивные медиа на потребительском GPU-оборудовании.

## Почему это важно

360° видео традиционно требовало специализированных устройств для съёмки (несколько камер, ПО для сшивки, дорогостоящая постобработка). CubeComposer меняет это:

* **Вход**: любое стандартное видео с камеры (одиночный объектив, камера телефона, видеорегистратор)
* **Выход**: нативное 4K 360° эквиректангулярное видео
* **Метод**: разлагает панорамы на грани кубической карты, генерирует каждую грань авторегрессионно с пространственной согласованностью
* **Качество**: значительно превосходит предыдущие подходы к сшивке и outpainting

## Требования к оборудованию

| Конфигурация  | VRAM | Разрешение           | Скорость      |
| ------------- | ---- | -------------------- | ------------- |
| RTX 4090 24GB | 24GB | 4K 360° (30 кадров)  | \~8 мин/клип  |
| RTX 5090 32GB | 32GB | 4K 360° (60 кадров)  | \~6 мин/клип  |
| 2× RTX 4090   | 48GB | 4K 360° (120 кадров) | \~9 мин/клип  |
| A100 80GB     | 80GB | 4K 360° (240 кадров) | \~12 мин/клип |

**Минимум**: RTX 4090 24GB (или эквивалентный GPU с 24GB+ VRAM)

> На Clore.ai: RTX 4090 от **\~$1.20/час spot** — 2-минутный клип стоит около \~$0.40.

## Установка

```bash
# Клонировать репозиторий
git clone https://github.com/TencentARC/CubeComposer
cd cubecomposer

# Установить зависимости (Python 3.10+, CUDA 12.1+)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt

# Скачать веса модели (~18GB)
python scripts/download_weights.py --model cubecomposer-4k-v1
```

### Docker (рекомендуется для Clore.ai)

```bash
# Официального Docker-образа нет — установите из исходников:
git clone https://github.com/TencentARC/CubeComposer /workspace/CubeComposer
cd /workspace/CubeComposer
pip install -r requirements.txt
python app.py --share --listen 0.0.0.0 --port 7860
```

## Быстрый старт

### CLI: перспективное видео → 4K 360°

```bash
# Базовое использование: входное перспективное видео, выход — 4K эквиректангулярное
python generate_360.py \
  --input /workspace/input_video.mp4 \
  --output /workspace/output_360.mp4 \
  --resolution 4096x2048 \
  --frames 30 \
  --fps 30

# Более высокое качество: больше шагов, более длинный клип
python generate_360.py \
  --input /workspace/walk_through_park.mp4 \
  --output /workspace/park_360_4k.mp4 \
  --resolution 4096x2048 \
  --frames 60 \
  --num_inference_steps 50 \
  --guidance_scale 7.5 \
  --fps 30
```

### Python API

```python
from cubecomposer import CubeComposerPipeline
import torch

# Загрузить pipeline
pipe = CubeComposerPipeline.from_pretrained(
    "cubecomposer/cubecomposer-4k-v1",
    torch_dtype=torch.bfloat16
).to("cuda")

# Генерировать 360° видео из перспективного входа
output = pipe(
    input_video_path="input.mp4",
    num_frames=30,
    resolution=(4096, 2048),  # 4K эквиректангулярное
    num_inference_steps=50,
    guidance_scale=7.5,
    cubemap_size=1024  # размер каждой грани кубической карты
)

# Сохранить как стандартный эквиректангулярный MP4
output.save("output_360.mp4", fps=30)
print(f"Сгенерировано 4K 360° видео: output_360.mp4")
```

### Gradio WebUI

```python
import gradio as gr
from cubecomposer import CubeComposerPipeline
import torch

pipe = CubeComposerPipeline.from_pretrained(
    "cubecomposer/cubecomposer-4k-v1",
    torch_dtype=torch.bfloat16
).to("cuda")

def generate_360(video, frames, steps):
    output = pipe(
        input_video_path=video,
        num_frames=int(frames),
        resolution=(4096, 2048),
        num_inference_steps=int(steps)
    )
    output.save("/tmp/output_360.mp4", fps=30)
    return "/tmp/output_360.mp4"

demo = gr.Interface(
    fn=generate_360,
    inputs=[
        gr.Video(label="Входное перспективное видео"),
        gr.Slider(10, 120, value=30, label="Количество кадров"),
        gr.Slider(20, 80, value=50, label="Шаги инференса (качество)")
    ],
    outputs=gr.Video(label="4K 360° выход"),
    title="CubeComposer — генерация 4K 360° видео",
    description="Загрузите любое перспективное видео → получите нативное 4K 360° панорамное видео"
)

demo.launch(server_name="0.0.0.0", server_port=7860, share=True)
```

## Развёртывание на Clore.ai: пошагово

### 1. Арендуйте RTX 4090

1. Перейдите на [clore.ai/marketplace](https://clore.ai/marketplace)
2. Фильтр: GPU с **24GB+ VRAM** (рекомендуется RTX 4090)
3. Спотовая цена: около \~$1.20–2.50/час в зависимости от доступности
4. Выберите **Custom Docker** или **Ubuntu** образ

### 2. Настройка через SSH

```bash
# Подключитесь к вашему серверу Clore
ssh root@<server-ip>

# Однострочная настройка
git clone https://github.com/TencentARC/CubeComposer && \
  cd cubecomposer && \
  pip install -r requirements.txt && \
  python scripts/download_weights.py && \
  python app.py --port 7860 --host 0.0.0.0
```

### 3. Откройте интерфейс

Откройте `http://<server-ip>:7860` в браузере, чтобы использовать интерфейс Gradio.

## Рабочий процесс: видео с телефона → готовое для VR 4K 360°

```bash
# Шаг 1: загрузите видео с телефона на сервер
scp ~/my_video.mp4 root@<server-ip>:/workspace/

# Шаг 2: сгенерируйте версию 4K 360°
ssh root@<server-ip> "cd cubecomposer && python generate_360.py \
  --input /workspace/my_video.mp4 \
  --output /workspace/my_video_360_4k.mp4 \
  --resolution 4096x2048 --frames 60"

# Шаг 3: добавьте 360°-метаданные для YouTube/VR-гарнитур
ffmpeg -i my_video_360_4k.mp4 \
  -c copy \
  -metadata:s:v:0 spherical=equirectangular \
  my_video_360_4k_vr.mp4

# Шаг 4: скачайте результат
scp root@<server-ip>:/workspace/my_video_360_4k_vr.mp4 ~/
```

## Интеграция Spectrum: ускорение в 4.79× на Wan2.1

Акселератор **Spectrum** (CVPR 2026) — предсказатель спектральных диффузионных признаков без обучения, использующий полиномы Чебышёва — может быть применён к базовой модели Wan2.1, на которой основан CubeComposer, для значительного ускорения:

```python
from cubecomposer import CubeComposerPipeline
from spectrum_accelerator import SpectrumAccelerator
import torch

pipe = CubeComposerPipeline.from_pretrained(
    "cubecomposer/cubecomposer-4k-v1",
    torch_dtype=torch.bfloat16
).to("cuda")

# Применить Spectrum для ускорения в 4.79× без потери качества
accelerator = SpectrumAccelerator(pipe.unet, order=8)  # порядок Чебышёва
pipe.unet = accelerator

# Теперь генерирует примерно в 4.79× быстрее исходной скорости
output = pipe(
    input_video_path="input.mp4",
    num_frames=30,
    resolution=(4096, 2048),
    num_inference_steps=50  # Эффективное качество примерно как у 240 шагов
)
output.save("output_fast_360.mp4")
```

## Советы по качеству

1. **Качество входного видео имеет значение** — более высокое разрешение входа = лучший 360°-результат
2. **Стабильное видео** — дрожание при съёмке с рук снижает согласованность между гранями кубической карты
3. **Хорошее освещение** — избегайте экстремального контраста (пересвеченное небо + тёмный интерьер)
4. **Более длинные клипы** — 30+ кадров дают лучшую временную согласованность
5. **Разрешение граней** — `--cubemap_size 1024` — оптимальный вариант (2048 для критически важной работы, требует в 4 раза больше VRAM)

## Сценарии использования

* **Создание VR-контента** — преобразуйте любые материалы для Meta Quest, Apple Vision Pro
* **Виртуальные туры по недвижимости** — превращайте видео-обходы в 360° туры
* **Туристический контент** — делитесь иммерсивными путешествиями
* **Визуализация архитектуры** — 360° обходы интерьеров/экстерьеров
* **Документация мероприятий** — преобразуйте записи мероприятий в иммерсивные повторы
* **Игровые ассеты** — генерируйте 360° референсы окружения

## Оценка стоимости производственного процесса

| Задача                            | Стоимость на Clore.ai   |
| --------------------------------- | ----------------------- |
| Клип 5 секунд (30 кадров, 4K)     | \~$0.30 (спот RTX 4090) |
| Клип 10 секунд (60 кадров, 4K)    | \~$0.50                 |
| Клип 30 секунд (180 кадров, 4K)   | \~$1.20                 |
| Пакет: 100 клипов (по 5 с каждый) | \~$30                   |

## Похожие руководства

* [Wan2.1 Video Generation](/guides/guides_v2-ru/generaciya-video/wan-video.md) — базовая модель, лежащая в основе CubeComposer
* [FramePack](/guides/guides_v2-ru/generaciya-video/framepack.md) — эффективная генерация длинных видео (6GB VRAM!)
* [LTX-2 Video](/guides/guides_v2-ru/generaciya-video/ltx-video-2.md) — быстрая латентная генерация видео
* [ComfyUI](/guides/guides_v2-ru/generaciya-izobrazhenii/comfyui.md) — workflow на основе узлов для видео + изображений
* [RIFE Video Interpolation](/guides/guides_v2-ru/obrabotka-video/rife-interpolation.md) — сглаживание сгенерированного видео

***

*Последнее обновление: 16 марта 2026 | Статья: arXiv:2603.04291 (CVPR 2026) | Основано на базовой модели Wan2.1*


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-ru/generaciya-video/cubecomposer-360-video.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
