# InstantID

Генерируйте изображения с любой лицевой идентичностью, используя всего одно эталонное фото.

{% hint style="success" %}
Все примеры можно запускать на GPU-серверах, арендуемых через [CLORE.AI Marketplace](https://clore.ai/marketplace).
{% endhint %}

## Аренда на CLORE.AI

1. Посетите [CLORE.AI Marketplace](https://clore.ai/marketplace)
2. Отфильтруйте по типу GPU, объему VRAM и цене
3. Выберите **On-Demand** (фиксированная ставка) или **Spot** (цена по ставке)
4. Настройте ваш заказ:
   * Выберите Docker-образ
   * Установите порты (TCP для SSH, HTTP для веб-интерфейсов)
   * Добавьте переменные окружения при необходимости
   * Введите команду запуска
5. Выберите способ оплаты: **CLORE**, **BTC**, или **USDT/USDC**
6. Создайте заказ и дождитесь развертывания

### Доступ к вашему серверу

* Найдите данные для подключения в **Моих заказах**
* Веб-интерфейсы: используйте URL HTTP-порта
* SSH: `ssh -p <port> root@<proxy-address>`

## Что такое InstantID?

InstantID сохраняет идентичность лица:

* Используйте любое референтное лицо
* Zero-shot — обучение не требуется
* Работает с любым стилем/промптом
* Лучше, чем обучение LoRA

## Требования

| Режим            | VRAM   | Рекомендуется |
| ---------------- | ------ | ------------- |
| Базовый          | 12GB   | RTX 4080      |
| Высокое качество | 16GB   | RTX 4090      |
| С позой          | 16 ГБ+ | RTX 4090      |

## Быстрое развертывание

**Docker-образ:**

```
pytorch/pytorch:2.5.1-cuda12.4-cudnn9-devel
```

**Порты:**

```
22/tcp
7860/http
```

**Команда:**

```bash
pip install diffusers transformers accelerate opencv-python insightface onnxruntime-gpu && \
huggingface-cli download InstantX/InstantID --local-dir ./checkpoints && \
python instantid_app.py
```

## Доступ к вашему сервису

После развертывания найдите ваш `http_pub` URL в **Моих заказах**:

1. Перейдите на **Моих заказах** страницу
2. Нажмите на ваш заказ
3. Найдите `http_pub` URL (например, `abc123.clorecloud.net`)

Используйте `https://YOUR_HTTP_PUB_URL` вместо `localhost` в примерах ниже.

## Установка

```bash
pip install diffusers transformers accelerate
pip install opencv-python insightface onnxruntime-gpu
pip install huggingface_hub

# Скачайте модели
huggingface-cli download InstantX/InstantID --local-dir ./checkpoints
```

## Базовое использование

```python
import torch
import cv2
import numpy as np
from PIL import Image
from diffusers import StableDiffusionXLPipeline, DDIMScheduler
from insightface.app import FaceAnalysis

# Инициализировать анализатор лиц
app = FaceAnalysis(name='antelopev2', root='./', providers=['CUDAExecutionProvider'])
app.prepare(ctx_id=0, det_size=(640, 640))

# Загрузить pipeline
pipe = StableDiffusionXLPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    torch_dtype=torch.float16
).to("cuda")

# Загрузить компоненты InstantID
from diffusers import ControlNetModel

controlnet = ControlNetModel.from_pretrained(
    "./checkpoints/ControlNetModel",
    torch_dtype=torch.float16
)

# Загрузить IP-Adapter для лица
pipe.load_ip_adapter(
    "./checkpoints",
    subfolder="",
    weight_name="ip-adapter.bin"
)

# Обработать референсное лицо
face_image = cv2.imread("reference_face.jpg")
faces = app.get(face_image)
face_emb = faces[0].normed_embedding

# Генерация с идентичностью лица
image = pipe(
    prompt="портрет человека как астронавта, фон космоса",
    negative_prompt="уродливый, размытый, низкое качество",
    ip_adapter_image_embeds=[torch.tensor(face_emb).unsqueeze(0)],
    num_inference_steps=30,
    guidance_scale=7.5
).images[0]

image.save("output.png")
```

## Использование Diffusers Pipeline

```python
from diffusers import StableDiffusionXLInstantIDPipeline, DDIMScheduler
from insightface.app import FaceAnalysis
import torch
import cv2

# Загрузить анализатор лиц
app = FaceAnalysis(name='antelopev2', providers=['CUDAExecutionProvider'])
app.prepare(ctx_id=0)

# Загрузить pipeline
pipe = StableDiffusionXLInstantIDPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet="./checkpoints/ControlNetModel",
    torch_dtype=torch.float16
).to("cuda")

pipe.load_ip_adapter_instantid("./checkpoints/ip-adapter.bin")

# Получить встраивание лица
face_image = cv2.imread("face.jpg")
face_info = app.get(face_image)[0]

face_emb = face_info.normed_embedding
face_kps = face_info.kps

# Генерация
image = pipe(
    prompt="акварельный портрет, художественный",
    face_emb=face_emb,
    face_kps=face_kps,
    num_inference_steps=30
).images[0]

image.save("portrait.png")
```

## Примеры стилей

### Профессиональный портрет

```python
prompt = "профессиональный корпоративный портрет, студийное освещение, серый фон, деловой костюм"
negative = "мультфильм, аниме, иллюстрация, размыто"
```

### Художественный портрет

```python
prompt = "портрет маслом в стиле Рембрандта, драматическое освещение, музейное качество"
negative = "фото, реалистичный, современный"
```

### Фэнтезийный персонаж

```python
prompt = "фэнтезийный эльф-персонаж, заостренные уши, магический лес на фоне, эфирное освещение"
negative = "человеческие уши, современная одежда, реалистичный"
```

### Аниме-стиль

```python
prompt = "портрет персонажа аниме, стиль студии Ghibli, детализированный, красивый"
negative = "реалистичный, фото, 3D-рендер"
```

## С контролем позы

```python
from diffusers.utils import load_image

# Загрузить референс позы
pose_image = load_image("pose_reference.jpg")

# Генерация с лицом И позой
image = pipe(
    prompt="человек в динамичной позе, динамично, высокое качество",
    face_emb=face_emb,
    face_kps=face_kps,
    image=pose_image,  # Референс позы
    controlnet_conditioning_scale=0.8,
    num_inference_steps=30
).images[0]
```

## Интерфейс Gradio

```python
import gradio as gr
import torch
import cv2
import numpy as np
from diffusers import StableDiffusionXLInstantIDPipeline
from insightface.app import FaceAnalysis

app = FaceAnalysis(name='antelopev2', providers=['CUDAExecutionProvider'])
app.prepare(ctx_id=0)

pipe = StableDiffusionXLInstantIDPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet="./checkpoints/ControlNetModel",
    torch_dtype=torch.float16
).to("cuda")

pipe.load_ip_adapter_instantid("./checkpoints/ip-adapter.bin")

def generate(face_image, prompt, negative_prompt, strength, steps):
    # Конвертировать в формат cv2
    face_cv = cv2.cvtColor(np.array(face_image), cv2.COLOR_RGB2BGR)

    # Получить информацию о лице
    faces = app.get(face_cv)
    if len(faces) == 0:
        return None, "Лицо не обнаружено!"

    face_info = faces[0]
    face_emb = face_info.normed_embedding
    face_kps = face_info.kps

    # Генерация
    image = pipe(
        prompt=prompt,
        negative_prompt=negative_prompt,
        face_emb=face_emb,
        face_kps=face_kps,
        ip_adapter_scale=strength,
        num_inference_steps=steps
    ).images[0]

    return image, "Успешно!"

demo = gr.Interface(
    fn=generate,
    inputs=[
        gr.Image(type="pil", label="Референсное лицо"),
        gr.Textbox(label="Промпт", value="профессиональный портрет"),
        gr.Textbox(label="Негативная подсказка", value="уродливое, размытое"),
        gr.Slider(0.1, 1.0, value=0.8, label="Сила идентичности"),
        gr.Slider(10, 50, value=30, step=1, label="Шаги")
    ],
    outputs=[
        gr.Image(label="Сгенерированное изображение"),
        gr.Textbox(label="Статус")
    ],
    title="InstantID - генерация с сохранением идентичности"
)

demo.launch(server_name="0.0.0.0", server_port=7860)
```

## Пакетная замена лиц

```python
import os
from pathlib import Path

def batch_generate(face_image_path, prompts, output_dir):
    # Загрузить лицо
    face_cv = cv2.imread(face_image_path)
    face_info = app.get(face_cv)[0]
    face_emb = face_info.normed_embedding
    face_kps = face_info.kps

    os.makedirs(output_dir, exist_ok=True)

    for i, prompt in enumerate(prompts):
        print(f"Генерация {i+1}/{len(prompts)}: {prompt[:50]}...")

        image = pipe(
            prompt=prompt,
            negative_prompt="уродливый, размытый, деформированный",
            face_emb=face_emb,
            face_kps=face_kps,
            num_inference_steps=30
        ).images[0]

        image.save(f"{output_dir}/output_{i:03d}.png")

# Пример использования
prompts = [
    "астронавт в скафандре, фон Земли",
    "средневековый рыцарь в доспехах",
    "ученый в лаборатории",
    "шеф-повар на кухне ресторана",
    "спортсмен на поле"
]

batch_generate("my_face.jpg", prompts, "./outputs")
```

## Контроль силы идентичности

```python

# Низкая сила — больше стиля, меньше идентичности
image_stylized = pipe(
    prompt=prompt,
    face_emb=face_emb,
    ip_adapter_scale=0.4,  # Низкая
    num_inference_steps=30
).images[0]

# Высокая сила — больше идентичности, меньше стиля
image_faithful = pipe(
    prompt=prompt,
    face_emb=face_emb,
    ip_adapter_scale=0.9,  # Высокая
    num_inference_steps=30
).images[0]
```

## Оптимизация памяти

```python

# Включить оптимизации
pipe.enable_model_cpu_offload()
pipe.enable_vae_slicing()

# Или используйте последовательный offload для очень малого объема VRAM
pipe.enable_sequential_cpu_offload()
```

## Производительность

| Режим   | GPU      | Время на изображение |
| ------- | -------- | -------------------- |
| Базовый | RTX 4090 | \~8s                 |
| С позой | RTX 4090 | \~12с                |
| Базовый | RTX 3090 | \~15с                |
| Базовый | A100     | \~5 с                |

## Устранение неполадок

### Лицо не обнаружено

* Убедитесь, что лицо хорошо видно
* Хорошее освещение на референсном изображении
* Лицо должно быть повернуто фронтально

### Идентичность не сохранена

* Увеличьте ip\_adapter\_scale
* Используйте более четкую референсную фотографию
* Избегайте экстремальных углов

### Стиль не применён

* Уменьшите ip\_adapter\_scale
* Более описательный промпт
* Увеличить guidance\_scale

## Оценка стоимости

Типичные ставки на маркетплейсе CLORE.AI (по состоянию на 2024):

| GPU       | Почасовая ставка | Дневная ставка | Сессия 4 часа |
| --------- | ---------------- | -------------- | ------------- |
| RTX 3060  | \~$0.03          | \~$0.70        | \~$0.12       |
| RTX 3090  | \~$0.06          | \~$1.50        | \~$0.25       |
| RTX 4090  | \~$0.10          | \~$2.30        | \~$0.40       |
| A100 40GB | \~$0.17          | \~$4.00        | \~$0.70       |
| A100 80GB | \~$0.25          | \~$6.00        | \~$1.00       |

*Цены варьируются в зависимости от провайдера и спроса. Проверьте* [*CLORE.AI Marketplace*](https://clore.ai/marketplace) *для текущих тарифов.*

**Экономьте деньги:**

* Используйте **Spot** рынок для гибких рабочих нагрузок (часто на 30–50% дешевле)
* Платите с помощью **CLORE** токенов
* Сравнивайте цены у разных провайдеров

## Дальнейшие шаги

* [IP-Adapter](/guides/guides_v2-ru/lico-i-identichnost/ip-adapter.md) - Промпт с изображением
* Stable Diffusion WebUI - расширение InstantID
* [ControlNet](/guides/guides_v2-ru/obrabotka-izobrazhenii/controlnet-advanced.md) - Контроль позы


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-ru/lico-i-identichnost/instantid.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
