> For the complete documentation index, see [llms.txt](https://docs.clore.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.clore.ai/guides/guides_v2-fr/visage-et-identite/instantid.md).

# InstantID

Générez des images avec n'importe quelle identité faciale en utilisant une seule photo de référence.

{% hint style="success" %}
Tous les exemples peuvent être exécutés sur des serveurs GPU loués via [CLORE.AI Marketplace](https://clore.ai/marketplace).
{% endhint %}

## Location sur CLORE.AI

1. Visitez [CLORE.AI Marketplace](https://clore.ai/marketplace)
2. Filtrer par type de GPU, VRAM et prix
3. Choisir **À la demande** (tarif fixe) ou **Spot** (prix d'enchère)
4. Configurez votre commande :
   * Sélectionnez l'image Docker
   * Définissez les ports (TCP pour SSH, HTTP pour les interfaces web)
   * Ajoutez des variables d'environnement si nécessaire
   * Entrez la commande de démarrage
5. Sélectionnez le paiement : **CLORE**, **BTC**, ou **USDT/USDC**
6. Créez la commande et attendez le déploiement

### Accédez à votre serveur

* Trouvez les détails de connexion dans **Mes commandes**
* Interfaces Web : utilisez l'URL du port HTTP
* SSH : `ssh -p <port> root@<adresse-proxy>`

## Qu'est-ce qu'InstantID ?

InstantID préserve l'identité faciale :

* Utilisez n'importe quel visage de référence
* Zero-shot - pas d'entraînement nécessaire
* Fonctionne avec n'importe quel style/commande
* Meilleur que l'entraînement LoRA

## Exigences

| Mode          | VRAM   | Recommandé |
| ------------- | ------ | ---------- |
| Basique       | 12Go   | RTX 4080   |
| Haute qualité | 16Go   | RTX 4090   |
| Avec pose     | 16 Go+ | RTX 4090   |

## Déploiement rapide

**Image Docker :**

```
pytorch/pytorch:2.5.1-cuda12.4-cudnn9-devel
```

**Ports :**

```
22/tcp
7860/http
```

**Commande :**

```bash
pip install diffusers transformers accelerate opencv-python insightface onnxruntime-gpu && \
huggingface-cli download InstantX/InstantID --local-dir ./checkpoints && \
python instantid_app.py
```

## Accéder à votre service

Après le déploiement, trouvez votre `http_pub` URL dans **Mes commandes**:

1. Aller à la **Mes commandes** page
2. Cliquez sur votre commande
3. Trouvez l' `http_pub` URL (par ex., `abc123.clorecloud.net`)

Utilisez `https://VOTRE_HTTP_PUB_URL` au lieu de `localhost` dans les exemples ci-dessous.

## Installation

```bash
pip install diffusers transformers accelerate
pip install opencv-python insightface onnxruntime-gpu
pip install huggingface_hub

# Télécharger les modèles
huggingface-cli download InstantX/InstantID --local-dir ./checkpoints
```

## Utilisation de base

```python
import torch
import cv2
import numpy as np
from PIL import Image
from diffusers import StableDiffusionXLPipeline, DDIMScheduler
from insightface.app import FaceAnalysis

# Initialiser l'analyseur de visage
app = FaceAnalysis(name='antelopev2', root='./', providers=['CUDAExecutionProvider'])
app.prepare(ctx_id=0, det_size=(640, 640))

# Charger le pipeline
pipe = StableDiffusionXLPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    torch_dtype=torch.float16
).to("cuda")

# Charger les composants InstantID
from diffusers import ControlNetModel

controlnet = ControlNetModel.from_pretrained(
    "./checkpoints/ControlNetModel",
    torch_dtype=torch.float16
)

# Charger IP-Adapter pour le visage
pipe.load_ip_adapter(
    "./checkpoints",
    subfolder="",
    weight_name="ip-adapter.bin"
)

# Traiter le visage de référence
face_image = cv2.imread("reference_face.jpg")
faces = app.get(face_image)
face_emb = faces[0].normed_embedding

# Générer avec l'identité faciale
image = pipe(
    prompt="portrait d'une personne en astronaute, fond spatial",
    negative_prompt="laid, flou, basse qualité",
    ip_adapter_image_embeds=[torch.tensor(face_emb).unsqueeze(0)],
    num_inference_steps=30,
    guidance_scale=7.5
).images[0]

image.save("output.png")
```

## Utilisation du pipeline Diffusers

```python
from diffusers import StableDiffusionXLInstantIDPipeline, DDIMScheduler
from insightface.app import FaceAnalysis
import torch
import cv2

# Charger l'analyseur de visage
app = FaceAnalysis(name='antelopev2', providers=['CUDAExecutionProvider'])
app.prepare(ctx_id=0)

# Charger le pipeline
pipe = StableDiffusionXLInstantIDPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet="./checkpoints/ControlNetModel",
    torch_dtype=torch.float16
).to("cuda")

pipe.load_ip_adapter_instantid("./checkpoints/ip-adapter.bin")

# Obtenir l'embedding du visage
face_image = cv2.imread("face.jpg")
face_info = app.get(face_image)[0]

face_emb = face_info.normed_embedding
face_kps = face_info.kps

# Générer
image = pipe(
    prompt="peinture de portrait aquarelle, artistique",
    face_emb=face_emb,
    face_kps=face_kps,
    num_inference_steps=30
).images[0]

image.save("portrait.png")
```

## Exemples de styles

### Photo professionnelle (headshot)

```python
prompt = "photo professionnelle d'entreprise, éclairage studio, fond gris, tenue professionnelle"
negative = "dessin animé, anime, illustration, flou"
```

### Portrait artistique

```python
prompt = "portrait à l'huile dans le style de Rembrandt, éclairage dramatique, qualité musée"
negative = "photo, réaliste, moderne"
```

### Personnage fantastique

```python
prompt = "personnage elfe fantastique, oreilles pointues, forêt magique en arrière-plan, éclairage éthéré"
negative = "oreilles humaines, vêtements modernes, réaliste"
```

### Style anime

```python
prompt = "portrait de personnage anime, style Studio Ghibli, détaillé, beau"
negative = "réaliste, photo, rendu 3D"
```

## Avec contrôle de la pose

```python
from diffusers.utils import load_image

# Charger la référence de pose
pose_image = load_image("pose_reference.jpg")

# Générer avec visage ET pose
image = pipe(
    prompt="personne en pose d'action, dynamique, haute qualité",
    face_emb=face_emb,
    face_kps=face_kps,
    image=pose_image,  # Référence de pose
    controlnet_conditioning_scale=0.8,
    num_inference_steps=30
).images[0]
```

## Interface Gradio

```python
import gradio as gr
import torch
import cv2
import numpy as np
from diffusers import StableDiffusionXLInstantIDPipeline
from insightface.app import FaceAnalysis

app = FaceAnalysis(name='antelopev2', providers=['CUDAExecutionProvider'])
app.prepare(ctx_id=0)

pipe = StableDiffusionXLInstantIDPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet="./checkpoints/ControlNetModel",
    torch_dtype=torch.float16
).to("cuda")

pipe.load_ip_adapter_instantid("./checkpoints/ip-adapter.bin")

def generate(face_image, prompt, negative_prompt, strength, steps):
    # Convertir au format cv2
    face_cv = cv2.cvtColor(np.array(face_image), cv2.COLOR_RGB2BGR)

    # Obtenir les informations du visage
    faces = app.get(face_cv)
    if len(faces) == 0:
        return None, "Aucun visage détecté !"

    face_info = faces[0]
    face_emb = face_info.normed_embedding
    face_kps = face_info.kps

    # Générer
    image = pipe(
        prompt=prompt,
        negative_prompt=negative_prompt,
        face_emb=face_emb,
        face_kps=face_kps,
        ip_adapter_scale=strength,
        num_inference_steps=steps
    ).images[0]

    return image, "Succès !"

demo = gr.Interface(
    fn=generate,
    inputs=[
        gr.Image(type="pil", label="Visage de référence"),
        gr.Textbox(label="Prompt", value="portrait professionnel"),
        gr.Textbox(label="Invite négative", value="laid, flou"),
        gr.Slider(0.1, 1.0, value=0.8, label="Force de l'identité"),
        gr.Slider(10, 50, value=30, step=1, label="Étapes")
    ],
    outputs=[
        gr.Image(label="Image générée"),
        gr.Textbox(label="Statut")
    ],
    title="InstantID - Génération préservant l'identité"
)

demo.launch(server_name="0.0.0.0", server_port=7860)
```

## Remplacement de visage par lot

```python
import os
from pathlib import Path

def batch_generate(face_image_path, prompts, output_dir):
    # Charger le visage
    face_cv = cv2.imread(face_image_path)
    face_info = app.get(face_cv)[0]
    face_emb = face_info.normed_embedding
    face_kps = face_info.kps

    os.makedirs(output_dir, exist_ok=True)

    for i, prompt in enumerate(prompts):
        print(f"Génération {i+1}/{len(prompts)} : {prompt[:50]}...")

        image = pipe(
            prompt=prompt,
            negative_prompt="laid, flou, déformé",
            face_emb=face_emb,
            face_kps=face_kps,
            num_inference_steps=30
        ).images[0]

        image.save(f"{output_dir}/output_{i:03d}.png")

# Utilisation
prompts = [
    "astronaute en combinaison spatiale, fond Terre",
    "chevalier médiéval en armure",
    "scientifique dans un laboratoire",
    "chef dans la cuisine d'un restaurant",
    "athlète sur le terrain de sport"
]

batch_generate("my_face.jpg", prompts, "./outputs")
```

## Contrôle de la force d'identité

```python

# Faible intensité - plus de style, moins d'identité
image_stylized = pipe(
    prompt=prompt,
    face_emb=face_emb,
    ip_adapter_scale=0.4,  # Faible
    num_inference_steps=30
).images[0]

# Haute intensité - plus d'identité, moins de style
image_faithful = pipe(
    prompt=prompt,
    face_emb=face_emb,
    ip_adapter_scale=0.9,  # Élevé
    num_inference_steps=30
).images[0]
```

## Optimisation de la mémoire

```python

# Activer les optimisations
pipe.enable_model_cpu_offload()
pipe.enable_vae_slicing()

# Ou utiliser le déchargement séquentiel pour très peu de VRAM
pipe.enable_sequential_cpu_offload()
```

## Performances

| Mode      | GPU      | Temps par image |
| --------- | -------- | --------------- |
| Basique   | RTX 4090 | \~8s            |
| Avec pose | RTX 4090 | \~12s           |
| Basique   | RTX 3090 | \~15s           |
| Basique   | A100     | \~5s            |

## Dépannage

### Aucun visage détecté

* Assurez-vous que le visage est clairement visible
* Bonne éclairage sur l'image de référence
* Le visage doit être orienté vers l'avant

### Identité non préservée

* Augmenter ip\_adapter\_scale
* Utilisez une photo de référence plus nette
* Évitez les angles extrêmes

### Style non appliqué

* Diminuer ip\_adapter\_scale
* Invite plus descriptive
* Augmenter guidance\_scale

## Estimation des coûts

Tarifs typiques du marché CLORE.AI (à partir de 2024) :

| GPU       | Tarif horaire | Tarif journalier | Session de 4 heures |
| --------- | ------------- | ---------------- | ------------------- |
| RTX 3060  | \~$0.03       | \~$0.70          | \~$0.12             |
| RTX 3090  | \~$0.06       | \~$1.50          | \~$0.25             |
| RTX 4090  | \~$0.10       | \~$2.30          | \~$0.40             |
| A100 40GB | \~$0.17       | \~$4.00          | \~$0.70             |
| A100 80GB | \~$0.25       | \~$6.00          | \~$1.00             |

*Les prix varient selon le fournisseur et la demande. Vérifiez* [*CLORE.AI Marketplace*](https://clore.ai/marketplace) *pour les tarifs actuels.*

**Économisez de l'argent :**

* Utilisez **Spot** market pour les charges de travail flexibles (souvent 30-50 % moins cher)
* Payer avec **CLORE** jetons
* Comparer les prix entre différents fournisseurs

## Prochaines étapes

* [IP-Adapter](/guides/guides_v2-fr/visage-et-identite/ip-adapter.md) - Invitation par image
* Stable Diffusion WebUI - extension InstantID
* [ControlNet](/guides/guides_v2-fr/traitement-dimages/controlnet-advanced.md) - Contrôle de la pose


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-fr/visage-et-identite/instantid.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.