SD WebUI Forge

Clore.ai GPUs पर अनुकूलित VRAM प्रबंधन और FLUX सपोर्ट के साथ Stable Diffusion WebUI Forge तैनात करें

SD WebUI Forge क्लासिक AUTOMATIC1111 Stable Diffusion WebUI का एक अनुकूलित फोर्क है, जिसे lllyasviel टीम ने विकसित किया है। यह बहुत बेहतर VRAM प्रबंधन प्रदान करता है (4 GB GPU पर SDXL सक्षम करना), मूल FLUX मॉडल समर्थन, तेज़ जनरेशन गति, और सभी A1111 एक्सटेंशनों और मॉडलों के साथ पूर्ण पिछड़ा संगतता। CLORE.AI का लचीला GPU मार्केटप्लेस आपको Forge के लिए आदर्श GPU चुनने देता है — बजट कार्ड से लेकर टॉप-टियर A100s तक।

सभी उदाहरण GPU सर्वरों पर चलाए जा सकते हैं जिन्हें के माध्यम से किराये पर लिया जा सकता है CLORE.AI मार्केटप्लेस.

सर्वर आवश्यकताएँ

पैरामीटर

न्यूनतम

अनुशंसित

RAM

8 GB

16 GB+

VRAM

4 GB

12 GB+

डिस्क

30 GB

200 GB+

GPU

NVIDIA GTX 1650 4GB+

RTX 3090, RTX 4090

Forge का मुख्य लाभ इसका VRAM ऑप्टिमाइज़र है: यह जितना कम 4 GB VRAM पर भी SDXL चला सकता है (धीमी गति के साथ)। FLUX मॉडलों के लिए व्यावहारिक न्यूनतम 12 GB VRAM है, और पूरी गुणवत्ता व गति के लिए 24 GB की आवश्यकता होती है।

CLORE.AI पर त्वरित तैनाती

Docker इमेज: nykk3/stable-diffusion-webui-forge:latest

पोर्ट्स: 22/tcp, 7860/http

पर्यावरण चर:

चर

उदाहरण

विवरण

CLI_ARGS

--xformers --medvram

अतिरिक्त CLI आर्गुमेंट्स

COMMANDLINE_ARGS

--api --listen

वैकल्पिक CLI args env

चरण-दर-चरण सेटअप

1. CLORE.AI पर एक GPU सर्वर किराए पर लें

यहाँ जाएँ CLORE.AI मार्केटप्लेस:

बजट SD1.5: GTX 1660/2060 (6 GB) — 512/768px के लिए पर्याप्त
SDXL सक्षम: RTX 3080/3090 (10–24 GB)
FLUX सक्षम: RTX 4090/A6000 (24+ GB)
अधिकतम गुणवत्ता: बैच जनरेशन के लिए A100 80GB

2. अपने सर्वर में SSH करें

ssh -p <PORT> root@<SERVER_IP>

3. स्टोरेज डायरेक्टरी बनाएं

mkdir -p /root/sd-forge/{models,outputs,extensions,configs}
mkdir -p /root/sd-forge/models/{Stable-diffusion,VAE,Lora,ControlNet,embeddings,ESRGAN}

4. SD WebUI Forge को पुल और रन करें

सामान्य लॉन्च:

docker run -d \
  --name sd-forge \
  --gpus all \
  -p 7860:7860 \
  -v /root/sd-forge/models:/app/stable-diffusion-webui/models \
  -v /root/sd-forge/outputs:/app/stable-diffusion-webui/outputs \
  -v /root/sd-forge/extensions:/app/stable-diffusion-webui/extensions \
  nykk3/stable-diffusion-webui-forge:latest

API सक्षम और अतिरिक्त प्रदर्शन फ़्लैग के साथ:

docker run -d \
  --name sd-forge \
  --gpus all \
  -p 7860:7860 \
  -v /root/sd-forge/models:/app/stable-diffusion-webui/models \
  -v /root/sd-forge/outputs:/app/stable-diffusion-webui/outputs \
  -v /root/sd-forge/extensions:/app/stable-diffusion-webui/extensions \
  -e CLI_ARGS="--api --xformers --enable-insecure-extension-access" \
  nykk3/stable-diffusion-webui-forge:latest

कम VRAM मोड (4-6 GB GPU):

docker run -d \
  --name sd-forge \
  --gpus all \
  -p 7860:7860 \
  -v /root/sd-forge/models:/app/stable-diffusion-webui/models \
  -v /root/sd-forge/outputs:/app/stable-diffusion-webui/outputs \
  -e CLI_ARGS="--api --medvram-sdxl --opt-sdp-attention" \
  nykk3/stable-diffusion-webui-forge:latest

अधिकतम प्रदर्शन (24+ GB VRAM):

docker run -d \
  --name sd-forge \
  --gpus all \
  -p 7860:7860 \
  -v /root/sd-forge/models:/app/stable-diffusion-webui/models \
  -v /root/sd-forge/outputs:/app/stable-diffusion-webui/outputs \
  -e CLI_ARGS="--api --xformers --no-half-vae" \
  nykk3/stable-diffusion-webui-forge:latest

5. स्टार्टअप मॉनिटर करें

docker logs -f sd-forge

इसके लिए देखें:

Running on local URL:  http://0.0.0.0:7860

पहली बार रन पर स्टार्टअप आम तौर पर 2–5 मिनट लेता है।

6. वेब इंटरफेस तक पहुँचें

पोर्ट 7860 के लिए आपका CLORE.AI http_pub URL:

https://<order-id>-7860.clore.ai/

7. मॉडलों को जोड़ें

विधि 1: वेब UI में CivitAI के माध्यम से डाउनलोड करें

जाएँ Extensions → Installed → Models (कुछ संस्करण)
या Settings में URL डाउनलोडर का उपयोग करें

विधि 2: सर्वर पर सीधे डाउनलोड करें

# SDXL बेस मॉडल डाउनलोड करें
cd /root/sd-forge/models/Stable-diffusion
wget -O "sd_xl_base_1.0.safetensors" \
  "https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0.safetensors"

# FLUX.1-schnell (तेज़ FLUX मॉडल) डाउनलोड करें
wget -O "flux1-schnell.safetensors" \
  "https://huggingface.co/black-forest-labs/FLUX.1-schnell/resolve/main/flux1-schnell.safetensors"

विधि 3: HuggingFace CLI

docker exec -it sd-forge bash -c "
pip install huggingface_hub
huggingface-cli download stabilityai/stable-diffusion-xl-base-1.0 \
  sd_xl_base_1.0.safetensors \
  --local-dir /app/stable-diffusion-webui/models/Stable-diffusion/
"

उपयोग के उदाहरण

उदाहरण 1: वेब UI के माध्यम से टेक्स्ट टू इमेज

अपने CLORE.AI URL पर Forge UI खोलें
अपने मॉडल का चयन करें Checkpoint ड्रॉपडाउन
प्रॉम्प्ट डालें: "cinematic portrait of a warrior, golden hour, 8k photography"
नकारात्मक प्रॉम्प्ट सेट करें: "blurry, low resolution, watermark, ugly"
चौड़ाई/ऊंचाई सेट करें: 1024x1024 SDXL के लिए, 512x768 SD1.5 के लिए
Steps सेट करें: 20–30, CFG: 7
पर क्लिक करें Generate

उदाहरण 2: FLUX जनरेशन

FLUX मॉडल अलग तरीके से काम करते हैं — नकारात्मक प्रॉम्प्ट की आवश्यकता नहीं, उच्च गुणवत्ता:

FLUX चेकपॉइंट चुनें (flux1-dev.safetensors)
के अंतर्गत Forge, उपयुक्त चुनें Unet और VAE यदि अलग फाइलें हों

प्रॉम्प्ट दर्ज करें (नकारात्मक प्रॉम्प्ट की जरूरत नहीं):

सूर्यास्त पर एक मनोरम परिदृश्य, पहाड़ एक शुद्ध झील में परावर्तित,
फोटोरियलिस्टिक, अल्ट्रा डिटेल्ड, पेशेवर फोटोग्राफी

Steps: 20, CFG: 1.0 (FLUX में कम CFG का उपयोग होता है)
सैम्पलर: Euler इमेज जेनरेट करें DPM++ 2M

उदाहरण 3: ControlNet-गाइडेड जनरेशन

ControlNet एक्सटेंशन इंस्टॉल करें (यदि पहले से इंस्टॉल नहीं है):
- जाएँ Extensions → Available → Load from
- "ControlNet" खोजें और इंस्टॉल करें
ControlNet मॉडल डाउनलोड करें यहाँ: /root/sd-forge/models/ControlNet/
txt2img में, विस्तारित करें ControlNet सेक्शन
संदर्भ इमेज अपलोड करें (पोज़, डीप्थ, canny edge)
अपने संदर्भ प्रकार के अनुरूप प्रीप्रोसेसर और मॉडल चुनें
Generate — आउटपुट संदर्भ संरचना का पालन करेगा

उदाहरण 4: API उपयोग

के साथ --api फ़्लैग, Forge एक REST API उजागर करता है:

import requests
import base64
import io
from PIL import Image

BASE_URL = "http://localhost:7860"  # या CLORE.AI http_pub URL

# टेक्स्ट टू इमेज
payload = {
    "prompt": "a serene Japanese garden with cherry blossoms, watercolor style",
    "negative_prompt": "ugly, blurry, low quality",
    "steps": 25,
    "cfg_scale": 7,
    "width": 1024,
    "height": 1024,
    "sampler_name": "DPM++ 2M",
    "batch_size": 1,
}

response = requests.post(f"{BASE_URL}/sdapi/v1/txt2img", json=payload)
result = response.json()

# इमेज सहेजें
for i, img_b64 in enumerate(result["images"]):
    img_data = base64.b64decode(img_b64)
    img = Image.open(io.BytesIO(img_data))
    img.save(f"output_{i}.png")
    print(f"Saved output_{i}.png")

उदाहरण 5: बैच जनरेशन स्क्रिप्ट

import requests
import base64
import io
from PIL import Image
import os

BASE_URL = "http://localhost:7860"

prompts = [
    ("cyberpunk city at night, neon lights, rain", "cyberpunk"),
    ("ancient forest, mystical fog, fantasy art", "fantasy"),
    ("minimalist logo design, geometric shapes, white background", "logo"),
    ("portrait of an elderly sailor, weathered face, oil painting", "portrait"),
]

os.makedirs("batch_output", exist_ok=True)

for prompt_text, filename in prompts:
    print(f"Generating: {filename}...")
    response = requests.post(
        f"{BASE_URL}/sdapi/v1/txt2img",
        json={
            "prompt": prompt_text,
            "negative_prompt": "low quality, blurry, watermark",
            "steps": 25,
            "cfg_scale": 7,
            "width": 1024,
            "height": 1024,
        },
    )
    
    if response.status_code == 200:
        img_b64 = response.json()["images"][0]
        img = Image.open(io.BytesIO(base64.b64decode(img_b64)))
        img.save(f"batch_output/{filename}.png")
        print(f"  Saved batch_output/{filename}.png")
    else:
        print(f"  Error: {response.status_code}")

कॉन्फ़िगरेशन

मुख्य CLI आर्गुमेंट्स

आर्गुमेंट

विवरण

--api

REST API सक्षम करें

--listen

सभी इंटरफेस पर सुनें (CLORE.AI के लिए आवश्यक)

--port 7860

पोर्ट बदलें

--xformers

xFormers attention सक्षम करें (तेज़, कम VRAM)

--medvram

मध्यम VRAM मोड (SD1.5 6GB पर)

--medvram-sdxl

SDXL के लिए मध्यम VRAM (SDXL 8GB पर)

--lowvram

कम VRAM मोड (बहुत धीमा, किसी भी GPU पर)

--no-half

float32 का उपयोग करें (अधिक VRAM, अधिक स्थिर)

--no-half-vae

VAE को float32 में रखें (काले इमेज होने से रोकता है)

--opt-sdp-attention

PyTorch scaled dot product attention

--enable-insecure-extension-access

एक्सटेंशन इंस्टॉलेशन की अनुमति दें

--skip-version-check

Python/torch वर्शन चेक स्किप करें

Forge-विशिष्ट सेटिंग्स

Forge UI में एक जोड़ता है Forge पैनल जिसमें:

Forge Unet: अनुकूलन बैकएंड चुनें (डिफ़ॉल्ट, bnb, आदि)
Diffusers Torch कंपाइलेशन: 20-30% तेज़ जनरेशन के लिए सक्षम करें (पहली रन पर कंपाइल होता है)
GPU वेट्स: GPU बनाम CPU पर कितना रखा जाए

प्रदर्शन सुझाव

1. 20-30% कम VRAM के लिए xFormers का उपयोग करें

--xformers

अधिकांश GPUs पर स्वचालित रूप से प्रदर्शन में सुधार करता है।

2. Forge का VRAM ऑप्टिमाइज़र

Forge स्वचालित रूप से A1111 से बेहतर VRAM प्रबंध करता है। बस --medvram-sdxl फ्लैग का उपयोग करें SDXL को 8-12 GB GPUs पर चलाने के लिए और बाकी इसे संभालने दें।

3. Torch कंपाइलेशन सक्षम करें (Ampere+)

UI में Forge टैब में, सक्षम करें Diffusers Torch कंपाइलेशन. पहली जनरेशन को कंपाइल होने में 2-3 मिनट लगते हैं, लेकिन बाद की जनरेशन्स 20-30% तेज़ होती हैं।

4. आदर्श Steps/Sampler कॉम्बिनेशन

लक्ष्य

सैंपलर

स्टेप्स

CFG

गति

DPM++ SDE Karras

15-20

गुणवत्ता

DPM++ 2M Karras

25-35

आर्टिस्टिक

Euler a

20-30

5-7

FLUX

Euler

5. 2K+ रिज़ॉल्यूशन्स के लिए Tile VAE का उपयोग करें

अति-उच्च रिज़ॉल्यूशन (2048×2048+) के लिए, SD टैब में सक्षम करें Tiled VAE ताकि VAE OOM त्रुटियों से बचा जा सके।

6. API के साथ लोकली बैच करें

UI में एक-एक करके जनरेट करने के बजाय, तेज थ्रूपुट के लिए API के साथ उपयोग करें batch_size ताकि तेज़ थ्रूपुट:

payload = {
    "prompt": "...",
    "batch_size": 4,  # एक साथ 4 इमेज जनरेट करें
    "n_iter": 2,      # 2 इटरशन चलाएं = कुल 8 इमेज
}

समस्या निवारण

समस्या: काले या हरे इमेज

VAE प्रिसिशन समस्या। यह फ्लैग जोड़ें:

--no-half-vae

या उपयोग करें sdxl-vae-fp16-fix.safetensors VAE।

समस्या: "CUDA out of memory"

क्रम में आज़माएँ:

--medvram-sdxl (SDXL के लिए)
--medvram (SD1.5 के लिए)
इमेज रिज़ॉल्यूशन कम करें
--lowvram (अंतिम उपाय, बहुत धीमा)

समस्या: एक्सटेंशन्स लोड नहीं हो रहे

# एक्सटेंशन एक्सेस की अनुमति दें
-e CLI_ARGS="--enable-insecure-extension-access"

फिर UI में Extensions टैब से इंस्टॉल करें।

समस्या: स्टार्टअप बहुत लंबा लेता है

पहली रन पर सामान्य — PyTorch और मॉडल हैश गणना की जाती है। बाद की स्टार्ट्स तेज़ होते हैं।

docker logs -f sd-forge  # प्रगति देखें

समस्या: ब्राउज़र से UI एक्सेस नहीं कर पा रहे

सुनिश्चित करें कि Forge प्रोसेस बाइंड कर रहा है 0.0.0.0:

लॉन्च कमांड में जोड़ें --listen to CLI_ARGS
पुष्टि करें कि पोर्ट 7860 आपके CLORE.AI आर्डर पोर्ट सूची में है

समस्या: मॉडल ड्रॉपडाउन में नहीं दिख रहा

फाइलें रखने के बाद .safetensors सही फ़ोल्डर में, क्लिक करें 🔄 रिफ्रेश Checkpoint ड्रॉपडाउन के पास।

लिंक

Clore.ai GPU सिफारिशें

उपयोग केस

सिफारिश की गई GPU

Clore.ai पर अनुमानित लागत

डेवलपमेंट/टेस्टिंग

RTX 3090 (24GB)

~$0.12/gpu/hr

प्रोडक्शन

RTX 4090 (24GB)

~$0.70/gpu/hr

बड़े पैमाने पर

A100 80GB

~$1.20/gpu/hr

💡 इस गाइड के सभी उदाहरण तैनात किए जा सकते हैं Clore.ai GPU सर्वरों पर। उपलब्ध GPUs ब्राउज़ करें और घंटे के हिसाब से किराए पर लें — कोई प्रतिबद्धता नहीं, पूर्ण रूट एक्सेस।

PreviousInvokeAI Nextअवलोकन

Last updated 23 days ago

Was this helpful?

hashtagसर्वर आवश्यकताएँ

hashtagCLORE.AI पर त्वरित तैनाती

hashtagचरण-दर-चरण सेटअप

hashtag1. CLORE.AI पर एक GPU सर्वर किराए पर लें

hashtag2. अपने सर्वर में SSH करें

hashtag3. स्टोरेज डायरेक्टरी बनाएं

hashtag4. SD WebUI Forge को पुल और रन करें

hashtag5. स्टार्टअप मॉनिटर करें

hashtag6. वेब इंटरफेस तक पहुँचें

hashtag7. मॉडलों को जोड़ें

hashtagउपयोग के उदाहरण

hashtagउदाहरण 1: वेब UI के माध्यम से टेक्स्ट टू इमेज

hashtagउदाहरण 2: FLUX जनरेशन

hashtagउदाहरण 3: ControlNet-गाइडेड जनरेशन

hashtagउदाहरण 4: API उपयोग

hashtagउदाहरण 5: बैच जनरेशन स्क्रिप्ट

hashtagकॉन्फ़िगरेशन

hashtagमुख्य CLI आर्गुमेंट्स

hashtagForge-विशिष्ट सेटिंग्स

hashtagप्रदर्शन सुझाव

hashtag1. 20-30% कम VRAM के लिए xFormers का उपयोग करें

hashtag2. Forge का VRAM ऑप्टिमाइज़र

hashtag3. Torch कंपाइलेशन सक्षम करें (Ampere+)

hashtag4. आदर्श Steps/Sampler कॉम्बिनेशन

hashtag5. 2K+ रिज़ॉल्यूशन्स के लिए Tile VAE का उपयोग करें

hashtag6. API के साथ लोकली बैच करें

hashtagसमस्या निवारण

hashtagसमस्या: काले या हरे इमेज

hashtagसमस्या: "CUDA out of memory"

hashtagसमस्या: एक्सटेंशन्स लोड नहीं हो रहे

hashtagसमस्या: स्टार्टअप बहुत लंबा लेता है

hashtagसमस्या: ब्राउज़र से UI एक्सेस नहीं कर पा रहे

hashtagसमस्या: मॉडल ड्रॉपडाउन में नहीं दिख रहा

hashtagलिंक

hashtagClore.ai GPU सिफारिशें

सर्वर आवश्यकताएँ

CLORE.AI पर त्वरित तैनाती

चरण-दर-चरण सेटअप

1. CLORE.AI पर एक GPU सर्वर किराए पर लें

2. अपने सर्वर में SSH करें

3. स्टोरेज डायरेक्टरी बनाएं

4. SD WebUI Forge को पुल और रन करें

5. स्टार्टअप मॉनिटर करें

6. वेब इंटरफेस तक पहुँचें

7. मॉडलों को जोड़ें

उपयोग के उदाहरण

उदाहरण 1: वेब UI के माध्यम से टेक्स्ट टू इमेज

उदाहरण 2: FLUX जनरेशन

उदाहरण 3: ControlNet-गाइडेड जनरेशन

उदाहरण 4: API उपयोग

उदाहरण 5: बैच जनरेशन स्क्रिप्ट

कॉन्फ़िगरेशन

मुख्य CLI आर्गुमेंट्स

Forge-विशिष्ट सेटिंग्स

प्रदर्शन सुझाव

1. 20-30% कम VRAM के लिए xFormers का उपयोग करें

2. Forge का VRAM ऑप्टिमाइज़र

3. Torch कंपाइलेशन सक्षम करें (Ampere+)

4. आदर्श Steps/Sampler कॉम्बिनेशन

5. 2K+ रिज़ॉल्यूशन्स के लिए Tile VAE का उपयोग करें

6. API के साथ लोकली बैच करें

समस्या निवारण

समस्या: काले या हरे इमेज

समस्या: "CUDA out of memory"

समस्या: एक्सटेंशन्स लोड नहीं हो रहे

समस्या: स्टार्टअप बहुत लंबा लेता है

समस्या: ब्राउज़र से UI एक्सेस नहीं कर पा रहे

समस्या: मॉडल ड्रॉपडाउन में नहीं दिख रहा

लिंक

Clore.ai GPU सिफारिशें