> For the complete documentation index, see [llms.txt](https://docs.clore.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.clore.ai/guides/guides_v2-de/erste-schritte/cost-calculator.md).

# Kostenrechner

Schätzen Sie Ihre KI-Arbeitslastkosten auf CLORE.AI.

{% hint style="success" %}
Preise sind Schätzungen. Prüfen Sie [CLORE.AI Marketplace](https://clore.ai/marketplace) auf aktuelle Preise.
{% endhint %}

## Schnelle Kostenreferenz

### GPU-Stundenpreise

| GPU              | On-Demand  | Spot (typisch) |
| ---------------- | ---------- | -------------- |
| RTX 3060 12GB    | $0.03-0.05 | $0.02-0.03     |
| RTX 3070 8GB     | $0.03-0.04 | $0.02-0.03     |
| RTX 3080 10GB    | $0.04-0.06 | $0.03-0.04     |
| RTX 3090 24GB    | $0.05-0.08 | $0.04-0.06     |
| RTX 4070 Ti 12GB | $0.05-0.07 | $0.03-0.05     |
| RTX 4080 16GB    | $0.07-0.10 | $0.05-0.07     |
| RTX 4090 24GB    | $0.10-0.15 | $0.07-0.10     |
| RTX 5090 32GB    | $0.15-0.20 | $0.10-0.15     |
| A100 40GB        | $0.15-0.22 | $0.12-0.17     |
| A100 80GB        | $0.22-0.35 | $0.18-0.25     |
| H100 80GB        | $0.45-0.70 | $0.35-0.50     |

***

## Kosten nach Aufgabe

### Chat/LLM-Inferenz

**Kosten pro 1 Million generierter Token:**

| Modellgröße | GPU       | Geschwindigkeit (tok/s) | Kosten/1M Token |
| ----------- | --------- | ----------------------- | --------------- |
| 7B (Q4)     | RTX 3060  | 25                      | $0.33           |
| 7B (Q4)     | RTX 3090  | 45                      | $0.37           |
| 7B (Q4)     | RTX 4090  | 80                      | $0.35           |
| 13B (Q4)    | RTX 3090  | 30                      | $0.56           |
| 13B (Q4)    | RTX 4090  | 55                      | $0.51           |
| 30B (Q4)    | RTX 4090  | 25                      | $1.11           |
| 70B (Q4)    | A100 40GB | 25                      | $1.89           |
| 70B (Q4)    | A100 80GB | 35                      | $1.98           |

**Beispielkosten:**

* 1 Stunde Chatten (\~50K Token): $0.02–0.10
* 100 Dokumente verarbeiten (1M Token): $0.33–2.00
* Chatbot 24 Stunden betreiben: $0.72–4.00

***

### Bildgenerierung

**Kosten pro 1000 Bilder:**

| Modell       | Auflösung | GPU       | Zeit/Bild | Kosten/1000 |
| ------------ | --------- | --------- | --------- | ----------- |
| SD 1.5       | 512x512   | RTX 3060  | 4 Sek     | $0.33       |
| SD 1.5       | 512x512   | RTX 3090  | 2 Sek     | $0.28       |
| SD 1.5       | 512x512   | RTX 4090  | 1 Sek     | $0.28       |
| SDXL         | 1024x1024 | RTX 3090  | 7 Sek     | $0.97       |
| SDXL         | 1024x1024 | RTX 4090  | 3 Sek     | $0.83       |
| FLUX schnell | 1024x1024 | RTX 4090  | 5 Sek     | $1.39       |
| FLUX schnell | 1024x1024 | RTX 5090  | 3,5 Sek.  | $1.46       |
| FLUX dev     | 1024x1024 | RTX 4090  | 15 Sek    | $4.17       |
| FLUX dev     | 1024x1024 | A100 40GB | 10 Sek.   | $4.72       |

**Beispielkosten:**

* 100 SDXL-Bilder generieren: $0.08–0.10
* 1000 SD 1.5-Bilder generieren: $0.28–0.33
* Batch von 500 FLUX-Bildern: $0.70–2.40

***

### Videogenerierung

**Kosten pro Minute Video:**

| Modell      | Länge | Auflösung | GPU       | Zeit    | Kosten/Min Video |
| ----------- | ----- | --------- | --------- | ------- | ---------------- |
| SVD         | 4 Sek | 576x1024  | RTX 4090  | 1,5 Min | $0.38            |
| SVD         | 4 Sek | 576x1024  | A100 40GB | 1 Min   | $0.43            |
| AnimateDiff | 3 Sek | 512x512   | RTX 3090  | 2 Min   | $0.53            |
| Wan2.1      | 5 Sek | 480p      | RTX 5090  | 2 Min   | $0.80            |
| Wan2.1      | 5 Sek | 720p      | A100 40GB | 2 Min   | $0.85            |
| Hunyuan     | 5 Sek | 720p      | A100 80GB | 5 Min   | $3.13            |

**Beispielkosten:**

* 1 Minute SVD-Clips: $0.38–0.50
* 5 Minuten AnimateDiff: $2.65
* 1 Minute Hunyuan-Video: $3.00–4.00

***

### Audioverarbeitung

**Kosten pro Stunde Audio:**

| Aufgabe       | Modell           | GPU      | Verarbeitungszeit | Kosten/Stunde Audio |
| ------------- | ---------------- | -------- | ----------------- | ------------------- |
| Transkription | Whisper large-v3 | RTX 3060 | 10 Min            | $0.05               |
| Transkription | Whisper large-v3 | RTX 4090 | 3 Min.            | $0.05               |
| TTS           | Bark             | RTX 3090 | Echtzeit          | $0.06               |
| TTS           | XTTS             | RTX 3090 | Echtzeit          | $0.06               |
| Music Gen     | Stable Audio     | RTX 3090 | 2x Echtzeit       | $0.12               |

**Beispielkosten:**

* 10 Stunden Podcasts transkribieren: $0.50
* 1 Stunde TTS erzeugen: $0.06
* 30 Minuten Musik erstellen: $0.06

***

### Modelltraining

**Kostenschätzungen für gängige Trainingsaufgaben:**

| Aufgabe                | Datensatz     | GPU       | Zeit          | Gesamtkosten |
| ---------------------- | ------------- | --------- | ------------- | ------------ |
| LoRA-Finetune (7B)     | 10K Beispiele | RTX 4090  | 2–4 Stunden   | $0.20-0.50   |
| LoRA-Finetune (13B)    | 10K Beispiele | A100 40GB | 3–6 Stunden   | $0.50-1.00   |
| Volles Finetuning (7B) | 50K Beispiele | A100 80GB | 24–48 Stunden | $5-12        |
| SD LoRA                | 100 Bilder    | RTX 3090  | 1–2 Stunden   | $0.05-0.12   |
| DreamBooth             | 20 Bilder     | RTX 4090  | 30–60 min     | $0.05-0.10   |

***

## Kostenrechner

### LLM-Inferenzrechner

```
Zu generierende Token: ________
Modellgröße: 7B / 13B / 30B / 70B
GPU-Auswahl: ________

Formel:
Zeit (Stunden) = Token ÷ (Token_pro_Sekunde × 3600)
Kosten = Zeit × Stundenpreis

Beispiel: 1M Token mit 70B auf A100 40GB
Zeit = 1.000.000 ÷ (25 × 3600) = 11,1 Stunden
Kosten = 11,1 × $0.17 = $1.89
```

### Bildgenerierungsrechner

```
Anzahl Bilder: ________
Modell: SD 1.5 / SDXL / FLUX
GPU-Auswahl: ________

Formel:
Zeit (Stunden) = Bilder × Sekunden_pro_Bild ÷ 3600
Kosten = Zeit × Stundenpreis

Beispiel: 1000 SDXL-Bilder auf RTX 4090
Zeit = 1000 × 3 ÷ 3600 = 0,83 Stunden
Kosten = 0,83 × $0.10 = $0.083
```

### Videogenerierungsrechner

```
Videolänge (Sekunden): ________
Modell: SVD / AnimateDiff / Wan2.1
GPU-Auswahl: ________

Formel:
Benötigte Clips = Gesamte Sekunden ÷ Clip-Länge
Zeit (Stunden) = Clips × Generierungszeit ÷ 60
Kosten = Zeit × Stundenpreis

Beispiel: 60 Sekunden mit SVD (4-Sekunden-Clips) auf RTX 4090
Clips = 60 ÷ 4 = 15 Clips
Zeit = 15 × 1,5 ÷ 60 = 0,375 Stunden
Kosten = 0,375 × $0.10 = $0.04
```

***

## Budgetplanung

### Kleines Projekt (\~$5)

Was Sie tun können:

* 5.000+ SD 1.5-Bilder generieren
* 500+ SDXL-Bilder generieren
* 100+ Stunden Audio-Transkriptionen verarbeiten
* 7B-Chatbot 100+ Stunden betreiben
* 5+ LoRA-Modelle trainieren

### Mittleres Projekt (\~$25)

Was Sie tun können:

* 25.000+ SDXL-Bilder generieren
* 5.000+ FLUX-Bilder generieren
* 500+ Stunden Audio verarbeiten
* 70B-Modell 100+ Stunden betreiben
* Mehrere benutzerdefinierte Modelle trainieren
* 30+ Minuten Video generieren

### Großes Projekt (\~$100)

Was Sie tun können:

* Volles Finetuning eines 7B-Modells
* 100.000+ Bilder generieren
* Produktive LLM-API eine Woche betreiben
* Stunden an Videoinhalten generieren
* Mehrere DreamBooth-Modelle trainieren

***

## Tipps zur Kostenoptimierung

### 1. Verwenden Sie Spot-Aufträge

Sparen Sie 30–50% mit Spot-Preisen:

* Ideal für Batch-Jobs
* Speichern Sie häufig Ihre Arbeit
* Vermeiden Sie für zeitkritische Aufgaben

### 2. Wählen Sie die richtige GPU-Größe

Zahlen Sie nicht für ungenutzte Leistung:

| Wenn Sie ...  | Nicht verwenden | Stattdessen verwenden |
| ------------- | --------------- | --------------------- |
| 7B-Chat       | A100            | RTX 3060              |
| SD 1.5-Bilder | RTX 4090        | RTX 3060              |
| SDXL-Bilder   | A100            | RTX 3090              |
| Schnelltests  | A100            | RTX 3060              |

### 3. Verwenden Sie Quantisierung

Reduzieren Sie GPU-Anforderungen:

* Q4: 4x weniger VRAM, etwas geringere Qualität
* Q8: 2x weniger VRAM, minimaler Qualitätsverlust
* AWQ/GPTQ: Für Inferenz optimiert

### 4. Batch-Verarbeitung

Mehr in weniger Zeit verarbeiten:

* Batch-API-Anfragen
* Verwenden Sie größere Batch-Größen
* Führen Sie Übernacht-Jobs aus

### 5. Modelle vorab herunterladen

Vermeiden Sie Zahlungen während des Downloads:

* Verwenden Sie Docker-Images mit vorinstallierten Modellen
* Cachen Sie Modelle auf persistentem Speicher
* Vor dem Start eines kostenpflichtigen Auftrags herunterladen

***

## Vergleich: CLORE.AI vs Alternativen

### vs Cloud-Anbieter (AWS, GCP, Azure)

| Faktor               | CLORE.AI   | Cloud-Anbieter      |
| -------------------- | ---------- | ------------------- |
| A100 Stundenpreis    | $0.17-0.25 | $3-5+               |
| Einrichtungszeit     | Minuten    | Stunden             |
| Mindestverpflichtung | Keine      | Oft stündlich       |
| Spot-Einsparungen    | 30-50%     | 60–90% aber komplex |

**Vorteil von CLORE.AI:** 10–20x günstiger für die meisten KI-Arbeitslasten.

### vs RunPod, Vast.ai

| Faktor           | CLORE.AI         | Andere   |
| ---------------- | ---------------- | -------- |
| Preis            | Wettbewerbsfähig | Ähnlich  |
| GPU-Vielfalt     | Groß             | Groß     |
| Spot-Aufträge    | Ja               | Ja       |
| Krypto-Zahlungen | Ja (nativ)       | Begrenzt |

### vs Lokaler Hardware

| Faktor                 | CLORE.AI      | Lokale RTX 4090 |
| ---------------------- | ------------- | --------------- |
| Anschaffungskosten     | $0            | $1,600+         |
| Monatlich (8 Std./Tag) | \~$24         | \~$15 (Strom)   |
| Break-even             | -             | \~3 Monate      |
| Flexibilität           | Beliebige GPU | Eine GPU        |
| Wartung                | Keine         | Sie             |

**Wann mieten:** Tests, variable Arbeitslasten, Bedarf an High-End-GPUs **Wann kaufen:** Konstanter täglicher Gebrauch, 4+ Std./Tag für 3+ Monate

***

## Praxisbeispiele

### Startup: KI-Chatbot

**Anforderungen:** 70B-Modell, 8 Std./Tag, 30 Tage

```
GPU: A100 40GB
Stunden: 8 × 30 = 240 Stunden
Kosten: 240 × $0.17 = $40.80/Monat

Mit Spot: ~ $28/Monat
```

### Creator: Bildgenerierung

**Anforderungen:** 1000 SDXL-Bilder/Tag, 30 Tage

```
GPU: RTX 4090
Zeit pro Tag: 1000 × 3 Sek = 50 Minuten
Monatliche Stunden: 25 Stunden
Kosten: 25 × $0.10 = $2.50/Monat
```

### Forscher: Modelltraining

**Anforderungen:** 13B-Modell mit 100K Beispielen finetunen

```
GPU: A100 80GB
Geschätzte Zeit: 48 Stunden
Kosten: 48 × $0.25 = $12.00

Mit Spot: ~ $8.00
```

### Agentur: Videoproduktion

**Anforderungen:** 10 Minuten KI-Video/Woche

```
GPU: A100 40GB
Zeit pro Minute: ~5 Minuten Generierung
Wöchentlich: 10 × 5 = 50 Minuten
Monatlich: 200 Minuten = 3,3 Stunden
Kosten: 3,3 × $0.17 = $0.56/Woche = $2.24/Monat
```

***

## Nächste Schritte

* [GPU-Vergleich](/guides/guides_v2-de/erste-schritte/gpu-comparison.md) - Detaillierte GPU-Spezifikationen
* [Modellkompatibilität](/guides/guides_v2-de/erste-schritte/model-compatibility.md) - VRAM-Anforderungen
* [Schnellstart-Anleitung](/guides/guides_v2-de/quickstart.md) - Jetzt loslegen


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-de/erste-schritte/cost-calculator.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.