# Fehlerbehebung

Häufige Probleme und Lösungen beim Mieten von GPU-Servern auf dem CLORE.AI-Marktplatz.

{% hint style="success" %}
Alle Beispiele können auf GPU-Servern ausgeführt werden, die über [CLORE.AI Marketplace](https://clore.ai/marketplace).
{% endhint %}

{% hint style="info" %}
Diese Anleitung basiert auf der technischen Dokumentation der CLORE.AI-Plattform.
{% endhint %}

## Inhaltsverzeichnis

* [Probleme bei der Auftragserstellung](#order-creation-issues)
* [Verbindungsprobleme](#connection-issues)
* [Container-Probleme](#container-issues)
* [GPU-Probleme](#gpu-issues)
* [Zahlungsprobleme](#payment-issues)
* [Plattformbeschränkungen](#platform-limits)

***

## Probleme bei der Auftragserstellung

### Auftrag schlägt fehl: "Unzureichendes Guthaben"

**Ursache:** Nicht genügend Mittel, um die Erstellungsgebühr und die Mindesteinzahlung zu decken.

**Lösung:**

* Überprüfen Sie Ihr Guthaben in der gewählten Währung (CLORE, BTC oder USDT/USDC)
* Die Erstellungsgebühr wird bei Erstellung des Auftrags belastet
* Laden Sie Ihr Guthaben mit ausreichend Mitteln für mehrere Stunden Miete auf

### Auftrag schlägt fehl: "Server nicht verfügbar"

**Ursache:** Server ist bereits vermietet oder offline.

**Lösung:**

* Aktualisieren Sie die Marktplatzseite
* Überprüfen Sie den Serverstatus (Online-/Offline-Anzeige)
* Bei Spot-Mieten - Sie wurden möglicherweise überboten

### Auftrag bleibt im Status "Erstellung" hängen

**Ursache:** Container wird bereitgestellt oder es ist ein Fehler aufgetreten.

**Lösung:**

1. Warten Sie 2–5 Minuten (Docker-Image wird heruntergeladen)
2. Überprüfen Sie die Protokolle in **Meine Bestellungen**
3. Große Images (10GB+) benötigen länger zum Herunterladen
4. Wenn es länger als 10 Minuten hängt - abbrechen und erneut versuchen

***

## Verbindungsprobleme

### Keine Verbindung per SSH möglich

**Ursache:** Port nicht konfiguriert oder Container nicht bereit.

**Checkliste:**

1. Port 22 muss als festgelegt sein **TCP** (nicht HTTP)
2. Container-Status muss sein **Aktiv** (nicht Erstellung)
3. Verwenden Sie den korrekten zugeordneten Port aus **Meine Bestellungen**

**Korrektes SSH-Kommando:**

```bash
ssh -p <MAPPED_PORT> root@<PROXY_ADDRESS>
```

Wo `<MAPPED_PORT>` der öffentliche Port ist (z. B. 45678), NICHT Port 22.

### SSH funktioniert, aber die Weboberfläche öffnet sich nicht

**Ursache:** Port als TCP statt HTTP gesetzt oder Dienst läuft nicht.

**Lösung:**

1. Weboberflächen-Ports müssen als festgelegt sein **HTTP** (nicht TCP)
2. Dienst muss lauschen auf `0.0.0.0`, nicht `localhost`
3. Überprüfen Sie die Protokolle – der Dienst könnte beim Start abgestürzt sein

**Korrekte Port-Konfiguration:**

```
22/tcp      - SSH-Zugang
7860/http   - Gradio/WebUI-Oberfläche
8000/http   - API-Server
```

### "Connection refused"-Fehler

**Ursache:** Dienst im Container läuft nicht oder lauscht an der falschen Adresse.

**Lösung:**

1. SSH in den Container und überprüfen Sie den Dienststatus:

   ```bash
   ps aux | grep python
   netstat -tlnp
   ```
2. Dienst muss lauschen auf `0.0.0.0`, nicht `127.0.0.1`:

   ```bash
   # Falsch:
   python app.py --host 127.0.0.1

   # Richtig:
   python app.py --host 0.0.0.0
   ```

### "Connection timed out"-Fehler

**Ursache:** Falsche Adresse/Port oder Netzwerkprobleme.

**Checkliste:**

1. Verwenden Sie die Proxy-Adresse aus **Meine Bestellungen** (nicht Server-IP!)
2. Verwenden Sie den zugeordneten Port (öffentlicher Port, nicht Container-Port)
3. Verwenden Sie das richtige Protokoll (http\:// für HTTP-Ports)

***

## Container-Probleme

### Container startet ständig neu

**Ursache:** Fehler im Startbefehl oder unzureichende Ressourcen.

**Lösung:**

1. Überprüfen Sie die Protokolle in **Meine Bestellungen**
2. Vereinfachen Sie den Startbefehl:

   ```bash
   # Schlecht - langer Befehl kann fehlschlagen:
   apt update && apt install -y ... && pip install ... && python ...

   # Besser - beginnen Sie mit einfachem Befehl:
   sleep infinity
   ```
3. Dann per SSH einloggen und manuell konfigurieren

### Container kann nicht zurückgesetzt werden

**Ursache:** Abkühlzeit zwischen Zurücksetzungen.

**Tatsache:** Das Zurücksetzen des Containers hat eine **120 Sekunden** Abkühlzeit.

**Lösung:** Warten Sie 2 Minuten zwischen Reset-Versuchen.

### Daten nach Neustart verloren

**Ursache:** Daten sind nicht im persistenten Speicher.

**Wichtig:**

* Daten innerhalb des Containers werden **beibehalten** bei Zurücksetzen des Containers
* Daten werden **verloren** wenn der Auftrag storniert oder abläuft
* Laden Sie Ergebnisse immer herunter, bevor Sie die Miete beenden:

  ```bash
  scp -P <port> root@<proxy>:/workspace/results.tar.gz ./
  ```

### Startbefehl wird nicht ausgeführt

**Ursache:** Syntaxfehler oder Image-Problem.

**Häufige Fehler:**

```bash

# Fehler: zusätzliches Leerzeichen nach \
apt update && \
apt install -y git   # <-- Leerzeichen vor der nächsten Zeile

# Richtig:
apt update && \
apt install -y git && \
python app.py
```

**Lösung:**

1. Verwenden Sie einfachen Start: `bash` oder `sleep infinity`
2. Konfigurieren Sie alles per SSH
3. Oder erstellen Sie ein benutzerdefiniertes Docker-Image mit vorinstallierter Software

***

## GPU-Probleme

### GPU im Container nicht sichtbar

**Überprüfen:**

```bash
nvidia-smi
```

**Wenn Befehl nicht gefunden:**

* Docker-Image muss CUDA unterstützen
* Verwenden Sie CUDA-fähige Images: `pytorch/pytorch:2.5.1-cuda12.4-cudnn9-runtime`

**Wenn GPU nicht angezeigt wird:**

* Überprüfen Sie, ob der Server eine GPU hat (Marktplatz-Eintrag prüfen)
* Kontaktieren Sie den Serveranbieter

### CUDA-Versionskonflikt

**Fehler:** `CUDA-Treiberversion ist unzureichend für die CUDA-Runtime-Version`

**Ursache:** CUDA-Version im Image ist mit dem Server-Treiber inkompatibel.

**Lösung:**

* Überprüfen Sie die Treiberversion: `nvidia-smi` (oben rechts)
* Verwenden Sie ein Image mit kompatibler CUDA-Version
* Sichere Optionen: CUDA 11.8, CUDA 12.1

### Nicht genügend GPU-Speicher

**Fehler:** `CUDA out of memory`

**Lösungen:**

1. Verwenden Sie ein kleineres Modell oder Quantisierung
2. Fügen Sie Speicheroptimierungs-Flags hinzu:
   * Stable Diffusion: `--medvram` oder `--lowvram`
   * LLMs: `load_in_4bit=True` oder `load_in_8bit=True`
3. Speicher leeren: `torch.cuda.empty_cache()`
4. Mieten Sie einen Server mit mehr VRAM

***

## Zahlungsprobleme

### Unterstützte Währungen

CLORE.AI unterstützt drei Währungen:

* **CLORE** - natives Token der Plattform
* **BTC** - Bitcoin
* **USD** - Stablecoins (falls vom Anbieter aktiviert)

### Auftrag storniert: "Überboten"

**Ursache:** Jemand bot einen höheren Preis auf dem Spot-Markt.

**Lösung:**

* Verwenden Sie **On-Demand** für garantierte Miete
* Oder erhöhen Sie Ihren Spot-Gebotspreis

### Guthaben belastet, aber Auftrag nicht erstellt

**Ursache:** Die Erstellungsgebühr wird auch dann belastet, wenn der Auftrag fehlschlägt.

**Lösung:**

* Die Erstellungsgebühr ist in der Regel minimal
* Überprüfen Sie den Stornierungsgrund in der Historie
* Kontaktieren Sie den Support bei wiederkehrenden Problemen

***

## Plattformbeschränkungen

Verifiziert aus dem CLORE.AI-Codebestand:

| Parameter                               | Limit                     |
| --------------------------------------- | ------------------------- |
| Ports pro Auftrag                       | **5**                     |
| Gesamte Umgebungsvariablen              | **12.288 Zeichen** (12KB) |
| Name einer einzelnen Umgebungsvariablen | 128 Zeichen               |
| Wert einer einzelnen Umgebungsvariablen | 1.536 Zeichen             |
| SSH-Schlüssel                           | **3.072 Zeichen**         |
| SSH-Passwort                            | **32 Zeichen**            |
| Jupyter-Token                           | **32 Zeichen**            |
| Cooldown für Container-Reset            | **120 Sekunden**          |
| Port-Bereich                            | 1-65535                   |
| Port-Protokolle                         | Nur TCP oder HTTP         |

***

## Umgebungsvariablen

Verwenden Sie Umgebungsvariablen für SSH- und Jupyter-Zugriff:

| Variable        | Zweck                          | Maximale Länge |
| --------------- | ------------------------------ | -------------- |
| `SSH_KEY`       | Ihr öffentlicher SSH-Schlüssel | 3.072 Zeichen  |
| `SSH_PASSWORD`  | SSH-Passwort                   | 32 Zeichen     |
| `JUPYTER_TOKEN` | Jupyter-Notebook-Token         | 32 Zeichen     |

**Beispielkonfiguration:**

```
SSH_PASSWORD=mypassword123
JUPYTER_TOKEN=mysecrettoken
```

***

## Diagnosebefehle

```bash

# GPU prüfen
nvidia-smi

# Speicherverbrauch prüfen
free -h

# Festplattenspeicher prüfen
df -h

# Laufende Prozesse prüfen
ps aux | grep python

# Offene Ports prüfen
netstat -tlnp

# Aktuelle Fehlermeldungen prüfen
dmesg | tail -50

# GPU-Speicher leeren (Python)
import torch
torch.cuda.empty_cache()
```

***

## Hilfe erhalten

Wenn das Problem weiterhin besteht:

1. Überprüfen Sie [CLORE.AI-Dokumentation](https://docs.clore.ai/)
2. Beschreiben Sie das Problem mit Protokollen und Screenshots
3. Fügen Sie Auftrags-ID und Server-ID bei
