3D-Gaussian-Splatting

3D Gaussian Splatting ist eine revolutionäre Echtzeit-3D-Szenenrekonstruktionsmethode mit über 15.000 GitHub-Sternen. Im Gegensatz zu NeRF-basierten Methoden stellt Gaussian Splatting Szenen als Millionen winziger 3D-Gaussfunktionen dar, die mit Echtzeit-Bildraten (100+ FPS) gerendert werden können und dabei photorealistische Qualität erreichen. Setzen Sie es auf Clore.ais GPU-Cloud ein, um 3D-Szenen aus Ihren eigenen Fotos zu rekonstruieren und zu erkunden.


Was ist 3D Gaussian Splatting?

Traditionelle NeRF-Methoden kodieren eine Szene implizit in einem neuronalen Netzwerk und erfordern beim Rendern pro Pixel Ray-Marching. Gaussian Splatting verfolgt einen grundlegend anderen Ansatz:

  1. Initialisierung: Beginnen Sie mit einer spärlichen Punktwolke (von COLMAP)

  2. Darstellung: Erweitern Sie jeden Punkt zu einer 3D-Gaussfunktion mit Position, Skala, Rotation, Opazität und Farbinformationen in Kugelharmonischen

  3. Optimierung: Differenzierbar Gaussfunktionen rendern und gegenüber Trainingsbildern optimieren

  4. Rendering: Gaussfunktionen mittels Alpha-Komposition auf die Bildebene projizieren (extrem schnell)

Wesentliche Vorteile gegenüber NeRF:

  • Echtzeit-Rendering (100+ FPS bei 1080p)

  • Bessere Rekonstruktion feiner Details

  • Explizite 3D-Darstellung (bearbeitbar, exportierbar)

  • Schnelleres Training (30–60 Min statt Stunden)

  • Funktioniert auf Consumer-GPUs


Voraussetzungen

Anforderung
Minimum
Empfohlen

GPU-VRAM

12 GB

24 GB

GPU

RTX 3080 12GB

RTX 4090 / A100

RAM

16 GB

32 GB

Speicher

30 GB

60 GB

CUDA

11.7+

12.1+

circle-exclamation

Schritt 1 — Mieten Sie eine GPU auf Clore.ai

  1. Melden Sie sich an bei clore.aiarrow-up-right.

  2. Klicken Sie Marktplatz und filtern Sie nach VRAM ≥ 16 GB.

  3. Wählen Sie einen Server — die RTX 4090 bietet das beste Preis-/Leistungsverhältnis.

  4. Setzen Sie das Docker-Image auf Ihr benutzerdefiniertes Image (siehe Schritt 2).

  5. Offene Ports festlegen: 22 (SSH) und 8080 (Web-Viewer).

  6. Klicken Sie Mieten.


Schritt 2 — Dockerfile

Erstellen Sie ein benutzerdefiniertes Docker-Image mit allen Abhängigkeiten:

Build und Push

Baue das Image und pushe es in dein eigenes Docker Hub-Konto (ersetze YOUR_DOCKERHUB_USERNAME durch deinen tatsächlichen Benutzernamen):

circle-info

Es gibt kein offizielles vorgefertigtes Docker-Image für 3D Gaussian Splatting auf Docker Hub. Das offizielle Repository unter graphdeco-inria/gaussian-splattingarrow-up-right bietet keines an — bauen Sie es aus dem obigen Dockerfile. Das Image muss mit den korrekten CUDA-Architekturflags erstellt werden, die zu Ihrer Ziel-GPU passen.

Verwende YOUR_DOCKERHUB_USERNAME/gaussian-splatting:latest in Ihrer Clore.ai-Konfiguration.


Schritt 3 — Verbindung per SSH

Überprüfen Sie den Build:


Schritt 4 — Bereiten Sie Ihr Dataset vor

Option A: Verwenden Sie das Tandt (Tanks and Temples) Dataset

Klassisches Benchmark-Dataset für schnelle Tests:

Option B: Verarbeiten Sie Ihre eigenen Fotos

circle-info

Der convert.py Das Skript führt die gesamte COLMAP-Pipeline aus: Merkmalserkennung, Matching, spärliche Rekonstruktion und Entzerrung. Das dauert je nach Bildanzahl 5–30 Minuten.

Option C: Verarbeitung aus Video


Schritt 5 — Trainieren Sie einen Gaussian Splat

Standardtraining

Training auf dem Tandt-Dataset

Schnelles Training (Schnellvorschau)

circle-info

Training bis 7.000 Iterationen dauert ~10 Minuten auf einer RTX 4090 und liefert eine gute Vorschauqualität. Vollständige 30.000 Iterationen dauern ~30–40 Minuten und erzeugen die Endqualität.

Trainingsfortschritt

Überwachen Sie die Trainingsausgabe — Sie sehen Metriken wie:

PSNR über 30 dB deutet auf eine hochqualitative Rekonstruktion hin.


Schritt 6 — Rendern und Visualisieren

Aus trainiertem Modell rendern

Gerenderte Bilder werden gespeichert unter /workspace/output/my_scene/test/ours_30000/renders/.

Erstellen Sie ein Flythrough-Video

Metriken auswerten

Erwartete Ausgabe:


Schritt 7 — Interaktiver Web-Viewer

Um die trainierte Szene interaktiv zu erkunden:

Verwendung von nerfview/viser

Öffnen Sie dann: http://<clore-host>:<public-port-8080>

Alternative: Verwenden Sie SuperSplat (browserbasierter Viewer)

Laden Sie die .ply Datei herunter und öffnen Sie sie in SuperSplatarrow-up-right:

Ziehen Sie dann per Drag & Drop die .ply in den SuperSplat-Browser unter: https://playcanvas.com/super-splat


Erweiterte Optionen

Anzahl der Gaussfunktionen steuern

Weißer Hintergrund (für Objekte)

Große Szenen im Maßstab


Alternative: Gaussian Splatting mit gsplat

gsplat ist eine schnellere, speichereffiziente Implementierung:


Fehlerbehebung

CUDA-Erweiterungs-Build schlägt fehl

Lösung: Bauen Sie neu für Ihre spezifische GPU-Architektur:

COLMAP kann nicht rekonstruieren

Lösungen:

  • Stellen Sie ≥ 50% Bildüberlappung sicher

  • Verwenden Sie mehr Fotos (100+ empfohlen)

  • Versuchen Sie sequentielles Matching für Video-Frames: fügen Sie --match sequential zu convert.py hinzu

Während des Trainings kein Speicher mehr

Schwebende Artefakte in der Szene

Schwebende Artefakte durch Gauss-Initialisierung:

  • Erhöhen --densify_grad_threshold um selektiver zu sein

  • Verwende --prune_opacity_threshold 0.005 um Gaussfunktionen mit geringer Opazität früher zu entfernen


Clore.ai GPU-Empfehlungen

Das Training von Gaussian Splatting ist GPU-rechenintensiv mit häufigen CUDA-Kernel-Aufrufen. VRAM bestimmt die maximale Szenenkomplexität (Anzahl der Gaussfunktionen); Rechenleistung bestimmt die Trainingsgeschwindigkeit.

GPU
VRAM
Clore.ai-Preis
30K-Iter-Training
Max. Gaussfunktionen

RTX 3090

24 GB

~$0.12/Stunde

~45–55 Min

~6M

RTX 4090

24 GB

~$0.70/Stunde

~30–35 Min

~6M

A100 40GB

40 GB

~$1.20/Stunde

~12–18 Min

~10M+

RTX 3080 12GB

12 GB

~$0.08/Stunde

~70 Min

~3M (begrenzt)

circle-info

RTX 3090 zu ~$0.12/Stunde ist die beste Wahl für Gaussian Splatting. Ein vollständiger 30K-Iterationen-Trainingslauf kostet ~$0.09–0.11 an GPU-Zeit. Für mehrere Szenen in einer Sitzung sind die Kosten vernachlässigbar.

Für schnelle Experimente: trainieren Sie zunächst bis 7.000 Iterationen (~15 Min auf RTX 3090, ~$0.03). Prüfen Sie die Qualität im Web-Viewer. Führen Sie nur für das endgültige Ergebnis die vollen 30K Iterationen aus.

Hinweis zur COLMAP-Vorverarbeitung: COLMAP (Structure from Motion) läuft auf CPU/GPU, aber die schwere Berechnung erfolgt auf der CPU. Die meisten Clore.ai-Server haben ausreichend CPUs für Szenen mit weniger als 200 Bildern. Für Datensätze mit 500+ Bildern suchen Sie nach Servern mit 16+ CPU-Kernen.


Nützliche Ressourcen

Zuletzt aktualisiert

War das hilfreich?