ChromaDB

ChromaDB Open‑Source Vektor-Datenbank für KI‑Anwendungen auf Clore.ai‑GPUs bereitstellen

ChromaDB ist die führende Open-Source-Vektordatenbank speziell für KI-Anwendungen entwickelt. Sie bietet eine einfache, intuitive API zum Speichern, Abfragen und Verwalten hochdimensionaler Embeddings — das Rückgrat moderner RAG-Systeme, semantischer Suche, Empfehlungssysteme und LLM-Speicher.

ChromaDB nimmt die Komplexität der Vektorähnlichkeitssuche ab, sodass Sie sich auf den Aufbau von KI-Anwendungen konzentrieren können. Es unterstützt sowohl einen In-Memory-Modus für die Entwicklung als auch einen persistenten Servermodus für Produktionsbereitstellungen, mit Docker-Unterstützung für eine einfache Bereitstellung auf Clore.ai GPU-Servern.

Wichtige Funktionen:

  • 🚀 Einfache Python/JavaScript-API — in wenigen Minuten loslegen

  • 💾 Persistenter Speicher — Daten überleben Container-Neustarts

  • 🔍 Mehrere Distanzmetriken — Kosinus, L2, Skalarprodukt

  • 📦 Integrierte Embeddings — eingebaute Unterstützung für OpenAI, Cohere, sentence-transformers

  • 🏗️ Mandantenfähig — Collections zur Organisation verschiedener Datensätze

  • 🔌 REST-API — sprachunabhängige HTTP-Schnittstelle

  • Schnell — HNSW-Index für approximative nächstgelegene Nachbarschaftssuche

  • 🔗 LangChain/LlamaIndex-nativ — erstklassige Integration

circle-check

Serveranforderungen

Parameter
Minimum
Empfohlen

GPU

Jede NVIDIA-GPU (optional)

NVIDIA RTX 3080+ (für Embeddings)

VRAM

Für ChromaDB nicht erforderlich

8–16 GB (für lokale Embedding-Modelle)

RAM

4 GB

16–32 GB

CPU

2 Kerne

8 Kerne

Festplatte

10 GB

50–200 GB (für große Datensätze)

Betriebssystem

Ubuntu 20.04+

Ubuntu 22.04

Docker

Erforderlich

Docker + Docker Compose

Ports

22, 8000

22, 8000

circle-info

ChromaDB selbst benötigt keine GPU — es läuft effizient auf der CPU. Allerdings Erzeugen von Embeddings (Umwandlung von Text in Vektoren) profitiert stark von GPU-Beschleunigung. Wenn Sie vorhaben, lokale Embedding-Modelle (sentence-transformers etc.) zu verwenden, wählen Sie einen Server mit GPU.


Schnelle Bereitstellung auf CLORE.AI

1. Finden Sie einen geeigneten Server

Gehe zu CLORE.AI Marketplacearrow-up-right und wählen Sie:

  • Nur CPU für ChromaDB-Server + API (speichern Sie vorab berechnete Embeddings)

  • GPU-Server wenn Sie Embeddings auch lokal erzeugen möchten

2. Konfigurieren Sie Ihre Bereitstellung

Docker-Image:

Portzuordnungen:

Umgebungsvariablen:

Startbefehl:

3. Testen Sie die Bereitstellung


Schritt-für-Schritt-Einrichtung

Schritt 1: SSH auf Ihren Server

Schritt 2: Erstellen Sie das Datenverzeichnis

Schritt 3: Starten Sie den ChromaDB-Container

Schritt 4: Überprüfen Sie, ob er läuft

Schritt 5: Installieren Sie den Python-Client

Schritt 6: Testen Sie die Konnektivität aus Python

Schritt 7: (Optional) Authentifizierung aktivieren


Beispielanwendungen

Beispiel 1: Grundlegende Vektor-Store-Operationen


Beispiel 2: Semantische Suche


Beispiel 3: RAG-Pipeline mit ChromaDB + OpenAI


Beispiel 4: Dokumentenverwaltung mit mehreren Collections


Beispiel 5: Filterung und Metadaten-Abfragen


Konfiguration

Docker Compose (Produktion)

Referenz der Umgebungsvariablen

Variable
Standard
Beschreibung

IS_PERSISTENT

FALSE

Persistenten Speicher aktivieren

ANONYMIZED_TELEMETRY

TRUE

Nutzungs-Tracking deaktivieren

CHROMA_SERVER_LOG_LEVEL

INFO

Protokollierungsstufe

CHROMA_MEMORY_LIMIT_BYTES

Keiner

Maximaler Speicher für Segment-Cache

ALLOW_RESET

FALSE

Erlaubt das Zurücksetzen aller Daten über die API

CHROMA_SERVER_AUTH_PROVIDER

Keiner

Authentifizierungsanbieter-Klasse


Leistungs-Tipps

1. Wählen Sie das richtige Embedding-Modell

Modell
Dimensionen
Geschwindigkeit
Qualität
GPU erforderlich

all-MiniLM-L6-v2

384

Schnell

Gut

Nein

all-mpnet-base-v2

768

Mittel

Besser

Optional

text-embedding-3-small

1536

Schnell

Sehr gut

Nur API

BAAI/bge-large-en-v1.5

1024

Mittel

Beste

Ja

2. Batch-Upserts für Geschwindigkeit

3. HNSW-Index-Tuning

4. Persistenter Client für lokale Nutzung


Fehlerbehebung

Problem: Keine Verbindung zu ChromaDB möglich

Problem: Daten nach Container-Neustart verloren

Problem: Out-of-Memory-Fehler

Problem: Langsame Embedding-Erzeugung

Problem: Collection nach Neustart nicht gefunden



Clore.ai GPU-Empfehlungen

Anwendungsfall
Empfohlene GPU
Geschätzte Kosten auf Clore.ai

Entwicklung/Tests

RTX 3090 (24GB)

~$0.12/gpu/hr

Produktion RAG

RTX 3090 (24GB)

~$0.12/gpu/hr

Hochdurchsatz-Embedding

RTX 4090 (24GB)

~$0.70/gpu/hr

💡 Alle Beispiele in diesem Leitfaden können bereitgestellt werden auf Clore.aiarrow-up-right GPU-Servern. Durchsuchen Sie verfügbare GPUs und mieten Sie stundenweise — keine Verpflichtungen, voller Root-Zugriff.

Zuletzt aktualisiert

War das hilfreich?