RAGFlow

Deploye die RAGFlow-Engine für tiefes Dokumentenverständnis auf Clore.ai-GPUs

RAGFlow ist eine Open-Source- Retrieval-Augmented-Generation-(RAG)-Engine mit tiefgehenden Dokumentenverständnis-Fähigkeiten. Mit über 50.000 GitHub-Sternen, ist es eine der umfassendsten RAG-Plattformen — konzipiert, um komplexe Dokumente einschließlich PDFs, Word-Dateien, Tabellenkalkulationen, Bildern und mehr zu extrahieren, zu zerteilen und darüber zu schlussfolgern.

Im Gegensatz zu einfachen RAG-Systemen, die Dokumente naiv in Fragmente aufteilen, verwendet RAGFlow layout- und struktur-aware Parsing, um Dokumentenaufbau, Tabellen, Abbildungen und Mehrspaltentexte zu verstehen. Das führt zu deutlich höherer Retrieval-Genauigkeit und besserer Antwortqualität.

Wichtige Funktionen:

📄 Tiefgehendes Dokumentenverständnis — OCR, Tabellenerkennung, Abbildungserkennung
🔍 Mehrere Chunking-Strategien — semantisch, layout-bewusst, feste Größe, Q&A-Stil
🤖 LLM-Integration — funktioniert mit OpenAI, Ollama, Anthropic, lokalen Modellen
🌐 Voll ausgestattetes WebUI — Drag-and-Drop-Dokumentenverwaltung
🔌 REST-API — integrieren Sie RAGFlow in jede Anwendung
📊 Zitationsverfolgung — Antworten enthalten Referenzen auf Quelldokumente
🏗️ Mandantenfähig — Team-Arbeitsbereiche mit Berechtigungskontrolle

Alle Beispiele können auf GPU-Servern ausgeführt werden, die über CLORE.AI Marketplace.

Serveranforderungen

Parameter

Minimum

Schnelle Bereitstellung auf CLORE.AI

1. Finden Sie einen geeigneten Server

Gehe zu CLORE.AI Marketplace und filtern Sie nach:

VRAM: ≥ 8 GB
RAM: ≥ 16 GB
Festplatte: ≥ 50 GB
GPU: RTX 3090, 4090, A100, H100

2. Konfigurieren Sie Ihre Bereitstellung

Docker-Image:

infiniflow/ragflow:latest

Portzuordnungen:

22   → SSH-Zugriff
80   → RAGFlow Web-UI (HTTP)
9380 → RAGFlow API

Startbefehl:

bash -c "docker-compose -f docker/docker-compose.yml up -d"

3. Greifen Sie auf das WebUI zu

http://<your-clore-server-ip>:80

Standardanmeldedaten: [email protected] / admin

Schritt-für-Schritt-Einrichtung

Schritt 1: SSH auf Ihren Server

ssh root@<your-clore-server-ip> -p <ssh-port>

Schritt 2: Docker Compose installieren

apt-get update && apt-get install -y docker-compose-plugin

# Überprüfen
docker compose version

Schritt 3: Das RAGFlow-Repository klonen

cd /workspace
git clone https://github.com/infiniflow/ragflow.git
cd ragflow

Schritt 4: Umgebung konfigurieren

# Kopieren und die Umgebungsdatei bearbeiten
cp docker/.env.example docker/.env
nano docker/.env

Wichtige Einstellungen zum Konfigurieren:

# LLM-Konfiguration
OPENAI_API_KEY=your-openai-api-key

# Oder verwenden Sie eine lokale Ollama-Instanz
OLLAMA_BASE_URL=http://localhost:11434

# Speichereinstellungen
MINIO_USER=ragflow
MINIO_PASSWORD=infini_rag_flow

# MySQL-Einstellungen
MYSQL_PASSWORD=infini_rag_flow

# Anwendungsport
HTTP_PORT=80
RAGFLOW_API_PORT=9380

Schritt 5: Wählen Sie die richtige Image-Variante

# Verfügbare Tags prüfen
# Für CUDA 12.1 (die meisten RTX-Karten)
docker pull infiniflow/ragflow:latest

# Für eine bestimmte CUDA-Version
docker pull infiniflow/ragflow:v0.7.0-cuda12.1

Schritt 6: Starten Sie alle Dienste

cd /workspace/ragflow/docker

# Starten mit GPU-Unterstützung
docker compose -f docker-compose.yml up -d

# Startvorgang überwachen (dauert 2–5 Minuten)
docker compose logs -f

Warten auf:

ragflow-server | INFO: Application startup complete.

Schritt 7: Administratorkonto anlegen

Offen http://<server-ip>:80 und registrieren Sie das erste Administratorkonto.

Schritt 8: LLM-Modell konfigurieren

Gehe zu Einstellungen → Modellanbieter
Fügen Sie Ihr LLM hinzu (OpenAI, Ollama, etc.)
Setzen Sie das Standard-Chat-Modell und das Embedding-Modell

Beispielanwendungen

Beispiel 1: Dokumente per WebUI hochladen und abfragen

Melden Sie sich an bei http://<server-ip>:80
Klicken Sie "Knowledge Base" → "Knowledge Base erstellen"
Benennen Sie es: "Clore.ai Dokumentation"
PDF/Word/TXT-Dateien per Drag-and-Drop hochladen
Warten Sie auf das Parsen (Fortschritt im UI angezeigt)
Gehe zu "Chat" → Erstellen Sie einen neuen Assistenten, der mit Ihrer Knowledge Base verknüpft ist
Stellen Sie Fragen zu Ihren Dokumenten

Beispiel 2: API — Knowledge Base erstellen und Dokumente hochladen

import requests
import json
from pathlib import Path

BASE_URL = "http://<your-clore-server-ip>:9380"
API_KEY = "your-ragflow-api-key"  # Abruf unter Einstellungen → API

headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

# Schritt 1: Eine Knowledge Base erstellen
kb_payload = {
    "name": "Clore.ai Technical Docs",
    "description": "GPU-Cloud-Marktplatz-Dokumentation und Leitfäden",
    "language": "English",
    "embedding_model": "text-embedding-ada-002",
    "chunk_method": "naive",  # oder 'qa', 'table', 'paper', 'book'
}

response = requests.post(
    f"{BASE_URL}/api/v1/knowledgebase",
    headers=headers,
    json=kb_payload
)
kb = response.json()
kb_id = kb["data"]["id"]
print(f"Erstellte Knowledge Base: {kb_id}")

# Schritt 2: Ein Dokument hochladen
pdf_path = Path("technical_manual.pdf")

with open(pdf_path, "rb") as f:
    files = {"file": (pdf_path.name, f, "application/pdf")}
    upload_response = requests.post(
        f"{BASE_URL}/api/v1/document/upload?kb_id={kb_id}",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files=files
    )

doc = upload_response.json()
doc_id = doc["data"]["id"]
print(f"Hochgeladenes Dokument: {doc_id}")

# Schritt 3: Parsen starten
parse_response = requests.post(
    f"{BASE_URL}/api/v1/document/run",
    headers=headers,
    json={"doc_ids": [doc_id]}
)
print(f"Parsen gestartet: {parse_response.json()}")

Beispiel 3: Dokumente per API abfragen

import requests
import json

BASE_URL = "http://<your-clore-server-ip>:9380"
API_KEY = "your-ragflow-api-key"
CHAT_ID = "your-chat-assistant-id"  # Aus WebUI → Chat

headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

def ask_ragflow(question, chat_id, session_id=None):
    """Senden Sie eine Frage an RAGFlow und erhalten Sie eine Antwort mit Zitaten."""
    payload = {
        "question": question,
        "stream": False
    }

    if session_id:
        payload["session_id"] = session_id

    response = requests.post(
        f"{BASE_URL}/api/v1/chat/{chat_id}/completion",
        headers=headers,
        json=payload
    )

    result = response.json()
    if result.get("code") == 0:
        data = result["data"]
        answer = data.get("answer", "")
        references = data.get("reference", {}).get("chunks", [])
        return answer, references
    else:
        return None, []

# Beispielanfragen
questions = [
    "Welche GPU-Spezifikationen sind auf Clore.ai verfügbar?",
    "Wie miete ich einen GPU-Server auf dem Marktplatz?",
    "Wie sieht das Preismodell für GPU-Instanzen aus?",
    "Welche Deep-Learning-Frameworks werden unterstützt?",
]

for question in questions:
    print(f"\n📌 Q: {question}")
    answer, refs = ask_ragflow(question, CHAT_ID)
    print(f"💬 A: {answer}")
    if refs:
        print(f"📚 Quellen ({len(refs)} Chunks):")
        for ref in refs[:2]:
            print(f"   - {ref.get('docnm_kwd', 'Unbekannt')}: {ref.get('content_ltks', '')[:100]}...")

Beispiel 4: Batch-Dokumentenverarbeitungspipeline

import requests
import time
from pathlib import Path

BASE_URL = "http://<your-clore-server-ip>:9380"
API_KEY = "your-ragflow-api-key"

headers = {"Authorization": f"Bearer {API_KEY}"}

def upload_and_parse_documents(kb_id, document_paths):
    """Mehrere Dokumente hochladen und auf Abschluss des Parsens warten."""
    doc_ids = []

    # Alle Dokumente hochladen
    for doc_path in document_paths:
        path = Path(doc_path)
        with open(path, "rb") as f:
            mime = "application/pdf" if path.suffix == ".pdf" else "text/plain"
            files = {"file": (path.name, f, mime)}
            resp = requests.post(
                f"{BASE_URL}/api/v1/document/upload?kb_id={kb_id}",
                headers=headers,
                files=files
            )
            if resp.status_code == 200:
                doc_id = resp.json()["data"]["id"]
                doc_ids.append(doc_id)
                print(f"✓ Hochgeladen: {path.name} → {doc_id}")
            else:
                print(f"✗ Fehlgeschlagen: {path.name}")

    # Batch-Parsing starten
    if doc_ids:
        requests.post(
            f"{BASE_URL}/api/v1/document/run",
            headers={**headers, "Content-Type": "application/json"},
            json={"doc_ids": doc_ids}
        )
        print(f"\nParsen von {len(doc_ids)} Dokumenten...")

        # Abfragen, bis abgeschlossen
        while True:
            time.sleep(5)
            status_resp = requests.get(
                f"{BASE_URL}/api/v1/document/list?kb_id={kb_id}",
                headers=headers
            )
            docs = status_resp.json().get("data", {}).get("docs", [])
            pending = [d for d in docs if d.get("status") == "1"]  # 1 = Verarbeitung
            done = [d for d in docs if d.get("status") == "2"]     # 2 = abgeschlossen

            print(f"  In Bearbeitung: {len(pending)} | Fertig: {len(done)}/{len(doc_ids)}")

            if len(pending) == 0:
                break

    print("✓ Alle Dokumente geparst!")
    return doc_ids

# Verwendung
docs = ["manual_v1.pdf", "faq.txt", "api_reference.pdf"]
doc_ids = upload_and_parse_documents(kb_id="your-kb-id", document_paths=docs)

Beispiel 5: RAGFlow mit lokalem Ollama-LLM

# 1. Ollama auf demselben Clore.ai-Server installieren
curl -fsSL https://ollama.ai/install.sh | sh

# 2. Ein lokales Modell herunterladen
ollama pull llama3:8b
ollama pull nomic-embed-text  # Für Embeddings

# 3. RAGFlow so konfigurieren, dass Ollama verwendet wird
# Im WebUI: Einstellungen → Modellanbieter → Ollama hinzufügen
# Basis-URL: http://host.docker.internal:11434
# Oder wenn Ollama in Docker läuft: http://ollama:11434

# Ollama-Integration testen
import requests

# Überprüfen, ob Ollama läuft
resp = requests.get("http://localhost:11434/api/tags")
models = [m["name"] for m in resp.json()["models"]]
print(f"Verfügbare Ollama-Modelle: {models}")

# RAGFlow mit lokalem LLM abfragen (im WebUI konfiguriert)
BASE_URL = "http://localhost:9380"
API_KEY = "your-api-key"
CHAT_ID = "your-chat-id"

response = requests.post(
    f"{BASE_URL}/api/v1/chat/{CHAT_ID}/completion",
    headers={"Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json"},
    json={"question": "Explain the RAGFlow architecture", "stream": False}
)
print(response.json()["data"]["answer"])

Konfiguration

docker-compose.yml Schlüsselservices

services:
  ragflow:
    image: infiniflow/ragflow:latest
    ports:
      - "9380:9380"
      - "80:80"
    environment:
      - HF_ENDPOINT=https://huggingface.co
      - MACOS=0
    depends_on:
      - mysql
      - minio
      - es01
      - redis

  es01:
    image: elasticsearch:8.11.3
    environment:
      - xpack.security.enabled=false
      - discovery.type=single-node
    volumes:
      - esdata01:/usr/share/elasticsearch/data

  mysql:
    image: mysql:8.0.39
    environment:
      - MYSQL_ROOT_PASSWORD=infini_rag_flow

  minio:
    image: quay.io/minio/minio:RELEASE.2023-12-20T01-00-02Z
    command: server /data --console-address ":9001"

  redis:
    image: redis:7.2.4

Chunking-Strategien

Methode

Am besten für

Beschreibung

naiv

Allgemeine Dokumente

Chunks fester Größe mit Überlappung

qa

FAQ-/Q&A-Dokumente

Teilt anhand von Frage-Antwort-Paaren

table

Tabellenkalkulationen, Tabellen

Bewahrt Tabellenstruktur

paper

Wissenschaftliche Artikel

Abschnitte, Abstract, Referenzen

book

Lange Bücher, Handbücher

Kapitelerkennendes Chunking

laws

Rechtliche Dokumente

Artikelbasiertes Chunking

manual

Technische Handbücher

Erhaltung der Abschnittshierarchie

Leistungs-Tipps

1. Elasticsearch-Speicher skalieren

# In docker-compose.yml
es01:
  environment:
    - ES_JAVA_OPTS=-Xms4g -Xmx4g  # Für große Dokumentensätze erhöhen

2. GPU-beschleunigte Embeddings

Konfigurieren Sie RAGFlow so, dass ein GPU-basiertes Embedding-Modell verwendet wird:

In Einstellungen → Modellanbieter ein lokales GPU-Modell über Ollama verwenden
Oder verweisen Sie auf einen dedizierten Embedding-Dienst, der auf der Clore.ai-GPU läuft

3. Parallele Dokumentenverarbeitung

RAGFlow verarbeitet Dokumente standardmäßig parallel. Konfigurieren Sie die Anzahl der Worker:

# In docker/.env
TASK_WORKER_COUNT=4  # An CPU-Kerne anpassen

4. MinIO für große Dokumentensätze

Für Deployments mit tausenden Dokumenten konfigurieren Sie dedizierten MinIO-Speicher mit größerer Festplattenzuweisung in Ihrer CLORE.AI-Bestellung.

Fehlerbehebung

Problem: Dienste starten nicht (Speicher)

# Speicherverbrauch prüfen
free -h
docker stats

# Elasticsearch-Speicher reduzieren
# Edit docker/.env: ES_JAVA_OPTS=-Xms1g -Xmx1g

Problem: Kein Zugriff auf WebUI über Port 80

# Prüfen, ob nginx läuft
docker compose ps

# Überprüfen Sie die Port-Bindung
docker port ragflow-nginx-1

# Überprüfen in CLORE.AI: Port 80 muss in Ihrer Serverbestellung gemappt sein

Problem: Dokumentenparsing hängt

# Task-Worker-Logs prüfen
docker compose logs ragflow-worker

# Worker neu starten
docker compose restart ragflow-worker

Problem: Elasticsearch-Heap out of memory

# Heap in .env erhöhen
ES_JAVA_OPTS=-Xms2g -Xmx2g
docker compose restart es01

Problem: Embedding-Modell nicht gefunden

# HuggingFace-Modell-Download prüfen
docker exec ragflow-server ls /ragflow/models/

# Erneut herunterladen
docker exec ragflow-server python -c "
from huggingface_hub import snapshot_download
snapshot_download('BAAI/bge-large-en-v1.5')
"

Clore.ai GPU-Empfehlungen

Anwendungsfall

Empfohlene GPU

Geschätzte Kosten auf Clore.ai

Entwicklung/Tests

RTX 3090 (24GB)

~$0.12/gpu/hr

Produktion RAG

RTX 3090 (24GB)

~$0.12/gpu/hr

Hochdurchsatz-Embedding

RTX 4090 (24GB)

~$0.70/gpu/hr

💡 Alle Beispiele in diesem Leitfaden können bereitgestellt werden auf Clore.ai GPU-Servern. Durchsuchen Sie verfügbare GPUs und mieten Sie stundenweise — keine Verpflichtungen, voller Root-Zugriff.

VorherigeÜberblick NächsteLlamaIndex

Zuletzt aktualisiert vor 19 Tagen

War das hilfreich?

hashtagServeranforderungen

hashtagSchnelle Bereitstellung auf CLORE.AI

hashtag1. Finden Sie einen geeigneten Server

hashtag2. Konfigurieren Sie Ihre Bereitstellung

hashtag3. Greifen Sie auf das WebUI zu

hashtagSchritt-für-Schritt-Einrichtung

hashtagSchritt 1: SSH auf Ihren Server

hashtagSchritt 2: Docker Compose installieren

hashtagSchritt 3: Das RAGFlow-Repository klonen

hashtagSchritt 4: Umgebung konfigurieren

hashtagSchritt 5: Wählen Sie die richtige Image-Variante

hashtagSchritt 6: Starten Sie alle Dienste

hashtagSchritt 7: Administratorkonto anlegen

hashtagSchritt 8: LLM-Modell konfigurieren

hashtagBeispielanwendungen

hashtagBeispiel 1: Dokumente per WebUI hochladen und abfragen

hashtagBeispiel 2: API — Knowledge Base erstellen und Dokumente hochladen

hashtagBeispiel 3: Dokumente per API abfragen

hashtagBeispiel 4: Batch-Dokumentenverarbeitungspipeline

hashtagBeispiel 5: RAGFlow mit lokalem Ollama-LLM

hashtagKonfiguration

hashtagdocker-compose.yml Schlüsselservices

hashtagChunking-Strategien

hashtagLeistungs-Tipps

hashtag1. Elasticsearch-Speicher skalieren

hashtag2. GPU-beschleunigte Embeddings

hashtag3. Parallele Dokumentenverarbeitung

hashtag4. MinIO für große Dokumentensätze

hashtagFehlerbehebung

hashtagProblem: Dienste starten nicht (Speicher)

hashtagProblem: Kein Zugriff auf WebUI über Port 80

hashtagProblem: Dokumentenparsing hängt

hashtagProblem: Elasticsearch-Heap out of memory

hashtagProblem: Embedding-Modell nicht gefunden

hashtagLinks

hashtagClore.ai GPU-Empfehlungen

Serveranforderungen

Schnelle Bereitstellung auf CLORE.AI

1. Finden Sie einen geeigneten Server

2. Konfigurieren Sie Ihre Bereitstellung

3. Greifen Sie auf das WebUI zu

Schritt-für-Schritt-Einrichtung

Schritt 1: SSH auf Ihren Server

Schritt 2: Docker Compose installieren

Schritt 3: Das RAGFlow-Repository klonen

Schritt 4: Umgebung konfigurieren

Schritt 5: Wählen Sie die richtige Image-Variante

Schritt 6: Starten Sie alle Dienste

Schritt 7: Administratorkonto anlegen

Schritt 8: LLM-Modell konfigurieren

Beispielanwendungen

Beispiel 1: Dokumente per WebUI hochladen und abfragen

Beispiel 2: API — Knowledge Base erstellen und Dokumente hochladen

Beispiel 3: Dokumente per API abfragen

Beispiel 4: Batch-Dokumentenverarbeitungspipeline

Beispiel 5: RAGFlow mit lokalem Ollama-LLM

Konfiguration

docker-compose.yml Schlüsselservices

Chunking-Strategien

Leistungs-Tipps

1. Elasticsearch-Speicher skalieren

2. GPU-beschleunigte Embeddings

3. Parallele Dokumentenverarbeitung

4. MinIO für große Dokumentensätze

Fehlerbehebung

Problem: Dienste starten nicht (Speicher)

Problem: Kein Zugriff auf WebUI über Port 80

Problem: Dokumentenparsing hängt

Problem: Elasticsearch-Heap out of memory

Problem: Embedding-Modell nicht gefunden

Links

Clore.ai GPU-Empfehlungen