ChromaDB

Clore.ai GPUs पर AI एप्लिकेशन के लिए ChromaDB ओपन-सोर्स वेक्टर डेटाबेस तैनात करें

ChromaDB है आधुनिक ओपन-सोर्स वेक्टर डेटाबेस जो AI अनुप्रयोगों के लिए विशेष रूप से बनाया गया है। यह उच्च-आयामी एम्बेडिंग्स को संग्रहित करने, क्वेरी करने और प्रबंधित करने के लिए एक सरल, सहज API प्रदान करता है — जो आधुनिक RAG सिस्टम, सिमेंटिक सर्च, सिफारिश इंजन और LLM मेमोरी की रीढ़ हैं।

ChromaDB वेक्टर समानता खोज की जटिलता को abstract करता है, जिससे आप AI अनुप्रयोग बनाने पर ध्यान केंद्रित कर सकते हैं। यह विकास के लिए इन-मेमोरी मोड और प्रोडक्शन डिप्लॉयमेंट के लिए पर्सिस्टेंट सर्वर मोड दोनों का समर्थन करता है, और Clore.ai GPU सर्वरों पर आसान डिप्लॉयमेंट के लिए Docker समर्थन के साथ आता है।

मुख्य विशेषताएँ:

  • 🚀 सरल Python/JavaScript API — मिनटों में शुरू करें

  • 💾 स्थायी भंडारण — कंटेनर रीस्टार्ट के बाद डेटा बचा रहता है

  • ACE-Step (ओपन-सोर्स Suno विकल्प) कई दूरी मेट्रिक — कॉसाइन, L2, इनर प्रोडक्ट

  • 📦 एकीकृत एम्बेडिंग्स — OpenAI, Cohere, sentence-transformers के लिए बिल्ट-इन समर्थन

  • 🏗️ मल्टी-टेनेंट — विभिन्न डेटासेट व्यवस्थित करने के लिए कलेक्शन्स

  • 🔌 REST API — भाषा-निरपेक्ष HTTP इंटरफ़ेस

  • MLflow, Triton Inference Server, BentoML, ClearML तेज़ — अनुमानित निकटतम पड़ोसी खोज के लिए HNSW इंडेक्स

  • 🔗 LangChain/LlamaIndex नेटिव — प्रथम-श्रेणी एकीकरण

circle-check

सर्वर आवश्यकताएँ

पैरामीटर
न्यूनतम
अनुशंसित

GPU

कोई भी NVIDIA GPU (वैकल्पिक)

NVIDIA RTX 3080+ (एम्बेडिंग्स के लिए)

VRAM

ChromaDB के लिए आवश्यक नहीं

8–16 GB (स्थानीय एम्बेडिंग मॉडल के लिए)

RAM

4 GB

16–32 GB

CPU

2 कोर

8 कोर

डिस्क

10 GB

50–200 GB (बड़े डेटासेट के लिए)

ऑपरेटिंग सिस्टम

Ubuntu 20.04+

Ubuntu 22.04

Docker

आवश्यक

Docker + Docker Compose

पोर्ट्स

22, 8000

22, 8000

circle-info

ChromaDB स्वयं GPU की आवश्यकता नहीं रखता — यह CPU पर कुशलता से चलता है। हालांकि, एम्बेडिंग्स जनरेट करना (टेक्स्ट को वेक्टर में बदलना) GPU त्वरण से काफी लाभान्वित होता है। यदि आप स्थानीय एम्बेडिंग मॉडल (sentence-transformers आदि) उपयोग करने की योजना बना रहे हैं, तो GPU वाला सर्वर चुनें।


CLORE.AI पर त्वरित तैनाती

1. एक उपयुक्त सर्वर खोजें

जाएँ CLORE.AI मार्केटप्लेसarrow-up-right और चुनें:

  • केवल CPU ChromaDB सर्वर + API के लिए (पूर्व-गणना की गई एम्बेडिंग्स संग्रहीत करें)

  • GPU सर्वर यदि आप चाहें कि एम्बेडिंग्स स्थानीय रूप से भी जनरेट हों

2. अपनी तैनाती कॉन्फ़िगर करें

Docker इमेज:

पोर्ट मैपिंग्स:

पर्यावरण चर:

स्टार्टअप कमांड:

3. डिप्लॉयमेंट का परीक्षण करें


चरण-दर-चरण सेटअप

चरण 1: अपने सर्वर में SSH करें

चरण 2: डेटा निर्देशिका बनायें

चरण 3: ChromaDB कंटेनर चलाएँ

चरण 4: जांचें कि यह चल रहा है

चरण 5: Python क्लाइंट इंस्टॉल करें

चरण 6: Python से कनेक्टिविटी का परीक्षण करें

चरण 7: (वैकल्पिक) प्रमाणीकरण सक्षम करें


उपयोग के उदाहरण

उदाहरण 1: बेसिक वेक्टर स्टोर ऑपरेशन्स


उदाहरण 2: सिमेंटिक सर्च


उदाहरण 3: ChromaDB + OpenAI के साथ RAG पाइपलाइन


उदाहरण 4: मल्टी-कलेक्शन दस्तावेज़ प्रबंधन


उदाहरण 5: फ़िल्टरिंग और मेटाडेटा क्वेरीज


कॉन्फ़िगरेशन

Docker Compose (प्रोडक्शन)

पर्यावरण वेरिएबल्स संदर्भ

चर
डिफ़ॉल्ट
विवरण

IS_PERSISTENT

FALSE

स्थायी स्टोरेज सक्षम करें

ANONYMIZED_TELEMETRY

TRUE

उपयोग ट्रैकिंग अक्षम करें

CHROMA_SERVER_LOG_LEVEL

INFO

लॉग verbosity

CHROMA_MEMORY_LIMIT_BYTES

कोई नहीं

सेगमेंट कैश के लिए अधिकतम मेमोरी

ALLOW_RESET

FALSE

API के माध्यम से सभी डेटा रीसेट करने की अनुमति दें

CHROMA_SERVER_AUTH_PROVIDER

कोई नहीं

प्रमाणीकरण प्रदाता क्लास


प्रदर्शन सुझाव

1. सही एम्बेडिंग मॉडल चुनें

मॉडल
आयाम
गति
गुणवत्ता
GPU आवश्यक

all-MiniLM-L6-v2

384

तेज़

अच्छा

नहीं

all-mpnet-base-v2

768

मध्यम

बेहतर

वैकल्पिक

text-embedding-3-small

1536

तेज़

शानदार

केवल API

BAAI/bge-large-en-v1.5

1024

मध्यम

सबसे अच्छा

हाँ

2. गति के लिए बैच अपसर्ट्स

3. HNSW इंडेक्स ट्यूनिंग

4. स्थानीय उपयोग के लिए पर्सिस्टेंट क्लाइंट


समस्या निवारण

समस्या: ChromaDB से कनेक्ट नहीं हो रहा

समस्या: कंटेनर रीस्टार्ट पर डेटा खो गया

समस्या: मेमोरी आउट एरर

समस्या: एम्बेडिंग जनरेशन धीमा है

समस्या: रीस्टार्ट के बाद कलेक्शन नहीं मिला


लिंक


Clore.ai GPU सिफारिशें

उपयोग केस
सिफारिश की गई GPU
Clore.ai पर अनुमानित लागत

डेवलपमेंट/टेस्टिंग

RTX 3090 (24GB)

~$0.12/gpu/hr

Production RAG

RTX 3090 (24GB)

~$0.12/gpu/hr

हाई-थ्रूपुट एम्बेडिंग

RTX 4090 (24GB)

~$0.70/gpu/hr

💡 इस गाइड के सभी उदाहरण तैनात किए जा सकते हैं Clore.aiarrow-up-right GPU सर्वरों पर। उपलब्ध GPUs ब्राउज़ करें और घंटे के हिसाब से किराए पर लें — कोई प्रतिबद्धता नहीं, पूर्ण रूट एक्सेस।

Last updated

Was this helpful?