Milvus

एआई अनुप्रयोगों के लिए सबसे अधिक स्केलेबल ओपन-सोर्स वेक्टर डेटाबेस — अरबों वेक्टर के लिए बनाया गया

Milvus एक ओपन-सोर्स वेक्टर डेटाबेस है जो स्केलेबल समानता खोज और एआई अनुप्रयोगों के लिए विशेष रूप से बनाया गया है। मूल रूप से Zilliz द्वारा निर्मित और LF AI & Data Foundation को दान किया गया, Milvus NVIDIA, AT&T, IBM और Salesforce सहित कंपनियों में उत्पादन एआई कार्यभार को शक्ति देता है। जब आपको अरबों वेक्टर पर स्केल करने की आवश्यकता हो तो यह पसंदीदा विकल्प है।

GitHub: milvus-io/milvusarrow-up-right — 32K+ ⭐


Milvus बनाम Qdrant — किसे कब चुनें

मानदंड
Qdrant
ChromaDB

स्केल

अरबों वेक्टर

सैकड़ों मिलियन

आर्किटेक्चर

वितरित (कई सर्विसेस)

सिंगल बाइनरी

सेटअप जटिलता

अधिक

कम

GPU इंडेक्स समर्थन

✅ नेटिव GPU FAISS

सीमित

मल्टी-टेनेन्सी

✅ पार्टिशन + उपनाम (aliases)

कलेक्शन-आधारित

स्ट्रीमिंग इनजेन्शन

✅ Kafka/Pulsar

सीमित

हाइब्रिड खोज

✅ Dense + sparse

क्लाउड-मैनेज्ड विकल्प

Zilliz Cloud

Qdrant Cloud

circle-check

Milvus आर्किटेक्चर

स्टैंडअलोन मोड (एकल सर्वर) में Milvus में शामिल हैं:

  • milvus — मुख्य सेवा (प्रॉक्सी, क्वेरी, डेटा, इंडेक्स समन्वयक)

  • etcd — मेटाडेटा स्टोरेज और सर्विस डिस्कवरी

  • MinIO — सेगमेंट डेटा के लिए ऑब्जेक्ट स्टोरेज

वितरित मोड (क्लस्टर) में, प्रत्येक कंपोनेंट स्वतंत्र रूप से स्केल करता है।


पूर्व-आवश्यकताएँ

  • GPU किराये के साथ Clore.ai खाता

  • Docker Compose (आम तौर पर पूर्व-इंस्टॉल्ड)

  • बुनियादी Python ज्ञान

  • 16GB+ RAM (उत्पादन के लिए 32GB सिफारिश की जाती है)


चरण 1 — Clore.ai पर GPU सर्वर किराए पर लें

  1. जाएँ clore.aiarrow-up-rightमार्केटप्लेस

  2. सिफारिश की गई GPU: GPU-एक्सेलेरेटेड इंडेक्सिंग के लिए RTX 4090 या A100

  3. CPU विकल्प: CPU-आधारित इंडेक्सिंग के लिए कोई भी सर्वर जिसमें 32GB+ RAM हो

न्यूनतम आवश्यकताएँ:

  • CPU: 8 कोर

  • RAM: 16GB (32GB सिफारिश की जाती है)

  • डिस्क: 50GB SSD/NVMe

  • GPU: वैकल्पिक (केवल GPU इंडेक्स प्रकारों के लिए आवश्यक)

circle-info

Milvus में GPU इंडेक्स प्रकार (IVF_FLAT_GPU, IVFSQ8_GPU) CUDA-सक्षम GPU की आवश्यकता होते हैं और बड़े कलेक्शन के लिए इंडेक्स निर्माण को उल्लेखनीय रूप से तेज करते हैं। यदि आप अक्सर 10M+ वेक्टर इंडेक्स करने की योजना बना रहे हैं, तो GPU इंडेक्सिंग जल्दी ही स्वयं का निवेश वापस कर देती है।


चरण 2 — Milvus स्टैंडअलोन तैनात करें

Docker इमेज:

Milvus स्टैंडअलोन के लिए etcd और MinIO की आवश्यकता होती है। सबसे आसान सेटअप के लिए Docker Compose का उपयोग करें।

पोर्ट्स:

  • पोर्ट 19530: Milvus SDK/gRPC पोर्ट (प्राथमिक)

  • पोर्ट 9091: Milvus REST API और हेल्थ चेक (आंतरिक)

पर्यावरण चर:


चरण 3 — Docker Compose के साथ सेट अप करें

अपने Clore.ai सर्वर में SSH करें और compose फ़ाइल बनाएं:

docker-compose.yml को अनुकूलित करें

Milvus शुरू करें


चरण 4 — Python क्लाइंट इंस्टॉल करें


चरण 5 — एक कलेक्शन बनाएं

Milvus में, एक कलेक्शन एक डेटाबेस तालिका के समान होता है। इसमें वेटर फ़ील्ड्स सहित टाइप किए गए फ़ील्ड के साथ एक स्कीमा होता है।


चरण 6 — इंडेक्स बनाएं

खोज के लिए डेटा लोड करने से पहले, उपयुक्त इंडेक्स बनाएं:


चरण 7 — डेटा डालें


चरण 8 — खोज और क्वेरी

मूल सिमेंटिक खोज

फ़िल्टर की गई खोज

हाइब्रिड खोज (Dense + Sparse)


चरण 9 — एक RAG सेवा बनाएं


चरण 10 — मॉनिटर और प्रबंधित करें


समस्या निवारण

सर्विसेज़ स्टार्ट नहीं हो रही हैं

19530 पर कनेक्शन अस्वीकृत

बड़े कलेक्शन के लिए इंडेक्स बिल्ड टाइमआउट

उच्च मेमोरी उपयोग


इंडेक्स प्रकार चयन मार्गदर्शिका

इंडेक्स प्रकार
माध्य/दिन
मेमोरी
गति
GPU आवश्यक

FLAT

छोटा (<1M), सटीक खोज

उच्च

धीमा

नहीं

IVF_FLAT

मध्यम (1M–10M)

मध्यम

अच्छा

नहीं

HNSW

निम्न लेटेंसी, <100M

उच्च

अत्युत्तम

नहीं

IVF_SQ8

कम्प्रेस्ड, बड़ा

कम

अच्छा

नहीं

GPU_IVF_FLAT

तेज़ बैच प्रश्न

GPU+RAM

सबसे अच्छा

हाँ

DISKANN

अरब-स्तरीय

निम्न (डिस्क)

अच्छा

नहीं


प्रदर्शन बेंचमार्क्स

कलेक्शन आकार
इंडेक्स
GPU
QPS

1M वेक्टर

HNSW

RTX 3090

~8,000

10M वेक्टर

IVF_FLAT

RTX 4090

~2,500

10M वेक्टर

GPU_IVF_FLAT

A100

~12,000

100M वेक्टर

DISKANN

A100

~1,200


अतिरिक्त संसाधन


Clore.ai पर Milvus उन एआई अनुप्रयोगों के लिए आदर्श समाधान है जिन्हें सैकड़ों मिलियन से आगे स्केल करने की आवश्यकता होती है। GPU-एक्सेलेरेटेड एम्बेडिंग जेनरेशन के साथ संयोजित करके, आप प्रबंधित क्लाउड लागत के एक हिस्से पर विश्व-स्तरीय सेमांटिक सर्च और RAG सिस्टम बना सकते हैं।


Clore.ai GPU सिफारिशें

उपयोग केस
सिफारिश की गई GPU
Clore.ai पर अनुमानित लागत

डेवलपमेंट/टेस्टिंग

RTX 3090 (24GB)

~$0.12/gpu/hr

प्रोडक्शन वेक्टर सर्च

RTX 3090 (24GB)

~$0.12/gpu/hr

हाई-थ्रूपुट एम्बेडिंग

RTX 4090 (24GB)

~$0.70/gpu/hr

💡 इस गाइड के सभी उदाहरण तैनात किए जा सकते हैं Clore.aiarrow-up-right GPU सर्वरों पर। उपलब्ध GPUs ब्राउज़ करें और घंटे के हिसाब से किराए पर लें — कोई प्रतिबद्धता नहीं, पूर्ण रूट एक्सेस।

Last updated

Was this helpful?