LLaVA

Clore.ai पर LLaVA विज़न-लैंग्वेज मॉडल के साथ इमेज के साथ चैट करें

LLaVA के साथ छवियों के साथ चैट करें - ओपन-सोर्स GPT-4V विकल्प।

circle-check

CLORE.AI पर किराये पर लेना

  1. GPU प्रकार, VRAM, और मूल्य के अनुसार फ़िल्टर करें

  2. चुनें ऑन-डिमांड (निश्चित दर) या स्पॉट (बिड प्राइस)

  3. अपना ऑर्डर कॉन्फ़िगर करें:

    • Docker इमेज चुनें

    • पोर्ट सेट करें (SSH के लिए TCP, वेब UI के लिए HTTP)

    • यदि आवश्यक हो तो एनवायरनमेंट वेरिएबल जोड़ें

    • स्टार्टअप कमांड दर्ज करें

  4. भुगतान चुनें: CLORE, BTC, या USDT/USDC

  5. ऑर्डर बनाएं और डिप्लॉयमेंट का इंतज़ार करें

अपने सर्वर तक पहुँचें

  • कनेक्शन विवरण में खोजें मेरे ऑर्डर

  • वेब इंटरफेस: HTTP पोर्ट URL का उपयोग करें

  • SSH: ssh -p <port> root@<proxy-address>

LLaVA क्या है?

LLaVA (Large Language and Vision Assistant) कर सकता है:

  • छवियों को समझना और वर्णन करना

  • दृश्य सामग्री के बारे में प्रश्नों के उत्तर देना

  • चार्ट, आरेख, स्क्रीनशॉट का विश्लेषण करना

  • ओसीआर और दस्तावेज़ समझ

मॉडल वेरिएंट

मॉडल
आकार
VRAM
गुणवत्ता

LLaVA-1.5-7B

7B

8GB

अच्छा

LLaVA-1.5-13B

13B

16GB

बेहतर

LLaVA-1.6-34B

34B

40GB

सर्वोत्तम

LLaVA-NeXT

7-34B

8-40GB

नवीनतम

त्वरित तैनाती

Docker इमेज:

पोर्ट:

कमांड:

अपनी सेवा तक पहुँचना

डिप्लॉयमेंट के बाद, अपना खोजें http_pub URL में मेरे ऑर्डर:

  1. जाएँ मेरे ऑर्डर पृष्ठ

  2. अपने ऑर्डर पर क्लिक करें

  3. खोजें http_pub URL (उदा., abc123.clorecloud.net)

उपयोग करें https://YOUR_HTTP_PUB_URL की बजाय localhost नीचे दिए उदाहरणों में।

इंस्टॉलेशन

मूल उपयोग

Python API

Transformers का उपयोग करना

Ollama एकीकरण (अनुशंसित)

CLORE.AI पर LLaVA चलाने का सबसे आसान तरीका:

Ollama के माध्यम से LLaVA API

circle-exclamation

करते।

प्रतिक्रिया:

"done": true

# छवि-संबंधित उत्तरों के लिए null लौटाता है

उपयोग के मामले

result = analyze_image(url, "photo.jpg", "इस छवि का विस्तार से वर्णन करें")

prompt = "इस छवि का विस्तार से वर्णन करें, जिसमें रंग, वस्तुएँ और वातावरण शामिल हों."

prompt = "इस छवि में दिखाई देने वाला सभी पाठ निकालें। इसे स्पष्ट रूप से स्वरूपित करें."

prompt = "इस चार्ट का विश्लेषण करें। प्रमुख रुझान और अंतर्दृष्टियाँ क्या हैं?"

ऑब्जेक्ट डिटेक्शन

Gradio इंटरफ़ेस

API सर्वर

बैच प्रोसेसिंग

मेमोरी अनुकूलन

4-बिट क्वांटाइज़ेशन

bnb_4bit_compute_dtype=torch.float16

प्रदर्शन

मॉडल
GPU
टोकन/सेकंड

LLaVA-1.5-7B

RTX 3090

~30

LLaVA-1.5-7B

RTX 4090

~45

offload_folder="offload"

RTX 4090

~40

LLaVA-1.5-13B

A100

~35

समस्याओं का निवारण

आउट ऑफ़ मेमोरी

धीमा जनरेशन

  • image = image.resize((336, 336))

  • फ्लैश अटेंशन का उपयोग करें

  • max_new_tokens कम करें

खराब गुणवत्ता

  • बड़ा मॉडल उपयोग करें

  • क्वांटाइज़्ड मॉडल का उपयोग करें

  • संदर्भ के साथ बेहतर प्रॉम्प्ट्स

लागत अनुमान

सामान्य CLORE.AI मार्केटप्लेस दरें (2024 के अनुसार):

GPU
घंटात्मक दर
दैनिक दर
4-घंटे सत्र

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

कीमतें प्रदाता और मांग के अनुसार बदलती हैं। जाँच करें CLORE.AI मार्केटप्लेसarrow-up-right वर्तमान दरों के लिए।

पैसे बचाएँ:

  • उपयोग करें स्पॉट लचीले वर्कलोड के लिए मार्केट (अक्सर 30-50% सस्ता)

  • भुगतान करें CLORE टोकन के साथ

  • विभिन्न प्रदाताओं के बीच कीमतों की तुलना करें

अगले कदम

  • उच्च-रिज़ॉल्यूशन छवियाँ

  • Ollama LLMs - Ollama के साथ LLaVA चलाएँ

  • vLLM Inference - प्रोडक्शन सर्विंग

Last updated

Was this helpful?