समस्याओं का निवारण

Clore.ai GPU रेंटल्स के सामान्य मुद्दे और उनके समाधान

CLORE.AI मार्केटप्लेस पर GPU सर्वर्स किराये पर लेने के सामान्य मुद्दे और समाधान।

circle-check
circle-info

यह मार्गदर्शिका CLORE.AI प्लेटफ़ॉर्म तकनीकी दस्तावेज़ों पर आधारित है।

सामग्री तालिका


ऑर्डर बनाने में समस्याएँ

ऑर्डर विफल: "अपर्याप्त शेष"

कारण: निर्माण शुल्क और न्यूनतम जमा को कवर करने के लिए पर्याप्त फंड नहीं।

समाधान:

  • चयनित मुद्रा (CLORE, BTC, या USDT/USDC) में अपना बैलेंस जांचें

  • निर्माण शुल्क ऑर्डर बनते समय लिया जाता है

  • कई घंटों के किराये के लिए पर्याप्त राशि के साथ अपना बैलेंस टॉप-अप करें

ऑर्डर विफल: "सर्वर उपलब्ध नहीं"

कारण: सर्वर पहले से ही किराये पर है या ऑफ़लाइन है।

समाधान:

  • मार्केटप्लेस पेज को रिफ्रेश करें

  • सर्वर की स्थिति जाँचें (ऑनलाइन/ऑफलाइन संकेतक)

  • Spot किराये के लिए - आपको आउटबिड किया जा सकता है

ऑर्डर "Creating" स्थिति में अटका हुआ है

कारण: कंटेनर तैनात हो रहा है या एक त्रुटि हुई है।

समाधान:

  1. 2-5 मिनट प्रतीक्षा करें (Docker इमेज खींची जा रही है)

  2. लॉग्स जाँचें मेरे ऑर्डर

  3. बड़ी इमेज (10GB+) डाउनलोड होने में अधिक समय लेती हैं

  4. यदि 10 मिनट से अधिक समय के लिए अटका है - रद्द करें और पुनः प्रयास करें


कनेक्शन संबंधी समस्याएँ

SSH के माध्यम से कनेक्ट नहीं कर सकता

कारण: पोर्ट कॉन्फ़िगर नहीं है या कंटेनर तैयार नहीं है।

चेकलिस्ट:

  1. पोर्ट 22 को के रूप में सेट होना चाहिए TCP (HTTP नहीं)

  2. कंटेनर की स्थिति होनी चाहिए Active (Creating नहीं)

  3. सही मैप किए गए पोर्ट का उपयोग करें मेरे ऑर्डर

सही SSH कमांड:

जहाँ <MAPPED_PORT> सार्वजनिक पोर्ट है (उदाहरण के लिए, 45678), पोर्ट 22 नहीं।

SSH काम करता है लेकिन वेब इंटरफेस खुलता नहीं है

कारण: पोर्ट TCP के रूप में सेट है बजाय HTTP के, या सेवा चल नहीं रही है।

समाधान:

  1. वेब इंटरफेस पोर्ट HTTP के रूप में सेट होने चाहिए HTTP (TCP नहीं)

  2. सर्विस को सुनना चाहिए 0.0.0.0, नहीं localhost

  3. लॉग्स जाँचें - सेवा स्टार्टअप पर क्रैश हो सकती है

सही पोर्ट कॉन्फ़िगरेशन:

"Connection refused" त्रुटि

कारण: कंटेनर के अंदर सेवा नहीं चल रही है या गलत पते पर सुन रही है।

समाधान:

  1. कंटेनर में SSH कर के सेवा की स्थिति जाँचें:

  2. सर्विस को सुनना चाहिए 0.0.0.0, नहीं 127.0.0.1:

"Connection timed out" त्रुटि

कारण: गलत पता/पोर्ट या नेटवर्क समस्याएँ।

चेकलिस्ट:

  1. प्रॉक्सी पता उपयोग करें मेरे ऑर्डर (सर्वर IP नहीं!)

  2. मैप्ड पोर्ट का उपयोग करें (सार्वजनिक पोर्ट, कंटेनर पोर्ट नहीं)

  3. सही प्रोटोकॉल का उपयोग करें (HTTP पोर्ट के लिए http://)


कंटेनर संबंधी समस्याएँ

कंटेनर बार-बार रिस्टार्ट हो रहा है

कारण: स्टार्टअप कमांड में त्रुटि या अपर्याप्त संसाधन।

समाधान:

  1. लॉग्स जाँचें मेरे ऑर्डर

  2. स्टार्टअप कमांड सरल करें:

  3. फिर SSH करके मैन्युअली कॉन्फ़िगर करें

कंटेनर रिसेट नहीं कर सकते

कारण: रिसेट के बीच कूलडाउन अवधि।

तथ्य: कंटेनर रिसेट का एक 120 सेकंड कूलडाउन है।

समाधान: रिसेट प्रयासों के बीच 2 मिनट प्रतीक्षा करें।

रिस्टार्ट के बाद डेटा खो गया

कारण: डेटा स्थायी स्टोरेज में नहीं है।

महत्वपूर्ण:

  • कंटेनर के अंदर डेटा सुरक्षित रखा जाता है Reset Container पर

  • डेटा खो जाता है जब ऑर्डर रद्द किया जाता है या समाप्त हो जाता है

  • किराये को समाप्त करने से पहले हमेशा परिणाम डाउनलोड करें:

स्टार्टअप कमांड निष्पादित नहीं हो रहा

कारण: सिंटैक्स त्रुटि या इमेज समस्या।

सामान्य गलतियाँ:

समाधान:

  1. सरल स्टार्टअप का उपयोग करें: bash या sleep infinity

  2. सब कुछ SSH के माध्यम से कॉन्फ़िगर करें

  3. या पूर्व-इंस्टॉल किए गए सॉफ़्टवेयर के साथ कस्टम Docker इमेज बनाएं


GPU संबंधी समस्याएँ

कंटेनर में GPU दिखाई नहीं दे रहा

जाँचें:

यदि कमांड नहीं मिला:

  • Docker इमेज को CUDA का समर्थन करना चाहिए

  • CUDA-सक्षम इमेज का उपयोग करें: pytorch/pytorch:2.5.1-cuda12.4-cudnn9-runtime

यदि GPU प्रदर्शित नहीं हो रहा:

  • सत्यापित करें कि सर्वर में GPU है (मार्केटप्लेस लिस्टिंग जाँचें)

  • सर्वर प्रदाता से संपर्क करें

CUDA संस्करण mismatch

त्रुटि: CUDA ड्राइवर संस्करण CUDA रनटाइम संस्करण के लिए अपर्याप्त है

कारण: इमेज में CUDA संस्करण सर्वर ड्राइवर के साथ असंगत है।

समाधान:

  • ड्राइवर संस्करण जाँचें: nvidia-smi (ऊपर दाएँ कोना)

  • संगत CUDA संस्करण वाली इमेज का उपयोग करें

  • सुरक्षित विकल्प: CUDA 11.8, CUDA 12.1

GPU मेमोरी समाप्त हो गई

त्रुटि: CUDA में आउट ऑफ मेमोरी

समाधान:

  1. छोटा मॉडल या क्वांटाइज़ेशन का उपयोग करें

  2. मेमोरी अनुकूलन फ़्लैग जोड़ें:

    • Stable Diffusion: --medvram या --lowvram

    • LLMs: load_in_4bit=True या load_in_8bit=True

  3. मेमोरी साफ़ करें: torch.cuda.empty_cache()

  4. अधिक VRAM वाले सर्वर को किराये पर लें


भुगतान संबंधी समस्याएँ

समर्थित मुद्राएँ

CLORE.AI तीन मुद्राओं का समर्थन करता है:

  • CLORE - प्लेटफ़ॉर्म का नेटिव टोकन

  • BTC - बिटकॉइन

  • USD - स्टेबलकॉइन्स (यदि प्रदाता द्वारा सक्षम)

ऑर्डर रद्द: "Outbid"

कारण: किसी ने Spot मार्केट पर उच्च कीमत प्रस्तुत की।

समाधान:

  • उपयोग करें ऑन-डिमांड गारंटीड किराये के लिए

  • या अपने Spot बोलियों की कीमत बढ़ाएँ

बैलेंस लिया गया लेकिन ऑर्डर नहीं बनाया गया

कारण: ऑर्डर विफल होने पर भी निर्माण शुल्क लिया जाता है।

समाधान:

  • निर्माण शुल्क आमतौर पर न्यूनतम होता है

  • इतिहास में रद्द करने का कारण जाँचें

  • दोहराए जाने वाले मुद्दों के लिए सपोर्ट से संपर्क करें


प्लेटफ़ॉर्म सीमाएँ

CLORE.AI कोडबेस से सत्यापित:

पैरामीटर
सीमा

प्रति ऑर्डर पोर्ट

5

कुल पर्यावरण चर

12,288 वर्ण (12KB)

एकल env var नाम

128 वर्ण

एकल env var मान

1,536 वर्ण

SSH कुंजी

3,072 वर्ण

SSH पासवर्ड

32 वर्ण

Jupyter टोकन

32 वर्ण

कंटेनर रिसेट कूलडाउन

120 सेकंड

पोर्ट रेंज

1-65535

पोर्ट प्रोटोकॉल

केवल TCP या HTTP


पर्यावरण चर

SSH और Jupyter एक्सेस के लिए पर्यावरण चर उपयोग करें:

वैरिएबल
उद्देश्य
अधिकतम लंबाई

SSH_KEY

आपकी सार्वजनिक SSH कुंजी

3,072 वर्ण

SSH_PASSWORD

SSH पासवर्ड

32 वर्ण

JUPYTER_TOKEN

Jupyter नोटबुक टोकन

32 वर्ण

उदाहरण कॉन्फ़िगरेशन:


निदानात्मक कमांड


मदद प्राप्त करना

यदि समस्या बनी रहती है:

  1. लॉग और स्क्रीनशॉट के साथ समस्या का वर्णन करें

  2. ऑर्डर ID और सर्वर ID शामिल करें

Last updated

Was this helpful?