Docker विफलता

समस्या Clore.ai रिग को चिह्नित करता है Docker विफलता और इसे ऑफ़लाइन रखता है, भले ही HiveOS चल रहा हो।

लक्षण

  • Clore पैनल में “Docker Failure” आइकन दिख रहा है।

  • में मेरे सर्वर विभाग में, GPU दिखाए जाते हैं जैसे 0x अज्ञात या GPU की गिनती बदलती रहती है।


कारण 1: अस्थिर GPU या राइज़र

यदि GPU डिस्कनेक्टेड या अस्थिर है तो Clore GPU को इनिशियलाइज़ नहीं कर सकता। भले ही HiveOS GPU को देखे, Clore इसका उपयोग नहीं कर सकता → Docker विफलता.

समाधान: पुनरारंभ करें और हार्डवेयर जांचें

  1. GPU या राइज़र की जांच करें, सुनिश्चित करें कि सब कुछ मजबूती से जुड़ा हुआ है।

  2. रिग को रिबूट करें:

reboot

यदि रिबूट के बाद त्रुटि वापस आती है, तो समस्या संभवतः GPU, मदरबोर्ड, या राइज़र्स में है।


कारण 2: Python वातावरण (Miniconda) भ्रष्ट हो गया है

यदि निर्देशिका /opt/clore-hosting/miniconda-env भ्रष्ट है, तो Clore स्टार्टअप पर हैंग कर सकता है।

समाधान: वातावरण हटाएँ और पुनः आरंभ करें

sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service

कारण 3: निर्भरताओं की स्थापना अटकी हुई है

यदि Clore शुरू नहीं होता है, तो यह निर्भरताओं (जैसे aiofiles, docker, आदि) की फ्रीज़ या अटकी हुई स्थापना के कारण हो सकता है।

समाधान: निर्भरताएँ पुनर्स्थापित करें


कारण 4: इंस्टॉल किया गया Docker संस्करण अस्थिर है (उदा., 28.*)

अनुशंसित संस्करण: 27.5.1 Docker 28+ के साथ क्रैश सामान्य हैं।

समाधान: Docker डाउनग्रेड करें


कारण 5: आवश्यक सेवाएँ स्टार्टअप पर सक्षम नहीं हैं

रिबूट के बाद, सिस्टम Docker और Clore Hosting लॉन्च नहीं करता → सर्वर ऑफ़लाइन हो जाता है।

समाधान: स्टार्टअप पर सेवाएँ सक्षम करें


कारण 6: ड्राइवर GPU का पता नहीं लगाता (nvidia-smi → कोई डिवाइस नहीं मिला)

यदि HiveOS GPU का पता नहीं लगाता, तो Clore उसके साथ काम नहीं कर सकता → परिणामस्वरूप Docker विफलता।

समाधान: ड्राइवर पुनर्स्थापित करें


यदि समस्या बनी रहती है — सर्वर को Clore से पूरी तरह हटा दें, टोकन बदलें, और फिर से जोड़ें।

यदि आंतरिक कॉन्फ़िग टूटे हों तो यह अक्सर मदद करता है।


Docker विफलता लगभग हमेशा मतलब होता है कि Clore GPU को नहीं देखता. में 90% मामलों में, कारण या तो किसी सेवा का अक्षम होना है या अस्थिर GPU/राइज़र्स। मूल समस्या को ठीक करें, स्टार्टअप पर सेवाएँ सक्षम करें — और आपका रिग ऑनलाइन रहेगा।

Last updated

Was this helpful?