Docker विफलता

समस्या Clore.ai रिग को चिन्हित करता है Docker विफलता और इसे ऑफलाइन रखता है, भले ही HiveOS चल रहा हो।

लक्षण

  • Clore पैनल में “Docker Failure” आइकन दिखता है।

  • में मेरे सर्वर सेक्शन में, GPU दिखाए जाते हैं 0x Unknown या GPU की गिनती बदलती रहती है।


कारण 1: अस्थिर GPU या राइज़र

यदि GPU डिस्कनेक्टेड या अस्थिर है तो Clore उसे इनिशियलाइज़ नहीं कर सकता। भले ही HiveOS GPU को देखे, Clore इसका उपयोग नहीं कर सकता → Docker विफलता.

समाधान: पुनरारंभ करें और हार्डवेयर जाँचें

  1. GPU या राइज़र की जाँच करें, सुनिश्चित करें कि सबकुछ सुरक्षित रूप से जुड़ा हुआ है।

  2. रिग को रिबूट करें:

reboot

यदि रिबूट के बाद त्रुटि फिर से आती है, तो समस्या संभवतः GPU, मदरबोर्ड, या राइज़र्स में है।


कारण 2: Python वातावरण (Miniconda) भ्रष्ट हो गया है

यदि निर्देशिका /opt/clore-hosting/miniconda-env क्षतिग्रस्त है तो Clore स्टार्टअप पर फंस जाता है।

समाधान: वातावरण हटाएँ और पुनःप्रारंभ करें

sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service

कारण 3: निर्भरताओं की स्थापना अटकी हुई है

यदि Clore शुरू नहीं होता है, तो यह निर्भरताओं (जैसे aiofiles, docker, आदि) की जमी स्थापना के कारण हो सकता है।

समाधान: निर्भरताएँ पुनर्स्थापित करें

sudo /opt/clore-hosting/clore.sh --reinstall

कारण 4: अस्थिर Docker संस्करण स्थापित है (उदा., 28.*)

अनुशंसित संस्करण: 27.5.1 Docker 28+ के साथ क्रैश सामान्य हैं।

समाधान: Docker को डाउनग्रेड करें

sudo apt install \
docker-ce=5:27.5.1-1~ubuntu.22.04~jammy \
docker-ce-cli=5:27.5.1-1~ubuntu.22.04~jammy \
containerd.io -y

कारण 5: आवश्यक सेवाएँ स्टार्टअप पर सक्षम नहीं हैं

रिबूट के बाद, सिस्टम Docker और Clore Hosting शुरू नहीं करता → सर्वर ऑफलाइन हो जाता है।

समाधान: स्टार्टअप पर सेवाएँ सक्षम करें

sudo systemctl enable clore-hosting.service
sudo systemctl enable docker.service
sudo systemctl enable docker.socket

कारण 6: ड्राइवर GPUs का पता नहीं लगाता (nvidia-smi → कोई डिवाइस नहीं मिले)

यदि HiveOS GPU का पता नहीं लगाता, तो Clore उसके साथ काम नहीं कर सकता → परिणामस्वरूप Docker Failure।

समाधान: ड्राइवर को पुनर्स्थापित करें

nvidia-driver-update --force

यदि समस्या बनी रहती है — सर्वर को Clore से पूरी तरह हटा दें, टोकन बदलें, और फिर से जोड़ें।

यदि आंतरिक कॉन्फ़िग टूटी हुई हों तो यह अक्सर मदद करता है।


Docker विफलता लगभग हमेशा इसका मतलब होता है कि Clore GPU को नहीं देखता. में 90% मामलों में, कारण या तो सेवा अक्षम होना है या अस्थिर GPU/राइज़र्स। मूल समस्या को ठीक करें, स्टार्टअप पर सेवाएँ सक्षम करें — और आपका रिग ऑनलाइन रहेगा।

Last updated

Was this helpful?