Docker विफलता
समस्या Clore.ai रिग को चिन्हित करता है Docker विफलता और इसे ऑफलाइन रखता है, भले ही HiveOS चल रहा हो।
लक्षण
Clore पैनल में “Docker Failure” आइकन दिखता है।
में मेरे सर्वर सेक्शन में, GPU दिखाए जाते हैं 0x Unknown या GPU की गिनती बदलती रहती है।
कारण 1: अस्थिर GPU या राइज़र
यदि GPU डिस्कनेक्टेड या अस्थिर है तो Clore उसे इनिशियलाइज़ नहीं कर सकता। भले ही HiveOS GPU को देखे, Clore इसका उपयोग नहीं कर सकता → Docker विफलता.
समाधान: पुनरारंभ करें और हार्डवेयर जाँचें
GPU या राइज़र की जाँच करें, सुनिश्चित करें कि सबकुछ सुरक्षित रूप से जुड़ा हुआ है।
रिग को रिबूट करें:
rebootयदि रिबूट के बाद त्रुटि फिर से आती है, तो समस्या संभवतः GPU, मदरबोर्ड, या राइज़र्स में है।
कारण 2: Python वातावरण (Miniconda) भ्रष्ट हो गया है
यदि निर्देशिका /opt/clore-hosting/miniconda-env क्षतिग्रस्त है तो Clore स्टार्टअप पर फंस जाता है।
समाधान: वातावरण हटाएँ और पुनःप्रारंभ करें
sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.serviceकारण 3: निर्भरताओं की स्थापना अटकी हुई है
यदि Clore शुरू नहीं होता है, तो यह निर्भरताओं (जैसे aiofiles, docker, आदि) की जमी स्थापना के कारण हो सकता है।
समाधान: निर्भरताएँ पुनर्स्थापित करें
sudo /opt/clore-hosting/clore.sh --reinstallकारण 4: अस्थिर Docker संस्करण स्थापित है (उदा., 28.*)
अनुशंसित संस्करण: 27.5.1 Docker 28+ के साथ क्रैश सामान्य हैं।
समाधान: Docker को डाउनग्रेड करें
sudo apt install \
docker-ce=5:27.5.1-1~ubuntu.22.04~jammy \
docker-ce-cli=5:27.5.1-1~ubuntu.22.04~jammy \
containerd.io -yकारण 5: आवश्यक सेवाएँ स्टार्टअप पर सक्षम नहीं हैं
रिबूट के बाद, सिस्टम Docker और Clore Hosting शुरू नहीं करता → सर्वर ऑफलाइन हो जाता है।
समाधान: स्टार्टअप पर सेवाएँ सक्षम करें
sudo systemctl enable clore-hosting.service
sudo systemctl enable docker.service
sudo systemctl enable docker.socketकारण 6: ड्राइवर GPUs का पता नहीं लगाता (nvidia-smi → कोई डिवाइस नहीं मिले)
nvidia-smi → कोई डिवाइस नहीं मिले)यदि HiveOS GPU का पता नहीं लगाता, तो Clore उसके साथ काम नहीं कर सकता → परिणामस्वरूप Docker Failure।
समाधान: ड्राइवर को पुनर्स्थापित करें
nvidia-driver-update --forceयदि समस्या बनी रहती है — सर्वर को Clore से पूरी तरह हटा दें, टोकन बदलें, और फिर से जोड़ें।
यदि आंतरिक कॉन्फ़िग टूटी हुई हों तो यह अक्सर मदद करता है।
Docker विफलता लगभग हमेशा इसका मतलब होता है कि Clore GPU को नहीं देखता. में 90% मामलों में, कारण या तो सेवा अक्षम होना है या अस्थिर GPU/राइज़र्स। मूल समस्या को ठीक करें, स्टार्टअप पर सेवाएँ सक्षम करें — और आपका रिग ऑनलाइन रहेगा।
Last updated
Was this helpful?