बेर मेटल

Clore बेयर मेटल — आवश्यकताएँ और मार्गदर्शिका

Clore बेयर मेटल वे भौतिक (गैर-वर्चुअलाइज़्ड) सर्वर हैं जिनमें पूर्ण रूट एक्सेस, कोई साझा नहीं, और कोई पावर सीमा नहीं होती। AI/ML, HPC, 3D रेंडरिंग और किसी भी भारी वर्कलोड के लिए उपयुक्त।

उपलब्ध GPU (उदाहरण): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090, आदि। स्थान (शुरू): यूएसए, जापान, हांगकांग, और अन्य SLA: टियर 3 और उससे ऊपर के डेटा सेंटर, लक्षित अपटाइम 99.99%.


1) Clore पर बेयर मेटल क्या है

  • आपको एक पूरा भौतिक मशीन मिलती है (CPU, RAM, डिस्क, नेटवर्क, GPU)।

  • पूर्ण रूट एक्सेस/SSH और उपलब्ध होने पर OS पुनर्स्थापना के लिए IPMI/KVM।

  • कोई PL सीमा नहीं / अलगाव परतें — प्रदर्शन हार्डवेयर के अनुरूप होता है।

  • यह कंटेनर-आधारित रेंटल (HiveOS/Docker) से अलग है क्योंकि संसाधन साझा नहीं किए जाते।


2) अनिवार्य अवसंरचना आवश्यकताएँ (प्रदाता के लिए)

2.1 डेटा सेंटर

  • न्यूनतम टियर 3 (Uptime Institute या मान्यता प्राप्त स्थानीय समकक्ष)।

  • दस्तावेज़: DC पत्र/प्रमाण पत्र, redundancy वर्णन (पावर N+1/2N, कूलिंग, नेटवर्क)।

  • SLA 99.99% 24/7 NOC के साथ।

  • फायर सेफ्टी मानकों का पालन; आपातकालीन प्रक्रियाओं की उपलब्धता (RPO/RTO)।

  • केवल वैध कानूनी इकाइयाँ। होम/ऑफिस "सर्वर रूम" स्वीकार्य नहीं हैं।

2.2 हार्डवेयर बेस (न्यूनतम)

  • CPU: 64 थ्रेड्स से शुरू।

  • RAM: 128 GB से शुरू (मल्टी-GPU/HPC के लिए 256 GB+ की सिफारिश)।

  • स्टोरेज: NVMe SSD ≥ 1 TB, थ्रूपुट ≥ 1 GB/s (सिस्टम और डेटा के लिए RAID1/10 की सिफारिश)।

  • नेटवर्क: ≥ 1 Gbps सिमेट्रिक (10 Gbps वरीय), L2/L3 redundancy, स्टैटिक IPv4; IPv6 एक प्लस है।

  • GPU (टीयर): L40S / H200 और उससे ऊपर या भारी वर्कलोड के प्रति सहनशील समकक्ष: B200, H100, H200, A100, L40S, RTX 4090/5090 (सर्वर A-सीरीज़ और डेटा-सेन्टर कार्ड प्राथमिकता देय).

2.3 उच्च-प्रदर्शन इंटरकनेक्ट (वरीय)

  • InfiniBand (EDR/HDR/NDR) वितरित प्रशिक्षण/HPC के लिए।

  • NVLink/NVSwitch — नोड के भीतर मल्टी-GPU के लिए वांछनीय।

2.4 विश्वसनीयता और प्रतिस्थापन

  • हार्डवेयर विफलता के मामले में — एक-के-बदले-एक प्रतिस्थापन (एक समान या कड़ाई से समकक्ष कॉन्फ़िगरेशन) बिना SLA गिरावट के।

  • अनिवार्य स्पेयर पार्ट्स का स्टॉक / "हॉट" स्पेयर्स।

2.5 सुरक्षा और डेटा स्वच्छता

  • रेंटल के बीच डिस्क नसबंदी: blkdiscard/secure erase/1-pass zero/TRIM (लॉगिंग)।

  • IPMI अलगाव, बंद mgmt परिमाप, ACL/DDoS प्रोफ़ाइल।

  • OS इमेज — जांची हुई, अद्यतित माइक्रोकोड/पैच के साथ, समर्थन NVIDIA ड्राइवरों के लिए।


3) न्यूनतम वाणिज्यिक शर्तें

  • न्यूनतम रेंटल अवधि: से 1 महीना.

  • मूल्य निर्धारण: भू-स्थान के हिसाब से प्रतिस्पर्धी प्राइस लिस्ट (ट्रैफिक/बिजली/VAT लागतों को ध्यान में रखकर)।

  • API एकीकरण ऑटो-प्रोविज़निंग, विस्तार और मॉनिटरिंग के लिए अनिवार्य/वांछनीय (वॉल्यूम पर निर्भर)।


4) सॉफ़्टवेयर और इमेज आवश्यकताएँ

  • OS: Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9; अनुरोध पर — Windows Server (लाइसेंसिंग के साथ)।

  • GPU स्टैक: NVIDIA 550.xx+ (या विशिष्ट GPUs के लिए सिफारिश किए गए संस्करण), CUDA 12.2/12.4+।

  • प्रबंधन: SSH (आवश्यक), IPMI/KVM (पसंदीदा) किरायेदार के लिए अस्थायी खाते के साथ।

  • कंटेनरीकरण: अनुरोध पर Docker/Podman; Kubernetes — अनुमति है यदि मास्टर उसी DC के भीतर प्रोविज़न किया गया हो।


5) एक प्रदाता कैसे Bare Metal से कनेक्ट कर सकता है

  1. आवेदन & सत्यापन:

    • कानूनी इकाई, टियर 3+ DC के साथ आधिकारिक अनुबंध, SLA 99.99%, 24/7 NOC।

    • दस्तावेज़ पैकेज: टियर/समकक्ष प्रमाण पत्र, SLA, फायर सेफ्टी, redundancy स्कीम।

    • स्वीकृति परीक्षण: सार्वजनिक IPv4, IPMI (KVM) का स्क्रीनशॉट/एक्सेस, iPerf3/डिस्क प्रदर्शन परिणाम।

  2. SKU कैटलॉग और मूल्य निर्धारण:

    • मानकीकृत कार्ड (GPU संयोजन, CPU थ्रेड्स, RAM, NVMe, नेटवर्क, IB/NVLink, DC/स्थान, ट्रैफिक सीमाएँ)।

    • मूल्य भूगोल से जुड़े होते हैं। न्यूनतम अवधि — 2 सप्ताह।

  3. संचालन नीतियाँ:

    • घटना प्रतिक्रिया समय: ≤ 15 मिनट; हार्डवेयर प्रतिस्थापन: तुरंत समकक्ष।

    • डिस्क नसबंदी का लॉगिंग, वापसी के बाद एडमिन एक्सेस का बंद होना, ऑडिट।

    • अपटाइम/घटनाओं पर मासिक रिपोर्ट।

6) नेटवर्क और थ्रूपुट आवश्यकताएँ

  • न्यूनतम 1 Gbps (सिमेट्रिक), वरीय रूप से 10 Gbps रेडंडेंसी के साथ।

  • सार्वजनिक IPv4, अनुरोध पर rDNS समर्थन; IPv6 वांछनीय है।

  • मूलभूत ACL, anti-DDoS प्रोफ़ाइल, समर्पित mgmt-VLAN IPMI के लिए।

  • के लिए InfiniBand — रैक/रूम के भीतर प्रत्यक्ष L2 विभाजन और OFED उपलब्धता।


7) उदाहरण वर्कलोड

  • मल्टी-GPU LLM प्रशिक्षण: 8×L40S/NVLink या A100/H100/H200 नोड्स के IB क्लस्टर।

  • वीडियो रेंडरिंग: 4×RTX 4090/5090 स्थानीय NVMe कैश और 10 Gbps एग्रीस।

  • HFT/ट्रेडिंग: निम्न विलंबता, CPU 64–128 थ्रेड्स, RAM 256–512 GB, NVMe RAID1 और 10 Gbps नेटवर्क।

  • जीनोमिक्स/HPC: A100/H100 के साथ IB HDR/NDR, SLURM / MPI समर्थन।


स्टैंडर्ड रेंटल और बेयर मेटल की तुलना

पैरामीटर
स्टैंडर्ड रेंटल (HiveOS/Docker)
बेयर मेटल

यह क्या है

होस्ट OS के अंदर कंटेनर/पर्यावरण

पूरा भौतिक सर्वर

संसाधन (CPU/RAM/बैंडविड्थ)

शेड्यूलर द्वारा साझा; cgroup कोटाएँ, संभावित थ्रॉटलिंग

विशेष; अनुमानित CPU/RAM/बैंडविड्थ

रूट/विशेषाधिकार

कंटेनर के अंदर रूट, BIOS एक्सेस नहीं

पूर्ण सर्वर रूट; BIOS/UEFI एक्सेस

GPU ड्राइवर (CUDA/NVIDIA)

संस्करण होस्ट द्वारा परिभाषित

आप आवश्यक संस्करण (CUDA/OFED, आदि) इंस्टॉल करते हैं

GPU नियंत्रण

प्रतिबंधों के साथ पासथ्रू (होस्ट नीति के अनुसार PL/OC)

पूर्ण PL/OC नियंत्रण; NVLink/NVSwitch (यदि मौजूद हो)

IPMI/KVM/वर्चुअल मीडिया

नहीं

हाँ (रिमोट कंसोल, ISO माउंटिंग)

स्टोरेज

होस्ट वॉल्यूम/माउंट्स; बैंडविड्थ उतार-चढ़ाव कर सकती है

डायरेक्ट NVMe/RAID; स्थिर IOPS/थ्रूपुट

नेटवर्क

पोर्ट्स/NAT/शेयर्ड बैंडविड्थ

समर्पित NIC 1–10G+; rDNS, VLAN; सार्वजनिक IPv4

विश्वसनीयता / SLA

होस्ट पर निर्भर; समान-के-लिए-समान स्वैप की गारंटी नहीं

DC टियर 3+, लक्षित SLA 99.99%, अनिवार्य समान-के-लिए-समान प्रतिस्थापन

न्यूनतम अवधि

आम तौर पर घंटे/दिन

2 सप्ताह से

लागत

कम

उच्च (विशेष + डेटा सेंटर)

शुरू करने का समय

सेकंड–मिनट

शुरू करने में 1 घंटे से लेकर 48 घंटे तक

HPC / InfiniBand

आम तौर पर नहीं

सिफारिश की जाती है (InfiniBand), NVLink/NVSwitch

उपयुक्त के लिए

त्वरित कार्य, परीक्षण, माइनिंग, छोटी सत्र

AI/ML/HPC, प्रोडक्शन वर्कलोड, लंबे प्रोजेक्ट

प्रदाता के लिए आवश्यकताएँ

बुनियादी

कानूनी इकाई, DC टियर 3+, 24/7 NOC, क्षेत्रीय मूल्य निर्धारण, API

सुरक्षा / डेटा

होस्ट नीतियों के भीतर

रेंटल के बीच डिस्क सैनिटाइजेशन, अलग प्रबंधन (IPMI)

सामान्य प्रश्न

बेयर मेटल कंटेनर रेंटल से कैसे अलग है? बेयर मेटल है पूरी तरह से आपकी भौतिक मशीन (CPU/RAM/डिस्क/नेट/GPU)। कंटेनर रेंटल में, संसाधन साझा होते हैं और आप एक अलग वातावरण में काम करते हैं।

क्या IPMI आवश्यक है? वरीय। यह OS पुनर्स्थापना को तेज करता है और नेटवर्क/SSH समस्याओं के लिए KVM एक्सेस प्रदान करता है।

क्या नोड्स को IB पर आपस में जोड़ा जा सकता है? हाँ, वितरित प्रशिक्षण/HPC के लिए InfiniBand प्रोत्साहित किया जाता है। SKU में IB बैंडविड्थ/प्रकार निर्दिष्ट करें।

GPU के लिए न्यूनतम क्या है? L40S / H200 स्तर और उससे ऊपर, या भारी वर्कलोड के प्रति सहनशील समकक्ष (B200, H100, A100, आदि)।

अगर सर्वर "डाउन" हो जाता है तो क्या होता है? प्रदाता को शीघ्रता से एक समान प्रतिस्थापन बिना किसी गिरावट के (SLA 99.99%).

Last updated

Was this helpful?