TabbyML कोड कंप्लीशन
Clore.ai पर निजी GitHub Copilot विकल्प के रूप में TabbyML को सेल्फ-होस्ट करें
TabbyML एक स्वयं-होस्टेड एआई कोड पूर्णता सर्वर है — GitHub Copilot का ड्रॉप-इन विकल्प जो आपका कोड पूरी तरह से आपकी अपनी इंफ्रास्ट्रक्चर पर रखता है। Apache 2.0 के तहत लाइसेंस प्राप्त, यह Clore.ai GPUs पर चलता है और आधिकारिक एक्सटेंशनों के माध्यम से VS Code, JetBrains और Vim/Neovim से जुड़ता है। मॉडल StarCoder2-1B (4 GB VRAM पर फिट होता है) से लेकर StarCoder2-15B और सर्वोत्तम गुणवत्ता के लिए DeepSeek-Coder तक हैं।
सभी उदाहरण GPU सर्वरों पर चलते हैं जो कि के माध्यम से किराये पर लिए गए हैं CLORE.AI मार्केटप्लेस.
प्रमुख विशेषताएँ
स्वयं-होस्टेड Copilot विकल्प — आपका कोड कभी भी आपके सर्वर से बाहर नहीं जाता
Apache 2.0 लाइसेंस — व्यावसायिक उपयोग के लिए मुफ्त, कोई प्रतिबंध नहीं
IDE एक्सटेंशन — VS Code, JetBrains (IntelliJ, PyCharm, WebStorm), Vim/Neovim
कई मॉडल — StarCoder2 (1B/3B/7B/15B), DeepSeek-Coder, CodeLlama
रिपॉजिटरी संदर्भ — प्रोजेक्ट-सचेत पूर्णताओं के लिए RAG- संचालित कोड पुनर्प्राप्ति
Docker परिनियोजन — GPU समर्थन के साथ लॉन्च करने के लिए एक कमांड
एडमिन डैशबोर्ड — उपयोग विश्लेषिकी, मॉडल प्रबंधन, उपयोगकर्ता प्रबंधन
चैट इंटरफ़ेस — ऑटोकम्पलीशन से परे कोडिंग प्रश्न पूछें
आवश्यकताएँ
GPU
RTX 3060 12 GB
RTX 3080 10 GB+
VRAM
4 GB
10 GB
RAM
8 GB
16 GB
डिस्क
20 GB
50 GB
CUDA
11.8
12.1+
Clore.ai मूल्य निर्धारण: RTX 3080 ≈ $0.3–1/दिन · RTX 3060 ≈ $0.15–0.3/दिन
TabbyML हल्का है — यहाँ तक कि एक RTX 3060 भी StarCoder2-7B को तेज़ इन्फ़रेंस के साथ चला सकता है।
त्वरित आरंभ
1. Docker से परिनियोजित करें
2. एक मॉडल चुनें
StarCoder2-1B
~3 GB
सबसे तेज
बेसिक
RTX 3060, तेज़ प्रारूप / ड्राफ्ट
StarCoder2-3B
~5 GB
तेज़
अच्छा
सामान्य विकास के लिए
StarCoder2-7B
~8 GB
मध्यम
उच्च
अनुशंसित डिफ़ॉल्ट
StarCoder2-15B
~16 GB
धीमा
सर्वोत्तम
जटिल कोडबेस के लिए
DeepSeek-Coder-6.7B
~8 GB
मध्यम
उच्च
Python, JS, TypeScript
CodeLlama-7B
~8 GB
मध्यम
अच्छा
सामान्य प्रयोजन
मॉडल बदलने के लिए बदलें --model फ्लैग:
3. IDE एक्सटेंशन इंस्टॉल करें
VS Code:
एक्सटेंशन्स खोलें (Ctrl+Shift+X)
"Tabby" खोजें और आधिकारिक एक्सटेंशन इंस्टॉल करें
सेटिंग्स खोलें → "Tabby" खोजें
सर्वर एंडपॉइंट सेट करें:
http://<your-clore-ip>:8080
JetBrains (IntelliJ, PyCharm, WebStorm):
Settings → Plugins → Marketplace
"Tabby" खोजें और इंस्टॉल करें
Settings → Tools → Tabby → Server endpoint:
http://<your-clore-ip>:8080
Vim/Neovim:
4. एडमिन डैशबोर्ड तक पहुँचें
खोलें http://<your-clore-ip>:8080 ब्राउज़र में। डैशबोर्ड प्रदान करता है:
पूर्णता उपयोग सांख्यिकी
मॉडल स्थिति और प्रदर्शन मीट्रिक्स
उपयोगकर्ता और API टोकन प्रबंधन
रिपॉजिटरी इंडेक्सिंग कॉन्फ़िगरेशन
उपयोग के उदाहरण
रिपॉजिटरी संदर्भ (RAG) जोड़ें
प्रोजेक्ट-सचेत पूर्णताओं के लिए अपनी रिपॉजिटरी को इंडेक्स करें:
चैट API का उपयोग करें
प्रमाणीकरण के साथ चलाएँ
Docker के बिना चलाएँ (प्रत्यक्ष इंस्टॉल)
लागत तुलना
GitHub Copilot
$19/उपयोगकर्ता
❌ क्लाउड
~200 ms
RTX 3060 पर TabbyML
~$5–9/माह
✅ स्वयं
~50 ms
RTX 3080 पर TabbyML
~$9–30/माह
✅ स्वयं
~30 ms
RTX 4090 पर TabbyML
~$15–60/माह
✅ स्वयं
~15 ms
एक छोटी टीम (3–5 डेवलपर्स) के लिए, Clore.ai पर एक अकेला RTX 3080 कई Copilot सब्सक्रिप्शनों की जगह ले सकता है और लागत का केवल एक अंश खर्च होता है।
टिप्स
StarCoder2-7B सबसे उपयुक्त है — अधिकांश टीमों के लिए VRAM के मुकाबले सर्वोत्तम गुणवत्ता
रिपॉजिटरी संदर्भ सक्षम करें — बड़े कोडबेस के लिए RAG इंडेक्सिंग पूर्णता की प्रासंगिकता को नाटकीय रूप से सुधारता है
पोर्ट 8080 को सुरक्षित रूप से एक्सपोज़ करें — प्रोडक्शन परिनियोजन के लिए SSH टनेलिंग या TLS के साथ रिवर्स प्रॉक्सी का उपयोग करें
VRAM उपयोग की निगरानी करें —
nvidia-smiताकि यह सुनिश्चित हो कि मॉडल इन्फ़रेंस बैचिंग के लिए हेडरूम के साथ फिट होपूर्णता API का उपयोग करें CI/CD एकीकरण के लिए — कोड समीक्षा सुझावों को स्वचालित करें
Tabby कई उपयोगकर्ताओं का समर्थन करता है — एडमिन डैशबोर्ड आपको प्रत्येक डेवलपर के लिए API टोकन बनाने देता है
लेटेंसी मायने रखती है — सबसे तेज़ पूर्णताओं के लिए अपनी टीम के भौगोलिक रूप से नजदीक Clore.ai सर्वर चुनें
समस्याओं का निवारण
Docker कंटेनर तुरंत बाहर निकलता है
लॉग जांचें: docker logs tabby। संभावना है कि मॉडल के लिए VRAM अपर्याप्त है
IDE एक्सटेंशन कनेक्ट नहीं हो रहा
एंडपॉइंट URL सत्यापित करें, Clore.ai पर फ़ायरवॉल/पोर्ट फ़ॉरवर्डिंग जांचें
पूर्णताएँ धीमी हैं
छोटा मॉडल उपयोग करें, या सुनिश्चित करें कि GPU अन्य कार्यों के साथ साझा न हो
CUDA में आउट ऑफ मेमोरी
छोटे मॉडल (StarCoder2-3B या 1B) पर स्विच करें
रिपॉजिटरी इंडेक्सिंग अटकी हुई है
डिस्क स्थान जांचें और सुनिश्चित करें कि git रिपो पहुँच योग्य है
ऑथ टोकन अस्वीकार कर दिया गया
एडमिन डैशबोर्ड में टोकन पुनःजनरेट करें, IDE एक्सटेंशन अपडेट करें
रिमोट IDE से उच्च विलंबता
SSH टनल का उपयोग करें: ssh -L 8080:localhost:8080 root@<clore-ip>
संसाधन
Last updated
Was this helpful?