Stable Audio

Clore.ai पर Stable Audio के साथ संगीत और साउंड इफ़ेक्ट्स जेनरेट करें

CLORE.AI GPU पर Stability AI के Stable Audio के साथ संगीत और ध्वनि प्रभाव उत्पन्न करें।

circle-check

Stable Audio क्यों?

  • उच्च गुणवत्ता - 44.1kHz स्टेरियो ऑडियो जनरेशन

  • वेरिएबल लंबाई - 95 सेकंड तक उत्पन्न करें

  • बहुमुखी - संगीत, ध्वनि प्रभाव, परिवेशी ध्वनियाँ

  • टेक्स्ट-से-ऑडियो - जो आप सुनना चाहते हैं उसका वर्णन करें

  • ओपन वेट्स - Stable Audio Open उपलब्ध

मॉडल वेरिएंट

मॉडल
अवधि
गुणवत्ता
VRAM
लाइसेंस

Stable Audio Open

47 सेकंड

अच्छा

8GB

खोलें

Stable Audio 2.0

3 मिनट

उत्कृष्ट

12GB

वाणिज्यिक

CLORE.AI पर त्वरित डिप्लॉय

Docker इमेज:

pytorch/pytorch:2.5.1-cuda12.4-cudnn9-devel

पोर्ट:

कमांड:

अपनी सेवा तक पहुँचना

डिप्लॉयमेंट के बाद, अपना खोजें http_pub URL में मेरे ऑर्डर:

  1. जाएँ मेरे ऑर्डर पृष्ठ

  2. अपने ऑर्डर पर क्लिक करें

  3. खोजें http_pub URL (उदा., abc123.clorecloud.net)

उपयोग करें https://YOUR_HTTP_PUB_URL की बजाय localhost नीचे दिए उदाहरणों में।

हार्डवेयर आवश्यकताएँ

मॉडल
न्यूनतम GPU
अनुशंसित

Stable Audio Open

RTX 3070 8GB

RTX 3090 24GB

Stable Audio 2.0

RTX 3090 12GB

RTX 4090 24GB

इंस्टॉलेशन

मूल उपयोग

टेक्स्ट से संगीत

साउंड इफेक्ट्स

परिवेशी ध्वनियाँ

प्रॉम्प्ट उदाहरण

संगीत शैलियाँ

साउंड इफेक्ट्स

परिवेशी/पृष्ठभूमि

उन्नत विकल्प

जनरेशन को नियंत्रित करना

वेरिएबल लंबाई

बैच जनरेशन

Gradio वेब इंटरफेस

प्रदर्शन

अवधि
स्टेप्स
GPU
समय

10 सेकंड

100

RTX 3090

~15s

10 सेकंड

100

RTX 4090

~10s

30 सेकंड

100

RTX 3090

~40s

30 सेकंड

100

RTX 4090

~25s

47 सेकंड

100

RTX 4090

~40s

गुणवत्ता सुझाव

बेहतर संगीत

बेहतर साउंड इफेक्ट्स

लागत अनुमान

सामान्य CLORE.AI मार्केटप्लेस दरें:

GPU
घंटात्मक दर
~30 सेकंड क्लिप/घंटा

RTX 3060 12GB

~$0.03

~50

RTX 3090 24GB

~$0.06

~90

RTX 4090 24GB

~$0.10

~140

A100 40GB

~$0.17

~200

कीमतें भिन्न होती हैं। जाँच करें CLORE.AI मार्केटप्लेसarrow-up-right वर्तमान दरों के लिए।

समस्याओं का निवारण

आउट ऑफ़ मेमोरी

खराब गुणवत्ता आउटपुट

  • स्टेप्स बढ़ाएँ (150-200)

  • CFG स्केल समायोजित करें (5-10 आज़माएँ)

  • प्रॉम्प्ट में अधिक विशिष्ट रहें

  • विभिन्न सीड आज़माएँ

कोई ध्वनि / मौन

  • जाँच करें कि प्रॉम्प्ट पर्याप्त वर्णनात्मक है

  • बहुत ABSTRACT वर्णनों से बचें

  • पहले जानी-पहचानी कार्यशील प्रॉम्प्ट आज़माएँ

ऑडियो आर्टिफैक्ट्स

  • स्टेप्स बढ़ाएँ

  • CFG स्केल घटाएँ

  • अवधि घटाएँ

  • GPU थर्मल थ्रॉटलिंग के लिए जाँच करें

Stable Audio बनाम अन्य

फ़ीचर
Stable Audio
AudioCraft
Bark

संगीत

उत्कृष्ट

उत्कृष्ट

खराब

SFX

बहुत अच्छा

अच्छा

खराब

भाषण

नहीं

नहीं

हाँ

अवधि

47s / 3min

30s

15s

गुणवत्ता

44.1kHz

32kHz

24kHz

खोलें

आंशिक

हाँ

हाँ

Stable Audio का उपयोग करें जब:

  • उच्च-गुणवत्ता संगीत जनरेशन

  • गेम/वीडियो के लिए साउंड इफेक्ट्स

  • बैकग्राउंड संगीत

  • परिवेशी साउंडस्केप

अगले कदम

  • AudioCraft - मेटा का संगीत जनरेशन

  • Bark TTS - वॉइस सिंथेसिस

  • Demucs - ऑडियो विभाजन

  • Whisper - ट्रांसक्रिप्शन

Last updated

Was this helpful?