5 सर्वश्रेष्ठ ओपन-सोर्स एआई इमेज जेनरेटर

5 सर्वश्रेष्ठ ओपन-सोर्स एआई इमेज जेनरेटर

त्वरित सम्पक

एआई-आधारित टेक्स्ट-टू-इमेज जेनरेशन मॉडल हर जगह हैं और दैनिक उपयोग करना आसान होता जा रहा है। हालाँकि किसी वेबसाइट पर जाना और वह छवि तैयार करना आसान है जिसे आप ढूंढ रहे हैं, यदि आप पीढ़ी प्रक्रिया पर अधिक नियंत्रण चाहते हैं तो ओपन-सोर्स टेक्स्ट-टू-इमेज जेनरेटर आपके लिए सबसे अच्छा विकल्प हैं।





दिन का मेकयूसोफ़ वीडियो सामग्री जारी रखने के लिए स्क्रॉल करें

इंटरनेट पर दर्जनों मुफ़्त और ओपन-सोर्स एआई टेक्स्ट-टू-इमेज जेनरेटर उपलब्ध हैं जो विशिष्ट प्रकार की छवियों में विशेषज्ञ हैं। इसलिए, हमने ढेर की जांच की है और सबसे अच्छा ओपन-सोर्स एआई टेक्स्ट-टू-इमेज जेनरेटर पाया है जिसे आप अभी आज़मा सकते हैं।





1 Craiyon

  क्रेयॉन-होम-पेज

क्रेयॉन सबसे आसानी से सुलभ ओपन-सोर्स एआई छवि जनरेटर में से एक है। यह DALL-E मिनी पर आधारित है, और जबकि आप इसका क्लोन बना सकते हैं जीथब भंडार और मॉडल को अपने कंप्यूटर पर स्थानीय रूप से स्थापित करें, ऐसा लगता है कि क्रेयॉन ने अपनी वेबसाइट के पक्ष में इस दृष्टिकोण को छोड़ दिया है।





आधिकारिक जीथब रिपॉजिटरी को जून 2022 से अपडेट नहीं किया गया है, लेकिन नवीनतम मॉडल अभी भी मुफ्त में उपलब्ध है आधिकारिक क्रेयॉन साइट . कोई एंड्रॉइड या आईओएस ऐप भी नहीं हैं।

कार्यक्षमता के संदर्भ में, आपको वे सभी सामान्य विकल्प दिखाई देंगे जिनकी आप AI छवि जनरेटर से अपेक्षा करते हैं। एक बार जब आप अपना संकेत दर्ज करते हैं और एक छवि प्राप्त करते हैं, तो आप उच्च-रिज़ॉल्यूशन प्रतिलिपि प्राप्त करने के लिए अपस्केल सुविधा का उपयोग कर सकते हैं। चुनने के लिए तीन शैलियाँ हैं: कला, फोटो और ड्राइंग। यदि आप चाहते हैं कि मॉडल तय हो तो आप 'कोई नहीं' विकल्प भी चुन सकते हैं।



  क्रेयॉन-जनित-छवि

इसके अतिरिक्त, 'विशेषज्ञ मोड' आपको नकारात्मक शब्द शामिल करने देता है, जो मॉडल को विशिष्ट वस्तुओं से बचने के लिए कहता है। इसमें एक त्वरित पूर्वानुमान सुविधा भी है, जो उपयोगकर्ताओं को यथासंभव सर्वोत्तम, सबसे विस्तृत संकेत लिखने में मदद करने के लिए ChatGPT का उपयोग करती है। अंत में, एआई-पावर्ड रिमूव बैकग्राउंड फीचर्स आपको छवियों से बैकग्राउंड क्रॉप करने में समय और प्रयास बचाने में मदद कर सकते हैं।

और यही वह सब कुछ है जो क्रेयॉन करता है। यह सबसे परिष्कृत एआई छवि निर्माण मॉडल नहीं है, लेकिन यदि आप कुछ विस्तृत या यथार्थवादी नहीं चाहते हैं तो यह एक बुनियादी मॉडल के रूप में अच्छा काम करता है।





मॉडल का उपयोग मुफ़्त है, लेकिन मुफ़्त उपयोगकर्ता एक मिनट के भीतर एक समय में नौ मुफ़्त छवियों तक सीमित हैं। आप कोई विज्ञापन या वॉटरमार्क नहीं, तेज़ पीढ़ी और अपनी जेनरेट की गई छवियों को निजी रखने का विकल्प पाने के लिए उनके समर्थक या पेशेवर स्तरों की सदस्यता ले सकते हैं (कीमत क्रमशः और प्रति माह है, और सालाना बिल दिया जाता है)। एक कस्टम सदस्यता स्तर कस्टम मॉडल, एकीकरण, समर्पित समर्थन और निजी सर्वर की भी अनुमति देता है।

2 स्थिर प्रसार 1.5

स्टेबल डिफ्यूजन शायद सबसे लोकप्रिय ओपन-सोर्स टेक्स्ट-टू-इमेज जेनरेशन मॉडल में से एक है। यह नीचे उल्लिखित तीन छवि जनरेटर सहित अन्य मॉडलों को भी शक्ति प्रदान करता है। इसे 2022 में जारी किया गया था और तब से इसके कई कार्यान्वयन हुए हैं।





रास्पबेरी पाई बूट पर पायथन स्क्रिप्ट शुरू करें
  स्थिर-प्रसार-वेब-यूआई

मैं आपको मॉडल कैसे काम करता है इसकी अत्यधिक तकनीकी जानकारी दूंगा (जिसके लिए आप उनकी जांच कर सकते हैं)। आधिकारिक जीथब भंडार ), लेकिन मॉडल को पूरी तरह से शुरुआती लोगों के लिए भी स्थापित करना आसान है और यह तब तक अच्छी तरह से काम करता है जब तक आपके पास कम से कम 4 जीबी मेमोरी के साथ एक समर्पित जीपीयू है। आप भी पहुंच सकते हैं स्थिर प्रसार ऑनलाइन, और यदि आप चाहें तो हमने आपको कवर कर लिया है Mac पर स्टेबल डिफ्यूज़न चलाएँ .

स्थिर प्रसार के लिए उपयोग करने के लिए कई चेकपॉइंट (उन्हें संस्करण पर विचार करें) उपलब्ध हैं। जबकि हमने संस्करण 1.5 का परीक्षण किया, संस्करण 2.1 सक्रिय विकास में भी है और अधिक सटीक है।

  ड्रीमशेपर-एआई-जेनरेटेड-इमेज
यदुल्लाह आबिदी/MakeUseOf/DreamShaper

मॉडल को चलाना भी काफी आसान है। हमने इसके साथ इसका परीक्षण किया AUTOMATIC1111 स्थिर प्रसार वेब उपयोगकर्ता इंटरफ़ेस , और सभी नियंत्रण और पैरामीटर अच्छी तरह से काम करते हैं। यह LAION-5B डेटाबेस के सौजन्य से काफी NSFW-प्रूफ है जिस पर मॉडल को प्रशिक्षित किया गया है (हालाँकि यह सही नहीं है, ध्यान रखें)। जबकि पीढ़ी का समय आपके हार्डवेयर के आधार पर अलग-अलग होगा, आप बुनियादी संकेतों के साथ भी अपनी छवियों के विस्तृत और यथार्थवादी होने की उम्मीद कर सकते हैं।

दुस्साहस के साथ डेस्कटॉप ऑडियो कैसे रिकॉर्ड करें

3 ड्रीमशेपर

ड्रीमशेपर स्टेबल डिफ्यूजन पर आधारित एक इमेज जेनरेशन मॉडल है। इसका उद्देश्य मिडजर्नी के ओपन-सोर्स विकल्प के रूप में था और उत्पन्न छवियों में फोटोरियलिज्म पर ध्यान केंद्रित करता है, हालांकि यह कुछ बदलावों के साथ एनीमे और पेंटिंग शैलियों को भी संभाल सकता है।

मॉडल स्टेबल डिफ्यूजन की तुलना में अधिक सक्षम है, जिससे उपयोगकर्ताओं को अंतिम आउटपुट पर अधिक स्वतंत्रता मिलती है, जिसमें बिजली के सुधार से लेकर एनएसएफडब्ल्यू प्रतिबंधों को कम करना शामिल है। मॉडल को चलाना भी आसान है, a डाउनलोड करने योग्य, पूर्व-प्रशिक्षित संस्करण उपलब्ध है स्थानीय पहुंच के लिए ऑनलाइन और कई वेबसाइटों सहित सिंकिन.एआई , यादृच्छिक बीज , और मैज.स्पेस (एक बुनियादी सदस्यता की आवश्यकता है) जो आपको मॉडल को GPU त्वरण के साथ चलाने देती है।

  ड्रीमशेपर-स्थिरप्रसार-तुलना

जैसा कि आप शायद अब तक अनुमान लगा सकते हैं, ड्रीमशेपर द्वारा उत्पन्न छवियां स्थिर प्रसार की तुलना में अधिक यथार्थवादी दिखती हैं। भले ही आप दोनों मॉडलों पर एक ही प्रॉम्प्ट चलाते हैं, ड्रीमशेपर मॉडल संभवतः अधिक यथार्थवादी, विस्तृत और बेहतर रोशनी वाला होगा।

यह पोर्ट्रेट या पात्रों के लिए विशेष रूप से सच है, मुझे उसी प्रॉम्प्ट की तुलना में स्थिर प्रसार की कमी महसूस हुई। यदि आपकी छवियां बहुत यथार्थवादी हो जाती हैं, तो यहां हैं एआई-जनित छवि की पहचान करने के चार तरीके .

मॉडल को चलाने के लिए आपको किसी विशाल पीसी की भी आवश्यकता नहीं है। 4GB VRAM के साथ मेरे GTX 1650Ti ने मॉडल को पूरी तरह से चलाया। उत्पादन का समय थोड़ा अधिक था, लेकिन इसका वास्तविक उत्पादन पर कोई प्रभाव नहीं पड़ा। जैसा कि कहा गया है, आपको ड्रीमशेपर एक्सएल चलाने के लिए अधिक वीआरएएम वाले जीपीयू की आवश्यकता हो सकती है, जो स्टेबल डिफ्यूजन एक्सएल मॉडल पर आधारित है।

4 InvokeAI

इनवोक एआई एक अन्य एआई-आधारित इमेज जेनरेशन मॉडल है जो स्टेबल डिफ्यूजन पर आधारित है, जिसका एक्सएल संस्करण स्टेबल डिफ्यूजन एक्सएल पर आधारित है। इसका अपना वेब और कमांड लाइन यूजर इंटरफेस भी है, जिसका अर्थ है कि आपको स्टेबल डिफ्यूजन वेब यूआई जैसी चीजों के साथ परेशान नहीं होना पड़ेगा।

  invokeai-उपयोगकर्ता-इंटरफ़ेस-छवि के साथ

मॉडल उपयोगकर्ताओं को अनुकूलित वर्कफ़्लो के साथ उनकी बौद्धिक संपदा के आधार पर दृश्य बनाने की सुविधा देने पर केंद्रित है। कस्टम मॉडल के प्रशिक्षण और बौद्धिक संपदा के साथ काम करने के लिए InvokeAI सबसे अच्छे ओपन-सोर्स AI इमेज जेनरेशन मॉडल में से एक है।

इसका आधिकारिक जीथब भंडार दो इंस्टॉलेशन विधियों को सूचीबद्ध करता है: InvokeAI के इंस्टॉलर के माध्यम से इंस्टॉल करना या PyPI का उपयोग करना यदि आप टर्मिनल और पायथन के साथ सहज हैं और मॉडल के साथ इंस्टॉल किए गए पैकेजों पर अधिक नियंत्रण की आवश्यकता है।

हालाँकि, अतिरिक्त नियंत्रण कुछ सीमाएँ लाता है, विशेष रूप से सख्त हार्डवेयर आवश्यकताएँ। InvokeAI कम से कम 4 जीबी मेमोरी के साथ एक समर्पित जीपीयू की सिफारिश करता है, जिसमें एक्सएल वेरिएंट को चलाने के लिए छह से आठ जीबी की सिफारिश की जाती है। वीआरएएम आवश्यकताएँ एएमडी और एनवीडिया जीपीयू दोनों पर लागू होती हैं। आपको मॉडल, उसकी निर्भरता और पायथन के लिए कम से कम 12GB रैम और 12GB मुफ्त डिस्क स्थान की भी आवश्यकता होगी।

  इनवोक-एआई-जेनरेटेड-इमेज
यदुल्लाह आबिदी/MakeUseOf/InvokeAI

हालाँकि दस्तावेज़ीकरण वीडियो मेमोरी की कमी के कारण एनवीडिया की GTX 10 सीरीज़ और 16 सीरीज़ GPU की अनुशंसा नहीं करता है, लेकिन प्रदान किया गया इंस्टॉलर ठीक से चलता है। यद्यपि आपका माइलेज अलग-अलग हो सकता है, यदि आप निचले स्तर के जीपीयू पर हैं, तो अपने संकेतों को छवियों में परिवर्तित होते देखने के लिए अधिक समय तक प्रतीक्षा करने की अपेक्षा करें। अंत में, यदि आप विंडोज़ पर हैं, तो आप केवल एनवीडिया जीपीयू का उपयोग कर सकते हैं, क्योंकि वर्तमान में एएमडी जीपीयू के लिए कोई समर्थन नहीं है।

फेसबुक पर पोस्ट कैसे हटाएं

छवि निर्माण भाग के लिए, मॉडल फोटोयथार्थवाद की तुलना में कलात्मक शैलियों की ओर अधिक झुकाव रखता है। बेशक, आप अपने डेटासेट पर मॉडल को प्रशिक्षित कर सकते हैं और इससे आप जो चाहते हैं उसके करीब छवियां उत्पन्न कर सकते हैं, भले ही इसमें फोटोरिअलिस्टिक छवियां शामिल हों, खासकर यदि आप उत्पाद डिजाइन, वास्तुकला या खुदरा स्थानों में काम कर रहे हैं। हालाँकि, ध्यान रखने योग्य एक महत्वपूर्ण बात यह है कि InvokeAI मुख्य रूप से एक छवि निर्माण इंजन है, जिसका अर्थ है कि आपको संभवतः सर्वोत्तम परिणामों के लिए अपने स्वयं के मॉडल का उपयोग करना होगा (वेब ​​​​इंटरफ़ेस में प्रदान किए गए मॉडल प्रबंधक के माध्यम से आसानी से पाया जा सकता है) डिफ़ॉल्ट के रूप में मॉडल काफी हद तक स्टेबल डिफ्यूजन के समान है।

5 खुली यात्रा

ओपनजर्नी एक स्वतंत्र, ओपन-सोर्स एआई इमेज जेनरेशन मॉडल है जो एक बार फिर स्टेबल डिफ्यूजन पर आधारित है। यदि आप सोच रहे हैं कि मॉडल को ओपनजॉर्नी क्यों कहा जाता है, तो ऐसा इसलिए है क्योंकि इसे मिडजॉर्नी छवियों पर प्रशिक्षित किया गया था और यह उत्पन्न होने वाली छवियों में अपनी शैली की नकल कर सकता है।

प्रॉम्प्टहीरो ओपनजर्नी के पीछे की कंपनी, आपको स्टेबल डिफ्यूजन (संस्करण 1.5 और 2), ड्रीमशेपर और रियलिस्टिक विजन सहित अन्य मॉडलों के साथ मॉडल का परीक्षण करने देती है। साइन अप करते समय, आपको 25 मुफ्त क्रेडिट (प्रत्येक छवि के लिए एक क्रेडिट) मिलते हैं, जिसके बाद आपको उनके प्रो सब्सक्रिप्शन टियर की सदस्यता लेनी होगी, जिसकी लागत प्रति माह है और आपको अन्य विशेष सुविधाओं के साथ हर महीने 300 क्रेडिट तक पहुंच प्रदान करता है।

  ओपन जर्नी-स्थिर प्रसार-तुलना

हालाँकि, यदि आप इसे स्थानीय स्तर पर और निःशुल्क चलाना चाहते हैं, तो आप कर सकते हैं हगिंगफेस से मॉडल फ़ाइल डाउनलोड करें और इसे स्टेबल डिफ्यूजन वेब यूआई का उपयोग करके चलाएं। ओपनजर्नी हगिंगफेस पर स्टेबल डिफ्यूजन के ठीक बाद दूसरा सबसे ज्यादा डाउनलोड किया जाने वाला एआई इमेज जेनरेशन मॉडल है।

ओपनजर्नी अपनी वेबसाइट पर मॉडल को स्थानीय रूप से चलाने के लिए किसी विशिष्ट हार्डवेयर आवश्यकताओं को सूचीबद्ध नहीं करता है, लेकिन आप स्टेबल डिफ्यूजन के लिए समान हार्डवेयर आवश्यकताओं की अपेक्षा कर सकते हैं। इसका मतलब है मॉडल और उसकी निर्भरता को बचाने के लिए आपके कंप्यूटर पर 4 जीबी वीआरएएम, 16 जीबी रैम और लगभग 12 से 15 जीबी खाली जगह के साथ एक समर्पित जीपीयू।

  ओपनजर्नी-एआई-जेनरेटेड-इमेज
यदुल्लाह आबिदी/MakeUseOf/OpenJourney

जब तक अन्यथा निर्दिष्ट न किया जाए, ओपनजर्नी द्वारा उत्पन्न छवियां फोटोरियलिज़्म और कला के बीच संतुलित होती हैं। यदि आप एक ऑल-अराउंड मॉडल की तलाश में हैं और सब्सक्रिप्शन के लिए भुगतान किए बिना मिडजर्नी लुक और फील पसंद करते हैं, तो ओपनजर्नी सबसे अच्छे विकल्पों में से एक है।