एआई हमें वास्तविक तस्वीरों के लिए गलत कला उत्पन्न करने में धोखा दे सकता है। तो हाथ इतनी बड़ी चुनौती क्यों हैं?
एआई जनरेटर हमारी आंखों के सामने डरावनी गति से विकसित होते हैं, लेकिन उनमें अभी भी खामियां हैं। एआई छवियों में अजीब विवरण खोजना वास्तव में काफी मज़ेदार है। इसलिए मिडजर्नी हैंड्स एक गर्म विषय बन गया, कई इंजनों में एक आम समस्या।
आइए जानें कि हाथ AI इमेज जेनरेटर को इतनी चुनौती क्यों देते हैं। उनके प्रोग्रामर पहले से ही इस मेम-योग्य मुद्दे को ठीक कर रहे हैं, लेकिन यह सोचना दिलचस्प है कि आर्टिफिशियल इंटेलिजेंस कैसे सीखता है, यह उल्लेख नहीं करना कि इसके रास्ते में क्या आता है।
एआई-जेनरेटेड हैंड्स ने हलचल क्यों मचाई
छवियों को बनाने के लिए एआई इंजन का उपयोग करने वाले किसी भी व्यक्ति ने देखा होगा कि हाथ शायद ही कभी सही निकलते हैं, लेकिन ट्विटर पर "फोटो" का एक समूह दिखाई देने पर यह मुद्दा बदल गया।
करीब से निरीक्षण करने पर, लोगों के अजीब हाथों ने उन्हें एआई-जनित छवियों के रूप में दिखाया। तथ्य यह है कि यह मिडजर्नी के हाथों का प्रयास था जिसने स्थिति को और अधिक रोचक बना दिया।
आस-पास के सर्वश्रेष्ठ एआई इंजनों में से एक मानव हाथों की जटिलता से नहीं निपट सका, इसलिए मिडजर्नी और उसके प्रतिस्पर्धियों की क्षमताओं का परीक्षण किया गया। यह सच है, यहां तक कि DALL-E भी अवास्तविक उंगलियों और नाखूनों के प्रति संवेदनशील है।
प्रचार अनुपात से बाहर था, एआई-जनित हाथों को देखते हुए हमेशा एक समस्या रही है, लेकिन अतिरिक्त ध्यान ने रिलीज को प्रेरित किया मिडजर्नी वी5 वी4 में सुधार करेगा.
नए संस्करण ने हाथ के डिजाइन को बढ़ाने का एक बिंदु बनाया, एक स्पष्ट संकेत है कि एआई इंजीनियरों ने प्रफुल्लित करने वाली हलचल पर ध्यान दिया और सॉफ्टवेयर की क्षमताओं को अपग्रेड करने का फैसला किया।
मिडजर्नी के उदाहरण का पालन करने के लिए अन्य इंजन धीमे हैं, इसलिए फोटोशॉप के साथ एआई कला को ठीक करना एक अमूल्य कौशल बना हुआ है। प्रोग्रामर्स के लिए मुख्य बाधा यह है कि आर्टिफिशियल इंटेलिजेंस को प्रशिक्षित करना कितना जटिल है।
एआई इमेज जेनरेटर हाथों से क्यों संघर्ष करते हैं?
एआई इंजन छवियों का उत्पादन करने के लिए जनरेटिव एडवरसैरियल नेटवर्क (जीएएन) या स्थिर प्रसार का उपयोग करते हैं। दोनों तकनीकों को सबसे बुनियादी कलाकृतियाँ बनाने के लिए व्यापक स्रोत सामग्री, प्रशिक्षण और प्रसंस्करण शक्ति की आवश्यकता होती है।
चूंकि पूर्व-मौजूदा छवियां एआई के प्रशिक्षण के लिए केंद्रीय हैं, प्रोग्रामर को अपने सॉफ़्टवेयर को हजारों, यदि लाखों नहीं, चित्रों को खिलाना पड़ता है संकेतों के साथ-साथ प्रक्रिया को बार-बार दोहराना जब तक कि इंजन यह नहीं समझता कि कोई विशेष शब्द क्या संदर्भित करता है और उसका प्रतिनिधित्व कैसे करें वस्तु।
लेकिन एआई जिन स्रोत छवियों से सीखता है, वे मुख्य रूप से 2डी हैं, जहां हाथों को विभिन्न स्थितियों में चित्रित किया गया है। चाहे सीधी हो या मुड़ी हुई, पाँच उँगलियाँ दिखा रही हैं या तीन।
दिन के अंत में, एक मशीन वास्तव में हाथों की अवधारणा को नहीं समझती है, और जिन चित्रों से वह सीखती है, वे हमेशा हाथों को स्पष्ट रूप से या लगातार पर्याप्त रूप से प्रदर्शित नहीं करते हैं। इसलिए मिडजर्नी के हाथ इतने बदसूरत हो सकते हैं: एआई भ्रम।
के रूप में मान्य है एआई विकास के बारे में एलोन मस्क की चिंता हो सकता है, तकनीक के कुछ हिस्सों को अभी भी बहुत कुछ सीखना बाकी है। और उनकी बाधाएँ हाथों के अपर्याप्त उदाहरणों से परे हैं।
अन्य कारण क्यों एआई छवि जेनरेटर सुधार के लिए धीमे हैं I
की ओर देखें मिडजर्नी के मॉडल, v5 पाठ संकेतों और निर्मित छवियों के साथ-साथ उच्च रिज़ॉल्यूशन और अतिरिक्त टूल के बीच उन्नत सुसंगतता प्रदान करता है। लेकिन ऐसी उपलब्धियां सस्ते नहीं आतीं।
हाथों से बेहतर करने के लिए एआई को प्रशिक्षित करने के लिए उसे बेहतर इमेज फीड करने की आवश्यकता होती है, खासकर 3डी में। इसका मतलब है कि स्रोत सामग्री प्राप्त करने से लेकर कोडिंग में सुधार करने और एआई के सही होने तक प्रशिक्षण को दोहराने तक प्रक्रियाओं पर बहुत समय और जनशक्ति खर्च की जाती है।
फिर भी, सॉफ्टवेयर कला के अन्यथा आश्चर्यजनक कार्यों में गलतियाँ कर सकता है। एक बड़ा और जटिल काम होने के अलावा, यह महंगा है। तो उम्मीद मत करो मुफ्त एआई टेक्स्ट-टू-इमेज जेनरेटर अभी तक मिडजर्नी के कैलिबर तक कदम बढ़ाने के लिए।
सीधे शब्दों में कहें, एआई इंजन के साथ समस्या सिर्फ इन कंप्यूटर प्रोग्रामों की पूरी तरह से समझने में असमर्थता नहीं है कि हाथ और पैर जैसी मानवीय विशेषताएं कैसे दिखती हैं या काम करती हैं। यह इसकी लागत के हिसाब से भी नीचे आता है, और 3डी इमेजरी और मशीन लर्निंग तकनीकों तक प्रौद्योगिकी की पहुंच जो जनरेटर को उनके आसपास की दुनिया की अधिक यथार्थवादी समझ प्राप्त करने में मदद कर सकती है।
एआई इमेज जेनरेटर हमेशा के लिए संघर्ष नहीं करेंगे
हाथ कृत्रिम बुद्धि के लिए अपने द्विआधारी सिर को चारों ओर लपेटने के लिए एक मुश्किल अवधारणा है, लेकिन समस्या का समाधान पहले से ही काम पर है। मिडजर्नी, डीएएल-ई 2, और अन्य प्लेटफॉर्म अंततः विचित्र उंगलियों को कम से कम रखने में सक्षम होंगे, यदि उन्हें पूरी तरह खत्म नहीं किया जा सकता है।
अन्य एआई क्षेत्रों में प्रगति सुनिश्चित करती है कि तकनीक लगातार विकसित हो रही है, और इसके डेवलपर्स हमेशा इसे लागू करने और सुधारने के नए तरीके सीख रहे हैं।