संगीत निर्माण में एआई उपकरण कोई नई बात नहीं है। लेकिन एआई के साथ स्क्रैच से उत्पन्न संगीत के बारे में क्या? वह भी अब एक हकीकत है।
रचनात्मक उद्योग में जनरेटिव एआई धीरे-धीरे हमेशा के लिए फैल रहा है। यह एआई कला जनरेटर के साथ शुरू हुआ और फिर एआई-जेनरेट किए गए पाठ के साथ लेखन में फैल गया। अब, हम उस सूची में संगीत जोड़ सकते हैं।
निकट भविष्य में, एआई-जनित संगीत, खरोंच से पैदा हुआ, एक वास्तविकता बन जाएगा। वास्तव में, यह पहले से ही ज्यूकबॉक्स, ओपनएआई के संगीत बनाने वाले एआई मॉडल के साथ एक संभावना है। यह अभी तक उपयोग में आसान एप्लिकेशन में उपलब्ध नहीं है, और यह अभी तक पर्याप्त अच्छा नहीं लगता है, लेकिन एल्गोरिथम हड्डियां हैं।
यहाँ आपको OpenAI के ज्यूकबॉक्स के बारे में जानने की आवश्यकता है और आप इसके साथ क्या कर सकते हैं।
ज्यूकबॉक्स: एआई जो कच्चे ऑडियो के रूप में संगीत उत्पन्न करता है
ज्यूकबॉक्स एक तंत्रिका जाल है जो शैली, कलाकार या गीत जैसे इनपुट देने पर कच्चे ऑडियो रूप में संगीत उत्पन्न कर सकता है। यह अप्रैल 2020 में OpenAI द्वारा जारी किया गया था, वही कंपनी जिसने हमें Dall-E नाम का AI आर्ट जनरेटर और ChatGPT नामक AI चैटबॉट लाया था।
डल-ई के विपरीत, जो दुनिया भर में तेजी से फैल गया और एआई को समाचार और मीडिया का एक उग्र विषय बना दिया, ज्यूकबॉक्स ने अपनी रिलीज के बाद व्यापक रुचि दर्ज नहीं की। इसका एक कारण यह है कि इसमें उपयोगकर्ता के अनुकूल वेब एप्लिकेशन नहीं है—कम से कम अभी तो नहीं है।
आप पर कोड पा सकते हैं ओपनएआई वेबसाइट, एन्कोडिंग और डिकोडिंग प्रक्रिया कैसे काम करती है, इसकी गहन व्याख्या के साथ।
एक और संभावित कारण यह है कि इसमें बहुत अधिक समय और कंप्यूटिंग शक्ति लगती है। आपको अंदाजा देने के लिए, केवल एक मिनट के ऑडियो को रेंडर करने में 9 घंटे लग सकते हैं। यदि आप यह देखना चाहते हैं कि एआई मॉडल संगीत उत्पन्न करने के लिए क्या कर सकता है, तो आपको इसके कोड रूप में मॉडल का पता लगाने की इच्छा की आवश्यकता होगी, साथ ही बहुत धैर्य की आवश्यकता होगी।
या, आप इसे छोड़ सकते हैं ज्यूकबॉक्स नमूना एक्सप्लोरर. यहीं पर OpenAI ने Ella Fitzgerald या 2Pac की समानता में गाने बनाने के अपने प्रयोगों को पोस्ट किया है।
स्पष्ट होना, अन्य एआई संगीत उपकरण गीत उत्पन्न करने में आपकी सहायता के लिए मौजूद हैं, लेकिन वे स्क्रैच से ऑडियो उत्पन्न नहीं करते हैं। इसके बजाय, वे या तो पहले से रिकॉर्ड किए गए नमूनों का संयोजन कर रहे हैं या MIDI जानकारी बना रहे हैं जिसे डिजिटल सिंथेसाइज़र के माध्यम से डाला जाता है।
ज्यूकबॉक्स ध्वनि कैसा लगता है?
ज्यूकबॉक्स के परिणाम पहचानने योग्य लेकिन अजीब हैं। गाने के आकार और शैली को समझना मुश्किल नहीं है, लेकिन परिणामों की गुणवत्ता ऐसा लगता है जैसे आप सबसे पुराने रिकॉर्ड किए गए संगीत में से कुछ सुन रहे हैं: यानी, बहुत सारे संगीत के साथ दब गया शोर।
यह कहना सुरक्षित है, ज्यूकबॉक्स उस तरह की उच्च-निष्ठा ध्वनि उत्पन्न नहीं करता है जो आप अच्छे हेडफ़ोन की एक जोड़ी से सुनेंगे। यह एक रेडियो स्टेशन से संगीत सुनने के समान है जो पूरी तरह से सही आवृत्ति पर ट्यून नहीं किया गया है। कुछ गाने री-रेंडिशन हैं जबकि अन्य मौजूदा गानों की निरंतरता हैं। उपन्यास कलाकारों और शैलियों और अनदेखे गीतों के लिए भी एक श्रेणी है।
ध्वनि की गुणवत्ता के बावजूद, शुरुआती प्रयोगकर्ता ज्यूकबॉक्स द्वारा बनाए गए संगीत की भयानक सुंदरता और विचित्र प्रकृति से चकित होने का वर्णन करते हैं। "एक अज्ञात संस्कृति के साथ एक अज्ञात देश के बारे में प्रलेखन के साउंडट्रैक की तरह", लिखते हैं मध्यम पर मर्जमेन्च.
वर्तमान में, परिणाम मनुष्यों द्वारा बनाए गए संगीत की नकल करने, या यहां तक कि उसे बदलने के लिए काफी अच्छे नहीं हैं, लेकिन प्रौद्योगिकी तेजी से आगे बढ़ रही है और, जल्द ही, ज्यूकबॉक्स जैसे मॉडल उन करतबों को पूरा करने में सक्षम होंगे बहुत।
ओपनएआई के ज्यूकबॉक्स को कैसे प्रशिक्षित किया गया
ज्यूकबॉक्स कैसे संगीत बनाने में सक्षम है जो पहले कभी अस्तित्व में नहीं था, इसका एक हिस्सा यह है कि यह वास्तविक संगीतकारों के संगीत पर प्रशिक्षित है। ओपनएआई बताता है कि:
"इस मॉडल को प्रशिक्षित करने के लिए, हमने 1.2 मिलियन गानों (जिनमें से 600,000 अंग्रेजी में हैं) के एक नए डेटासेट को क्यूरेट करने के लिए वेब को क्रॉल किया, जिसे लिरिकविकी से संबंधित गीत और मेटाडेटा के साथ जोड़ा गया।"
डेटा के लिए क्रॉलिंग कुछ एआई कंपनियों द्वारा डेटा का एक सेट बनाने के लिए उपयोग की जाने वाली एक प्रथा है जिसे एक एआई मॉडल सीखने के लिए उपयोग कर सकता है, और छवि, टेक्स्ट-या इस मामले में-संगीत उत्पन्न करते समय निर्णय ले सकता है। क्रॉलिंग द्वारा बनाए गए डेटासेट विवादास्पद हैं क्योंकि डेटा के मालिकों से पहली जगह में सहमति प्राप्त नहीं की जाती है। हालाँकि, कुछ प्लेटफ़ॉर्म आपको इसकी अनुमति देते हैं अपनी सामग्री को डेटासेट से ऑप्ट आउट करें.
आप सोच सकते हैं कि 1.2 मिलियन गाने बहुत हैं, लेकिन तुलनात्मक रूप से, Dall-E 2 को इंटरनेट से लाखों-करोड़ों इमेज-टेक्स्ट जोड़े पर प्रशिक्षित किया गया था। इसे ध्यान में रखते हुए, ज्यूकबॉक्स की अपनी सीमाएँ हैं।
इसका अपेक्षाकृत छोटा प्रशिक्षण पूल मानव संगीत की संपत्ति और विविधता पर कब्जा नहीं कर सकता है। OpenAI ने कहा है कि यह काफी हद तक पश्चिमी संगीत पर प्रशिक्षित है, यह स्पष्ट पूर्वाग्रह का प्रतिनिधित्व करता है कि यह किस संगीत को उत्पन्न करने में सक्षम है।
आप ज्यूकबॉक्स के साथ क्या कर सकते हैं?
तो, इसकी सीमाओं को ध्यान में रखते हुए, आप ज्यूकबॉक्स के साथ क्या कर सकते हैं? उस प्रश्न का उत्तर देने का एक त्वरित तरीका यह कहना है कि आप ज्यूकबॉक्स के साथ क्या नहीं कर सकते।
क्योंकि एक मिनट का संगीत प्रस्तुत करने में करीब आधा दिन लगता है, यह संगीत बनाने के लिए बहुत उपयोगी नहीं है। कम से कम, पारंपरिक अर्थों में नहीं। आम तौर पर, संगीतकार एक उपकरण (सुधार) पर खेलने और एक गीत की संरचना की योजना बनाने के बीच आगे और आगे बढ़ते हैं। ज्यूकबॉक्स के साथ एक ही तरह का प्रयोग संभव नहीं है।
चूंकि इस स्तर पर ज्यूकबॉक्स के साथ एक गीत तैयार करना आसान नहीं है, आप इसे संगीत के नमूने उत्पन्न करने के एक नए तरीके के रूप में सोच सकते हैं। एक बार जब आप अपनी पसंद का ऑडियो जनरेट कर लेते हैं, तो आप इसे अपनी रचनात्मक परियोजनाओं में उपयोग कर सकते हैं जैसा कि आप सामान्य रूप से करते हैं।
नीचे दिया गया वीडियो किसी छोटे असेंबल वीडियो को अंडरस्कोर करने के लिए ज्यूकबॉक्स के साथ बनाए गए संगीत का उपयोग करने का परिणाम है।
आर्टिफिशियल इंटेलिजेंस में रचनात्मक अनुप्रयोगों के बाहर भी अनुप्रयोगों की एक विस्तृत श्रृंखला है, यही कारण है कि यह इसके लायक है एआई क्या है और इसके क्या खतरे हैं, इसे समझना.
क्या आप एआई म्यूजिक से प्रेरित हैं?
ज्यूकबॉक्स द्वारा उत्पन्न संगीत को खारिज करना आसान नहीं है, और इसकी सभी विचित्रता और भयानक, मानव-मशीन गुणवत्ता के लिए, यह अंत में संगीत की तरह ध्वनि करता है। जबकि संगीत उद्योग पिछले कुछ समय से एआई उपकरणों का उपयोग कर रहा है, कच्चे ऑडियो के रूप में संगीत उत्पन्न करने की संभावना अब केवल एक वास्तविकता है।
लेकिन जबकि ज्यूकबॉक्स जैसे मॉडल मौजूद हैं, उन्हें अभी तक एक व्यावसायिक उपकरण में पैक किया जाना है और अभी भी मानव संगीतकारों की क्षमताओं की कमी है।