जीरो-शॉट लर्निंग मशीन लर्निंग में कई समस्याओं का समाधान करती है, लेकिन यह कैसे काम करती है, और यह एआई को कैसे बेहतर बनाती है?

चाबी छीनना

  • नए डेटा के साथ सटीक भविष्यवाणियां सुनिश्चित करने के लिए गहन शिक्षण में सामान्यीकरण आवश्यक है। जीरो-शॉट लर्निंग एआई को लेबल किए गए डेटा के बिना नई या अनदेखी कक्षाओं पर सटीक भविष्यवाणियां करने के लिए मौजूदा ज्ञान का उपयोग करने की अनुमति देकर इसे प्राप्त करने में मदद करता है।
  • जीरो-शॉट लर्निंग मनुष्य के डेटा सीखने और संसाधित करने के तरीके की नकल करता है। अतिरिक्त अर्थ संबंधी जानकारी प्रदान करके, एक पूर्व-प्रशिक्षित मॉडल नई कक्षाओं की सटीक पहचान कर सकता है, जैसे एक इंसान खोखले शरीर वाले गिटार की विशेषताओं को समझकर उसकी पहचान करना सीख सकता है।
  • जीरो-शॉट लर्निंग सामान्यीकरण, स्केलेबिलिटी में सुधार, ओवरफिटिंग को कम करने और लागत प्रभावी होने के कारण एआई में सुधार करती है। यह मॉडलों को बड़े डेटासेट पर प्रशिक्षित करने, ट्रांसफर लर्निंग के माध्यम से अधिक ज्ञान प्राप्त करने, बेहतर प्रासंगिक समझ रखने और व्यापक लेबल वाले डेटा की आवश्यकता को कम करने की अनुमति देता है। जैसे-जैसे एआई आगे बढ़ता है, विभिन्न क्षेत्रों में जटिल चुनौतियों से निपटने के लिए जीरो-शॉट लर्निंग और भी महत्वपूर्ण हो जाएगी।
    instagram viewer

गहन शिक्षण का एक सबसे बड़ा लक्ष्य उन मॉडलों को प्रशिक्षित करना है जिन्होंने सामान्यीकृत ज्ञान प्राप्त किया है। सामान्यीकरण आवश्यक है क्योंकि यह सुनिश्चित करता है कि मॉडल ने सार्थक पैटर्न सीख लिया है और नए या अनदेखे डेटा का सामना करने पर सटीक भविष्यवाणी या निर्णय ले सकता है। ऐसे मॉडलों को प्रशिक्षित करने के लिए अक्सर काफी मात्रा में लेबल किए गए डेटा की आवश्यकता होती है। हालाँकि, ऐसा डेटा महंगा, श्रम-गहन और कभी-कभी असंभव हो सकता है।

इस अंतर को पाटने के लिए जीरो-शॉट लर्निंग लागू की गई है, जिससे एआई को लेबल किए गए डेटा की कमी के बावजूद अपने मौजूदा ज्ञान का उपयोग करके काफी सटीक भविष्यवाणियां करने की अनुमति मिलती है।

जीरो-शॉट लर्निंग क्या है?

जीरो-शॉट लर्निंग एक विशिष्ट प्रकार की ट्रांसफर लर्निंग तकनीक है। यह नए वर्ग के विवरणों का वर्णन करने वाली अतिरिक्त जानकारी प्रदान करके नए या पहले कभी न देखे गए वर्गों की पहचान करने के लिए पूर्व-प्रशिक्षित मॉडल का उपयोग करने पर केंद्रित है।

किसी मॉडल के कुछ विषयों के सामान्य ज्ञान का उपयोग करके और उसे क्या देखना है, इस पर अतिरिक्त शब्दार्थ देकर, उसे बहुत सटीक रूप से यह इंगित करने में सक्षम होना चाहिए कि उसे किस विषय की पहचान करने का काम सौंपा गया है।

मान लीजिए कि हमें ज़ेबरा की पहचान करनी है। हालाँकि, हमारे पास ऐसा कोई मॉडल नहीं है जो ऐसे जानवरों की पहचान कर सके। इसलिए, हम पहले से मौजूद एक मॉडल को घोड़ों की पहचान करने के लिए प्रशिक्षित करते हैं और मॉडल को बताते हैं कि काली और सफेद धारियों वाले घोड़े ज़ेबरा हैं। जब हम ज़ेबरा और घोड़ों की छवियां प्रदान करके मॉडल का अनुमान लगाना शुरू करते हैं, तो इस बात की अच्छी संभावना है कि मॉडल प्रत्येक जानवर की सही पहचान करेगा।

कई गहन शिक्षण तकनीकों की तरह, शून्य-शॉट शिक्षण मनुष्य के डेटा सीखने और संसाधित करने के तरीके की नकल करता है। मनुष्य को स्वाभाविक रूप से शून्य-शॉट सीखने वाला माना जाता है। यदि आपको संगीत की दुकान में खोखली बॉडी वाला गिटार ढूंढने का काम सौंपा गया है, तो आपको इसे ढूंढने में समस्या हो सकती है। लेकिन एक बार जब मैं आपको बताता हूं कि एक खोखला शरीर मूल रूप से एक गिटार होता है जिसके एक या दोनों तरफ एफ-आकार का छेद होता है, तो आपको शायद तुरंत एक गिटार मिल जाएगा।

वास्तविक दुनिया के उदाहरण के लिए, आइए शून्य-शॉट वर्गीकरण ऐप का उपयोग करें ओपन सोर्स एलएलएम होस्टिंग साइट हगिंग फेस क्लिप-विट-लार्ज मॉडल का उपयोग करना।

यह तस्वीर एक ऊंची कुर्सी पर बंधे किराने के थैले में ब्रेड की छवि दर्शाती है। चूंकि मॉडल को छवियों के एक बड़े डेटासेट पर प्रशिक्षित किया गया था, इसलिए मॉडल संभवतः फोटो में प्रत्येक आइटम, जैसे ब्रेड, किराने का सामान, कुर्सियाँ और सुरक्षा बेल्ट की पहचान कर सकता है।

अब, हम चाहते हैं कि मॉडल पहले से अनदेखी कक्षाओं का उपयोग करके छवि को वर्गीकृत करे। इस मामले में, उपन्यास या अनदेखी कक्षाएं "आरामदायक ब्रेड," "सुरक्षित ब्रेड," "सिटिंग ब्रेड," "ड्राइविंग किराना," और "सुरक्षित किराना" होंगी।

ध्यान दें कि हमने किसी छवि पर शून्य-शॉट वर्गीकरण की प्रभावशीलता को प्रदर्शित करने के लिए जानबूझकर असामान्य अनदेखी कक्षाओं और छवियों का उपयोग किया है।

मॉडल का अनुमान लगाने के बाद, यह लगभग 80% निश्चितता के साथ वर्गीकृत करने में सक्षम था कि इसके लिए सबसे उपयुक्त वर्गीकरण छवि थी "सुरक्षित रोटी।" ऐसा संभवतः इसलिए है क्योंकि मॉडल का मानना ​​है कि ऊंची कुर्सी बैठने, आराम करने से ज्यादा सुरक्षा के लिए है ड्राइविंग.

बहुत बढ़िया! मैं व्यक्तिगत रूप से मॉडल के आउटपुट से सहमत हूँ। लेकिन वास्तव में यह मॉडल ऐसे आउटपुट के साथ कैसे आया? जीरो-शॉट लर्निंग कैसे काम करती है, इसकी एक सामान्य जानकारी यहां दी गई है।

जीरो-शॉट लर्निंग कैसे काम करती है

शून्य-शॉट शिक्षण एक पूर्व-प्रशिक्षित मॉडल को लेबल किए गए डेटा प्रदान किए बिना नई कक्षाओं की पहचान करने में मदद कर सकता है। अपने सरलतम रूप में, शून्य-शॉट सीखना तीन चरणों में किया जाता है:

1. तैयारी

जीरो-शॉट लर्निंग तीन प्रकार के डेटा तैयार करके शुरू होती है

  • देखी गई कक्षा: पूर्व-प्रशिक्षित मॉडल के प्रशिक्षण में उपयोग किया गया डेटा। मॉडल पहले से ही देखी गई कक्षाएं प्रदान करता है। शून्य-शॉट सीखने के लिए सर्वोत्तम मॉडल उन कक्षाओं पर प्रशिक्षित मॉडल हैं जो उस नई कक्षा से निकटता से संबंधित हैं जिसे आप मॉडल से पहचानना चाहते हैं।
  • अनदेखी/उपन्यास कक्षा: वह डेटा जिसका उपयोग मॉडल के प्रशिक्षण के दौरान कभी नहीं किया गया था। आपको इस डेटा को स्वयं क्यूरेट करना होगा क्योंकि आप इसे मॉडल से प्राप्त नहीं कर सकते हैं।
  • सिमेंटिक/सहायक डेटा: डेटा के अतिरिक्त बिट्स जो मॉडल को नए वर्ग की पहचान करने में मदद कर सकते हैं। यह शब्दों, वाक्यांशों, शब्द एम्बेडिंग या वर्ग नामों में हो सकता है।

2. सिमेंटिक मैपिंग

अगला कदम अदृश्य वर्ग की विशेषताओं का मानचित्रण करना है। यह शब्द एम्बेडिंग बनाकर और एक सिमेंटिक मानचित्र बनाकर किया जाता है जो अदृश्य वर्ग की विशेषताओं या विशेषताओं को प्रदान किए गए सहायक डेटा से जोड़ता है। एआई ट्रांसफर लर्निंग प्रक्रिया को बहुत तेज़ बनाता है, क्योंकि अदृश्य वर्ग से संबंधित कई विशेषताओं को पहले ही मैप किया जा चुका है।

3. अनुमान लगाना

पूर्वानुमान या आउटपुट उत्पन्न करने के लिए मॉडल का उपयोग अनुमान लगाना है। शून्य-शॉट छवि वर्गीकरण में, दिए गए छवि इनपुट पर शब्द एम्बेडिंग उत्पन्न की जाती है और फिर सहायक डेटा के साथ प्लॉट और तुलना की जाती है। निश्चितता का स्तर इनपुट और प्रदान किए गए सहायक डेटा के बीच समानता पर निर्भर करेगा।

ज़ीरो-शॉट लर्निंग एआई को कैसे बेहतर बनाता है

जीरो-शॉट लर्निंग मशीन लर्निंग में कई चुनौतियों का समाधान करके एआई मॉडल में सुधार करती है, जिनमें शामिल हैं:

  • बेहतर सामान्यीकरण: लेबल किए गए डेटा पर निर्भरता कम करने से मॉडल को बड़े डेटा सेट में प्रशिक्षित करने, सामान्यीकरण में सुधार करने और मॉडल को अधिक मजबूत और विश्वसनीय बनाने की अनुमति मिलती है। जैसे-जैसे मॉडल अधिक अनुभवी और सामान्यीकृत होते जाते हैं, मॉडलों के लिए सामान्य ज्ञान सीखना भी संभव हो सकता है जानकारी का विश्लेषण करने के सामान्य तरीके के बजाय।
  • स्केलेबिलिटी: मॉडलों को लगातार प्रशिक्षित किया जा सकता है और स्थानांतरण शिक्षण के माध्यम से अधिक ज्ञान प्राप्त किया जा सकता है। कंपनियां और स्वतंत्र शोधकर्ता भविष्य में अधिक सक्षम होने के लिए अपने मॉडल में लगातार सुधार कर सकते हैं।
  • ओवरफिटिंग की संभावना कम: ओवरफिटिंग एक छोटे डेटा सेट पर मॉडल को प्रशिक्षित करने के कारण हो सकती है जिसमें सभी संभावित इनपुट का प्रतिनिधित्व करने के लिए पर्याप्त विविधता नहीं होती है। शून्य-शॉट शिक्षण के माध्यम से मॉडल को प्रशिक्षित करने से विषयों की बेहतर प्रासंगिक समझ रखने के लिए मॉडल को प्रशिक्षित करने से ओवरफिटिंग की संभावना कम हो जाती है।
  • प्रभावी लागत: बड़ी मात्रा में लेबल किया गया डेटा उपलब्ध कराने में समय और संसाधन लग सकते हैं। जीरो-शॉट ट्रांसफर लर्निंग का उपयोग करके, एक मजबूत मॉडल का प्रशिक्षण बहुत कम समय और लेबल किए गए डेटा के साथ किया जा सकता है।

जैसे-जैसे एआई आगे बढ़ेगा, जीरो-शॉट लर्निंग जैसी तकनीकें और भी महत्वपूर्ण हो जाएंगी।

जीरो-शॉट लर्निंग का भविष्य

जीरो-शॉट लर्निंग मशीन लर्निंग का एक अनिवार्य हिस्सा बन गया है। यह मॉडलों को स्पष्ट प्रशिक्षण के बिना नई कक्षाओं को पहचानने और वर्गीकृत करने में सक्षम बनाता है। मॉडल आर्किटेक्चर, विशेषता-आधारित दृष्टिकोण और मल्टीमॉडल एकीकरण में चल रही प्रगति के साथ, शून्य-शॉट सीखना संभव है रोबोटिक्स, स्वास्थ्य देखभाल और कंप्यूटर में जटिल चुनौतियों का समाधान करने में मॉडलों को और अधिक अनुकूलनीय बनाने में महत्वपूर्ण रूप से मदद मिलेगी दृष्टि।