बड़े भाषा के मॉडल (एलएलएम) अंतर्निहित तकनीक हैं जिसने जनरेटिव एआई चैटबॉट्स के उल्कापिंड वृद्धि को संचालित किया है। चैटजीपीटी, गूगल बार्ड और बिंग चैट जैसे उपकरण आपके संकेतों और प्रश्नों के लिए मानव जैसी प्रतिक्रियाएं उत्पन्न करने के लिए एलएलएम पर भरोसा करते हैं।

लेकिन एलएलएम क्या हैं और वे कैसे काम करते हैं? यहां हमने एलएलएम के रहस्य को उजागर करना शुरू किया।

एक बड़ा भाषा मॉडल क्या है?

अपने सरलतम शब्दों में, एलएलएम टेक्स्ट डेटा का एक विशाल डेटाबेस है जिसे आपके संकेतों के लिए मानव-जैसी प्रतिक्रियाएं उत्पन्न करने के लिए संदर्भित किया जा सकता है। पाठ कई स्रोतों से आता है और इसमें अरबों शब्द हो सकते हैं।

उपयोग किए गए टेक्स्ट डेटा के सामान्य स्रोतों में ये हैं:

  • साहित्य: एलएलएम में अक्सर समकालीन और शास्त्रीय साहित्य की भारी मात्रा होती है। इसमें किताबें, कविता और नाटक शामिल हो सकते हैं।
  • ऑनलाइन सामग्री: एक एलएलएम में अक्सर ऑनलाइन सामग्री का एक बड़ा भंडार होता है, जिसमें ब्लॉग, वेब सामग्री, फोरम प्रश्न और प्रतिक्रियाएं, और अन्य ऑनलाइन पाठ शामिल होते हैं।
  • समाचार और करंट अफेयर्स: कुछ, लेकिन सभी नहीं, एलएलएम वर्तमान समाचार विषयों तक पहुंच सकते हैं। कुछ LLM, जैसे GPT-3.5, इस अर्थ में प्रतिबंधित हैं।
    instagram viewer
  • सामाजिक मीडिया: सोशल मीडिया प्राकृतिक भाषा के विशाल संसाधन का प्रतिनिधित्व करता है। एलएलएम फेसबुक, ट्विटर और इंस्टाग्राम जैसे प्रमुख प्लेटफॉर्म से टेक्स्ट का उपयोग करते हैं।

बेशक, पाठ का एक विशाल डेटाबेस होना एक बात है, लेकिन एलएलएम को मानव जैसी प्रतिक्रियाओं का उत्पादन करने के लिए इसे समझने के लिए प्रशिक्षित करने की आवश्यकता है। यह ऐसा कैसे करता है जिसे हम आगे कवर करेंगे।

एलएलएम कैसे काम करते हैं?

एलएलएम अपनी प्रतिक्रियाएँ बनाने के लिए इन रिपॉजिटरी का उपयोग कैसे करते हैं? पहला कदम डीप लर्निंग नामक प्रक्रिया का उपयोग करके डेटा का विश्लेषण करना है।

मानव भाषा के पैटर्न और बारीकियों की पहचान करने के लिए डीप लर्निंग का उपयोग किया जाता है। इसमें व्याकरण और वाक्य-विन्यास की समझ हासिल करना शामिल है। लेकिन महत्वपूर्ण बात यह है कि इसमें संदर्भ भी शामिल है। संदर्भ को समझना एलएलएम का एक महत्वपूर्ण हिस्सा है।

आइए एक उदाहरण देखें कि कैसे एलएलएम संदर्भ का उपयोग कर सकते हैं।

निम्नलिखित छवि में संकेत रात में चमगादड़ को देखने का उल्लेख करता है। इससे चैटजीपीटी समझ गया कि हम एक जानवर के बारे में बात कर रहे थे, उदाहरण के लिए बेसबॉल बैट की नहीं। बेशक, अन्य चैटबॉट पसंद करते हैं बिंग चैट या गूगल बार्ड इसका उत्तर पूरी तरह से अलग तरीके से दे सकते हैं।

हालांकि, यह अचूक नहीं है, और जैसा कि इस उदाहरण से पता चलता है, कभी-कभी आपको वांछित प्रतिक्रिया प्राप्त करने के लिए अतिरिक्त जानकारी प्रदान करने की आवश्यकता होगी।

इस उदाहरण में, हमने यह प्रदर्शित करने के लिए कि संदर्भ कितनी आसानी से खो जाता है, जानबूझकर एक घुमावदार गेंद फेंकी। लेकिन मनुष्य प्रश्नों के संदर्भ को भी गलत समझ सकते हैं, और प्रतिक्रिया को ठीक करने के लिए केवल एक अतिरिक्त संकेत की आवश्यकता होती है।

इन प्रतिक्रियाओं को उत्पन्न करने के लिए, एलएलएम प्राकृतिक भाषा पीढ़ी (एनएलजी) नामक तकनीक का उपयोग करते हैं। इसमें प्रासंगिक रूप से सही और प्रासंगिक प्रतिक्रिया उत्पन्न करने के लिए इनपुट की जांच करना और इसके डेटा रिपॉजिटरी से सीखे गए पैटर्न का उपयोग करना शामिल है।

लेकिन एलएलएम इससे कहीं ज्यादा गहरे जाते हैं। वे इनपुट के भावनात्मक स्वर के अनुरूप जवाब भी दे सकते हैं। जब प्रासंगिक समझ के साथ जोड़ा जाता है, तो दो पहलू मुख्य चालक होते हैं जो एलएलएम को मानव जैसी प्रतिक्रियाएं बनाने की अनुमति देते हैं।

संक्षेप में, एलएलएम आपके संकेतों के लिए मानव-जैसी प्रतिक्रियाएं बनाने के लिए गहन शिक्षण और एनएलजी तकनीकों के संयोजन के साथ एक विशाल टेक्स्ट डेटाबेस का उपयोग करते हैं। लेकिन इससे क्या हासिल हो सकता है इसकी सीमाएं हैं।

एलएलएम की सीमाएं क्या हैं?

एलएलएम एक प्रभावशाली तकनीकी उपलब्धि का प्रतिनिधित्व करते हैं। लेकिन तकनीक परिपूर्ण से बहुत दूर है, और अभी भी बहुत सी सीमाएँ हैं कि वे क्या हासिल कर सकते हैं। इनमें से कुछ अधिक उल्लेखनीय नीचे सूचीबद्ध हैं:

  1. प्रासंगिक समझ: हमने इसका उल्लेख कुछ ऐसे एलएलएम के रूप में किया है जो उनके उत्तरों में शामिल हैं। हालांकि, वे इसे हमेशा सही नहीं पाते हैं और अक्सर संदर्भ को समझने में असमर्थ होते हैं, जिससे अनुपयुक्त या सीधे सादे गलत उत्तर मिलते हैं।
  2. पक्षपात: प्रशिक्षण डेटा में मौजूद कोई भी पक्षपात अक्सर प्रतिक्रियाओं में मौजूद हो सकता है। इसमें लिंग, जाति, भूगोल और संस्कृति के प्रति पूर्वाग्रह शामिल हैं।
  3. व्यावहारिक बुद्धि: सामान्य ज्ञान को मापना मुश्किल है, लेकिन मनुष्य कम उम्र से ही अपने आसपास की दुनिया को देखकर इसे सीख लेते हैं। एलएलएम के पास वापस आने के लिए यह अंतर्निहित अनुभव नहीं है। वे केवल वही समझते हैं जो उन्हें उनके प्रशिक्षण डेटा के माध्यम से प्रदान किया गया है, और यह उन्हें उस दुनिया की सही समझ नहीं देता है जिसमें वे मौजूद हैं।
  4. एक एलएलएम केवल उतना ही अच्छा है जितना कि इसका प्रशिक्षण डेटा: सटीकता की कभी गारंटी नहीं दी जा सकती। "गारबेज इन, गारबेज आउट" का पुराना कंप्यूटर कहावत इस सीमा को पूरी तरह से बताता है। एलएलएम केवल उतना ही अच्छा है जितना कि उनके प्रशिक्षण डेटा की गुणवत्ता और मात्रा उन्हें अनुमति देती है।

एक तर्क यह भी है कि नैतिक चिंताओं को एलएलएम की एक सीमा माना जा सकता है, लेकिन यह विषय इस लेख के दायरे से बाहर है।

लोकप्रिय एलएलएम के 3 उदाहरण

एआई की निरंतर उन्नति अब काफी हद तक एलएलएम द्वारा समर्थित है। इसलिए जबकि वे बिल्कुल नई तकनीक नहीं हैं, वे निश्चित रूप से महत्वपूर्ण गति के बिंदु पर पहुंच गए हैं, और अब कई मॉडल हैं।

यहाँ कुछ सबसे व्यापक रूप से उपयोग किए जाने वाले एलएलएम हैं।

1. जीपीटी

जनरेटिव प्री-प्रशिक्षित ट्रांसफॉर्मर (जीपीटी) शायद सबसे व्यापक रूप से ज्ञात एलएलएम है। GPT-3.5 इस आलेख में उदाहरणों के लिए उपयोग किए गए ChatGPT प्लेटफ़ॉर्म को शक्ति प्रदान करता है, जबकि नवीनतम संस्करण, GPT-4, उपलब्ध है चैटजीपीटी प्लस सदस्यता के माध्यम से. Microsoft नवीनतम संस्करण का भी उपयोग करता है इसके बिंग चैट प्लेटफॉर्म में.

2. लाएमडीए

यह Google बार्ड, Google के AI चैटबॉट द्वारा उपयोग किया जाने वाला प्रारंभिक LLM है। संस्करण बार्ड को शुरू में एलएलएम के "लाइट" संस्करण के रूप में वर्णित किया गया था। एलएलएम के अधिक शक्तिशाली PaLM पुनरावृति ने इसका स्थान ले लिया।

3. बर्ट

बीईआरटी ट्रांसफॉर्मर से द्वि-दिशात्मक एनकोडर प्रतिनिधित्व के लिए खड़ा है। मॉडल की द्विदिश विशेषताएं अंतर करती हैं जीपीटी जैसे अन्य एलएलएम से बीईआरटी.

बहुत अधिक एलएलएम विकसित किए गए हैं, और प्रमुख एलएलएम से शाखाएं आम हैं। जैसे-जैसे वे विकसित होते हैं, ये जटिलता, सटीकता और प्रासंगिकता में बढ़ते रहेंगे। लेकिन एलएलएम का भविष्य क्या है?

एलएलएम का भविष्य

निस्संदेह ये भविष्य में तकनीक के साथ हमारे इंटरैक्ट करने के तरीके को आकार देंगे। चैटजीपीटी और बिंग चैट जैसे मॉडलों का तेजी से बढ़ना इस तथ्य का प्रमाण है। बहुत कम सम्य के अंतराल मे, एआई आपको काम पर बदलने की संभावना नहीं है. लेकिन अभी भी अनिश्चितता है कि भविष्य में ये हमारे जीवन में कितनी बड़ी भूमिका निभाएंगे।

नैतिक तर्क अभी भी कह सकते हैं कि हम इन उपकरणों को समाज में कैसे एकीकृत करते हैं। हालाँकि, इसे एक तरफ रखते हुए, कुछ अपेक्षित एलएलएम विकासों में शामिल हैं:

  1. बेहतर दक्षता: एलएलएम में करोड़ों मापदंडों की विशेषता है, वे अविश्वसनीय रूप से संसाधनों के भूखे हैं। हार्डवेयर और एल्गोरिदम में सुधार के साथ, वे अधिक ऊर्जा कुशल बनने की संभावना है। इससे प्रतिक्रिया समय भी तेज होगा।
  2. बेहतर प्रासंगिक जागरूकता:एलएलएम स्व-प्रशिक्षण हैं; उन्हें जितना अधिक उपयोग और प्रतिक्रिया मिलती है, वे उतने ही बेहतर होते जाते हैं। महत्वपूर्ण रूप से, यह बिना किसी और बड़ी इंजीनियरिंग के है। जैसे-जैसे तकनीक आगे बढ़ती है, इससे भाषा की क्षमताओं और प्रासंगिक जागरूकता में सुधार देखने को मिलेगा।
  3. विशिष्ट कार्यों के लिए प्रशिक्षित: जैक-ऑफ़-ऑल-ट्रेड उपकरण जो एलएलएम का सार्वजनिक चेहरा हैं, त्रुटियों से ग्रस्त हैं। लेकिन जैसा कि वे विकसित होते हैं और उपयोगकर्ता उन्हें विशिष्ट आवश्यकताओं के लिए प्रशिक्षित करते हैं, एलएलएम चिकित्सा, कानून, वित्त और शिक्षा जैसे क्षेत्रों में बड़ी भूमिका निभा सकते हैं।
  4. ग्रेटर इंटीग्रेशन: एलएलएम पर्सनल डिजिटल असिस्टेंट बन सकते हैं। स्टेरॉयड पर सिरी के बारे में सोचें, और आपको इसका अंदाजा हो जाएगा। एलएलएम आभासी सहायक बन सकते हैं जो भोजन का सुझाव देने से लेकर आपके पत्राचार से निपटने तक हर चीज में आपकी मदद करते हैं।

ये कुछ ऐसे क्षेत्र हैं जहां एलएलएम हमारे जीने के तरीके का एक बड़ा हिस्सा बनने की संभावना है।

एलएलएम ट्रांसफॉर्मिंग एंड एजुकेटिंग

एलएलएम संभावनाओं की एक रोमांचक दुनिया खोल रहे हैं। ChatGPT, Bing Chat, और Google Bard जैसे चैटबॉट्स का तेजी से उदय इस बात का प्रमाण है कि संसाधनों को क्षेत्र में डाला जा रहा है।

संसाधनों का ऐसा प्रसार ही इन उपकरणों को अधिक शक्तिशाली, बहुमुखी और सटीक बनते हुए देख सकता है। ऐसे उपकरणों के संभावित अनुप्रयोग विशाल हैं, और इस समय, हम केवल एक अविश्वसनीय नए संसाधन की सतह को खंगाल रहे हैं।