ChatGPT OpenAI का गेम-चेंजिंग AI चैटबॉट है जो इंटरनेट को हैरान कर रहा है। सभी स्थापित तकनीकी रुझानों के खिलाफ, चैटजीपीटी को हमारे डिजिटल जीवन के लगभग हर क्षेत्र में अपना रास्ता खोजने में देर नहीं लगी है।
इतने कम समय में ChatGPT ने जितनी दिलचस्पी हासिल की है, उतनी कम तकनीकी नवाचारों ने ही हासिल की है। ऐसा लगता है कि यह कभी भी शानदार तरकीबों से बाहर नहीं निकलता है - हर दिन, हम रोमांचक नई चीजों के बारे में सीखते हैं जिन्हें हम नहीं जानते थे कि यह कर सकता है।
लेकिन चैटजीपीटी उन चीजों को कैसे कर सकता है जो वह कर सकता है? चैटजीपीटी कैसे काम करता है?
चैटजीपीटी कैसे बनाया गया था?
यह समझने के लिए कि चैटजीपीटी कैसे काम करता है, इसकी उत्पत्ति और अत्याधुनिक एआई चैटबॉट के पीछे के दिमाग को देखने लायक है।
सबसे पहले, चैटजीपीटी जितना जादुई लग सकता है, यह मनुष्यों की प्रतिभा द्वारा बनाया गया था, ठीक वैसे ही जैसे हर सार्थक सॉफ्टवेयर तकनीक। OpenAI ने DALL-E, InstructGPT, और कोडेक्स जैसे अन्य शक्तिशाली AI टूल के पीछे क्रांतिकारी AI अनुसंधान और विकास कंपनी, ChatGPT का निर्माण किया। हम पहले उत्तर दे चुके हैं
चैटजीपीटी के बारे में आपके कुछ प्रश्न हो सकते हैं, तो अवश्य देखें।जबकि ChatGPT 2022 के अंत में वायरल हो गया था, अधिकांश अंतर्निहित तकनीक जो ChatGPT को शक्ति प्रदान करती है, बहुत कम प्रचार के साथ, बहुत लंबे समय तक रही है। ChatGPT मॉडल GPT-3 (या, अधिक विशेष रूप से, GPT-3.5) के शीर्ष पर बनाया गया है। GPT का अर्थ है "जनरेटिव प्री-प्रशिक्षित ट्रांसफॉर्मर 3."
GPT-3 AI मॉडल की GPT लाइन का तीसरा पुनरावृत्ति है और GPT-2 और GPT से पहले था। GPT मॉडल के पहले के पुनरावृत्तियाँ समान रूप से उपयोगी हैं, लेकिन GPT-3 और सूक्ष्म रूप से ट्यून किए गए GPT-3.5 पुनरावृत्ति बहुत अधिक शक्तिशाली हैं। अधिकांश चैटजीपीटी क्या कर सकता है अंतर्निहित GPT-3 तकनीक के कारण है।
जीपीटी क्या है?
इसलिए हमने स्थापित किया है कि चैटजीपीटी जीपीटी मॉडल की तीसरी पीढ़ी पर बनाया गया है। लेकिन वैसे भी GPT क्या है?
आइए सरल शब्दों को पचाने में आसान और गैर-तकनीकी तरीके से खोलना शुरू करें।
- जीपीटी में "जेनरेटिव" प्राकृतिक मानव भाषा पाठ उत्पन्न करने की क्षमता का प्रतिनिधित्व करता है।
- "पूर्व प्रशिक्षित" इस तथ्य का प्रतिनिधित्व करता है कि मॉडल को पहले से ही कुछ परिमित डेटासेट पर प्रशिक्षित किया गया है। ठीक वैसे ही जैसे आप किसी किताब के बारे में सवालों के जवाब देने से पहले या शायद कई किताबें पढ़ते हैं।
- "ट्रांसफ़ॉर्मर" अंतर्निहित मशीन-लर्निंग आर्किटेक्चर का प्रतिनिधित्व करता है जो GPT को शक्ति प्रदान करता है।
अब, इसे एक साथ रखते हुए, जनरेटिव प्री-प्रशिक्षित ट्रांसफॉर्मर (जीपीटी) एक भाषा मॉडल है जिसे प्रस्तुत किए जाने पर मानव भाषा पाठ उत्पन्न करने के उद्देश्य से इंटरनेट से डेटा का उपयोग करके प्रशिक्षित किया जाता है तत्पर। इसलिए, हमने बार-बार कहा है कि GPT को प्रशिक्षित किया गया था, लेकिन इसे कैसे प्रशिक्षित किया गया?
चैटजीपीटी को कैसे प्रशिक्षित किया गया?
ChatGPT को शुरू से ही प्रशिक्षित नहीं किया गया था। इसके बजाय, यह GPT-3.5 का एक ठीक-ठीक संस्करण है, जो स्वयं GPT-3 का एक ठीक-ठीक संस्करण है। GPT-3 मॉडल को इंटरनेट से एकत्रित भारी मात्रा में डेटा के साथ प्रशिक्षित किया गया था। विकिपीडिया, ट्विटर और रेडिट के बारे में सोचें- यह डेटा और मानव पाठ को इंटरनेट के सभी कोनों से स्क्रैप किया गया था।
यदि आप सोच रहे हैं कि GPT प्रशिक्षण कैसे काम करता है, तो GPT-3 को पर्यवेक्षित शिक्षण और मानव फ़ीडबैक (RLHF) के माध्यम से सुदृढीकरण सीखने के संयोजन का उपयोग करके प्रशिक्षित किया गया था। सुपरवाइज्ड लर्निंग वह चरण है जहां मॉडल को इंटरनेट से स्क्रैप किए गए टेक्स्ट के बड़े डेटासेट पर प्रशिक्षित किया जाता है। सुदृढीकरण सीखने का चरण वह है जहाँ इसे बेहतर प्रतिक्रियाएँ देने के लिए प्रशिक्षित किया जाता है जो मानव के साथ संरेखित होती हैं जो मानव-समान और सही दोनों के रूप में स्वीकार करती हैं।
पर्यवेक्षित शिक्षण के साथ प्रशिक्षण
यह बेहतर ढंग से समझने के लिए कि चैटजीपीटी पर पर्यवेक्षित और सुदृढीकरण शिक्षण कैसे लागू होता है, एक ऐसे परिदृश्य की कल्पना करें जहां एक शिक्षक द्वारा एक छात्र को निबंध लिखना सिखाया जा रहा हो। पर्यवेक्षित शिक्षण छात्र को पढ़ने के लिए सैकड़ों निबंध देने वाले शिक्षक के बराबर होगा। यहाँ लक्ष्य छात्र के लिए यह सीखना है कि सैकड़ों निबंधों के स्वर, शब्दावली और संरचना के अभ्यस्त होकर एक निबंध कैसे लिखा जाना चाहिए।
हालाँकि, उन सैकड़ों निबंधों में अच्छा और बुरा होगा। चूंकि छात्र को अच्छी और बुरी दोनों प्रतियों पर प्रशिक्षित किया गया था, कभी-कभी, छात्र खराब निबंध लिख सकता है क्योंकि छात्र को किसी समय खराब निबंध भी खिलाया गया था। इसका मतलब यह है कि जब एक निबंध लिखने के लिए कहा जाता है, तो छात्र एक ऐसी कॉपी लिख सकता है जो स्वीकार्य नहीं है या शिक्षक के लिए पर्याप्त नहीं है। यहीं पर सुदृढीकरण सीखना आता है।
सुदृढीकरण सीखने के साथ प्रशिक्षण
एक बार जब शिक्षक यह स्थापित कर लेता है कि छात्र सैकड़ों निबंधों को पढ़कर निबंध लेखन के सामान्य नियमों को समझता है, तो शिक्षक छात्र को बार-बार निबंध लिखने का गृहकार्य देगा। इसके बाद, शिक्षक निबंध लेखन गृहकार्य पर प्रतिक्रिया देंगे, छात्रों को बताएंगे कि उन्होंने क्या अच्छा किया और वे क्या सुधार कर सकते हैं। छात्र फीडबैक का उपयोग बाद के निबंध लेखन होमवर्क को निर्देशित करने के लिए करता है, जिससे छात्र को समय के साथ सुधार करने में मदद मिलती है।
यह GPT मॉडल के प्रशिक्षण के सुदृढीकरण सीखने के चरण के समान है। इंटरनेट से बड़ी मात्रा में स्क्रैप किए गए टेक्स्ट को फीड किए जाने के बाद, मॉडल सवालों के जवाब दे सकता है। हालाँकि, इसकी सटीकता पर्याप्त अच्छी नहीं होने वाली है। मानव प्रशिक्षक मॉडल से एक प्रश्न पूछते हैं और प्रतिक्रिया प्रदान करते हैं कि प्रत्येक प्रश्न के लिए कौन सा उत्तर अधिक उपयुक्त है।
मॉडल सवालों के जवाब देने की अपनी क्षमता में सुधार करने के लिए प्रतिक्रिया का उपयोग करता है और अधिक सटीक रूप से और अधिक पसंद करता है कि मानव कैसे प्रतिक्रिया देगा। इस तरह से ChatGPT मानवीय-सी लगने वाली प्रतिक्रियाएँ उत्पन्न कर सकता है जो सुसंगत, आकर्षक और आम तौर पर सटीक दोनों हैं।
चैटजीपीटी सवालों के जवाब देने में कैसे सक्षम है?
इसलिए, आप चैटजीपीटी वेबसाइट पर जाएं और साइन इन करें। आप चैटजीपीटी को संकेत देते हैं: "स्नूप डॉग की शैली में एक रैप गीत लिखें।" यह एक रैप गीत के बोल के साथ प्रतिक्रिया करता है जो आश्चर्यजनक रूप से स्नूप डॉग द्वारा लिखे जाने के समान दिखता है। यह कैसे संभव है?
खैर, ChatGPT के पीछे का "जादू" इसके प्रशिक्षण में बड़े करीने से जुड़ा हुआ है।
अपनी भौतिकी 101 की पाठ्यपुस्तक के हर इंच को कवर करने के बाद, एक अच्छा मौका है कि आप इसमें से किसी भी प्रश्न का उत्तर देने में सक्षम होंगे जो आप पर फेंका जाता है। क्यों? क्योंकि आपने इसे पढ़ा है, और आपने इसे सीखा है। चैटजीपीटी के साथ भी यही बात है—यह सीखता है। और जैसा कि मानव सभ्यता ने दिखाया है, पर्याप्त प्रशिक्षण के साथ लगभग किसी भी समस्या का समाधान संभव है।
जबकि आप शायद अपने जीवनकाल में सैकड़ों पुस्तकों का प्रबंधन कर सकते हैं, चैटजीपीटी या जीपीटी ने पहले ही इंटरनेट का एक बड़ा हिस्सा इस्तेमाल कर लिया है। यह जानकारी का एक विशाल खजाना है। इसमें कहीं न कहीं स्नूप डॉग के कई गानों के बोल हैं। इसलिए, निश्चित रूप से, ChatGPT ने इसका सेवन किया होगा (याद रखें, यह पूर्व-प्रशिक्षित है) और स्नूप डॉग के गीतों में पहचाने जाने वाले पैटर्न। इसके बाद यह इस पैटर्न के "ज्ञान" का उपयोग स्नूप डॉग द्वारा लिखे जाने वाले गीतों के समान "भविष्यवाणी" करने के लिए करेगा।
यहाँ जोर "भविष्यवाणी" पर है। चैटजीपीटी सवालों के जवाब उसी तरह नहीं देता जिस तरह हम इंसानों के तौर पर देते हैं। उदाहरण के लिए, "पुर्तगाल की राजधानी क्या है?" आप लिस्बन कह सकते हैं और इसे "तथ्य" कह सकते हैं। हालाँकि, ChatGPT 100% निश्चितता के साथ प्रश्नों का उत्तर नहीं देता है। इसके बजाय, यह अपने प्रशिक्षण डेटासेट में उपयोग किए गए डेटा को देखते हुए सही उत्तर की भविष्यवाणी करने की कोशिश करता है।
प्रश्नों के उत्तर देने के लिए ChatGPT का दृष्टिकोण
प्रतिक्रियाओं की भविष्यवाणी करने की अवधारणा को बेहतर ढंग से समझने के लिए, चैटजीपीटी को एक हत्या को सुलझाने के साथ काम करने वाले जासूस होने की कल्पना करें। जासूस को सबूत के साथ पेश किया जाता है, लेकिन वे नहीं जानते कि हत्या किसने और कैसे की। हालांकि, पर्याप्त सबूत के साथ, जासूस बड़ी सटीकता के साथ "भविष्यवाणी" कर सकता है कि हत्या के लिए कौन जिम्मेदार है और अपराध कैसे किया गया था।
इंटरनेट से डेटा का उपभोग करने के बाद, चैटजीपीटी मूल डेटा को छोड़ देता है और डेटा से सीखे गए तंत्रिका कनेक्शन या पैटर्न को संग्रहीत करता है। ये कनेक्शन या पैटर्न साक्ष्य के टुकड़ों की तरह हैं जो चैटजीपीटी विश्लेषण करता है जब यह किसी भी संकेत का जवाब देने का प्रयास करता है।
तो, सिद्धांत रूप में, चैटजीपीटी एक बहुत अच्छे जासूस की तरह है। यह निश्चित रूप से नहीं जानता कि उत्तर के तथ्य क्या होने चाहिए, लेकिन यह कोशिश करता है, प्रभावशाली ढंग से सटीकता, मानव भाषा पाठ के एक तार्किक अनुक्रम की भविष्यवाणी करने के लिए जो सबसे उचित रूप से उत्तर देगा सवाल। इस तरह आपको अपने सवालों के जवाब मिलते हैं।
और यही कारण है कि उनमें से कुछ उत्तर बहुत ठोस लगते हैं लेकिन भयानक रूप से गलत हैं।
चैटजीपीटी: मानव की तरह उत्तर, मशीन की तरह सोचता है
ChatGPT के अंतर्निहित तकनीकी विवरण जटिल हैं। हालाँकि, एक अल्पविकसित दृष्टिकोण से, यह सीखने और पुन: प्रस्तुत करने के द्वारा काम करता है जो उसने सीखा है जब उसे संकेत दिया जाता है, ठीक वैसे ही जैसे हम मनुष्य करते हैं।
जैसा कि चैटजीपीटी अनुसंधान के माध्यम से विकसित होता है, इसके काम करने का तरीका बदल सकता है। हालाँकि, इसके मूलभूत कार्य सिद्धांत कुछ समय के लिए वैसे ही रहेंगे, कम से कम तब तक जब तक कि कोई विघटनकारी नई तकनीक नहीं आ जाती।