जबकि OpenAI जनरेटिव AI विकास का मार्ग प्रशस्त कर रहा है, कई लोगों ने Google पर पिछड़ने का आरोप लगाया है। हालाँकि, इससे आगे निकलने के लिए नहीं, Google ने अपने 2023 Google I/O सम्मेलन में एक नया बड़ा भाषा मॉडल, PaLM 2 लॉन्च किया।

अनुप्रयोगों की एक श्रृंखला के लिए चार अलग-अलग आकारों में आने के लिए तैयार, Google का नया एलएलएम जाहिर तौर पर पहले से ही कई Google सेवाओं को शक्ति प्रदान कर रहा है, और भी बहुत कुछ आने वाला है।

पाम 2 क्या है?

10 मई को आयोजित Google I/O 2023 में, Google के सीईओ सुंदा पिचाई ने Google की नवीनतम प्लेथिंग का खुलासा किया: पालम 2.

पाथवेज लैंग्वेज मॉडल 2 के लिए लघु, Google का उन्नत एलएलएम PaLM का दूसरा पुनरावृत्ति है, जिसका पहला संस्करण अप्रैल 2022 में वापस लॉन्च होगा। PaLM याद नहीं कर सकते? खैर, उस समय, यह बड़ी खबर थी और इसकी थोड़ी बातचीत करने, बुनियादी चुटकुले सुनाने, और इसी तरह की क्षमता के लिए बहुत रुचि प्राप्त हुई। तेजी से आगे छह महीने, और OpenAI के GPT-3.5 ने सब कुछ पानी से बाहर निकाल दिया, पालम सहित।

के बाद से, OpenAI ने GPT-4 लॉन्च किया, GPT-3.5 पर भारी अपग्रेड। फिर भी जब नए मॉडल को कई उपकरणों में एकीकृत किया जा रहा है, विशेष रूप से माइक्रोसॉफ्ट की बिंग एआई चैट, Google लक्ष्य ले रहा है PaLM 2 के साथ OpenAI और GPT-4 पर और उम्मीद है कि इसका अपग्रेडेड LLM एक महत्वपूर्ण अंतर को बंद कर सकता है - Google बार्ड लॉन्च शायद ही एक गर्जनापूर्ण था सफलता।

instagram viewer

पिचाई ने घोषणा की कि PaLM 2 चार अलग-अलग मॉडल आकारों में आएगा: गेको, ओटर, बाइसन और यूनिकॉर्न।

गेको इतना हल्का है कि यह मोबाइल उपकरणों पर काम कर सकता है और ऑफ़लाइन होने पर भी डिवाइस पर शानदार इंटरैक्टिव एप्लिकेशन के लिए पर्याप्त तेज़ है। इस बहुमुखी प्रतिभा का अर्थ है कि PaLM 2 को उत्पादों की संपूर्ण श्रेणियों को अधिक तरीकों से समर्थन देने के लिए और अधिक लोगों की मदद करने के लिए ठीक किया जा सकता है।

गेको प्रति सेकंड लगभग 20 टोकन संसाधित करने में सक्षम है- टोकन जनरेटिव एआई मॉडल द्वारा उपयोग के लिए वास्तविक शब्दों को दिए गए मान हैं- यह मोबाइल तैनाती योग्य एआई टूल के लिए गेम-चेंजर होने की संभावना है।

PaLM 2 प्रशिक्षण डेटा

Google PaLM 2 के प्रशिक्षण डेटा के साथ बिल्कुल आगे नहीं आ रहा था, समझ में आता है कि इसे अभी जारी किया गया था। लेकिन गूगल का PaLM 2 रिपोर्ट [पीडीएफ] ने कहा कि वह चाहता है कि PaLM 2 को गणित, तर्क और विज्ञान की गहरी समझ हो और इसके प्रशिक्षण कोष का एक बड़ा हिस्सा इन विषयों पर केंद्रित हो।

फिर भी, यह ध्यान देने योग्य है कि PaLM कोई सुस्ती नहीं थी। कब गूगल PaLM का खुलासा किया, इसने पुष्टि की कि इसे 540 बिलियन मापदंडों पर प्रशिक्षित किया गया था, जो उस समय एक विशाल आंकड़ा था।

OpenAI के GPT-4 पर एक ट्रिलियन से अधिक मापदंडों का उपयोग करने का आरोप है, कुछ अनुमानों के अनुसार यह आंकड़ा 1.7 ट्रिलियन तक है। यह एक सुरक्षित शर्त है कि चूंकि Google PaLM 2 को OpenAI के LLM के साथ सीधे प्रतिस्पर्धा करना चाहता है, यह अधिक नहीं तो कम से कम एक तुलनीय आंकड़ा प्रदर्शित करेगा।

PaLM 2 को एक और महत्वपूर्ण बढ़ावा इसका भाषा प्रशिक्षण डेटा है। Google ने PaLM 2 को 100 से अधिक भाषाओं में प्रशिक्षित किया है ताकि इसे अधिक गहराई और प्रासंगिक समझ प्रदान की जा सके और इसकी अनुवाद क्षमताओं को बढ़ाया जा सके।

लेकिन यह सिर्फ बोली जाने वाली भाषाएं नहीं हैं। बेहतर वैज्ञानिक और गणितीय तर्क प्रदान करने के लिए PaLM 2 के लिए Google की मांग से जुड़ते हुए, LLM के पास है 20 से अधिक प्रोग्रामिंग भाषाओं में भी प्रशिक्षित किया गया है, जो इसे प्रोग्रामरों के लिए एक असाधारण संपत्ति बनाता है।

PaLM 2 पहले से ही Google सेवाओं को शक्ति प्रदान कर रहा है—लेकिन फिर भी फ़ाइन ट्यूनिंग की आवश्यकता है

यह तब तक लंबा नहीं होगा जब तक हम PaLM 2 पर अपना हाथ नहीं जमा लेते हैं और देखते हैं कि यह क्या कर सकता है। सौभाग्य से, किसी भी PaLM 2 एप्लिकेशन और सेवाओं का लॉन्च बार्ड से बेहतर होगा।

लेकिन आपने (तकनीकी रूप से!) PaLM 2 का उपयोग पहले ही कर लिया होगा। Google ने पुष्टि की है कि PaLM 2 पहले से ही तैनात है और Android, YouTube, Gmail, Google डॉक्स, Google स्लाइड, Google पत्रक और अन्य सहित इसके 25 उत्पादों में उपयोग में है।

लेकिन PaLM 2 रिपोर्ट से यह भी पता चलता है कि अभी भी काम किया जाना बाकी है, विशेष रूप से कई भाषाओं में जहरीली प्रतिक्रियाओं की ओर।

उदाहरण के लिए, जब विशेष रूप से विषाक्त संकेत दिए जाते हैं, तो PaLM 2 समय के 30 प्रतिशत से अधिक विषाक्त प्रतिक्रियाएँ उत्पन्न करता है। इसके अलावा, विशिष्ट भाषाओं में- अंग्रेजी, जर्मन और पुर्तगाली-PaLM 2 ने जहरीली प्रतिक्रियाएँ अधिक दीं 17 प्रतिशत से अधिक समय, नस्लीय पहचान और धर्मों सहित उस आंकड़े को आगे बढ़ाने वाले संकेतों के साथ उच्च।

कोई फर्क नहीं पड़ता कि शोधकर्ता एलएलएम प्रशिक्षण डेटा को साफ करने का कितना प्रयास करते हैं, यह अनिवार्य है कि कुछ फिसल जाएगा। अगला चरण उन विषाक्त प्रतिक्रियाओं को कम करने के लिए PaLM 2 का प्रशिक्षण जारी रखना है।

यह बड़े भाषा मॉडल के लिए बूम का दौर है

OpenAI एक बड़े भाषा मॉडल को लॉन्च करने वाला पहला नहीं था, लेकिन इसके GPT-3, GPT-3.5, और GPT-4 मॉडल ने निःसंदेह जनरेटिव AI पर ब्लू टचपेपर को रोशन किया।

Google के PaLM 2 में कुछ समस्याएँ हैं जिन्हें दूर करना है, लेकिन यह पहले से ही कई Google सेवाओं में उपयोग में है जो कंपनी के अपने नवीनतम LLM में विश्वास को दर्शाता है।