PaLM 2 Google के LLM में भारी उन्नयन लाता है, लेकिन क्या इसका मतलब यह है कि अब यह OpenAI के GPT-4 के साथ बराबरी पर जा सकता है?
Google ने 10 मई, 2023 को Google I/O 2023 में अपने पाथवेज लैंग्वेज मॉडल (PaLM 2) की अगली पीढ़ी का अनावरण किया। इसका नया लार्ज लैंग्वेज मॉडल (LLM) अपने पूर्ववर्ती (PaLM) की तुलना में काफी सुधार का दावा करता है और अंततः अपने सबसे बड़े प्रतिद्वंद्वी, OpenAI के GPT-4 को लेने के लिए तैयार हो सकता है।
लेकिन Google ने अभी कितना सुधार किया है? क्या PaLM 2 अंतर निर्माता है Google उम्मीद करता है कि यह होगा, और इससे भी महत्वपूर्ण बात यह है कि इतनी सारी समान क्षमताओं के साथ, PaLM 2 OpenAI के GPT-4 से कैसे अलग है?
पालम 2 वि. GPT-4: प्रदर्शन अवलोकन
PaLM 2 नई और बेहतर क्षमताओं से भरा हुआ है अपने पूर्ववर्ती के ऊपर। PaLM 2 का GPT-4 से अधिक अद्वितीय लाभों में से एक तथ्य यह है कि यह छोटे आकार में उपलब्ध है, विशेष रूप से कुछ अनुप्रयोगों के लिए जिनके पास ऑनबोर्ड प्रोसेसिंग पावर नहीं है।
इन सभी अलग-अलग आकारों के अपने छोटे मॉडल हैं जिन्हें गेको, ओटर, बाइसन और यूनिकॉर्न कहा जाता है, जिसमें गेको सबसे छोटा है, इसके बाद ओटर, बाइसन और अंत में यूनिकॉर्न सबसे बड़ा मॉडल है।
Google, WinoGrande और DROP में GPT-4 की तुलना में तार्किक क्षमताओं में सुधार का भी दावा करता है, पूर्व में ARC-C में एक संकीर्ण मार्जिन खींच रहा है। हालाँकि, जब PaLM और SOTA की बात आती है तो बोर्ड में महत्वपूर्ण सुधार होता है।
Google के 91 पेज के अनुसार, PaLM 2 गणित में भी बेहतर है PaLM 2 शोध पत्र [पीडीएफ]। हालाँकि, जिस तरह से Google और OpenAI ने अपने परीक्षा परिणामों को संरचित किया है, उससे सीधे दो मॉडलों की तुलना करना मुश्किल हो जाता है। Google ने कुछ तुलनाओं को भी छोड़ दिया, संभवतः इसलिए कि PaLM 2 ने लगभग GPT-4 जितना अच्छा प्रदर्शन नहीं किया।
MMLU में, GPT-4 ने 86.4 स्कोर किया, जबकि PaLM 2 ने 81.2 स्कोर किया। वही हेलास्वाग के लिए जाता है, जहां GPT-4 ने स्कोर किया 95.3, लेकिन PaLM 2 केवल 86.8 जुटा सका, और ARC-E, जहां GPT-4 और PaLM 2 को 96.3 और 89.7 मिले, क्रमश।
PaLM 2 परिवार का सबसे बड़ा मॉडल PaLM 2-L है। जबकि हम इसके सटीक आकार को नहीं जानते हैं, हम जानते हैं कि यह सबसे बड़े PaLM मॉडल से काफी छोटा है लेकिन अधिक प्रशिक्षण कंप्यूटिंग का उपयोग करता है। गूगल के अनुसार, PaLM के पास 540 बिलियन पैरामीटर हैं, इसलिए "काफी छोटे" को PaLM 2 को 10 से 300 बिलियन पैरामीटर के बीच कहीं भी रखना चाहिए। ध्यान रखें कि Google ने PaLM 2 पेपर में जो कहा है, उसके आधार पर ये संख्याएँ केवल धारणाएँ हैं।
यदि यह संख्या कहीं भी 100 बिलियन या उससे कम है, तो PaLM 2 की तुलना में मापदंडों के संदर्भ में सबसे अधिक संभावना है। जीपीटी-3.5। संभावित रूप से 100 बिलियन से कम के मॉडल पर विचार करना GPT-4 के साथ पैर की अंगुली तक जा सकता है और कुछ कार्यों में इसे हरा भी सकता है प्रभावशाली। GPT-3.5 ने शुरू में सब कुछ पानी से बाहर निकाल दियाPaLM सहित, लेकिन PaLM 2 ने काफी सुधार किया है।
GPT-4 और PaLM 2 प्रशिक्षण डेटा में अंतर
जबकि Google ने PaLM 2 के प्रशिक्षण डेटासेट के आकार का अनावरण नहीं किया है, कंपनी ने अपने शोध पत्र में रिपोर्ट दी है कि नए LLM का प्रशिक्षण डेटा सेट काफी बड़ा है। प्रशिक्षण डेटासेट के आकार के बारे में कोई दावा नहीं करते हुए OpenAI ने GPT-4 का अनावरण करते समय भी वही दृष्टिकोण अपनाया।
हालाँकि, Google गणित, तर्क, तर्क और विज्ञान की गहरी समझ पर ध्यान केंद्रित करना चाहता था, जिसका अर्थ है कि PaLM 2 के प्रशिक्षण डेटा का एक बड़ा हिस्सा उपरोक्त विषयों पर केंद्रित है। Google ने अपने पेपर में कहा है कि PaLM 2 का प्री-ट्रेनिंग कॉर्पस वेब दस्तावेज़ों सहित कई स्रोतों से बना है, किताबें, कोड, गणित और संवादात्मक डेटा, बोर्ड भर में सुधार करते हुए, कम से कम जब तुलना की जाती है हथेली।
मॉडल के प्रशिक्षित होने पर विचार करते हुए PaLM 2 के संवादी कौशल भी दूसरे स्तर पर होने चाहिए इसे बेहतर प्रासंगिक समझ और बेहतर अनुवाद देने के लिए 100 से अधिक भाषाओं में क्षमताओं।
जहाँ तक GPT-4 के प्रशिक्षण डेटा की पुष्टि है, OpenAI ने हमें बताया है कि उसने सार्वजनिक रूप से उपलब्ध डेटा और लाइसेंस प्राप्त डेटा का उपयोग करके मॉडल को प्रशिक्षित किया है। GPT-4 का शोध पृष्ठ कहते हैं, "डेटा डेटा का एक वेब-स्केल कॉर्पस है जिसमें गणित की समस्याओं के सही और गलत समाधान, कमजोर और गलत समाधान शामिल हैं मजबूत तर्क, आत्म-विरोधाभासी और सुसंगत बयान, और विभिन्न प्रकार की विचारधाराओं का प्रतिनिधित्व करते हैं और विचार।"
जब GPT-4 से कोई सवाल पूछा जाता है, तो यह कई तरह के जवाब दे सकता है, जिनमें से सभी आपकी क्वेरी के लिए प्रासंगिक नहीं हो सकते हैं। उपयोगकर्ता के इरादे के साथ इसे संरेखित करने के लिए, OpenAI ने मानवीय प्रतिक्रिया के साथ सुदृढीकरण सीखने का उपयोग करके मॉडल के व्यवहार को ठीक किया।
जबकि हम सटीक प्रशिक्षण डेटा नहीं जानते हैं कि इनमें से किसी भी मॉडल को प्रशिक्षित किया गया था, हम जानते हैं कि प्रशिक्षण का इरादा बहुत अलग था। हमें इंतजार करना होगा और देखना होगा कि प्रशिक्षण के इरादे में यह अंतर वास्तविक दुनिया में दो मॉडलों के बीच कैसे अंतर करता है।
PaLM 2 और GPT-4 चैटबॉट और सेवाएं
दोनों एलएलएम तक पहुंचने वाला पहला पोर्टल उनके संबंधित चैटबॉट्स, PaLM 2 के बार्ड और GPT-4 के ChatGPT का उपयोग कर रहा है। उस ने कहा, GPT-4, ChatGPT Plus के साथ एक पेवॉल के पीछे है, और मुफ्त उपयोगकर्ताओं को केवल GPT-3.5 तक पहुंच प्राप्त होती है। दूसरी ओर, बार्ड सभी के लिए निःशुल्क है और 180 देशों में उपलब्ध है।
इसका मतलब यह नहीं है कि आप GPT-4 को मुफ्त में एक्सेस नहीं कर सकते। Microsoft का Bing AI चैट GPT-4 का उपयोग करता है और पूरी तरह से मुफ़्त है, सभी के लिए खुला है, और बिंग सर्च के ठीक बगल में उपलब्ध है, जो अंतरिक्ष में Google का सबसे बड़ा प्रतिद्वंद्वी है।
Google I/O 2023 इस बारे में घोषणाओं से भरा हुआ था कि कैसे PaLM 2 और जनरेटिव AI एकीकरण Google Workspace को बेहतर बनाएगा Google डॉक्स, शीट्स, स्लाइड्स, जीमेल, और सर्च जायंट द्वारा प्रदान की जाने वाली हर सेवा में आने वाली एआई सुविधाओं के साथ अनुभव। इसके अलावा, Google ने पुष्टि की है कि PaLM 2 को Android और YouTube सहित 25 से अधिक Google उत्पादों में एकीकृत किया जा चुका है।
इसकी तुलना में, Microsoft ने पहले ही AI सुविधाओं को Microsoft Office सूट के कार्यक्रमों और अपनी कई सेवाओं में ला दिया है। फिलहाल, आप एआई लड़ाई में आमने-सामने जा रही दो प्रतिद्वंद्वी कंपनियों से समान पेशकशों के अपने स्वयं के संस्करणों में दोनों एलएलएम का अनुभव कर सकते हैं।
हालाँकि, चूंकि GPT-4 जल्दी बाहर आ गया था और Google द्वारा मूल बार्ड के साथ की गई कई भूलों से बचने के लिए सावधान रहा है, यह रहा है वास्तविक एलएलएम तीसरे पक्ष के डेवलपर्स, स्टार्टअप्स, और लगभग किसी और के लिए है जो अपनी सेवा में एक सक्षम एआई मॉडल को शामिल करना चाहता है। दूर। हमारे पास एक यदि आप उन्हें देखना चाहते हैं तो GPT-4 ऐप्स की सूची.
यह कहना नहीं है कि डेवलपर्स PaLM 2 पर स्विच नहीं कर रहे हैं या कम से कम कोशिश कर रहे हैं, लेकिन Google को अभी भी उस मोर्चे पर OpenAI के साथ कैच-अप खेलना है। और यह तथ्य कि PaLM 2 सशुल्क API के पीछे बंद होने के बजाय खुला-स्रोत है, इसका मतलब है कि इसमें GPT-4 की तुलना में अधिक व्यापक रूप से अपनाए जाने की क्षमता है।
क्या PaLM 2 GPT-4 को टक्कर दे सकता है?
PaLM 2 अभी भी बहुत नया है, इसलिए यह GPT-4 पर ले सकता है या नहीं, इसका उत्तर दिया जाना बाकी है। हालाँकि, Google जो कुछ भी वादा कर रहा है और आक्रामक तरीके से इसे प्रचारित करने के लिए इस्तेमाल करने का फैसला किया है, ऐसा लगता है कि PaLM 2 GPT-4 को अपने पैसे के लिए एक रन दे सकता है।
हालाँकि, GPT-4 अभी भी काफी सक्षम मॉडल है और, जैसा कि पहले उल्लेख किया गया है, कुछ तुलनाओं में PaLM 2 को हरा देता है। उस ने कहा, PaLM 2 के कई छोटे मॉडल इसे एक अकाट्य बढ़त देते हैं। गेको अपने आप में इतना हल्का है कि यह ऑफ़लाइन होने पर भी मोबाइल उपकरणों पर काम कर सकता है। इसका मतलब यह है कि PaLM 2 उत्पादों और उपकरणों की पूरी तरह से अलग श्रेणी का समर्थन कर सकता है जो GPT-4 का उपयोग करने के लिए संघर्ष कर सकते हैं।
एआई रेस गर्म हो रही है
PaLM2 के लॉन्च के साथ, AI प्रभुत्व की दौड़ तेज हो गई है, क्योंकि यह GPT-4 के खिलाफ जाने वाला पहला योग्य प्रतिद्वंद्वी हो सकता है। प्रशिक्षण में "जेमिनी" नामक एक नए मल्टीमॉडल एआई मॉडल के साथ, Google यहां धीमा होने का कोई संकेत नहीं दिखा रहा है।