आपने शायद ओपनएआई के जीपीटी के बारे में सुना होगा, लेकिन वे ब्लॉक पर एकमात्र एलएलएम नहीं हैं।
चाबी छीनना
- OpenAI का GPT-4 1.76 ट्रिलियन पैरामीटर और मल्टीमॉडल क्षमताओं के साथ सबसे उन्नत और व्यापक रूप से इस्तेमाल किया जाने वाला बड़ा भाषा मॉडल है।
- एंथ्रोपिक का क्लाउड 2 रचनात्मक लेखन कार्यों में जीपीटी-4 के साथ प्रतिस्पर्धा करता है और कम संसाधनों के बावजूद अपना दबदबा रखता है।
- Google का PaLM 2, हालांकि GPT-4 किलर नहीं है, मजबूत बहुभाषी और रचनात्मक क्षमताओं वाला एक शक्तिशाली भाषा मॉडल है। फाल्कन-180बी एक ओपन-सोर्स मॉडल है जो वाणिज्यिक दिग्गजों को टक्कर देता है और जीपीटी-3.5 के साथ आमने-सामने खड़ा हो सकता है।
यह एआई का मौसम है, और तकनीकी कंपनियां बेकरी से ब्रेड जैसे बड़े भाषा मॉडल तैयार कर रही हैं। नए मॉडल तेजी से जारी किए जाते हैं, और उन पर नज़र रखना बहुत कठिन होता जा रहा है।
लेकिन नई रिलीज़ों की सुगबुगाहट के बीच, केवल कुछ मॉडल ही शीर्ष पर पहुंचे हैं और बड़े भाषा मॉडल क्षेत्र में खुद को सच्चे दावेदार के रूप में साबित किया है। जैसे-जैसे हम 2023 के अंत की ओर बढ़ रहे हैं, हमने छह सबसे प्रभावशाली बड़े भाषा मॉडल एक साथ रखे हैं जिन्हें आपको आज़माना चाहिए।
1. OpenAI का GPT-4
GPT-4 आज तक का सबसे उन्नत सार्वजनिक रूप से उपलब्ध बड़ा भाषा मॉडल है। OpenAI द्वारा विकसित और मार्च 2023 में जारी किया गया, GPT-4 जेनरेटिव प्री-प्रशिक्षित ट्रांसफार्मर श्रृंखला में नवीनतम पुनरावृत्ति है जो 2018 में शुरू हुआ। अपनी विशाल क्षमताओं के साथ, GPT-4 दुनिया में सबसे व्यापक रूप से उपयोग किए जाने वाले और सबसे लोकप्रिय बड़े भाषा मॉडल में से एक बन गया है।
हालांकि आधिकारिक तौर पर पुष्टि नहीं की गई है, सूत्रों का अनुमान है कि GPT-4 में चौंका देने वाले 1.76 ट्रिलियन पैरामीटर हो सकते हैं, अपने पूर्ववर्ती, GPT-3.5 से लगभग दस गुना अधिक, और Google के फ्लैगशिप, PaLM 2 से पाँच गुना बड़ा। यह विशाल पैमाना GPT-4 की मल्टीमॉडल क्षमताओं को सक्षम बनाता है, जिससे यह टेक्स्ट और छवियों दोनों को इनपुट के रूप में संसाधित करने की अनुमति देता है। परिणामस्वरूप, GPT-4 पाठ के अलावा चित्र और स्क्रीनशॉट जैसी दृश्य जानकारी की व्याख्या और वर्णन कर सकता है। इसकी मल्टीमॉडल प्रकृति वास्तविक दुनिया के डेटा की अधिक मानवीय समझ प्रदान करती है।
वैज्ञानिक बेंचमार्क में, GPT-4 विभिन्न परीक्षणों में अन्य समकालीन मॉडलों से काफी बेहतर प्रदर्शन करता है। जबकि अकेले बेंचमार्क किसी मॉडल की ताकत को पूरी तरह से प्रदर्शित नहीं करते हैं, वास्तविक दुनिया के उपयोग के मामलों से पता चला है कि GPT-4 व्यावहारिक समस्याओं को सहजता से हल करने में असाधारण रूप से कुशल है। GPT-4 का बिल वर्तमान में $20 प्रति माह है चैटजीपीटी के प्लस प्लान के माध्यम से पहुंच योग्य.
2. एन्थ्रोपिक का क्लाउड 2
हालांकि एंथ्रोपिक एआई द्वारा विकसित क्लाउड 2, जीपीटी-4 जितना लोकप्रिय नहीं है, लेकिन कई क्षेत्रों में जीपीटी-4 के तकनीकी मानकों और वास्तविक दुनिया के प्रदर्शन से मेल खा सकता है। चुनिंदा परीक्षाओं सहित कुछ मानकीकृत परीक्षणों में, क्लाउड 2 जीपीटी-4 से बेहतर प्रदर्शन करता है। GPT -4 के 8k और 32k टोकन मॉडल की तुलना में AI भाषा मॉडल में लगभग 100,000 टोकन पर एक बहुत ही बेहतर संदर्भ विंडो है। हालाँकि बड़ी संदर्भ लंबाई हमेशा बेहतर प्रदर्शन में तब्दील नहीं होती है, क्लाउड 2 की विस्तारित क्षमता स्पष्ट लाभ प्रदान करती है, जैसे विश्लेषण के लिए संपूर्ण 75,000 शब्दों की पुस्तकों को पचाना।
समग्र प्रदर्शन में, GPT-4 श्रेष्ठ बना हुआ है, लेकिन हमारे इन-हाउस परीक्षण से पता चलता है कि क्लाउड 2 इससे आगे निकल गया है कई रचनात्मक लेखन कार्यों में। क्लाउड 2 हमारे मूल्यांकन के आधार पर प्रोग्रामिंग और गणित कौशल में जीपीटी-4 से भी पीछे है, लेकिन मानव-जैसे, रचनात्मक उत्तर प्रदान करने में उत्कृष्ट है। जब हमने इस सूची के सभी मॉडलों को रचनात्मक कृति लिखने या फिर से लिखने के लिए प्रेरित किया, तो दस में से छह बार, हमने प्राकृतिक-लगने वाले मानव-जैसे परिणामों के लिए क्लाउड 2 के परिणाम को चुना। वर्तमान में, क्लाउड 2 क्लाउड एआई चैटबॉट के माध्यम से निःशुल्क उपलब्ध है. अतिरिक्त सुविधाओं तक पहुंच के लिए $20 भुगतान योजना भी है।
OpenAI और Microsoft जैसे दिग्गजों की तुलना में कम वित्तीय सहायता होने के बावजूद, एंथ्रोपिक का क्लाउड 2 AI मॉडल लोकप्रिय GPT मॉडल और Google की PaLM श्रृंखला के मुकाबले अपनी पकड़ रखता है। कम संसाधनों वाले AI के लिए, क्लाउड 2 प्रभावशाली रूप से प्रतिस्पर्धी है। यदि यह दांव लगाने के लिए मजबूर किया जाए कि किस मौजूदा मॉडल के पास निकट भविष्य में जीपीटी को टक्कर देने की सबसे अच्छी संभावना है, तो क्लाउड 2 सबसे सुरक्षित दांव लगता है। हालांकि फंडिंग के मामले में क्लाउड 2 की उन्नत क्षमताएं बताती हैं कि यह किसी भी मामले में कड़ी टक्कर दे सकता है। अच्छी तरह से वित्त पोषित दिग्गज (हालांकि यह ध्यान देने योग्य है कि Google ने इसमें कई बड़े योगदान दिए हैं एंथ्रोपिक)। मॉडल अपने वजन वर्ग से ऊपर है और एक उभरते हुए चैलेंजर के रूप में वादा दिखाता है।
3. OpenAI का GPT-3.5
जबकि GPT-4 की रिलीज़ से प्रभावित होकर, GPT-3.5 और इसके 175 बिलियन मापदंडों को कम करके नहीं आंका जाना चाहिए। प्रदर्शन, सटीकता और सुरक्षा पर केंद्रित पुनरावृत्तीय फ़ाइन-ट्यूनिंग और अपग्रेड के माध्यम से, GPT-3.5 ने मूल GPT-3 मॉडल से एक लंबा सफर तय किया है। हालाँकि इसमें GPT -4 की मल्टीमॉडल क्षमताओं का अभाव है और यह संदर्भ लंबाई और पैरामीटर गणना में पीछे है, GPT-3.5 अत्यधिक सक्षम बना हुआ है, GPT-4 एकमात्र मॉडल है जो अपने सर्वांगीण प्रदर्शन को पार करने में सक्षम है निर्णायक रूप से.
GPT परिवार में दूसरे स्तर का मॉडल होने के बावजूद, GPT-3.5 अपनी पकड़ बनाए रख सकता है और यहां तक कि कई बेंचमार्क पर Google और मेटा के प्रमुख मॉडल से भी बेहतर प्रदर्शन कर सकता है। Google के PaLM 2 के मुकाबले गणितीय और प्रोग्रामिंग कौशल के साथ-साथ परीक्षणों में, अंतर बहुत अधिक नहीं था, GPT-3.5 में कुछ मामलों में थोड़ी बढ़त भी थी। हास्य और कथा लेखन जैसे अधिक रचनात्मक कार्यों में GPT-3.5 निर्णायक रूप से आगे बढ़ा।
इसलिए, जबकि GPT-4 AI में एक नया मील का पत्थर है, GPT-3.5 एक प्रभावशाली शक्तिशाली मॉडल बना हुआ है, जो सबसे उन्नत विकल्पों के साथ प्रतिस्पर्धा करने और कभी-कभी उनसे भी आगे निकलने में सक्षम है। इसका निरंतर परिशोधन यह सुनिश्चित करता है कि यह अगली पीढ़ी के आकर्षक मॉडलों के साथ भी प्रासंगिक बना रहे।
4. गूगल का PaLM 2
एआई मॉडल की क्षमताओं का मूल्यांकन करते समय, सिद्ध सूत्र तकनीकी रिपोर्ट को पढ़ना है बेंचमार्क स्कोर की जाँच करें, लेकिन जो कुछ भी आपने सीखा है, उसे थोड़ी मात्रा में लें और मॉडल का परीक्षण करें अपने आप को। यह भले ही विरोधाभासी प्रतीत हो, लेकिन बेंचमार्क परिणाम हमेशा कुछ एआई मॉडलों के वास्तविक दुनिया के प्रदर्शन के साथ संरेखित नहीं होते हैं। कागज पर, Google के PaLM 2 को GPT-4 हत्यारा माना जाता था, आधिकारिक परीक्षण परिणामों से पता चलता है कि यह कुछ बेंचमार्क में GPT-4 से मेल खाता है। हालाँकि, रोजमर्रा के उपयोग में, एक अलग तस्वीर उभरती है।
तार्किक तर्क, गणित और रचनात्मकता में, PaLM 2, GPT-4 से कम है। रचनात्मक लेखन कार्यों की श्रृंखला में यह एंथ्रोपिक के क्लाउड से भी पीछे है। हालाँकि, हालाँकि यह GPT-4 किलर के रूप में अपनी बिलिंग पर खरा उतरने में विफल रहता है, Google का PaLM 2 एक शक्तिशाली भाषा मॉडल बना हुआ है अपने आप में, अपार क्षमताओं के साथ। इसके इर्द-गिर्द अधिकांश नकारात्मक भावना पूरी तरह से खराब प्रदर्शन के बजाय GPT-4 जैसे मॉडलों की तुलना से उत्पन्न होती है।
340 बिलियन मापदंडों के साथ, PaLM 2 दुनिया के सबसे बड़े मॉडलों में से एक है। यह विशेष रूप से बहुभाषी कार्यों में उत्कृष्टता प्राप्त करता है और इसमें मजबूत गणित और प्रोग्रामिंग क्षमताएं हैं। हालाँकि यह सर्वश्रेष्ठ नहीं है, PaLM 2 लेखन जैसे रचनात्मक कार्यों में भी काफी कुशल है। इसलिए, जबकि बेंचमार्क ने एक आशावादी तस्वीर चित्रित की जो पूरी तरह से साकार नहीं हुई, PaLM 2 अभी भी प्रभावशाली एआई कौशल प्रदर्शित करता है, भले ही बोर्ड के सभी प्रतिस्पर्धियों से आगे न निकल पाए।
5. टीआईआई का फाल्कन-180बी
जब तक आप एआई भाषा मॉडल रिलीज की तीव्र गति के साथ तालमेल नहीं बिठा रहे हैं, तब तक आपने कभी फाल्कन-180बी का सामना नहीं किया होगा। यूएई के टेक्नोलॉजी इनोवेशन इंस्टीट्यूट द्वारा विकसित, 180 बिलियन पैरामीटर फाल्कन-180 सबसे शक्तिशाली में से एक है ओपन-सोर्स भाषा मॉडल मौजूद हैं, भले ही इसमें जीपीटी मॉडल की नाम पहचान या मेटा के व्यापक उपयोग का अभाव हो लामा 2. लेकिन कोई गलती न करें - फाल्कन-180बी अपनी श्रेणी में सर्वश्रेष्ठ के साथ आमने-सामने खड़ा हो सकता है।
बेंचमार्क परिणामों से पता चलता है कि फाल्कन-180बी अधिकांश ओपन-सोर्स मॉडल से बेहतर प्रदर्शन करता है और वाणिज्यिक दिग्गजों जैसे के साथ प्रतिस्पर्धा करता है PaLM 2 और GPT-3.5. गणित, कोडिंग, तर्क और रचनात्मक लेखन कार्यों के परीक्षण में, इसने GPT-3.5 और PaLM 2 को भी पीछे छोड़ दिया बार. यदि GPT-4, GPT-3.5, और Falcon-180B की रैंकिंग की जाती है, तो हम कई उपयोग मामलों में इसकी ताकत के लिए Falcon-180B को GPT-4 और GPT-3.5 के बीच रखेंगे।
हालाँकि हम विश्वास के साथ यह नहीं कह सकते कि यह समग्र प्रदर्शन में GPT-3.5 से बेहतर है, लेकिन यह अपने लिए एक मामला बनाता है। अस्पष्ट होते हुए भी, यह मॉडल बेहतर ज्ञात विकल्पों की क्षमताओं से मेल खाने या उससे अधिक होने के कारण ध्यान देने योग्य है। आप फाल्कन-180बी मॉडल को आज़मा सकते हैं आलिंगन करता हुआ चेहरा (एक ओपन-सोर्स एलएलएम प्लेटफॉर्म)।
लामा 2, मेटा एआई का 70 बिलियन पैरामीटर बड़ा भाषा मॉडल, अपने पूर्ववर्ती लामा 1 पर आधारित है। प्रमुख मॉडलों से छोटा होते हुए भी, लामा 2 बेंचमार्क और वास्तविक दुनिया में उपयोग के मामले में अधिकांश सार्वजनिक रूप से उपलब्ध ओपन-सोर्स एलएलएम से बेहतर प्रदर्शन करता है। फाल्कन-180बी एक अपवाद होगा।
हमने इसकी क्षमताओं को मापने के लिए GPT-4, GPT-3.5, क्लाउड 2 और PaLM 2 के विरुद्ध लामा 2 का परीक्षण किया। अप्रत्याशित रूप से, GPT-4 ने लगभग सभी मापदंडों में लामा 2 को पछाड़ दिया। हालाँकि, Llama 2 ने कई मूल्यांकनों में GPT-3.5 और PaLM 2 के मुकाबले अपनी पकड़ बनाए रखी। हालाँकि यह दावा करना ग़लत होगा कि लामा 2, PaLM 2 से बेहतर है, लामा 2 ने कोडिंग कार्यों सहित, PaLM 2 को रोकने वाली कई समस्याओं का समाधान किया। क्लाउड 2 और जीपीटी-3.5 ने कुछ क्षेत्रों में लामा 2 को पीछे छोड़ दिया, लेकिन सीमित संख्या में कार्यों में ही निर्णायक रूप से बेहतर थे।
इसलिए, सबसे बड़े मालिकाना मॉडल की क्षमताओं से अधिक न होते हुए भी, ओपन-सोर्स लामा 2 अपने भार वर्ग से ऊपर है. खुले तौर पर उपलब्ध मॉडल के लिए, यह प्रभावशाली प्रदर्शन प्रदर्शित करता है, चुनिंदा मूल्यांकनों में PaLM 2 जैसे AI दिग्गजों को टक्कर देता है। लामा 2 ओपन-सोर्स भाषा मॉडल की भविष्य की क्षमता की एक झलक प्रदान करता है।
एआई मॉडल के बीच प्रदर्शन अंतर कम हो रहा है
हालाँकि AI परिदृश्य तीव्र गति से विकसित हो रहा है, OpenAI का GPT-4 इस समूह में अग्रणी बना हुआ है। हालाँकि, जबकि GPT-4 पैमाने और प्रदर्शन में बेजोड़ है, क्लाउड 2 जैसे मॉडल दिखाते हैं कि पर्याप्त कौशल के साथ, छोटे मॉडल चुनिंदा क्षेत्रों में प्रतिस्पर्धा कर सकते हैं। Google का PaLM 2, कुछ उच्च अपेक्षाओं से कम होने के बावजूद, अभी भी गहन क्षमताओं का प्रदर्शन करता है। और फाल्कन-180बी साबित करता है कि ओपन-सोर्स पहल पर्याप्त संसाधन दिए जाने पर उद्योग जगत के दिग्गजों के साथ कंधे से कंधा मिलाकर खड़ी हो सकती है।