क्या आप अपने कस्टम डेटा के साथ चैटजीपीटी प्रदान करना चाहते हैं? ऐसा कैसे करें, इसके बारे में यहां चरण-दर-चरण बताया गया है!

एक शक्तिशाली और उपयोग में आसान चैटबॉट में जीपीटी तकनीक प्रदान करते हुए, चैटजीपीटी दुनिया का सबसे लोकप्रिय एआई टूल बन गया है। कई लोग आकर्षक बातचीत प्रदान करने, प्रश्नों का उत्तर देने, रचनात्मक सुझाव देने और कोडिंग और लेखन में सहायता के लिए चैटजीपीटी का उपयोग करते हैं। हालाँकि, ChatGPT सीमित है क्योंकि आप अपने डेटा को दीर्घकालिक व्यक्तिगत उपयोग के लिए संग्रहीत नहीं कर सकते हैं, और यह सितंबर 2021 का ज्ञान डेटा कटऑफ बिंदु है।

वर्कअराउंड के रूप में, हम कस्टम चैटजीपीटी इंस्टेंस बनाने के लिए 2021 के बाद कस्टम डेटा और अद्यतन जानकारी के साथ चैटजीपीटी प्रदान करने के लिए ओपनएआई के एपीआई और लैंगचेन का उपयोग कर सकते हैं।

कस्टम डेटा के साथ चैटजीपीटी क्यों प्रदान करें?

चैटजीपीटी को कस्टम डेटा के साथ फीड करना और इसकी ज्ञान कटऑफ तिथि से परे अद्यतन जानकारी प्रदान करना सामान्य रूप से चैटजीपीटी का उपयोग करने की तुलना में कई लाभ प्रदान करता है। यहां उनमें से कुछ हैं:

  • वैयक्तिकृत इंटरैक्शन: चैटजीपीटी को कस्टम डेटा प्रदान करके, उपयोगकर्ता अधिक अनुकूलित अनुभव बना सकते हैं। मॉडल को व्यक्तिगत उपयोगकर्ताओं या संगठनों के लिए प्रासंगिक विशिष्ट डेटासेट पर प्रशिक्षित किया जा सकता है, जिसके परिणामस्वरूप उनकी विशिष्ट आवश्यकताओं और प्राथमिकताओं के अनुरूप प्रतिक्रियाएँ प्राप्त की जा सकती हैं।
  • डोमेन-विशिष्ट विशेषज्ञता: कस्टम डेटा एकीकरण ChatGPT को विशेष डोमेन या उद्योगों में विशेषज्ञता प्राप्त करने की अनुमति देता है। इसे उद्योग-विशिष्ट ज्ञान, शब्दावली और रुझानों पर प्रशिक्षित किया जा सकता है, जिससे उन विशिष्ट क्षेत्रों में अधिक सटीक और व्यावहारिक प्रतिक्रियाएं सक्षम हो सकेंगी।
  • वर्तमान और सटीक जानकारी: अद्यतन जानकारी तक पहुंच यह सुनिश्चित करती है कि चैटजीपीटी नवीनतम विकास और ज्ञान से अपडेट रहे। यह हाल की घटनाओं, समाचारों या शोध के आधार पर सटीक प्रतिक्रियाएँ प्रदान कर सकता है, जिससे यह जानकारी का अधिक विश्वसनीय स्रोत बन जाता है।

अब जब आप चैटजीपीटी को कस्टम डेटा प्रदान करने के महत्व को समझते हैं, तो यहां आपके स्थानीय कंप्यूटर पर ऐसा करने का चरण-दर-चरण तरीका बताया गया है।

चरण 1: सॉफ़्टवेयर और पूर्व-निर्मित स्क्रिप्ट स्थापित करें और डाउनलोड करें

कृपया ध्यान दें कि निम्नलिखित निर्देश विंडोज 10 या विंडोज 11 मशीन के लिए हैं।

ChatGPT को कस्टम डेटा प्रदान करने के लिए, आपको GitHub से नवीनतम Python3, Git, Microsoft C++ और ChatGPT-पुनर्प्राप्ति स्क्रिप्ट को इंस्टॉल और डाउनलोड करना होगा। यदि आपके पीसी पर पहले से ही कुछ सॉफ़्टवेयर इंस्टॉल हैं, तो सुनिश्चित करें कि प्रक्रिया के दौरान किसी भी समस्या से बचने के लिए उन्हें नवीनतम संस्करण के साथ अपडेट किया गया है।

इंस्टॉल करके प्रारंभ करें:

  • डाउनलोड करना:Python3 (मुक्त)
  • डाउनलोड करना:गिट (मुक्त)
  • डाउनलोड करना:माइक्रोसॉफ्ट विज़ुअल बिल्ड टूल्स (मुक्त)

Python3 और Microsoft C++ इंस्टालेशन नोट्स

Python3 इंस्टॉल करते समय, सुनिश्चित करें कि आप टिक करें PATH में Python.exe जोड़ें क्लिक करने से पहले विकल्प अब स्थापित करें. यह महत्वपूर्ण है क्योंकि यह आपको अपने कंप्यूटर पर किसी भी निर्देशिका में पायथन तक पहुंचने की अनुमति देता है।

Microsoft C++ इंस्टॉल करते समय, आप इंस्टॉल करना चाहेंगे माइक्रोसॉफ्ट विज़ुअल स्टूडियो बिल्ड टूल्स पहला। एक बार इंस्टॉल हो जाने पर, आप टिक कर सकते हैं C++ के साथ डेस्कटॉप विकास विकल्प और क्लिक करें स्थापित करना सभी वैकल्पिक टूल स्वचालित रूप से दाएँ साइडबार पर टिक कर दिए जाते हैं।

अब जब आपने Python3, Git और Microsoft C++ के नवीनतम संस्करण स्थापित कर लिए हैं, तो आप कस्टम स्थानीय डेटा को आसानी से क्वेरी करने के लिए Python स्क्रिप्ट डाउनलोड कर सकते हैं।

डाउनलोड करना: चैटजीपीटी-पुनर्प्राप्ति स्क्रिप्ट (मुक्त)

स्क्रिप्ट डाउनलोड करने के लिए, पर क्लिक करें कोड, फिर चुनें ज़िप डाउनलोड करें. इससे पायथन स्क्रिप्ट को आपकी डिफ़ॉल्ट या चयनित निर्देशिका में डाउनलोड होना चाहिए।

एक बार डाउनलोड होने के बाद, अब हम एक स्थानीय वातावरण स्थापित कर सकते हैं।

चरण 2: स्थानीय वातावरण स्थापित करें

वातावरण स्थापित करने के लिए, आपको डाउनलोड किए गए चैटजीपीटी-पुनर्प्राप्ति-मुख्य फ़ोल्डर में एक टर्मिनल खोलने की आवश्यकता होगी। ऐसा करने के लिए, खोलें चैटजीपीटी-पुनर्प्राप्ति-मुख्य फ़ोल्डर, राइट-क्लिक करें और चुनें टर्मिनल में खोलें.

एक बार टर्मिनल खुलने के बाद, इस कमांड को कॉपी और पेस्ट करें:

पिप इंस्टाल लैंगचैन ओपनाई क्रोमैडबी टिकटोकन अनस्ट्रक्चर्ड

यह कमांड Python के पैकेज मैनेजर का उपयोग करता है पायथन वर्चुअल वातावरण बनाएं और प्रबंधित करें आवश्यकता है।

आभासी वातावरण बनाने के बाद, हमें उनकी सेवाओं तक पहुँचने के लिए एक OpenAI API कुंजी की आपूर्ति करने की आवश्यकता है। हमें सबसे पहले एक एपीआई कुंजी तैयार करनी होगी OpenAI API कुंजी साइट पर क्लिक करके नई गुप्त कुंजी बनाएं, कुंजी के लिए एक नाम जोड़ना, फिर दबाना गुप्त कुंजी बटन बनाएं.

आपको पात्रों की एक श्रृंखला प्रदान की जाएगी। यह आपकी OpenAI API कुंजी है. एपीआई कुंजी के किनारे कॉपी आइकन पर क्लिक करके इसे कॉपी करें। ध्यान रखें कि इस एपीआई कुंजी को गुप्त रखा जाना चाहिए। इसे दूसरों के साथ तब तक साझा न करें जब तक आप वास्तव में यह नहीं चाहते कि वे इसे आपके साथ उपयोग करें।

एक बार कॉपी हो जाने पर, चैटजीपीटी-पुनर्प्राप्ति-मुख्य फ़ोल्डर पर वापस लौटें और स्थिरांक खोलें नोटपैड. अब प्लेसहोल्डर को अपनी एपीआई कुंजी से बदलें। फ़ाइल को सहेजना याद रखें!

अब जब आपने अपना वर्चुअल वातावरण सफलतापूर्वक सेट कर लिया है और अपनी OpenAI API कुंजी को पर्यावरण चर के रूप में जोड़ लिया है। अब आप अपना कस्टम डेटा ChatGPT को प्रदान कर सकते हैं।

चरण 3: कस्टम डेटा जोड़ना

कस्टम डेटा जोड़ने के लिए, अपने सभी कस्टम टेक्स्ट डेटा को इसमें रखें आंकड़े चैटजीपीटी-पुनर्प्राप्ति-मुख्य के भीतर फ़ोल्डर। टेक्स्ट डेटा का प्रारूप PDF, TXT, या DOC के रूप में हो सकता है।

जैसा कि आप ऊपर स्क्रीनशॉट में देख सकते हैं, मैंने एक टेक्स्ट फ़ाइल जोड़ी है जिसमें एक बना-बनाया व्यक्तिगत शेड्यूल है, जिस पर मैंने एक लेख लिखा है एएमडी के इंस्टिंक्ट एक्सेलेरेटर, और एक पीडीएफ दस्तावेज़।

चरण 4: टर्मिनल के माध्यम से चैटजीपीटी को क्वेरी करना

पायथन स्क्रिप्ट हमें डेटा फ़ोल्डर और इंटरनेट में जोड़े गए कस्टम डेटा से डेटा क्वेरी करने की अनुमति देती है। दूसरे शब्दों में, आपके पास सामान्य चैटजीपीटी बैकएंड और डेटा फ़ोल्डर में स्थानीय रूप से संग्रहीत सभी डेटा तक पहुंच होगी।

स्क्रिप्ट का उपयोग करने के लिए, पायथन चलाएँ चैटgpt.py स्क्रिप्ट और फिर अपने प्रश्न या क्वेरी को तर्क के रूप में जोड़ें।

अजगर चैटgpt.py "आपका प्रश्न"

अपने प्रश्नों को उद्धरण चिह्नों में रखना सुनिश्चित करें।

यह जांचने के लिए कि क्या हमने चैटजीपीटी को अपना डेटा सफलतापूर्वक फीड कर दिया है, मैं इसके संबंध में एक व्यक्तिगत प्रश्न पूछूंगा व्यक्तिगत शेड्यूल.txt फ़ाइल।

इसने काम किया! इसका मतलब है कि ChatGPT पहले प्रदान की गई व्यक्तिगत शेड्यूल.txt को पढ़ने में सक्षम था। अब देखते हैं कि क्या हमने चैटजीपीटी को वह जानकारी सफलतापूर्वक फीड कर दी है जो उसे अपनी ज्ञान कटऑफ तिथि के कारण नहीं पता है।

जैसा कि आप देख सकते हैं, इसने AMD Instinct MI250x का सही वर्णन किया है, जिसे ChatGPT -3 की ज्ञान कटऑफ तिथि के बाद जारी किया गया था।

कस्टम चैटजीपीटी की सीमाएँ

हालाँकि GPT-3.5 को कस्टम डेटा के साथ फीड करने से एलएलएम को लागू करने और उपयोग करने के अधिक तरीके खुलते हैं, लेकिन कुछ कमियाँ और सीमाएँ हैं।

सबसे पहले, आपको सारा डेटा स्वयं प्रदान करना होगा। आप अभी भी जीपीटी-3.5 के सभी ज्ञान तक इसकी ज्ञान कटऑफ तिथि तक पहुंच सकते हैं; हालाँकि, आपको सभी अतिरिक्त डेटा प्रदान करना होगा। इसका मतलब यह है कि यदि आप चाहते हैं कि आपका स्थानीय मॉडल इंटरनेट पर एक निश्चित विषय का जानकार हो जो GPT-3.5 पहले से नहीं जानता है, आपको इंटरनेट पर जाना होगा और डेटा को स्वयं स्क्रैप करना होगा और इसे चैटजीपीटी-रिट्रीवल-मेन के डेटा फ़ोल्डर पर टेक्स्ट के रूप में सहेजना होगा।

एक और मुद्दा यह है कि चैटजीपीटी से सीधे पूछने की तुलना में इस तरह चैटजीपीटी को क्वेरी करने में लोड होने में अधिक समय लगता है।

अंत में, वर्तमान में उपलब्ध एकमात्र मॉडल GPT-3.5 टर्बो है। इसलिए भले ही आपके पास GPT-4 तक पहुंच हो, आप अपने कस्टम ChatGPT इंस्टेंस को पावर देने के लिए इसका उपयोग नहीं कर पाएंगे।

कस्टम चैटजीपीटी अद्भुत लेकिन सीमित है

ChatGPT को कस्टम डेटा प्रदान करना मॉडल से अधिक लाभ प्राप्त करने का एक शक्तिशाली तरीका है। इस पद्धति के माध्यम से, आप मॉडल को अपने इच्छित किसी भी टेक्स्ट डेटा के साथ फ़ीड कर सकते हैं और इसे नियमित चैटजीपीटी की तरह संकेत दे सकते हैं, हालांकि कुछ सीमाओं के साथ। हालाँकि, यह भविष्य में बदल जाएगा क्योंकि नवीनतम GPT-4 मॉडल तक पहुंच के साथ-साथ हमारे डेटा को एलएलएम के साथ एकीकृत करना आसान हो जाएगा।