नवंबर 2022 में चैटजीपीटी के लॉन्च के बाद, अभूतपूर्व एआई चैटबॉट इंटरनेट पर सबसे भरोसेमंद लेखन टूल में से एक के रूप में उभरा है। इसका उपयोग करना सरल है; वर्णन करें कि आपको क्या लिखना है, और चैटजीपीटी इसे सेकंडों में स्क्रीन पर प्रिंट कर देता है।
हालाँकि, ऐसे युग में जहां AI-जनित पाठ को मानव-लिखित के रूप में पारित किया जाता है और अनुचित लाभ प्राप्त करने के लिए उपयोग किया जाता है, AI सामग्री की पहचान करना बहुत महत्वपूर्ण है। लेकिन चैटजीपीटी एआई सामग्री, यहां तक कि अपने स्वयं के काम को भी सटीक रूप से नहीं देख सकता है - लेकिन क्यों?
क्या एआई टेक्स्ट और मानव लेखन के बीच कोई अंतर है?
चैटजीपीटी के लिए अपने स्वयं के लेखन या किसी एआई-जनित पाठ को पहचानने की एक पूर्व शर्त यह है कि इसमें और मानव-लिखित पाठ के बीच अंतर होना चाहिए। तो, क्या मानव-लिखित पाठ और एआई-जनित सामग्री के बीच कोई महत्वपूर्ण अंतर है? यदि है, तो निश्चित रूप से, चैटजीपीटी जैसा कोई उपकरण इसे समझने में सक्षम होना चाहिए।
हमने किसी भी एआई टूल से इनपुट के बिना एक छोटी कहानी लिखी और फिर चैटजीपीटी से पूछा कि क्या कहानी एआई-लिखित सामग्री थी। चैटजीपीटी ने आत्मविश्वास से इसे एआई-जनरेटेड टेक्स्ट के रूप में चिह्नित किया।
फिर हमने चैटजीपीटी से एक कहानी तैयार करने के लिए कहा, और उसी चैट थ्रेड में, हमने जेनरेट किए गए टेक्स्ट को कॉपी-पेस्ट किया और चैटजीपीटी से पूछा कि क्या टेक्स्ट एआई-निर्मित था। चैटजीपीटी की प्रतिक्रिया? एक आश्वस्त "नहीं।"
चैटजीपीटी दोनों ही मामलों में मानव-लिखित या एआई-जनित पाठ की पहचान करने में विफल रहा। तो फिर ChatGPT अपने स्वयं के टेक्स्ट का पता कैसे नहीं लगा सकता? क्या इसका मतलब यह है कि एआई और मानव पाठ के बीच कोई अंतर नहीं है?
खैर, वहाँ है. हम दोनों के बीच के अंतर पर एक पूरी किताब लिख सकते हैं, लेकिन इससे कोई खास फर्क नहीं पड़ेगा। तो, यदि कोई अंतर है, तो चैटजीपीटी या कोई अन्य एआई उपकरण इन अंतरों की पहचान करने और मानव-लिखित एआई-जनित पाठ को सटीक रूप से इंगित करने में असमर्थ क्यों है? उत्तर निहित है चैटजीपीटी कैसे काम करता है और यह टेक्स्ट कैसे उत्पन्न करता है.
चैटजीपीटी टेक्स्ट कैसे उत्पन्न करता है
जब आप ChatGPT से टेक्स्ट जेनरेट करने के लिए कहते हैं, तो यह मानव लेखन प्रक्रिया की नकल करने का प्रयास करता है। सबसे पहले, चैटजीपीटी-जेनरेटिव प्री-ट्रेंड ट्रांसफार्मर (जीपीटी) के पीछे के मॉडल को मानव पाठ के एक बड़े संग्रह पर प्रशिक्षित किया गया है। ईमेल, स्वास्थ्य लेख, तकनीकी लेख, हाई स्कूल निबंध और ऑनलाइन मिलने वाला कोई भी पाठ प्रशिक्षण के दौरान मॉडल को खिलाया गया है। इसलिए चैटजीपीटी समझता है कि इनमें से प्रत्येक प्रकार का पाठ कैसे लिखा जाना चाहिए।
यदि आप ChatGPT को अपने बॉस को एक ईमेल लिखने के लिए कहते हैं, तो वह जानता है कि उस प्रकृति का ईमेल कैसा दिखना चाहिए क्योंकि इसे समान ईमेल पर प्रशिक्षित किया गया है - शायद उनमें से हजारों हैं। इसी तरह, यदि आप इसे हाई स्कूल निबंध लिखने के लिए कहते हैं, तो यह भी जानता है कि हाई स्कूल निबंध कैसा होना चाहिए। ChatGPT वह सब कुछ लिखने का प्रयास करेगा जिसे आप एक इंसान की तरह लिखना चाहते हैं।
लेकिन एक दिक्कत है. इंसानों के लिखने के तरीके के विपरीत, चैटजीपीटी वास्तव में यह नहीं समझता है कि वह क्या लिख रहा है, जिस तरह से एक इंसान लिखता है। इसके बजाय, चैटबॉट यह अनुमान लगाने की कोशिश करता है कि लेखन पूरा होने तक वाक्य में सबसे प्रशंसनीय अगला शब्द क्या होगा।
चैटजीपीटी भविष्यवाणी के आधार पर कैसे लिखता है
मान लीजिए कि आप चैटजीपीटी से वोल्क्रा नामक एक काल्पनिक शहर के बारे में एक कहानी लिखने के लिए कहते हैं। इस बात की बहुत अधिक संभावना है कि चैटबॉट कहानी की शुरुआत "वंस अपॉन" शब्दों से करेगा। ऐसा इसलिए है क्योंकि चैटबॉट इसके बारे में नहीं सोचता है स्वयं, लेकिन यह भविष्यवाणी करने का प्रयास करता है कि एक इंसान उन हजारों कहानियों से जो उसने सीखा है, उसके आधार पर क्या लिखेगा प्रशिक्षण।
इसलिए, यह विश्वास करते हुए कि एक मानव संभवतः "वन्स अपॉन" शब्दों के साथ कहानी शुरू करेगा, चैटजीपीटी फिर अगले तार्किक शब्द की भविष्यवाणी करने की कोशिश करेगा, जो कि होगा "ए" के बाद "समय" हो। तो फिर आपके पास "वंस अपॉन ए टाइम..." के बाद अगला तार्किक शब्द और कहानी पूरी होने तक अगला शब्द होगा। चैटजीपीटी मूल रूप से यह अनुमान लगाकर लिखता है कि वाक्य में अगला शब्द स्वाभाविक रूप से (या कम से कम इसकी सबसे अधिक संभावना) होगा और इसे सम्मिलित किया जाएगा।
इसलिए, जब कोई एआई उपकरण यह पता लगाने की कोशिश करता है कि कोई पाठ एआई-जनरेटेड है या नहीं, तो वह जिन मानदंडों को तौलने की कोशिश करता है उनमें से एक पाठ की भविष्यवाणी है क्योंकि एआई उपकरण भविष्यवाणी द्वारा लिखते हैं। पूर्वानुमेयता के इस माप को एआई भाषा में उलझन कहा जाता है। अब, जब किसी पाठ को अन्य मानदंडों के साथ प्रस्तुत किया जाता है, तो चैटजीपीटी जैसा एआई उपकरण पाठ का विश्लेषण करने की कोशिश करता है ताकि यह मापा जा सके कि पाठ में शब्दों या वाक्यों का क्रम कितना पूर्वानुमानित है। अधिक पूर्वानुमेयता या कम उलझन का आम तौर पर मतलब यह है कि पाठ संभवतः एआई-जनित है। कम पूर्वानुमेयता या उच्च उलझन का आम तौर पर मतलब यह है कि पाठ संभवतः मनुष्यों द्वारा लिखा गया है।
ये मानदंड, किसी पाठ की रचनात्मकता के स्तर जैसे अन्य कारकों के साथ, दुर्भाग्य से निश्चितता के साथ यह पता लगाने के लिए पर्याप्त नहीं हैं कि कोई पाठ एआई उपकरण द्वारा लिखा गया है या नहीं। ऐसा इसलिए है क्योंकि मनुष्य अधिक भिन्नता के साथ लिख सकते हैं, जैसा कि हमने इस लेख की शुरुआत में प्रदर्शन के लिए उदाहरण पाठ में इस्तेमाल किया था।
ChatGPT जैसे AI चैटबॉट यथासंभव प्राकृतिक मानव भाषा की नकल करने के लिए डिज़ाइन किए गए हैं। इसलिए जबकि एआई टेक्स्ट में समझने योग्य पैटर्न हो सकते हैं, वे पैटर्न चैटजीपीटी जैसे शक्तिशाली टूल के लिए भी इतने स्पष्ट नहीं हैं। यही कारण है कि चैटजीपीटी अपनी लेखनी को भी नहीं पहचान पाता है एआई-टेक्स्ट डिटेक्टर उपकरण काम क्यों नहीं करते?.
क्या चैटजीपीटी भविष्य में अपने लेखन को मान्यता देगा?
वर्तमान में, चैटजीपीटी जैसे उपकरण यह पता नहीं लगा सकते हैं कि कोई पाठ स्वयं या किसी अन्य एआई उपकरण द्वारा लिखा गया था क्योंकि एआई-जनरेटेड सामग्री में कोई स्पष्ट, समझने योग्य पैटर्न नहीं है। हालाँकि, इस बात की अच्छी संभावना है कि यह जल्द ही बदल सकता है। चैटजीपीटी जैसी कंपनियों द्वारा चैटजीपीटी-जनित सामग्री में डिजिटल वॉटरमार्क पेश करने के प्रयासों से, चैटबॉट द्वारा उत्पन्न पाठ का एक अधिक स्पष्ट पैटर्न होगा।