एनवीडिया जीपीयू न केवल गेमिंग प्रदर्शन के मामले में बल्कि अन्य अनुप्रयोगों, विशेष रूप से आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग के मामले में भी एक लंबा सफर तय कर चुका है। Nvidia के GPU के प्रदर्शन के लिए जिम्मेदार दो मुख्य कारक हैं CUDA और Tensor cores जो आपके द्वारा खरीदे जा सकने वाले हर आधुनिक Nvidia GPU पर मौजूद हैं।

लेकिन ये कोर वास्तव में क्या करते हैं, और यदि वे दोनों कृत्रिम बुद्धिमत्ता और मशीन लर्निंग अनुप्रयोगों में उपयोग किए जाते हैं, तो वे कैसे भिन्न हैं?

CUDA कोर क्या हैं और इनका उपयोग किस लिए किया जाता है?

CUDA का मतलब कंप्यूट यूनिफाइड डिवाइस आर्किटेक्चर है, जो GPU में उनकी मौजूदगी की व्याख्या करने के लिए बहुत कुछ नहीं करता है। इन कोर को 2014 मैक्सवेल आर्किटेक्चर में एनवीडिया जीपीयू लाइनअप में पेश किया गया था और समानांतर प्रसंस्करण में विशेषज्ञ थे।

वे अपने कामकाज के मामले में सीपीयू कोर के समान हैं लेकिन कुछ को संभालने में बेहतर हैं क्रिप्टोग्राफ़िक हैश, भौतिकी इंजन, डेटा-विज्ञान से संबंधित प्रोजेक्ट और यहां तक ​​कि गेम सहित कार्य विकास।

छवि क्रेडिट: NVIDIA

जबकि हम पहले ही कवर कर चुके हैं

instagram viewer
CUDA कोर आपके PC के गेमिंग प्रदर्शन को कैसे प्रभावित करता है, वे संख्याओं को कम करने में भी उतने ही सहायक हैं। जबकि सबसे शक्तिशाली सीपीयू में भी दोहरे अंकों में कोर होते हैं, एनवीडिया जीपीयू कई हजार सीयूडीए कोर के साथ आते हैं जो उन्हें संख्यात्मक वर्कलोड पर बहुत तेज बनाते हैं। इसके अतिरिक्त, चूंकि वे इन गणनाओं को समानांतर में करते हैं, इसलिए आपको CUDA कोर के साथ बहुत तेज गति मिलती है।

जब क्रंचिंग नंबरों की बात आती है तो CUDA कोर रन-ऑफ-द-मिल CPU कोर की तुलना में तेज़ होते हैं, लेकिन वे अभी भी आदर्श समाधान नहीं हैं। ऐसा इसलिए है क्योंकि उनका कभी भी उस तरीके से उपयोग करने का इरादा नहीं था। CUDA कोर ग्राफिकल प्रोसेसिंग के लिए और एनवीडिया जीपीयू को गेमिंग प्रदर्शन में अधिक सक्षम बनाने के उद्देश्य से बनाया गया था।

टेन्सर कोर क्या हैं, और उनका उपयोग किस लिए किया जाता है?

जैसे ही आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग वर्कलोड के लिए जीपीयू का इस्तेमाल शुरू हुआ, एनवीडिया ने 2017 में शुरू होने वाले अपने डेटा सेंटर जीपीयू के लिए वोल्टा आर्किटेक्चर में टेन्सर कोर पेश किया।

हालाँकि, इन कोर के उपभोक्ता जीपीयू में आने के लिए एनवीडिया ट्यूरिंग आर्किटेक्चर (आरटीएक्स 20-सीरीज़ जीपीयू) तक का समय लगा। याद करना जबकि GTX 16-सीरीज़ कार्ड भी ट्यूरिंग आर्किटेक्चर पर आधारित हैं, उनमें कोई रे ट्रेसिंग या टेंसर शामिल नहीं है कोर।

जबकि CUDA कोर कम्प्यूटेशनल वर्कलोड के लिए पर्याप्त रूप से पर्याप्त थे, Tensor कोर ने काफी तेजी से आगे बढ़े। जबकि CUDA कोर प्रति घड़ी चक्र में केवल एक ऑपरेशन कर सकता है, Tensor कोर कई ऑपरेशनों को संभाल सकता है, जिससे उन्हें अविश्वसनीय प्रदर्शन को बढ़ावा मिलता है। मूल रूप से, सभी टेन्सर कोर मैट्रिक्स गुणन की गति को बढ़ाते हैं।

कम्प्यूटेशनल गति में यह वृद्धि सटीकता की कीमत पर आती है, जिसमें CUDA कोर काफी अधिक सटीक हैं। उस ने कहा, जब प्रशिक्षण मशीन सीखने के मॉडल की बात आती है, तो कम्प्यूटेशनल गति और समग्र लागत के मामले में टेंसर कोर कहीं अधिक प्रभावी होते हैं; इसलिए सटीकता में कमी को अक्सर उपेक्षित किया जाता है।

Tensor और CUDA Core GPU के प्रदर्शन को कैसे प्रभावित करते हैं?

जैसा कि आप शायद अब तक अनुमान लगा सकते हैं, जबकि CUDA और Tensor कोर एक ही वर्कलोड को संभाल सकते हैं, वे क्रमशः ग्राफिक्स रेंडरिंग और न्यूमेरिकल वर्कलोड के लिए विशेष कोर हैं।

इसका मतलब यह है कि जिस उपयोगकर्ता पर एक विशेष जीपीयू लक्षित है, उसके आधार पर इसमें कोर की एक अलग संख्या होगी। उदाहरण के लिए, यदि हम RTX 4090, Nvidia के नवीनतम और सबसे बड़े उपभोक्ता-सामना करने वाले गेमिंग GPU पर विचार करते हैं, तो आपको Tensor cores की तुलना में कहीं अधिक CUDA कोर मिलेंगे। विशिष्ट होने के लिए 16,384 CUDA कोर से 512 टेंसर कोर।

इसकी तुलना में, डेटा केंद्रों के लिए Nvidia L40 GPU, RTX 4090 के समान Ada Lovelace आर्किटेक्चर पर आधारित है, जिसमें 18,176 CUDA कोर और 568 Tensor कोर हैं। यह इतना बड़ा अंतर नहीं लग सकता है, लेकिन यह इन जीपीयू के प्रदर्शन को व्यापक रूप से प्रभावित कर सकता है।

सैद्धांतिक प्रदर्शन के संदर्भ में, L40 में FP16 के 90.52 TFlops और FP32 प्रदर्शन के साथ-साथ FP64 प्रदर्शन के 1,414 GFlops हैं। यह RTX 4090 के FP16 के 82.58 TFlops और FP32 प्रदर्शन और FP64 प्रदर्शन के 1,290 GFlops की तुलना में बड़े पैमाने पर प्रदर्शन को बढ़ावा देता है।

जब तक आप जीपीयू संख्यात्मक प्रदर्शन संख्याओं से अच्छी तरह वाकिफ नहीं हैं, ऊपर दिए गए एनवीडिया जीपीयू फ्लोटिंग पॉइंट प्रदर्शन आंकड़े आपके लिए ज्यादा मायने नहीं रखते हैं। हालाँकि, संक्षेप में, वे दिखाते हैं कि जब संख्यात्मक गणनाओं की बात आती है तो L40 RTX 4090 की तुलना में बहुत तेज़ है - जो कृत्रिम बुद्धिमत्ता और मशीन लर्निंग-आधारित वर्कलोड के लिए आवश्यक हैं।

जब आप दो जीपीयू की बिजली खपत पर विचार करते हैं तो प्रदर्शन में सुधार और भी प्रभावशाली हो जाता है। RTX 4090 में रेटेड TGP (तेदेपा के साथ भ्रमित न होने के लिए, एक छोटा सा अंतर है) 450W का, जबकि L40 को केवल 300W के लिए रेट किया गया है।

ये दोनों जीपीयू गेम चलाएंगे और आपके मशीन-लर्निंग मॉडल को ठीक से प्रशिक्षित करेंगे। हालाँकि, RTX 4090 गेम चलाने में बेहतर होगा, और L40 प्रशिक्षण मशीन लर्निंग मॉडल में बेहतर होगा।

CUDA कोर बनाम। टेंसर कोर: कौन सा अधिक महत्वपूर्ण है?

दोनों कोर समान रूप से महत्वपूर्ण हैं, भले ही आप गेमिंग के लिए अपना जीपीयू खरीद रहे हों या डेटा सेंटर रैक में डाल रहे हों। एनवीडिया के उपभोक्ता-सामना करने वाले गेमिंग जीपीयू एआई सुविधाओं (सबसे विशेष रूप से डीएलएसएस) का एक गुच्छा उपयोग करते हैं, और बोर्ड पर टेंसर कोर काम में आ सकते हैं।

डेटा सेंटर जीपीयू के लिए, सीयूडीए और टेन्सर कोर वैसे भी ज्यादातर समय एक साथ काम करते हैं, इसलिए आपके द्वारा चुने गए जीपीयू की परवाह किए बिना आपको दोनों मिलेंगे। अपने GPU में एक विशिष्ट प्रकार के कोर पर ध्यान केंद्रित करने के बजाय, आपको इस बात पर अधिक ध्यान देना चाहिए कि ग्राफिक्स कार्ड समग्र रूप से क्या करता है और किस प्रकार के उपयोगकर्ता के लिए इसका इरादा है।

CUDA कोर ग्राफिकल वर्कलोड को संभालने में माहिर हैं, जबकि टेंसर कोर न्यूमेरिकल में बेहतर हैं। वे एक साथ काम करते हैं और कुछ हद तक विनिमेय हैं, लेकिन वे अपनी विशेषज्ञता को संभालते हैं, यही कारण है कि वे पहले स्थान पर मौजूद हैं।

अलग-अलग जीपीयू अलग-अलग पहलुओं के विशेषज्ञ होते हैं। RTX 4090 आपके द्वारा फेंके गए किसी भी गेम को आसानी से कुचल देगा, जबकि RTX 4060 केवल 1080p गेमिंग को संभाल सकता है। यदि आप अपने GPU का उपयोग करके गेमिंग नहीं कर रहे हैं और केवल क्रंचिंग नंबरों या तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए इसकी आवश्यकता है, तो A-Series डेटा सेंटर GPU जैसे A100 या L40 आपके लिए सबसे अच्छा दांव है।

आपका जीपीयू कोर मैटर

अधिक जीपीयू कोर आपको बेहतर समग्र प्रदर्शन देंगे क्योंकि आपका जीपीयू अधिक बहुमुखी होगा और विभिन्न कार्यों को संभालने के लिए समर्पित संसाधन होंगे। हालाँकि, आँख बंद करके सबसे अधिक संख्या में कोर वाला GPU प्राप्त करना सबसे अच्छा निर्णय नहीं है। अपने उपयोग के मामले पर सावधानीपूर्वक विचार करने के लिए कुछ समय निकालें, जीपीयू की क्षमताओं को समग्र रूप से देखें और फिर अपनी पसंद बनाएं।