Google का TensorFlow प्लेटफ़ॉर्म अपने उपयोगकर्ताओं को मशीन सीखने के लिए उपकरण और संसाधन प्रदान करके AI को प्रशिक्षित करने की अनुमति देता है। लंबे समय से, AI इंजीनियरों ने AI को प्रशिक्षित करने के लिए पारंपरिक CPU और GPU का उपयोग किया है। यद्यपि ये प्रोसेसर विभिन्न मशीन सीखने की प्रक्रियाओं को संभाल सकते हैं, फिर भी वे सामान्य-उद्देश्य वाले हार्डवेयर हैं जिनका उपयोग विभिन्न दैनिक कार्यों के लिए किया जाता है।
AI प्रशिक्षण को गति देने के लिए, Google ने एक एप्लिकेशन स्पेसिफिक इंटीग्रेटेड सर्किट (ASIC) विकसित किया, जिसे Tensor Processing Unit (TPU) के रूप में जाना जाता है। लेकिन, टेंसर प्रोसेसिंग यूनिट क्या है, और वे एआई प्रोग्रामिंग को कैसे गति देते हैं?
टेंसर प्रोसेसिंग यूनिट (टीपीयू) क्या हैं?
टेंसर प्रोसेसिंग यूनिट Google की हैं मशीन सीखने के लिए ASIC. टीपीयू का उपयोग विशेष रूप से जटिल मैट्रिक्स और वेक्टर संचालन को हल करने के लिए गहन सीखने के लिए किया जाता है। टीपीयू को अल्ट्रा-हाई स्पीड पर मैट्रिक्स और वेक्टर ऑपरेशंस को हल करने के लिए सुव्यवस्थित किया जाता है, लेकिन निर्देश देने और निष्पादित करने के लिए सीपीयू के साथ जोड़ा जाना चाहिए। TPU का उपयोग केवल Google के साथ किया जा सकता है
TensorFlow या TensorFlow Lite प्लेटफॉर्म, चाहे क्लाउड कंप्यूटिंग के माध्यम से या स्थानीय हार्डवेयर पर इसके लाइट संस्करण के माध्यम से।टीपीयू के लिए आवेदन
Google ने 2015 से TPU का उपयोग किया है। उन्होंने Google स्ट्रीट व्यू टेक्स्ट प्रोसेसिंग, Google फ़ोटो और Google खोज परिणाम (रैंक ब्रेन) के लिए इन नए प्रोसेसर के उपयोग की भी पुष्टि की है। साथ ही एक AI बनाने के लिए जिसे AlphaGo के नाम से जाना जाता है, जिसने शीर्ष गो खिलाड़ियों और अल्फाज़ेरो सिस्टम को हरा दिया है जो शतरंज, गो और में अग्रणी कार्यक्रमों के खिलाफ जीता है। शोगी
टीपीयू का उपयोग विभिन्न गहन शिक्षण अनुप्रयोगों जैसे धोखाधड़ी का पता लगाने, कंप्यूटर दृष्टि, प्राकृतिक भाषा में किया जा सकता है प्रसंस्करण, स्व-ड्राइविंग कार, मुखर एआई, कृषि, आभासी सहायक, स्टॉक ट्रेडिंग, ई-कॉमर्स, और विभिन्न सामाजिक भविष्यवाणियां।
टीपीयू का उपयोग कब करें
चूंकि टीपीयू गहन सीखने के लिए उच्च विशिष्ट हार्डवेयर हैं, इसलिए यह कई अन्य कार्यों को खो देता है जिनकी आप आमतौर पर सीपीयू जैसे सामान्य-उद्देश्य वाले प्रोसेसर से अपेक्षा करते हैं। इसे ध्यान में रखते हुए, ऐसे विशिष्ट परिदृश्य हैं जहां एआई प्रशिक्षण के दौरान टीपीयू का उपयोग करने से सर्वोत्तम परिणाम प्राप्त होंगे।
टीपीयू का उपयोग करने का सबसे अच्छा समय उन कार्यों के लिए है जहां मॉडल मैट्रिक्स कंप्यूटेशंस पर बहुत अधिक निर्भर करते हैं, जैसे सर्च इंजन के लिए सिफारिश प्रणाली। टीपीयू उन मॉडलों के लिए भी अच्छे परिणाम देते हैं जहां एआई बड़ी मात्रा में डेटा बिंदुओं का विश्लेषण करता है जिसे पूरा होने में कई सप्ताह या महीने लगेंगे। एआई इंजीनियर कस्टम टेंसरफ्लो मॉडल के बिना उदाहरणों के लिए टीपीयू का उपयोग करते हैं और उन्हें खरोंच से शुरू करना पड़ता है।
टीपीयू का उपयोग कब नहीं करना चाहिए
जैसा कि पहले कहा गया है, टीपीयू का अनुकूलन इस प्रकार के प्रोसेसर को केवल विशिष्ट कार्यभार संचालन पर काम करने का कारण बनता है। इसलिए, ऐसे उदाहरण हैं जहां पारंपरिक सीपीयू और जीपीयू का उपयोग करने का विकल्प तेजी से परिणाम देगा। इन उदाहरणों में शामिल हैं:
- अधिकतम लचीलेपन के साथ रैपिड प्रोटोटाइप
- उपलब्ध डेटा बिंदुओं द्वारा सीमित मॉडल
- मॉडल जो सरल हैं और जिन्हें जल्दी से प्रशिक्षित किया जा सकता है
- बदलने के लिए बहुत कठिन मॉडल
- C++ में लिखे गए कस्टम TensorFlow संचालन पर निर्भर मॉडल
टीपीयू संस्करण और विनिर्देश
जब से Google ने अपने टीपीयू की घोषणा की है, जनता को टीपीयू के नवीनतम संस्करणों और उनके विनिर्देशों के बारे में लगातार अपडेट किया गया है। विनिर्देशों के साथ सभी टीपीयू संस्करणों की सूची निम्नलिखित है:
टीपीयूवी1 | टीपीयूवी2 | टीपीयूवी3 | टीपीयूवी4 | एजव1 | |
---|---|---|---|---|---|
दिनांक पेश किया गया | 2016 | 2017 | 2018 | 2021 | 2018 |
प्रक्रिया नोड (एनएम) | 28 | 16 | 16 | 7 | |
मरने का आकार (मिमी²) | 331 | <625 | <700 | <400 | |
ऑन-चिप मेमोरी | 28 | 32 | 32 | 144 | |
घड़ी की गति (मेगाहर्ट्ज) | 700 | 700 | 940 | 1050 | |
सबसे छोटा मेमोरी कॉन्फ़िगरेशन (GB) | 8 डीडीआर3 | 16 एचबीएम | 32 एचबीएम | 32 एचबीएम | |
तेदेपा (वाट) | 75 | 280 | 450 | 175 | 2 |
TOPS (टेरा ऑपरेशंस प्रति सेकेंड) | 23 | 45 | 90 | ? | 4 |
टॉप/डब्ल्यू | 0.3 | 0.16 | 0.2 | ? | 2 |
जैसा कि आप देख सकते हैं, टीपीयू घड़ी की गति इतनी प्रभावशाली नहीं लगती है, खासकर जब आधुनिक डेस्कटॉप कंप्यूटरों में आज घड़ी की गति 3-5 गुना तेज हो सकती है। लेकिन यदि आप तालिका की निचली दो पंक्तियों को देखें, तो आप देख सकते हैं कि टीपीयू 23-90 टेरा-ऑपरेशन प्रति सेकंड केवल 0.16-0.3 वाट बिजली का उपयोग करके संसाधित कर सकते हैं। तंत्रिका नेटवर्क इंटरफेस का उपयोग करते समय टीपीयू आधुनिक सीपीयू और जीपीयू की तुलना में 15-30 गुना तेज होने का अनुमान है।
जारी किए गए प्रत्येक संस्करण के साथ, नए टीपीयू महत्वपूर्ण सुधार और क्षमताएं दिखाते हैं। यहां प्रत्येक संस्करण के लिए कुछ हाइलाइट्स दिए गए हैं।
- टीपीयूवी1: पहला सार्वजनिक रूप से घोषित टीपीयू। 8-बिट मैट्रिक्स गुणन इंजन के रूप में डिज़ाइन किया गया और यह केवल पूर्णांकों को हल करने तक सीमित है।
- टीपीयूवी2: चूंकि इंजीनियरों ने नोट किया कि TPUv1 बैंडविड्थ में सीमित था। इस संस्करण में अब 16GB RAM के साथ मेमोरी बैंडविड्थ को दोगुना कर दिया गया है। यह संस्करण अब फ्लोटिंग पॉइंट्स को हल कर सकता है जिससे यह प्रशिक्षण और अनुमान के लिए उपयोगी हो जाता है।
- टीपीयूवी3: 2018 में जारी, TPUv3 में प्रोसेसर से दोगुना है और इसे TPUv2 की तुलना में चार गुना अधिक चिप्स के साथ तैनात किया गया है। उन्नयन इस संस्करण को पिछले संस्करणों की तुलना में आठ गुना प्रदर्शन करने की अनुमति देता है।
- टीपीयूवी4: यह 18 मई, 2021 को घोषित टीपीयू का नवीनतम संस्करण है। Google के CEO ने घोषणा की कि इस संस्करण में TPU v3.
- एज टीपीयू: यह टीपीयू संस्करण समग्र संचालन में टीपीयू के अन्य संस्करणों की तुलना में कम बिजली का उपयोग करने के लिए अनुकूलित छोटे संचालन के लिए है। हालांकि केवल दो वाट बिजली का उपयोग करते हुए, एज टीपीयू प्रति सेकंड चार टेरा-ऑपरेशंस तक हल कर सकता है। एज टीपीयू केवल Google के पिक्सेल 4 स्मार्टफोन जैसे छोटे हैंडहेल्ड डिवाइस पर पाया जाता है।
आप टीपीयू को कैसे एक्सेस करते हैं? उनका उपयोग कौन कर सकता है?
TPU, Google द्वारा अपने TensorFlow प्लेटफ़ॉर्म के साथ उपयोग करने के लिए डिज़ाइन की गई मालिकाना प्रसंस्करण इकाइयाँ हैं। 2018 से इन प्रोसेसर के लिए थर्ड-पार्टी एक्सेस की अनुमति दी गई है। आज, टीपीयू (एज टीपीयू को छोड़कर) को केवल गूगल के माध्यम से एक्सेस किया जा सकता है क्लाउड के माध्यम से कंप्यूटिंग सेवाएं. जबकि एज टीपीयू हार्डवेयर को गूगल के पिक्सल 4 स्मार्टफोन और इसके प्रोटोटाइप किट कोरल के जरिए खरीदा जा सकता है।
कोरल एक यूएसबी त्वरक है जो डेटा और पावर के लिए यूएसबी 3.0 टाइप सी का उपयोग करता है। यह आपके डिवाइस को एज टीपीयू कंप्यूटिंग प्रदान करता है जो प्रत्येक 2W पावर के लिए 4 TOPS में सक्षम है। यह किट विंडोज 10, मैकओएस और डेबियन लिनक्स (यह रास्पबेरी पाई के साथ भी काम कर सकती है) का उपयोग करने वाली मशीनों पर चल सकती है।
अन्य विशिष्ट एआई त्वरक
पिछले एक दशक से आर्टिफिशियल इंटेलिजेंस का क्रेज होने के साथ, बिग टेक लगातार मशीन लर्निंग को यथासंभव तेज और कुशल बनाने के तरीकों की तलाश कर रहा है। हालांकि Google के टीपीयू यकीनन डीप लर्निंग के लिए विकसित किए गए सबसे लोकप्रिय एएसआईसी हैं, लेकिन इंटेल, माइक्रोसॉफ्ट, अलीबाबा और क्वालकॉम जैसी अन्य तकनीकी कंपनियों ने भी अपने स्वयं के एआई एक्सेलेरेटर विकसित किए हैं। इनमें माइक्रोसॉफ्ट ब्रेनवेव, इंटेल न्यूरल कंप्यूट स्टिक और ग्राफिकोर का आईपीयू (इंटेलिजेंस प्रोसेसिंग यूनिट) शामिल हैं।
लेकिन जबकि अधिक एआई हार्डवेयर विकसित किया जा रहा है, दुख की बात है कि अधिकांश बाजार में अभी उपलब्ध नहीं हैं, और कई कभी नहीं करेंगे। लेखन के समय, यदि आप वास्तव में AI त्वरक हार्डवेयर खरीदना चाहते हैं, तो सबसे लोकप्रिय विकल्प एक कोरल प्रोटोटाइप किट, एक Intel NCS, एक ग्राफिकोर बो पॉड, या एक Asus IoT AI त्वरक खरीदना है। यदि आप केवल विशिष्ट AI हार्डवेयर तक पहुँच चाहते हैं, तो आप Google की क्लाउड कंप्यूटिंग सेवाओं या Microsoft Brainwave जैसे अन्य विकल्पों का उपयोग कर सकते हैं।