मशीन विज़न सेल्फ-ड्राइविंग कारों की नींव है, और पूरी तरह से स्वायत्त भविष्य के लिए महत्वपूर्ण है।
चाबी छीनना
- स्व-चालित कारें अपने परिवेश को देखने और समझने के लिए मशीन विज़न तकनीक पर भरोसा करती हैं, जिससे उन्हें वस्तुओं का पता लगाने, संकेतों की पहचान करने और सड़क पर नेविगेट करने की अनुमति मिलती है।
- सेल्फ-ड्राइविंग कारों में मशीन विज़न में एक कैमरा सिस्टम, एज कंप्यूटिंग और एआई एल्गोरिदम शामिल होते हैं, जो दृश्य जानकारी इकट्ठा करने, उसे वास्तविक समय में संसाधित करने और पैटर्न की पहचान करने के लिए मिलकर काम करते हैं वस्तुएं.
- सेल्फ-ड्राइविंग कारों में पूर्ण स्वायत्तता प्राप्त करने के लिए मशीन विज़न महत्वपूर्ण है, क्योंकि यह ऑब्जेक्ट वर्गीकरण, लेन और सिग्नल का पता लगाने, साइन पहचान और ट्रैफ़िक पहचान को सक्षम बनाता है। स्वायत्त वाहनों का भविष्य एआई, एज कंप्यूटिंग और कैमरा प्रौद्योगिकी में प्रगति में निहित है।
सेल्फ-ड्राइविंग कारों ने हमेशा ध्यान आकर्षित किया है। हालाँकि हमारे पास अभी तक पूरी तरह से स्वायत्त कारें नहीं हैं, लेकिन हमारे पास उन्नत विशेषताओं वाली कारें हैं ड्राइवर-सहायता प्रणाली (एडीएएस) स्वचालित स्टीयरिंग, लेन बदलने, पार्किंग आदि में सक्षम है यातायात-जागरूक क्रूज़ नियंत्रण।
एक सेल्फ-ड्राइविंग कार अपने एडीएएस के लिए कई सेंसर का उपयोग करती है, जिसमें मशीन विजन वस्तुओं और सामान्य परिवेश की दूरी का पता लगाने, पहचानने और गणना करने का प्राथमिक तरीका है। मशीन विज़न के बिना, क्रूज़ नियंत्रण और ऑटोपायलट वाली सेल्फ-ड्राइविंग कारों की संभावना बहुत कम है।
मशीन विजन क्या है?
मशीन विज़न एक ऐसी तकनीक है जो मशीनों को उनके आसपास के वातावरण में वस्तुओं को देखने और पहचानने की अनुमति देती है। यह कंप्यूटर विज़न का एक उपसमूह है जो रोबोट और वाहनों जैसी स्वायत्त मशीनों में दृष्टि-उन्मुख वस्तु पहचान के औद्योगिक अनुप्रयोगों पर केंद्रित है।
मशीन विज़न आज एआई डीप लर्निंग एल्गोरिदम जैसे कन्वेन्शनल न्यूरल नेटवर्क (सीएनएन) का उपयोग करता है। मजबूत और अच्छी तरह से सामान्यीकृत मॉडल बनाने के लिए जो विभिन्न वस्तुओं की सटीक पहचान कर सकते हैं स्थितियाँ। यह विनिर्माण, कृषि, रोबोटिक्स और ऑटोमोटिव में उच्च विश्वसनीयता की आवश्यकता वाले विभिन्न कार्यों पर मशीन विज़न को लागू करना संभव बनाता है।
सेल्फ-ड्राइविंग कारों में मशीन विज़न कैसे काम करता है?
सेल्फ-ड्राइविंग कारों में मशीन विज़न को आम तौर पर तीन भागों में विभाजित किया जा सकता है: कैमरा सिस्टम, प्रोसेसिंग (एज कंप्यूटिंग), और एआई। यह प्रौद्योगिकी स्टैक एक स्वायत्त वाहन को गाड़ी चलाते समय संकेतों और बाधाओं को देखने, सोचने और पहचानने की अनुमति देता है। आइए यह समझने के लिए प्रत्येक भाग पर गहराई से चर्चा करें कि कैसे ये प्रौद्योगिकियाँ एक साथ मिलकर एक सेल्फ-ड्राइविंग कार की मशीन विज़न बनाती हैं।
कैमरा सिस्टम
पर्यावरण पर दृश्य जानकारी इकट्ठा करने के लिए मशीन विज़न कैमरा सिस्टम पर निर्भर करता है। सेल्फ-ड्राइविंग कारों में यथासंभव दृश्य जानकारी इकट्ठा करने के लिए कार के चारों ओर कई कैमरे लगाए जाते हैं।
मशीन विज़न कैमरों में दो मुख्य सेंसर का उपयोग किया जाता है: पूरक धातु-ऑक्साइड अर्धचालक (सीएमओएस) और चार्ज-युग्मित डिवाइस (सीसीडी). सेल्फ-ड्राइविंग कारों के लिए, CMOS को अक्सर इसकी तेज़ रीडआउट गति, शक्तिशाली ऑन-शिप के लिए पसंद किया जाता है इलेक्ट्रॉनिक्स, और समानांतर प्रसंस्करण क्षमताएं, इसे तेज़ सेंसर बनाती हैं, हालांकि शोर होने की संभावना होती है या कलाकृतियाँ. विभिन्न प्रकाश मोड, डिजिटल नाइट विज़न और फ़िल्टर जैसे समाधान, आदर्श से कम प्रकाश की स्थिति के दौरान CMOS सेंसर की मदद कर सकते हैं।
स्व-चालित कारों के लिए, त्रिविम दृष्टि उत्पन्न करने के लिए एक दूसरे से कुछ दूरी पर कैमरे लगाए जाते हैं। स्टीरियोस्कोपिक दृष्टि दो या दो से अधिक दृश्य इनपुट को संयोजित करने, वस्तुओं और पर्यावरण में गहराई या त्रि-आयामीता की भावना पैदा करने की क्षमता है। यह, बदले में, कारों को वस्तु और कार के बीच अनुमानित दूरी को त्रिकोण बनाने और गणना करने की अनुमति देता है।
चूँकि मनुष्य की दो आँखें होती हैं, इसलिए हमें त्रिविम दृष्टि से भी लाभ होता है। आप स्वयं इसका परीक्षण कर सकते हैं; एक आंख बंद करें और अपने डेस्क से एक छोटी वस्तु चुनें। अपना हाथ वस्तु के किनारे पर रखें और सुनिश्चित करें कि वस्तु का सिरा कम से कम दो इंच की दूरी पर हो। कुछ सेकंड रुकने का प्रयास करें और देखें कि आप अपने अनुमान को लेकर कितने आश्वस्त हैं। अब, दोनों आंखें खोलने का प्रयास करें और देखें कि आपकी गहराई की समझ कितनी बेहतर है।
एज कंप्यूटर
जबकि सेल्फ-ड्राइविंग कार पर कैमरा सिस्टम डेटा इकट्ठा करता है, एक ऑनबोर्ड कंप्यूटर (एज प्रोसेसर) पर्यावरण की स्थिति पर सिस्टम को अपडेट करने के लिए सभी इनपुट को वास्तविक समय में संसाधित करेगा तुरंत। हालाँकि विशिष्ट मशीन विज़न कार्य क्लाउड कंप्यूटिंग का उपयोग करके पैसे बचा सकते हैं, लेकिन इसमें बहुत कुछ है सेल्फ-ड्राइविंग कारों को क्लाउड से कनेक्ट करने का जोखिम, भले ही यह मशीन विज़न के लिए अपनी आवश्यकताओं में प्रक्रिया को आउटसोर्स करने के लिए हो।
इनपुट डेटा को संसाधित करने के लिए एक एज कंप्यूटर का उपयोग विलंबता की समस्याओं को समाप्त करता है और यह सुनिश्चित करता है कि डेटा वास्तविक समय में प्राप्त, संसाधित और संचारित हो। सेल्फ-ड्राइविंग कारों के लिए एज कंप्यूटर, NVIDIA के टेन्सर कोर और CUDA कोर जैसे AI ग्राफिक्स प्रोसेसर को एकीकृत करने वाले विशेष कंप्यूटर का उपयोग करते हैं।
एआई एल्गोरिदम
एल्गोरिदम हमेशा से मशीन विज़न का एक महत्वपूर्ण हिस्सा रहा है। एल्गोरिदम वह है जो कंप्यूटर को कैमरा सिस्टम द्वारा प्रदान किए गए सभी पैटर्न, आकार और रंगों की पहचान करने की अनुमति देता है। अधिक पारंपरिक मशीन विज़न एल्गोरिदम पर एआई का उपयोग वस्तुओं, सड़क संकेतों, सड़क चिह्नों और ट्रैफिक लाइटों की विश्वसनीय रूप से पहचान करने के लिए सेल्फ-ड्राइविंग कार की क्षमता को बढ़ाता है। सेल्फ-ड्राइविंग कारों को प्रशिक्षित करने के लिए कई एआई एल्गोरिदम का उपयोग किया जा रहा है। सबसे लोकप्रिय में शामिल हैं:
- योलो (आप केवल एक बार देखें): एक वास्तविक समय वस्तु पहचान एल्गोरिथ्म जो कार के दृश्य क्षेत्र में वस्तुओं की पहचान करता है और उन्हें ट्रैक करता है।
- SIFT (स्केल-इकार'सैंट फ़ीचर ट्रांसफ़ॉर्म): फीचर निष्कर्षण के लिए उपयोग किया जाता है, यह कार को उसके आसपास के विशिष्ट स्थलों और वस्तुओं को पहचानने में मदद करता है।
- ओरिएंटेड ग्रैडिएंट्स का हिस्टोग्राम (HOG): ऑब्जेक्ट पहचान के लिए उपयोग किया जाता है, यह छवियों से स्थानीय पैटर्न और ग्रेडिएंट निकालने पर केंद्रित है।
- टेक्स्टनबूस्ट: एक एल्गोरिदम जो पर्यावरण में बनावट का विश्लेषण करके वस्तु पहचान में मदद करता है।
- एडाबूस्ट: डेटा वर्गीकरण के लिए नियोजित, AdaBoost वाहन के मार्ग में वस्तुओं और बाधाओं के बारे में मजबूत निर्णय लेने के लिए कई कमजोर क्लासिफायरों को जोड़ता है।
सेल्फ-ड्राइविंग कारों में मशीन विजन का महत्व
मशीन विजन एक सेल्फ-ड्राइविंग कार के लिए अपने परिवेश को समझने और समझने का प्राथमिक तरीका है। मशीन विज़न के बिना, यह बहुत संभव है कि सेल्फ-ड्राइविंग कारों को लेवल 1 पर वापस धकेल दिया जाएगा वाहन स्वायत्तता पैमाना और कभी भी पूर्ण स्वायत्तता प्राप्त नहीं कर सकेगा।
मशीन विज़न के साथ, सेल्फ-ड्राइविंग कारें अब ऑब्जेक्ट वर्गीकरण, लेन और सिग्नल का पता लगाने, संकेत की पहचान और ट्रैफ़िक की पहचान करने में सक्षम हैं।
हालाँकि कई स्व-चालित वाहन अब LIDAR, RADAR और SONAR जैसे विभिन्न सेंसरों का उपयोग करते हैं, लेकिन ये सभी बहुत अधिक निर्भर करते हैं पर्यावरण को देखने, वस्तुओं की पहचान करने और संकेतों और ट्रैफिक लाइटों का अर्थ समझने के लिए मशीन दृष्टि सड़क। ये सभी अतिरिक्त सेंसर केवल मशीन की दृष्टि बढ़ाने और लोगों, जानवरों और संपत्तियों की सुरक्षा को बढ़ाने के लिए हैं।
जैसा कि कहा गया है, ऑटोपायलट क्षमताएं प्रदान करने के लिए मशीन विज़न अन्य सेंसर की मदद के बिना स्वतंत्र रूप से कार्य कर सकता है। वास्तव में, टेस्ला की नवीनतम सेल्फ-ड्राइविंग कारों ने RADAR को गिरा दिया और अब अपने ऑटोपायलट सिस्टम के लिए पूरी तरह से मशीन विज़न पर निर्भर हैं।
हालाँकि इसका अन्य सेंसर प्रौद्योगिकियों की उपयोगिता को बदनाम करने के संदर्भ में कोई मतलब नहीं है, लेकिन यह सेल्फ-ड्राइविंग कारों में मशीन विज़न के महत्व और शक्ति को दर्शाता है।
स्वायत्त वाहनों में मशीन विजन का भविष्य
मशीन विजन सेल्फ-ड्राइविंग कारों की नींव है। मशीन विज़न के माध्यम से, कारें पर्यावरण को ठीक उसी तरह देख और समझ सकती हैं जैसे मनुष्य करते हैं। हालाँकि चुनौतियाँ बनी हुई हैं, सुरक्षा और नेविगेशन के संदर्भ में मशीन विज़न के लाभों को कम करके नहीं आंका जा सकता है। स्वायत्त वाहनों के भविष्य के लिए, एआई, एज कंप्यूटिंग और/या कैमरे में कोई और प्रगति प्रौद्योगिकी निश्चित रूप से सेल्फ-ड्राइविंग कारों को और अधिक कुशल बनाएगी, जो संभवतः उन्हें उच्च स्तर पर ले जाएगी स्वचालन.