YOLO-NAS, YOLO श्रृंखला में ऑब्जेक्ट डिटेक्शन मॉडल का शिखर है। लेकिन इसे सर्वश्रेष्ठ क्यों माना जाता है?

YOLOv8 के बाद, एक नया और बेहतर अत्याधुनिक ऑब्जेक्ट डिटेक्शन मॉडल, YOLO-NAS है। यह पिछले YOLO (यू ओनली लुक वन्स) मॉडल की सीमाओं से निपटने के लिए डेसी एआई द्वारा विकसित एक ऑब्जेक्ट डिटेक्शन एल्गोरिदम है।

यह मॉडल न्यूरल आर्किटेक्चर सर्च इंजन ऑटोएनएसी से बनाया गया है। यह SOTA मॉडल की गति और प्रदर्शन को पीछे छोड़ देता है, जो सटीकता-विलंबता और परिमाणीकरण समर्थन ट्रेडऑफ़ में सुधार करके ऑब्जेक्ट डिटेक्शन में एक बड़ी छलांग प्रस्तुत करता है।

यह लेख YOLO-NAS की शक्तियों और विशेषताओं पर चर्चा करेगा, यह खोजेगा कि यह YOLO श्रृंखला में सबसे अच्छा ऑब्जेक्ट डिटेक्शन मॉडल क्यों है।

यह समझना कि योलो-एनएएस कैसे काम करता है

डेसी का ऑटोएनएसी (ऑटोमेटेड न्यूरल आर्किटेक्चर कंस्ट्रक्शन) योलो-एनएएस का आर्किटेक्चर तैयार करता है। ऑटोएनएसी एक निर्बाध प्रक्रिया है जो मौजूदा गहरे तंत्रिका नेटवर्क के प्रदर्शन को बढ़ावा देती है।

ऑटोएनएसी पाइपलाइन एक उपयोगकर्ता-प्रशिक्षित गहरे तंत्रिका नेटवर्क को इनपुट, डेटासेट और एक अनुमान प्रणाली तक पहुंच के रूप में लेती है। उपयोगकर्ता-प्रशिक्षित गहरे तंत्रिका नेटवर्क को फिर पाइपलाइन का उपयोग करके पुन: डिज़ाइन किया जाता है। सटीकता से समझौता किए बिना कम विलंबता के साथ एक अनुकूलित आर्किटेक्चर हासिल किया जाता है।

instagram viewer

YOLO-NAS RepVGG का उपयोग करता है। RepVGG इसे पुनः-पैरामीटराइजेशन या पोस्ट-ट्रेनिंग क्वांटाइजेशन द्वारा प्रशिक्षण के बाद अनुकूलन के लिए उपलब्ध कराता है। यह वीजीजी पर आधारित एक प्रकार का न्यूरल नेटवर्क आर्किटेक्चर है। यह गहन शिक्षण मॉडल की सामान्यीकरण क्षमता को बढ़ाने के लिए डिज़ाइन की गई नियमितीकरण तकनीकों का उपयोग करता है।

आर्किटेक्चर का डिज़ाइन गति और मेमोरी में अधिक कुशल है। रेपवीजीजी तेजी से अनुमान प्राप्त करने के लिए मल्टी-ब्रांच आर्किटेक्चर का उपयोग करके प्रशिक्षण लेता है। फिर इसे पुन: पैरामीटरीकरण का उपयोग करके एकल शाखा में परिवर्तित कर दिया जाता है।

यह सुविधा उत्पादन परिनियोजन के लिए YOLO-NAS को बहुत उपयोगी बनाती है। ऐसा इसलिए है क्योंकि अनुमान गति और मेमोरी उपयोग के लिए पूरी सटीकता के साथ मॉडल को प्रशिक्षित और अनुकूलित करना संभव है।

योलो-एनएएस की मुख्य विशेषताएं

योलो-एनएएस की प्रमुख विशेषताओं में निम्नलिखित शामिल हैं:

  • परिमाणीकरण-जागरूक प्रशिक्षण: मॉडल 8-बिट परिमाणीकरण के पुन: पैरामीटरीकरण को संयोजित करके प्रशिक्षण के बाद परिमाणीकरण के दौरान सटीकता हानि को कम करने के लिए QSP और QCI (परिमाणीकरण-जागरूक मॉड्यूल) का उपयोग करता है।
  • स्वचालित वास्तुकला डिजाइन: ऑटोएनएसी, डेसी की स्वामित्व वाली एनएएस तकनीक एक इष्टतम मॉडल आर्किटेक्चर की खोज करती है जो एक अनुकूलित मॉडल के साथ आने के लिए मौलिक YOLO मॉडल आर्किटेक्चर को एकीकृत करती है।
  • हाइब्रिड परिमाणीकरण तकनीक: मानक परिमाणीकरण विधि पूरे मॉडल को प्रभावित करती है। इसके विपरीत, हाइब्रिड परिमाणीकरण तकनीक मॉडल की विलंबता और सटीकता को संतुलित करने के लिए मॉडल के एक अनुभाग को परिमाणित करती है।
  • स्वचालित रूप से लेबल किए गए डेटा का उपयोग करके प्रशिक्षण के लिए मॉडल तैयार करने के लिए अद्वितीय दृष्टिकोण का उपयोग करें। फिर मॉडल अपनी भविष्यवाणियों से सीखता है और बड़ी मात्रा में डेटा तक पहुंचता है।

तुलनात्मक विश्लेषण: योलो-एनएएस बनाम अन्य योलो मॉडल

नीचे विभिन्न YOLO श्रृंखला मॉडलों के बीच तुलना दी गई है।

योलो-एनएएस पहले से मौजूद ऑब्जेक्ट डिटेक्शन मॉडल से बेहतर है, लेकिन इसमें कुछ खामियां भी हैं। यहां योलो-एनएएस के लाभ और अवगुणों की सूची दी गई है:

पेशेवरों

  • यह ओपन-सोर्स है.
  • यह पहले से मौजूद YOLO मॉडल की तुलना में 10-20% तेज़ है।
  • यह पहले से मौजूद YOLO मॉडल की तुलना में अधिक सटीक है।
  • यह एक बेहतर आर्किटेक्चर, ऑटोएनएसी का उपयोग करता है। यह ऑब्जेक्ट डिटेक्शन में एक नया रिकॉर्ड स्थापित करता है, जो सर्वोत्तम सटीकता और विलंबता ट्रेडऑफ़ प्रदर्शन प्रदान करता है।
  • NVIDIA जैसे अनुमान इंजनों के लिए निर्बाध समर्थन। यह सुविधा इसे उत्पादन के लिए तैयार मॉडल बनाती है।
  • इसमें बेहतर मेमोरी दक्षता और बढ़ी हुई अनुमान गति है।

दोष

  • यह अभी तक स्थिर नहीं है क्योंकि तकनीक अभी भी नई है और उत्पादन में इसका बेतहाशा उपयोग नहीं किया गया है।

योलो-एनएएस का कार्यान्वयन

आप प्रयोग करेंगे गूगल कोलाब इस कार्यान्वयन में कोड लिखने और चलाने के लिए। Google Colab का एक विकल्प यह होगा एक आभासी वातावरण बनाएँ और अपनी स्थानीय मशीन पर एक आईडीई का उपयोग करें.

मॉडल बहुत संसाधन गहन है. इसे अपनी मशीन पर चलाने से पहले सुनिश्चित करें कि आपके पास कम से कम 8 जीबी रैम है। वीडियो का आकार जितना बड़ा होगा, वह उतनी ही अधिक मेमोरी का उपयोग करेगा।

निर्भरताएँ स्थापित करना

YOLO-NAS निर्भरता स्थापित करें, सुपर-ग्रेडिएंट्स नीचे दिए गए आदेश का उपयोग करना:

पिप सुपर-ग्रेडिएंट्स स्थापित करें ==3.1.2

सफल इंस्टालेशन के बाद, अब आप YOLO-NAS मॉडल को प्रशिक्षित करने में सक्षम होंगे।

मॉडल प्रशिक्षण

मॉडल को प्रशिक्षित करने के लिए, नीचे दिया गया कोड ब्लॉक चलाएँ:

से super_gradients.training आयात मॉडल
yolo_nas_l = models.get("yolo_nas_l", पूर्वप्रशिक्षित_वेट="कोको")

आप इस कोड में स्थापित सुपरग्रैडिएंट्स लाइब्रेरी से प्रशिक्षण मॉडल आयात कर रहे हैं। फिर आप COCO डेटासेट से पूर्व-प्रशिक्षित मॉडल वज़न का उपयोग कर रहे हैं।

मॉडल अनुमान

मॉडल अनुमान में छवि पहचान, वर्गीकरण और विभाजन कार्यों के लिए संभावित अनुप्रयोग हैं।

इस मामले में, आप पर ध्यान केंद्रित करेंगे वस्तु का पता लगाने का कार्य वीडियो और छवियों के लिए. किसी छवि में किसी ऑब्जेक्ट का पता लगाने के लिए, नीचे दिया गया कोड ब्लॉक चलाएँ:

यूआरएल = "img_path"
yolo_nas_l.predict (url, conf=0.25)।दिखाना()

सुनिश्चित करें कि आप अपनी छवि के लिए सटीक पथ का उपयोग करते हैं। इस स्थिति में, छवि को Google Colab परिवेश पर अपलोड करें, फिर छवि का पथ कॉपी करें।

अपेक्षित उत्पादन:

किसी वीडियो में ऑब्जेक्ट का पता लगाने के लिए, नीचे दिया गया कोड ब्लॉक चलाएँ:

आयात मशाल

इनपुट_वीडियो_पथ = "पथ_से_वीडियो"
आउटपुट_वीडियो_पथ = "पता चला.mp4"
डिवाइस = 'कुडा'अगर मशाल.कुडा.is_उपलब्ध() अन्य"CPU"
yolo_nas_l.to (डिवाइस).भविष्यवाणी करें (इनपुट_वीडियो_पथ).सहेजें (आउटपुट_वीडियो_पथ)

छवि डेटा की तरह, उस वीडियो को अपलोड करें जिसके ऑब्जेक्ट का आप Google Colab परिवेश में पता लगाना चाहते हैं और वीडियो वेरिएबल के पथ को कॉपी करें। अनुमानित वीडियो नाम का उपयोग करके Google Colab परिवेश से पहुंच योग्य होगा पता लगाया गया.mp4. अपना सत्र समाप्त करने से पहले वीडियो को अपनी स्थानीय मशीन पर डाउनलोड करें।

अपेक्षित उत्पादन:

YOLO-NAS कस्टम डेटा पर मॉडल फ़ाइन-ट्यूनिंग और प्रशिक्षण का भी समर्थन करता है। दस्तावेज़ीकरण पर उपलब्ध है डेसी का फाइन-ट्यूनिंग स्टार्टर नोटबुक।

योलो-एनएएस के वास्तविक-विश्व अनुप्रयोग

YOLO-NAS का स्रोत कोड अपाचे लाइसेंस 2.0 के तहत पहुंच योग्य है, जो गैर-व्यावसायिक उपयोग के लिए सुलभ है। व्यावसायिक उपयोग के लिए, मॉडल को कस्टम वज़न प्राप्त करने के लिए स्क्रैच से पुनः प्रशिक्षण से गुजरना होगा।

यह एक बहुमुखी मॉडल है जिसका अनुप्रयोग कई क्षेत्रों में संभव है, जैसे:

स्वायत्त वाहन और रोबोटिक्स

YOLO-NAS स्वायत्त वाहनों की धारणा क्षमताओं में सुधार कर सकता है, जिससे वे वास्तविक समय में तेजी से और अधिक सटीक रूप से वस्तुओं का पता लगाने और उन्हें ट्रैक करने में सक्षम हो सकते हैं। यह क्षमता सड़क सुरक्षा और सुचारू ड्राइविंग अनुभव सुनिश्चित करने में मदद करती है।

निगरानी और सुरक्षा प्रणालियाँ

यह मॉडल निगरानी और सुरक्षा के लिए तेज़, सटीक और वास्तविक समय में वस्तु का पता लगाने की सुविधा प्रदान कर सकता है सिस्टम, जो संभावित खतरों या संदिग्ध गतिविधियों की पहचान करने में मदद करता है, जिसके परिणामस्वरूप बेहतर सुरक्षा होती है प्रणाली

खुदरा और इन्वेंटरी प्रबंधन

मॉडल तेज़ और सटीक ऑब्जेक्ट डिटेक्शन क्षमताएं प्रदान कर सकता है जो कुशल और वास्तविक समय स्वचालित इन्वेंट्री प्रबंधन, स्टॉक ट्रैकिंग और शेल्फ अनुकूलन की अनुमति देता है। यह मॉडल परिचालन लागत को कम करने और मुनाफा बढ़ाने में मदद करता है।

हेल्थकेयर और मेडिकल इमेजिंग

स्वास्थ्य देखभाल में, YOLO-NAS रोग संबंधी विसंगतियों या रुचि के विशिष्ट क्षेत्रों का कुशल पता लगाने और विश्लेषण करने में मदद करने में सक्षम है। यह मॉडल डॉक्टरों को बीमारियों का सटीक निदान करने और मरीजों की निगरानी करने में मदद कर सकता है, जिससे स्वास्थ्य सेवा क्षेत्र में सुधार होगा।

योलो-एनएएस टेकअवे

YOLO-NAS एक नया ऑब्जेक्ट डिटेक्शन मॉडल है जो ऑब्जेक्ट डिटेक्शन करने का एक नया तरीका पेश करता है। यह SOTA मॉडल से बेहतर है. ऑब्जेक्ट डिटेक्शन पर इसका प्रदर्शन कंप्यूटर विज़न परियोजनाओं के लिए एक बड़ी छलांग है।