पायथन एक लोकप्रिय उच्च-स्तरीय प्रोग्रामिंग भाषा है जिसका उपयोग मुख्य रूप से डेटा साइंस, ऑटोमेशन, वेब डेवलपमेंट और आर्टिफिशियल इंटेलिजेंस के लिए किया जाता है। यह एक सामान्य-उद्देश्य वाली प्रोग्रामिंग भाषा है जो कार्यात्मक प्रोग्रामिंग, ऑब्जेक्ट-ओरिएंटेड प्रोग्रामिंग और प्रक्रियात्मक प्रोग्रामिंग का समर्थन करती है। वर्षों से, पायथन को डेटा विज्ञान के लिए सबसे अच्छी प्रोग्रामिंग भाषा के रूप में जाना जाता है, और यह आमतौर पर बड़ी तकनीकी कंपनियों द्वारा डेटा विज्ञान कार्यों के लिए उपयोग किया जाता है।
इस ट्यूटोरियल में, आप सीखेंगे कि पायथन डेटा साइंस के लिए इतना लोकप्रिय क्यों है और भविष्य में यह लोकप्रिय क्यों रहेगा।
पायथन का उपयोग किस लिए किया जा सकता है?
जैसा कि पहले कहा गया है, पायथन एक सामान्य-उद्देश्य वाली प्रोग्रामिंग भाषा है, जिसका अर्थ है कि इसका उपयोग लगभग हर चीज के लिए किया जा सकता है।
वेब विकास में पायथन का एक सामान्य अनुप्रयोग है जहाँ Django या फ्लास्क का उपयोग किसी वेबसाइट के बैकएंड के रूप में किया जाता है। उदाहरण के लिए, Instagram का बैकएंड Django पर चलता है, और यह Django की सबसे बड़ी तैनाती में से एक है।
आप पाइगेम, किवी, आर्केड, वगैरह के साथ खेल के विकास के लिए पायथन का भी उपयोग कर सकते हैं; हालांकि यह शायद ही कभी इस्तेमाल किया जाता है। मोबाइल ऐप डेवलपमेंट को नहीं छोड़ा गया है, पायथन कई ऐप डेवलपमेंट लाइब्रेरी प्रदान करता है जैसे कि किवी और किवीएमडी जिसका उपयोग आप मल्टीप्लायर ऐप विकसित करने के लिए कर सकते हैं; और कई अन्य पुस्तकालय जैसे टिंकर, पीईक्यूटी, आदि।
इस ट्यूटोरियल की मुख्य बात डेटा साइंस में पायथन का अनुप्रयोग है। पायथन डेटा साइंस के लिए सबसे अच्छी प्रोग्रामिंग भाषा साबित हुई है और आप इस ट्यूटोरियल में जानेंगे कि क्यों।
डेटा साइंस क्या है?
के अनुसार आकाशवाणी, डेटा विज्ञान डेटा से मूल्य निकालने के लिए सांख्यिकी, वैज्ञानिक विधियों, कृत्रिम बुद्धिमत्ता (एआई), और डेटा विश्लेषण सहित कई क्षेत्रों को जोड़ता है। इसमें विश्लेषण के लिए डेटा तैयार करना शामिल है, जिसमें उन्नत डेटा विश्लेषण करने के लिए डेटा को साफ करना, एकत्र करना और हेरफेर करना शामिल है।
डेटा विज्ञान विभिन्न उद्योगों में लागू होता है, और यह समस्याओं को हल करने और ब्रह्मांड के बारे में अधिक जानने में मदद कर रहा है। स्वास्थ्य उद्योग में, डेटा विज्ञान डॉक्टरों को निर्णय लेने में पिछले डेटा का उपयोग करने में मदद करता है, उदाहरण के लिए, निदान, या किसी बीमारी के लिए सही उपचार। शिक्षा क्षेत्र भी छूटा नहीं है, अब आप अनुमान लगा सकते हैं कि छात्र स्कूल छोड़ देंगे, यह सब डेटा विज्ञान की बदौलत है।
पायथन में एक सरल सिंटेक्स है
सहज ज्ञान युक्त वाक्य रचना की तुलना में प्रोग्रामिंग को और क्या आसान बना सकता है? पायथन में, आपको अपना पहला प्रोग्राम चलाने के लिए केवल एक पंक्ति की आवश्यकता है: बस टाइप करें प्रिंट ("हैलो वर्ल्ड!") और भागो - यह इतना आसान है।
पायथन का एक बहुत ही सरल सिंटैक्स है, और यह प्रोग्रामिंग को बहुत आसान और तेज़ बनाता है। फ़ंक्शन लिखते समय घुंघराले ब्रेसिज़ की कोई आवश्यकता नहीं है, कोई अर्धविराम आपका दुश्मन नहीं है, और आपको मूल कोड लिखने से पहले पुस्तकालयों को आयात करने की भी आवश्यकता नहीं है।
यह अन्य प्रोग्रामिंग भाषाओं की तुलना में पायथन का एक फायदा है। आपमें गलतियाँ करने की प्रवृत्ति कम होती है, और आप आसानी से बग नोटिस कर सकते हैं।
व्यापक समुदाय
डेटा साइंस एक जटिल क्षेत्र है जिसे आप बिना किसी मदद के नहीं कर सकते। Python अपने विस्तृत समुदाय के माध्यम से आपको आवश्यक सभी सहायता प्रदान करता है। जब भी आप फंसें, बस इसे ब्राउज़ करें और आपका उत्तर आपकी प्रतीक्षा कर रहा है। स्टैक ओवरफ़्लो एक बहुत ही लोकप्रिय वेबसाइट है जहां प्रोग्रामिंग समस्याओं पर प्रश्न और उत्तर पोस्ट किए जाते हैं।
यदि आपकी समस्या नई है, जो दुर्लभ है, तो आप प्रश्न पूछ सकते हैं और लोग उत्तर देने के इच्छुक होंगे।
पायथन सभी पुस्तकालयों की पेशकश करता है
आपको पानी की सख्त जरूरत है, और आपके पास मेज पर सिर्फ दो कप हैं। एक पानी से भरा एक चौथाई है जबकि दूसरा लगभग भरा हुआ है। क्या आप प्याले को ज्यादा पानी के साथ ले जाएंगे या दूसरा, हालांकि उन दोनों में पानी है? आप बहुत सारे पानी वाले कप को ले जाना चाहेंगे क्योंकि आपको वास्तव में पानी की जरूरत है। यह पायथन से संबंधित है, यह उन सभी पुस्तकालयों की पेशकश करता है जिनकी आपको कभी भी डेटा विज्ञान के लिए आवश्यकता होती है, आप निश्चित रूप से केवल कुछ पुस्तकालयों के साथ किसी अन्य प्रोग्रामिंग भाषा का उपयोग नहीं करना चाहेंगे।
आपको इन पुस्तकालयों के साथ काम करने का बहुत अच्छा अनुभव होगा क्योंकि ये वास्तव में उपयोग में आसान हैं। यदि आपको कोई पुस्तकालय स्थापित करने की आवश्यकता है, तो पुस्तकालय का नाम खोजें PyPI.org और पुस्तकालय को स्थापित करने के लिए इस लेख के अंत में दिए गए निर्देशों का पालन करें।
सम्बंधित: पायथन के लिए डेटा विज्ञान पुस्तकालय प्रत्येक डेटा वैज्ञानिक को उपयोग करना चाहिए
संख्यात्मक पायथन - NumPy
NumPy सबसे अधिक इस्तेमाल की जाने वाली डेटा साइंस लाइब्रेरी में से एक है। यह आपको पायथन में संख्यात्मक और वैज्ञानिक कार्यों के साथ काम करने की अनुमति देता है। डेटा को सरणियों का उपयोग करके दर्शाया जाता है या जिसे आप सूचियों के रूप में संदर्भित कर सकते हैं, जो किसी भी आयाम में हो सकता है: 1-आयामी (1D) सरणी, 2-आयामी (2D) सरणी, 3-आयामी (3D) सरणी, और इसी तरह।
पांडा
पांडा एक लोकप्रिय डेटा विज्ञान पुस्तकालय भी है जिसका उपयोग डेटा तैयार करने, डेटा प्रोसेसिंग, डेटा विज़ुअलाइज़ेशन में किया जाता है। पांडा के साथ, आप सीएसवी (अल्पविराम से अलग किए गए मान) या टीएसवी (टैब से अलग किए गए मान) जैसे विभिन्न स्वरूपों में डेटा आयात कर सकते हैं। पांडा Matplotlib की तरह काम करता है क्योंकि यह आपको विभिन्न प्रकार के प्लॉट बनाने की अनुमति देता है। पंडों की एक और बढ़िया विशेषता यह है कि यह आपको SQL प्रश्नों को पढ़ने की अनुमति देता है। इसलिए, यदि आप अपने डेटाबेस से जुड़े हैं, और आप पायथन में SQL क्वेरी लिखना और चलाना चाहते हैं, तो पांडा एक बढ़िया विकल्प है।
माटप्लोटलिब और सीबोर्न
Matplotlib एक और भयानक पुस्तकालय है जो पायथन प्रदान करता है। इसे MatLab के शीर्ष पर विकसित किया गया है - एक प्रोग्रामिंग भाषा जिसका उपयोग मुख्य रूप से वैज्ञानिक और विज़ुअलाइज़ेशन उद्देश्यों के लिए किया जाता है। Matplotlib आपको कोड की कुछ पंक्तियों के साथ विभिन्न प्रकार के ग्राफ़ बनाने की अनुमति देता है।
आप किसी भी डेटा की कल्पना करने के लिए ग्राफ़ प्लॉट कर सकते हैं, जिससे आपको अपने डेटा से अंतर्दृष्टि प्राप्त करने में मदद मिलती है, या आपको डेटा का बेहतर प्रतिनिधित्व मिलता है। अन्य पुस्तकालय जैसे पांडा, सीबॉर्न और ओपनसीवी भी परिष्कृत रेखांकन की साजिश रचने के लिए मैटप्लोटलिब का उपयोग करते हैं।
सीबॉर्न (सीबोर्न नहीं) बिल्कुल मैटप्लोटलिब की तरह है, बस आपके पास और विकल्प हैं - अपने ग्राफ़ के अलग-अलग हिस्सों को अलग-अलग रंग, या रंग देने के लिए। आप अच्छे रेखांकन बना सकते हैं और डेटा प्रस्तुति को बेहतर बनाने के लिए रूप को अनुकूलित कर सकते हैं।
ओपन कंप्यूटर विजन - ओपनसीवी
शायद आप एक ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) सिस्टम, दस्तावेज़ स्कैनर, छवि बनाना चाहते हैं फ़िल्टर, मोशन सेंसर, सुरक्षा प्रणाली, या कंप्यूटर दृष्टि से संबंधित कुछ भी, आपको कोशिश करनी चाहिए ओपनसीवी। पायथन द्वारा पेश किया गया यह अद्भुत और मुफ्त पुस्तकालय आपको कोड की कुछ ही पंक्तियों में कंप्यूटर विज़न सिस्टम बनाने की अनुमति देता है। आप छवियों, वीडियो, या यहां तक कि अपने वेबकैम फ़ीड और परिनियोजन के साथ काम कर सकते हैं।
स्किकिट-लर्न - स्किलर्न
स्किकिट-लर्न सबसे लोकप्रिय पुस्तकालय है जिसका उपयोग विशेष रूप से डेटा विज्ञान में मशीन सीखने के कार्यों के लिए किया जाता है। Sklearn आपको अपने डेटा का उपयोग करने और कोड की कुछ ही पंक्तियों में मशीन लर्निंग मॉडल बनाने के लिए आवश्यक सभी सुविधाएं प्रदान करता है।
लीनियर रिग्रेशन (सरल और मल्टीपल), लॉजिस्टिक रिग्रेशन, k-निकटतम पड़ोसी जैसे विभिन्न मशीन लर्निंग कार्य हैं। भोले बे, समर्थन वेक्टर प्रतिगमन, यादृच्छिक वन प्रतिगमन, बहुपद प्रतिगमन, वर्गीकरण और क्लस्टरिंग सहित कार्य।
हालांकि पायथन अपने सिंटैक्स के कारण सरल है; ऐसे उपकरण हैं जिन्हें विशेष रूप से डेटा विज्ञान को ध्यान में रखकर तैयार किया गया है। जुपिटर नोटबुक पहला उपकरण है, यह एनाकोंडा द्वारा बनाया गया एक विकास वातावरण है, जो डेटा विज्ञान कार्यों के लिए पायथन कोड लिखता है। आप कोशिकाओं में कोड लिख सकते हैं और तुरंत चला सकते हैं, उन्हें समूहित कर सकते हैं, या यहां तक कि दस्तावेज़ीकरण भी शामिल कर सकते हैं, जैसा कि इसकी मार्कडाउन क्षमता द्वारा प्रदान किया गया है।
एक लोकप्रिय विकल्प Google Colaboratory है, जिसे Google Colab के नाम से भी जाना जाता है। वे समान हैं और एक ही उद्देश्य के लिए उपयोग किए जाते हैं लेकिन Google Colab के क्लाउड समर्थन के कारण अधिक लाभ हैं। आपके पास अधिक स्थान तक पहुंच है, आपको अपने कंप्यूटर संग्रहण के पूर्ण होने की चिंता करने की आवश्यकता नहीं है। आप अपनी नोटबुक भी साझा कर सकते हैं, किसी भी डिवाइस पर लॉग इन कर सकते हैं और उस तक पहुंच सकते हैं, या यहां तक कि अपनी नोटबुक को गिटहब में सहेज सकते हैं।
पायथन में कोई भी डेटा साइंस लाइब्रेरी कैसे स्थापित करें
यह देखते हुए कि आपके कंप्यूटर पर पहले से ही पायथन स्थापित है, यह चरण-दर-चरण अनुभाग आपको मार्गदर्शन करेगा कि आपके विंडोज कंप्यूटर पर किसी भी डेटा विज्ञान पुस्तकालय को कैसे स्थापित किया जाए। इस मामले में NumPy स्थापित किया जाएगा, नीचे दिए गए चरणों का पालन करें:
- दबाएँ शुरू और टाइप करें अध्यक्ष एवं प्रबंध निदेशक. परिणाम पर राइट-क्लिक करें और चुनें व्यवस्थापक के रूप में चलाएं.
- PyPi से Python पुस्तकालयों को स्थापित करने के लिए आपको PIP की आवश्यकता है। यदि आपके पास पहले से है, तो बेझिझक इस चरण को छोड़ दें; यदि नहीं, तो कृपया पढ़ें अपने कंप्यूटर पर पीआईपी कैसे स्थापित करें.
- प्रकार पाइप स्थापित numpy और दबाएं दर्ज चलाने के लिए। यह प्रक्रिया आपके कंप्यूटर पर NumPy स्थापित करेगी और अब आप अपने कंप्यूटर पर NumPy को आयात और उपयोग कर सकते हैं। यह प्रक्रिया नीचे दिखाए गए स्क्रीनशॉट के समान दिखनी चाहिए, चेतावनी और रिक्त स्थान को अनदेखा करें। (यदि आप Linux या macOS का उपयोग करते हैं, तो बस एक टर्मिनल खोलें और दर्ज करें पाइप स्थापित आदेश)।
डेटा साइंस के लिए पायथन का उपयोग करने का समय आ गया है
R, C++, और Java जैसी अन्य प्रोग्रामिंग भाषाओं में; डेटा साइंस के लिए पायथन सबसे अच्छा है। इस ट्यूटोरियल ने आपका मार्गदर्शन किया है कि क्यों पायथन डेटा साइंस के लिए इतना लोकप्रिय है। अब आप जानते हैं कि पायथन क्या प्रदान करता है और Google, मेटा, नासा, टेस्ला, वगैरह जैसी बड़ी कंपनियां पायथन का उपयोग क्यों करती हैं।
क्या यह ट्यूटोरियल आपको यह समझाने में सफल रहा कि पायथन डेटा साइंस के लिए सबसे अच्छी प्रोग्रामिंग भाषा बनी रहेगी? यदि हाँ, तो आगे बढ़ें और अच्छी डेटा विज्ञान परियोजनाओं का निर्माण करें; जीवन को आसान बनाने में मदद करें।
उन्नत डेटा विश्लेषण के लिए, पायथन एक्सेल से बेहतर है। पंडों का उपयोग करके अपने एक्सेल डेटा को पायथन लिपि में आयात करने का तरीका यहां दिया गया है!
आगे पढ़िए
- प्रोग्रामिंग
हमारे न्यूज़लेटर की सदस्यता लें
तकनीकी युक्तियों, समीक्षाओं, निःशुल्क ई-पुस्तकों और अनन्य सौदों के लिए हमारे न्यूज़लेटर से जुड़ें!
सब्सक्राइब करने के लिए यहां क्लिक करें