पिवट टेबल एमएस एक्सेल के भीतर सबसे अधिक सम्मानित और व्यापक रूप से उपयोग किए जाने वाले टूल में से एक है। चाहे आप डेटा विश्लेषक हों, डेटा इंजीनियर हों, या बस एक नियमित उपयोगकर्ता हों, संभावना है कि आपके पास पहले से ही एमएस एक्सेल के लिए एक सॉफ्ट स्पॉट है।
फिर भी, एमएस एक्सेल के टूल्स और यूटिलिटीज की नकल करने की गुंजाइश बढ़ रही है, खासकर पायथन में। क्या आप जानते हैं कि आप कोड की कुछ पंक्तियों के साथ ही पायथन के डेटाफ़्रेम में व्यापक पिवट टेबल बना सकते हैं?
हाँ, यह सही है; यदि आप रुचि रखते हैं, तो यहां बताया गया है कि आप इसे कैसे कर सकते हैं।
पिवट टेबल बनाने के लिए पूर्व-आवश्यकताएँ
किसी भी अन्य प्रोग्रामिंग भाषा की तरह, यहां तक कि पायथन को भी कोडिंग करने से पहले आपको कुछ पूर्व-आवश्यकताएं पूरी करने की आवश्यकता होती है।
पायथन में अपनी पहली पिवट टेबल बनाते समय सबसे अधिक अनुकूलित अनुभव प्राप्त करने के लिए, आपको इसकी आवश्यकता होगी:
- पायथन आईडीई: अधिकांश पायथन कोड में एक एकीकृत विकास वातावरण (IDE) होता है जो उनके सिस्टम पर पहले से स्थापित होता है। वहाँ कई हैं बाजार में पायथन संगत आईडीई, जिसमें जुपिटर नोटबुक, स्पाइडर, पाइचर्म और कई अन्य शामिल हैं।
- नमूना डेटा: उदाहरण के लिए, यहां एक नमूना डेटासेट है जिस पर आप काम कर सकते हैं। वैकल्पिक रूप से, बेझिझक इन कोड्स को सीधे अपने लाइव डेटा पर ट्विक करें।
डेटा नमूना लिंक:नमूना सुपरस्टोर
आवश्यक पुस्तकालयों का आयात
चूंकि पायथन तीसरे पक्ष के पुस्तकालयों की अवधारणा पर काम करता है, इसलिए आपको आयात करने की आवश्यकता है पांडा पिवट बनाने के लिए पुस्तकालय।
आप पंडों का उपयोग कर सकते हैं पायथन में एक एक्सेल फ़ाइल आयात करें और डेटा को डेटाफ्रेम में स्टोर करें। पांडा आयात करने के लिए, का उपयोग करें आयात निम्नलिखित तरीके से आदेश:
आयात पांडा जैसा पी.डी.
पायथन में पिवोट्स कैसे बनाएं
चूंकि पुस्तकालय अब उपलब्ध है, इसलिए आपको एक्सेल फ़ाइल को पायथन में आयात करने की आवश्यकता है, जो कि पायथन में पिवट बनाने और परीक्षण करने का आधार है। आयातित डेटा को निम्न कोड के साथ डेटाफ़्रेम में संग्रहीत करें:
# एक नया डेटाफ़्रेम बनाएं
#यहां अपने रास्ते से बदलें
पथ = "सी://उपयोगकर्ता//उपयोगकर्ता/वनड्राइव//डेस्कटॉप//"
# आप यहां फ़ाइल नाम परिभाषित कर सकते हैं
फ़ाइल = "नमूना - Superstore.xls"
df = pd.read_excel (पथ + फ़ाइल)
डीएफ।सिर()
कहाँ पे:
- डीएफ: डेटाफ़्रेम डेटा को संग्रहीत करने के लिए चर नाम
- पीडी: पंडों पुस्तकालय के लिए उपनाम
- read_excel (): पंडों ने एक एक्सेल फ़ाइल को पायथन में पढ़ने के लिए कार्य किया
- रास्ता: वह स्थान जहाँ एक्सेल फ़ाइल संग्रहीत है (नमूना सुपरस्टोर)
- फ़ाइल: आयात करने के लिए फ़ाइल का नाम
- सिर(): डिफ़ॉल्ट रूप से डेटाफ़्रेम की पहली पाँच पंक्तियाँ प्रदर्शित करता है
उपरोक्त कोड एक्सेल फ़ाइल को पायथन में आयात करता है और डेटा को डेटाफ़्रेम में संग्रहीत करता है। अंततः सिर फ़ंक्शन डेटा की पहली पांच पंक्तियों को प्रदर्शित करता है।
यह फ़ंक्शन यह सुनिश्चित करने के लिए आसान है कि डेटा सही ढंग से पायथन में आयात किया गया है।
पायथन में कौन से पिवट टेबल फील्ड मौजूद हैं?
अपने एक्सेल समकक्ष की तरह, एक पिवट टेबल में पाइथन में फ़ील्ड का एक समान सेट होता है। यहां कुछ फ़ील्ड हैं जिनके बारे में आपको जानना आवश्यक है:
- जानकारी: डेटा फ़ील्ड एक पायथन डेटाफ़्रेम के भीतर संग्रहीत डेटा को संदर्भित करता है
- मान: एक पिवट के भीतर उपयोग किया जाने वाला स्तंभ डेटा
- अनुक्रमणिका: डेटा को समूहीकृत करने के लिए एक इंडेक्स कॉलम
- कॉलम: कॉलम डेटाफ़्रेम के भीतर मौजूदा डेटा को एकत्र करने में मदद करते हैं
सूचकांक समारोह का उपयोग करने के पीछे का उद्देश्य
चूंकि इंडेक्स फ़ंक्शन पिवट टेबल का प्राथमिक तत्व है, यह डेटा का मूल लेआउट देता है। दूसरे शब्दों में, आप अपने डेटा को इसके साथ समूहीकृत कर सकते हैं अनुक्रमणिका समारोह।
मान लीजिए कि आप में सूचीबद्ध उत्पादों के लिए कुछ समेकित मान देखना चाहते हैं खंड कॉलम। आप निर्दिष्ट कॉलम एनइंडेक्स मान को परिभाषित करके पायथन में एक पूर्व-निर्धारित कुल (माध्य मान) की गणना कर सकते हैं।
df.pivot_table (सूचकांक = "खंड")
कहाँ पे:
- डीएफ:डेटाफ़्रेम जिसमें डेटा शामिल है
- पिवट तालिका:पायथन में पिवट टेबल फंक्शन
- अनुक्रमणिका: कॉलम को इंडेक्स के रूप में परिभाषित करने के लिए इन-बिल्ट फ़ंक्शन
- खंड: सूचकांक मूल्य के रूप में उपयोग करने के लिए कॉलम
पायथन के चर नाम केस-संवेदी हैं, इसलिए इस गाइड में सूचीबद्ध पूर्व-निर्धारित चर नामों से दूर संक्रमण से बचें।
बहु-सूचकांक मानों का उपयोग कैसे करें
जब आप एकाधिक अनुक्रमणिका स्तंभों का उपयोग करना चाहते हैं, तो आप स्तंभ नामों को a. में परिभाषित कर सकते हैं सूची सूचकांक समारोह के भीतर। आपको बस इतना करना है कि के एक सेट के भीतर कॉलम नाम निर्दिष्ट करें वर्ग कोष्ठक ([ ]), नीचे दिखाए गए रूप में:
df.pivot_table (सूचकांक = ["श्रेणी", "उप-श्रेणी"])
पिवट फ़ंक्शन आउटपुट में इंडेक्स कॉलम को इंडेंट करता है। पायथन प्रदर्शित करता है अर्थ प्रत्येक सूचकांक मूल्य के खिलाफ सभी संख्यात्मक मूल्यों की।
आउटपुट में मूल्यों को प्रतिबंधित करना सीखें
चूंकि पायथन डिफ़ॉल्ट रूप से सभी संख्यात्मक कॉलम चुनता है, आप अंतिम आउटपुट में दिखाए गए परिणामों को ट्विक करने के लिए मानों को प्रतिबंधित कर सकते हैं। उपयोग मूल्यों उन स्तंभों को परिभाषित करने के लिए कार्य करें जिन्हें आप देखना चाहते हैं।
df.pivot_table (सूचकांक = ["क्षेत्र", "श्रेणी", "उप-श्रेणी"], मान = "बिक्री")
अंतिम आउटपुट में, तीन इंडेक्स कॉलम होंगे, और प्रत्येक तत्व के खिलाफ बिक्री कॉलम के लिए माध्य मान होंगे।
पिवट तालिका में समग्र कार्यों को परिभाषित करना
क्या होता है जब आप डिफ़ॉल्ट रूप से माध्य मानों की गणना नहीं करना चाहते हैं? पिवट टेबल में कई अन्य कार्य हैं, जो एक साधारण माध्य की गणना से परे हैं।
यहां कोड लिखने का तरीका बताया गया है:
df.pivot_table (सूचकांक = ["श्रेणी"], मान = "बिक्री", aggfunc = [योग, अधिकतम, न्यूनतम, लेन])
कहाँ पे:
- जोड़: मानों के योग की गणना करता है
- अधिकतम: अधिकतम मूल्य की गणना करता है
- मिनट: अधिकतम मूल्य की गणना करता है
- लेन: मूल्यों की गिनती की गणना करता है
आप इनमें से प्रत्येक फ़ंक्शन को कोड की अलग-अलग पंक्तियों में भी परिभाषित कर सकते हैं।
पिवट टेबल में ग्रैंड टोटल कैसे जोड़ें
कोई भी डेटा एसेट बिना कुल योग के पूरा नहीं होता है. प्रति डेटा कॉलम में कुल योग की गणना और प्रदर्शित करने के लिए, का उपयोग करें मार्जिन तथा मार्जिन_नाम समारोह।
df.pivot_table (सूचकांक = ["श्रेणी"], मान = "बिक्री", aggfunc = [योग, अधिकतम, न्यूनतम, लेन], हाशिया = सही, हाशिये_नाम ='ग्रैंड टोटल')
कहाँ पे:
- मार्जिन: कुल योग की गणना के लिए कार्य
- मार्जिन_नाम: इंडेक्स कॉलम में श्रेणी का नाम निर्दिष्ट करें (उदाहरण के लिए, ग्रैंड टोटल)
संशोधित करें और अंतिम कोड का उपयोग करें
यहाँ अंतिम कोड संक्षिप्त है:
आयात पांडा जैसा पी.डी.
#यहां अपने रास्ते से बदलें
पथ = "सी://उपयोगकर्ता//उपयोगकर्ता/वनड्राइव//डेस्कटॉप//"
# आप यहां फ़ाइल नाम परिभाषित कर सकते हैं
फ़ाइल = "नमूना - Superstore.xls"
df = pd.read_excel (पथ + फ़ाइल)
df.pivot_table (सूचकांक = ["क्षेत्र", "श्रेणी", "उप-श्रेणी"], मान = "बिक्री",
aggfunc = [योग, अधिकतम, न्यूनतम, लेन],
मार्जिन =सत्य,
मार्जिन_नाम ='ग्रैंड टोटल')
पायथन में पिवट टेबल बनाना
जब आप पिवट टेबल का उपयोग कर रहे होते हैं, तो विकल्प बस अंतहीन होते हैं। पायथन आपको डेटा विसंगतियों और सिस्टम लैग के बारे में चिंता किए बिना विशाल डेटा सरणियों को आसानी से संभालने देता है।
चूंकि पायथन की कार्यक्षमता केवल डेटा को पिवट में संघनित करने तक ही सीमित नहीं है, आप पाइथन के साथ संबंधित कार्यों की एक श्रृंखला करते समय एकाधिक एक्सेल वर्कबुक और शीट्स को जोड़ सकते हैं।
पायथन के साथ, क्षितिज पर हमेशा कुछ नया होता है।