बड़ी डेटा संपत्तियां गड़बड़ हैं, खासकर जब आपको उन्हें वेबसाइटों, सर्वरों या अन्य डेटा स्रोतों से खींचना पड़ता है।

एमएस एक्सेल जैसे यूआई-आधारित एप्लिकेशन सरल डेटा सेट से निपटने के लिए अच्छे हैं, लेकिन जब डेटा बड़ा हो जाता है तो संघर्ष कर सकते हैं। अधिक जटिल डेटा-आधारित संचालन करने के लिए आपके लिए पायथन में जाने का यह एक अच्छा कारण है।

पायथन की थर्ड-पार्टी लाइब्रेरी, पंडों, आपके मौजूदा डेटासेट को जल्दी से सॉर्ट करने में आपकी मदद करने में एक लंबा रास्ता तय करती है। यदि आप अपने डेटा को पायथन में क्रमबद्ध करना चाहते हैं, तो यह लेख इस कार्य को प्राप्त करने के कुछ तरीकों को देखता है।

डेटा को सॉर्ट करने के लिए पायथन का उपयोग करने के लिए आवश्यक शर्तें

पायथन में अपने डेटा को सॉर्ट करने से पहले, आपको कुछ पूर्वापेक्षाओं का ध्यान रखना होगा:

  • एक पायथन आईडीई डाउनलोड करें. आप एक का उपयोग कर सकते हैं पायथन-संगत आईडीई, जैसे कि जुपिटर नोटबुक, पाइचर्म और स्पाइडर, दूसरों के बीच में। इनमें से प्रत्येक सभी पायथन संस्करणों के साथ संगत है।
  • पांडा स्थापित करें. आपको पांडा पैकेज की आवश्यकता होगी जो आप कर सकते हैं पीआईपी का उपयोग करके स्थापित करें या आपकी पसंदीदा विधि।
  • नमूना डेटासेट. डाउनलोड करें नमूना डाटासेट सूचीबद्ध कोड का अभ्यास करने के लिए। वैकल्पिक रूप से, आप इन प्रक्रियाओं का उपयोग अपने अनन्य डेटा पर कर सकते हैं।

पायथन में पंडों की लाइब्रेरी आयात करना

पांडा एक तृतीय-पक्ष पायथन लाइब्रेरी है जिसका उपयोग आप एक्सेल, सीएसवी और अन्य डेटा प्रारूपों को संभालने के लिए कर सकते हैं।

एक नमूना एक्सेल फ़ाइल के साथ काम करने के लिए, पांडा पुस्तकालय को आयात करके शुरू करें। उसके बाद, आप का उपयोग करेंगे एक्सेल डेटा को पायथन में पढ़ने के लिए आयात प्रक्रिया.

पुस्तकालय आयात करने के लिए

आयात पांडा जैसा पी.डी.

एक्सेल डेटा लोड करने के लिए एक नया डेटाफ्रेम बनाएं

फ़ाइल = "नमूना - Superstore.xls"
df = pd.read_excel (फ़ाइल)
डीएफ।सिर()

कहाँ पे:

  • डीएफ एक DataFrame ऑब्जेक्ट है जो आयातित डेटा को संग्रहीत करता है।
  • पी.डी. पंडों पुस्तकालय के लिए एक उपनाम है।
  • read_excel एक्सेल फ़ाइल को पायथन में पढ़ने की एक विधि है।
  • फ़ाइल एक्सेल फ़ाइल का पथ है।
  • सिर एक विधि है जो डेटाफ़्रेम से पहली पाँच पंक्तियाँ लौटाती है।

एक बार जब आपका प्रोग्राम डेटा लोड कर लेता है, तो आप इसे विभिन्न तरीकों से सॉर्ट करने के लिए कई उपलब्ध डेटाफ़्रेम विधियों का उपयोग कर सकते हैं।

1. डेटाफ़्रेम में एकल कॉलम के आधार पर छाँटना

चूंकि आपके डेटा में बहुत सारी पंक्तियाँ और कॉलम होंगे, आप अक्सर किसी विशिष्ट कॉलम या कॉलम के आधार पर डेटा को सॉर्ट करना चाहेंगे।

पायथन डिफ़ॉल्ट रूप से डेटा को आरोही क्रम में क्रमबद्ध करता है। यदि आप छँटाई क्रम बदलना चाहते हैं, तो आपको अपने कोड में इसका स्पष्ट रूप से उल्लेख करना होगा।

एकल कॉलम के आधार पर छाँटें (आरोही क्रम)

df.sort_values ​​​​(द्वारा = "ग्राहक आईडी, ग्राहक पहचान")

एकल कॉलम के आधार पर छाँटें (अवरोही क्रम)

ठीक आरोही करने के लिए पैरामीटर असत्य अपने कॉलम को अवरोही क्रम में क्रमबद्ध करने के लिए।

df.sort_values ​​​​(द्वारा = "ग्राहक आईडी, ग्राहक पहचान", आरोही = असत्य)

कहाँ पे:

  • डीएफ डेटा युक्त डेटाफ़्रेम ऑब्जेक्ट है।
  • सॉर्ट_वैल्यू डेटा मानों के आधार पर छाँटने की एक विधि है।
  • द्वारा कॉलम नाम को परिभाषित करने के लिए एक पैरामीटर है।
  • आरोही छँटाई क्रम को परिभाषित करने के लिए एक पैरामीटर है।

2. डेटाफ़्रेम में एकाधिक स्तंभों को छाँटना

यदि आपकी आवश्यकताएँ इसके लिए आवश्यक हैं, तो आप एक साथ कई कॉलमों के आधार पर अपने डेटाफ़्रेम को भी सॉर्ट कर सकते हैं। ऐसे परिदृश्य में, आपको सूची में कॉलम संदर्भों को परिभाषित करना होगा।

आरोही अनेक स्तंभों के आधार पर छाँटें

df.sort_values ​​(द्वारा = ["ग्राहक आईडी, ग्राहक पहचान", "शहर"])

अवरोही अनेक स्तंभों के आधार पर छाँटें

फ़ंक्शन का उपयोग करें आरोही = असत्य अपने कॉलम को अवरोही क्रम में क्रमबद्ध करने के लिए। याद रखें, आपको एक साथ क्रमित करने के लिए किसी सूची में स्तंभों के नाम निर्दिष्ट करने होंगे।

df.sort_values ​​(द्वारा = ["ग्राहक आईडी, ग्राहक पहचान", "शहर"], आरोही = असत्य)

अलग-अलग क्रम में कई कॉलमों के आधार पर छाँटना

रास्ते से बाहर छँटाई की मूल बातें के साथ, क्या होता है जब आप एक कॉलम को अवरोही क्रम में और दूसरे को आरोही क्रम में क्रमबद्ध करना चाहते हैं? इन आवश्यकताओं को शामिल करने के लिए आपको अपने कोड में थोड़ा बदलाव करना होगा।

उदाहरण के लिए, सॉर्ट करने के लिए क्षेत्र तथा शहर क्रमशः अवरोही और आरोही क्रम में कॉलम:

df.sort_values ​​(द्वारा = ["क्षेत्र", "शहर"], आरोही = [गलत, सही])

इस कोड की व्याख्या सरल है; आप DataFrame नाम को परिभाषित करते हैं और पास करते हैं सॉर्ट_वैल्यू सूची में कॉलम नामों के साथ कार्य करें। आपको उपयोग करना चाहिए बूलियन सॉर्ट ऑर्डर निर्दिष्ट करने के लिए मान।

फ़ंक्शन को इस तरह से कॉल करने का अर्थ है कि पायथन डेटाफ़्रेम के क्षेत्र कॉलम द्वारा अवरोही क्रम में क्रमबद्ध करेगा, पहले। फिर, समान क्षेत्र वाली पंक्तियों को सिटी कॉलम द्वारा आरोही क्रम में और क्रमबद्ध किया जाएगा।

3. इंडेक्स द्वारा डेटाफ्रेम में कॉलम कैसे सॉर्ट करें

इंडेक्स वेरिएबल पायथन डेटाफ्रेम के भीतर प्रत्येक पंक्ति को निर्दिष्ट डिफ़ॉल्ट मान है। आप इंडेक्स वैल्यू को परिभाषित कर सकते हैं या पायथन को अपने आप एक इंडेक्स वैल्यू सेट करने दे सकते हैं।

डेटा को उसके इंडेक्स वैल्यू के आधार पर सॉर्ट करने के लिए, आप इसका उपयोग कर सकते हैं सॉर्ट_इंडेक्स समारोह। यह फ़ंक्शन मूल डेटासेट में निहित किसी भी मान के बजाय अनुक्रमणिका के आधार पर सॉर्ट करता है।

डीएफ.sort_index()

Sort_values ​​​​के साथ, आप एक पास कर सकते हैं आरोही प्रकार की दिशा निर्दिष्ट करने के लिए पैरामीटर। उदाहरण के लिए, का मान पास करें असत्य डेटा को अवरोही क्रम में क्रमबद्ध करने के लिए:

df.sort_index (आरोही = असत्य)

4. पंक्तियों के बजाय डेटाफ़्रेम में स्तंभों को छाँटना

डेटाफ़्रेम में पंक्तियों को सॉर्ट करने के बजाय, आप इसके कॉलम को सॉर्ट कर सकते हैं। आप सॉर्ट_इंडेक्स विधि को कॉल करके और इसे पास करके ऐसा कर सकते हैं एक्सिस के मान के साथ पैरामीटर 1:

df.sort_index (अक्ष = 1)

यह चरण DataFrame को उसके कॉलम के अनुसार आरोही क्रम में सॉर्ट करता है। DataFrame के कॉलम को अवरोही क्रम में सॉर्ट करने के लिए, आप अपने सॉर्ट चरण में सॉर्टिंग ऑर्डर निर्दिष्ट कर सकते हैं।

df.sort_index (अक्ष =1, आरोही = असत्य)

5. डेटाफ़्रेम को सॉर्ट करते समय संशोधित करना

दो प्रकार की विधियाँ मूल डेटा की एक प्रति, उसकी नई क्रमबद्ध स्थिति में लौटाकर काम करती हैं। भंडारण स्थान बचाने के लिए, या बस अधिक संक्षिप्त कोड लिखने के लिए, आप इसके बजाय मूल डेटाफ़्रेम डेटा को संशोधित कर सकते हैं। प्रत्येक विधि स्वीकार करती है a जगह में बूलियन पैरामीटर जो संशोधित प्रति को वापस करने के बजाय डेटा को संशोधित करता है।

df.sort_values ​​(द्वारा = ["ग्राहक आईडी, ग्राहक पहचान", "शहर"], आरोही = असत्य, इनप्लेस = सत्य)

पायथन में डेटा सॉर्ट करना सीखना

पायथन एक्सेल के कई अंतर्निहित कार्यों को कोड की कुछ पंक्तियों के साथ दोहराता है। छँटाई प्रक्रियाओं से लेकर आपके डेटा पर विस्तृत पिवट टेबल बनाने तक, आप इसे नाम देते हैं, और आप इसे पायथन में कर सकते हैं।

यदि आप अभी भी पायथन के लिए नए हैं और रस्सियों को सीख रहे हैं, तो ये कदम आपके कोडिंग कौशल को अपेक्षाकृत आसानी से बढ़ाएंगे।