पायथन, एक भाषा के रूप में, माप से परे मूल्यवान है, खासकर जब आप संरचित डेटा के साथ काम करना चाहते हैं। चूंकि लोग एक्सेल फाइलों में बहुत सारा डेटा स्टोर करते हैं, इसलिए समय और मेहनत बचाने के लिए कई फाइलों को समेकित करना अनिवार्य है।
पायथन आपको ठीक वैसा ही करने देता है; आप चाहे कितनी भी एक्सेल फाइलों को संयोजित करना चाहें, आप इसे सापेक्ष आसानी से कर सकते हैं। पुस्तकालयों और तीसरे पक्ष के संसाधनों की इसकी सीमा को देखते हुए, आप अपनी बोली लगाने के लिए पायथन के बहुआयामी उपकरणों का आयात और उपयोग कर सकते हैं।
इस गाइड में, आपको पंडों के पुस्तकालयों को स्थापित करने और उनका उपयोग करने की आवश्यकता होगी ताकि इसे समेकित करने से पहले पायथन में डेटा आयात किया जा सके।
पायथन में पांडस पुस्तकालय स्थापित करें
पांडा एक तृतीय-पक्ष पुस्तकालय है जिसे आप पायथन में स्थापित कर सकते हैं। कुछ आईडीई में पहले से ही पांडा स्थापित हैं।
यदि आप एक का उपयोग कर रहे हैं आईडीई संस्करण यह पहले से स्थापित पंडों के साथ नहीं आता है, निश्चिंत रहें, आप इसे सीधे पायथन में स्थापित कर सकते हैं।
पंडों को स्थापित करने का तरीका यहां दिया गया है:
पाइप स्थापित पांडा
यदि आप जुपिटर नोटबुक का उपयोग कर रहे हैं, तो आप सीधे पंडों को स्थापित कर सकते हैं पीआईपी कमांड. अधिकतर, जब आपने ज्यूपिटर को एनाकोंडा के साथ स्थापित किया है, तो पंडों के सीधे उपयोग के लिए पहले से ही उपलब्ध होने की उच्च संभावना है।
यदि आप पंडों को कॉल नहीं कर सकते हैं, तो आप उन्हें सीधे स्थापित करने के लिए उपरोक्त कमांड का उपयोग कर सकते हैं।
एक्सेल फाइलों को पायथन के साथ जोड़ना
सबसे पहले, आपको सभी एक्सेल फाइलों के साथ अपने पसंदीदा स्थान पर एक फ़ोल्डर बनाना होगा। एक बार फ़ोल्डर तैयार हो जाने के बाद, आप पुस्तकालयों को आयात करने के लिए कोड लिखना शुरू कर सकते हैं।
आप इस कोड में दो चर का उपयोग करेंगे:
- पांडा: पंडों की लाइब्रेरी एक्सेल फाइलों को स्टोर करने के लिए डेटा फ्रेम प्रदान करती है।
- ओएस: पुस्तकालय आपके मशीन के फ़ोल्डर से डेटा पढ़ने के लिए फायदेमंद है
इन पुस्तकालयों को आयात करने के लिए, इन आदेशों का उपयोग करें:
पंडों को पीडी. के रूप में आयात करें
आयात ओएस
- आयात: पायथन सिंटैक्स का उपयोग पायथन में पुस्तकालयों को आयात करने के लिए किया जाता है
- पांडा: पुस्तकालय का नाम
- पीडी: पुस्तकालय को दिया गया उपनाम
- ओएस: सिस्टम फ़ोल्डर तक पहुँचने के लिए एक पुस्तकालय
एक बार जब आप पुस्तकालयों को आयात कर लेते हैं, तो इनपुट और आउटपुट फ़ाइल पथ को संग्रहीत करने के लिए दो चर बनाएं। फ़ाइलों के फ़ोल्डर तक पहुँचने के लिए इनपुट फ़ाइल पथ की आवश्यकता होती है। आउटपुट फ़ाइल पथ आवश्यक है क्योंकि संयुक्त फ़ाइल वहाँ निर्यात की जाएगी।
यदि आप पायथन का उपयोग कर रहे हैं, तो सुनिश्चित करें कि आपने बैकस्लैश को फ़ॉरवर्ड-स्लैश में बदल दिया है (\ प्रति /)
input_file_path = "सी:/उपयोगकर्ता/गौरव/वनड्राइव/डेस्कटॉप/एक्सेल फ़ाइलें/"
output_file_path = "सी:/उपयोगकर्ता/गौरव/वनड्राइव/डेस्कटॉप/"
संलग्न करें / अंत में भी रास्तों को पूरा करने के लिए।
फ़ोल्डर की फ़ाइलें एक सूची में उपलब्ध हैं। का उपयोग करके इनपुट फ़ोल्डर के सभी फ़ाइल संदर्भों को संग्रहीत करने के लिए एक सूची बनाएं सूचीदिर से समारोह ओएस पुस्तकालय।
यदि आप पुस्तकालय के भीतर उपलब्ध कार्यों के बारे में सुनिश्चित नहीं हैं, तो आप इसका उपयोग कर सकते हैं डिर पुस्तकालय के नाम के साथ कार्य करें। उदाहरण के लिए, listdir फ़ंक्शन के सटीक संस्करण की जांच करने के लिए, आप निम्नानुसार कमांड का उपयोग कर सकते हैं:
डीआईआर (ओएस)
आउटपुट में OS लाइब्रेरी के भीतर उपलब्ध सभी संबद्ध कार्य शामिल होंगे। लिस्टडिर फ़ंक्शन इस लाइब्रेरी के भीतर उपलब्ध कई कार्यों में से एक है।
फ़ोल्डर से इनपुट फ़ाइलों को संग्रहीत करने के लिए एक नया चर बनाएँ।
excel_file_list = os.listdir (input_file_path)
फ़ोल्डर में संग्रहीत फ़ाइलों के नाम देखने के लिए इस चर को प्रिंट करें। एक बार जब आप प्रिंट फ़ंक्शन का उपयोग करते हैं तो फ़ोल्डर में संग्रहीत सभी फाइलें प्रदर्शित होती हैं।
प्रिंट (excel_file_list)
इसके बाद, आपको प्रत्येक एक्सेल फाइल को स्टोर करने के लिए एक नया डेटा फ्रेम जोड़ना होगा। डेटा संग्रहीत करने के लिए एक कंटेनर के रूप में डेटा फ़्रेम की कल्पना करें। यहाँ डेटा फ़्रेम बनाने का आदेश दिया गया है।
डीएफ = पीडी। डेटा ढांचा()
- डीएफ: DataFrame के मान को संग्रहीत करने के लिए चर
- पीडी: के लिए उपनाम पंडों की लाइब्रेरी
- डेटा ढांचा: डेटा फ़्रेम जोड़ने के लिए डिफ़ॉल्ट सिंटैक्स
इनपुट फ़ोल्डर में तीन हैं .xlsx इस उदाहरण में फ़ाइलें। फ़ाइल नाम हैं:
File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx
इस फ़ोल्डर से प्रत्येक फ़ाइल को खोलने के लिए, आपको एक लूप चलाने की आवश्यकता है। लूप ऊपर बनाई गई सूची में से प्रत्येक फ़ाइल के लिए चलेगा।
यहां बताया गया है कि आप इसे कैसे कर सकते हैं:
एक्सेल_फाइल_लिस्ट में एक्सेल_फाइल्स के लिए:
इसके बाद, फ़ाइलों के एक्सटेंशन की जांच करना आवश्यक है क्योंकि कोड केवल XLSX फ़ाइलें खोलेगा। इन फ़ाइलों की जाँच करने के लिए, आप a. का उपयोग कर सकते हैं अगर बयान।
उपयोग इसी के साथ समाप्त होता है इस उद्देश्य के लिए कार्य निम्नानुसार है:
एक्सेल_फाइल_लिस्ट में एक्सेल_फाइल्स के लिए:
अगर excel_files.endswith(.xlsx"):
- एक्सेल_फाइल्स: सभी फ़ाइल मानों के साथ सूची बनाएं
- इसी के साथ समाप्त होता है: फाइलों के विस्तार की जांच करने का कार्य
- (".xlsx"): आप जो खोजना चाहते हैं उसके आधार पर यह स्ट्रिंग मान बदल सकता है
अब जब आपने एक्सेल फाइलों की पहचान कर ली है, तो आप फाइलों को अलग-अलग पढ़ने और स्टोर करने के लिए एक नया डेटा फ्रेम बना सकते हैं।
एक्सेल_फाइल_लिस्ट में एक्सेल_फाइल्स के लिए:
अगर excel_files.endswith(.xlsx"):
df1 = pd.read_excel (input_file_path+excel_files)
- df1: नया डेटा फ्रेम
- पीडी: पंडों की लाइब्रेरी
- read_excel: पंडों पुस्तकालय के भीतर एक्सेल फाइलों को पढ़ने का कार्य
- इनपुट_फाइल_पथ: फ़ोल्डर का पथ जहाँ फ़ाइलें संग्रहीत हैं
- एक्सेल_फाइल्स: लूप के लिए उपयोग किया जाने वाला कोई भी चर
फ़ाइलों को जोड़ना शुरू करने के लिए, आपको इसका उपयोग करने की आवश्यकता है संलग्न समारोह।
एक्सेल_फाइल_लिस्ट में एक्सेल_फाइल्स के लिए:
अगर excel_files.endswith(.xlsx"):
df1 = pd.read_excel (input_file_path+excel_files)
df = df.append (df1)
अंत में, अब समेकित डेटा फ़्रेम तैयार है, आप इसे आउटपुट स्थान पर निर्यात कर सकते हैं। इस स्थिति में, आप डेटा फ़्रेम को XLSX फ़ाइल में निर्यात कर रहे हैं।
df.to_excel (output_file_path+"Consolved_file.xlsx")
- डीएफ: निर्यात करने के लिए डेटाफ़्रेम
- निपुर्ण होना: डेटा निर्यात करने के लिए प्रयुक्त कमांड
- आउटपुट_फाइल_पथ: आउटपुट को स्टोर करने के लिए परिभाषित पथ
- समेकित_फ़ाइल.xlsx: समेकित फ़ाइल का नाम
अब, आइए अंतिम कोड देखें:
#पंडों का उपयोग एक्सेल फाइलों को संभालने के लिए डेटाफ्रेम के रूप में किया जाता है
पीडी. के रूप में आयात पांडा
आयात ओएस# स्लैश को "\" से "/" में बदलें, यदि आप विंडोज डिवाइस का उपयोग कर रहे हैं
input_file_path = "सी:/उपयोगकर्ता/गौरव/वनड्राइव/डेस्कटॉप/एक्सेल फ़ाइलें/"
output_file_path = "सी:/उपयोगकर्ता/गौरव/वनड्राइव/डेस्कटॉप/"# ओएस लाइब्रेरी से listdir फ़ंक्शन का उपयोग करके इनपुट फ़ोल्डर के सभी फ़ाइल संदर्भों को संग्रहीत करने के लिए एक सूची बनाएं।
# लाइब्रेरी की सामग्री देखने के लिए (जैसे लिस्टडिर फंक्शन, आप लाइब्रेरी के नाम पर डीआईआर फंक्शन का इस्तेमाल कर सकते हैं)।
#सामग्री को सूचीबद्ध करने के लिए डीआईआर (लाइब्रेरी_नाम) का उपयोग करेंexcel_file_list = os.listdir (input_file_path)
#सूची को परिभाषित करने के बाद, फ़ोल्डर में संग्रहीत सभी फाइलों को प्रिंट करें
एक्सेल_फाइल_सूची# एक बार प्रत्येक फ़ाइल खुलने के बाद, एकाधिक फ़ाइलों में संग्रहीत डेटा को समेकित करना प्रारंभ करने के लिए परिशिष्ट फ़ंक्शन का उपयोग करें
#एक्सेल फ़ाइल आयात को संभालने के लिए एक नया, रिक्त डेटाफ़्रेम बनाएं
डीएफ = पीडी। डेटा ढांचा()#सूची में प्रत्येक फ़ाइल के माध्यम से लूप के लिए लूप के लिए चलाएँ
एक्सेल_फाइल_लिस्ट में एक्सेल_फाइल्स के लिए:
#केवल .xlsx प्रत्यय फाइलों की जांच करें
अगर excel_files.endswith(.xlsx"):
#ऊपर बनाई गई फाइलों की सूची से प्रत्येक एक्सेल फाइल को पढ़ने/खोलने के लिए एक नया डेटाफ्रेम बनाएं
df1 = pd.read_excel (input_file_path+excel_files)
#प्रत्येक फ़ाइल को मूल खाली डेटाफ़्रेम में जोड़ें
df = df.append (df1)
#आउटपुट पथ पर अंतिम आउटपुट को एक्सेल (xlsx) फ़ाइल में स्थानांतरित करें
df.to_excel (output_file_path+"Consolved_file.xlsx")
एकाधिक एक्सेल कार्यपुस्तिकाओं को संयोजित करने के लिए पायथन का उपयोग करना
Python's Pandas शुरुआती और उन्नत उपयोगकर्ताओं के लिए समान रूप से एक उत्कृष्ट उपकरण है। पुस्तकालय का उपयोग डेवलपर्स द्वारा बड़े पैमाने पर किया जाता है जो पायथन में महारत हासिल करना चाहते हैं।
यहां तक कि अगर आप एक नौसिखिया हैं, तो आप पंडों की बारीकियों और पायथन के भीतर पुस्तकालय का उपयोग करने के तरीके को सीखकर बहुत लाभ उठा सकते हैं।
इन शुरुआती ऑपरेशनों के साथ पंडों को फांसी दें।
आगे पढ़िए
- प्रोग्रामिंग
- अजगर
- Microsoft Excel
- स्प्रेडशीट
गौरव सियाल के पास डिजिटल मार्केटिंग फर्मों और सॉफ्टवेयर जीवनचक्र दस्तावेजों की एक श्रृंखला के लिए लेखन का दो साल का अनुभव है।
हमारे न्यूज़लेटर की सदस्यता लें
तकनीकी युक्तियों, समीक्षाओं, निःशुल्क ई-पुस्तकों और अनन्य सौदों के लिए हमारे न्यूज़लेटर से जुड़ें!
सब्सक्राइब करने के लिए यहां क्लिक करें