एक सुबह की कल्पना करें जहां आप एक गर्म कप ताज़ी कॉफी की चुस्की ले रहे हों, और आपका कंप्यूटर आपको नवीनतम सुर्खियाँ पढ़ता है—सब कुछ अपने आप। क्या यह आश्चर्यजनक नहीं लगता?
ठीक है, पायथन के साथ, आप अपना खुद का, वैयक्तिकृत न्यूज़रीडर बना सकते हैं, जो प्रत्येक शीर्षक के अंशों के साथ-साथ आपके लिए सभी शीर्ष सुर्खियों को पढ़ेगा। हाँ यह सही है। सही पुस्तकालयों का उपयोग करके, आप एक-एक शब्द को स्वयं पढ़े बिना, पायथन को अपनी सुबह की सभी दिनचर्याएँ कर सकते हैं।
यहां बताया गया है कि आप इस कोड को कैसे लिख सकते हैं और इसे अपनी पसंदीदा समाचार वेबसाइट में बदल सकते हैं।
कोड चलाने के लिए पूर्व-आवश्यकताएँ
इससे पहले कि आप कूदें और कोड लिखना शुरू करें, आपको कुछ पूर्व-आवश्यकताएं पूरी करनी होंगी। ये कुछ बहुत ही बुनियादी आवश्यकताएं हैं, जो पायथन के उपयोग को आसान और अधिक प्रभावी बना सकती हैं।
- अजगर: पायथन का नवीनतम संस्करण स्थापित करना एक अच्छा निर्णय होगा। सर्वोत्तम परिणामों के लिए आप कोई भी Python IDE स्थापित कर सकते हैं।
- समाचार वेबसाइट/इंटरनेट एक्सेस: चूंकि पायथन कोड आपकी पसंदीदा वेबसाइट से शीर्ष सुर्खियों को पढ़ता है, इसलिए आपको यह सुनिश्चित करने की आवश्यकता है कि आप इस कोड को चलाते समय वेबसाइट तक पहुंच सकते हैं।
संपूर्ण कोड जुपिटर नोटबुक में लिखा गया है, जो एक लोकप्रिय है पायथन आईडीई इस गाइड के लिए। इसके अतिरिक्त, इंडिया टुडे की समाचार वेबसाइट को नमूना कोड में कोडित किया गया है।
Jupyter नोटबुक डाउनलोड करने के लिए, आप या तो इसे एनाकोंडा पैकेज के एक भाग के रूप में उपयोग कर सकते हैं, या अपने सिस्टम पर एक स्टैंडअलोन संस्करण डाउनलोड कर सकते हैं।
डाउनलोड:एनाकोंडा | जुपिटर नोटबुक
आगे की हलचल के बिना, आइए कोड में गहराई से उतरें।
पायथन में कोड लिखना
शुरू करने के लिए, आपको कुछ पायथन पुस्तकालयों को आयात करने की आवश्यकता है, प्रत्येक अलग-अलग उद्देश्यों की पूर्ति करता है।
win32com.client को wincl के रूप में आयात करें
urllib.request से urlopen को ureq के रूप में आयात करें
bs4 से सूप के रूप में सुंदर सूप आयात करें
सपा = wincl. डिस्पैच ("SAPI.spVoice")
कहां:
- win32com.क्लाइंट: यह लाइब्रेरी विंडोज डिवाइस के साथ इंटरैक्ट करती है और पाइथन प्रोग्राम को निर्बाध रूप से चलाती है।
- urllib.अनुरोध: यह पुस्तकालय अनुरोध मॉड्यूल से URL मानों को संभालता है।
- बीएस4: BS4 लाइब्रेरी में ब्यूटीफुल सूप फंक्शन शामिल है, जो पायथन का उपयोग करके वेबसाइटों से डेटा को स्क्रैप करता है।
- सपा = wincl. डिस्पैच ("SAPI.spVoice"): विंडोज़ में वॉयस कमांड सक्रिय करें।
यह कोड केवल विंडोज़ पर काम करेगा, क्योंकि आप win32.com.client लाइब्रेरी को कॉल कर रहे होंगे।
इसके बाद, आपको वेबसाइट के URL (लिंक) को परिभाषित करने की आवश्यकता है यूआरएल वेरिएबल, जो पायथन की मेमोरी में स्टोर होता है।
यूआरएल = https://www.indiatoday.in/top-stories
URL ओपनिंग कमांड को स्टोर करने के लिए एक नया वेरिएबल क्लाइंट बनाएं।
ग्राहक = यूरेक (यूआरएल)
प्रिंट (क्लाइंट)
कहाँ पे:
- ग्राहक: नया चर।
- यूरेक: urllib.request से आयात किया गया पायथन फ़ंक्शन, जो संग्रहीत url को खोलता है।
चूंकि आपने स्मृति में URL खोला है, यह जांचने का समय है कि क्या विचाराधीन वेबसाइट पायथन के माध्यम से असुरक्षित कनेक्शन की अनुमति देती है। आप क्लाइंट वैरिएबल को प्रिंट कर सकते हैं और आउटपुट की जांच कर सकते हैं।
प्रिंट कमांड के साथ दो संभावनाएं हैं:
- एच टी टी पी त्रुटि: जब कोई वेबसाइट सुरक्षित होती है, तो आप पायथन का उपयोग करके सामग्री को परिमार्जन नहीं कर सकते।
- सांकेतिक टुकड़ा: यदि वेबसाइट चलाने के बाद कोई कोड स्निपेट लौटाया जाता है, तो मान लें कि आप आसानी से सुर्खियां बटोर सकते हैं।
एक बार जब आप URL कमांड के भीतर समाचार वेबसाइट के URL को परिभाषित कर लेते हैं, तो HTML कोड को एक चर में आयात करने का समय आ जाता है।
पेज_एचटीएमएल = क्लाइंट.रीड ()
प्रिंट (पेज_एचटीएमएल)
एहतियात के तौर पर आपको वेबसाइट के HTML कोड को Python में इम्पोर्ट किया गया प्रिंट करना होगा। आप इस कोड का मिलान इसके अंतर्गत उपलब्ध वेबसाइट कोड से भी कर सकते हैं निरीक्षण विकल्प।
कोड को कनवर्ट करने से पहले, आपको क्लोज़ कमांड का उपयोग करके वेबसाइट को पायथन की मेमोरी से बंद करना होगा।
क्लाइंट.क्लोज़ ()
चूंकि आपके पास HTML कोड को पायथन वेरिएबल में आयात किया गया है, इसलिए आपको इसे लागू करने के लिए इसे पायथन पठनीय प्रारूप में बदलने की आवश्यकता है पाना तथा सब ढूँढ़ो खोजशब्दों को देखने के लिए आदेश।
HTML कोड को कन्वर्ट करने के लिए आप निम्न कमांड पास कर सकते हैं:
पेज_सूप = सूप (पेज_एचटीएमएल, "एचटीएमएल.पार्सर")
कहां:
- पेज_सूप: नया चर।
- सूप: के लिए उपनाम सुंदर सूप मॉड्यूल.
- पेज_एचटीएमएल: वेरिएबल जिसमें वेबसाइट से एचटीएमएल कोड होता है।
- html_पार्सर: HTML कोड को कनवर्ट करने के लिए डिफ़ॉल्ट सिंटैक्स।
एक बार कोड उपयोग के लिए तैयार हो जाने के बाद, शीर्षक कीवर्ड की तलाश शुरू करने के लिए वेबसाइट HTML कोड की जांच करने का समय आ गया है।
ऐसा करने के लिए, वेबसाइट पर कहीं भी राइट-क्लिक करें, और निरीक्षण पर क्लिक करें। इससे विचाराधीन वेबसाइट का HTML कोड खुल जाएगा।
वेबसाइट की कोड विंडो पर, चारों ओर स्क्रॉल करें, जब तक कि आप हेडलाइन को स्टोर करने वाले कंटेनर टैग का पता नहीं लगा लेते।
ये के भीतर समाहित हैं दृश्य-सामग्री इंडिया टुडे वेबसाइट पर टैग। प्रत्येक समाचार वेबसाइट के कंटेनर अलग-अलग होते हैं, लेकिन आपको कोड के माध्यम से सापेक्ष आसानी से नेविगेट करने में सक्षम होना चाहिए।
article = page_soup.find("div", { "class": "view-content" })
अंत में, आपको उप-टैग को कैप्चर करने की आवश्यकता है, जिसमें मुख्य शीर्षक शामिल हैं जिन्हें पायथन आपको पढ़ रहा होगा।
article = article.findAll("div", {"class": "catagory-listing"})
दृश्य-सामग्री कंटेनर में एकाधिक शीर्षक होंगे, आपके शीर्षकों के लिए बाहरी आवरण।
H2 टैग और प्रत्येक शीर्षक के साथ सूचीबद्ध स्निपेट को कैप्चर करने के लिए, आपको एक लूप चलाने की आवश्यकता है।
मैं = 1
लेखों में x के लिए:
शीर्षक = x.find("h2").text
पैरा = x.find("p").text
प्रिंट (i, शीर्षक, "
", "
", पैरा,"
", "
")
सपा बोलो (शीर्षक)
सपा बोलो (पैरा)
मैं=मैं+1
कहां:
- मैं: नया काउंटर वैरिएबल, जो ऑटो-इन्क्रिमेंटेड होगा।
- शीर्षक: हेडलाइन को सेव करने के लिए नया वेरिएबल (h2)।
- पैरा: प्रत्येक H2 से जुड़े अनुच्छेदों को धारण करने के लिए नया चर।
- प्रिंट: शीर्षक और पैरा का शीर्षक पायथन इंटरफ़ेस पर मुद्रित किया जाएगा।
- सपा बोलो (शीर्षक): पायथन प्रत्येक संग्रहीत शीर्षक को पढ़ेगा।
- सपा बोलो (पैरा): पायथन प्रत्येक संग्रहीत अनुच्छेद स्निपेट को पढ़ेगा।
- मैं = मैं+1: यह कमांड पायथन के इंटरफेस पर प्रदर्शित प्रत्येक शीर्षक से जुड़े सीरियल नंबर को ऑटो-इन्क्रीमेंट करता है।
अपने दैनिक समाचार पढ़ने के लिए पायथन के सुंदर सूप मॉड्यूल का उपयोग करना
हर बार जब आप कोड चलाते हैं, तो जोर से पढ़े जाने से पहले समाचार वेबसाइट से ताजा सुर्खियां डाउनलोड की जाएंगी। हर बार जब आप कोड का सेट चलाते हैं, तो पायथन कोड को निष्पादित करता है, जिससे आप वेबसाइट पर होने वाले परिवर्तनों से अपडेट रहते हैं।
जब तक आप कोड को रीफ़्रेश और रीरन नहीं करते तब तक पुराने हेडलाइन को पायथन द्वारा प्रदर्शित और पढ़ा जाना जारी रहेगा।
अपनी दैनिक सुर्खियों को पढ़ने के लिए पायथन का उपयोग करना आसान है
पायथन, एक ओपन-सोर्स भाषा के रूप में, शुरुआती और उन्नत उपयोगकर्ताओं को समान रूप से सुंदर सूप, सेलेनियम और अन्य ढांचे जैसे उपकरणों की एक श्रृंखला प्रदान करता है।
यदि आप अपने दैनिक समाचारों को आवाज से पहुंचाना चाहते हैं, तो पायथन इसे आसान बनाता है। इस विशेष भाषा को सीखने से आपको सभी क्षेत्रों में एक बेहतर प्रोग्रामर बनने में मदद मिल सकती है।
चाहे आपको डेटा साइंस, मशीन लर्निंग, वेब डेवलपमेंट, या बीच में किसी भी चीज़ के लिए पायथन टूल्स की आवश्यकता हो, इस सूची में आपको शामिल किया गया है।
आगे पढ़िए
- प्रोग्रामिंग
- अजगर
- समाचार
- कंप्यूटर टिप्स
- प्रोग्रामिंग
गौरव सियाल के पास डिजिटल मार्केटिंग फर्मों और सॉफ्टवेयर जीवनचक्र दस्तावेजों की एक श्रृंखला के लिए लेखन का दो साल का अनुभव है।
हमारे न्यूज़लेटर की सदस्यता लें
तकनीकी युक्तियों, समीक्षाओं, निःशुल्क ई-पुस्तकों और अनन्य सौदों के लिए हमारे न्यूज़लेटर से जुड़ें!
सब्सक्राइब करने के लिए यहां क्लिक करें