इंस्टाग्राम अरबों उपयोगकर्ताओं के साथ सबसे लोकप्रिय सोशल मीडिया साइटों में से एक है। स्टूडेंट्स से लेकर सेलिब्रिटीज तक सभी के इंस्टाग्राम अकाउंट हैं। Instagram का सार्वजनिक डेटा व्यवसायों, विपणक और व्यक्तियों के लिए अत्यधिक मूल्यवान हो सकता है। कोई भी इस डेटा का उपयोग डेटा विश्लेषण, लक्ष्य विपणन और अंतर्दृष्टि उत्पन्न करने के लिए कर सकता है।

आप एक स्वचालित उपकरण बनाने के लिए पायथन का उपयोग कर सकते हैं जो इंस्टाग्राम डेटा को निकालता है।

आवश्यक पुस्तकालय स्थापित करना

इंस्टालोडर एक Python लाइब्रेरी है जिसका उपयोग आप Instagram से सार्वजनिक रूप से उपलब्ध डेटा निकालने के लिए कर सकते हैं। आप छवियों, वीडियो, उपयोगकर्ता नाम, संख्या जैसे डेटा तक पहुंच सकते हैं। पदों की संख्या, अनुयायियों की गिनती, निम्नलिखित गिनती, जैव, आदि। इंस्टालोडर का उपयोग करना। ध्यान दें कि इंस्टालोडर किसी भी तरह से इंस्टाग्राम द्वारा संबद्ध, अधिकृत, अनुरक्षित या समर्थित नहीं है।

पाइप के माध्यम से इंस्टालोडर स्थापित करने के लिए, निम्नलिखित कमांड चलाएँ:

रंज स्थापित करना instaloader

आपको होना आवश्यक है आपके सिस्टम पर पाइप स्थापित है बाहरी पायथन पुस्तकालयों को स्थापित करने के लिए।

instagram viewer

अगला, आपको पंडों पायथन पुस्तकालय को स्थापित करने की आवश्यकता है। पांडा एक पायथन लाइब्रेरी है जिसका उपयोग मुख्य रूप से डेटा हेरफेर और डेटा विश्लेषण करने के लिए किया जाता है। इसे स्थापित करने के लिए निम्न कमांड चलाएँ:

रंज स्थापित करना पांडा

अब, आप कोड सेट करना शुरू करने और Instagram से डेटा लाने के लिए तैयार हैं।

अपना कोड सेट करना

इंस्टाग्राम डेटा फ़ेचिंग टूल को सेट करने के लिए, आपको इंस्टालोडर पायथन लाइब्रेरी को आयात करने और इंस्टालोडर क्लास का एक उदाहरण बनाने की आवश्यकता है। उसके बाद, आपको उस प्रोफ़ाइल का इंस्टाग्राम हैंडल प्रदान करना होगा जिससे आप डेटा निकालना चाहते हैं।

इंस्टाग्राम एक्सट्रैक्टर पायथन कोड एक में उपलब्ध है गिटहब रिपॉजिटरी और आपके लिए एमआईटी लाइसेंस के तहत उपयोग करने के लिए स्वतंत्र है।

आयात instaloader

# इंस्टालोडर वर्ग का एक उदाहरण बनाना
बॉट = इंस्टालोडर। इंस्टालोडर ()

# इंस्टाग्राम हैंडल से प्रोफाइल लोड करना
प्रोफाइल = इंस्टालोडर। Profile.from_username (bot.context, 'क्रिस्टियानो')
छपाई(प्रोफ़ाइल)

मूलभूत कार्यों की जांच करने के लिए यह एक अच्छा पहला कदम है। आपको बिना किसी त्रुटि के कुछ अर्थपूर्ण डेटा दिखाई देने चाहिए:

प्रोफ़ाइल से डेटा निकालना

आप मूल्यवान सार्वजनिक रूप से उपलब्ध डेटा जैसे उपयोगकर्ता नाम, नहीं निकाल सकते हैं। कोड की कुछ पंक्तियों के साथ इंस्टालोडर का उपयोग करते हुए पोस्ट, फॉलोअर्स की संख्या, फॉलोइंग काउंट, बायो, यूजर आईडी और बाहरी URL। आपको केवल प्रोफ़ाइल का Instagram हैंडल प्रदान करना होगा।

आयात instaloader
आयात पांडा जैसा पी.डी.

# इंस्टालोडर वर्ग का एक उदाहरण बनाना
बॉट = इंस्टालोडर। इंस्टालोडर ()

# इंस्टाग्राम हैंडल से प्रोफाइल लोड करना
प्रोफाइल = इंस्टालोडर। Profile.from_username (bot.context, 'लियो मेस्सी')
प्रिंट ("उपयोगकर्ता नाम: ", प्रोफ़ाइल.उपयोगकर्ता नाम)
प्रिंट ("उपयोगकर्ता पहचान: ", profile.userid)
प्रिंट ("पदों की संख्या: ", प्रोफ़ाइल.मीडियाकाउंट)
प्रिंट ("अनुयायियों की संख्या: ", प्रोफाइल। अनुयायी)
प्रिंट ("निम्नलिखित गणना: ", प्रोफ़ाइल.अनुयायी)
प्रिंट ("जैव: ", प्रोफ़ाइल.जीवनी)
प्रिंट ("बाहरी यूआरएल: ", प्रोफ़ाइल.external_url)

आपके द्वारा निर्दिष्ट हैंडल से आपको बहुत सारी प्रोफ़ाइल जानकारी दिखाई देनी चाहिए:

बायो से ईमेल निकालना

आप किसी भी प्रोफाइल के इंस्टा बायो से ईमेल एड्रेस निकाल सकते हैं नियमित अभिव्यक्ति. आपको पायथन का आयात करने की आवश्यकता है दोबारा पुस्तकालय और ईमेल को एक पैरामीटर के रूप में मान्य करने के लिए नियमित अभिव्यक्ति पास करें re.findall () तरीका:

आयात instaloader
आयात दोबारा
# इंस्टालोडर क्लास का एक उदाहरण बनाना
बॉट = इंस्टालोडर। इंस्टालोडर ()
प्रोफाइल = इंस्टालोडर। Profile.from_username (bot.context, "संपत्ति")
प्रिंट ("उपयोगकर्ता नाम: ", प्रोफ़ाइल.उपयोगकर्ता नाम)
प्रिंट ("जैव: ", प्रोफ़ाइल.जीवनी)
ईमेल = re.findall (आर"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", प्रोफ़ाइल.जीवनी)
प्रिंट ("ईमेल निकाले गए से जैव:")
छपाई(ईमेल)

स्क्रिप्ट बायो में एक ईमेल पते के रूप में पहचानी जाने वाली किसी भी चीज़ को प्रिंट करेगी:

शीर्ष खोज परिणाम डेटा निकालना

जब आप Instagram पर कुछ भी खोजते हैं, तो आपको यूज़रनेम और हैशटैग सहित कई परिणाम मिलते हैं। आप का उपयोग करके शीर्ष खोज परिणाम निकाल सकते हैं get_profiles () और get_hashtags () तरीके। आपको केवल खोज क्वेरी प्रदान करने की आवश्यकता है instaloader. शीर्ष खोज परिणाम () तरीका। इसके अलावा, आप अलग-अलग परिणामों को दोहरा सकते हैं और प्रिंट/स्टोर कर सकते हैं।

आयात instaloader

# इंस्टालोडर वर्ग का एक उदाहरण बनाना
बॉट = इंस्टालोडर। इंस्टालोडर ()

# यहां खोज क्वेरी प्रदान करें
search_results = इंस्टालोडर. TopSearchResults (bot.context, 'संगीत')

# निकाले गए उपयोगकर्ता नामों पर ध्यान देना
के लिएउपयोगकर्ता नाममेंखोज के परिणाम.get_profiles():
छपाई(उपयोगकर्ता नाम)

# निकाले गए हैशटैग पर ध्यान देना
के लिएहैशटैगमेंखोज के परिणाम.get_hashtags():
छपाई(हैशटैग)

आउटपुट में कोई भी मिलान करने वाले उपयोगकर्ता नाम और हैशटैग शामिल होंगे:

एक खाते के अनुयायियों और अनुसरण को निकालना

आप इंस्टालोडर का उपयोग करके किसी खाते के अनुयायियों को निकाल सकते हैं, और जो इसे स्वयं अनुसरण करते हैं। इस डेटा को पुनः प्राप्त करने के लिए आपको एक Instagram उपयोगकर्ता नाम और पासवर्ड प्रदान करना होगा।

इंस्टाग्राम से डेटा निकालने के लिए कभी भी अपने व्यक्तिगत खातों का उपयोग न करें क्योंकि इससे आपका खाता अस्थायी या स्थायी रूप से प्रतिबंधित हो सकता है।

इंस्टालोडर वर्ग का एक उदाहरण बनाने के बाद, आपको अपना उपयोगकर्ता नाम और पासवर्ड प्रदान करना होगा। ऐसा इसलिए है ताकि बॉट आपके अकाउंट का उपयोग करके इंस्टाग्राम में लॉग इन कर सके और फॉलोअर्स और फॉलोइंग डेटा प्राप्त कर सके।

अगला, आपको लक्ष्य प्रोफ़ाइल का Instagram हैंडल प्रदान करना होगा। अनुयायियों को प्राप्त करें() और get_followees () विधियाँ अनुयायियों और अनुयायियों को निकालती हैं। आप का उपयोग करके अनुयायियों और अनुयायियों के उपयोगकर्ता नाम प्राप्त कर सकते हैं अनुयायी उपयोगकर्ता नाम और फ़ॉलो करें। उपयोगकर्ता नाम गुण क्रमशः।

यदि आप परिणामों को CSV फ़ाइल में संग्रहीत करना चाहते हैं, तो आपको पहले डेटा को पांडा डेटाफ़्रेम ऑब्जेक्ट में बदलना होगा। उपयोग पीडी। डेटा ढांचा() सूची ऑब्जेक्ट को डेटाफ़्रेम में बदलने की विधि।

अंत में, आप DataFrame ऑब्जेक्ट को CSV फ़ाइल में निर्यात कर सकते हैं to_csv () तरीका। आपको पास करने की जरूरत है फ़ाइलनाम.सीएसवी CSV फ़ाइल स्वरूप में निर्यात किए गए डेटा को प्राप्त करने के लिए इस विधि के एक पैरामीटर के रूप में।

केवल खाता स्वामी ही सभी अनुयायियों और अनुसरण को देख सकते हैं। आप इस या किसी अन्य विधि का उपयोग करके सभी अनुयायियों और अनुवर्ती डेटा को निकालने में सक्षम नहीं होंगे।

# पुस्तकालयों का आयात करना
आयात instaloader
आयात पांडा जैसा पी.डी.

# इंस्टालोडर वर्ग का एक उदाहरण बनाना
बॉट = इंस्टालोडर। इंस्टालोडर ()
बॉट.लॉगिन (उपयोगकर्ता ="तुम्हारा प्रयोगकर्ती नाम", पासवार्ड ="आपका पासवर्ड")

# इंस्टाग्राम हैंडल से प्रोफाइल लोड करना
प्रोफाइल = इंस्टालोडर। Profile.from_username (bot.context, 'आपका_लक्ष्य_खाता_insta_handle')

# सभी अनुयायियों के उपयोगकर्ता नाम पुनर्प्राप्त करना
फ़ॉलोअर्स = [follower.username for followers in profile.get_followers()]

# डेटा को डेटाफ़्रेम में बदलना
फ़ॉलोअर्स_डीएफ = पीडी. डेटाफ़्रेम (अनुयायी)

# CSV फ़ाइल में परिणाम संग्रहीत करना
followers_df.to_csv('followers.csv', अनुक्रमणिका = असत्य)

# सभी अनुसरणकर्ताओं के उपयोगकर्ता नाम पुनर्प्राप्त करना
फ़ॉलोइंग = [followee.username forfollowee in profile.get_followees()]

# डेटा को डेटाफ़्रेम में बदलना
फ़ॉलोइंग_डीएफ = पीडी. डेटाफ़्रेम (फ़ॉलोइंग)

# CSV फ़ाइल में परिणाम संग्रहीत करना
फ़ॉलोइंग_df.to_csv('फ़ॉलोइंग.सीएसवी', अनुक्रमणिका = असत्य)

इंस्टाग्राम अकाउंट से पोस्ट डाउनलोड करें

दोबारा, किसी भी खाते से पोस्ट डाउनलोड करने के लिए, आपको एक उपयोगकर्ता नाम और पासवर्ड देना होगा। ऐसा इसलिए है ताकि बॉट आपके खाते का उपयोग करके Instagram में लॉग इन कर सके। आप का उपयोग करके सभी पोस्ट के डेटा को पुनः प्राप्त कर सकते हैं get_posts () तरीका। और आप डाउनलोड_पोस्ट () तरीका।

# पुस्तकालयों का आयात करना
आयात instaloader
आयात पांडा जैसा पी.डी.

# इंस्टालोडर क्लास का एक उदाहरण बनाएं
बॉट = इंस्टालोडर। इंस्टालोडर ()
बॉट.लॉगिन (उपयोगकर्ता ="तुम्हारा प्रयोगकर्ती नाम", पासवार्ड ="आपका पासवर्ड")

# इंस्टाग्राम हैंडल से प्रोफाइल लोड करना
प्रोफाइल = इंस्टालोडर। Profile.from_username (bot.context, 'आपका_लक्ष्य_खाता_insta_handle')

# किसी वस्तु में सभी पदों को पुनः प्राप्त करना
पोस्ट = प्रोफ़ाइल.get_posts ()

# सभी अलग-अलग पोस्ट को इटरेट करना और डाउनलोड करना
अनुक्रमणिका के लिए, गणना में पोस्ट (पोस्ट, 1):
bot.download_post (पोस्ट, लक्ष्य = च"{प्रोफाइल.उपयोगकर्ता नाम} _ {अनुक्रमणिका}")

पायथन का उपयोग करके वेब को परिमार्जन करें

डेटा स्क्रैपिंग या वेब स्क्रैपिंग वेब से उपयोगी जानकारी निकालने के सबसे सामान्य तरीकों में से एक है। आप मार्केटिंग, सामग्री निर्माण, या निर्णय लेने के लिए निकाले गए डेटा का उपयोग कर सकते हैं।

डेटा स्क्रैपिंग के लिए पायथन पसंदीदा भाषा है। सुंदर सूप, स्क्रेपी और पांडा जैसे पुस्तकालय डेटा निष्कर्षण, विश्लेषण और विज़ुअलाइज़ेशन को सरल बनाते हैं।