विज्ञापन

अगर मैं आपको बताऊं कि आपके पास अपने निपटान में उपकरण हैं, तो ग्राउंड-ब्रेकिंग, अर्थ-शैटरिंग रिसर्च करने के लिए? ठीक है, आप करते हैं, और मैं आपको दिखाता हूँ कि कैसे।

सरकारें, शैक्षणिक संस्थान और गैर-लाभकारी अनुसंधान संगठन सार्वजनिक डोमेन पर डेटा से भरे टेबल प्रकाशित करते हैं। इस जानकारी का उपयोग किए बिना, इसका सही मूल्य कभी भी ज्ञात नहीं होगा। दुर्भाग्य से, कुछ लोगों के पास जानकारी, कौशल या उपकरण लेने के लिए डेटा है और प्रतीत होता है असंबद्ध जानकारी के बीच दिलचस्प सहसंबंध हैं।

पृष्ठभूमि

अपने स्वयं के ब्लॉग के लिए मैं जो भी शोध करता हूं, उसमें जो कुछ भी शामिल है, उसके माध्यम से खुदाई करना शामिल है अदृश्य वेब अदृश्य वेब का पता लगाने के लिए 12 सर्वश्रेष्ठ खोज इंजनGoogle या बिंग सब कुछ नहीं खोज सकते। अदृश्य वेब का पता लगाने के लिए, आपको इन विशेष खोज इंजनों का उपयोग करने की आवश्यकता है। अधिक पढ़ें , उन आंकड़ों को उजागर करने के लिए जो जनता के लिए जारी किए गए हैं, लेकिन उनसे छिपाए गए हैं खोज यन्त्र वेब पर 5 सबसे उन्नत खोज इंजन अधिक पढ़ें एक ऑनलाइन डेटाबेस के अंदर। यह है गहरा जाल TorSearch डीप वेब के लिए Google का उद्देश्य है

instagram viewer
टोर एक छिपी हुई सेवा है और डीप वेब का हिस्सा है। TorSearch एक नया अनाम खोज इंजन है, जिसके संस्थापक क्रिस मैकनॉटन "Google of Tor" बनाना चाहते हैं। अधिक पढ़ें , और यह मूल्यवान डेटा के साथ व्याप्त है। बहुत बार, मैं उन वेबपेजों पर आता हूं, जो कुछ दुर्लभ विषयों पर जनगणना के आंकड़ों से लेकर महामारी विज्ञान के अध्ययनों तक सरगम ​​को चलाने वाले कुछ सबसे मूल्यवान आंकड़ों से भरे होते हैं। मेरे पास निरंतर नए विचार हैं कि कैसे विभिन्न डेटा का उपयोग करके उन असमान डेटा स्रोतों की कोशिश और सहसंबंध किया जाए उपकरण - और सबसे मूल्यवान उपकरण जो मैंने पाया है वह माइक्रोसॉफ्ट के अंदर वेब क्वेरी है एक्सेल।

दिलचस्प डेटा सहसंबंध ढूँढना

आज मैं आपको जो दिखाने जा रहा हूं, वह इस बात का एक उदाहरण है कि आप डेटा में खींचने के लिए एक्सेल वेब क्वेरी का उपयोग कैसे कर सकते हैं विभिन्न वेबसाइटों, और उनके बीच एक दूसरे के खिलाफ चार्ट के क्रम में संभावित सहसंबंधों के लिए खोज करने के लिए डेटा।

इस तरह एक व्यायाम शुरू करने का तरीका एक दिलचस्प परिकल्पना के साथ आना है। उदाहरण के लिए - चीजों को यहाँ दिलचस्प रखने के लिए - मैं संयुक्त राज्य अमेरिका में उस आसमान छूती आत्मकेंद्रित दरों को अनियमित रूप से पोस्ट करने जा रहा हूँ वैक्सीन टीका के कारण या बच्चों में और आसपास सेल जैसे विद्युत चुम्बकीय क्षेत्रों की बढ़ती उपस्थिति के कारण होता है फोन। यह एक पागल परिकल्पना है, जिसमें से अधिकांश षड्यंत्र सिद्धांत वेबसाइटों पर आपको मिलेंगे, लेकिन यह वही है जो इसे मजेदार बनाता है। तो चलिए शुरू करते हैं, क्या हम?

सबसे पहले, एक्सेल खोलें, डेटा मेनू आइटम पर जाएं, और मेनू रिबन में "वेब से" आइकन ढूंढें।

वेब क्वेरी-excel1

यह वही है जो आप उन विभिन्न वेबसाइट से अलग-अलग डेटा तालिकाओं को आयात करने के लिए उपयोग करेंगे, जिन्होंने उन्हें प्रकाशित किया है।

एक्सेल में वेब डेटा आयात करना

इसलिए, पुराने दिनों में आपको वेबपृष्ठ पर उस तालिका के डेटा को कॉपी करने, उसे एक्सेल में पेस्ट करने और फिर उसे करने में शामिल सभी पागल प्रारूपण मुद्दों से निपटना होगा। कुल परेशानी, और बहुत बार यह सिर्फ सिरदर्द के लायक नहीं है। ठीक है, एक्सेल वेब क्वेरी के साथ, वे दिन चले गए हैं। बेशक, इससे पहले कि आप डेटा आयात कर सकें, आपको तालिका प्रारूप में आवश्यक डेटा को खोजने के लिए वेब के चारों ओर Google की आवश्यकता होगी। मेरे मामले में, मुझे एक वेबसाइट मिली, जिसने यू.एस. पब्लिक स्कूल के छात्रों की संख्या के लिए शिक्षा विभाग के आंकड़ों को प्रकाशित किया था जिन्हें आत्मकेंद्रित के रूप में पहचाना गया था। एक अच्छी तालिका वहाँ 1994 से 2006 के माध्यम से सभी तरह से नंबर प्रदान किया।

तो आप बस "वेब से" पर क्लिक करें, वेबपेज URL को क्वेरी एड्रेस फ़ील्ड में पेस्ट करें, और उसके बाद पृष्ठ को नीचे स्क्रॉल करें जब तक कि आप जिस डेटा को आयात करना चाहते हैं उसके साथ तालिका के बगल में पीला तीर देखें।

वेब क्वेरी-excel2

तीर पर क्लिक करें ताकि यह एक ग्रीन चेकमार्क बन जाए।

वेब क्वेरी-excel3

अंत में, एक्सेल को बताएं कि आप अपनी नई स्प्रेडशीट के अंदर टेबल डेटा को किस क्षेत्र में पेस्ट करना चाहते हैं।

वेब क्वेरी-excel4

फिर - वोइला! डेटा स्वतः ही आपकी स्प्रैडशीट में प्रवाहित होता है।

वेब क्वेरी-excel5
इसलिए, 1996 से 2006 तक पब्लिक स्कूल ऑटिज्म की दर के रुझान के साथ, टीकाकरण और सेल फोन के उपयोग के रुझानों के लिए भी बाहर जाने का समय है।

सौभाग्य से, मैंने जल्दी से यू.एस. में सेल फोन ग्राहकों के लिए रुझान 1985 से 2012 तक पाया। इस विशेष अध्ययन के लिए उत्कृष्ट डेटा। फिर से, मैंने उस तालिका को आयात करने के लिए एक्सेल वेब क्वेरी टूल का उपयोग किया।

वेब क्वेरी-excel6

मैंने उस तालिका को एक साफ, नई शीट में आयात किया। फिर, मैंने विभिन्न बीमारियों के लिए टीकाकरण वाले स्कूली बच्चों के प्रतिशत के लिए टीकाकरण के रुझान की खोज की। मैंने उस तालिका को तीसरी शीट में वेब क्वेरी टूल का उपयोग करके आयात किया है। इसलिए, अंत में, मेरे पास वेब पर खोजे गए असंबद्ध डेटा के साथ भरी हुई तीन तालिकाओं के साथ तीन पत्रक थे।

वेब क्वेरी-excel8

अगला कदम, डेटा का विश्लेषण करने और किसी भी सहसंबंध की पहचान करने के लिए एक्सेल का उपयोग कर रहा है। यह मेरा पसंदीदा डेटा-विश्लेषण उपकरण में से एक खेल में आता है - PivotTable।

PivotTable के साथ Excel में डेटा का विश्लेषण करना

एक नई, खाली शीट में अपना PivotTable बनाना सबसे अच्छा है। आप जो करना चाहते हैं उसके लिए आप विज़ार्ड का उपयोग करना चाहते हैं। Excel में PivotTable विज़ार्ड को सक्षम करने के लिए, आपको एक ही समय में Alt-D को तब तक दबाए रखना होगा जब तक कि अधिसूचना विंडो पॉप अप न हो जाए। फिर उन बटनों को जाने दें, और "P" कुंजी दबाएं। फिर, आप विज़ार्ड को पॉप अप देखेंगे।

वेब क्वेरी-excel10

विज़ार्ड की पहली विंडो पर, आप "एकाधिक समेकन रेंज" का चयन करना चाहते हैं, जो आपको उन सभी शीट्स से डेटा का चयन करने की अनुमति देता है, जिन्हें आपने आयात किया है। ऐसा करने से, आप उन सभी को एक से एक अविश्वसनीय शक्तिशाली डेटा में समेकित रूप से समेकित कर सकते हैं। कुछ मामलों में, आपको कुछ डेटा की मालिश करने की आवश्यकता हो सकती है। उदाहरण के लिए, मुझे आत्मकेंद्रित तालिका में "वर्ष" फ़ील्ड को ठीक करना था ताकि इसके बजाय "1994" दिखाया जाए "1994-95" - इसे अन्य चादरों पर तालिकाओं के साथ बेहतर बनाना है, जिसमें प्राथमिक वर्ष भी था खेत।

वेब क्वेरी-excel11

डेटा के बीच का सामान्य क्षेत्र वह है जो आपको जानकारी को आज़माने और सहसंबंधित करने के लिए आवश्यक है, इसलिए ध्यान रखें कि जब आप अपने डेटा के लिए वेब का शिकार कर रहे हों।

एक बार PivotTable हो जाने के बाद और आपको सभी अलग-अलग डेटा मान एक तालिका में दिखाए गए हैं, यह देखने के लिए एक दृश्य विश्लेषण करने का समय है कि क्या कोई स्पष्ट कनेक्शन है जो आप पर कूदता है।

विज़ुअलाइज़िंग डेटा कुंजी है

यदि आप एक अर्थशास्त्री हैं, लेकिन सबसे तेज़ और सबसे आसान तरीका है, तो किसी तालिका में संख्याओं का एक गुच्छा होना बहुत अच्छा है कि "अहा!" वह क्षण जब आप हॉस्टैक में सुई की तरह कनेक्शन खोजने की कोशिश कर रहे हैं, चार्ट के माध्यम से और रेखांकन। एक बार जब आप अपना PivotChart आपके द्वारा एकत्र किए गए सभी डेटा सेटों के साथ कर लेते हैं, तो यह आपका ग्राफ बनाने का समय होता है। आमतौर पर एक लाइन ग्राफ सबसे अच्छा करेगा, लेकिन यह डेटा पर निर्भर करता है। ऐसे समय होते हैं जब एक बार चार्ट बहुत बेहतर काम करता है। यह समझने की कोशिश करें कि आप किस तरह का डेटा देख रहे हैं और किस रूप में तुलना करना सबसे अच्छा है।

इस मामले में, मैं समय के साथ डेटा देख रहा हूं, इसलिए एक रेखा ग्राफ़ वास्तव में वर्षों में रुझान देखने का सबसे अच्छा तरीका है। स्केलिंग-डाउन टीकाकरण दर (गहरा नीला), चिकन-पॉक्स वैक्सीन (हल्का नीला) के खिलाफ आत्मकेंद्रित दर (हरा) को चार्ज करना और सेल फोन का उपयोग (बैंगनी), डेटा के इस नमूने सेट में एक अजीब सहसंबंध अचानक प्रकट हुआ जो मैं खेल रहा था साथ में।

वेब क्वेरी-excel12

अजीब तरह से पर्याप्त है, 2006 के माध्यम से 1994 से सेल फोन के उपयोग की प्रवृत्ति लगभग उसी अवधि में आत्मकेंद्रित दरों में चढ़ाई से पूरी तरह से मेल खाती है। जबकि पैटर्न पूरी तरह से अप्रत्याशित था, यह एक आदर्श उदाहरण है कि दिलचस्प डेटा को एक साथ बांधने से आकर्षक लीड कैसे प्रकट हो सकती हैं - आपको आगे बढ़ाने के लिए और अधिक डेटा की खोज करने के लिए अधिक से अधिक अंतर्दृष्टि और प्रेरणा प्रदान करने के लिए जो आपके आगे को बढ़ा सकता है परिकल्पना।

उस तरह का एक सहसंबंध कुछ भी साबित नहीं करता है। समय के साथ बढ़ने वाले बहुत सारे रुझान हैं - पैटर्न संयोग हो सकता है, लेकिन यह इंटरनेट पर अधिक डेटा के लिए आपकी निरंतर खोज में एक महत्वपूर्ण सुराग भी हो सकता है। शुक्र है, आपके पास Excel Web Queries नामक एक शक्तिशाली उपकरण है जो उस खोज को थोड़ा आसान बना देगा।

चित्र का श्रेय देना: केविन डोले के जरिए photopinसीसी

रयान के पास इलेक्ट्रिकल इंजीनियरिंग में बीएससी की डिग्री है। उन्होंने ऑटोमेशन इंजीनियरिंग में 13 साल, आईटी में 5 साल काम किया है, और अब एक एप्स इंजीनियर हैं। MakeUseOf के पूर्व प्रबंध संपादक, उन्होंने डेटा विज़ुअलाइज़ेशन पर राष्ट्रीय सम्मेलनों में बात की और राष्ट्रीय टीवी और रेडियो पर चित्रित किया गया है।