विज्ञापन
अगर मैं आपको बताऊं कि आपके पास अपने निपटान में उपकरण हैं, तो ग्राउंड-ब्रेकिंग, अर्थ-शैटरिंग रिसर्च करने के लिए? ठीक है, आप करते हैं, और मैं आपको दिखाता हूँ कि कैसे।
सरकारें, शैक्षणिक संस्थान और गैर-लाभकारी अनुसंधान संगठन सार्वजनिक डोमेन पर डेटा से भरे टेबल प्रकाशित करते हैं। इस जानकारी का उपयोग किए बिना, इसका सही मूल्य कभी भी ज्ञात नहीं होगा। दुर्भाग्य से, कुछ लोगों के पास जानकारी, कौशल या उपकरण लेने के लिए डेटा है और प्रतीत होता है असंबद्ध जानकारी के बीच दिलचस्प सहसंबंध हैं।
पृष्ठभूमि
अपने स्वयं के ब्लॉग के लिए मैं जो भी शोध करता हूं, उसमें जो कुछ भी शामिल है, उसके माध्यम से खुदाई करना शामिल है अदृश्य वेब अदृश्य वेब का पता लगाने के लिए 12 सर्वश्रेष्ठ खोज इंजनGoogle या बिंग सब कुछ नहीं खोज सकते। अदृश्य वेब का पता लगाने के लिए, आपको इन विशेष खोज इंजनों का उपयोग करने की आवश्यकता है। अधिक पढ़ें , उन आंकड़ों को उजागर करने के लिए जो जनता के लिए जारी किए गए हैं, लेकिन उनसे छिपाए गए हैं खोज यन्त्र वेब पर 5 सबसे उन्नत खोज इंजन अधिक पढ़ें एक ऑनलाइन डेटाबेस के अंदर। यह है गहरा जाल TorSearch डीप वेब के लिए Google का उद्देश्य है टोर एक छिपी हुई सेवा है और डीप वेब का हिस्सा है। TorSearch एक नया अनाम खोज इंजन है, जिसके संस्थापक क्रिस मैकनॉटन "Google of Tor" बनाना चाहते हैं। अधिक पढ़ें , और यह मूल्यवान डेटा के साथ व्याप्त है। बहुत बार, मैं उन वेबपेजों पर आता हूं, जो कुछ दुर्लभ विषयों पर जनगणना के आंकड़ों से लेकर महामारी विज्ञान के अध्ययनों तक सरगम को चलाने वाले कुछ सबसे मूल्यवान आंकड़ों से भरे होते हैं। मेरे पास निरंतर नए विचार हैं कि कैसे विभिन्न डेटा का उपयोग करके उन असमान डेटा स्रोतों की कोशिश और सहसंबंध किया जाए उपकरण - और सबसे मूल्यवान उपकरण जो मैंने पाया है वह माइक्रोसॉफ्ट के अंदर वेब क्वेरी है एक्सेल।
दिलचस्प डेटा सहसंबंध ढूँढना
आज मैं आपको जो दिखाने जा रहा हूं, वह इस बात का एक उदाहरण है कि आप डेटा में खींचने के लिए एक्सेल वेब क्वेरी का उपयोग कैसे कर सकते हैं विभिन्न वेबसाइटों, और उनके बीच एक दूसरे के खिलाफ चार्ट के क्रम में संभावित सहसंबंधों के लिए खोज करने के लिए डेटा।
इस तरह एक व्यायाम शुरू करने का तरीका एक दिलचस्प परिकल्पना के साथ आना है। उदाहरण के लिए - चीजों को यहाँ दिलचस्प रखने के लिए - मैं संयुक्त राज्य अमेरिका में उस आसमान छूती आत्मकेंद्रित दरों को अनियमित रूप से पोस्ट करने जा रहा हूँ वैक्सीन टीका के कारण या बच्चों में और आसपास सेल जैसे विद्युत चुम्बकीय क्षेत्रों की बढ़ती उपस्थिति के कारण होता है फोन। यह एक पागल परिकल्पना है, जिसमें से अधिकांश षड्यंत्र सिद्धांत वेबसाइटों पर आपको मिलेंगे, लेकिन यह वही है जो इसे मजेदार बनाता है। तो चलिए शुरू करते हैं, क्या हम?
सबसे पहले, एक्सेल खोलें, डेटा मेनू आइटम पर जाएं, और मेनू रिबन में "वेब से" आइकन ढूंढें।

यह वही है जो आप उन विभिन्न वेबसाइट से अलग-अलग डेटा तालिकाओं को आयात करने के लिए उपयोग करेंगे, जिन्होंने उन्हें प्रकाशित किया है।
एक्सेल में वेब डेटा आयात करना
इसलिए, पुराने दिनों में आपको वेबपृष्ठ पर उस तालिका के डेटा को कॉपी करने, उसे एक्सेल में पेस्ट करने और फिर उसे करने में शामिल सभी पागल प्रारूपण मुद्दों से निपटना होगा। कुल परेशानी, और बहुत बार यह सिर्फ सिरदर्द के लायक नहीं है। ठीक है, एक्सेल वेब क्वेरी के साथ, वे दिन चले गए हैं। बेशक, इससे पहले कि आप डेटा आयात कर सकें, आपको तालिका प्रारूप में आवश्यक डेटा को खोजने के लिए वेब के चारों ओर Google की आवश्यकता होगी। मेरे मामले में, मुझे एक वेबसाइट मिली, जिसने यू.एस. पब्लिक स्कूल के छात्रों की संख्या के लिए शिक्षा विभाग के आंकड़ों को प्रकाशित किया था जिन्हें आत्मकेंद्रित के रूप में पहचाना गया था। एक अच्छी तालिका वहाँ 1994 से 2006 के माध्यम से सभी तरह से नंबर प्रदान किया।
तो आप बस "वेब से" पर क्लिक करें, वेबपेज URL को क्वेरी एड्रेस फ़ील्ड में पेस्ट करें, और उसके बाद पृष्ठ को नीचे स्क्रॉल करें जब तक कि आप जिस डेटा को आयात करना चाहते हैं उसके साथ तालिका के बगल में पीला तीर देखें।

तीर पर क्लिक करें ताकि यह एक ग्रीन चेकमार्क बन जाए।

अंत में, एक्सेल को बताएं कि आप अपनी नई स्प्रेडशीट के अंदर टेबल डेटा को किस क्षेत्र में पेस्ट करना चाहते हैं।

फिर - वोइला! डेटा स्वतः ही आपकी स्प्रैडशीट में प्रवाहित होता है।
इसलिए, 1996 से 2006 तक पब्लिक स्कूल ऑटिज्म की दर के रुझान के साथ, टीकाकरण और सेल फोन के उपयोग के रुझानों के लिए भी बाहर जाने का समय है।
सौभाग्य से, मैंने जल्दी से यू.एस. में सेल फोन ग्राहकों के लिए रुझान 1985 से 2012 तक पाया। इस विशेष अध्ययन के लिए उत्कृष्ट डेटा। फिर से, मैंने उस तालिका को आयात करने के लिए एक्सेल वेब क्वेरी टूल का उपयोग किया।

मैंने उस तालिका को एक साफ, नई शीट में आयात किया। फिर, मैंने विभिन्न बीमारियों के लिए टीकाकरण वाले स्कूली बच्चों के प्रतिशत के लिए टीकाकरण के रुझान की खोज की। मैंने उस तालिका को तीसरी शीट में वेब क्वेरी टूल का उपयोग करके आयात किया है। इसलिए, अंत में, मेरे पास वेब पर खोजे गए असंबद्ध डेटा के साथ भरी हुई तीन तालिकाओं के साथ तीन पत्रक थे।

अगला कदम, डेटा का विश्लेषण करने और किसी भी सहसंबंध की पहचान करने के लिए एक्सेल का उपयोग कर रहा है। यह मेरा पसंदीदा डेटा-विश्लेषण उपकरण में से एक खेल में आता है - PivotTable।
PivotTable के साथ Excel में डेटा का विश्लेषण करना
एक नई, खाली शीट में अपना PivotTable बनाना सबसे अच्छा है। आप जो करना चाहते हैं उसके लिए आप विज़ार्ड का उपयोग करना चाहते हैं। Excel में PivotTable विज़ार्ड को सक्षम करने के लिए, आपको एक ही समय में Alt-D को तब तक दबाए रखना होगा जब तक कि अधिसूचना विंडो पॉप अप न हो जाए। फिर उन बटनों को जाने दें, और "P" कुंजी दबाएं। फिर, आप विज़ार्ड को पॉप अप देखेंगे।

विज़ार्ड की पहली विंडो पर, आप "एकाधिक समेकन रेंज" का चयन करना चाहते हैं, जो आपको उन सभी शीट्स से डेटा का चयन करने की अनुमति देता है, जिन्हें आपने आयात किया है। ऐसा करने से, आप उन सभी को एक से एक अविश्वसनीय शक्तिशाली डेटा में समेकित रूप से समेकित कर सकते हैं। कुछ मामलों में, आपको कुछ डेटा की मालिश करने की आवश्यकता हो सकती है। उदाहरण के लिए, मुझे आत्मकेंद्रित तालिका में "वर्ष" फ़ील्ड को ठीक करना था ताकि इसके बजाय "1994" दिखाया जाए "1994-95" - इसे अन्य चादरों पर तालिकाओं के साथ बेहतर बनाना है, जिसमें प्राथमिक वर्ष भी था खेत।

डेटा के बीच का सामान्य क्षेत्र वह है जो आपको जानकारी को आज़माने और सहसंबंधित करने के लिए आवश्यक है, इसलिए ध्यान रखें कि जब आप अपने डेटा के लिए वेब का शिकार कर रहे हों।
एक बार PivotTable हो जाने के बाद और आपको सभी अलग-अलग डेटा मान एक तालिका में दिखाए गए हैं, यह देखने के लिए एक दृश्य विश्लेषण करने का समय है कि क्या कोई स्पष्ट कनेक्शन है जो आप पर कूदता है।
विज़ुअलाइज़िंग डेटा कुंजी है
यदि आप एक अर्थशास्त्री हैं, लेकिन सबसे तेज़ और सबसे आसान तरीका है, तो किसी तालिका में संख्याओं का एक गुच्छा होना बहुत अच्छा है कि "अहा!" वह क्षण जब आप हॉस्टैक में सुई की तरह कनेक्शन खोजने की कोशिश कर रहे हैं, चार्ट के माध्यम से और रेखांकन। एक बार जब आप अपना PivotChart आपके द्वारा एकत्र किए गए सभी डेटा सेटों के साथ कर लेते हैं, तो यह आपका ग्राफ बनाने का समय होता है। आमतौर पर एक लाइन ग्राफ सबसे अच्छा करेगा, लेकिन यह डेटा पर निर्भर करता है। ऐसे समय होते हैं जब एक बार चार्ट बहुत बेहतर काम करता है। यह समझने की कोशिश करें कि आप किस तरह का डेटा देख रहे हैं और किस रूप में तुलना करना सबसे अच्छा है।
इस मामले में, मैं समय के साथ डेटा देख रहा हूं, इसलिए एक रेखा ग्राफ़ वास्तव में वर्षों में रुझान देखने का सबसे अच्छा तरीका है। स्केलिंग-डाउन टीकाकरण दर (गहरा नीला), चिकन-पॉक्स वैक्सीन (हल्का नीला) के खिलाफ आत्मकेंद्रित दर (हरा) को चार्ज करना और सेल फोन का उपयोग (बैंगनी), डेटा के इस नमूने सेट में एक अजीब सहसंबंध अचानक प्रकट हुआ जो मैं खेल रहा था साथ में।

अजीब तरह से पर्याप्त है, 2006 के माध्यम से 1994 से सेल फोन के उपयोग की प्रवृत्ति लगभग उसी अवधि में आत्मकेंद्रित दरों में चढ़ाई से पूरी तरह से मेल खाती है। जबकि पैटर्न पूरी तरह से अप्रत्याशित था, यह एक आदर्श उदाहरण है कि दिलचस्प डेटा को एक साथ बांधने से आकर्षक लीड कैसे प्रकट हो सकती हैं - आपको आगे बढ़ाने के लिए और अधिक डेटा की खोज करने के लिए अधिक से अधिक अंतर्दृष्टि और प्रेरणा प्रदान करने के लिए जो आपके आगे को बढ़ा सकता है परिकल्पना।
उस तरह का एक सहसंबंध कुछ भी साबित नहीं करता है। समय के साथ बढ़ने वाले बहुत सारे रुझान हैं - पैटर्न संयोग हो सकता है, लेकिन यह इंटरनेट पर अधिक डेटा के लिए आपकी निरंतर खोज में एक महत्वपूर्ण सुराग भी हो सकता है। शुक्र है, आपके पास Excel Web Queries नामक एक शक्तिशाली उपकरण है जो उस खोज को थोड़ा आसान बना देगा।
चित्र का श्रेय देना: केविन डोले के जरिए photopinसीसी
रयान के पास इलेक्ट्रिकल इंजीनियरिंग में बीएससी की डिग्री है। उन्होंने ऑटोमेशन इंजीनियरिंग में 13 साल, आईटी में 5 साल काम किया है, और अब एक एप्स इंजीनियर हैं। MakeUseOf के पूर्व प्रबंध संपादक, उन्होंने डेटा विज़ुअलाइज़ेशन पर राष्ट्रीय सम्मेलनों में बात की और राष्ट्रीय टीवी और रेडियो पर चित्रित किया गया है।