विज्ञापन

Google स्प्रेडशीट में डेटा आयात करेंजब ऑनलाइन डेटाबेस और जानकारी की बात आती है, जिसे आमतौर पर “के रूप में जाना जाता है” के अंदर पाया जा सकता है।अदृश्य वेब अदृश्य वेब का अन्वेषण करने के लिए 12 सर्वश्रेष्ठ खोज इंजनगूगल या बिंग सब कुछ नहीं खोज सकते। अदृश्य वेब का पता लगाने के लिए, आपको इन विशेष खोज इंजनों का उपयोग करने की आवश्यकता है। अधिक पढ़ें ", मैं आपका विशिष्ट उपयोगकर्ता नहीं हूं। निश्चित रूप से, मैं अपना बहुत अधिक समय राष्ट्रीय अभिलेखागार और सीआईए एफओआईए पढ़ने जैसी जगहों पर ऑनलाइन डेटाबेस के माध्यम से स्थानांतरित करने में बिताता हूं कमरा, लेकिन मुझे कुछ भी नहीं कहना है, जब मुझे एक HTML आधारित तालिका मिलती है जो प्रतीत होता है कि जटिल और असंबद्ध की मात्रा से भरी हुई है आंकड़े।

तथ्य यह है कि, डेटा टेबल महत्वपूर्ण सत्य की सोने की खान हैं। डेटा अक्सर जमीन पर बूट के साथ डेटा-संग्रह ग्रन्ट्स की सेनाओं द्वारा एकत्र किया जाता है। यू.एस. जनगणना के लोग पूरे देश में घरेलू और पारिवारिक जानकारी के लिए यात्रा कर रहे हैं। आपके पास गैर-लाभकारी पर्यावरण समूह हैं जो पर्यावरण, प्रदूषण, ग्लोबल वार्मिंग और बहुत कुछ के बारे में सभी प्रकार की रोचक जानकारी एकत्र करते हैं। और यदि आप अपसामान्य या यूफोलॉजी में हैं, तो हमारे ऊपर आकाश में अजीब वस्तुओं के देखे जाने के बारे में जानकारी की लगातार अद्यतन तालिकाएँ भी हैं।

instagram viewer

विडंबना यह है कि आप सोचेंगे कि दुनिया की किसी भी सरकार को यह जानने में दिलचस्पी होगी कि किस तरह का विदेशी शिल्प किसी भी देश में आसमान में देखे जा रहे हैं, लेकिन जाहिर तौर पर नहीं - कम से कम यू.एस. वैसे भी। अमेरिका में, शिल्प के असामान्य दृश्यों के संग्रह को शौकिया शौक़ीन लोगों की टीमों को सौंप दिया गया है, जो पतंगों की तरह नए यूएफओ देखे जाने के लिए झुंड में आते हैं। इन दृश्यों में मेरी दिलचस्पी वास्तव में अन्य ग्रहों के एलियंस या शिल्प के प्रति आकर्षण से नहीं है, बल्कि पैटर्न के साथ एक वैज्ञानिक आकर्षण से है - अधिक लोग आकाश में चीजों को कहां और क्यों देख रहे हैं, और क्या वे दृश्य कुछ बहुत ही वास्तविक और बहुत कुछ वास्तविक रूप से वास्तविक रूप में दर्शा सकते हैं पर।

यूएफओ के शौकीनों की टीमों द्वारा एकत्र किए गए डेटा की मात्रा का पता लगाने के लिए, मैंने वास्तव में बड़ी HTML तालिकाओं को आयात करने का एक तरीका विकसित किया है एक Google स्प्रेडशीट में डेटा, और उसके बाद सार्थक और महत्वपूर्ण निकालने और खोजने के लिए उस डेटा में हेरफेर और विश्लेषण करें जानकारी। इस लेख में, मैं आपको यह दिखाने का इरादा रखता हूं कि यह कैसे करना है।

Google स्प्रेडशीट में महत्वपूर्ण HTML डेटा

इस उदाहरण में, मैं आपको यह दिखाने जा रहा हूं कि इंटरनेट पर किसी भी वेबसाइट पर किसी तालिका में संग्रहीत किसी भी डेटा को आपकी Google स्प्रेडशीट में कैसे आयात किया जाए। HTML तालिकाओं के रूप में आज इंटरनेट पर उपलब्ध डेटा की विशाल मात्रा के बारे में सोचें। जैसे विषयों के लिए अकेले विकिपीडिया में तालिकाओं में डेटा है ग्लोबल वार्मिंग, यू.एस. सेंसस ब्यूरो के पास टन है जनसंख्या डेटासेट, और थोड़ा सा Googling आपको उससे भी आगे ले जाएगा।

मेरे उदाहरण में, मैं राष्ट्रीय यूएफओ रिपोर्टिंग केंद्र पर एक डेटाबेस के साथ शुरुआत कर रहा हूं जो वास्तव में ऐसा लगता है कि यह एक क्वेरी-शैली डीप-वेब डेटाबेस हो सकता है, लेकिन यदि आप देखते हैं यूआरएल संरचना, यह वास्तव में एक अर्ध-जटिल वेब-आधारित रिपोर्टिंग प्रणाली है जिसमें स्थिर वेब पेज और स्थिर एचटीएमएल टेबल शामिल हैं - डेटा की तलाश करते समय हम वास्तव में क्या चाहते हैं आयात।
Google स्प्रेडशीट में डेटा आयात करें
NUForc.org उन संगठनों में से एक है जो UFO देखे जाने के लिए सबसे बड़े रिपोर्टिंग केंद्रों में से एक के रूप में कार्य करता है। यह केवल एक ही नहीं है, लेकिन यह हर महीने वर्तमान देखे जाने वाले नए डेटासेट खोजने के लिए काफी बड़ा है। आप राज्य या तिथि जैसे मानदंडों के अनुसार क्रमबद्ध डेटा देखना चुनते हैं, और उनमें से प्रत्येक एक स्थिर पृष्ठ के रूप में प्रदान किया जाता है। यदि आप तिथि के अनुसार क्रमबद्ध करते हैं और फिर सबसे हाल की तिथि पर क्लिक करते हैं, तो आप देखेंगे कि वहां सूचीबद्ध तालिका दिनांक प्रारूप के अनुसार नामित एक स्थिर वेब पेज है।
Google डॉक्स में डेटा आयात करें
इसलिए, अब हमारे पास इस HTML-आधारित डेटाबेस से नियमित रूप से नवीनतम दृश्य जानकारी निकालने का एक पैटर्न है। आपको केवल पहली तालिका को आयात करना है, इसकी पहचान करने के लिए सबसे हाल की प्रविष्टि (शीर्ष एक) का उपयोग करना है नवीनतम अपडेट करें, और फिर उस पोस्टिंग की तारीख का उपयोग करके URL लिंक बनाएं जहां नवीनतम HTML डेटा तालिका मौजूद। ऐसा करने के लिए केवल इम्पोर्टएचटीएमएल फ़ंक्शन के कुछ उदाहरणों की आवश्यकता होगी, और फिर टेक्स्ट मैनिपुलेशन फ़ंक्शंस के कुछ रचनात्मक उपयोगों की आवश्यकता होगी। जब आप काम पूरा कर लेंगे, तो आपके पास अपनी खुद की सबसे अच्छी, स्वयं-अपडेट करने वाली रिपोर्टिंग स्प्रैडशीट्स में से एक होगी। आएँ शुरू करें।

तालिकाएँ आयात करना और डेटा में हेरफेर करना

बेशक, पहला कदम नई स्प्रेडशीट बनाना है।
Google डॉक्स में डेटा आयात करें
तो, आप HTML तालिकाओं को कैसे आयात करते हैं? आपको केवल उस URL की आवश्यकता है जहां तालिका संग्रहीत है, और पृष्ठ पर तालिका की संख्या - आमतौर पर पहली सूची में 1 है, दूसरा 2 है, और इसी तरह। चूंकि मुझे उस पहली तालिका सूचीकरण तिथियों का URL और सूचीबद्ध देखे जाने की संख्या का पता है, इसलिए सेल A1 में निम्न फ़ंक्शन टाइप करके आयात करना संभव है।

=आयातएचटीएमएल(“ http://www.nuforc.org/webreports/ndxpost.html?”&H2,”table”,1)

H2 फंक्शन रखता है "= घंटा (अब ())", इसलिए तालिका हर घंटे अपडेट होगी। यह शायद डेटा के लिए चरम है जो इसे बार-बार अपडेट करता है, इसलिए मैं शायद इसे रोजाना करने से दूर हो सकता हूं। वैसे भी, ऊपर दिए गए इम्पोर्टएचटीएमएल फ़ंक्शन नीचे दिखाए गए अनुसार तालिका में लाता है।
यूएफओरिपोर्ट4
इससे पहले कि आप सभी यूएफओ देखे जाने के साथ दूसरी तालिका के URL को एक साथ जोड़ सकें, आपको इस पृष्ठ पर थोड़ा सा डेटा हेरफेर करने की आवश्यकता होगी। लेकिन आगे बढ़ें और कार्यपुस्तिका पर दूसरी शीट बनाएं।
Google डॉक्स में डेटा आयात करें
उस दूसरी शीट को बनाने का प्रयास करने से पहले, दूसरी तालिका का लिंक बनाने के लिए, इस पहली तालिका से पोस्ट की तारीख निकालने का समय आ गया है। समस्या यह है कि तिथि को दिनांक प्रारूप के रूप में लाया जाता है, स्ट्रिंग नहीं। तो, पहले आपको रिपोर्ट पोस्ट की तारीख को एक स्ट्रिंग में बदलने के लिए टेक्स्ट फ़ंक्शन का उपयोग करने की आवश्यकता है:

=पाठ (ए2,"मिमी/दिन/वर्ष")

अगले सेल में दाईं ओर, आपको तारीख को महीने, दिन और साल में विभाजित करने के लिए "/" सीमांकक के साथ SPLIT फ़ंक्शन का उपयोग करने की आवश्यकता है।

=विभाजन (D2,"/")
Google स्प्रेडशीट में आयात करें
जंच रहे हो! हालांकि, प्रत्येक संख्या को दो अंकों के लिए मजबूर करने की आवश्यकता है। आप इसे फिर से टेक्स्ट कमांड का उपयोग करके उनके ठीक नीचे की कोशिकाओं में करते हैं।

=पाठ (ई2,"00″)

"00" (वे शून्य हैं) का एक प्रारूप प्लेसहोल्डर के रूप में दो अंकों या "0" को बाध्य करता है।
Google स्प्रेडशीट में आयात करें
अब आप संपूर्ण URL को नई देखे जाने की नवीनतम HTML तालिका में फिर से बनाने के लिए तैयार हैं। आप CONCATENATE फ़ंक्शन का उपयोग करके और पहली तालिका से आपके द्वारा अभी-अभी निकाली गई जानकारी के सभी बिट्स को एक साथ जोड़कर ऐसा कर सकते हैं।

= संयोजित करें (" http://www.nuforc.org/webreports/ndxp”,G3,E3,F3,”.html”)
Google स्प्रेडशीट में आयात करें
अब, आपके द्वारा ऊपर बनाई गई नई शीट (रिक्त शीट) पर, आप एक नया "importhtml" फ़ंक्शन करने जा रहे हैं, लेकिन इस बार पहली बार URL लिंक पैरामीटर, इसलिए आप पहली स्प्रैडशीट पर वापस नेविगेट करने जा रहे हैं और आपके द्वारा अभी बनाए गए URL लिंक वाले सेल पर क्लिक करें।
यूएफओरिपोर्ट9
दूसरा पैरामीटर "तालिका" है और अंतिम "1" है (क्योंकि दृश्य तालिका पहले और केवल पृष्ठ पर है)। एंटर दबाएं, और अब आपने उस विशेष तिथि पर पोस्ट किए गए दृश्यों की पूरी मात्रा आयात कर ली है।
यूएफओरिपोर्ट10
तो, आप शायद सोच रहे हैं कि यह एक अच्छा नवीनता अधिनियम है और सब कुछ - मेरा मतलब है, आखिरकार, आपने जो किया है वह निकाला गया है इंटरनेट पर एक तालिका से मौजूदा जानकारी और इसे किसी अन्य तालिका में माइग्रेट कर दिया, भले ही आपके Google डॉक्स में एक निजी हो लेखा। हाँ यह सच है। हालांकि, अब जब यह आपके अपने निजी Google डॉक्स खाते में है, तो आपके पास उस डेटा का बेहतर विश्लेषण करने और अद्भुत कनेक्शन की खोज शुरू करने के लिए उपकरण और कार्य हैं।

आयातित डेटा का विश्लेषण करने के लिए पिवट रिपोर्ट का उपयोग करना

अभी हाल ही में, मैंने उपयोग करने के बारे में एक लेख लिखा था Google स्प्रैडशीट में पिवट रिपोर्ट Google स्प्रैडशीट रिपोर्ट टूल का उपयोग करके रातोंरात एक विशेषज्ञ डेटा विश्लेषक बनेंक्या आप जानते हैं कि डेटा विश्लेषण करने के लिए सबसे महान उपकरणों में से एक वास्तव में Google स्प्रेडशीट है? इसका कारण केवल इसलिए नहीं है क्योंकि यह लगभग वह सब कुछ कर सकता है जो आप करना चाहते हैं... अधिक पढ़ें सभी प्रकार के शांत डेटा विश्लेषण करतब करने के लिए। ठीक है, आप डेटा पर वही अद्भुत डेटा विश्लेषण कलाबाजी कर सकते हैं जिसे आपने इंटरनेट से आयात किया है - आपको दिलचस्प कनेक्शनों को उजागर करने की क्षमता प्रदान करता है जो संभवतः पहले किसी और ने उजागर नहीं किया है आप।

उदाहरण के लिए, अंतिम दृश्य तालिका से, मैं की संख्या पर एक नज़र डालने के लिए पिवट रिपोर्ट का उपयोग करने का निर्णय ले सकता हूं उस विशेष में देखे जाने की कुल संख्या की तुलना में, प्रत्येक राज्य में अलग-अलग विशिष्ट आकृतियों की सूचना दी गई है राज्य। अंत में, मैं टिप्पणी अनुभाग में "एलियंस" का उल्लेख करते हुए कुछ भी फ़िल्टर करता हूं, उम्मीद है कि कुछ और विंगनट प्रविष्टियों को हटा दें।
यूएफओरिपोर्ट11
यह वास्तव में बल्ले से कुछ बहुत ही रोचक चीजें प्रकट करता है, जैसे तथ्य यह है कि कैलिफ़ोर्निया में स्पष्ट रूप से उच्चतम है किसी भी अन्य राज्य के देखे जाने की सूचना की संख्या के साथ-साथ सबसे अधिक संख्या में शिल्प आकृतियों की रिपोर्ट करने का गौरव प्राप्त करना देश। यह यह भी दर्शाता है कि मैसाचुसेट्स, फ्लोरिडा और इलिनोइस यूएफओ देखे जाने वाले विभाग में भी बड़े हिटर हैं (कम से कम हाल के आंकड़ों में)।

Google स्प्रैडशीट के बारे में एक और अच्छी बात यह है कि आपके लिए उपलब्ध चार्ट की विस्तृत श्रृंखला है, जिसमें एक भू-मानचित्र भी शामिल है जो आपको देता है डेटा के "हॉट स्पॉट" को एक ग्राफिकल प्रारूप में रखना जो वास्तव में सबसे अलग है और डेटा के भीतर उन कनेक्शनों को काफी बनाता है ज़ाहिर।
Google स्प्रेडशीट में डेटा आयात करें
यदि आप इसके बारे में सोचते हैं, तो यह वास्तव में केवल हिमशैल का सिरा है। यदि आप अब इंटरनेट पर किसी भी पृष्ठ पर डेटा तालिकाओं से डेटा आयात कर सकते हैं, तो संभावनाओं के बारे में सोचें। न्यूयॉर्क टाइम्स की बेस्टसेलर सूची में नवीनतम स्टॉक नंबर, या सबसे हाल की शीर्ष 10 पुस्तकें और लेखक या दुनिया में सबसे अधिक बिकने वाली कारें प्राप्त करें। लगभग किसी भी विषय पर HTML तालिकाएँ हैं जिनकी आप कल्पना कर सकते हैं, और कई मामलों में उन तालिकाओं को अक्सर अद्यतन किया जाता है।

ImportHtml आपको अपनी Google स्प्रैडशीट को इंटरनेट में प्लग करने और वहां मौजूद डेटा को फीड करने की क्षमता देता है। यह जानकारी का आपका अपना निजी केंद्र बन सकता है जिसका उपयोग आप उस प्रारूप में हेरफेर करने और मालिश करने के लिए कर सकते हैं जिसके साथ आप वास्तव में काम कर सकते हैं। Google स्प्रैडशीट के बारे में प्यार करने के लिए यह सिर्फ एक और बहुत अच्छी बात है।

क्या आपने कभी अपनी स्प्रैडशीट में डेटा आयात किया है? उस डेटा में आपको किस तरह की दिलचस्प चीज़ें मिलीं? आपने डेटा का उपयोग कैसे किया? अपने अनुभव और विचार नीचे टिप्पणी अनुभाग में साझा करें!

छवि क्रेडिट: व्यापार ग्राफ

रयान के पास इलेक्ट्रिकल इंजीनियरिंग में बीएससी की डिग्री है। उसने ऑटोमेशन इंजीनियरिंग में 13 साल, आईटी में 5 साल काम किया है और अब वह एक ऐप इंजीनियर है। MakeUseOf के एक पूर्व प्रबंध संपादक, उन्होंने डेटा विज़ुअलाइज़ेशन पर राष्ट्रीय सम्मेलनों में बात की है और उन्हें राष्ट्रीय टीवी और रेडियो पर चित्रित किया गया है।