दो डेटा सेट के साथ काम करने के लिए Google पत्रक का उपयोग करते समय, आप उस डिग्री का निर्धारण करके दोनों की तुलना करना चाह सकते हैं जिससे एक दूसरे को प्रभावित करता है।

सहसंबंध अंतर्दृष्टि प्रदान कर सकते हैं कि क्या x और y विमानों के बीच एक भविष्य कहनेवाला संबंध है, लेकिन वे आवश्यक रूप से कार्य-कारण का संकेत नहीं देते हैं। यहां बताया गया है कि आप अपने डेटा में सहसंबंधों की पहचान करने के लिए Google पत्रक का उपयोग कैसे कर सकते हैं।

सहसंबंध क्या है, और आप इसका उपयोग किस लिए कर सकते हैं?

जब दो चर सहसंबद्ध होते हैं, तो एक यह निर्धारित कर सकता है कि एक चर दूसरे को कैसे प्रभावित करता है। लेकिन, यह याद रखना महत्वपूर्ण है कि इस मामले में सहसंबंध का मतलब निर्भरता नहीं है; यह सिर्फ दिखाता है कि दो चर कितनी बारीकी से और जल्दी से तुलना करते हैं या संबंधित होते हैं।

सांख्यिकीय मेट्रिक्स डेटा विश्लेषण में अंतर्निहित प्रवृत्तियों की समझ में सहायता करते हैं। सहसंबंध सबसे अधिक उपयोग किए जाने वाले सांख्यिकीय मेट्रिक्स में से एक है, और यह निर्धारित करता है कि दो चर कितने निकट से संबंधित या निर्भर हैं।

Google पत्रक में सहसंबंध गुणांक को समझना

instagram viewer

Google पत्रक में, सहसंबंध गुणांक की गणना CORREL फ़ंक्शन का उपयोग करके की जाती है। सहसंबंध गुणांक एक गेज के रूप में कार्य करता है कि डेटा के सेट कितने निकट से जुड़े हुए हैं। यदि आपके पास डेटा के दो चर सेट हैं, तो इसका उपयोग पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक (आर) प्राप्त करने के लिए किया जा सकता है। यदि आप इस गुणांक के बारे में अधिक जानना चाहते हैं, तो आप इस मार्गदर्शिका में अधिक पढ़ सकते हैं Leard पर सांख्यिकी.

कोई तीन सहसंबंध मेट्रिक्स में से एक में आ सकता है। हर माप चर के बीच संबंधों को अलग तरह से परिभाषित करता है। इसका मान -1 और +1 के बीच है:

  • -1 पूर्ण नकारात्मक सहसंबंध दर्शाता है: जब एक सहसंबंध में सहसंबंध का गुणांक होता है जो -0.9 के बराबर या उससे कम होता है, तो इसे अत्यधिक नकारात्मक कहा जाता है। यह एक संकेत है कि डेटा सहसंबद्ध है। हालाँकि, चर x बढ़ता रहता है, जबकि चर y घटता रहता है।
  • 0 कोई कनेक्शन नहीं दर्शाता है: यदि सहसंबंध गुणांक 0.01 से अधिक है, लेकिन 0.1 से कम है, तो चर को सहसंबद्ध नहीं माना जाता है क्योंकि प्रत्येक चर के बीच कोई स्पष्ट संबंध नहीं है। वे एक दूसरे से स्वतंत्र हैं।
  • +1 एक पूर्ण सकारात्मक सहसंबंध दर्शाता है: जब सहसंबंध का गुणांक 0.9 और 1 के बीच आता है, तो इसे अत्यधिक सकारात्मक माना जाता है। यह इंगित करता है कि दो चर सेटों में वृद्धि हुई है।

किसी गुणांक का उच्चतम मान 1 का सहसंबंध गुणांक हो सकता है। जब सहसंबंध मान 1 होता है, तो इसका तात्पर्य है कि यदि आप डेटा को ग्राफ़ करना चाहते हैं, तो यह एक सीधी रेखा बनाने के लिए पूरी तरह से संरेखित होगा।

यदि आप अभी भी थोड़े खोए हुए हैं, तो चिंता न करें। हम CORREL फ़ंक्शन के सिंटैक्स की व्याख्या करेंगे और फिर इसे बेहतर ढंग से समझने में आपकी मदद करने के लिए कुछ वास्तविक दुनिया के उदाहरणों में गोता लगाएंगे। सर्वोत्तम फ़िट की पंक्तियों को समझना और Google पत्रक में ट्रेंडलाइन कैसे बनाएं इसमें आपकी मदद करेंगे।

Google पत्रक में CORREL फ़ंक्शन सिंटैक्स

= कॉरेल (डेटा_वाई, डेटा_एक्स) 

आइए इसे इसके भागों में विभाजित करें और बेहतर ढंग से समझें कि प्रत्येक वाक्यांश का क्या अर्थ है:

  • = कोरल: यह Google शीट फ़ंक्शन है जो r निर्धारित करता है, (डेटासेट का पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक)।
  • data_y: यह सेल के समूह को संदर्भित करता है जिसमें निर्भर डेटा या उन सेल के लिए मानों की श्रेणी होती है।
  • डेटा एक्स: यह या तो स्वतंत्र डेटा वाले सेल की सरणी का संदर्भ है या उन सेल के मानों की श्रेणी है।

यदि आप डेटा बिंदुओं को ग्राफ़ करना चाहते हैं, तो data_y Y अक्ष और data_x X अक्ष होगा। आप देखेंगे कि डेटा की श्रेणी दर्ज करने के दो अलग-अलग तरीके हैं। फ़ंक्शन में या तो एक संदर्भ सेल रेंज या सीधे डेटा प्रविष्टि विकल्प हैं।

ज्यादातर मामलों में, संदर्भ कोशिकाओं की श्रेणी का उपयोग बेहतर होता है। ऐसा इसलिए है क्योंकि स्प्रैडशीट में संभवतः पहले से ही आपका डेटा शामिल है। संदर्भ सेल श्रेणी का उपयोग अत्यधिक टाइप किए गए इनपुट से बच सकता है जिसके परिणामस्वरूप उपयोगकर्ता त्रुटि हो सकती है।

Google पत्रक में CORREL फ़ंक्शन उदाहरण

Google पत्रक में CORREL फ़ंक्शन का उपयोग करने के तरीके को समझने के लिए आइए कुछ उदाहरण देखें।

उदाहरण 1: एक मजबूत सकारात्मक सहसंबंध

इस पहले उदाहरण के लिए, मान लें कि हम रियल एस्टेट उद्योग में काम कर रहे हैं। नीचे दी गई स्प्रैडशीट में, आपके द्वारा बेची जा रही हेक्टेयर भूमि के विभाजन और आपकी Google शीट में उन विभिन्न भूमि के डेटा की बेची गई इकाइयों की संख्या है।

  1. यदि आप किसी शीट में अनुसरण कर रहे हैं, तो आप अपनी स्प्रैडशीट में वेरिएबल्स के डेटा को दर्ज करके प्रारंभ करेंगे, जैसा कि नीचे दिखाया गया है:
  2. सेल पर क्लिक करें सी2
  3. प्रकार = कोरल (
  4. फिर आप data_y टाइप करने के लिए आगे बढ़ेंगे, जो हमारे मामले में संदर्भित सेल रेंज है ए2:ए6, फिर एक अल्पविराम दर्ज करें।
  5. data_x टाइप करने के लिए आगे बढ़ें, जिसे हमारे मामले में संदर्भित किया गया है बी 2: बी 6.
  6. एक क्लोजिंग ब्रैकेट के साथ समाप्त करें, जैसा कि नीचे दिखाया गया है:
  7. अंत में दबाएं प्रवेश करना सेल में डेटा के दो टुकड़ों का सहसंबंध गुणांक वापस करने के लिए सी2.

ऊपर दिखाए गए उदाहरण का उपयोग करते हुए, आपने 0.90 का सहसंबंध गुणांक प्राप्त किया है, जो एक मजबूत सकारात्मक सहसंबंध है क्योंकि इसका मान 0.9 और 1 के बीच आता है। इसलिए, यह इंगित करता है कि जैसे-जैसे y बदलता है, x भी काफी तुलनीय तरीके से बदलता है।

नीचे XY स्कैटर ग्राफ़ पर हमारे उदाहरण नमूना डेटा का प्रतिनिधित्व है। जैसा कि आप देख सकते हैं, सर्वोत्तम फिट की रेखा ग्राफ़ पर डेटा बिंदुओं के करीब है, जो इस विचार का समर्थन करती है कि आंकड़े अत्यधिक सहसंबद्ध हैं।

आप के बारे में और जान सकते हैं Google पत्रक में XY स्कैटर ग्राफ़ बनाना हमारे दूसरे लेख में।

उदाहरण 2: एक कमजोर नकारात्मक सहसंबंध

इस बार, हम अपनी स्प्रैडशीट में "वैरिएबल x और y" के अधिक सामान्य उदाहरण का उपयोग करेंगे। हमने एक नकारात्मक सहसंबंध प्रदर्शित करने के लिए जानबूझकर आंकड़े शामिल किए हैं, जो कॉरेल फ़ंक्शन नीचे प्रदर्शित करता है:

चर y और x के बीच कोई मजबूत संबंध नहीं है, इसलिए हमें जो परिणाम मिलता है वह पिछले उदाहरण की तुलना में कम महत्वपूर्ण सहसंबंध गुणांक है। हमने जो परिणाम प्राप्त किया वह -0.47 है। हालांकि, इसका मतलब यह नहीं है कि कोई संबंध नहीं है। आइए इसे समझने के लिए फिर से सर्वश्रेष्ठ फ़िट की एक पंक्ति देखें।

जैसा कि आप स्कैटर प्लॉट द्वारा देख सकते हैं, डेटा बिंदु सर्वोत्तम फिट की रेखा से आगे हैं। इसलिए, पहले उदाहरण की तुलना में कम सहसंबंध है, लेकिन कोई नहीं। आप यह भी देखेंगे कि सर्वोत्तम फ़िट की रेखा घट रही है। यह एक नकारात्मक सहसंबंध दिखाता है, एक मूल्य घटता है क्योंकि दूसरा बढ़ता है।

उदाहरण 3: कोई कनेक्शन नहीं

यहां हमारे पास पूरी तरह यादृच्छिक संख्याओं का एक सेट है। आइए जल्दी से देखें कि कोरेल फ़ंक्शन का फिर से उपयोग कैसे करें:

  1. सेल में टाइप करें सी2 कोरल सूत्र
  2. हमारे तर्क हैं ए2:ए10 और बी 2: बी 10
  3. एंटर मारो

C2 पर लौटाया गया मान 0.02 है। यदि एक सहसंबंध गुणांक 0.01 और 0.1 के बीच आता है, तो यह निर्धारित किया जाता है कि प्रश्न में चर सहसंबंधित नहीं होते हैं क्योंकि उनके बीच कोई स्पष्ट संबंध नहीं है। चरों के बीच संबंध पूरी तरह से स्वतंत्र होते हैं।

नीचे स्कैटर ग्राफ पर उसी का प्रतिनिधित्व है। सर्वोत्तम फ़िट की रेखा लगभग सपाट है, जो दो डेटा सेटों के बीच थोड़ा सा सहसंबंध दर्शाती है।

Google पत्रक में अपने डेटा को आसानी से सहसंबंधित करें

सहसंबंध एक चुनौतीपूर्ण विषय हो सकता है यदि आपने हाई स्कूल में इसके साथ ज्यादा काम नहीं किया। इस मार्गदर्शिका में सभी मूल बातें शामिल हैं, लेकिन आपको इसे अपने दिमाग में ताज़ा रखने के लिए Google पत्रक में CORREL फ़ंक्शन का उपयोग करते रहना होगा।

यह एक शक्तिशाली कार्य है क्योंकि यह स्कैटर ग्राफ़ के निर्माण से बचने में मदद करता है और आपके डेटा में रुझानों को जल्दी से खोज सकता है। फिर भी, अन्य उपयोगकर्ताओं को आपकी स्प्रैडशीट में डेटा को बेहतर ढंग से समझने में मदद करने के लिए चार्ट जोड़ने से न डरें।