अध्याय 06 सहसंबंध
1. परिचय
पिछले अध्यायों में आपने सीखा है कि बड़े पैमाने पर डेटा से सारांश माप कैसे तैयार किए जाते हैं और समान चरों में होने वाले परिवर्तनों को कैसे समझा जाता है। अब आप सीखेंगे कि दो चरों के बीच संबंध की जांच कैसे की जाती है।
जैसे-जैसे गर्मी बढ़ती है, पहाड़ी स्थलों पर अधिक से अधिक पर्यटक आते हैं। आइसक्रीम की बिक्री भी तेज हो जाती है। इस प्रकार, तापमान का संबंध आने वाले पर्यटकों की संख्या और आइसक्रीम की बिक्री से है। इसी तरह, जब आपके स्थानीय मंडी में टमाटर की आपूर्ति बढ़ती है, तो इसकी कीमत घट जाती है। जब स्थानीय फसल बाजार में आने लगती है, तो टमाटर की कीमत ₹40 प्रति $\mathrm{kg}$ से घटकर ₹4 प्रति kg या उससे भी कम हो जाती है। इस प्रकार, आपूर्ति का संबंध कीमत से है। सहसंबंध विश्लेषण (correlation analysis) ऐसे संबंधों को व्यवस्थित रूप से जांचने का एक साधन है। यह ऐसे प्रश्नों से संबंधित है:
- क्या दो चरों के बीच कोई संबंध है?
- यदि एक चर का मान बदलता है, तो क्या दूसरे चर का मान भी बदलता है?
- क्या दोनों चर एक ही दिशा में बढ़ते या घटते हैं?
- संबंध कितना मजबूत है?
2. संबंध के प्रकार
आइए विभिन्न प्रकार के संबंधों को देखें। किसी वस्तु की मांग में आंदोलन और उसकी कीमत के बीच संबंध मांग के सिद्धांत का एक अभिन्न हिस्सा है, जिसे आप कक्षा बारहवीं में पढ़ेंगे। कृषि उत्पादकता का कम होना कम वर्षा से संबंधित है। ऐसे संबंधों के उदाहरणों को कारण और प्रभाव की व्याख्या दी जा सकती है। अन्य केवल संयोग हो सकते हैं। किसी अभयारण्य में प्रवासी पक्षियों के आगमन और स्थानीय जन्म दर के बीच संबंध को कोई कारण और प्रभाव की व्याख्या नहीं दी जा सकती। ये संबंध केवल संयोग हैं। जूते के आकार और आपकी जेब में पैसों के बीच संबंध एक और ऐसा ही उदाहरण है। यदि संबंध मौजूद भी हैं, तो उन्हें समझाना कठिन है।
एक अन्य उदाहरण में, दो चरों पर किसी तीसरे चर का प्रभाव उन दोनों के बीच संबंध उत्पन्न कर सकता है। आइसक्रीम की तेज बिक्री डूबने से होने वाली मौतों की अधिक संख्या से संबंधित हो सकती है। पीड़ित आइसक्रीम खाने से नहीं डूबते। तापमान बढ़ने से आइसक्रीम की तेज बिक्री होती है। इसके अलावा, अधिक संख्या में लोग गर्मी से बचने के लिए स्विमिंग पूल जाने लगते हैं। इससे डूबने से होने वाली मौतों की संख्या बढ़ सकती है। इस प्रकार, आइसक्रीम की बिक्री और डूबने से होने वाली मौतों के बीच उच्च सहसंबंध के पीछे तापमान है।
सहसंबंध क्या मापता है?
सहसंबंध चरों के बीच संबंध की दिशा और तीव्रता का अध्ययन और मापन करता है। सहसंबंध सह-परिवर्तन को मापता है, कारण-प्रभाव को नहीं। सहसंबंध को कभी भी कारण और प्रभाव संबंध का तात्पर्य मानकर व्याख्यायित नहीं करना चाहिए। दो चरों $\mathrm{X}$ और Y के बीच सहसंबंध की उपस्थिति का सरल अर्थ यह है कि जब एक चर का मान एक दिशा में बदलता है, तो दूसरे चर का मान या तो उसी दिशा में (अर्थात् धनात्मक परिवर्तन) या विपरीत दिशा में (अर्थात् ऋणात्मक परिवर्तन) परंतु एक निश्चित तरीके से बदलता है। सरलता के लिए हम यहाँ यह मान लेते हैं कि सहसंबंध, यदि विद्यमान है, तो रेखीय है, अर्थात् दोनों चरों की सापेक्ष गति को ग्राफ पेपर पर एक सीधी रेखा खींचकर दर्शाया जा सकता है।
सहसंबंध के प्रकार
सहसंबंध को आमतौर पर ऋणात्मक और धनात्मक सहसंबंध में वर्गीकृत किया जाता है। सहसंबंध को धनात्मक कहा जाता है जब चर एक ही दिशा में साथ-साथ चलते हैं। जब आय बढ़ती है, खपत भी बढ़ती है। जब आय घटती है, खपत भी घटती है। आइसक्रीम की बिक्री और तापमान एक ही दिशा में चलते हैं। सहसंबंध ऋणात्मक होता है जब वे विपरीत दिशाओं में चलते हैं। जब सेब की कीमतें गिरती हैं तो इसकी मांग बढ़ती है। जब कीमतें बढ़ती हैं तो इसकी मांग घटती है। जब आप अध्ययन में अधिक समय बिताते हैं, तो आपके फेल होने की संभावना घटती है। जब आप अपनी पढ़ाई में कम घंटे बिताते हैं, तो कम अंक/ग्रेड प्राप्त करने की संभावना बढ़ती है। ये ऋणात्मक सहसंबंध के उदाहरण हैं। चर विपरीत दिशा में चलते हैं।
3. सहसंबंध को मापने की तकनीकें
सहसंबंध का अध्ययन करने के लिए प्रयुक्त तीन महत्वपूर्ण उपकरण हैं: बिखरा हुआ आरेख, कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन का क्रम सहसंबंध।
बिखरा हुआ आरेख दृश्य रूप से संबंध की प्रकृति को प्रस्तुत करता है बिना किसी विशिष्ट संख्यात्मक मान के। दो चरों के बीच रैखिक संबंध का संख्यात्मक माप कार्ल पियर्सन का सहसंबंध गुणांक देता है। एक संबंध को रैखिक कहा जाता है यदि उसे एक सीधी रेखा द्वारा दर्शाया जा सकता है। स्पीयरमैन का सहसंबंध गुणांक उन रैंकों के बीच रैखिक संबंध मापता है जो व्यक्तिगत वस्तुओं को उनके गुणों के अनुसार दिए जाते हैं। गुण वे चर होते हैं जिन्हें संख्यात्मक रूप से मापा नहीं जा सकता, जैसे लोगों की बुद्धिमत्ता, शारीरिक सौंदर्य, ईमानदारी आदि।
बिखरा हुआ आरेख
बिखरा हुआ आरेख संबंध के रूप को दृश्य रूप से परीक्षित करने की एक उपयोगी तकनीक है, बिना किसी संख्यात्मक मान की गणना किए। इस तकनीक में, दो चरों के मानों को ग्राफ पेपर पर बिंदुओं के रूप में प्लॉट किया जाता है। बिखरे हुए आरेख से संबंध की प्रकृति का काफी अच्छा अनुमान लगाया जा सकता है। बिखरे हुए आरेख में, बिखरे बिंदुओं की निकटता की डिग्री और उनकी समग्र दिशा हमें संबंध की जांच करने में सक्षम बनाती है। यदि सभी बिंदु एक रेखा पर स्थित हैं, तो सहसंबंध पूर्ण होता है और इसे एकता में कहा जाता है। यदि बिखरे बिंदु रेखा के चारों ओर व्यापक रूप से फैले हुए हैं, तो सहसंबंध कम होता है। यदि बिखरे बिंदु किसी रेखा के पास या रेखा पर स्थित हैं, तो सहसंबंध को रैखिक कहा जाता है।
फिगर 6.1 से फिगर 6.5 तक फैले हुए बिखरे हुए आरेख हमें दो चरों के बीच संबंध की एक झलक देते हैं। फिगर 6.1 में ऊपर की ओर बढ़ती रेखा के आसपास बिंदुओं का बिखराव दिखता है, जिससे पता चलता है कि चर एक ही दिशा में चल रहे हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ भी बढ़ता है। यह सकारात्मक सहसंबंध है। फिगर 6.2 में बिंदु नीचे की ओर झुकी रेखा के आसपास बिखरे हुए हैं। इस बार चर विपरीत दिशा में चलते हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ घटता है और इसका विपरीत भी सच है। यह नकारात्मक सहसंबंध है। फिगर 6.3 में न तो ऊपर की ओर बढ़ती और न ही नीचे की ओर झुकी कोई रेखा है जिसके आसपास बिंदु बिखरे हों। यह सहसंबंध के अभाव का उदाहरण है। फिगर 6.4 और फिगर 6.5 में बिंदु अब ऊपर की ओर बढ़ती या नीचे की ओर गिरती रेखा के आसपास नहीं बिखरे हैं, बल्कि स्वयं रेखाओं पर स्थित हैं। इन्हें क्रमशः पूर्ण सकारात्मक सहसंबंध और पूर्ण नकारात्मक सहसंबंध कहा जाता है।
गतिविधि
- अपनी कक्षा के कक्षा $X$ के विद्यार्थियों की ऊँचाई, वजन और किन्हीं दो विषयों में प्राप्त अंकों के आँकड़े इकट्ठा कीजिए। इन चरों में से दो-दो को लेकर बिखरे हुए आरेख खींचिए। आपको किस प्रकार का संबंध दिखाई देता है?
बिखरे हुए आरेख का सावधानीपूर्वक अवलोकन संबंध की प्रकृति और तीव्रता का अनुमान देता है।
कार्ल पियर्सन का सहसंबंध गुणांक
इसे प्रोडक्ट मोमेंट कोरिलेशन को-एफिशिएंट या सिंपल कोरिलेशन को-एफिशिएंट भी कहा जाता है। यह दो चरों $\mathrm{X}$ और $Y$ के बीच रैखिक संबंध की डिग्री का एक सटीक संख्यात्मक मान देता है।
यह ध्यान देना महत्वपूर्ण है कि कार्ल पियर्सन का कोरिलेशन को-एफिशिएंट तभी प्रयोग किया जाना चाहिए जब चरों के बीच रैखिक संबंध हो। जब $\mathrm{X}$ और $\mathrm{Y}$ के बीच गैर-रैखिक संबंध हो, तो कार्ल पियर्सन का कोरिलेशन को-एफिशिएंट गणना करना भ्रामक हो सकता है। इस प्रकार, यदि सच्चा संबंध रैखिक प्रकार का है जैसा कि आकृतियों 6.1, $6.2,6.4$ और 6.5 में दिखाए गए स्कैटर आरेखों द्वारा प्रदर्शित है, तो कार्ल पियर्सन का कोरिलेशन को-एफिशिएंट गणना किया जाना चाहिए और यह हमें चरों के बीच संबंध की दिशा और तीव्रता बताएगा। लेकिन यदि सच्चा संबंध आकृतियों 6.6 या 6.7 में दिखाए गए स्कैटर आरेखों के प्रकार का है, तो इसका अर्थ है कि $\mathrm{X}$ और $\mathrm{Y}$ के बीच गैर-रैखिक संबंध है और हमें कार्ल पियर्सन का कोरिलेशन को-एफिशिएंट प्रयोग करने का प्रयास नहीं करना चाहिए।
इसलिए, कार्ल पियर्सन का कोरिलेशन को-एफिशिएंट गणना करने से पहले चरों के बीच संबंध के स्कैटर आरेख की जांच करना उचित है।
मान लीजिए $X _{1}, X _{2}, \ldots, X _{N}$ क्रमशः $X$ के $N$ मान हैं और $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$ क्रमशः Y के संगत मान हैं। आगे की प्रस्तुतियों में सरलता के लिए इकाई को दर्शाने वाले उपसर्ग हटा दिए गए हैं। $\mathrm{X}$ और $\mathrm{Y}$ के समांतर माध्य इस प्रकार परिभाषित हैं
$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$
और उनके प्रसरण इस प्रकार हैं
$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$
और $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$
$\mathrm{X}$ और $\mathrm{Y}$ के मानक विचलन क्रमशः उनके प्रसरणों के धनात्मक वर्गमूल होते हैं। $\mathrm{X}$ और $\mathrm{Y}$ का सहप्रसरण इस प्रकार परिभाषित है
$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$
जहाँ $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ और $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के $i^{\text {th }}$ मानों और उनके माध्य मानों के बीच विचलन हैं।
$\mathrm{X}$ और $\mathrm{Y}$ के बीच सहप्रसरण का चिह्न सहसंबंध गुणांक के चिह्न को निर्धारित करता है। मानक विचलन सदैव धनात्मक होते हैं। यदि सहप्रसरण शून्य हो, तो सहसंबंध गुणांक सदैव शून्य होता है। उत्पाद आघूर्ण सहसंबंध या कार्ल पियर्सन का सहसंबंध माप निम्नलिखित है
$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$
या
$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$
या
$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$
या
$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$
सहसंबंध गुणांक के गुण
आइए अब हम सहसंबंध गुणांक के गुणों की चर्चा करें
- $r$ की कोई इकाई नहीं होती। यह एक शुद्ध संख्या है। इसका अर्थ है कि मापन की इकाइयाँ $r$ का हिस्सा नहीं होतीं। उदाहरण के लिए, फुट में ऊँचाई और किलोग्राम में वज़न के बीच $r$ का मान कहें 0.7 हो सकता है।
- $r$ का ऋणात्मक मान एक व्युत्क्रम संबंध को दर्शाता है। एक चर में परिवर्तन दूसरे चर में विपरीत दिशा में परिवर्तन के साथ जुड़ा होता है। जब किसी वस्तु की कीमत बढ़ती है, तो उसकी मांग घट जाती है। जब ब्याज दर बढ़ती है, तो धन की मांग भी घट जाती है, क्योंकि अब धन महँगा हो गया है।
- यदि $r$ धनात्मक है, तो दोनों चर एक ही दिशा में चलते हैं। जब चाय के विकल्प के रूप में कॉफ़ी की कीमत बढ़ती है, तो चाय की मांग भी बढ़ जाती है। सिंचाई की सुविधाओं में सुधार अधिक उत्पादन से जुड़ा होता है। जब तापमान बढ़ता है, तो आइसक्रीम की बिक्री तेज हो जाती है।
- सहसंबंध गुणांक का मान ऋण एक और धन एक के बीच होता है, $-1 \leq r \leq 1$। यदि किसी गणना में $r$ का मान इस सीमा से बाहर हो, तो यह गणना में त्रुटि को दर्शाता है।
- $r$ का परिमाण मूल बिंदु में परिवर्तन और स्केल में परिवर्तन से अप्रभावित रहता है। दो चर $\mathrm{X}$ और $\mathrm{Y}$ दिए गए हैं, आइए दो नए चर परिभाषित करें।
$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$
जहाँ $A$ और $C$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के मान लिए गए माध्य हैं। $\mathrm{B}$ और $\mathrm{D}$ उभयनिष्ठ गुणनखंड हैं और एक ही चिह्न के हैं। तब
$r _{x y}=r _{u v}$
यह गुण सहसंबंध गुणांक को अत्यंत सरल तरीके से, जैसे कि पद विचलन विधि में, परिकलित करने के लिए प्रयुक्त होता है।
- यदि $r=0$ तो दो चर असहसंबद्ध हैं। उनके बीच कोई रैखिक संबंध नहीं है। फिर भी अन्य प्रकार का संबंध हो सकता है।
- यदि $r=1$ या $r=-1$ तो सहसंबंध पूर्ण है और सटीक रैखिक संबंध है।
- $r$ का उच्च मान प्रबल रैखिक संबंध को दर्शाता है। इसका मान उच्च कहा जाता है जब वह +1 या -1 के निकट हो।
- $r$ का निम्न मान (शून्य के निकट) दुर्बल रैखिक संबंध को दर्शाता है। परंतु कोई अरैखिक संबंध हो सकता है।
जैसा कि आपने अध्याय 1 में पढ़ा है, सांख्यिकीय विधियां सामान्य बुद्धि का विकल्प नहीं हैं। यहाँ एक और उदाहरण है, जो सहसंबंध की गणना और व्याख्या करने से पहले डेटा को ठीक से समझने की आवश्यकता को उजागर करता है। कुछ गाँवों में एक महामारी फैलती है और सरकार प्रभावित गाँवों में डॉक्टरों की एक टीम भेजती है। गाँवों में भेजे गए डॉक्टरों की संख्या और मौतों की संख्या के बीच सहसंबंध सकारात्मक पाया गया है। सामान्यतः, डॉक्टरों द्वारा दी जाने वाली स्वास्थ्य सेवाओं से मौतों की संख्या में कमी आने की उम्मीद की जाती है, जिससे एक नकारात्मक सहसंबंध दिखाई देता है। यह अन्य कारणों से हुआ। डेटा एक विशिष्ट समय अवधि से संबंधित है। रिपोर्ट की गई कई मौतें ऐसे अंतिम चरण के मामले हो सकते हैं जहाँ डॉक्टर कुछ नहीं कर सकते थे। इसके अतिरिक्त, डॉक्टरों की उपस्थिति का लाभ कुछ समय बाद ही दिखाई देता है। यह भी संभव है कि रिपोर्ट की गई मौतें महामारी के कारण न हों। राज्य में अचानक एक सूनामी आती है और मृतकों की संख्या बढ़ जाती है।
आइए किसानों की स्कूली शिक्षा के वर्षों और प्रति एकड़ वार्षिक उपज के बीच संबंध की जाँच करके $r$ की गणना को दर्शाएं।
उदाहरण 1
| किसानों की स्कूली शिक्षा के वर्षों की संख्या | वार्षिक उपज प्रति एकड़ ‘Ooo (रु) में |
|---|---|
| 0 | 4 |
| 2 | 4 |
| 4 | 6 |
| 6 | 10 |
| 8 | 10 |
| 10 | 8 |
| 12 | 7 |
सूत्र 1 को $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ का मान चाहिए
तालिका 6.1 से हमें मिलता है,
$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$
इन मानों को सूत्र (1) में रखने पर
$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$
इसी मान को सूत्र (2) से भी प्राप्त किया जा सकता है।
$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$
इस प्रकार, किसानों की शिक्षा के वर्ष और प्रति एकड़ वार्षिक उपज सकारात्मक रूप से सहसंबद्ध हैं। r का मान भी बड़ा है। इसका तात्पर्य है कि किसान जितने अधिक वर्षों तक शिक्षा में निवेश करते हैं, उपज प्रति एकड़ उतनी ही अधिक होगी। यह किसानों की शिक्षा के महत्व को रेखांकित करता है।
सूत्र (3) का उपयोग करने के लिए
TABLE 6.1 किसानों की स्कूली शिक्षा के वर्षों और वार्षिक उपज के बीच r की गणना
| शिक्षा के वर्ष (X) | $(X-\bar{X})$ | $(X-\bar{X})^{2}$ | एकड़ प्रति वार्षिक उत्पादन ‘000 रु में (Y) | $(Y-\bar{Y})$ | $(Y-\bar{Y})^{2}$ | $(X-\bar{X})(Y-\bar{Y})$ |
|---|---|---|---|---|---|---|
| 0 | -6 | 36 | 4 | -3 | 9 | 18 |
| 2 | -4 | 16 | 4 | -3 | 9 | 12 |
| 4 | -2 | 4 | 6 | -1 | 1 | 2 |
| 6 | 0 | 0 | 10 | 3 | 9 | 0 |
| 8 | 2 | 4 | 10 | 3 | 9 | 6 |
| 10 | 4 | 16 | 8 | 1 | 1 | 4 |
| 12 | 6 | 36 | 7 | 0 | 0 | 0 |
| $\Sigma X=42$ | $\sum (X-\overline{\mathrm{X}})^{2}=112$ | $\Sigma Y=49$ | $\Sigma(Y-\bar{Y})^{2}=38$ | $\Sigma(X-\bar{X})(Y-\bar{Y})=42$ |
$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$
निम्नलिखित व्यंजकों के मानों की गणना करनी होगी अर्थात्
$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$.
अब $r$ का मान प्राप्त करने के लिए सूत्र (3) लागू करें।
आइए $r$ के विभिन्न मानों की व्याख्या जानें। अंग्रेज़ी और सांख्यिकी में प्राप्त अंकों के बीच सहसंबंध गुणांक, मान लीजिए, 0.1 है। इसका अर्थ है कि यद्यपि दोनों विषयों में प्राप्त अंक सकारात्मक रूप से सहसंबद्ध हैं, संबंध की ताकत कमज़ोर है। अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थियों को सांख्यिकी में अपेक्षाकृत कम अंक मिल सकते हैं। यदि $r$ का मान, मान लीजिए, 0.9 होता, तो अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी निश्चित रूप से सांख्यिकी में भी अधिक अंक प्राप्त करते।
एक उदाहरण ऋणात्मक सहसंबंध का है स्थानीय मंडी में सब्जियों के आगमन और सब्जियों की कीमत के बीच संबंध। यदि $r$ -0.9 है, तो स्थानीय मंडी में सब्जी की आपूर्ति के साथ सब्जियों की कीमत कम होगी। यदि यह -0.1 होता, तो बड़ी मात्रा में सब्जी की आपूर्ति के साथ कीमत कम होती, लेकिन उतनी नहीं जितनी तब होती जब $r$ -0.9 होता है। कीमत में गिरावट की मात्रा $r$ के परम मान पर निर्भर करती है। यदि यह शून्य होता, तो बाजार में बड़ी आपूर्ति के बावजूद कीमत में कोई गिरावट नहीं आती। यह संभावना भी है यदि आपूर्ति में वृद्धि का ख्याल एक अच्छे परिवहन नेटवर्क द्वारा रखा जाता है जो इसे अन्य बाजारों में स्थानांतरित कर देता है।
गतिविधि
- निम्नलिखित सारणी को देखें। चालू कीमत पर राष्ट्रीय आय की वार्षिक वृद्धि और GDP के प्रतिशत के रूप में सकल घरेलू बचत के बीच $r$ की गणना करें।
सहसंबंध गुणांक की गणना के लिए पद विचलन विधि।
जब चरों के मान बड़े हों, तो गणना के बोझ को काफी कम किया जा सकता है $r$ के एक गुणधर्म का उपयोग करके। यह है कि $r$ मूल और स्केल में परिवर्तन से स्वतंत्र होता है। इसे पद विचलन विधि भी कहा जाता है। इसमें चरों $\mathrm{X}$ और $\mathrm{Y}$ का रूपांतरण इस प्रकार किया जाता है:
TABLE 6.2
| वर्ष | राष्ट्रीय आय की वार्षिक वृद्धि |
GDP के प्रतिशत के रूप में सकल घरेलू बचत |
|---|---|---|
| 1992-93 | 14 | 24 |
| 1993-94 | 17 | 23 |
| 1994-95 | 18 | 26 |
| 1995-96 | 17 | 27 |
| 1996-97 | 16 | 25 |
| 1997-98 | 12 | 25 |
| 1998-99 | 16 | 23 |
| 1999-00 | 11 | 25 |
| 2000-01 | 8 | 24 |
| 2001-02 | 10 | 23 |
स्रोत: आर्थिक सर्वेक्षण, (2004-05) पृ. 8,9
$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$
जहाँ $A$ और $B$ माना गया माध्य है, $h$ और $\mathrm{k}$ सामान्य गुणक हैं और समान चिन्ह रखते हैं।
तब $\mathrm{r} _{\mathrm{uv}}=\mathrm{r} _{\mathrm{XY}}$
इसे मूल्य सूचकांक और मुद्रा आपूर्ति के बीच सहसंबंध के विश्लेषण के अभ्यास से चित्रित किया जा सकता है।
उदाहरण 2
मूल्य सूचकांक $(\mathrm{X})$ $ 120 \quad 150 \quad 190 \quad 220 \quad 230$
रूपये करोड़ में मुद्रा आपूर्ति $(\mathrm{Y})$ $\quad 1800 \quad 2000 \quad 2500 \quad 2700 \quad 3000$
सरलीकरण, चरण विचलन विधि का उपयोग करके नीचे चित्रित किया गया है। मान लीजिए $\mathrm{A}=100 ; \mathrm{h}=10 ; \mathrm{B}=1700$ और $\mathrm{k}=100$
रूपांतरित चरों की सारणी इस प्रकार है:
चरण विचलन विधि का उपयोग करके मूल्य सूचकांक और मुद्रा आपूर्ति के बीच $r$ की गणना
सारणी 6.3
| $U$ | $V$ | |||
|---|---|---|---|---|
| $\left(\frac{\mathrm{x}-100}{10}\right)$ | $\left(\frac{\mathrm{y}-1700}{100}\right)$ | $U^{2}$ | $V^{2}$ | $U V$ |
| 2 | 1 | 4 | 1 | 2 |
| 5 | 3 | 25 | 9 | 15 |
| 9 | 8 | 81 | 64 | 72 |
| 12 | 10 | 144 | 100 | 120 |
| 13 | 13 | 169 | 169 | 169 |
$\Sigma \mathrm{U}=41 ; \Sigma \mathrm{U}=35 ; \Sigma \mathrm{U}^{2}=423 ;$ $\Sigma \mathrm{V}^{2}=343 ; \Sigma \mathrm{UV}=378$
इन मानों को सूत्र (3) में रखने पर
$$ \begin{aligned} & \mathrm{r}=\frac{\Sigma \mathrm{UV}-\frac{(\Sigma \mathrm{U})(\Sigma \mathrm{U})}{\mathrm{N}}}{\sqrt{\Sigma \mathrm{U}^{2}-\frac{(\Sigma \mathrm{U})^{2}}{\mathrm{~N}}} \sqrt{\Sigma \mathrm{V}^{2}-\frac{(\Sigma \mathrm{V})^{2}}{\mathrm{~N}}}} …(3) \end{aligned} $$
$$=\frac{378-\frac{41 \times 35}{5}}{\sqrt{423-\frac{(41)^2}{5}}\sqrt{343-\frac{(35)^2}{5}}}$$
$$ \begin{aligned} & =0.98 \end{aligned} $$
मूल्य सूचकांक और मुद्रा आपूर्ति के बीच मजबूत सकारात्मक सहसंबंध मौद्रिक नीति की एक महत्वपूर्ण आधारशिला है। जब मुद्रा आपूर्ति बढ़ती है तो मूल्य सूचकांक भी बढ़ता है।
गतिविधि
- भारत की जनसंख्या और राष्ट्रीय आय से संबंधित आंकड़ों का उपयोग कर, पद विचलन विधि से उनके बीच सहसंबंध की गणना करें।
स्पीयरमैन का रैंक सहसंबंध
स्पीयरमैन का रैंक सहसंबंध ब्रिटिश मनोवैज्ञानिक सी.ई. स्पीयरमैन द्वारा विकसित किया गया था। इसका उपयोग निम्नलिखित परिस्थितियों में किया जाता है:
-
मान लीजिए हम किसी दूरदराज़ गाँव के विद्यार्थियों की लम्बाई और वज़न के बीच सहसंबंध का अनुमान लगाने का प्रयास कर रहे हैं, जहाँ न तो मापने वाली छड़ें हैं और न ही तोलने वाली मशीनें। ऐसी स्थिति में हम लम्बाई या वज़न को माप नहीं सकते, पर हम विद्यार्थियों को वज़न और लम्बाई के अनुसार क्रमबद्ध अवश्य कर सकते हैं। इन क्रमों का उपयोग करके स्पीयरमैन का क्रम सहसंबंध गुणांक परिकलित किया जा सकता है।
-
मान लीजिए हम ऐसी चीज़ों से निपट रहे हैं जैसे निष्पक्षता, ईमानदारी या सौंदर्य। इन्हें उसी तरह मापा नहीं जा सकता जैसे हम आय, वज़न या लम्बाई मापते हैं। अधिकतम इन्हें सापेक्ष रूप से मापा जा सकता है, उदाहरण के लिए हम लोगों को सौंदर्य के अनुसार क्रमबद्ध कर सकते हैं (कुछ लोग तर्क देंगे कि यह भी संभव नहीं है क्योंकि सौंदर्य के मानदंड और मापदंड व्यक्ति-दर-व्यक्ति और संस्कृति-दर-संस्कृति भिन्न हो सकते हैं)। यदि हम चरों के बीच सम्बन्ध ज्ञात करना चाहते हैं, जिनमें से कम-से-कम एक इस प्रकार का है, तो स्पीयरमैन का क्रम सहसंबंध गुणांक प्रयुक्त किया जाता है।
-
स्पीयरमैन का क्रम सहसंबंध गुणांक कुछ ऐसे मामलों में प्रयुक्त किया जा सकता है जहाँ कोई सम्बन्ध है जिसकी दिशा स्पष्ट है परन्तु वह रैखिक नहीं है, जैसा कि आकृति 6.6 और 6.7 में दिखाए गए प्रकार के बिखर आरेखों में प्रकट होता है।
-
स्पीयरमैन का सहसंबंध गुणांक चरम मानों से प्रभावित नहीं होता। इस दृष्टि से यह कार्ल पियर्सन के सहसंबंध गुणांक से बेहतर है। इस प्रकार यदि आँकड़ों में कुछ चरम मान हों, तो स्पीयरमैन का सहसंबंध गुणांक अत्यंत उपयोगी हो सकता है।
रैंक सहसंबंध गुणांक और सरल सहसंबंध गुणांक की व्याख्या समान होती है। इसका सूत्र सरल सहसंबंध गुणांक से व्युत्पन्न किया गया है जहाँ व्यक्तिगत मानों को रैंकों से प्रतिस्थापित किया गया है। ये रैंक सहसंबंध की गणना के लिए प्रयोग किए जाते हैं। यह गुणांक इकाइयों को दी गई रैंकों के बीच रैखिक संघनन का माप प्रदान करता है, न कि उनके मानों का। स्पीयरमैन का रैंक सहसंबंध सूत्र है
$$ \begin{equation*} r _{a}=1-\frac{6 \sum D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$
जहाँ $n$ प्रेक्षणों की संख्या है और $\mathrm{D}$ एक चर को दी गई रैंकों से दूसरे चर को दी गई रैंकों का विचलन है।
सरल सहसंबंध गुणांक के सभी गुण यहाँ लागू होते हैं। पीर्सोनियन सहसंबंध गुणांक की तरह यह 1 और -1 के बीच होता है। हालाँकि, आमतौर पर यह साधारण विधि के समान सटीक नहीं होता है। यह इस तथ्य के कारण है कि डेटा से संबंधित सभी सूचना का उपयोग नहीं किया जाता है।
पहला अंतर क्रमागत मानों का अंतर होता है। श्रृंखला में वस्तुओं के मानों के पहले अंतर, जिन्हें परिमाण के क्रम में व्यवस्थित किया गया है, लगभग कभी स्थिर नहीं होते हैं। आमतौर पर डेटा केंद्रीय मानों के आसपास समूहित होते हैं जहाँ अभिक्रम के मध्य में छोटे अंतर होते हैं।
यदि पहले अंतर स्थिर होते, तो $r$ और $r _{\mathrm{k}}$ समान परिणाम देते। सामान्यतः $r _{\mathrm{k}$}, $r$ से कम या उसके बराबर होता है।
रैंक सहसंबंध गुणांक की गणना
रैंक सहसंबंध की गणना को तीन परिस्थितियों में दिखाया जाएगा।
- रैंक दी गई हैं।
- रैंक नहीं दी गई हैं। उन्हें आंकड़ों से निकालना होगा।
- रैंक दोहराई गई हैं।
स्थिति 1: जब रैंक दी गई हों
उदाहरण 3
एक सौंदर्य प्रतियोगिता में पाँच व्यक्तियों का मूल्यांकन तीन न्यायाधीशों द्वारा किया गया है। हमें यह पता लगाना है कि न्यायाधीशों का कौन-सा युग्म सौंदर्य की सामान्य धारणा के सर्वाधिक निकट है।
प्रतिभागी
| न्यायाधीश | 1 | 2 | 3 | 4 | 5 | |
|---|---|---|---|---|---|---|
| A | 1 | 2 | 3 | 4 | 5 | |
| B | 2 | 4 | 1 | 5 | 3 | |
| C | 1 | 3 | 5 | 2 | 4 |
न्यायाधीशों के तीन युग्म हैं, जिनके लिए रैंक सहसंबंध तीन बार गिनना होगा। सूत्र (4) का प्रयोग किया जाएगा।
$$ \begin{equation*} \mathrm{r} _{\mathrm{s}}=1-\frac{6 \Sigma \mathrm{D}^{2}}{\mathrm{n}^{3}-\mathrm{n}} \tag{4} \end{equation*} $$
A और B के बीच रैंक सहसंबंध इस प्रकार गिना जाता है:
| $A$ | $B$ | $D$ | $D^{2}$ |
|---|---|---|---|
| 1 | 2 | -1 | 1 |
| 2 | 4 | -2 | 4 |
| 3 | 1 | 2 | 4 |
| 4 | 5 | -1 | 1 |
| 5 | 3 | 2 | 4 |
| योग | 14 |
इन मानों को सूत्र (4) में रखने पर
$$ \begin{equation*} r _{s}=1-\frac{6 \Sigma D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$
$=1-\frac{6 \times 14}{5^{3}-5}=1-\frac{84}{120}=1-0.7=0.3$
A और $\mathrm{C}$ के बीच रैंक सहसंबंध इस प्रकार गिना जाता है:
| $A$ | $C$ | $D$ | $D^{2}$ |
|---|---|---|---|
| 1 | 1 | 0 | 0 |
| 2 | 3 | -1 | 1 |
| 3 | 5 | -2 | 4 |
| 4 | 2 | 2 | 4 |
| 5 | 4 | 1 | 1 |
| कुल | 10 |
इन मानों को सूत्र (4) में रखने पर रैंक सहसंबंध 0.5 आता है। इसी प्रकार, न्यायाधीशों $\mathrm{B}$ और $\mathrm{C}$ की रैंकिंग के बीच रैंक सहसंबंध 0.9 है। इस प्रकार, न्यायाधीशों $A$ और C की धारणाएँ सबसे अधिक निकट हैं। न्यायाधीशों B और C के स्वाद बहुत भिन्न हैं।
स्थिति 2: जब रैंक नहीं दी गई हों
उदाहरण 4
हमें 5 विद्यार्थियों द्वारा अर्थशास्त्र और सांख्यिकी में प्राप्त किए गए अंकों का प्रतिशत दिया गया है। फिर रैंकिंग निकालनी होगी और रैंक सहसंबंध की गणना करनी होगी।
| विद्यार्थी | सांख्यिकी में अंक (X) |
अर्थशास्त्र में अंक |
|---|---|---|
| (Y) | ||
| A | 85 | 60 |
| B | 60 | 48 |
| C | 55 | 49 |
| D | 65 | 50 |
| E | 75 | 55 |
| विद्यार्थी | सांख्यिकी में रैंकिंग $\left(R _{x}\right)$ |
अर्थशास्त्र में रैंकिंग $\left(R _{\gamma}\right)$ |
|---|---|---|
| A | 1 | 1 |
| B | 4 | 5 |
| C | 5 | 4 |
| D | 3 | 3 |
| E | 2 | 2 |
एक बार रैंकिंग पूरी हो जाने पर रैंक सहसंबंध की गणना के लिए सूत्र (4) का प्रयोग किया जाता है।
स्थिति 3: जब रैंक दोहराई गई हों और रैंक न दी गई हों
उदाहरण 5
मान $\mathrm{X}$ और $\mathrm{Y}$ निम्न प्रकार दिए गए हैं
| $X$ | $Y$ |
|---|---|
| 1200 | 75 |
| 1150 | 65 |
| 1000 | 50 |
| 990 | 100 |
| 800 | 90 |
| 780 | 85 |
| 760 | 90 |
| 750 | 40 |
| 730 | 50 |
| 700 | 60 |
| 620 | 50 |
| 600 | 75 |
रैंक सहसंबंध निकालने के लिए, मानों की रैंक निकाली जाती हैं। दोहराए गए मदों को सामान्य रैंक दी जाती हैं। सामान्य रैंक वह औसत रैंक होती है जो उन मदों को तब मिलती यदि वे एक-दूसरे से थोड़े भिन्न होते। अगली मद को पहले से प्राप्त रैंक के ठीक बाद वाली रैंक दी जाएगी।
यहाँ $Y$ का मान 50 है 9वें, 10वें और 11वें स्थान पर। इसलिए तीनों को औसत रैंक यानी 10 दी गई,
| रैंक $X$ की | रैंक $Y$ की | रैंक में विचलन |
$D^{2}$ |
|---|---|---|---|
| 1 | 5.5 | -4.5 | 20.25 |
| 2 | 7 | -5 | 25.00 |
| 3 | 10 | -7 | 49.00 |
| 4 | 1 | 3 | 9.00 |
| 5 | 2.5 | 2.5 | 6.25 |
| 6 | 4 | 2 | 4.00 |
| 7 | 2.5 | 4.5 | 20.25 |
| 8 | 12 | -4 | 16.00 |
| 9 | 10 | -1 | 1.00 |
| 10 | 8 | 2 | 4.00 |
| 11 | 10 | 1 | 1.00 |
| 12 | 5.5 | 6.5 | 42.25 |
| 198.00 |
जब रैंक दोहराई जाती हैं तो स्पीयरमैन के रैंक सहसंबंध गुणांक का सूत्र इस प्रकार है
$$ \begin{aligned} & \mathrm{r} _{\mathrm{s}}=1- \ \frac{6\left[\Sigma \mathrm{D}^{2}+\frac{\left(\mathrm{m} _{1}^{3}-\mathrm{m} _{1}\right)}{12}+\frac{\left(\mathrm{m} _{2}^{3}-\mathrm{m} _{2}\right)}{12}+\ldots\right]}{n\left(\mathrm{n}^{2}-1\right)} \end{aligned} $$
जहाँ $\mathrm{m} _{1}, \mathrm{~m} _{2}, \ldots$, रैंकों की पुनरावृत्तियों की संख्या हैं और $\frac{\mathrm{m}^{3}{ } _{1}-\mathrm{m} _{1}}{12} \ldots$, उनके संगत संशोधन कारक। इस डेटा के लिए आवश्यक संशोधन इस प्रकार है
$\frac{3^{3}-3}{12}+\frac{2^{3}-2}{12}=\frac{30}{12}=2.5$
इन अभिव्यक्तियों के मानों को प्रतिस्थापित करने पर
$r _{s}=1-\frac{6(198+2.5)}{12^{3}-12}=(1-0.70)=0.30$
इस प्रकार, $\mathrm{X}$ और $\mathrm{Y}$ के बीच सकारात्मक रैंक सहसंबंध है। $\mathrm{X}$ और $\mathrm{Y}$ दोनों एक ही दिशा में गतिशील हैं। हालांकि, इस संबंध को प्रबल नहीं कहा जा सकता।
गतिविधि
- कक्षा IX और X की परीक्षाओं में अपने 10 सहपाठियों द्वारा प्राप्त अंकों का डेटा एकत्र करें। उनके बीच रैंक सहसंबंध गुणांक की गणना करें। यदि आपके डेटा में कोई पुनरावृत्ति नहीं है, तो पुनः अभ्यास करें एक ऐसे डेटा सेट लेकर जिसमें पुनरावृत्त रैंक हों। ऐसी क्या परिस्थितियाँ हैं जिनमें रैंक सहसंबंध गुणांक को सरल सहसंबंध गुणांक से प्राथमिकता दी जाती है? यदि डेटा सटीक रूप से मापा गया हो, तो क्या आप अभी भी रैंक सहसंबंध गुणांक को सरल सहसंबंध गुणांक से प्राथमिकता देंगे? आप कब इस चयन के प्रति उदासीन हो सकते हैं? कक्षा में चर्चा करें।
4. निष्कर्ष
हमने दो चरों के बीच संबंध, विशेष रूप से रैखिक संबंध का अध्ययन करने की कुछ तकनीकों पर चर्चा की है। बिखरा हुआ आरेख संबंध की दृश्य प्रस्तुति देता है और यह केवल रैखिक संबंधों तक सीमित नहीं है। कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन की रैंक सहसंबंध चरों के बीच रैखिक संबंध को मापते हैं। जब चरों को सटीक रूप से मापा नहीं जा सकता, तब रैंक सहसंबंध का उपयोग किया जा सकता है। ये माप कारण-कार्य संबंध का संकेत नहीं देते। सहसंबंध का ज्ञान हमें इस बात की जानकारी देता है कि जब सहसंबंधित चर में परिवर्तन होता है, तब एक चर में परिवर्तन की दिशा और तीव्रता क्या होती है।
सारांश
- सहसंबंध विश्लेषण दो चरों के बीच संबंध का अध्ययन करता है।
- बिखरे हुए आरेख दो चरों के बीच संबंध की प्रकृति की दृश्य प्रस्तुति देते हैं।
- कार्ल पियर्सन का सहसंबंध गुणांक $r$ केवल दो चरों के बीच रैखिक संबंध को संख्यात्मक रूप से मापता है। r -1 और 1 के बीच होता है।
- जब चरों को सटीक रूप से मापा नहीं जा सकता, तब स्पीयरमैन की रैंक सहसंबंध का उपयोग करके रैखिक संबंध को संख्यात्मक रूप से मापा जा सकता है।
- दोहरी रैंकों के लिए सुधार कारक आवश्यक होते हैं।
- सहसंबंध का अर्थ कारण-कार्य संबंध नहीं होता। इसका अर्थ केवल सह-परिवर्तन होता है।
अभ्यास
1. ऊंचाई (फीट में) और वजन (किलोग्राम में) के बीच सहसंबंध गुणांक की इकाई है
(i) $\mathrm{kg} /$ feet
(ii) प्रतिशत
(iii) अस्तित्वहीन
2. सरल सहसंबंध गुणांक की सीमा है
(i) 0 से अनंत
(ii) ऋण एक से धन एक
(iii) ऋण अनंत से धन अनंत
3. यदि $r _{x y}$ धनात्मक है तो $X$ और $Y$ के बीच संबंध इस प्रकार का होता है
(i) जब $\mathrm{Y}$ बढ़ता है $\mathrm{X}$ बढ़ता है
(ii) जब $Y$ घटता है $X$ बढ़ता है
(iii) जब $\mathrm{Y}$ बढ़ता है $\mathrm{X}$ नहीं बदलता
4. यदि $r _{x y}=0$ है तो चर $X$ और $Y$ हैं
(i) रैखिक रूप से संबंधित
(ii) रैखिक रूप से संबंधित नहीं
(iii) स्वतंत्र
5. निम्नलिखित तीन मापों में से कौन-सा कोई भी प्रकार के संबंध को माप सकता है
(i) कार्ल पियर्सन का सहसंबंध गुणांक
(ii) स्पीयरमैन की क्रम सहसंबंध
(iii) बिखरा आरेख
6. यदि सटीक मापा गया डेटा उपलब्ध हो तो सरल सहसंबंध गुणांक है
(i) क्रम सहसंबंध गुणांक से अधिक सटीक
(ii) क्रम सहसंबंध गुणांक से कम सटीक
(iii) क्रम सहसंबंध गुणांक जितना ही सटीक
7. $\mathrm{r}$ को सहयोग के माप के रूप में सहप्रसरण से क्यों प्राथमिकता दी जाती है?
8. क्या $r$ डेटा के प्रकार के आधार पर -1 और 1 की सीमा के बाहर हो सकता है?
9. क्या सहसंबंध कारण-प्रभाव को दर्शाता है?
10. कब क्रम सहसंबंध सरल सहसंबंध गुणांक से अधिक सटीक होता है?
11. क्या शून्य सहसंबंध का अर्थ स्वतंत्रता होता है?
12. क्या सरल सहसंबंध गुणांक कोई भी प्रकार के संबंध को माप सकता है?
13. एक सप्ताह तक हर दिन अपने स्थानीय बाजार से पाँच सब्जियों के दाम इकट्ठा करें। उनके सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।
14. अपने सहपाठियों की ऊँचाई मापें। उनसे उनके बेंचमेट की ऊँचाई पूछें। इन दो चरों का सहसंबंध गुणांक गणना करें। परिणाम की व्याख्या करें।
15. कुछ ऐसे चरों की सूची बनाएँ जिनका सटीक माप कठिन होता है।
16. $r$ के मानों 1, –1 और 0 की व्याख्या करें।
17. रैंक सहसंबंध गुणांक पियरसोनीय सहसंबंध गुणांक से क्यों भिन्न होता है?
18. पिताओं की ऊँचाई इंच में $(\mathrm{X})$ और उनके पुत्रों की ऊँचाई $(\mathrm{Y})$ के बीच सहसंबंध गुणांक गणना करें:
$\begin{array}{lllllllll}\mathrm{X} & 65 & 66 & 57 & 67 & 68 & 69 & 70 & 72\end{array}$
$\begin{array}{lllllllll}\mathrm{Y} & 67 & 56 & 65 & 68 & 72 & 72 & 69 & 71 &\end{array}$
(उत्तर: $\mathrm{r}=0.603$ )
19. $X$ और $Y$ के बीच सहसंबंध गुणांक गणना करें और उनके संबंध पर टिप्पणी करें:
$\begin{array}{lllllllll}\mathrm{X} & -3 & -2 & -1 & 1 & 2 & 3\end{array}$
$\begin{array}{lllllllll}\mathrm{Y} & 9 & 4 & 1 & 1 & 4 & 9\end{array}$
(उत्तर: $\mathrm{r}=0$ )
20. $\mathrm{X}$ और $\mathrm{Y}$ के बीच सहसंबंध गुणांक गणना करें और उनके संबंध पर टिप्पणी करें:
$\begin{array}{lllllllll}\mathrm{X} & 1 & 3 & 4 & 5 & 7 & 8\end{array}$
$\begin{array}{lllllllll}\mathrm{Y} & 2 & 6 & 8 & 10 & 14 & 16\end{array}$
(उत्तर: $\mathrm{r}=1$ )
गतिविधि
- यहाँ चर्चा किए गए सभी सूत्रों का प्रयोग कर भारत की राष्ट्रीय आय और निर्यात के बीच $\mathrm{r}$ की गणना करें, कम से कम दस प्रेक्षण लेते हुए।