अध्याय 06 सहसंबंध

1. परिचय

पिछले अध्यायों में आपने सीखा है कि किस प्रकार बड़े पैमाने पर डेटा से सारांश मापकों का निर्माण किया जाता है और समान चरों में होने वाले परिवर्तनों को कैसे देखा जाता है। अब आप सीखेंगे कि दो चरों के बीच संबंध की जांच कैसे की जाती है। जैसे-जैसे गर्मी बढ़ती है, पहाड़ी स्थलों पर अधिक से अधिक पर्यटक आते हैं। आइसक्रीम की बिक्री तेज हो जाती है। इस प्रकार, तापमान का संबंध आने वाले पर्यटकों की संख्या और आइसक्रीम की बिक्री से होता है। इसी प्रकार, जब आपके स्थानीय मंडी में टमाटर की आपूर्ति बढ़ती है, तो इसकी कीमत गिर जाती है। जब स्थानीय फसल बाजार में आने लगती है, तो टमाटर की कीमत ₹40 प्रति $\mathrm{kg}$ से घटकर ₹4 प्रति kg या उससे भी कम हो जाती है। इस प्रकार आपूर्ति का संबंध कीमत से होता है। सहसंबंध विश्लेषण ऐसे संबंधों की व्यवस्थित रूप से जांच करने का एक साधन है। यह ऐसे प्रश्नों से संबंधित है:

  • क्या दो चरों के बीच कोई संबंध है?
  • क्या एक चर का मान बदलने पर दूसरे का मान भी बदलता है?
  • क्या दोनों चर एक ही दिशा में बढ़ते हैं?
  • संबंध कितना मजबूत है?

2. संबंध के प्रकार

आइए विभिन्न प्रकार के संबंधों को देखें। किसी वस्तु की मांग में आंदोलन और उसकी कीमत के बीच का संबंध मांग के सिद्धांत का एक अभिन्न हिस्सा है, जिसे आप कक्षा बारहवीं में पढ़ेंगे। कृषि उत्पादकता का कम होना कम वर्षा से संबंधित है। संबंध के ऐसे उदाहरणों को कारण और प्रभाव की व्याख्या दी जा सकती है। अन्य केवल संयोग हो सकते हैं। एक अभयारण्य में प्रवासी पक्षियों के आगमन और स्थानीय जन्म दर के बीच के संबंध को कोई कारण और प्रभाव की व्याख्या नहीं दी जा सकती। ये संबंध केवल संयोग हैं। जूते के आकार और आपकी जेब में पैसों के बीच का संबंध भी ऐसा ही एक उदाहरण है। यदि संबंध मौजूद भी हैं, तो उन्हें समझाना कठिन है।

एक अन्य उदाहरण में, दो चरों पर किसी तीसरे चर का प्रभाव उन दोनों के बीच एक संबंध उत्पन्न कर सकता है। आइसक्रीम की तेज बिकनी डूबने से होने वाली मौतों की बड़ी संख्या से संबंधित हो सकती है। पीड़ित आइसक्रीम खाने से नहीं डूबते। तापमान बढ़ने से आइसक्रीम की तेज बिकनी होती है। इसके अतिरिक्त, गर्मी से बचने के लिए बड़ी संख्या में लोग तैराकी पूलों में जाने लगते हैं। इससे डूबने से मौतों की संख्या बढ़ सकती है। इस प्रकार, तापमान आइसक्रीम की बिकनी और डूबने से मौतों के बीच उच्च सहसंबंध का कारण है।

सहसंबंध क्या मापता है?

सहसंबंध चरों के बीच संबंध की दिशा और तीव्रता का अध्ययन और मापन करता है। सहसंबंध सह-परिवर्तन को मापता है, कारण-कार्य संबंध नहीं। सहसंबंध को कभी भी कारण और प्रभाव संबंध का संकेत मानने की गलती नहीं करनी चाहिए। दो चरों $\mathrm{X}$ और Y के बीच सहसंबंध की उपस्थिति का सीधा अर्थ यह है कि जब एक चर का मान एक दिशा में बदलता है, तो दूसरे चर का मान या तो उसी दिशा में (अर्थात् धनात्मक परिवर्तन) या विपरीत दिशा में (अर्थात् ऋणात्मक परिवर्तन) परिवर्तित होता है, परंतु एक निश्चित तरीके से। सरलता के लिए हम यहाँ यह मानते हैं कि सहसंबंध, यदि मौजूद है, रेखीय है, अर्थात् दोनों चरों की सापेक्ष गति को ग्राफ पेपर पर एक सीधी रेखा खींचकर दर्शाया जा सकता है।

सहसंबंध के प्रकार

सहसंबंध को आमतौर पर ऋणात्मक और धनात्मक सहसंबंध में वर्गीकृत किया जाता है। सहसंबंध को धनात्मक कहा जाता है जब चर एक ही दिशा में साथ-साथ चलते हैं। जब आय बढ़ती है, उपभोग भी बढ़ता है। जब आय घटती है, उपभोग भी घटता है। आइसक्रीम की बिक्री और तापमान एक ही दिशा में चलते हैं। सहसंबंध ऋणात्मक होता है जब वे विपरीत दिशाओं में चलते हैं। जब सेब की कीमतें गिरती हैं तो इसकी मांग बढ़ती है। जब कीमतें बढ़ती हैं तो इसकी मांग घटती है। जब आप अध्ययन में अधिक समय बिताते हैं, तो आपके फेल होने की संभावना घटती है। जब आप अपनी पढ़ाई में कम घंटे बिताते हैं, तो कम अंक/ग्रेड प्राप्त करने की संभावना बढ़ती है। ये ऋणात्मक सहसंबंध के उदाहरण हैं। चर विपरीत दिशा में चलते हैं।

3. सहसंबंध मापने की तकनीकें

सहसंबंध का अध्ययन करने के लिए प्रयुक्त तीन महत्वपूर्ण उपकरण हैं: बिखरा हुआ आरेख, कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन का क्रम सहसंबंध।
बिखरा हुआ आरेख दृश्य रूप से संबंध की प्रकृति को प्रस्तुत करता है बिना किसी विशिष्ट संख्यात्मक मान के। दो चरों के बीच रैखिक संबंध का संख्यात्मक माप कार्ल पियर्सन का सहसंबंध गुणांक देता है। एक संबंध को रैखिक कहा जाता है यदि उसे एक सीधी रेखा द्वारा दर्शाया जा सकता है। स्पीयरमैन का सहसंबंध गुणांक उन रैंकों के बीच रैखिक संबंध मापता है जो व्यक्तिगत वस्तुओं को उनके गुणों के अनुसार दिए जाते हैं। गुण वे चर होते हैं जिन्हें संख्यात्मक रूप से मापा नहीं जा सकता, जैसे लोगों की बुद्धिमत्ता, शारीरिक सौंदर्य, ईमानदारी आदि।

बिखरा हुआ आरेख

बिखरा हुआ आरेख संबंध के स्वरूप को दृश्य रूप से परखने की एक उपयोगी तकनीक है, बिना किसी संख्यात्मक मान की गणना किए। इस तकनीक में, दो चरों के मानों को ग्राफ पेपर पर बिंदुओं के रूप में प्लॉट किया जाता है। एक बिखरे हुए आरेख से संबंध की प्रकृति का काफी अच्छा अनुमान लगाया जा सकता है। बिखरे हुए आरेख में, बिखरे बिंदुओं की निकटता की डिग्री और उनकी समग्र दिशा हमें संबंध की जांच करने में सक्षम बनाती है। यदि सभी बिंदु एक रेखा पर स्थित हैं, तो सहसंबंध पूर्ण होता है और इसे एकता में कहा जाता है। यदि बिखरे बिंदु रेखा के चारों ओर व्यापक रूप से फैले हुए हैं, तो सहसंबंध कम होता है। यदि बिखरे बिंदु किसी रेखा के निकट या रेखा पर स्थित हैं, तो सहसंबंध को रैखिक कहा जाता है।

फिगर 6.1 से फिगर 6.5 तक के बिखरे हुए आरेख हमें दो चरों के बीच संबंध की एक झलक देते हैं। फिगर 6.1 में ऊपर उठती रेखा के आसपास बिंदुओं का बिखराव दिखता है, जिससे पता चलता है कि चर एक ही दिशा में चल रहे हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ भी बढ़ता है। यह धनात्मक सहसंबंध है। फिगर 6.2 में बिंदु नीचे झुकती रेखा के आसपास बिखरे हुए हैं। इस बार चर विपरीत दिशा में चलते हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ घटता है और इसके विपरीत। यह ऋणात्मक सहसंबंध है। फिगर 6.3 में न तो ऊपर उठती और न ही नीचे झुकती रेखा है जिसके आसपास बिंदु बिखरे हों। यह सहसंबंध के अभाव का उदाहरण है। फिगर 6.4 और फिगर 6.5 में बिंदु अब ऊपर उठती या नीचे गिरती रेखा के आसपास नहीं बिखरे हैं, बल्कि बिंदु स्वयं रेखाओं पर हैं। इसे क्रमशः पूर्ण धनात्मक सहसंबंध और पूर्ण ऋणात्मक सहसंबंध कहा जाता है।

गतिविधि

  • अपनी कक्षा के कक्षा $X$ के विद्यार्थियों की ऊँचाई, वजन और किन्हीं दो विषयों में प्राप्त अंकों के आँकड़े इकट्ठा करें। इन चरों में से दो-दो को लेकर बिखरा आरेख खींचें। आपको किस प्रकार का संबंध दिखाई देता है?

बिखरे हुए आरेख का सावधानीपूर्वक अवलोकन संबंध की प्रकृति और तीव्रता का अनुमान देता है।

कार्ल पियर्सन का सहसंबंध गुणांक

इसे प्रोडक्ट मोमेंट सहसंबंध गुणांक या सरल सहसंबंध गुणांक भी कहा जाता है। यह दो चरों $\mathrm{X}$ और $Y$ के बीच रैखिक संबंध की डिग्री का एक सटीक संख्यात्मक मान देता है।

यह ध्यान देना महत्वपूर्ण है कि कार्ल पियर्सन का सहसंबंध गुणांक तभी प्रयोग किया जाना चाहिए जब चरों के बीच रैखिक संबंध हो। जब $\mathrm{X}$ और $\mathrm{Y}$ के बीच अरैखिक संबंध हो, तो कार्ल पियर्सन के सहसंबंध गुणांक की गणना करना भ्रामक हो सकता है। इस प्रकार, यदि सच्चा संबंध रैखिक प्रकार का है जैसा कि आकृतियों 6.1, $6.2,6.4$ और 6.5 में दिखाए गए बिखरे हुए आरेखों द्वारा प्रदर्शित किया गया है, तो कार्ल पियर्सन का सहसंबंध गुणांक गणना किया जाना चाहिए और यह हमें चरों के बीच संबंध की दिशा और तीव्रता बताएगा। लेकिन यदि सच्चा संबंध आकृतियों 6.6 या 6.7 में दिखाए गए बिखरे हुए आरेखों के समान है, तो इसका अर्थ है कि $\mathrm{X}$ और $\mathrm{Y}$ के बीच अरैखिक संबंध है और हमें कार्ल पियर्सन के सहसंबंध गुणांक का प्रयोग करने का प्रयास नहीं करना चाहिए।

इसलिए, कार्ल पियर्सन के सहसंबंध गुणांक की गणना करने से पहले चरों के बीच संबंध के बिखरे हुए आरेख की जांच करना उचित है।

मान लीजिए $X _{1}, X _{2}, \ldots, X _{N}$ मान $X$ के $N$ मान हैं और $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$ मान Y के संगत मान हैं। आगे की प्रस्तुतियों में, सरलता के लिए इकाई को दर्शाने वाले उपसर्ग हटा दिए गए हैं। $\mathrm{X}$ और $\mathrm{Y}$ के समांतर माध्य इस प्रकार परिभाषित हैं

$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$

और उनके प्रसरण निम्नलिखित हैं

$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$

और $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$

$\mathrm{X}$ और $\mathrm{Y}$ के मानक विचलन, क्रमशः, उनके प्रसरण के धनात्मक वर्गमूल होते हैं। $\mathrm{X}$ और $\mathrm{Y}$ का सहप्रसरण इस प्रकार परिभाषित है

$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$

जहाँ $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ और $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के $i^{\text {th }}$ मानों के उनके माध्य मानों से विचलन हैं।

$\mathrm{X}$ और $\mathrm{Y}$ के बीच सहप्रसरण का चिह्न सहसंबंध गुणांक के चिह्न को निर्धारित करता है। मानक विचलन सदैव धनात्मक होते हैं। यदि सहप्रसरण शून्य है, तो सहसंबंध गुणांक सदैव शून्य होता है। गुणन क्षण सहसंबंध या कार्ल पियर्सन का सहसंबंध माप इस प्रकार दिया गया है

$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$

या

$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$

या

$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$

या

$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$

सहसंबंध गुणांक के गुण

आइए अब हम सहसंबंध गुणांक के गुणों पर चर्चा करें

  • $r$ की कोई इकाई नहीं होती। यह एक शुद्ध संख्या है। इसका अर्थ है कि मापन की इकाइयाँ $r$ का हिस्सा नहीं होतीं। उदाहरण के लिए, फुट में ऊँचाई और किलोग्राम में वजन के बीच $r$ का मान 0.7 हो सकता है।
  • $r$ का ऋणात्मक मान एक व्युत्क्रम संबंध को दर्शाता है। एक चर में परिवर्तन दूसरे चर में विपरीत दिशा में परिवर्तन के साथ जुड़ा होता है। जब किसी वस्तु की कीमत बढ़ती है, तो उसकी मांग घट जाती है। जब ब्याज दर बढ़ती है, तो धन की मांग भी घट जाती है। ऐसा इसलिए है क्योंकि अब धन महंगा हो गया है।
  • यदि $r$ धनात्मक है, तो दोनों चर एक ही दिशा में चलते हैं। जब चाय के विकल्प के रूप में कॉफी की कीमत बढ़ती है, तो चाय की मांग भी बढ़ जाती है। सिंचाई की सुविधाओं में सुधार उच्च पैदावार से जुड़ा होता है। जब तापमान बढ़ता है, तो आइसक्रीम की बिक्री तेज हो जाती है।
  • सहसंबंध गुणांक का मान ऋण एक और धन एक के बीच होता है, $-1 \leq r \leq 1$। यदि किसी व्यायाम में $r$ का मान इस सीमा से बाहर हो तो यह गणना में त्रुटि का संकेत है।
  • $r$ का परिमाण मूल परिवर्तन और स्केल परिवर्तन से अप्रभावित रहता है। दो चर $\mathrm{X}$ और $\mathrm{Y}$ लेते हुए दो नए चर परिभाषित करते हैं।

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जहाँ $A$ और $C$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के माना गया माध्य हैं। $\mathrm{B}$ और $\mathrm{D}$ सामान्य गुणक हैं और समान चिह्न के हैं। तब

$r _{x y}=r _{u v}$

यह गुणधर्म सहसंबंध गुणांक को अत्यंत सरलीकृत तरीके से गणना करने में प्रयोग होता है, जैसे कि पद विचलन विधि में।

  • यदि $r=0$ हो तो दो चर असहसंबद्ध हैं। उनके बीच कोई रैखिक संबंध नहीं है। हालांकि अन्य प्रकार के संबंध हो सकते हैं।
  • यदि $r=1$ या $r=-1$ हो तो सहसंबंध पूर्ण होता है और सटीक रैखिक संबंध होता है।
  • $r$ का उच्च मान प्रबल रैखिक संबंध को दर्शाता है। इसका मान उच्च कहा जाता है जब यह +1 या -1 के निकट हो।
  • $r$ का निम्न मान (शून्य के निकट) दुर्बल रैखिक संबंध को दर्शाता है। लेकिन कोई अरैखिक संबंध हो सकता है।

जैसा कि आपने अध्याय 1 में पढ़ा है, सांख्यिकीय विधियां स्वस्थ बुद्धि का विकल्प नहीं हैं। यहाँ एक और उदाहरण है, जो सहसंबंध की गणना और व्याख्या करने से पहले डेटा को ठीक से समझने की आवश्यकता को रेखांकित करता है। कुछ गाँवों में एक महामारी फैलती है और सरकार प्रभावित गाँवों में डॉक्टरों की एक टीम भेजती है। गाँवों में भेजे गए डॉक्टरों की संख्या और मौतों की संख्या के बीच सहसंबंध सकारात्मक पाया गया है। सामान्यतः, डॉक्टरों द्वारा दी जाने वाली स्वास्थ्य सेवाओं से मौतों की संख्या में कमी आने की उम्मीद की जाती है, जिससे एक नकारात्मक सहसंबंध दिखता है। यह अन्य कारणों से हुआ। डेटा एक विशिष्ट समय अवधि से संबंधित है। रिपोर्ट की गई कई मौतें टर्मिनल केस हो सकती हैं जहाँ डॉक्टर कुछ नहीं कर सकते थे। इसके अतिरिक्त, डॉक्टरों की उपस्थिति का लाभ कुछ समय बाद ही दिखाई देता है। यह भी संभव है कि रिपोर्ट की गई मौतें महामारी के कारण न हों। एक सुनामी अचानक राज्य में आती है और मृतकों की संख्या बढ़ जाती है।

आइए किसानों की स्कूली शिक्षा के वर्षों और प्रति एकड़ वार्षिक उत्पादन के बीच संबंध की जाँच करके $r$ की गणना को उदाहरणित करें।

उदाहरण 1

किसानों की स्कूली शिक्षा के वर्षों की संख्या वार्षिक उत्पादन प्रति एकड़ ‘Ooo (रु) में
0 4
2 4
4 6
6 10
8 10
10 8
12 7

सूत्र 1 को $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ के मान की आवश्यकता है

तालिका 6.1 से हमें प्राप्त होता है,

$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$

इन मानों को सूत्र (1) में रखने पर

$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$

इसी मान को सूत्र (2) से भी प्राप्त किया जा सकता है।

$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$

इस प्रकार, किसानों की शिक्षा के वर्ष और प्रति एकड़ वार्षिक उपज सकारात्मक रूप से सहसंबद्ध हैं। $r$ का मान भी बड़ा है। इसका तात्पर्य है कि जितने अधिक वर्ष किसान शिक्षा में लगाते हैं, उपज प्रति एकड़ उतनी ही अधिक होगी। यह किसानों की शिक्षा के महत्व को रेखांकित करता है।

सूत्र (3) का उपयोग करने के लिए

TABLE 6.1 किसानों की स्कूली शिक्षा के वर्षों और वार्षिक उपज के बीच r की गणना

शिक्षा के वर्ष (X) $(X-\bar{X})$ $(X-\bar{X})^{2}$ प्रति एकड़ वार्षिक उत्पादन ‘000 रु में (Y) $(Y-\bar{Y})$ $(Y-\bar{Y})^{2}$ $(X-\bar{X})(Y-\bar{Y})$
0 -6 36 4 -3 9 18
2 -4 16 4 -3 9 12
4 -2 4 6 -1 1 2
6 0 0 10 3 9 0
8 2 4 10 3 9 6
10 4 16 8 1 1 4
12 6 36 7 0 0 0
$\Sigma X=42$ $\sum (X-\overline{\mathrm{X}})^{2}=112$ $\Sigma Y=49$ $\Sigma(Y-\bar{Y})^{2}=38$ $\Sigma(X-\bar{X})(Y-\bar{Y})=42$

$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$

निम्नलिखित व्यंजकों के मानों की गणना करनी होगी अर्थात्

$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$.

अब $r$ का मान प्राप्त करने के लिए सूत्र (3) लगाइए।

आइए $r$ के विभिन्न मानों की व्याख्या जानें। अंग्रेज़ी और सांख्यिकी में प्राप्त अंकों के बीच सहसंबंध गुणांक मान लीजिए 0.1 है। इसका अर्थ है कि यद्यपि दोनों विषयों में प्राप्त अंक धनात्मक रूप से सहसंबंधित हैं, संबंध की ताकत कमजोर है। अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी सांख्यिकी में अपेक्षाकृत कम अंक प्राप्त कर सकते हैं। यदि $r$ का मान मान लीजिए 0.9 होता, तो अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी निश्चित रूप से सांख्यिकी में भी अधिक अंक प्राप्त करते।

एक नकारात्मक सहसंबंध का उदाहरण स्थानीय मंडी में सब्जियों के आगमन और सब्जियों की कीमतों के बीच का संबंध है। यदि $r$ -0.9 है, तो स्थानीय मंडी में सब्जी की आपूर्ति के साथ सब्जियों की कीमतें कम होंगी। यदि यह -0.1 होता, तो बड़ी मात्रा में सब्जी की आपूर्ति के साथ कीमतें कम होतीं, लेकिन उतनी नहीं जितनी कम तब होती जब $r$ -0.9 होता। कीमतों में गिरावट की सीमा $r$ के परम मान पर निर्भर करती है। यदि यह शून्य होता, तो बाजार में बड़ी आपूर्ति के बावजूद कीमतों में कोई गिरावट नहीं आती। यह भी एक संभावना है यदि आपूर्ति में वृद्धि को अन्य बाजारों में स्थानांतरित करने वाले एक अच्छे परिवहन नेटवर्क द्वारा संभाल लिया जाता है।

गतिविधि

  • निम्नलिखित सारणी को देखें। चालू कीमतों पर राष्ट्रीय आय की वार्षिक वृद्धि और सकल घरेलू बचत को जीडीपी के प्रतिशत के बीच $r$ की गणना करें।

सहसंबंध गुणांक की गणना करने की पद विचलन विधि।

जब चरों के मान बड़े हों, तो गणना के बोझ को $r$ के एक गुणधर्म का उपयोग करके काफी कम किया जा सकता है। यह है कि $r$ मूल और स्केल में परिवर्तन से स्वतंत्र होता है। इसे पद विचलन विधि भी कहा जाता है। इसमें चरों $\mathrm{X}$ और $\mathrm{Y}$ का निम्नलिखित रूप में रूपांतरण शामिल होता है:

TABLE 6.2

वर्ष राष्ट्रीय आय की
वार्षिक वृद्धि
सकल घरेलू
बचत जीडीपी के
प्रतिशत में
1992-93 14 24
1993-94 17 23
1994-95 18 26
1995-96 17 27
1996-97 16 25
1997-98 12 25
1998-99 16 23
1999-00 11 25
2000-01 8 24
2001-02 10 23

स्रोत: आर्थिक सर्वेक्षण, (2004-05) पृ. 8,9

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जहाँ $A$ और $B$ माना गया माध्य हैं, $h$ और $\mathrm{k}$ सामान्य गुणनखंड हैं और समान चिह्न रखते हैं।

तब $\mathrm{r} _{\mathrm{uv}}=\mathrm{r} _{\mathrm{XY}}$

इसे मूल्य सूचकांक और मुद्रा आपूर्ति के बीच सहसंबंध के विश्लेषण के अभ्यास से दर्शाया जा सकता है।

उदाहरण 2

मूल्य सूचकांक $(\mathrm{X})$ $ 120 \quad 150 \quad 190 \quad 220 \quad 230$

मुद्रा आपूर्ति रुपये करोड़ में $(\mathrm{Y})$ $\quad 1800 \quad 2000 \quad 2500 \quad 2700 \quad 3000$

सरलीकरण, चरण विचलन विधि का उपयोग करके नीचे दर्शाया गया है। मान लीजिए $\mathrm{A}=100 ; \mathrm{h}=10 ; \mathrm{B}=1700$ और $\mathrm{k}=100$

रूपांतरित चरों की सारणी इस प्रकार है:

मूल्य सूचकांक और मुद्रा आपूर्ति के बीच $r$ की गणना चरण विचलन विधि का उपयोग करके

सारणी 6.3

$U$ $V$
$\left(\frac{\mathrm{x}-100}{10}\right)$ $\left(\frac{\mathrm{y}-1700}{100}\right)$ $U^{2}$ $V^{2}$ $U V$
2 1 4 1 2
5 3 25 9 15
9 8 81 64 72
12 10 144 100 120
13 13 169 169 169

$\Sigma \mathrm{U}=41 ; \Sigma \mathrm{U}=35 ; \Sigma \mathrm{U}^{2}=423 ;$ $\Sigma \mathrm{V}^{2}=343 ; \Sigma \mathrm{UV}=378$

इन मानों को सूत्र (3) में रखने पर

$$ \begin{aligned} & \mathrm{r}=\frac{\Sigma \mathrm{UV}-\frac{(\Sigma \mathrm{U})(\Sigma \mathrm{U})}{\mathrm{N}}}{\sqrt{\Sigma \mathrm{U}^{2}-\frac{(\Sigma \mathrm{U})^{2}}{\mathrm{~N}}} \sqrt{\Sigma \mathrm{V}^{2}-\frac{(\Sigma \mathrm{V})^{2}}{\mathrm{~N}}}} …(3) \end{aligned} $$

$$=\frac{378-\frac{41 \times 35}{5}}{\sqrt{423-\frac{(41)^2}{5}}\sqrt{343-\frac{(35)^2}{5}}}$$

$$ \begin{aligned} & =0.98 \end{aligned} $$

मूल्य सूचकांक और मुद्रा आपूर्ति के बीच प्रबल धनात्मक सहसंबंध मौद्रिक नीति की एक महत्वपूर्ण आधारभूत बात है। जब मुद्रा आपूर्ति बढ़ती है तो मूल्य सूचकांक भी बढ़ता है।

गतिविधि

  • भारत की जनसंख्या और राष्ट्रीय आय से संबंधित आंकड़ों का उपयोग करते हुए, पद विचलन विधि से उनके बीच सहसंबंध की गणना करें।

स्पीयरमैन का रैंक सहसंबंध

स्पीयरमैन का रैंक सहसंबंध ब्रिटिश मनोवैज्ञानिक सी.ई. स्पीयरमैन द्वारा विकसित किया गया था। इसका उपयोग निम्नलिखित परिस्थितियों में किया जाता है:

  1. मान लीजिए हम किसी दूरदराज गाँव के विद्यार्थियों की ऊँचाई और वज़न के बीच सहसंबंध का अनुमान लगाने की कोशिश कर रहे हैं, जहाँ न तो मापने वाली छड़ें हैं और न ही तौलने की मशीनें। ऐसी स्थिति में हम ऊँचाई या वज़न को माप नहीं सकते, लेकिन हम निश्चित रूप से विद्यार्थियों को वज़न और ऊँचाई के अनुसार क्रमबद्ध कर सकते हैं। इन क्रमों का उपयोग करके स्पीयरमैन का क्रम सहसंबंध गुणांक गणना किया जा सकता है।

  2. मान लीजिए हम ऐसी चीज़ों से निपट रहे हैं जैसे निष्पक्षता, ईमानदारी या सौंदर्य। इन्हें उसी तरह से मापा नहीं जा सकता जैसे हम आय, वज़न या ऊँचाई को मापते हैं। अधिकतम इन चीज़ों को सापेक्ष रूप से मापा जा सकता है, उदाहरण के लिए, हम लोगों को सौंदर्य के अनुसार क्रमबद्ध कर सकते हैं (कुछ लोग तर्क देंगे कि यह भी संभव नहीं है क्योंकि सौंदर्य के मानदंड और मापदंड व्यक्ति से व्यक्ति और संस्कृति से संस्कृति में भिन्न हो सकते हैं)। यदि हम चरों के बीच संबंध ज्ञात करना चाहते हैं, जिनमें से कम से कम एक इस प्रकार का है, तो स्पीयरमैन का क्रम सहसंबंध गुणांक प्रयोग किया जाना चाहिए।

  3. स्पीयरमैन का क्रम सहसंबंध गुणांक कुछ ऐसे मामलों में प्रयोग किया जा सकता है जहाँ संबंध की दिशा स्पष्ट है लेकिन वह रैखिक नहीं है, जैसा कि आकृति 6.6 और 6.7 में दिखाए गए प्रकार के बिखरे चित्रों में प्रकट होता है।

  4. स्पीयरमैन का सहसंबंध गुणांक चरम मानों से प्रभावित नहीं होता है। इस दृष्टि से यह कार्ल पियर्सन के सहसंबंध गुणांक से बेहतर है। इस प्रकार यदि आँकड़ों में कुछ चरम मान हैं, तो स्पीयरमैन का सहसंबंध गुणांक बहुत उपयोगी हो सकता है।

रैंक सहसंबंध गुणांक और सरल सहसंबंध गुणांक की व्याख्या समान होती है। इसका सूत्र सरल सहसंबंध गुणांक से व्युत्पन्न किया गया है जहाँ व्यक्तिगत मानों को रैंकों से प्रतिस्थापित किया गया है। सहसंबंध की गणना के लिए इन रैंकों का उपयोग किया जाता है। यह गुणांक इकाइयों को दी गई रैंकों के बीच रैखिक संघात का माप प्रदान करता है, न कि उनके मानों का। स्पीयरमैन रैंक सहसंबंध सूत्र है

$$ \begin{equation*} r _{a}=1-\frac{6 \sum D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$

जहाँ $n$ प्रेक्षणों की संख्या है और $\mathrm{D}$ एक चर को दी गई रैंकों से दूसरे चर को दी गई रैंकों का विचलन है।

सरल सहसंबंध गुणांक के सभी गुण यहाँ लागू होते हैं। पीर्सोनियन सहसंबंध गुणांक की तरह यह 1 और -1 के बीच होता है। हालांकि, यह सामान्यतः साधारण विधि जितना सटीक नहीं होता है। यह इस तथ्य के कारण है कि डेटा से संबंधित सभी सूचना का उपयोग नहीं किया जाता है।

प्रथम अंतर क्रमागत मानों का अंतर होता है। श्रेणी में वस्तुओं के मानों के प्रथम अंतर, जिन्हें परिमाण के क्रम में व्यवस्थित किया गया है, लगभग कभी स्थिर नहीं होते हैं। सामान्यतः डेटा केंद्रीय मानों के आसपास समूहित होते हैं जहाँ सरणी के मध्य में छोटे अंतर होते हैं।

यदि प्रथम अंतर स्थिर होते, तो $r$ और $r _{\mathrm{k}}$ समान परिणाम देते। सामान्यतः $r _{\mathrm{k}}$ $r$ से कम या बराबर होता है।

रैंक सहसंबंध गुणांक की गणना

रैंक सहसंबंध की गणना को तीन परिस्थितियों में दिखाया जाएगा।

  1. रैंक दी गई हैं।
  2. रैंक नहीं दी गई हैं। उन्हें आंकड़ों से निकालना होगा।
  3. रैंक दोहराई गई हैं।

स्थिति 1: जब रैंक दी गई हों

उदाहरण 3

एक सौंदर्य प्रतियोगिता में पाँच व्यक्तियों का मूल्यांकन तीन न्यायाधीशों द्वारा किया गया है। हमें यह पता लगाना है कि न्यायाधीशों का कौन-सा युग्म सौंदर्य की सामान्य धारणा के सर्वाधिक निकट है।

प्रतिभागी

न्यायाधीश 1 2 3 4 5
A 1 2 3 4 5
B 2 4 1 5 3
C 1 3 5 2 4

न्यायाधीशों के तीन युग्म हैं, जिनके लिए रैंक सहसंबंध तीन बार गिनना होगा। सूत्र (4) का प्रयोग किया जाएगा।

$$ \begin{equation*} \mathrm{r} _{\mathrm{s}}=1-\frac{6 \Sigma \mathrm{D}^{2}}{\mathrm{n}^{3}-\mathrm{n}} \tag{4} \end{equation*} $$

A और B के बीच रैंक सहसंबंध इस प्रकार गिना जाता है:

$A$ $B$ $D$ $D^{2}$
1 2 -1 1
2 4 -2 4
3 1 2 4
4 5 -1 1
5 3 2 4
योग 14

इन मानों को सूत्र (4) में रखने पर

$$ \begin{equation*} r _{s}=1-\frac{6 \Sigma D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$

$=1-\frac{6 \times 14}{5^{3}-5}=1-\frac{84}{120}=1-0.7=0.3$

A और $\mathrm{C}$ के बीच रैंक सहसंबंध इस प्रकार गिना जाता है:

$A$ $C$ $D$ $D^{2}$
1 1 0 0
2 3 -1 1
3 5 -2 4
4 2 2 4
5 4 1 1
कुल 10

इन मानों को सूत्र (4) में रखने पर रैंक सहसंबंध 0.5 है। इसी प्रकार, न्यायाधीशों $\mathrm{B}$ और $\mathrm{C}$ की रैंकिंग के बीच रैंक सहसंबंध 0.9 है। इस प्रकार, न्यायाधीशों $A$ और $C$ की धारणाएं सबसे अधिक निकट हैं। न्यायाधीशों B और C के स्वाद बहुत भिन्न हैं।

स्थिति 2: जब रैंक नहीं दी गई हों

उदाहरण 4

हमें 5 विद्यार्थियों द्वारा अर्थशास्त्र और सांख्यिकी में प्राप्त किए गए अंकों का प्रतिशत दिया गया है। फिर रैंकिंग निकालनी होगी और रैंक सहसंबंध की गणना करनी होगी।

विद्यार्थी सांख्यिकी में
अंक
(X)
अर्थशास्त्र में
अंक
(Y)
A 85 60
B 60 48
C 55 49
D 65 50
E 75 55

विद्यार्थी सांख्यिकी में
रैंकिंग
$\left(R _{x}\right)$
अर्थशास्त्र में
रैंकिंग
$\left(R _{\gamma}\right)$
A 1 1
B 4 5
C 5 4
D 3 3
E 2 2

एक बार रैंकिंग पूरी हो जाने पर सूत्र (4) का उपयोग कर रैंक सहसंबंध की गणना की जाती है।

स्थिति 3: जब रैंक दोहराई गई हों और रैंक न दी गई हों

उदाहरण 5

मान $\mathrm{X}$ और $\mathrm{Y}$ निम्न प्रकार से दिए गए हैं

$X$ $Y$
1200 75
1150 65
1000 50
990 100
800 90
780 85
760 90
750 40
730 50
700 60
620 50
600 75

रैंक सहसंबंध निकालने के लिए, मानों की रैंक निकाली जाती हैं। दोहराए गए मदों को सामान्य रैंक दी जाती हैं। सामान्य रैंक वह औसत रैंक होता है जो उन मदों को मिलता अगर वे थोड़े-से एक-दूसरे से भिन्न होते। अगली मद को वह रैंक दिया जाएगा जो पहले से निर्धारित रैंक के ठीक बाद आता है।

यहाँ $Y$ का मान 50 है 9वें, 10वें और 11वें स्थान पर। इसलिए तीनों को औसत रैंक यानी 10 दी गई,

Rank of $X$ Rank of $Y$ Deviation
in Ranks
$D^{2}$
1 5.5 -4.5 20.25
2 7 -5 25.00
3 10 -7 49.00
4 1 3 9.00
5 2.5 2.5 6.25
6 4 2 4.00
7 2.5 4.5 20.25
8 12 -4 16.00
9 10 -1 1.00
10 8 2 4.00
11 10 1 1.00
12 5.5 6.5 42.25
198.00

जब रैंक दोहराई जाती हैं तो स्पीयरमैन का रैंक सहसंबंध गुणांक इस सूत्र से निकाला जाता है

$$ \begin{aligned} & \mathrm{r} _{\mathrm{s}}=1- \ \frac{6\left[\Sigma \mathrm{D}^{2}+\frac{\left(\mathrm{m} _{1}^{3}-\mathrm{m} _{1}\right)}{12}+\frac{\left(\mathrm{m} _{2}^{3}-\mathrm{m} _{2}\right)}{12}+\ldots\right]}{n\left(\mathrm{n}^{2}-1\right)} \end{aligned} $$

जहाँ $\mathrm{m} _{1}, \mathrm{~m} _{2}, \ldots$, रैंकों की पुनरावृत्तियों की संख्या हैं और $\frac{\mathrm{m}^{3}{ } _{1}-\mathrm{m} _{1}}{12} \ldots$, उनके संगत संशोधन कारक। इस डेटा के लिए आवश्यक संशोधन इस प्रकार है

$\frac{3^{3}-3}{12}+\frac{2^{3}-2}{12}=\frac{30}{12}=2.5$

इन अभिव्यक्तियों के मानों को प्रतिस्थापित करने पर

$r _{s}=1-\frac{6(198+2.5)}{12^{3}-12}=(1-0.70)=0.30$

इस प्रकार, $\mathrm{X}$ और $\mathrm{Y}$ के बीच सकारात्मक रैंक सहसंबंध है। $\mathrm{X}$ और $\mathrm{Y}$ दोनों एक ही दिशा में चलते हैं। हालांकि, इस संबंध को प्रबल नहीं कहा जा सकता।

गतिविधि

  • कक्षा IX और X की परीक्षाओं में अपने 10 सहपाठियों द्वारा प्राप्त अंकों का डेटा एकत्र करें। उनके बीच रैंक सहसंबंध गुणांक की गणना करें। यदि आपके डेटा में कोई पुनरावृत्ति नहीं है, तो पुनरावृत्त रैंक वाले डेटा सेट को लेकर यह अभ्यास दोहराएं। ऐसी क्या परिस्थितियाँ हैं जिनमें रैंक सहसंबंध गुणांक को सरल सहसंबंध गुणांक पर प्राथमिकता दी जाती है? यदि डेटा सटीक रूप से मापा गया हो, तो क्या आप अभी भी रैंक सहसंबंध गुणांक को प्राथमिकता देंगे? आप कब इस चयन के प्रति उदासीन हो सकते हैं? कक्षा में चर्चा करें।

4. निष्कर्ष

हमने दो चरों के बीच संबंध, विशेष रूप से रैखिक संबंध का अध्ययन करने की कुछ तकनीकों पर चर्चा की है। बिखरा हुआ आरेख संबंध की दृश्य प्रस्तुति देता है और यह केवल रैखिक संबंधों तक सीमित नहीं है। कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन की रैंक सहसंबंध चरों के बीच रैखिक संबंध को मापते हैं। जब चरों को सटीक रूप से मापा नहीं जा सकता, तब रैंक सहसंबंध का उपयोग किया जा सकता है। ये माप कारण-कार्य संबंध का संकेत नहीं देते। सहसंबंध का ज्ञान हमें इस बात की जानकारी देता है कि जब सहसंबंधित चर में परिवर्तन होता है, तब एक चर में परिवर्तन की दिशा और तीव्रता क्या होती है।

सारांश

  • सहसंबंध विश्लेषण दो चरों के बीच संबंध का अध्ययन करता है।
  • बिखरे हुए आरेख दो चरों के बीच संबंध की प्रकृति की दृश्य प्रस्तुति देते हैं।
  • कार्ल पियर्सन का सहसंबंध गुणांक $r$ केवल दो चरों के बीच रैखिक संबंध को संख्यात्मक रूप से मापता है। r -1 और 1 के बीच होता है।
  • जब चरों को सटीक रूप से मापा नहीं जा सकता, तब स्पीयरमैन की रैंक सहसंबंध का उपयोग करके रैखिक संबंध को संख्यात्मक रूप से मापा जा सकता है।
  • दोहरी रैंकों के लिए सुधार कारक आवश्यक होते हैं।
  • सहसंबंध का अर्थ कारण-कार्य संबंध नहीं होता। इसका अर्थ केवल सह-परिवर्तन होता है।

अभ्यास

1. ऊंचाई (फीट में) और वजन (किलोग्राम में) के बीच सहसंबंध गुणांक की इकाई है

(i) $\mathrm{kg} /$ feet

(ii) प्रतिशत

(iii) अस्तित्वहीन

2. सरल सहसंबंध गुणांक की सीमा है

(i) 0 से अनंत

(ii) ऋण एक से धन एक

(iii) ऋण अनंत से धन अनंत

3. यदि $r _{x y}$ धनात्मक है तो $X$ और $Y$ के बीच संबंध इस प्रकार का होता है

(i) जब $\mathrm{Y}$ बढ़ता है तो $\mathrm{X}$ बढ़ता है

(ii) जब $Y$ घटता है तो $X$ बढ़ता है

(iii) जब $\mathrm{Y}$ बढ़ता है तो $\mathrm{X}$ नहीं बदलता

4. यदि $r _{x y}=0$ है तो चर $X$ और $Y$

(i) रैखिक रूप से संबंधित हैं

(ii) रैखिक रूप से संबंधित नहीं हैं

(iii) स्वतंत्र हैं

5. निम्नलिखित तीन मापकों में से कौन-सा किसी भी प्रकार के संबंध को माप सकता है

(i) कार्ल पियर्सन का सहसंबंध गुणांक

(ii) स्पीयरमैन की रैंक सहसंबंध

(iii) बिखरा हुआ आरेख

6. यदि सटीक मापे गए आंकड़े उपलब्ध हों तो सरल सहसंबंध गुणांक

(i) रैंक सहसंबंध गुणांक से अधिक सटीक होता है

(ii) रैंक सहसंबंध गुणांक से कम सहसंबंध होता है

(iii) रैंक सहसंबंध गुणांक जितना ही सटीक होता है

7. $\mathrm{r}$ को सहसंबंध के मापक के रूप में सहप्रचलन से क्यों प्राथमिकता दी जाती है?

8. क्या डेटा के प्रकार के आधार पर $r$, -1 और 1 की सीमा के बाहर हो सकता है?

9. क्या सहसंबंध कारण-प्रभाव को दर्शाता है?

10. रैंक सहसंबंध कब सरल सहसंबंध गुणांक से अधिक सटीक होता है?

11. क्या शून्य सहसंबंध स्वतंत्रता का अर्थ है?

12. क्या सरल सहसंबंध गुणांक किसी भी प्रकार के संबंध को माप सकता है?

13. एक सप्ताह तक हर दिन अपने स्थानीय बाजार से पाँच सब्जियों के दाम इकट्ठा करें। उनके सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।

14. अपने सहपाठियों की ऊँचाई मापें। उनसे उनके बेंचमेट की ऊँचाई पूछें। इन दो चरों के बीच सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।

15. कुछ ऐसे चरों की सूची बनाएँ जिनका सटीक मापन कठिन होता है।

16. $r$ के मानों 1, –1 और 0 की व्याख्या करें।

17. रैंक सहसंबंध गुणांक पियरसोनी सहसंबंध गुणांक से भिन्न क्यों होता है?

18. पिताओं की ऊँचाई इंच में $(\mathrm{X})$ और उनके पुत्रों की ऊँचाई $(\mathrm{Y})$ के बीच सहसंबंध गुणांक की गणना करें

$\begin{array}{lllllllll}\mathrm{X} & 65 & 66 & 57 & 67 & 68 & 69 & 70 & 72\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 67 & 56 & 65 & 68 & 72 & 72 & 69 & 71 &\end{array}$

(उत्तर $\mathrm{r}=0.603$ )

19. $X$ और $Y$ के बीच सहसंबंध गुणांक की गणना करें और उनके संबंध पर टिप्पणी करें:

$\begin{array}{lllllllll}\mathrm{X} & -3 & -2 & -1 & 1 & 2 & 3\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 9 & 4 & 1 & 1 & 4 & 9\end{array}$

(उत्तर $\mathrm{r}=0$ )

20. $\mathrm{X}$ और $\mathrm{Y}$ के बीच सहसंबंध गुणांक की गणना करें और उनके संबंध पर टिप्पणी करें

$\begin{array}{lllllllll}\mathrm{X} & 1 & 3 & 4 & 5 & 7 & 8\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 2 & 6 & 8 & 10 & 14 & 16\end{array}$

(उत्तर $\mathrm{r}=1$ )

गतिविधि

  • यहाँ चर्चा किए गए सभी सूत्रों का प्रयोग कर भारत की राष्ट्रीय आय और निर्यात के बीच कम-से-कम दस प्रेक्षण लेकर $\mathrm{r}$ की गणना करें।