अध्याय 13 सांख्यिकी

Subject Hub

सामान्य Learning Resources

65%
Complete
12
Guides
8
Tests
5
Resources
7
Day Streak
Your Learning Path Active
2
3
🎯
Learn Practice Test Master

“सांख्यिकी को औसत और उनके अनुमानों की विज्ञान सही कहा जा सकता है।” - ए.एल. बाउले और ए.एल. बॉडिंगटन

भूमिका

हम जानते हैं कि सांख्यिकी विशिष्ट उद्देश्यों के लिए एकत्रित आँकड़ों से संबंधित है। हम आँकड़ों का विश्लेषण और व्याख्या करके उनके बारे में निर्णय ले सकते हैं। पिछली कक्षाओं में हमने आँकड़ों को चित्रात्मक और सारणीबद्ध रूप में प्रस्तुत करने की विधियाँ पढ़ी हैं। यह प्रस्तुति आँकड़ों की कुछ प्रमुख विशेषताओं या लक्षणों को उजागर करती है। हमने दिए गए आँकड़ों के लिए एक प्रतिनिधि मान खोजने की विधियाँ भी पढ़ी हैं। इस मान को केंद्रीय प्रवृत्ति की माप कहा जाता है। याद कीजिए माध्य (अंकगणितीय माध्य), माध्यिका और बहुलक केंद्रीय प्रवृत्ति की तीन माप हैं। केंद्रीय प्रवृत्ति की माप हमें एक मोटा अनुमान देती है कि आँकड़े कहाँ केंद्रित हैं। लेकिन, आँकड़ों से बेहतर व्याख्या करने के लिए

कार्ल पियर्सन (1857-1936 ई.)

हमें यह भी अनुमान होना चाहिए कि आँकड़े कितने फैले हुए हैं या वे केंद्रीय प्रवृत्ति की माप के चारों ओर कितने समूहबद्ध हैं।

अब विचार कीजिए दो बल्लेबाजों द्वारा अपने पिछले दस मैचों में बनाए गए रन इस प्रकार हैं:

बल्लेबाज A : $30,91,0,64,42,80,30,5,117,71$

बल्लेबाज B : $53,46,48,50,53,53,58,60,57,52$

स्पष्ट है कि आँकड़ों का माध्य और माध्यिका है

बल्लेबाज A बल्लेबाज B
माध्य 53 53
माध्यिका 53 53

याद कीजिए, हम किसी डेटा का माध्य (जिसे $\bar{x}$ से दर्शाया जाता है) यह निकालते हैं कि प्रेक्षणों के योग को प्रेक्षणों की संख्या से विभाजित कर दें, अर्थात्

$ \bar{x}=\frac{1}{n} \sum\limits_{i=1}^{n} x_i $

इसके अतिरिक्त, माध्यिका (median) प्राप्त करने के लिए पहले डेटा को आरोही या अवरोही क्रम में व्यवस्थित करते हैं और निम्न नियम लागू करते हैं।

यदि प्रेक्षणों की संख्या विषम है, तो माध्यिका $(\frac{n+1}{2})^{\text{वाँ }}$ प्रेक्षण होता है।

यदि प्रेक्षणों की संख्या सम है, तो माध्यिका $(\frac{n}{2})^{\text{वें }}$ और $(\frac{n}{2}+1)^{\text{वें }}$ प्रेक्षणों का माध्य होता है।

हम पाते हैं कि दोनों बल्लेबाजों $A$ और B द्वारा बनाए गए रनों का माध्य और माध्यिका समान है, अर्थात् 53। क्या हम कह सकते हैं कि दोनों खिलाड़ियों का प्रदर्शन समान है? स्पष्ट रूप से नहीं, क्योंकि बल्लेबाज A के स्कोर में परिवर्तनशीलता 0 (न्यूनतम) से 117 (अधिकतम) तक है। जबकि बल्लेबाज B द्वारा बनाए गए रनों की सीमा 46 से 60 तक है।

आइए अब उपरोक्त स्कोरों को संख्या रेखा पर बिंदुओं के रूप में आलेखित करें। हम निम्न आरेख पाते हैं:

बल्लेबाज A के लिए

आकृति 13.1

बल्लेबाज B के लिए

आकृति 13.2

हम देख सकते हैं कि बल्लेबाज़ B से सम्बद्ध बिंदु एक-दूसरे के निकट हैं और केन्द्रीय प्रवृत्ति के माप (माध्य व माध्यिका) के आसपास समूहित हैं, जबकि बल्लेबाज़ A से सम्बद्ध बिंदु फैले हुए या अधिक बिखरे हुए हैं।

इस प्रकार, केन्द्रीय प्रवृत्ति के माप किसी दिए गए आँकड़ों के बारे में पूरी जानकारी देने के लिए पर्याप्त नहीं होते। विचरण एक अन्य कारक है जिसे सांख्यिकी के अन्तर्गत अध्ययन करने की आवश्यकता होती है। ‘केन्द्रीय प्रवृत्ति के मापों’ की तरह हम विचरण का वर्णन करने के लिए एक एकल संख्या चाहते हैं। इस एकल संख्या को ‘विक्षेपण का माप’ कहा जाता है। इस अध्याय में हम कुछ महत्वपूर्ण विक्षेपण के माप और अवर्गीकृत तथा वर्गीकृत आँकड़ों के लिए उनकी गणना की विधियाँ सीखेंगे।

13.2 विक्षेपण के माप

आँकड़ों में विक्षेप या बिखराव, वहाँ प्रयुक्त प्रेक्षणों और केन्द्रीय प्रवृत्ति के माप के प्रकार के आधार पर मापा जाता है। विक्षेपण के निम्नलिखित माप हैं:

(i) परास, (ii) चतुर्थक विचलन, (iii) माध्य विचलन, (iv) मानक विचलन।

इस अध्याय में हम इनमें से चतुर्थक विचलन को छोड़कर विक्षेपण के सभी मापों का अध्ययन करेंगे।

13.3 परास

याद कीजिए, दो बल्लेबाज़ों A और B द्वारा बनाए गए रनों के उदाहरण में हमें प्रत्येक श्रृंखला में न्यूनतम और अधिकतम रनों के आधार पर रनों में परिवर्तनशीलता की कुछ समझ थी। इसके लिए एक एकल संख्या प्राप्त करने के लिए हम प्रत्येक श्रृंखला के अधिकतम और न्यूनतम मानों का अन्तर निकालते हैं। इस अन्तर को आँकड़ों का ‘परास’ कहा जाता है।

बल्लेबाज़ A के मामले में, रेंज $=117-0=117$ और बल्लेबाज़ B के लिए, रेंज $=60-46=14$। स्पष्ट है कि A की रेंज $>$ B की रेंज है। इसलिए, A के मामले में स्कोर फैले हुए या बिखरे हैं जबकि B के लिए ये एक-दूसरे के निकट हैं।

इस प्रकार, किसी श्रेणी की रेंज $=$ अधिकतम मान - न्यूनतम मान।

डेटा की रेंज हमें विचरण या बिखराव का एक अनुमान देती है परंतु यह बताती नहीं कि डेटा किसी केंद्रीय प्रवृत्ति के माप से कितना फैला है। इस उद्देश्य के लिए हमें विचरण के किसी अन्य माप की आवश्यकता है। स्पष्ट है कि ऐसा माप मानों और केंद्रीय प्रवृत्ति के बीच के अंतर (या विचलन) पर निर्भर करना चाहिए।

विचरण के महत्वपूर्ण माप, जो प्रेक्षणों के किसी केंद्रीय प्रवृत्ति से विचलन पर निर्भर करते हैं, माध्य विचलन और मानक विचलन हैं। आइए इन पर विस्तार से चर्चा करें।

13.4 माध्य विचलन

याद कीजिए कि किसी प्रेक्षण $x$ का एक निश्चित मान ‘$a$’ से विचलन अंतर $x-a$ होता है। मानों के $x$ के किसी केंद्रीय मान ‘$a$’ से विचरण ज्ञात करने के लिए हम $a$ के परितः विचलन निकालते हैं। विचलनों का माध्य एक निरपेक्ष विचरण माप है। माध्य निकालने के लिए हमें विचलनों का योग प्राप्त करना होगा। परंतु हम जानते हैं कि कोई केंद्रीय प्रवृत्ति माप प्रेक्षणों के समुच्चय के अधिकतम और न्यूनतम मानों के बीच स्थित होता है। इसलिए कुछ विचलन ऋणात्मक और कुछ धनात्मक होंगे। इस प्रकार विचलनों का योग शून्य हो सकता है। इसके अतिरिक्त, माध्य $(\bar{x})$ से विचलनों का योग शून्य होता है।

इसके अतिरिक्त $\quad \quad \quad $ विचलनों का माध्य $=\frac{\text{ विचलनों का योग }}{\text{ प्रेक्षणों की संख्या }}=\frac{0}{n}=0$

इस प्रकार, माध्य के बारे में विचलनों का माध्य निकालना, विचरण के माप के संदर्भ में हमारे लिए किसी भी प्रकार से उपयोगी नहीं है।

याद रखें कि, विचरण के उपयुक्त माप को खोजने में, हमें प्रत्येक मान की एक केंद्रीय प्रवृत्ति या एक निश्चित संख्या ’ $a$ ’ से दूरी की आवश्यकता होती है। याद करें, कि दो संख्याओं के अंतर का निरपेक्ष मान, जब संख्या रेखा पर दर्शाया जाता है, तो संख्याओं के बीच की दूरी देता है। इस प्रकार, किसी निश्चित संख्या ’ $a$ ’ से विचरण के माप को खोजने के लिए हम केंद्रीय मान से विचलनों के निरपेक्ष मानों का माध्य निकाल सकते हैं। इस माध्य को ‘माध्य विचलन’ कहा जाता है। इस प्रकार किसी केंद्रीय मान ’ $a$ ’ के बारे में माध्य विचलन, प्रेक्षणों के ’ $a$ ’ से विचलनों के निरपेक्ष मानों का माध्य होता है। ’ $a$ ’ से माध्य विचलन को M.D. (a) द्वारा दर्शाया जाता है। इसलिए,

$ \text{ M.D. }(a)=\frac{\text{ ’ } a \text{ ’ से विचलनों के निरपेक्ष मानों का योग }}{\text{ प्रेक्षणों की संख्या }} . $

टिप्पणी माध्य विचलन किसी भी केंद्रीय प्रवृत्ति के माप से प्राप्त किया जा सकता है। हालांकि, सांख्यिकीय अध्ययनों में माध्य और माध्यिका से माध्य विचलन सामान्यतः प्रयुक्त होते हैं।

13.4.1 असमूहीकृत आंकड़ों के लिए माध्य विचलन

मान लीजिए $n$ प्रेक्षण $x_1, x_2, x_3, \ldots ., x_n$ हैं। माध्य या माध्यिका के बारे में माध्य विचलन की गणना में निम्नलिखित चरण शामिल होते हैं:

चरण 1 उस केंद्रीय प्रवृत्ति के माप की गणना करें जिसके बारे में हमें माध्य विचलन ज्ञात करना है। मान लीजिए वह ’ $a$ ’ है।

चरण 2 प्रत्येक $x_i$ का ’ $a$ ’ से विचलन ज्ञात करें, अर्थात् $x_1-a, x_2-a, x_3-a, \ldots, x_n-a$

चरण 3 विचलनों के निरपेक्ष मान ज्ञात करें, अर्थात् ऋण चिह्न (-) को हटा दें, यदि वह है, अर्थात् $|x_1-a|,|x_2-a|,|x_3-a|, \ldots .,|x_n-a|$

चरण 4 विचलनों के निरपेक्ष मानों का माध्य ज्ञात करें। यह माध्य ’ $a$ ’ के बारे में माध्य विचलन है, अर्थात्

$ \text{ M.D. }(a)=\frac{\sum\limits_{i=1}^{n}|x_i-a|}{n} $

इस प्रकार $\quad\quad\quad$ M.D. $(\bar{x})=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-\bar{x}|$, जहाँ $\bar{x}=$ माध्य

और $\quad\quad\quad$ M.D. $(M)=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-M|$, जहाँ $M=$ माध्यिका

नोट - इस अध्याय में, हम माध्यिका को दर्शाने के लिए प्रतीक M का प्रयोग करेंगे जब तक कि अन्यथा न कहा गया हो।आइए अब उपरोक्त विधि के चरणों को निम्नलिखित उदाहरणों में दर्शाते हैं।

उदाहरण 1 निम्नलिखित आंकड़ों के लिए माध्य के बारे में माध्य विचलन ज्ञात करें:

$ 6,7,10,12,13,4,8,12 $

हल हम चरणबद्ध तरीके से आगे बढ़ते हैं और निम्नलिखित प्राप्त करते हैं:

चरण 1 दिए गए आंकड़ों का माध्य है

$ \bar{x}=\frac{6+7+10+12+13+4+8+12}{8}=\frac{72}{8}=9 $

चरण 2 संबंधित प्रेक्षणों का माध्य $\bar{x}$ से विचलन, अर्थात् $x_i-\bar{x}$ है

$\quad\quad\quad\quad 6-9,7-9,10-9,12-9,13-9,4-9,8-9,12-9$,

या $ \quad\quad\quad\quad -3,-2,1,3,4,-5,-1,3 $

चरण 3 विचलनों के निरपेक्ष मान, अर्थात् $|x_i-\bar{x}|$ हैं

$ 3,2,1,3,4,5,1,3 $

चरण 4 माध्य के बारे में आवश्यक माध्य विचलन है

$ \text{ M.D. } \begin{aligned} (\bar{x}) & =\frac{\sum\limits_{i=1}^{8}|x_i-\bar{x}|}{8} \\ & =\frac{3+2+1+3+4+5+1+3}{8}=\frac{22}{8}=2.75 \end{aligned} $

नोट - हर बार चरणों को करने के बजाय, हम चरणबद्ध तरीके से गणना कर सकते हैं, चरणों का उल्लेख किए बिना।

उदाहरण 2 निम्नलिखित आंकड़ों के लिए माध्य के बारे में माध्य विचलन ज्ञात कीजिए :

$ 12,3,18,17,4,9,17,19,20,15,8,17,2,3,16,11,3,1,0,5 $

हल हमें पहले दिए गए आंकड़ों का माध्य $(\bar{x})$ निकालना होगा

$ \bar{x}=\frac{1}{20} \sum\limits_{i=1}^{20} x_i=\frac{200}{20}=10 $

माध्य से विचलन के क्रमशः निरपेक्ष मान, अर्थात् $|x_i-\bar{x}|$ हैं

$ 2,7,8,7,6,1,7,9,10,5,2,7,8,7,6,1,7,9,10,5 $

इसलिए $\quad \sum\limits_{i=1}^{20}|x_i-\bar{x}|=124$

और $ \quad\quad\quad\quad\text{ M.D. }(\bar{x})=\frac{124}{20}=6.2 $

उदाहरण 3 निम्नलिखित आंकड़ों के लिए माध्यिका के बारे में माध्य विचलन ज्ञात कीजिए:

$ 3,9,5,3,12,10,18,4,7,19,21 \text{. } $

हल यहाँ प्रेक्षणों की संख्या 11 है जो विषम है। आंकड़ों को आरोही क्रम में व्यवस्थित करने पर, हमें प्राप्त होता है $3,3,4,5,7,9,10,12,18,19,21$

अब

$ \text{ माध्यिका }=(\frac{11+1}{2})^{\text{वाँ }} \text{ या } 6^{\text{वाँ }} \text{ प्रेक्षण }=9 $

माध्यिका से क्रमशः विचलन के निरपेक्ष मान, अर्थात् $|x_i-\mathbf{M}|$ हैं $6,6,5,4,2,0,1,3,9,10,12$

इसलिए $ \quad\quad\quad\quad\quad \sum\limits_{i=1}^{11}|x_i-M|=58 $

और $ \quad\quad\quad\text{ म.वि. }(M)=\frac{1}{11} \sum\limits_{i=1}^{11}|x_i-M|=\frac{1}{11} \times 58=5.27 $

13.4.2 समूहबद्ध आँकड़ों के लिए माध्य विचलन

हम जानते हैं कि आँकड़ों को दो तरीकों से समूहबद्ध किया जा सकता है :

(a) विवृत बारंबारता बंटन,

(b) सतत बारंबारता बंटन।

आइए दोनों प्रकार के आँकड़ों के लिए माध्य विचलन ज्ञात करने की विधि पर चर्चा करें।

(a) विवृत बारंबारता बंटन माना दिए गए आँकड़ों में $n$ भिन्न मान $x_1, x_2, \ldots, x_n$ क्रमशः बारंबारताओं $f_1, f_2, \ldots, f_n$ के साथ आते हैं। इस आँकड़े को नीचे दी गई सारणीबद्ध रूप में प्रस्तुत किया जा सकता है, और इसे विवृत बारंबारता बंटन कहा जाता है:

$ \begin{matrix} x: x_1 & x_2 & x_3 \ldots x_n \\ f: f_1 & f_2 & f_3 \ldots f_n \end{matrix} $

(i) माध्य के बारे में माध्य विचलन

सबसे पहले हम सूत्र का उपयोग करके दिए गए आँकड़ों का माध्य $\bar{x}$ निकालते हैं

$ \bar{x}=\frac{\sum\limits_{i=1}^{n} x_i f_i}{\sum\limits_{i=1}^{n} f_i}=\frac{1}{N} \sum\limits_{i=1}^{n} x_i f_i $

जहाँ $\sum\limits_{i=1}^{n} x_i f_i$ प्रेक्षणों $x_i$ और उनकी संगत बारंबारताओं $f_i$ के गुणनफलों का योग दर्शाता है और $N=\sum\limits_{i=1}^{n} f_i$ बारंबारताओं का योग है।

फिर, हम प्रेक्षणों $x_i$ का माध्य $\bar{x}$ से विचलन निकालते हैं और उनके निरपेक्ष मान लेते हैं, अर्थात् $|x_i-\bar{x}|$ सभी $i=1,2, \ldots, n$ के लिए।

इसके बाद, विचलनों के निरपेक्ष मानों का माध्य निकालते हैं, जो माध्य के बारे में अभीष्ट माध्य विचलन होता है। इस प्रकार

$ \quad\quad\text{ M.D. }(\bar{x})=\frac{\sum\limits_{i=1}^{n} f_i|x_i-\bar{x}|}{\sum\limits_{i=1}^{n} f_i}=\frac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-\bar{x}| $

(ii) माध्यिका के बारे में माध्य विचलन माध्यिका के बारे में माध्य विचलन ज्ञात करने के लिए, हम दी गई विवृत्त बारंबारता बंटन की माध्यिका ज्ञात करते हैं। इसके लिए प्रेक्षणों को आरोही क्रम में व्यवस्थित किया जाता है। इसके बाद संचयी बारंबारताएँ प्राप्त की जाती हैं। फिर, हम वह प्रेक्षण पहचानते हैं जिसकी संचयी बारंबारता $\frac{N}{2}$ के बराबर या थोड़ी अधिक हो, जहाँ $N$ बारंबारताओं का योग है। प्रेक्षण का यह मान आँकड़ों के बीच में स्थित होता है, इसलिए यह अभीष्ट माध्यिका है। माध्यिका ज्ञात करने के बाद, हम माध्यिका से विचलनों के निरपेक्ष मानों का माध्य प्राप्त करते हैं। इस प्रकार,

$ \text{ M.D.(M) }=\frac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-M| $

उदाहरण 4 निम्नलिखित आँकड़ों के लिए माध्य के बारे में माध्य विचलन ज्ञात कीजिए :

$x_i$ 2 5 6 8 10 12
$f_i$ 2 8 10 7 8 5

हल आइए दिए गए आँकड़ों की सारणी 13.1 बनाएँ और गणनाओं के बाद अन्य स्तंभ जोड़ें।

सारणी 13.1

$x_i$ $f_i$ $f_i x_i$ $|x_i-\bar{x}|$ $f_i|x_i-\bar{x}|$
2 2 4 5.5 11
5 8 40 2.5 20
6 10 60 1.5 15
8 7 56 0.5 3.5
10 8 80 2.5 20
12 5 60 4.5 22.5
40 300 92

$ N=\sum\limits_{i=1}^{6} f_i=40, \quad \sum\limits_{i=1}^{6} f_i x_i=300, \quad \sum\limits_{i=1}^{6} f_i|x_i-\bar{x}|=92 $

इसलिए $ \quad \quad \quad\bar{x}=\frac{1}{N} \sum\limits_{i=1}^{6} f_i x_i=\frac{1}{40} \times 300=7.5 $

और $\quad \quad \quad$ M. D. $(\bar{x})=\frac{1}{N} \sum\limits_{i=1}^{6} f_i|x_i-\bar{x}|=\frac{1}{40} \times 92=2.3$

उदाहरण 5 निम्नलिखित आँकड़ों के लिए माध्य से माध्य विचलन ज्ञात कीजिए:

$x_i$ 3 6 9 12 13 15 21 22
$f_i$ 3 4 5 2 4 5 4 3

हल दी गई प्रेक्षणें पहले से ही आरोही क्रम में हैं। दी गई आँकड़ों में संचयी बारंबारताओं के अनुरूप एक पंक्ति जोड़ने पर हमें प्राप्त होता है (तालिका 13.2)।

तालिका 13.2

$x_i$ 3 6 9 12 13 15 21 22
$f_i$ 3 4 5 2 4 5 4 3
$c . f$. 3 7 12 14 18 23 27 30

अब, $N=30$ जो सम है।

माध्यिका $15^{\text{वें }}$ और $16^{\text{वें }}$ प्रेक्षणों का माध्य है। ये दोनों प्रेक्षण संचयी बारंबारता 18 में आते हैं, जिसके अनुरूप प्रेक्षण 13 है।

इसलिए, माध्यिका $M=\frac{15^{\text{वां }} \text{ प्रेक्षण }+16^{\text{वां }} \text{ प्रेक्षण }}{2}=\frac{13+13}{2}=13$

अब, माध्यिका से विचलनों के निरपेक्ष मान, अर्थात् $|x_i-M|$ तालिका 13.3 में दिखाए गए हैं। हमारे पास है

तालिका 13.3

$|x_i-M|$ 10 7 4 1 0 2 8 9
$f_i$ 3 4 5 2 4 5 4 3
$f_i|x_i-M|$ 30 28 20 2 0 10 32 27

$ \quad \quad \quad \sum\limits_{i=1}^{8} f_i=30 \text{ और } \sum\limits_{i=1}^{8} f_i|x_i-M|=149 $

इसलिए

$ \begin{aligned} \text{ M. D. }(M) & =\frac{1}{N} \sum\limits_{i=1}^{8} f_i|x_i-M| \ & =\frac{1}{30} \times 149=4.97 \end{aligned} $

(b) सतत बारंबारता बंटन एक सतत बारंबारता बंटन एक ऐसी श्रेणी है जिसमें आँकड़ों को विभिन्न वर्ग-अंतरालों में बिना अंतराल के उनकी संबंधित बारंबारताओं के साथ वर्गीकृत किया जाता है।

उदाहरण के लिए, 100 विद्यार्थियों द्वारा प्राप्त अंक निम्नलिखित सतत बारंबारता बंटन में प्रस्तुत किए गए हैं :

प्राप्त अंक $0-10$ $10-20$ $20-30$ $30-40$ $40-50$ $50-60$
विद्यार्थियों की संख्या 12 18 27 20 17 6

(i) माध्य के परितः माध्य विचलन एक सतत बारंबारता बंटन के माध्य की गणना करते समय हमने यह अभिधारणा ली थी कि प्रत्येक वर्ग में बारंबारता उसके मध्य-बिंदु पर केंद्रित है। यहाँ भी हम प्रत्येक दिए गए वर्ग का मध्य-बिंदु लिखते हैं और एक विविक्त बारंबारता बंटन की भाँति आगे बढ़ते हुए माध्य विचलन ज्ञात करते हैं।

आइए निम्नलिखित उदाहरण लें।

उदाहरण 6 निम्नलिखित आँकड़ों के लिए माध्य के परितः माध्य विचलन ज्ञात कीजिए।

प्राप्त अंक 10-20 20-30 30-40 40-50 50-60 60-70 70-80
विद्यार्थियों की संख्या 2 3 8 14 8 3 2

हल हम दिए गए आँकड़ों से निम्नलिखित तालिका 13.4 बनाते हैं :

तालिका 13.4

अंक
प्राप्त
विद्यार्थियों की
संख्या
$f_i$
मध्य-बिंदु
$x_i$
$f_i x_i$ $|x_i-\bar{x}|$ $f_i|x_i-\bar{x}|$
$10-20$ 2 15 30 30 60
$20-30$ 3 25 75 20 60
$30-40$ 8 35 280 10 80
$40-50$ 14 45 630 0 0
$50-60$ 8 55 440 10 80
$60-70$ 3 65 195 20 60
$70-80$ 2 75 150 30 60
40 1800 8 400

यहाँ $ \quad \quad \quad N=\sum\limits_{i=1}^{7} f_i=40, \sum\limits_{i=1}^{7} f_i x_i=1800, \sum\limits_{i=1}^{7} f_i|x_i-\bar{x}|=400 $

इसलिए $ \quad \quad \quad\bar{x}=\frac{1}{N} \sum\limits_{i=1}^{7} f_i x_i=\frac{1800}{40}=45 $

और $ \quad \quad \quad\text{ M.D. }(\bar{x})=\frac{1}{N} \sum\limits_{i=1}^{7} f_i|x_i-\bar{x}|=\frac{1}{40} \times 400=10 $

माध्य के बारे में माध्य विचलन की शॉर्टकट विधि

हम $\bar{x}$ की परिकलन करने की थकाऊ गणनाओं से बच सकते हैं कद-विचलन विधि का पालन करके। याद कीजिए कि इस विधि में हम एक अभिगृहित माध्य लेते हैं जो आँकड़ों के बीच या इसके बिलकुल निकट होता है। फिर प्रेक्षणों (या वर्गों के मध्य-बिंदुओं) के विचलन अभिगृहित माध्य से लिए जाते हैं। यह संख्या रेखा पर मूल को शून्य से अभिगृहित माध्य पर स्थानांतरित करने के समान है, जैसा कि आकृति 13.3 में दिखाया गया है।

आकृति 13.3

यदि सभी विचलनों का एक उभयनिष्ठ गुणनफल हो, तो हम उन्हें इस उभयनिष्ठ गुणनफल से विभाजित करके विचलनों को और सरल बना लेते हैं। इन्हें कद-विचलन कहा जाता है। कद-विचलन लेने की प्रक्रिया संख्या रेखा पर पैमाने के परिवर्तन के समान है जैसा कि आकृति 13.4 में दिखाया गया है।

विचलन और कद-विचलन प्रेक्षणों के आकार को घटा देते हैं, ताकि गुणा आदि जैसी गणनाएँ सरल हो जाएँ। मान लीजिए नया चर $d_i=\frac{x_i-a}{h}$ द्वारा दर्शाया जाता है, जहाँ ’ $a$ ’ अभिगृहित माध्य है और $h$ उभयनिष्ठ गुणनफल है। फिर कद-विचलन विधि द्वारा माध्य $\bar{x}$ निम्न प्रकार दिया जाता है

$ \bar{x}=a+\frac{\sum\limits_{i=1}^{n} f_i d_i}{N} \times h $

आइए उदाहरण 6 के आँकड़े लें और कद-विचलन विधि का प्रयोग करके माध्य विचलन ज्ञात करें।

माना लिया गया माध्य $a=45$ और $h=10$ लें, और निम्न तालिका 13.5 बनाएं।

तालिका 13.5

प्राप्त
अंक
विद्यार्थियों की
संख्या
मध्य-बिंदु $d_i=\frac{x_i-45}{10}$ $f_i d_i$ $|x_i-\bar{x}|$ $f_i|x_i-\bar{x}|$
$f_i$ $x_i$
$10-20$ 2 15 -3 -6 30 60
$20-30$ 3 25 -2 -6 20 60
$30-40$ 8 35 -1 -8 10 80
$40-50$ 14 45 0 0 0 0
$50-60$ 8 55 1 8 10 80
$60-70$ 3 65 2 6 20 60
$70-80$ 2 75 3 6 30 60
40 0 400

इसलिए

$ \begin{aligned} & \bar{x}=a+\frac{\sum\limits_{i=1}^{7} f_i d_i}{N} \times h \\ & =45+\frac{0}{40} \times 10=45 \end{aligned} $

और $ \quad \quad \quad \text{ M.D. }(\bar{x})=\frac{1}{N} \sum\limits_{i=1}^{7} f_i|x_i-\bar{x}|=\frac{400}{40}=10 $

नोट - $\bar{x}$ की गणना करने के लिए पग विचलन विधि लागू की गई है। शेष प्रक्रिया वही है।

(ii) माध्यिका के परितः माध्य विचलन एक सतत बारंबारता बंटन के लिए माध्यिका के परितः माध्य विचलन ज्ञात करने की प्रक्रिया वैसी ही है जैसे हमने माध्य के परितः माध्य विचलन के लिए की थी। एकमात्र अंतर यह है कि विचलन लेते समय माध्य के स्थान पर माध्यिका को रखा जाता है।

आइए सतत बारंबारता बंटन के लिए माध्यिका ज्ञात करने की प्रक्रिया को याद करें।

पहले आँकड़ों को आरोही क्रम में व्यवस्थित किया जाता है। फिर, संचयी बारंबारता बंटन की माध्यिका प्राप्त करने के लिए सर्वप्रथम वह वर्ग ज्ञात किया जाता है जिसमें माध्यिका स्थित हो (माध्यिका वर्ग) और फिर सूत्र लगाया जाता है

$ \text{ Median }=l+\frac{\frac{N}{2}-C}{f} \times h $

जहाँ माध्यिका वर्ग वह वर्ग अंतराल है जिसकी संचयी बारंबारता $\frac{N}{2}$ से बस बड़ी या बराबर है, $N$ बारंबारताओं का योग है, $l, f, h$ और $C$ क्रमशः माध्यिका वर्ग की निचली सीमा, बारंबारता, माध्यिका वर्ग की चौड़ाई और माध्यिका वर्ग से ठीक पहले वाले वर्ग की संचयी बारंबारता हैं। माध्यिका ज्ञात करने के बाद, प्रत्येक वर्ग के मध्य-बिंदु $x_i$ का माध्यिका से विचलन का निरपेक्ष मान प्राप्त किया जाता है, अर्थात् $|x_i-M|$।

फिर $ \quad \quad \quad \text{ M.D. }(M)=\frac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-M| $

इस प्रक्रिया को निम्नलिखित उदाहरण से स्पष्ट किया गया है:

उदाहरण 7 निम्नलिखित आँकड़ों के लिए माध्यिका के परिचय माध्य विचलन की गणना कीजिए :

वर्ग $0-10$ $10-20$ $20-30$ $30-40$ $40-50$ $50-60$
बारंबारता 6 7 15 16 4 2

हल दिए गए आँकड़ों से निम्नलिखित सारणी 13.6 बनाइए :

सारणी 13.6

वर्ग आवृत्ति संचयी
आवृत्ति
मध्य-बिंदु $\mid x_i-$ माध्य. $\mid$ $f_i \mid x_i-$ माध्य. $\mid$
$f_i$ $($ c.f. $)$ $x_i$
$0-10$ 6 6 5 23 138
$10-20$ 7 13 15 13 91
$20-30$ 15 28 25 3 45
$30-40$ 16 44 35 7 112
$40-50$ 4 48 45 17 68
$50-60$ 2 50 55 27 54
50 508

वह वर्ग अंतराल जिसमें $\frac{N^{\text{वाँ }}}{2}$ या $25^{\text{वाँ }}$ प्रेक्षण है, वह $20-30$ है। इसलिए, $20-30$ माध्यिका वर्ग है। हम जानते हैं कि

$ \text{ माध्यिका }=l+\frac{\frac{N}{2}-C}{f} \times h $

यहाँ $l=20, C=13, f=15, h=10$ और $N=50$

इसलिए, $\quad$ माध्यिका $=20+\frac{25-13}{15} \times 10=20+8=28$

इस प्रकार, माध्यिका के परितः माध्य विचलन निम्न प्रकार दिया जाता है

$ \text{ मा.वि. }(M)=\frac{1}{N} \sum\limits_{i=1}^{6} f_i|x_i-M|=\frac{1}{50} \times 508=10.16 $

13.4.3 माध्य विचलन की सीमाएँ

एक श्रृंखला में, जहाँ परिवर्तनशीलता की मात्रा बहुत अधिक हो, माध्यिका एक प्रतिनिधित्वकारी केंद्रीय प्रवृत्ति नहीं होती है। इस प्रकार, ऐसी श्रृंखला के लिए माध्यिका के परितः गणना किया गया माध्य विचलन पूरी तरह से भरोसेमंद नहीं हो सकता है।
माध्य से विचलनों का योग (ऋण चिन्हों को नजरअंदाज करते हुए) माध्यिका से विचलनों के योग से अधिक होता है। इसलिए, माध्य के परितः माध्य विचलन बहुत वैज्ञानिक नहीं होता है।
इस प्रकार, कई मामलों में, माध्य विचलन असंतोषजनक परिणाम दे सकता है। साथ ही, माध्य विचलन विचलनों के निरपेक्ष मानों के आधार पर गणना किया जाता है और इसलिए, इसे आगे बीजगणितीय संक्रियाओं के अधीन नहीं किया जा सकता है। इसका तात्पर्य है कि हमारे पास विस्तार का कोई अन्य माप होना चाहिए। मानक विचलन विस्तार का ऐसा ही एक माप है।

13.5 प्रसरण और मानक विचलन

याद कीजिए कि जब माध्य या माध्यिका के परितः माध्य विचलन की गणना की जाती थी, तो विचलनों के निरपेक्ष मान लिए जाते थे। माध्य विचलन को अर्थ देने के लिए निरपेक्ष मान लिए गए थे, अन्यथा विचलन आपस में रद्द हो सकते थे।

विचलनों के चिन्हों के कारण उत्पन्न हुई इस कठिनाई को दूर करने का एक अन्य तरीका यह है कि सभी विचलनों के वर्ग लिए जाएं। स्पष्टतः इन सभी विचलनों के वर्ग ऋणात्मक नहीं होते हैं।

मान लीजिए $x_1, x_2, x_3, \ldots, x_n$ $n$ प्रेक्षण हैं और $\bar{x}$ उनका माध्य है। तब
$ (x _ 1 - \bar {x}) ^ {2} + (x _ 2 - \bar {x} ) ^ {2} + \ldots \ldots . + (x _ {n} - \bar {x} ) ^ {2} = _ {i \neq 1} ^ {n}(x _ {i} - \bar{x})^{2} $

यदि यह योग शून्य है, तो प्रत्येक $(x_i-\bar{x})$ को शून्य होना चाहिए। इसका तात्पर्य है कि कोई भी विचरण नहीं है क्योंकि सभी प्रेक्षण माध्य $\bar{x}$ के बराबर हैं।

यदि $\sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}$ छोटा है, तो यह संकेत देता है कि प्रेक्षण $x_1, x_2, x_3, \ldots, x_n$ माध्य $\bar{x}$ के निकट हैं और इसलिए, विचरण की मात्रा कम है। इसके विपरीत, यदि यह योग बड़ा है, तो माध्य $\bar{x}$ से प्रेक्षणों का विचरण अधिक है। क्या हम इस प्रकार कह सकते हैं कि योग $\sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}$ विचरण या बिखराव की मात्रा का एक उचित संकेतक है?

आइए छः प्रेक्षणों 5, 15, 25, 35, 45, 55 का समुच्चय A लें। प्रेक्षणों का माध्य $\bar{x}=30$ है। इस समुच्चय के लिए $\bar{x}$ से विचलन के वर्गों का योग है

$ \begin{aligned} \sum\limits_{i=1}^{6}(x_i-\bar{x})^{2} & =(5-30)^{2}+(15-30)^{2}+(25-30)^{2}+(35-30)^{2}+(45-30)^{2}+(55-30)^{2} \\ & =625+225+25+25+225+625=1750 \end{aligned} $

अब आइए 31 प्रेक्षणों $15,16,17,18,19,20,21,22,23$, $24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45$ का दूसरा समुच्चय $B$ लें। इन प्रेक्षणों का माध्य $\bar{y}=30$ है

ध्यान दें कि प्रेक्षणों के दोनों समुच्चय A और B का माध्य 30 है।

अब, समुच्चय $B$ के प्रेक्षणों का माध्य $\bar{y}$ से विचलन के वर्गों का योग इस प्रकार दिया गया है

$ \begin{aligned} \sum\limits_{i=1}^{31}(y_i-\bar{y})^{2} & =(15-30)^{2}+(16-30)^{2}+(17-30)^{2}+\ldots+(44-30)^{2}+(45-30)^{2} \\ & =(-15)^{2}+(-14)^{2}+\ldots+(-1)^{2}+0^{2}+1^{2}+2^{2}+3^{2}+\ldots+14^{2}+15^{2} \\ & =2[15^{2}+14^{2}+\ldots+1^{2}] \\ & =2 \times \frac{15 \times(15+1)(30+1)}{6}=5 \times 16 \times 31=2480 \end{aligned} $

(क्योंकि पहले $n$ प्राकृतिक संख्याओं के वर्गों का योग $=\frac{n(n+1)(2 n+1)}{6}$ है। यहाँ $.n=15$ है)

यदि $\sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}$ केवल हमारा माध्य के बारे में विचरण या बिखराव का माप है, तो हम प्रवृत्त होंगे कहने के लिए कि छह प्रेक्षणों के समुच्चय A का माध्य के बारे में विचरण 31 प्रेक्षणों के समुच्चय B की तुलना में कम है, यद्यपि समुच्चय A में प्रेक्षण माध्य से अधिक बिखरे हुए हैं (विचलन की सीमा -25 से 25 है) समुच्चय $B$ की तुलना में (जहाँ विचलन की सीमा -15 से 15 है)।

यह निम्नलिखित आरेखों से भी स्पष्ट है।

समुच्चय A के लिए, हमारे पास है

आकृति 13.5

समुच्चय $B$ के लिए, हमारे पास है

आकृति 13.6

इस प्रकार, हम कह सकते हैं कि माध्य से विचलन के वर्गों का योग विस्तार का उचित माप नहीं है। इस कठिनाई को दूर करने के लिए हम विचलन के वर्गों का माध्य निकालते हैं, अर्थात् हम $\frac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}$ लेते हैं। समुच्चय $A$ के लिए, हमारा माध्य $=\frac{1}{6} \times 1750=291.67$ है और समुच्चय B के लिए, यह $\frac{1}{31} \times 2480=80$ है।

यह संकेत देता है कि समुच्चय A में फैलाव या विस्तार समुच्चय $B$ की तुलना में अधिक है, जो दोनों समुच्चयों की ज्यामितीय निरूपण से पुष्टि करता है।

इस प्रकार, हम $\frac{1}{n} \sum(x_i-\bar{x})^{2}$ को एक ऐसी राशि के रूप में ले सकते हैं जो विस्तार के उचित माप की ओर ले जाती है। यह संख्या, अर्थात् माध्य से विचलन के वर्गों का माध्य, प्रसरण (variance) कहलाता है और इसे $\sigma^{2}$ (सिग्मा स्क्वायर पढ़ा जाता है) द्वारा निरूपित किया जाता है। इसलिए, $n$ प्रेक्षणों $x_1, x_2, \ldots, x_n$ का प्रसरण इस प्रकार दिया जाता है

$ \sigma^{2}=\frac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2} $

13.5.1 मानक विचलन

प्रसरण की गणना में, हम पाते हैं कि व्यक्तिगत प्रेक्षणों $x_i$ के मात्रक और उनके माध्य $\bar{x}$ के मात्रक प्रसरण के मात्रक से भिन्न होते हैं, क्योंकि प्रसरण में $(x_i-\bar{x})$ के वर्गों का योग शामिल होता है। इस कारण, प्रेक्षणों के समुच्चय के माध्य के परितः विस्तार के उचित माप को प्रसरण के धनात्मक वर्गमूल के रूप में व्यक्त किया जाता है और इसे मानक विचलन (standard deviation) कहा जाता है। इसलिए, मानक विचलन, जिसे सामान्यतः $\sigma$ द्वारा निरूपित किया जाता है, इस प्रकार दिया जाता है

$$ \sigma=\sqrt{\frac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}} \quad \quad \quad \quad \quad \ldots(1) $$

आइए प्रसरण और इस प्रकार असमूहित आँकड़ों के मानक विचलन की गणना को समझाने के लिए निम्नलिखित उदाहरण लें।

उदाहरण 8 निम्नलिखित आँकड़ों का प्रसरण ज्ञात कीजिए:

$$ 6,8,10,12,14,16,18,20,22,24 $$

हल दिए गए आँकड़ों से हम निम्नलिखित तालिका 13.7 बना सकते हैं। माध्य 14 को माना गया माध्य मानकर चरण-विचलन विधि से परिकलित किया गया है। प्रेक्षणों की संख्या $n=10$ है।

तालिका 13.7

$x_i$ $d_i=\frac{x_i-14}{2}$ माध्य से विचलन
$(x_i-\bar{x})$
$(x_i-\bar{x})$
6 -4 -9 81
8 -3 -7 49
10 -2 -5 25
12 -1 -3 9
14 0 -1 1
16 1 1 1
18 2 3 9
20 3 5 25
22 4 7 49
24 5 9 81
5 330

इसलिए

$ \text{ माध्य } \bar{x}=\text{ माना गया माध्य }+\frac{\sum\limits_{i=1}^{n} d_i}{n} \times h=14+\frac{5}{10} \times 2=15 $

और

$ \text{ प्रसरण }(\sigma^{2})=\frac{1}{n} \sum\limits_{i=1}^{10}(x_i-\bar{x})^{2}=\frac{1}{10} \times 330=33 $

इस प्रकार मानक विचलन $(\sigma)=\sqrt{33}=5.74$

13.5.2 विवृत आवृत्ति बंटन का मानक विचलन

माना दिया गया विवृत आवृत्ति बंटन है

$ \begin{matrix} x: & x_1, & x_2, \quad x_3, \ldots, x_n \\ \\ & f: & f_1, \quad f_2, \quad f_3, \ldots, f_n \end{matrix} $

इस स्थिति में मानक विचलन $(\sigma)=\sqrt{\frac{1}{N} \sum\limits_{i=1}^{n} f_i(x_i-\bar{x})^{2}} \quad \quad \quad \quad \ldots(2)$

जहाँ $N=\sum\limits_{i=1}^{n} f_i$।

आइए निम्नलिखित उदाहरण लें।

उदाहरण 9 निम्नलिखित आँकड़ों के लिए प्रसरण और मानक विचलन ज्ञात कीजिए:

$x_i$ 4 8 11 17 20 24 32
$f_i$ 3 5 9 5 4 3 1

हल आँकड़ों को सारणीबद्ध रूप में प्रस्तुत करते हुए (तालिका 13.8), हमें प्राप्त होता है

तालिका 13.8

$x_i$ $f_i$ $f_i x_i$ $x_i-\bar{x}$ $(x_i-\bar{x})^{2}$ $f_i(x_i-\bar{x})^{2}$
4 3 12 -10 100 300
8 5 40 -6 36 180
11 9 99 -3 9 81
17 5 85 3 9 45
20 4 80 6 36 144
24 3 72 10 100 300
32 1 32 18 324 324
30 420 1374

$ \begin{gathered} N=30, \sum\limits_ {i=1}^{7} f _ {i} x _ {i}=420, \sum\limits_ {i=1}^{7} f _ {i}(x _ {i}-\bar{x})^{2}=1374 \\ \text{इसलिए }\quad \quad \quad \quad \bar{x}=\frac{\sum\limits_ {i=1}^{7} f _ {i} x _ {i}}{N}=\frac{1}{30} \times 420=14 \\ इस प्रकार }\quad \quad \quad \quad\text{ प्रसरण }(\sigma^{2})=\frac{1}{N} \sum\limits_ {i=1}^{7} f _ {i}(x _ {i}-\bar{x})^{2} \\ =\frac{1}{30} \times 1374=45.8 \end{gathered} $

$ \text{और }\quad \quad \quad \text{ मानक विचलन }(\sigma)=\sqrt{45.8}=6.77 $

13.5.3 सतत बारंबारता बंटन का मानक विचलन

दिए गए सतत बारंबारता बंटन को प्रत्येक वर्ग को उसके मध्य-बिंदु से प्रतिस्थापित करके एक विविक्त बारंबारता बंटन के रूप में प्रस्तुत किया जा सकता है। फिर, मानक विचलन की गणना विविक्त बारंबारता बंटन के मामले में अपनाई गई तकनीक द्वारा की जाती है।

यदि $n$ वर्गों का एक बारंबारता बंटन है, जहाँ प्रत्येक वर्ग अपने मध्य-बिंदु $x_i$ और बारंबारता $f_i$ द्वारा परिभाषित है, तो मानक विचलन निम्न सूत्र द्वारा प्राप्त किया जाएगा

$ \sigma=\sqrt{\frac{1}{N} \sum\limits_{i=1}^{n} f_i(x_i-\bar{x})^{2}} $

जहाँ $\bar{x}$ बंटन का माध्य है और $N=\sum\limits_{i=1}^{n} f_i$।

मानक विचलन के लिए एक अन्य सूत्र हम जानते हैं कि

प्रसरण $ (\sigma^{2})=\frac{1}{N} \sum\limits_ {i=1}^{n} f _ {i}(x _ {i} - \bar{x}) ^ {2} = \frac{1}{N} \sum\limits_{i = 1} ^ {n} f _ {i}(x _ i ^ {2} + \bar x ^{2} - 2 \bar {x} x _ {i}) $

$ \begin{aligned} =\frac{1}{N}\begin{bmatrix} \sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} + \sum\limits_ {i = 1} ^ {n} \bar x ^{2} f_i-\sum\limits_{i=1}^{n} 2 \bar{x} f_i x_i\end{bmatrix}\end{aligned} $

$ \begin{aligned} & =\frac{1}{N}\begin{bmatrix}\sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} + \bar x ^ {2} \sum\limits_ {i = 1} ^ {n} f _ {i} - 2 \bar{x} \sum\limits_ {i=1}^{n} x _{i} f _ {i} \end{bmatrix} \end{aligned} $

$ \begin{aligned} & =\frac {1}{N} \sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} + \bar x ^ {2} N - 2 \bar{x} . N \bar{x} \quad[\text{ यहाँ } \frac {1}{N} \sum\limits_ {i = 1} ^ {n} x _ {i} f _ {i} = \bar{x} \text{ या } \sum\limits_ {i = 1} ^ {n} x _ {i} f _ {i}= N \bar{x}] \\ & =\frac {1}{N} \sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} + \bar x ^ {2} - 2 \bar x ^ {2}=\frac {1}{N} \sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} - \bar x^{2} \end{aligned} $

या

$ \sigma^{2}=\frac{1}{N} \sum\limits_{i=1}^{n} f_i x_i^{2}-\left(\frac{\sum\limits_{i=1}^{n} f_i x_i}{N}\right)^{2}=\frac{1}{N^{2}}\left[N \sum\limits_{i=1}^{n} f_i x_i^{2}-(\sum\limits_{i=1}^{n} f_i x_i)^{2}\right] $

इस प्रकार, मानक विचलन $(\sigma)=\frac{1}{N} \sqrt{N \sum\limits_{i=1}^{n} f_i x_i{ }^{2}-(\sum\limits_{i=1}^{n} f_i x_i)^{2}}$

उदाहरण 10 निम्नलिखित बंटन के लिए माध्य, प्रसरण और मानक विचलन की गणना कीजिए :

वर्ग $30-40$ $40-50$ $50-60$ $60-70$ $70-80$ $80-90$ $90-100$
बारंबारता 3 7 12 15 8 3 2

हल दिए गए आँकड़ों से हम निम्नलिखित सारणी 13.9 बनाते हैं।

सारणी 13.9

वर्ग आवृत्ति
$(f_i)$
मध्य-बिंदु
$(x_i)$
$f_i x_i$ $(x_i-\bar{x})^{2}$ $f_i(x_i-\bar{x})^{2}$
$30-40$ 3 35 105 729 2187
$40-50$ 7 45 315 289 2023
$50-60$ 12 55 660 49 588
$60-70$ 15 65 975 9 135
$70-80$ 8 75 600 169 1352
$80-90$ 3 85 255 529 1587
$90-100$ 2 95 190 1089 2178
50 3100 10050

इस प्रकार $ \quad \quad \quad \quad \text{ माध्य } \bar{x}=\frac{1}{N} \sum\limits_{i=1}^{7} f_i x_i=\frac{3100}{50}=62 $

प्रसरण $(\sigma^{2})=\frac{1}{N} \sum\limits_{i=1}^{7} f_i(x_i-\bar{x})^{2}$

$ =\frac{1}{50} \times 10050=201 $

तथा $ \quad \quad \quad \quad \text{ मानक विचलन }(\sigma)=\sqrt{201}=14.18 $

उदाहरण 11 निम्नलिखित आँकड़ों के लिए मानक विचलन ज्ञात कीजिए :

$x_i$ 3 8 13 18 23
$f_i$ 7 10 15 10 6

हल आइए निम्नलिखित सारणी 13.10 बनाएँ:

सारणी 13.10

$x_i$ $f_i$ $f_i x_i$ $x_i{ }^{2}$ $f_i x_i{ }^{2}$
3 7 21 9 63
8 10 80 64 640
13 15 195 169 2535
18 10 180 324 3240
23 6 138 529 3174
48 614 9652

अब, सूत्र (3) द्वारा, हमारे पास

$ \begin{aligned} \sigma & =\frac{1}{N} \sqrt{N \sum{f_i x_i}^{2}-\left(\sum{f_i x_i}\right)^{2}} \\ \\ & =\frac{1}{48} \sqrt{48 \times 9652-(614)^{2}} \\ \\ & =\frac{1}{48} \sqrt{463296-376996} \end{aligned} $

$ =\frac{1}{48} \times 293.77=6.12 $

इसलिए, $\quad$ मानक विचलन $(\sigma)=6.12$

13.5.4. प्रसरण और मानक विचलन ज्ञात करने की शॉर्टकट विधि

कभी-कभी एक विचरित बंटन में $x_i$ के मान या एक सतत बंटन में विभिन्न वर्गों के मध्य-बिंदु $x_i$ बड़े होते हैं और इसलिए माध्य और प्रसरण की गणना कठिन और समय लेने वाली हो जाती है। चरण-विचलन विधि का प्रयोग करके इस प्रक्रिया को सरल बनाना संभव है।

मान लीजिए अनुमानित माध्य ‘A’ है और पैमाने को $\frac{1}{h}$ गुना तक घटाया गया है ($h$ वर्ग-अंतराल की चौड़ाई है)। मान लीजिए चरण-विचलन या नए मान $y_i$ हैं।

अर्थात् $\quad y_i=\frac{x_i-A}{h}$ या $x_i=A+h y_i \quad \quad \quad \quad \quad \ldots(1)$

हम जानते हैं कि $ \quad \quad \quad \bar{x}=\frac{\sum\limits_{i=1}^{n} f_i x_i}{N} \quad \quad \quad \quad \quad \ldots(2) $

(1) से $x_i$ को (2) में रखने पर, हम पाते हैं

$ \begin{aligned} \bar{x} & =\frac{\sum\limits_{i=1}^{n} f_i(A+h y_i)}{N} \\ & =\frac{1}{N}(\sum\limits_{i=1}^{n} f_i A+\sum\limits_{i=1}^{n} h f_i y_i)=\frac{1}{N}(A \sum\limits_{i=1}^{n} f_i+h \sum\limits_{i=1}^{n} f_i y_i) \\ & =A \cdot \frac{N}{N}+h \frac{\sum\limits_{i=1}^{n} f_i y_i}{N} \quad(\text{ क्योंकि } \sum\limits_{i=1}^{n} f_i=N) \end{aligned} $

इस प्रकार $\quad \bar{x}=A+h \bar{y} \quad \quad \quad\quad \quad \ldots(3)$

अब चर $x$ का प्रसरण, $\sigma_x^{2}=\frac{1}{N} \sum\limits_{i=1}^{n} f_i(x_i-\bar{x})^{2}$

$ =\frac{1}{N} \sum\limits_{i=1}^{n} f_i(A+h y_i-A-h \bar{y})^{2} \quad \text{(समीकरण (1) और (3) का प्रयोग करने पर)} $

$ \begin{aligned} & =\frac{1}{N} \sum\limits_{i=1}^{n} f_i h^{2}(y_i-\bar{y})^{2} \\ & =\frac{h^{2}}{N} \sum\limits_{i=1}^{n} f_i(y_i-\bar{y})^{2}=h^{2} \times \text{ चर } y_i \text{ का प्रसरण} \end{aligned} $

अर्थात् $\quad \sigma_x^{2}=h^{2} \sigma_y^{2}$

या $\quad \sigma_x=h \sigma_y \quad \quad \quad \quad \quad \ldots(4)$

समीकरण (3) और (4) से, हम पाते हैं

$ \sigma_x=\frac{h}{N} \sqrt{N \sum\limits_{i=1}^{n} f_i y_i^{2}-(\sum\limits_{i=1}^{n} f_i y_i)^{2}} \quad \quad \quad \quad \quad \ldots(5) $

आइए उदाहरण 11 को शॉर्टकट विधि से और सूत्र (5) का प्रयोग करके हल करें।

उदाहरण 12 निम्नलिखित बंटन के लिए माध्य, प्रसरण और मानक विचलन की गणना कीजिए।

वर्ग $30-40$ $40-50$ $50-60$ $60-70$ $70-80$ $80-90$ $90-100$
आवृत्ति 3 7 12 15 8 3 2

हल माना कि माना गया माध्य A $=65$। यहाँ $h=10$

हम दिए गए आँकड़ों से निम्नलिखित सारणी 13.11 प्राप्त करते हैं:

सारणी 13.11

वर्ग आवृत्ति मध्य-बिंदु $y_i=\frac{x_i-65}{10}$ $y_i{ }^{2}$ $f_i y_i$ $f_i y_i{ }^{2}$
$f_i$ $x_i$
$30-40$ 3 35 -3 9 -9 27
$40-50$ 7 45 -2 4 -14 28
$50-60$ 12 55 -1 1 -12 12
$60-70$ 15 65 0 0 0 0
$70-80$ 8 75 1 1 8 8
$80-90$ 3 85 2 4 6 12
$90-100$ 2 95 3 9 6 18
$N=50$ -15 105

इसलिए

$\quad \bar{x}=\mathrm{A}+\frac{\sum f _{i} y _{i}}{50} \times h=65-\frac{15}{50} \times 10=62$ $ \text { प्रसरण } \sigma^{2}=\frac{h^{2}}{\mathrm{~N}^{2}}\left[\mathrm{~N} \sum f _{i} y _{i}^{2}-\left(\sum f _{i} y _{i}\right)^{2}\right] $ $ \begin{aligned} & =\frac{(10)^{2}}{(50)^{2}}\left[50 \times 105-(-15)^{2}\right] \\ & =\frac{1}{25}[5250-225]=201 \end{aligned} $

और मानक विचलन $(\sigma)=\sqrt{201}=14.18$

विविध उदाहरण

उदाहरण 13 20 प्रेक्षणों का प्रसरण 5 है। यदि प्रत्येक प्रेक्षण को 2 से गुणा किया जाए, तो परिणामी प्रेक्षणों का नया प्रसरण ज्ञात कीजिए।

हल माना प्रेक्षण $x_1, x_2, \ldots, x _{20}$ हैं और $\bar{x}$ उनका माध्य है। दिया गया है कि प्रसरण $=5$ और $n=20$। हम जानते हैं कि

$ \begin{aligned} & \text{ प्रसरण }(\sigma^{2})=\frac{1}{n} \sum\limits_{i=1}^{20}(x_i-\bar{x})^{2}, \text{ अर्थात् } 5=\frac{1}{20} \sum\limits_{i=1}^{20}(x_i-\bar{x})^{2} \\ & \text{या}\quad \quad \quad \quad \sum\limits_{i=1}^{20}(x_i-\bar{x})^{2}=100 \end{aligned} $

यदि प्रत्येक प्रेक्षण को 2 से गुणा किया जाए, और नवीन प्राप्त प्रेक्षणों को $y_i$ कहा जाए, तब

$ y_i=2 x_i \text{ अर्थात् } x_i=\frac{1}{2} y_i \quad \quad \quad \quad \quad \quad \ldots(1) $

इसलिए $ \quad \quad \quad \quad\bar{y}=\frac{1}{n} \sum\limits_{i=1}^{20} y_i=\frac{1}{20} \sum\limits_{i=1}^{20} 2 x_i=2 \cdot \frac{1}{20} \sum\limits_{i=1}^{20} x_i $

अर्थात् $\quad \quad \quad \quad\bar{y}=2 \bar{x}$ या $\bar{x}=\frac{1}{2} \bar{y}$

(1) में $x_i$ और $\bar{x}$ के मान रखने पर, हमें प्राप्त होता है

$ \sum\limits_{i=1}^{20}(\frac{1}{2} y_i-\frac{1}{2} \bar{y})^{2}=100 \text{, अर्थात् } \sum\limits_{i=1}^{20}(y_i-\bar{y})^{2}=400 $

इस प्रकार नवीन प्रेक्षणों का प्रसरण $=\frac{1}{20} \times 400=20=2^{2} \times 5$

नोट - पाठक ध्यान दें कि यदि प्रत्येक प्रेक्षण को कोई नियतांक $k$ से गुणा किया जाए, तो परिणामी प्रेक्षणों का प्रसरण मूल प्रसरण का $k^{2}$ गुना हो जाता है।

उदाहरण 14 5 प्रेक्षणों का माध्य 4.4 है और उनका प्रसरण 8.24 है। यदि उनमें से तीन प्रेक्षण 1,2 और 6 हैं, तो शेष दो प्रेक्षण ज्ञात कीजिए।

हल मान लीजिए शेष दो प्रेक्षण $x$ और $y$ हैं।

इसलिए, श्रेणी है $1,2,6, x, y$।

अब $ \quad \quad \quad \quad\text{माध्य} \bar{x}=4.4=\frac{1+2+6+x+y}{5} $

या $ \quad \quad \quad \quad 22=9+x+y $

इसलिए $\quad x+y=13\quad \quad \quad \quad\quad \quad \ldots(1)$

साथ ही $\quad$ प्रसरण $=8.24=\frac{1}{n} \sum\limits_{i=1}^{5}(x_i-\bar{x})^{2}$

अर्थात् $8.24=\frac{1}{5}\left[(3.4)^{2}+(2.4)^{2}+(1.6)^{2}+x^{2}+y^{2}-2 \times 4.4(x+y)+2 \times(4.4)^{2}\right]$

या $41.20=11.56+5.76+2.56+x^{2}+y^{2}-8.8 \times 13+38.72$

इसलिए $\quad x^{2}+y^{2}=97\quad \quad \quad \quad\quad \quad \ldots(2)$

परंतु (1) से, हमारे पास है

$ x^{2}+y^{2}+2 x y=169 \quad \quad \quad \quad\quad \quad \ldots(3) $

(2) और (3) से, हमारे पास है

$ 2 x y=72 \quad \quad \quad \quad\quad \quad \ldots(4) $

(2) में से (4) घटाने पर, हमें मिलता है

$ \begin{aligned} & x^{2}+y^{2}-2 x y=97-72 \quad \text{ अर्थात् } \quad (x-y)^{2}=25 \\ & \text{या} \quad \quad \quad x-y= \pm 5 \quad \quad \quad \quad\quad \quad \ldots(5) \end{aligned} $

इसलिए, (1) और (5) से, हमें मिलता है

$ x=9, y=4 \text{ जब } x-y=5 $ या $\quad x=4, y=9$ जब $x-y=-5$

इस प्रकार, शेष प्रेक्षण 4 और 9 हैं।

उदाहरण 15 यदि प्रत्येक प्रेक्षण $x_1, x_2, \ldots, x_n$ को ’ $a$ ’ से बढ़ाया जाता है, जहाँ $a$ एक ऋणात्मक या धनात्मक संख्या है, तो दिखाइए कि प्रसरण अपरिवर्तित रहता है।

हल मान लीजिए $\bar{x}$, $x_1, x_2, \ldots, x_n$ का माध्य है। तब प्रसरण दिया गया है

$ \sigma_1^{2}=\frac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2} $

यदि प्रत्येक प्रेक्षण में ’ $a$ ’ जोड़ा जाए, तो नए प्रेक्षण होंगे

$ \begin{equation*} y _{i}=x _{i}+a \tag{1} \end{equation*} $

माना नयी प्रेक्षणों का माध्य $\bar{y}$ है। तब

$ \begin{aligned} \bar{y} & =\frac{1}{n} \sum\limits_{i=1}^{n} y_i=\frac{1}{n} \sum\limits_{i=1}^{n}(x_i+a) \ & =\frac{1}{n}[\sum\limits_{i=1}^{n} x_i+\sum\limits_{i=1}^{n} a]=\frac{1}{n} \sum\limits_{i=1}^{n} x_i+\frac{n a}{n}=\bar{x}+a \end{aligned} $

अर्थात् $ \quad \quad \quad \bar{y}=\bar{x}+a \quad \quad \quad \quad\quad \quad \ldots(1) $

इस प्रकार, नये प्रेक्षणों का प्रसरण

$ \begin{aligned} \sigma_2^{2} & =\frac{1}{n} \sum\limits_{i=1}^{n}(y_i-\bar{y})^{2}=\frac{1}{n} \sum\limits_{i=1}^{n}(x_i+a-\bar{x}-a)^{2} \quad \text{ [(1) और (2) का प्रयोग कर]} \ & =\frac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}=\sigma_1^{2} \end{aligned} $

इस प्रकार, नये प्रेक्षणों का प्रसरण मूल प्रेक्षणों के प्रसरण के समान है।

नोट - हम यह नोट कर सकते हैं कि किसी समूह के प्रत्येक प्रेक्षण में एक धनात्मक संख्या जोड़ने (या घटाने) से प्रसरण प्रभावित नहीं होता।

उदाहरण 16 100 प्रेक्षणों का माध्य और मानक विचलन क्रमशः 40 और 5.1 गणना किया गया था, जिसे एक छात्र ने गलती से एक प्रेक्षण के लिए 40 के स्थान पर 50 लेकर निकाला था। सही माध्य और मानक विचलन क्या हैं?

हल दिया गया है कि प्रेक्षणों की संख्या $(n)=100$

गलत माध्य $(\bar{x})=40$,

गलत मानक विचलन $(\sigma)=5.1$

हम जानते हैं कि $\bar{x}=\frac{1}{n} \sum\limits_{i=1}^{n} x_i$

अर्थात् $ \quad \quad \quad 40=\frac{1}{100} \sum\limits_{i=1}^{100} x_i \quad \text{ या } \quad \sum\limits_{i=1}^{100} x_i=4000 $

अर्थात् $\quad$ प्रेक्षणों का गलत योग $=4000$

इस प्रकार $\quad \quad \quad$ प्रेक्षणों का सही योग $=$ गलत योग $-50+40$

$ =4000-50+40=3990 $

अतः $\quad$ सही माध्य $=\frac{\text{ सही योग }}{100}=\frac{3990}{100}=39.9$

साथ ही $\quad$ मानक विचलन $\sigma=\sqrt{\frac{1}{n} \sum\limits_{i=1}^{n} x_i^{2}-\frac{1}{n^{2}}(\sum\limits_{i=1}^{n} x_i)^{2}}$

$ =\sqrt{\frac{1}{n} \sum\limits_{i=1}^{n} x_i^{2}-(\bar{x})^{2}} $

अर्थात् $ \quad \quad \quad\quad \quad \quad 5.1=\sqrt{\frac{1}{100} \times गलत \sum\limits_{i=1}^{n} x_i^{2}-(40)^{2}}$

या $ \quad \quad \quad\quad \quad \quad 26.01=\frac{1}{100} \times \text{ गलत } \sum\limits_{i=1}^{n} x_i^{2}-1600 $

इसलिए $\quad$ गलत $\sum\limits_{i=1}^{n} x_i{ }^{2}=100(26.01+1600)=162601$

अब $\quad \quad \quad\quad \quad \quad$ सही $\sum\limits_{i=1}^{n} x_i^{2}=$ गलत $\sum\limits_{i=1}^{n} x_i{ }^{2}-(50)^{2}+(40)^{2}$

$ =162601-2500+1600=161701 $

इसलिए सही मानक विचलन

$ \begin{aligned} & =\sqrt{\frac{\text{ सही } \sum x_i^{2}}{n}-(\text{ सही माध्य })^{2}} \ & =\sqrt{\frac{161701}{100}-(39.9)^{2}} \ & =\sqrt{1617.01-1592.01}=\sqrt{25}=5 \ \end{aligned} $

सारांश

फैलाव के माप परास, चतुर्थक विचलन, माध्य विचलन, प्रसरण, मानक विचलन फैलाव के माप हैं।

परास = अधिकतम मान - न्यूनतम मान

असमूहीकृत आँकड़ों के लिए माध्य विचलन

M.D. $(\bar{x})=\frac{\sum|x_i-\bar{x}|}{n}, \quad$ M.D. $(M)=\frac{\sum|x_i-M|}{n}$

समूहीकृत आँकड़ों के लिए माध्य विचलन

M.D. $(\bar{x})=\frac{\sum f_i|x_i \quad \bar{x}|}{N}, \quad$ M.D. (M) $=\frac{\sum f_i \mid x_i}{N}$ M , जहाँ $N=\sum f_i$

असमूहीकृत आँकड़ों के लिए प्रसरण और मानक विचलन

$\sigma^{2}=\frac{1}{n} \sum(x_i-\bar{x})^{2}, \quad \sigma=\sqrt{\frac{1}{n} \sum(x_i-\bar{x})^{2}}$

एक विवृत आवृत्ति बंटन का प्रसरण और मानक विचलन

$ \sigma^{2}=\frac{1}{N} \sum f_i(x_i-\bar{x})^{2}, \quad \sigma=\sqrt{\frac{1}{N} \sum f_i(x_i-\bar{x})^{2}} $

एक सतत आवृत्ति बंटन का प्रसरण और मानक विचलन

$ \sigma^{2}=\frac{1}{N} \sum f_i(x_i-\bar{x})^{2}, \quad \sigma=\frac{1}{N} \sqrt{N \sum f_i x_i^{2}-(\sum f_i x_i)^{2}} $

प्रसरण और मानक विचलन ज्ञात करने की शॉर्टकट विधि।

$ \begin{aligned} & \sigma^{2}=\frac{h^{2}}{N^{2}}[N \sum f_i y_i^{2}-(\sum f_i y_i)^{2}], \sigma=\frac{h}{N} \sqrt{N \sum f_i y_i^{2}-(\sum f_i y_i)^{2}}, \\ \\ & \text{ जहाँ } y_i=\frac{x_i-A}{h} \end{aligned} $

ऐतिहासिक टिप्पणी

‘सांख्यिकी’ शब्द लैटिन शब्द ‘स्टेटस’ से लिया गया है जिसका अर्थ है राजनीतिक राज्य। इससे सुझाव मिलता है कि सांख्यिकी मानव सभ्यता जितनी पुरानी है। ईसा पूर्व 3050 में, संभवतः मिस्र में पहली जनगणना आयोजित की गई थी। भारत में भी, लगभग 2000 वर्ष पूर्व, हमारे पास प्रशासनिक सांख्यिकी एकत्र करने की एक कुशल प्रणाली थी, विशेष रूप से चन्द्रगुप्त मौर्य (ईसा पूर्व 324-300) के शासनकाल के दौरान। जन्म और मृत्यु से संबंधित आँकड़े एकत्र करने की प्रणाली का उल्लेख कौटिल्य के अर्थशास्त्र (लगभग ईसा पूर्व 300) में किया गया है। अकबर के शासनकाल के दौरान संचालित प्रशासनिक सर्वेक्षणों का विस्तृत विवरण अबुल फजल द्वारा लिखित आइन-ए-अकबरी में दिया गया है।

लंदन के कैप्टन जॉन ग्राउंट (1620-1674) को जन्म और मृत्यु के आँकड़ों पर अपने अध्ययन के कारण जनसांख्यिकी का जनक माना जाता है। जैकब बर्नौली (1654-1705) ने 1713 में प्रकाशित अपनी पुस्तक “आर्स कॉन्जेक्टेंडी” में बड़ी संख्याओं का नियम बताया।

सांख्यिकी का सैद्धांतिक विकास सत्रहवीं सदी के मध्य में आया और उसके बाद खेल और संयोग के सिद्धांत (अर्थात् प्रायिकता) के प्रवेश के साथ जारी रहा। फ्रांसिस गाल्टन (1822-1921), एक अंग्रेज़, ने जैवमिति के क्षेत्र में सांख्यिकीय विधियों के उपयोग की शुरुआत की। कार्ल पियर्सन (1857-1936) ने काई वर्ग परीक्षण की खोज और इंग्लैंड में सांख्यिकीय प्रयोगशाला की स्थापना (1911) के साथ सांख्यिकीय अध्ययनों के विकास में बहुत योगदान दिया। सर रोनाल्ड ए. फिशर (1890-1962), जिन्हें आधुनिक सांख्यिकी का जनक कहा जाता है, ने इसे आनुवंशिकी, जैवमिति, शिक्षा, कृषि आदि विविध क्षेत्रों में लागू किया।