अध्याय 02 डेटा प्रोसेसिंग
आपने पिछले अध्याय में सीखा है कि डेटा को संगठित और प्रस्तुत करने से वे समझ में आने योग्य बन जाते हैं। यह डेटा प्रोसेसिंग को सुविधाजनक बनाता है। डेटा का विश्लेषण करने के लिए कई सांख्यिकीय तकनीकों का उपयोग किया जाता है, जैसे:
- केंद्रीय प्रवृत्ति के माप
- विस्तार के माप
- संबंध के माप
जबकि केंद्रीय प्रवृत्ति के माप उस मान को प्रदान करते हैं जो प्रेक्षणों के समूह का एक आदर्श प्रतिनिधि होता है, विस्तार के माप डेटा की आंतरिक विविधताओं को ध्यान में रखते हैं, अक्सर किसी केंद्रीय प्रवृत्ति के माप के आसपास। संबंध के माप, दूसरी ओर, किसी भी दो या अधिक संबंधित घटनाओं—जैसे वर्षा और बाढ़ की घटना या उर्वरक की खपत और फसल की पैदावार—के बीच संबंध की डिग्री प्रदान करते हैं। इस अध्याय में, आप केंद्रीय प्रवृत्ति के माप सीखेंगे।
केंद्रीय प्रवृत्ति के माप
मापने योग्य विशेषताएँ जैसे वर्षा, ऊँचाई, जनसंख्या घनत्व, शैक्षिक उपलब्धि के स्तर या आयु समूह भिन्न होते हैं। यदि हम उन्हें समझना चाहें, तो हम कैसे करेंगे? शायद हमें एक ऐसे एकल मान या संख्या की आवश्यकता होगी जो सभी प्रेक्षणों का सर्वोत्तम प्रतिनिधित्व करे। यह एकल मान आमतौर पर किसी वितरण के केंद्र के निकट होता है, न कि किसी चरम सिरे पर। वितरणों के केंद्र को ज्ञात करने के लिए प्रयुक्त सांख्यिकीय तकनीकों को केंद्रीय प्रवृत्ति के माप कहा जाता है। केंद्रीय प्रवृत्ति को दर्शाने वाली संख्या संपूर्ण डेटा सेट के लिए प्रतिनिधि आकृति होती है क्योंकि यह वह बिंदु है जिसके चारों ओर मदों के समूहित होने की प्रवृत्ति होती है।
केन्द्रीय प्रवृत्ति के माप को सांख्यिकीय औसत भी कहा जाता है। केन्द्रीय प्रवृत्ति के मापों की संख्या कई होती है, जैसे माध्य, माध्यिका और बहुलक।
माध्य
माध्य वह मान है जो सभी मानों को योग करके और उसे प्रेक्षणों की संख्या से विभाजित करके प्राप्त किया जाता है।
माध्यिका
माध्यिका वह रैंक का मान है जो व्यवस्थित श्रेणी को दो समान संख्याओं में विभाजित करता है। यह वास्तविक मान से स्वतंत्र होता है। आरोही या अवरोही क्रम में डेटा को व्यवस्थित करना और फिर मध्य रैंकिंग संख्या के मान को खोजना माध्यिका की गणना में सबसे महत्वपूर्ण है। सम संख्याओं के मामले में दो मध्य रैंकिंग मानों का औसत माध्यिका होगा।
बहुलक
बहुलक किसी विशेष बिंदु या मान पर अधिकतम आवृत्ति या बारंबारता है। आप देख सकते हैं कि इनमें से प्रत्येक माप विभिन्न प्रकार के डेटा सेटों के लिए उपयुक्त एकल प्रतिनिधि संख्या निर्धारित करने की एक भिन्न विधि है।
माध्य
माध्य किसी चर के विभिन्न मानों का सरल अंकगणितीय औसत है। अग्रुपित और समूहीकृत डेटा के लिए माध्य की गणना करने की विधियां आवश्यक रूप से भिन्न होती हैं। माध्य को समूहीकृत और अग्रुपित दोनों डेटा के लिए प्रत्यक्ष या अप्रत्यक्ष विधियों से गणना किया जा सकता है।
अग्रुपित डेटा से माध्य की गणना
प्रत्यक्ष विधि
अवर्गीकृत आँकड़ों से प्रत्यक्ष विधि द्वारा माध्य निकालते समय प्रत्येक प्रेक्षण के मानों को जोड़ा जाता है और कुल प्रेक्षणों के योग को घटनाओं की कुल संख्या से विभाजित किया जाता है। माध्य निम्न सूत्र द्वारा निकाला जाता है:
$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$
जहाँ,
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { माध्य } \ \sum \quad & \text { मापों की श्रृंखला का } \ & \text { योग } \end{aligned} $$
$x \quad=$ मापों की श्रृंखला में एक कच्चा अंक
$\sum \mathrm{x}=$ सभी मापों का योग
$\mathrm{N} \quad$ = मापों की संख्या
उदाहरण 2.1 : मध्य प्रदेश के मालवा पठार के लिए जिलों में वर्षा के आँकड़ों से माध्य वर्षा निकालें जो सारणी 2.1 में दी गई है:
$\hspace{1cm}$ सारणी 2.1 : माध्य वर्षा की गणना
| मालवा पठार के जिले |
सामान्य वर्षा मिमी में |
अप्रत्यक्ष विधि |
|---|---|---|
| x प्रत्यक्ष विधि | $d=x-800^{*}$ | |
| इंदौर | 979 | 179 |
| देवास | 1083 | 283 |
| धार | 833 | 33 |
| रतलाम | 896 | 96 |
| उज्जैन | 891 | 91 |
| मंदसौर | 825 | 25 |
| शाजापुर | 977 | 177 |
| $\sum x$ और $\sum d$ | 6484 | 884 |
| $\frac{\sum x}{N}$ और $\frac{\sum d}{N}$ | 926.29 | 126.29 |
- जहाँ 800 माना गया माध्य है।
$\mathrm{d}$ माना गया माध्य से विचलन है।
सारणी 2.1 में दिए गए आँकड़ों का माध्य इस प्रकार निकाला गया है:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$
यह ध्यान दिया जा सकता है कि माध्य की गणना में कच्चे वर्षा आँकड़ों को सीधे जोड़ा गया है और योग को प्रेक्षणों की संख्या अर्थात् जिलों की संख्या से विभाजित किया गया है। इसलिए इसे प्रत्यक्ष विधि कहा जाता है।
अप्रत्यक्ष विधि
बड़ी संख्या में प्रेक्षणों के लिए माध्य की गणना सामान्यतः अप्रत्यक्ष विधि द्वारा की जाती है। यह प्रेक्षणों के मानों को उनसे एक नियत संख्या घटाकर छोटे मानों तक सीमित करने में सहायक होती है। उदाहरण के लिए, जैसा कि तालिका 2.1 में दिखाया गया है, वर्षा मान 800 और $1100 \mathrm{~mm}$ के बीच हैं। हम इन मानों को ‘अनुमानित माध्य’ चुनकर और प्रत्येक मान से चयनित संख्या घटाकर कम कर सकते हैं। वर्तमान उदाहरण में हमने 800 को अनुमानित माध्य लिया है। इस प्रकार की प्रक्रिया को कोडिंग कहा जाता है। माध्य इन घटे हुए मानों (तालिका 2.1 का स्तंभ 3) से निकाला जाता है।
अप्रत्यक्ष विधि से माध्य की गणना निम्नलिखित सूत्र द्वारा की जाती है:
$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$
जहाँ,
$$ \begin{aligned} A & =\text { घटाई गई नियत संख्या } \ \sum d & =\text { कोडित स्कोरों का योग } \ N & =\text { श्रेणी में व्यक्तिगत प्रेक्षणों की संख्या } \end{aligned} $$
तालिका 2.1 में दिखाए गए आँकड़ों का माध्य अप्रत्यक्ष विधि से निम्न प्रकार से निकाला जा सकता है:
$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$
ध्यान दें कि माध्य मान दोनों में से किसी भी विधि से गणना करने पर समान आता है।
गुप्त डेटा से माध्य की गणना
माध्य को गुप्त डेटा के लिए भी प्रत्यक्ष या अप्रत्यक्ष विधि से गणना किया जाता है।
प्रत्यक्ष विधि
जब अंकों को बारंबारता बंटन में गुप्त किया जाता है, तो व्यक्तिगत मान अपनी पहचान खो देते हैं। ये मान उस वर्ग ${ }^{\circ}$ अंतराल के मध्यबिंदु द्वारा दर्शाए जाते हैं जिसमें वे स्थित होते हैं। प्रत्यक्ष विधि से गुप्त डेटा से माध्य गणना करते समय प्रत्येक वर्ग अंतराल का मध्यबिंदु उसकी संगत बारंबारता $(f)$ से गुणा किया जाता है; सभी $f x$ के मानों (यहाँ $\mathrm{X}$ मध्यबिंदु हैं) को जोड़कर $\sum f x$ प्राप्त किया जाता है जिसे अंततः प्रेक्षणों की संख्या अर्थात् $\mathrm{N}$ से विभाजित किया जाता है। इसलिए, निम्न सूत्र का उपयोग कर माध्य गणना किया जाता है :
$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$
जहाँ :
$$ \begin{aligned} \overline{\mathrm{X}} & =\text{माध्य} \ f & =\text{बारंबारताएँ} \ x & =\text{वर्ग अंतरालों के मध्यबिंदु} \ N & =\text{प्रेक्षणों की संख्या (इसे } \sum f \text{ भी कहा जा सकता है)} \end{aligned} $$
उदाहरण 2.2 : टेबल 2.2 में दिए गए डेटा का उपयोग कर फैक्ट्री श्रमिकों की औसत मजदूरी दर गणना करें:
टेबल 2.2 : फैक्ट्री श्रमिकों की मजदूरी दर
| मजदूरी दर (रु./दिन) | श्रमिकों की संख्या () |
|---|---|
| वर्ग | $\boldsymbol{f}$ |
| $50-70$ | 10 |
| $70-90$ | 20 |
| $90-110$ | 25 |
| $110-130$ | 35 |
| $130-150$ | 9 |
टेबल 2.3 : माध्य की गणना
| वर्ग | आवृत्ति (f) |
मध्य- बिंदु $(x)$ |
$f x x$ | $d=x-100$ | $f d$ | $U=$ $(x-100)$ 20 |
$f u$ |
|---|---|---|---|---|---|---|---|
| $50-70$ | 10 | 60 | 600 | -40 | -400 | -2 | -20 |
| $70-90$ | 20 | 80 | 1,600 | -20 | -400 | -1 | -20 |
| $\mathbf{9 0 - 1 1 0}$ | $\mathbf{2 5}$ | $\mathbf{1 0 0}$ | 2,500 | $\mathbf{0}$ | 0 | 0 | 0 |
| $110-130$ | 35 | 120 | 4,200 | 20 | 700 | 1 | 35 |
| $130-150$ | 9 | 140 | 1,260 | 40 | 360 | 2 | 18 |
| $\sum f x$ | |||||||
| और | $\sum f=99$ | $\sum f x=$ | $\sum f d=$ | $\sum f u=$ | |||
| $\sum f x$ | 10,160 | 260 | 13 |
जहाँ $\mathrm{N}=\sum f=99$
तालिका 2.3 समूहीकृत आंकड़ों के लिए माध्य की गणना की प्रक्रिया प्रदान करती है। दी गई आवृत्ति बंटन में, निन्यानवे श्रमिकों को मजदूरी दरों के पाँच वर्गों में समूहीकृत किया गया है। इन समूहों के मध्य-बिंदु तीसरे स्तंभ में सूचीबद्ध हैं। माध्य ज्ञात करने के लिए, प्रत्येक मध्य-बिंदु $(\mathrm{X})$ को आवृत्ति $(f)$ से गुणा किया गया है और उनका योग ( $\sum f_{x}$ ) को $N$ से विभाजित किया गया है।
माध्य को दिए गए सूत्र का उपयोग करके इस प्रकार गणना की जा सकती है :
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$
अप्रत्यक्ष विधि
समूहीकृत आंकड़ों के लिए अप्रत्यक्ष विधि के लिए निम्नलिखित सूत्र का उपयोग किया जा सकता है। इस सूत्र के सिद्धांत असमूहीकृत आंकड़ों के लिए दी गई अप्रत्यक्ष विधि के समान हैं। इसे इस प्रकार व्यक्त किया गया है
$$ \bar{x}=A \pm \frac{\sum f d}{N} $$
जहाँ,
= अनुमानित माध्य वर्ग का मध्य-बिन्दु
(तालिका 2.3 में अनुमानित माध्य वर्ग 90 – 110 है जिसका मध्य-बिन्दु 100 है।)
f = बारंबारता
d = अनुमानित माध्य वर्ग (A) से विचलन
N = प्रकरणों का योग या ∑ f
i = अंतराल चौड़ाई (इस स्थिति में यह 20 है)
तालिका 2.3 से प्रत्यक्ष विधि द्वारा माध्य निकालने में शामिल निम्नलिखित चरणों को निकाला जा सकता है :
(i) माध्य को 90 - 110 वर्ग में अनुमानित किया गया है। इसे श्रेणी के मध्य के निकटतम वर्ग से अनुमानित करना पसंद किया जाता है। यह प्रक्रिया परिकलन की मात्रा को न्यूनतम करती है। तालिका 2.3 में, A (अनुमानित माध्य) 100 है, जो वर्ग $90-110$ का मध्य-बिन्दु है।
(ii) पाँचवाँ स्तंभ (u) प्रत्येक वर्ग के मध्य-बिन्दु का अनुमानित माध्य वर्ग $(90-110)$ के मध्य-बिन्दु से विचलन सूचीबद्ध करता है।
(iii) छठा स्तंभ प्रत्येक $f$ को उसके संगत $d$ से गुणा करके $f d$ देने वाले मान दिखाता है। फिर, $f d$ के धनात्मक और ऋणात्मक मानों को अलग-अलग जोड़ा जाता है और उनका निरपेक अंतर निकाला जाता है ($\sum f d$)। ध्यान दें कि $\sum f d$ से जुड़ा चिह्न सूत्र में A के बाद दिए गए $\pm$ में प्रतिस्थापित कर दिया जाता है।
अप्रत्यक्ष विधि द्वारा माध्य इस प्रकार निकाला जाता है :
$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$
नोट : अप्रत्यक्ष माध्य विधि समान और असमान वर्ग अंतराल दोनों के लिए कार्य करती है।
माध्यिका
माध्यिका एक स्थितीय औसत है। इसे “एक ऐसा बिंदु जिसके दोनों ओर समान संख्या में प्रेक्षण हों” के रूप में परिभाषित किया जा सकता है। माध्यिका को प्रतीक $\mathrm{M}$ द्वारा व्यक्त किया जाता है।
अग्रुपित आँकड़ों के लिए माध्यिका की गणना
जब अंक अग्रुपित हों, तो इन्हें आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। माध्यिका व्यवस्थित श्रेणी के मध्यवर्ती प्रेक्षण या मान को खोजकर निकाली जा सकती है। मध्यवर्ती मान आरोही या अवरोही क्रम में व्यवस्थित श्रेणी के किसी भी सिरे से खोजा जा सकता है। माध्यिका की गणना के लिए निम्नलिखित समीकरा का प्रयोग किया जाता है:
$\left(\frac{\mathrm{N}+1}{2}\right)$वाँ पद का मान
उदाहरण 2.3: हिमालय के कुछ भागों में पर्वत शिखरों की माध्यिका ऊँचाई निम्नलिखित आँकड़ों से ज्ञात कीजिए:
$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.
गणना : माध्यिका (M) निम्नलिखित चरणों में गणना की जा सकती है :
(i) दिए गए आँकड़ों को आरोही या अवरोही क्रम में व्यवस्थित कीजिए।
(ii) श्रेणी में मध्यवर्ती मान को खोजने के लिए सूत्र लगाइए। इस प्रकार:
( $\frac{\mathrm{N}+1}{2}$ )वाँ पद का मान
$=\left(\frac{7+1}{2}\right)$वाँ पद
$=\left(\frac{8}{2}\right)$वाँ पद
व्यवस्थित श्रेणी में 4वाँ पद माध्यिका होगा।
आँकड़ों का आरोही क्रम में क्रमबद्धन -
7,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$
अतः,
4वाँ पद
$$ \mathrm{M}=8,172 \mathrm{~m} $$
ग्रुपित आँकड़ों के लिए माध्यिका की गणना
जब अंकों को समूहबद्ध किया जाता है, तो हमें उस बिंदु का मान ज्ञात करना होता है जहाँ एक व्यक्ति या प्रेक्षण समूह में केंद्रतः स्थित है। इसे निम्न सूत्र का प्रयोग करके परिकलित किया जा सकता है :
$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$
जहाँ,
M = समूहबद्ध आँकड़ों के लिए माध्यिका
l = माध्यिका वर्ग की निचली सीमा
i = अंतराल
f = माध्यिका वर्ग की आवृत्ति
N = कुल आवृत्तियों या प्रेक्षणों की संख्या
c = पूर्व-माध्यिका वर्ग की संचयी आवृत्ति।
उदाहरण 2.4 : निम्न बंटन के लिए माध्यिका की गणना करें :
| class | $50-60$ | $60-70$ | $70-80$ | $80-90$ | $90-100$ | $100-110$ |
|---|---|---|---|---|---|---|
| $\boldsymbol{f}$ | 3 | 7 | 11 | 16 | 8 | 5 |
तालिका 2.4 : माध्यिका की गणना
| Class | Frequency (f) |
Cumulative Frequency (iv) |
Calculation of Median Class |
|---|---|---|---|
| $50-60$ $60-70$ $70-80$ $\mathbf{8 0 - 9 0}$ (median group) $90-100$ $100-110$ |
3 7 11 $16 \boldsymbol{f}$ 8 5 5 |
3 10 $21 c$ $\mathbf{3 7}$ 45 50 |
$M=\frac{N}{2}$ $=\frac{50}{4}$ |
| $\sum_{\mathbf{N}=\mathbf{5 0}} f$ or |
माध्यिका को नीचे दिए गए चरणों में परिकलित किया जाता है :
(i) आवृत्ति तालिका को तालिका 2.4 के अनुसार तैयार किया जाता है।
(ii) संचयी बारंबारताएँ (F) प्राप्त की जाती हैं क्रमागत अंतराल समूहों की प्रत्येक सामान्य बारंबारता को जोड़कर, जैसा कि तालिका 2.4 के स्तंभ 3 में दिया गया है।
(iii) माध्यिका संख्या प्राप्त की जाती है $\frac{N}{2}$ अर्थात् इस स्थिति में $\frac{50}{2}=\mathbf{2 5}$, जैसा कि तालिका 2.4 के स्तंभ 4 में दिखाया गया है।
(iv) संचयी बारंबारता बंटन (F) में ऊपर से नीचे की ओर तब तक गिनती करें जब तक $\frac{N}{2}$ से अगली बड़ी मान वाली मान्यता न मिल जाए। इस उदाहरण में, $\frac{N}{2}$ 25 है, जो 40-44 के वर्ग अंतराल में आता है जिसकी संचयी बारंबारता 37 है, इस प्रकार प्री-माध्यिका वर्ग की संचयी बारंबारता 21 है और माध्यिका वर्ग की वास्तविक बारंबारता 16 है।
(v) फिर माध्यिका की गणना चरण 4 में निर्धारित सभी मानों को निम्न समीकरण में प्रतिस्थापित करके की जाती है :
$$ M=l+\frac{i}{f}(m-c) $$
$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$
बहुलक
वह मान जो किसी बंटन में सबसे अधिक बार आता है, बहुलक कहलाता है। इसे $\mathbf{Z}$ या $\mathbf{M}_{\mathbf{0}}$ से प्रदर्शित किया जाता है। बहुलक एक ऐसा माप है जो माध्य और माध्यिका की तुलना में कम प्रयोग में लाया जाता है। किसी दिए गए डेटा सेट में एक से अधिक प्रकार के बहुलक हो सकते हैं।
अग्रुपित डेटा के लिए बहुलक की गणना
जब दिए गए डेटा सेट से बहुलक की गणना की जाती है, तो सभी मापों को पहले आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। यह सबसे अधिक बार आने वाले माप की पहचान करने में सहायक होता है।
उदाहरण 2.5 : भूगोल की निम्नलिखित परीक्षा अंकों का मोड निकालें जो दस विद्यार्थियों के हैं :
$$ 61,10,88,37,61,72,55,61,46,22 $$
गणना : मोड ज्ञात करने के लिए मापों को आरोही क्रम में इस प्रकार व्यवस्थित किया जाता है:
$10,22,37,46,55, \mathbf{6 1}, \mathbf{6 1}, \mathbf{6 1}, 72,88$.
श्रेणी में 61 तीन बार आ रहा है, अतः यह दिए गए डेटासेट का मोड है। चूँकि कोई अन्य संख्या इस प्रकार नहीं आ रही, यह एकल-मोड (unimodal) है।
उदाहरण 2.6 : दस अन्य विद्यार्थियों के नमूने से मोड की गणना करें, जिनके अंक हैं:
$82,11,57,82,08,11,82,95,41,11$.
गणना : दिए गए मापों को आरोही क्रम में इस प्रकार व्यवस्थित करें :
$$ 08,11,11,11,41,57,82,82,82,95 $$
स्पष्ट देखा जा सकता है कि 11 और 82 दोनों ही माप तीन-तीन बार आ रहे हैं। अतः यह डेटासेट द्वि-मोड (bimodal) है। यदि तीन मान समान और उच्चतम बारंबारता रखते हैं, तो श्रेणी त्रि-मोड (trimodal) होती है। इसी प्रकार, अनेक मापों की बार-बार आवृत्ति श्रेणी को बहु-मोड (multimodal) बनाती है। यदि कोई भी मान दोहराया न जाए, तो श्रेणी को मोड-रहित (without mode) कहा जाता है।
माध्य, माध्यिका और मोड की तुलना
केन्द्रीय प्रवृत्ति के तीनों मापों की तुलना सामान्य बंटन वक्र की सहायता से आसानी से की जा सकती है। सामान्य वक्र एक आवृत्ति बंटन को दर्शाता है जिसमें अंकों का आलेख अक्सर घंटी के आकार का वक्र कहलाता है। अनेक मानवीय गुण जैसे बुद्धि, व्यक्तित्व अंक और विद्यार्थियों की उपलब्धियाँ सामान्य बंटन रखती हैं। घंटी के आकार का वक्र इसलिए इस प्रकार दिखता है क्योंकि यह सममित होता है। दूसरे शब्दों में, अधिकांश प्रेक्षण मध्य मान के आसपास होते हैं। जैसे-जैसे कोई चरम मानों की ओर बढ़ता है, प्रेक्षणों की संख्या सममित रूप से घटती जाती है। एक सामान्य वक्र में उच्च या निम्न डेटा परिवर्तनशीलता हो सकती है। सामान्य बंटन वक्र का एक उदाहरण चित्र 2.3 में दिया गया है।
चित्र 2.3 : सामान्य बंटन वक्र
सामान्य बंटन का एक महत्वपूर्ण लक्षण है। माध्य, माध्यिका और बहुलक एक ही अंक होते हैं (चित्र 2.3 में 100 अंक) क्योंकि सामान्य बंटन सममित होता है। सर्वाधिक आवृत्ति वाला अंक बंटन के मध्य में आता है और ठीक आधे अंक मध्य से ऊपर तथा आधे अंक मध्य से नीचे आते हैं। अधिकांश अंक बंटन के मध्य या माध्य के आसपास आते हैं। बहुत उच्च और बहुत निम्न अंक बारंबार नहीं आते और इसलिए इन्हें दुर्लभ माना जाता है।
यदि डेटा किसी प्रकार से विषम या विकृत है, तो माध्य, माध्यिका और बहुलक संपातित नहीं होंगे और विषम डेटा के प्रभाव पर विचार करने की आवश्यकता है (चित्र 2.4 और 2.5)।
चित्र 2.4 : धनात्मक विषमता
चित्र 2.5 : ऋणात्मक विषमता
अभ्यास
1. नीचे दिए गए चार विकल्पों में से सही उत्तर चुनें:
(i) केंद्रीय प्रवृत्ति का वह माप जो चरम मानों से प्रभावित नहीं होता:
(a) माध्य
(b) माध्य और बहुलक
(c) बहुलक
(d) माध्यिका
(ii) केंद्रीय प्रवृत्ति का वह माप जो किसी भी बंटन के उभार के साथ सदैव संपातित होता है:
(a) माध्यिका
(b) माध्यिका और बहुलक
(c) माध्य
(d) बहुलक
2. निम्नलिखित प्रश्नों के उत्तर लगभग 30 शब्दों में दें:
(i) माध्य को परिभाषित कीजिए।
(ii) बहुलक के प्रयोग के क्या लाभ हैं?
3. निम्नलिखित प्रश्नों के उत्तर लगभग 125 शब्दों में दें:
(i) सामान्य बंटन और विषम बंटन में माध्य, माध्यिका और बहुलक के सापेक्ष स्थानों की व्याख्या चित्रों की सहायता से कीजिए।
(ii) माध्य, माध्यिका और बहुलक की प्रयोज्यता पर टिप्पणी कीजिए (संकेत: उनके गुणों और दोषों से)।
गतिविधि
1. भौगोलिक विश्लेषण पर लागू एक काल्पनिक उदाहरण लीजिए और असमूहीकृत आंकड़ों से माध्य निकालने की प्रत्यक्ष और अप्रत्यक्ष विधियों की व्याख्या कीजिए।