अध्याय 02 डेटा प्रोसेसिंग

आपने पिछले अध्याय में सीखा है कि डेटा को संगठित और प्रस्तुत करने से वे समझ में आने योग्य बन जाते हैं। यह डेटा प्रोसेसिंग को सुविधाजनक बनाता है। डेटा का विश्लेषण करने के लिए कई सांख्यिकीय तकनीकों का उपयोग किया जाता है, जैसे:

  1. केंद्रीय प्रवृत्ति के माप
  2. विस्तार के माप
  3. संबंध के माप

जबकि केंद्रीय प्रवृत्ति के माप उस मान को प्रदान करते हैं जो प्रेक्षणों के समूह का एक आदर्श प्रतिनिधि होता है, विस्तार के माप डेटा की आंतरिक विविधताओं को ध्यान में रखते हैं, अक्सर किसी केंद्रीय प्रवृत्ति के माप के आसपास। संबंध के माप, दूसरी ओर, किसी भी दो या अधिक संबंधित घटनाओं—जैसे वर्षा और बाढ़ की घटना या उर्वरक की खपत और फसल की पैदावार—के बीच संबंध की डिग्री प्रदान करते हैं। इस अध्याय में, आप केंद्रीय प्रवृत्ति के माप सीखेंगे।

केंद्रीय प्रवृत्ति के माप

मापने योग्य विशेषताएँ जैसे वर्षा, ऊँचाई, जनसंख्या घनत्व, शैक्षिक उपलब्धि के स्तर या आयु समूह भिन्न होते हैं। यदि हम उन्हें समझना चाहें, तो हम कैसे करेंगे? शायद हमें एक ऐसे एकल मान या संख्या की आवश्यकता होगी जो सभी प्रेक्षणों का सर्वोत्तम प्रतिनिधित्व करे। यह एकल मान आमतौर पर किसी वितरण के केंद्र के निकट होता है, न कि किसी चरम सिरे पर। वितरणों के केंद्र को ज्ञात करने के लिए प्रयुक्त सांख्यिकीय तकनीकों को केंद्रीय प्रवृत्ति के माप कहा जाता है। केंद्रीय प्रवृत्ति को दर्शाने वाली संख्या संपूर्ण डेटा सेट के लिए प्रतिनिधि आकृति होती है क्योंकि यह वह बिंदु है जिसके चारों ओर मदों के समूहित होने की प्रवृत्ति होती है।

केन्द्रीय प्रवृत्ति के माप को सांख्यिकीय औसत भी कहा जाता है। केन्द्रीय प्रवृत्ति के मापों की संख्या कई होती है, जैसे माध्य, माध्यिका और बहुलक।

माध्य

माध्य वह मान है जो सभी मानों को योग करके और उसे प्रेक्षणों की संख्या से विभाजित करके प्राप्त किया जाता है।

माध्यिका

माध्यिका वह रैंक का मान है जो व्यवस्थित श्रेणी को दो समान संख्याओं में विभाजित करता है। यह वास्तविक मान से स्वतंत्र होता है। आरोही या अवरोही क्रम में डेटा को व्यवस्थित करना और फिर मध्य रैंकिंग संख्या के मान को खोजना माध्यिका की गणना में सबसे महत्वपूर्ण है। सम संख्याओं के मामले में दो मध्य रैंकिंग मानों का औसत माध्यिका होगा।

बहुलक

बहुलक किसी विशेष बिंदु या मान पर अधिकतम आवृत्ति या बारंबारता है। आप देख सकते हैं कि इनमें से प्रत्येक माप विभिन्न प्रकार के डेटा सेटों के लिए उपयुक्त एकल प्रतिनिधि संख्या निर्धारित करने की एक भिन्न विधि है।

माध्य

माध्य किसी चर के विभिन्न मानों का सरल अंकगणितीय औसत है। अग्रुपित और समूहीकृत डेटा के लिए माध्य की गणना करने की विधियां आवश्यक रूप से भिन्न होती हैं। माध्य को समूहीकृत और अग्रुपित दोनों डेटा के लिए प्रत्यक्ष या अप्रत्यक्ष विधियों से गणना किया जा सकता है।

अग्रुपित डेटा से माध्य की गणना

प्रत्यक्ष विधि

अवर्गीकृत आँकड़ों से प्रत्यक्ष विधि द्वारा माध्य निकालते समय प्रत्येक प्रेक्षण के मानों को जोड़ा जाता है और कुल प्रेक्षणों के योग को घटनाओं की कुल संख्या से विभाजित किया जाता है। माध्य निम्न सूत्र द्वारा निकाला जाता है:

$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$

जहाँ,

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { माध्य } \ \sum \quad & \text { मापों की श्रृंखला का } \ & \text { योग } \end{aligned} $$

$x \quad=$ मापों की श्रृंखला में एक कच्चा अंक

$\sum \mathrm{x}=$ सभी मापों का योग

$\mathrm{N} \quad$ = मापों की संख्या

उदाहरण 2.1 : मध्य प्रदेश के मालवा पठार के लिए जिलों में वर्षा के आँकड़ों से माध्य वर्षा निकालें जो सारणी 2.1 में दी गई है:

$\hspace{1cm}$ सारणी 2.1 : माध्य वर्षा की गणना

मालवा पठार
के जिले
सामान्य वर्षा
मिमी में
अप्रत्यक्ष विधि
x प्रत्यक्ष विधि $d=x-800^{*}$
इंदौर 979 179
देवास 1083 283
धार 833 33
रतलाम 896 96
उज्जैन 891 91
मंदसौर 825 25
शाजापुर 977 177
$\sum x$ और $\sum d$ 6484 884
$\frac{\sum x}{N}$ और $\frac{\sum d}{N}$ 926.29 126.29
  • जहाँ 800 माना गया माध्य है।
    $\mathrm{d}$ माना गया माध्य से विचलन है।

सारणी 2.1 में दिए गए आँकड़ों का माध्य इस प्रकार निकाला गया है:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$

यह ध्यान दिया जा सकता है कि माध्य की गणना में कच्चे वर्षा आँकड़ों को सीधे जोड़ा गया है और योग को प्रेक्षणों की संख्या अर्थात् जिलों की संख्या से विभाजित किया गया है। इसलिए इसे प्रत्यक्ष विधि कहा जाता है।

अप्रत्यक्ष विधि

बड़ी संख्या में प्रेक्षणों के लिए माध्य की गणना सामान्यतः अप्रत्यक्ष विधि द्वारा की जाती है। यह प्रेक्षणों के मानों को उनसे एक नियत संख्या घटाकर छोटे मानों तक सीमित करने में सहायक होती है। उदाहरण के लिए, जैसा कि तालिका 2.1 में दिखाया गया है, वर्षा मान 800 और $1100 \mathrm{~mm}$ के बीच हैं। हम इन मानों को ‘अनुमानित माध्य’ चुनकर और प्रत्येक मान से चयनित संख्या घटाकर कम कर सकते हैं। वर्तमान उदाहरण में हमने 800 को अनुमानित माध्य लिया है। इस प्रकार की प्रक्रिया को कोडिंग कहा जाता है। माध्य इन घटे हुए मानों (तालिका 2.1 का स्तंभ 3) से निकाला जाता है।

अप्रत्यक्ष विधि से माध्य की गणना निम्नलिखित सूत्र द्वारा की जाती है:

$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$

जहाँ,

$$ \begin{aligned} A & =\text { घटाई गई नियत संख्या } \ \sum d & =\text { कोडित स्कोरों का योग } \ N & =\text { श्रेणी में व्यक्तिगत प्रेक्षणों की संख्या } \end{aligned} $$

तालिका 2.1 में दिखाए गए आँकड़ों का माध्य अप्रत्यक्ष विधि से निम्न प्रकार से निकाला जा सकता है:

$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$

ध्यान दें कि माध्य मान दोनों में से किसी भी विधि से गणना करने पर समान आता है।

गुप्त डेटा से माध्य की गणना

माध्य को गुप्त डेटा के लिए भी प्रत्यक्ष या अप्रत्यक्ष विधि से गणना किया जाता है।

प्रत्यक्ष विधि

जब अंकों को बारंबारता बंटन में गुप्त किया जाता है, तो व्यक्तिगत मान अपनी पहचान खो देते हैं। ये मान उस वर्ग ${ }^{\circ}$ अंतराल के मध्यबिंदु द्वारा दर्शाए जाते हैं जिसमें वे स्थित होते हैं। प्रत्यक्ष विधि से गुप्त डेटा से माध्य गणना करते समय प्रत्येक वर्ग अंतराल का मध्यबिंदु उसकी संगत बारंबारता $(f)$ से गुणा किया जाता है; सभी $f x$ के मानों (यहाँ $\mathrm{X}$ मध्यबिंदु हैं) को जोड़कर $\sum f x$ प्राप्त किया जाता है जिसे अंततः प्रेक्षणों की संख्या अर्थात् $\mathrm{N}$ से विभाजित किया जाता है। इसलिए, निम्न सूत्र का उपयोग कर माध्य गणना किया जाता है :

$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$

जहाँ :

$$ \begin{aligned} \overline{\mathrm{X}} & =\text{माध्य} \ f & =\text{बारंबारताएँ} \ x & =\text{वर्ग अंतरालों के मध्यबिंदु} \ N & =\text{प्रेक्षणों की संख्या (इसे } \sum f \text{ भी कहा जा सकता है)} \end{aligned} $$

उदाहरण 2.2 : टेबल 2.2 में दिए गए डेटा का उपयोग कर फैक्ट्री श्रमिकों की औसत मजदूरी दर गणना करें:

टेबल 2.2 : फैक्ट्री श्रमिकों की मजदूरी दर

मजदूरी दर (रु./दिन) श्रमिकों की संख्या ()
वर्ग $\boldsymbol{f}$
$50-70$ 10
$70-90$ 20
$90-110$ 25
$110-130$ 35
$130-150$ 9

टेबल 2.3 : माध्य की गणना

वर्ग आवृत्ति
(f)
मध्य-
बिंदु
$(x)$
$f x x$ $d=x-100$ $f d$ $U=$
$(x-100)$
20
$f u$
$50-70$ 10 60 600 -40 -400 -2 -20
$70-90$ 20 80 1,600 -20 -400 -1 -20
$\mathbf{9 0 - 1 1 0}$ $\mathbf{2 5}$ $\mathbf{1 0 0}$ 2,500 $\mathbf{0}$ 0 0 0
$110-130$ 35 120 4,200 20 700 1 35
$130-150$ 9 140 1,260 40 360 2 18
$\sum f x$
और $\sum f=99$ $\sum f x=$ $\sum f d=$ $\sum f u=$
$\sum f x$ 10,160 260 13

जहाँ $\mathrm{N}=\sum f=99$

तालिका 2.3 समूहीकृत आंकड़ों के लिए माध्य की गणना की प्रक्रिया प्रदान करती है। दी गई आवृत्ति बंटन में, निन्यानवे श्रमिकों को मजदूरी दरों के पाँच वर्गों में समूहीकृत किया गया है। इन समूहों के मध्य-बिंदु तीसरे स्तंभ में सूचीबद्ध हैं। माध्य ज्ञात करने के लिए, प्रत्येक मध्य-बिंदु $(\mathrm{X})$ को आवृत्ति $(f)$ से गुणा किया गया है और उनका योग ( $\sum f_{x}$ ) को $N$ से विभाजित किया गया है।

माध्य को दिए गए सूत्र का उपयोग करके इस प्रकार गणना की जा सकती है :

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$

अप्रत्यक्ष विधि

समूहीकृत आंकड़ों के लिए अप्रत्यक्ष विधि के लिए निम्नलिखित सूत्र का उपयोग किया जा सकता है। इस सूत्र के सिद्धांत असमूहीकृत आंकड़ों के लिए दी गई अप्रत्यक्ष विधि के समान हैं। इसे इस प्रकार व्यक्त किया गया है

$$ \bar{x}=A \pm \frac{\sum f d}{N} $$

जहाँ,

= अनुमानित माध्य वर्ग का मध्य-बिन्दु
(तालिका 2.3 में अनुमानित माध्य वर्ग 90 – 110 है जिसका मध्य-बिन्दु 100 है।)
f = बारंबारता
d = अनुमानित माध्य वर्ग (A) से विचलन
N = प्रकरणों का योग या ∑ f
i = अंतराल चौड़ाई (इस स्थिति में यह 20 है)

तालिका 2.3 से प्रत्यक्ष विधि द्वारा माध्य निकालने में शामिल निम्नलिखित चरणों को निकाला जा सकता है :

(i) माध्य को 90 - 110 वर्ग में अनुमानित किया गया है। इसे श्रेणी के मध्य के निकटतम वर्ग से अनुमानित करना पसंद किया जाता है। यह प्रक्रिया परिकलन की मात्रा को न्यूनतम करती है। तालिका 2.3 में, A (अनुमानित माध्य) 100 है, जो वर्ग $90-110$ का मध्य-बिन्दु है।

(ii) पाँचवाँ स्तंभ (u) प्रत्येक वर्ग के मध्य-बिन्दु का अनुमानित माध्य वर्ग $(90-110)$ के मध्य-बिन्दु से विचलन सूचीबद्ध करता है।

(iii) छठा स्तंभ प्रत्येक $f$ को उसके संगत $d$ से गुणा करके $f d$ देने वाले मान दिखाता है। फिर, $f d$ के धनात्मक और ऋणात्मक मानों को अलग-अलग जोड़ा जाता है और उनका निरपेक अंतर निकाला जाता है ($\sum f d$)। ध्यान दें कि $\sum f d$ से जुड़ा चिह्न सूत्र में A के बाद दिए गए $\pm$ में प्रतिस्थापित कर दिया जाता है।

अप्रत्यक्ष विधि द्वारा माध्य इस प्रकार निकाला जाता है :

$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$

नोट : अप्रत्यक्ष माध्य विधि समान और असमान वर्ग अंतराल दोनों के लिए कार्य करती है।

माध्यिका

माध्यिका एक स्थितीय औसत है। इसे “एक ऐसा बिंदु जिसके दोनों ओर समान संख्या में प्रेक्षण हों” के रूप में परिभाषित किया जा सकता है। माध्यिका को प्रतीक $\mathrm{M}$ द्वारा व्यक्त किया जाता है।

अग्रुपित आँकड़ों के लिए माध्यिका की गणना

जब अंक अग्रुपित हों, तो इन्हें आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। माध्यिका व्यवस्थित श्रेणी के मध्यवर्ती प्रेक्षण या मान को खोजकर निकाली जा सकती है। मध्यवर्ती मान आरोही या अवरोही क्रम में व्यवस्थित श्रेणी के किसी भी सिरे से खोजा जा सकता है। माध्यिका की गणना के लिए निम्नलिखित समीकरा का प्रयोग किया जाता है:

$\left(\frac{\mathrm{N}+1}{2}\right)$वाँ पद का मान

उदाहरण 2.3: हिमालय के कुछ भागों में पर्वत शिखरों की माध्यिका ऊँचाई निम्नलिखित आँकड़ों से ज्ञात कीजिए:

$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.

गणना : माध्यिका (M) निम्नलिखित चरणों में गणना की जा सकती है :

(i) दिए गए आँकड़ों को आरोही या अवरोही क्रम में व्यवस्थित कीजिए।

(ii) श्रेणी में मध्यवर्ती मान को खोजने के लिए सूत्र लगाइए। इस प्रकार:

( $\frac{\mathrm{N}+1}{2}$ )वाँ पद का मान

$=\left(\frac{7+1}{2}\right)$वाँ पद

$=\left(\frac{8}{2}\right)$वाँ पद

व्यवस्थित श्रेणी में 4वाँ पद माध्यिका होगा।

आँकड़ों का आरोही क्रम में क्रमबद्धन -

7,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$

अतः,

4वाँ पद

$$ \mathrm{M}=8,172 \mathrm{~m} $$

ग्रुपित आँकड़ों के लिए माध्यिका की गणना

जब अंकों को समूहबद्ध किया जाता है, तो हमें उस बिंदु का मान ज्ञात करना होता है जहाँ एक व्यक्ति या प्रेक्षण समूह में केंद्रतः स्थित है। इसे निम्न सूत्र का प्रयोग करके परिकलित किया जा सकता है :

$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$

जहाँ,

M = समूहबद्ध आँकड़ों के लिए माध्यिका
l = माध्यिका वर्ग की निचली सीमा
i = अंतराल
f = माध्यिका वर्ग की आवृत्ति
N = कुल आवृत्तियों या प्रेक्षणों की संख्या
c = पूर्व-माध्यिका वर्ग की संचयी आवृत्ति।

उदाहरण 2.4 : निम्न बंटन के लिए माध्यिका की गणना करें :

class $50-60$ $60-70$ $70-80$ $80-90$ $90-100$ $100-110$
$\boldsymbol{f}$ 3 7 11 16 8 5

तालिका 2.4 : माध्यिका की गणना

Class Frequency
(f)
Cumulative
Frequency (iv)
Calculation
of Median Class
$50-60$
$60-70$
$70-80$
$\mathbf{8 0 - 9 0}$
(median group)
$90-100$
$100-110$
3
7
11
$16 \boldsymbol{f}$

8
5
5
3
10
$21 c$
$\mathbf{3 7}$
45
50
$M=\frac{N}{2}$
$=\frac{50}{4}$
$\sum_{\mathbf{N}=\mathbf{5 0}} f$ or

माध्यिका को नीचे दिए गए चरणों में परिकलित किया जाता है :

(i) आवृत्ति तालिका को तालिका 2.4 के अनुसार तैयार किया जाता है।

(ii) संचयी बारंबारताएँ (F) प्राप्त की जाती हैं क्रमागत अंतराल समूहों की प्रत्येक सामान्य बारंबारता को जोड़कर, जैसा कि तालिका 2.4 के स्तंभ 3 में दिया गया है।

(iii) माध्यिका संख्या प्राप्त की जाती है $\frac{N}{2}$ अर्थात् इस स्थिति में $\frac{50}{2}=\mathbf{2 5}$, जैसा कि तालिका 2.4 के स्तंभ 4 में दिखाया गया है।

(iv) संचयी बारंबारता बंटन (F) में ऊपर से नीचे की ओर तब तक गिनती करें जब तक $\frac{N}{2}$ से अगली बड़ी मान वाली मान्यता न मिल जाए। इस उदाहरण में, $\frac{N}{2}$ 25 है, जो 40-44 के वर्ग अंतराल में आता है जिसकी संचयी बारंबारता 37 है, इस प्रकार प्री-माध्यिका वर्ग की संचयी बारंबारता 21 है और माध्यिका वर्ग की वास्तविक बारंबारता 16 है।

(v) फिर माध्यिका की गणना चरण 4 में निर्धारित सभी मानों को निम्न समीकरण में प्रतिस्थापित करके की जाती है :

$$ M=l+\frac{i}{f}(m-c) $$

$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$

बहुलक

वह मान जो किसी बंटन में सबसे अधिक बार आता है, बहुलक कहलाता है। इसे $\mathbf{Z}$ या $\mathbf{M}_{\mathbf{0}}$ से प्रदर्शित किया जाता है। बहुलक एक ऐसा माप है जो माध्य और माध्यिका की तुलना में कम प्रयोग में लाया जाता है। किसी दिए गए डेटा सेट में एक से अधिक प्रकार के बहुलक हो सकते हैं।

अग्रुपित डेटा के लिए बहुलक की गणना

जब दिए गए डेटा सेट से बहुलक की गणना की जाती है, तो सभी मापों को पहले आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। यह सबसे अधिक बार आने वाले माप की पहचान करने में सहायक होता है।

उदाहरण 2.5 : भूगोल की निम्नलिखित परीक्षा अंकों का मोड निकालें जो दस विद्यार्थियों के हैं :

$$ 61,10,88,37,61,72,55,61,46,22 $$

गणना : मोड ज्ञात करने के लिए मापों को आरोही क्रम में इस प्रकार व्यवस्थित किया जाता है:

$10,22,37,46,55, \mathbf{6 1}, \mathbf{6 1}, \mathbf{6 1}, 72,88$.

श्रेणी में 61 तीन बार आ रहा है, अतः यह दिए गए डेटासेट का मोड है। चूँकि कोई अन्य संख्या इस प्रकार नहीं आ रही, यह एकल-मोड (unimodal) है।

उदाहरण 2.6 : दस अन्य विद्यार्थियों के नमूने से मोड की गणना करें, जिनके अंक हैं:

$82,11,57,82,08,11,82,95,41,11$.

गणना : दिए गए मापों को आरोही क्रम में इस प्रकार व्यवस्थित करें :

$$ 08,11,11,11,41,57,82,82,82,95 $$

स्पष्ट देखा जा सकता है कि 11 और 82 दोनों ही माप तीन-तीन बार आ रहे हैं। अतः यह डेटासेट द्वि-मोड (bimodal) है। यदि तीन मान समान और उच्चतम बारंबारता रखते हैं, तो श्रेणी त्रि-मोड (trimodal) होती है। इसी प्रकार, अनेक मापों की बार-बार आवृत्ति श्रेणी को बहु-मोड (multimodal) बनाती है। यदि कोई भी मान दोहराया न जाए, तो श्रेणी को मोड-रहित (without mode) कहा जाता है।

माध्य, माध्यिका और मोड की तुलना

केन्द्रीय प्रवृत्ति के तीनों मापों की तुलना सामान्य बंटन वक्र की सहायता से आसानी से की जा सकती है। सामान्य वक्र एक आवृत्ति बंटन को दर्शाता है जिसमें अंकों का आलेख अक्सर घंटी के आकार का वक्र कहलाता है। अनेक मानवीय गुण जैसे बुद्धि, व्यक्तित्व अंक और विद्यार्थियों की उपलब्धियाँ सामान्य बंटन रखती हैं। घंटी के आकार का वक्र इसलिए इस प्रकार दिखता है क्योंकि यह सममित होता है। दूसरे शब्दों में, अधिकांश प्रेक्षण मध्य मान के आसपास होते हैं। जैसे-जैसे कोई चरम मानों की ओर बढ़ता है, प्रेक्षणों की संख्या सममित रूप से घटती जाती है। एक सामान्य वक्र में उच्च या निम्न डेटा परिवर्तनशीलता हो सकती है। सामान्य बंटन वक्र का एक उदाहरण चित्र 2.3 में दिया गया है।

चित्र 2.3 : सामान्य बंटन वक्र

सामान्य बंटन का एक महत्वपूर्ण लक्षण है। माध्य, माध्यिका और बहुलक एक ही अंक होते हैं (चित्र 2.3 में 100 अंक) क्योंकि सामान्य बंटन सममित होता है। सर्वाधिक आवृत्ति वाला अंक बंटन के मध्य में आता है और ठीक आधे अंक मध्य से ऊपर तथा आधे अंक मध्य से नीचे आते हैं। अधिकांश अंक बंटन के मध्य या माध्य के आसपास आते हैं। बहुत उच्च और बहुत निम्न अंक बारंबार नहीं आते और इसलिए इन्हें दुर्लभ माना जाता है।

यदि डेटा किसी प्रकार से विषम या विकृत है, तो माध्य, माध्यिका और बहुलक संपातित नहीं होंगे और विषम डेटा के प्रभाव पर विचार करने की आवश्यकता है (चित्र 2.4 और 2.5)।

चित्र 2.4 : धनात्मक विषमता

चित्र 2.5 : ऋणात्मक विषमता

अभ्यास

1. नीचे दिए गए चार विकल्पों में से सही उत्तर चुनें:

(i) केंद्रीय प्रवृत्ति का वह माप जो चरम मानों से प्रभावित नहीं होता:

(a) माध्य
(b) माध्य और बहुलक
(c) बहुलक
(d) माध्यिका

(ii) केंद्रीय प्रवृत्ति का वह माप जो किसी भी बंटन के उभार के साथ सदैव संपातित होता है:

(a) माध्यिका
(b) माध्यिका और बहुलक
(c) माध्य
(d) बहुलक

2. निम्नलिखित प्रश्नों के उत्तर लगभग 30 शब्दों में दें:

(i) माध्य को परिभाषित कीजिए।
(ii) बहुलक के प्रयोग के क्या लाभ हैं?

3. निम्नलिखित प्रश्नों के उत्तर लगभग 125 शब्दों में दें:

(i) सामान्य बंटन और विषम बंटन में माध्य, माध्यिका और बहुलक के सापेक्ष स्थानों की व्याख्या चित्रों की सहायता से कीजिए।
(ii) माध्य, माध्यिका और बहुलक की प्रयोज्यता पर टिप्पणी कीजिए (संकेत: उनके गुणों और दोषों से)।

गतिविधि

1. भौगोलिक विश्लेषण पर लागू एक काल्पनिक उदाहरण लीजिए और असमूहीकृत आंकड़ों से माध्य निकालने की प्रत्यक्ष और अप्रत्यक्ष विधियों की व्याख्या कीजिए।