अध्याय 04 आंकड़ों की प्रस्तुति

1. परिचय

आपने पिछले अध्यायों में सीखा है कि आंकड़ों को कैसे एकत्रित और संगठित किया जाता है। चूंकि आंकड़े आमतौर पर बड़ी मात्रा में होते हैं, उन्हें संक्षिप्त और प्रस्तुत करने योग्य रूप में रखना आवश्यक होता है। यह अध्याय आंकड़ों की सटीक प्रस्तुति से संबंधित है ताकि एकत्रित भारी मात्रा के आंकड़ों को तुरंत उपयोग योग्य बनाया जा सके और उन्हें आसानी से समझा जा सके। आमतौर पर आंकड़ों की प्रस्तुति के तीन रूप होते हैं:

  • पाठात्मक या वर्णनात्मक प्रस्तुति
  • सारणीबद्ध प्रस्तुति
  • आरेखीय प्रस्तुति।

2. आंकड़ों की पाठात्मक प्रस्तुति

पाठात्मक प्रस्तुति में, आंकड़ों को पाठ के भीतर वर्णित किया जाता है। जब आंकड़ों की मात्रा अधिक नहीं होती है तो यह प्रस्तुति रूप अधिक उपयुक्त होता है। निम्नलिखित उदाहरणों को देखें:

उदाहरण 1

08 सितंबर 2005 को पेट्रोल और डीज़ल की कीमतों में वृद्धि के विरोध में दिए गए बंद आह्वान के दौरान, बिहार के एक कस्बे में 5 पेट्रोल पंप खुले पाए गए और 17 बंद थे जबकि 2 स्कूल बंद थे और शेष 9 स्कूल खुले पाए गए।

उदाहरण 2

भारत की जनगणना 2001 ने रिपोर्ट किया कि भारतीय जनसंख्या बढ़कर 102 करोड़ हो गई थी जिसमें केवल 49 करोड़ महिलाएं थीं जबकि 53 करोड़ पुरुष थे। चौहत्तर करोड़ लोग ग्रामीण भारत में रहते थे और केवल 28 करोड़ लोग शहरों या कस्बों में रहते थे। जबकि पूरे देश में 62 करोड़ गैर-कार्यरत जनसंख्या थी जबकि 40 करोड़ कार्यरत जनसंख्या थी। शहरी जनसंख्या में गैर-कार्यरत लोगों की हिस्सेदारी (19 करोड़) कार्यरत लोगों (9 करोड़) की तुलना में अधिक थी जबकि ग्रामीण जनसंख्या में 74 करोड़ की कुल जनसंख्या में से 31 करोड़ कार्यरत थे…

दोनों ही स्थितियों में आँकड़ों को केवल पाठ्य रूप में प्रस्तुत किया गया है। इस प्रस्तुति विधि का एक गंभीर दोष यह है कि समझने के लिए व्यक्ति को संपूर्ण पाठ को पढ़ना पड़ता है। परंतु यह भी सत्य है कि यह विधि प्रस्तुति के कुछ बिंदुओं पर बल देने में सहायक होती है।

3. आँकड़ों की सारणीबद्ध प्रस्तुति

सारणीबद्ध प्रस्तुति में आँकड़े पंक्तियों (क्षैतिज रूप से पढ़ी जाती हैं) और स्तंभों (ऊध्र्वाधर रूप से पढ़े जाते हैं) में प्रस्तुत किए जाते हैं। उदाहरण के लिए सारणी 4.1 देखें जो साक्षरता दरों की जानकारी सारणीबद्ध करती है। इसमें तीन पंक्तियाँ (पुरुष, महिला और कुल) और तीन स्तंभ (शहरी, ग्रामीण और कुल) हैं। इसे $3 \times 3$ सारणी कहा जाता है जो 9 कोष्ठकों में 9 जानकारियाँ देती है, जिन्हें सारणी की “कोशिकाएँ” कहा जाता है। प्रत्येक कोशिका ऐसी जानकारी देती है जो लिंग के एक गुण (“पुरुष”, “महिला” या कुल) को एक संख्या (ग्रामीण लोगों, शहरी लोगों और कुल की साक्षरता प्रतिशतता) से संबंधित करती है। सारणीबद्ध करने का सबसे महत्वपूर्ण लाभ यह है कि यह आँकड़ों को आगांव सांख्यिकीय उपचार और निर्णय लेने के लिए संगठित करता है। सारणी में प्रयुक्त वर्गीकरण चार प्रकार के होते हैं:

  • गुणात्मक
  • मात्रात्मक
  • कालिक और
  • स्थानिक

गुणात्मक वर्गीकरण

जब वर्गीकरण सामाजिक स्थिति, शारीरिक स्थिति, राष्ट्रीयता आदि जैसे गुणों के अनुसार किया जाता है, तो इसे गुणात्मक वर्गीकरण कहा जाता है। उदाहरण के लिए, तालिका 4.1 में वर्गीकरण के लिए गुण लिंग और स्थान हैं जो प्रकृति में गुणात्मक हैं।

तालिका 4.1 लिंग और स्थान के अनुसार भारत में साक्षरता (प्रतिशत)

स्थान कुल
लिंग ग्रामीण शहरी
पुरुष 79 90 82
महिला 59 80 65
कुल 68 84 74

स्रोत: भारत की जनगणना 2011। (साक्षरता दर 7 वर्ष और उससे अधिक आयु की आबादी से संबंधित है)

मात्रात्मक वर्गीकरण

मात्रात्मक वर्गीकरण में, आंकड़ों को उन विशेषताओं के आधार पर वर्गीकृत किया जाता है जो प्रकृति में मात्रात्मक होती हैं। दूसरे शब्दों में, इन विशेषताओं को मात्रात्मक रूप से मापा जा सकता है। उदाहरण के लिए, आयु, ऊंचाई, उत्पादन, आय आदि मात्रात्मक विशेषताएं हैं। वर्गों का निर्माण उन सीमाओं को निर्धारित करके किया जाता है जिन्हें वर्ग सीमाएं कहा जाता है, जिनके अंतर्गत विशेषता के मान आते हैं। मात्रात्मक वर्गीकरण का एक उदाहरण तालिका 4.2 में दिया गया है। तालिका में लुप्त आंकड़ों की गणना कीजिए।

तालिका 4.2 बिहार में एक चुनाव अध्ययन में उनकी आयु के अनुसार 542 उत्तरदाताओं का वितरण

आयु समूह (वर्ष) उत्तरदाताओं की संख्या प्रतिशत
20-30 3 0.55
30-40 61 11.25
40-50 132 24.35
50-60 153 28.24
60-70 $?$ $?$
70-80 51 9.41
80-90 2 0.37
सभी ? 100.00

स्रोत: विधानसभा चुनाव पटना मध्य निर्वाचन क्षेत्र 2005, ए.एन. सिन्हा इंस्टीट्यूट ऑफ सोशल स्टडीज, पटना।

यहाँ वर्गीकृत करने वाला लक्षण आयु वर्षों में है और यह मात्रात्मक है।

गतिविधियाँ

  • चर्चा करें कि तालिका 4.1 में कुल मान कैसे प्राप्त किए गए हैं
  • एक तालिका बनाएँ जो आपकी कक्षा के छात्रों की स्टार न्यूज़, ज़ी न्यूज़, बीबीसी वर्ल्ड, सीएनएन, आज तक और डीडी न्यूज़ के प्रति पसंदीदा रुचि के आंकड़े प्रस्तुत करे।
  • एक तालिका तैयार करें जिसमें शामिल हों

(i) ऊँचाइयाँ (सेमी में) और

(ii) वज़न (किग्रा में) आपकी कक्षा के छात्रों की।

अस्थायी वर्गीकरण

इस वर्गीकरण में समय वर्गीकृत करने वाला चर बन जाता है और आंकड़ों को समय के अनुसार श्रेणीबद्ध किया जाता है। समय घंटों, दिनों, सप्ताहों, महीनों, वर्षों आदि में हो सकता है। उदाहरण के लिए, तालिका 4.3 देखें।

तालिका 4.3 1995 से 2000 तक एक चाय की दुकान की वार्षिक बिक्री

वर्ष बिक्री (रुपये लाख में)
1995 79.2
1996 81.3
1997 8.4
1998 80.5
1999 100.2
2000 91.2

आंकड़ों का स्रोत: अप्रकाशित आंकड़े।

इस तालिका में वर्गीकृत करने वाला लक्षण एक वर्ष में बिक्री है और यह समय की स्केल पर मान लेता है।

गतिविधि

  • अपने स्कूल के कार्यालय जाएँ और पिछले दस वर्षों में प्रत्येक कक्षा में अध्ययन करने वाले छात्रों की संख्या के आंकड़े एकत्र करें और उन्हें एक तालिका में प्रस्तुत करें।

स्थानिक वर्गीकरण

जब वर्गीकरण स्थान के आधार पर किया जाता है, तो इसे स्थानिक वर्गीकरण कहा जाता है। स्थान गाँव/नगर, प्रखंड, जिला, राज्य, देश आदि हो सकता है।

तालिका 4.4 स्थानिक वर्गीकरण का एक उदाहरण है।

तालिका 4.4 वर्ष 2013-14 में भारत से शेष विश्व को निर्यात की कुल निर्यात में हिस्सेदारी (प्रतिशत में)

गंतव्य निर्यात हिस्सेदारी
यूएसए 12.5
जर्मनी 2.4
अन्य यूरोपीय संघ 10.9
यूके 3.1
जापान 2.2
रूस 0.7
चीन 4.7
पश्चिम एशिया - खाड़ी सहयोग परिषद 15.3
अन्य एशिया 29.4
अन्य 18.8
सभी 100.0

(कुल निर्यात: अमेरिकी $\$$ 314.40 अरब)

गतिविधि

  • अपनी कक्षा के विद्यार्थियों के अनुसार उनके मूल राज्य/आवासीय क्षेत्र के आधार पर एक तालिका बनाएँ।

4. आंकड़ों का सारणीयकरण और तालिका के भाग

एक तालिका बनाने के लिए यह जानना महत्वपूर्ण है कि एक अच्छी सांख्यिकीय तालिका के कौन-कौन से भाग होते हैं। जब इन भागों को क्रमबद्ध रूप से एक साथ रखा जाता है तो वे एक तालिका बनाते हैं। तालिका की अवधारणा का सबसे सरल तरीका यह है कि आंकड़ों को कुछ व्याख्यात्मक नोटों के साथ पंक्तियों और स्तंभों में प्रस्तुत किया जाए। सारणीयकरण एकल-दिशा, द्वि-दिशा या त्रि-दिशा वर्गीकरण के अनुसार किया जा सकता है, यह इस बात पर निर्भर करता है कि कितनी विशेषताएँ शामिल हैं। एक अच्छी तालिका में अनिवार्य रूप से निम्नलिखित होना चाहिए:

(i) तालिका संख्या

सारणी संख्या सारणी की पहचान के लिए निर्धारित की जाती है। यदि एक से अधिक सारणियाँ प्रस्तुत की जाती हैं, तो सारणी संख्या ही एक सारणी को दूसरी से अलग करती है। यह सारणी के शीर्षक के ऊपर या शुरुआत में दी जाती है। आमतौर पर, यदि किताब में कई सारणियाँ हों, तो सारणी संख्याएँ आरोही क्रम में पूर्ण संख्याएँ होती हैं। उपस्क्रिप्ट संख्याएँ, जैसे $1.2,3.1$, आदि, भी सारणी की स्थिति के अनुसार पहचान के लिए प्रयुक्त होती हैं। उदाहरण के लिए, सारणी 4.5 को चौथे अध्याय की पाँचवीं सारणी के रूप में पढ़ा जाना चाहिए, और इसी तरह (सारणी 4.5 देखें)।

(ii) शीर्षक

सारणी का शीर्षक सारणी की सामग्री के बारे में बताता है। इसे स्पष्ट, संक्षिप्त और सावधानीपूर्वक शब्दों में लिखा जाना चाहिए ताकि सारणी से की गई व्याख्याएँ स्पष्ट हों और अस्पष्टता से मुक्त हों। यह सारणी संख्या के बाद या उसके ठीक नीचे सारणी के शीर्ष पर स्थित होता है (सारणी 4.5 देखें)।

(iii) कैप्शन या स्तंभ शीर्षक

सारणी में प्रत्येक स्तंभ के शीर्ष पर स्तंभ का नाम दिया जाता है ताकि स्तंभ के आँकड़ों की व्याख्या हो सके। इसे कैप्शन या स्तंभ शीर्षक कहा जाता है (सारणी 4.5 देखें)।

(iv) स्टब या पंक्ति शीर्षक

कैप्शन या स्तंभ शीर्षक की तरह, सारणी की प्रत्येक पंक्ति को भी एक शीर्षक देना होता है। पंक्तियों के नामों को स्टब या स्टब आइटम भी कहा जाता है, और पूरी बाईं ओर की स्तंभ को स्टब स्तंभ कहा जाता है। पंक्ति शीर्षकों का संक्षिप्त विवरण सारणी के बाईं ओर ऊपर भी दिया जा सकता है (सारणी $4.5$ देखें)।

(v) सारणी का मुख्य भाग

सारणी का मुख्य भाग उसका शरीर होता है और इसमें वास्तविक आँकड़े होते हैं। सारणी में किसी एक आँकड़े/डेटा का स्थान निश्चित होता है और यह सारणी की पंक्ति तथा स्तंभ द्वारा निर्धारित होता है। उदाहरण के लिए, दूसरी पंक्ति तथा चौथे स्तंभ में दिया गया आँकड़ा यह दर्शाता है कि सन् 2001 में ग्रामीण भारत में 25 करोड़ महिलाएँ गैर-कार्यरत थीं (देखें सारणी 4.5)।

(vi) मापन की इकाई

सारणी में दिखाए गए आँकड़ों (वास्तविक डेटा) की मापन की इकाई हमेशा शीर्षक के साथ दी जानी चाहिए। यदि सारणी की पंक्तियों या स्तंभों के लिए भिन्न इकाइयाँ हैं, तो ये इकाइयाँ ‘स्टब्स’ या ‘कैप्शन’ के साथ अवश्य दी जानी चाहिए। यदि आँकड़े बड़े हैं, तो उन्हें गोल किया जाना चाहिए और गोल करने की विधि को दर्शाया जाना चाहिए (देखें सारणी 4.5)।

(नोट : सारणी 4.5 उसी डेटा को सारणीबद्ध रूप में प्रस्तुत करती है जो पहले डेटा के पाठात्मक प्रस्तुति में केस 2 के माध्यम से दिया गया है)

(vii) स्रोत

यह एक संक्षिप्त कथन या वाक्यांश होता है जो सारणी में प्रस्तुत डेटा के स्रोत को दर्शाता है। यदि एक से अधिक स्रोत हैं, तो सभी स्रोतों को स्रोत में लिखा जाना चाहिए। स्रोत आमतौर पर सारणी के नीचे लिखा जाता है (देखें सारणी 4.5)।

(viii) नोट

नोट सारणी का अंतिम भाग होता है। यह सारणी के डेटा सामग्री की उस विशेषता की व्याख्या करता है जो स्वतः स्पष्ट नहीं होती और पहले कहीं भी व्याख्यायित नहीं की गई है।

गतिविधियाँ

  • एक सारणी बनाने के लिए न्यूनतम कितनी पंक्तियाँ और स्तम्भों की आवश्यकता होती है?
  • क्या सारणी के स्तम्भ/पंक्ति शीर्षलेख मात्रात्मक हो सकते हैं?
  • क्या आप सारणी 4.2 और 4.3 को आँकड़ों को उपयुक्त रूप से पूर्णांकित करके प्रस्तुत कर सकते हैं?
  • पृष्ठ 41 पर दिए गए केस 2 के पहले दो वाक्यों को सारणी के रूप में प्रस्तुत कीजिए। इसके लिए कुछ विवरण इस अध्याय के अन्य भागों में मिलेंगे।

5. आँकड़ों की आरेखीय प्रस्तुति

यह आँकड़ों को प्रस्तुत करने की तीसरी विधि है। यह विधि तालिकीय या पाठात्मक प्रस्तुति की तुलना में आँकड़ों द्वारा समझाए जाने वाले वास्तविक परिदृश्य को सबसे तेज़ी से समझने में सहायक होती है। आँकड़ों की आरेखीय प्रस्तुति संख्याओं में निहित अत्यधिक अमूर्त विचारों को अधिक ठोस और सरलतः समझ में आने वाले रूप में अत्यंत प्रभावी ढंग से अनुवादित करती है।

आरेख कम सटीक हो सकते हैं, परंतु आँकड़ों को प्रस्तुत करने में सारणियों की तुलना में अधिक प्रभावी होते हैं।

सामान्य प्रयोग में आने वाले विभिन्न प्रकार के आरेख होते हैं। उनमें से महत्त्वपूर्ण निम्नलिखित हैं:

(i) ज्यामितीय आरेख

(ii) बारंबारता आरेख

(iii) अंकगणितीय रेखा ग्राफ

ज्यामितीय आरेख

बार आरेख और पाई आरेख ज्यामितीय आरेख की श्रेणी में आते हैं। बार आरेख तीन प्रकार के होते हैं - सरल, बहु और संघटक बार आरेख।

बार आरेख

सरल बार आरेख

दंड आरेख में प्रत्येक वर्ग या श्रेणी के लिए समान अंतराल और समान चौड़ाई के आयताकार दंडों का एक समूह होता है। दंड की ऊँचाई या लंबाई आँकड़े की मात्रा को दर्शाती है। दंड का निचला सिरा आधार रेखा को स्पर्श करता है ताकि दंड की ऊँचाई शून्य इकाई से प्रारंभ हो। दंड आरेख के दंडों की सापेक्ष ऊँचाई से दृश्य तुलना की जा सकती है और इससे आँकड़े शीघ्र समझ में आते हैं। इसके लिए आँकड़े बारंबारता या अ-बारंबारता प्रकार के हो सकते हैं। अ-बारंबारता प्रकार के आँकड़ों में किसी विशेष लक्षण, जैसे उत्पादन, उपज, जनसंख्या आदि को विभिन्न समय बिंदुओं पर या विभिन्न राज्यों के लिए दर्ज किया जाता है और लक्षण के मानों के अनुसार संबंधित ऊँचाई के दंड बनाकर आरेख तैयार किया जाता है। लक्षणों के मान (मापे गए या गिने गए) प्रत्येक मान की पहचान बनाए रखते हैं। चित्र 4.1 एक दंड आरेख का उदाहरण है।

गतिविधि

  • वर्तमान वर्ष में अपने विद्यालय में प्रत्येक कक्षा में अध्ययनरत विद्यार्थियों की संख्या एकत्र करें। उसी सारणी के लिए एक दंड आरेख बनाएँ।

विभिन्न प्रकार के आँकड़ों के लिए विभिन्न प्रकार के आलेखीय प्रस्तुति-प्रारूप आवश्यक हो सकते हैं। बार आरेख बारंबारता-प्रकार और गैर-बारंबारता-प्रकार दोनों चरों तथा गुणधर्मों के लिए उपयुक्त होते हैं। पारिवारिक आकार, पासे के बिंदु, परीक्षा में प्राप्त ग्रेड आदि जैसे विच्छिन्न चर और लिंग, धर्म, जाति, देश आदि जैसे गुणधर्म बार आरेखों द्वारा प्रस्तुत किए जा सकते हैं। बार आरेख आय-व्यय प्रोफ़ाइल, वर्षों के दौरान निर्यात/आयात आदि गैर-बारंबारता आँकड़ों के लिए अधिक सुविधाजनक होते हैं।

एक श्रेणी जिसकी बार अधिक लंबी हो (केरल की साक्षरता) दूसरी श्रेणी (पश्चिम बंगाल की साक्षरता) की तुलना में, उसमें मापे गए (या गिने गए) लक्षण अधिक होते हैं। बारों (जिन्हें स्तंभ भी कहा जाता है) का प्रयोग सामान्यतः समय श्रृंखला आँकड़ों में किया जाता है (1980 से 2000 के बीच उत्पादित खाद्यान्न, दशकीय कार्य-भागीदारी दर में परिवर्तन, वर्षों के दौरान पंजीकृत बेरोज़गारी, साक्षरता दर आदि) (चित्र 4.2)।

TABLE 4.6 भारत के प्रमुख राज्यों की साक्षरता दरें

2001 2011
प्रमुख भारतीय राज्य पुरुष महिला पुरुष महिला
आंध्र प्रदेश (AP) 70.3 50.4 75.6 59.7
असम (AS) 71.3 54.6 78.8 67.3
बिहार (BR) 59.7 33.1 73.4 53.3
झारखंड (JH) 67.3 38.9 78.4 56.2
गुजरात (GJ) 79.7 57.8 87.2 70.7
हरियाणा (HR) 78.5 55.7 85.3 66.8
कर्नाटक (KA) 76.1 56.9 82.9 68.1
केरल (KE) 94.2 87.7 96.0 92.0
मध्य प्रदेश (MP) 76.1 50.3 80.5 60.0
छत्तीसगढ़ (CH) 77.4 51.9 81.5 60.6
महाराष्ट्र (MR) 86.0 67.0 89.8 75.5
ओडिशा (OD) 75.3 50.5 82.4 64.4
पंजाब (PB) 75.2 63.4 81.5 71.3
राजस्थान (RJ) 75.7 43.9 80.5 52.7
तमिलनाडु (TN) 82.4 64.4 86.8 73.9
उत्तर प्रदेश (UP) 68.8 42.2 79.2 59.3
उत्तराखंड (UK) 83.3 59.6 88.3 70.7
पश्चिम बंगाल (WB) 77.0 59.6 82.7 71.2
भारत 75.3 53.7 82.1 65.5

आकृति 4.1: भारत के प्रमुख राज्यों के पुरुष साक्षरता दर को दर्शाता दंड आरेख, 2011. (साक्षरता दर 7 वर्ष और उससे अधिक आयु की जनसंख्या से संबंधित है)

दंड आरेखों के विभिन्न रूप हो सकते हैं जैसे कि बहु-दंड आरेख और घटक दंड आरेख।

गतिविधियाँ

  • 2011 में भारत के प्रमुख राज्यों में से कितने राज्यों में महिला साक्षरता दर राष्ट्रीय औसत से अधिक थी?
  • क्या 2001 और 2011 की दो क्रमिक जनगणना वर्षों में राज्यों के बीच अधिकतम और न्यूनतम महिला साक्षरता दर के बीच का अंतर घटा है?

बहु-बार आरेख

बहु-बार आरेख (चित्र 4.2) का उपयोग दो या दो से अधिक डेटा समूहों की तुलना के लिए किया जाता है, उदाहरण के लिए विभिन्न वर्षों के लिए आय और व्यय या आयात और निर्यात, विभिन्न कक्षाओं में विभिन्न विषयों में प्राप्त अंक, आदि।

घटक बार आरेख

घटक बार आरेख या चार्ट (चित्र 4.3), जिन्हें उप-आरेख भी कहा जाता है, विभिन्न घटक भागों के आकारों की तुलना करने में बहुत उपयोगी होते हैं (वे तत्व या भाग जिनसे कोई वस्तु बनी होती है) और साथ ही इन अभिन्न भागों के बीच संबंध को स्पष्ट करने के लिए भी। उदाहरण के लिए, विभिन्न उत्पादों से बिक्री आय, एक विशिष्ट भारतीय परिवार में व्यय प्रतिरूप (घटक होते हैं भोजन, किराया, दवा, शिक्षा, बिजली, आदि), प्राप्तियों और व्यय के लिए बजट आवंटन, श्रम बल के घटक, जनसंख्या आदि। घटक बार आरेख सामान्यतः उपयुक्त रूप से छायांकित या रंगे होते हैं।

चित्र 4.2: भारत के प्रमुख राज्यों द्वारा 2001 और 2011 की दो जनगणना वर्षों में महिला साक्षरता दर दिखाने वाला बहु-बार (स्तंभ) आरेख। (डेटा स्रोत तालिका 4.6)

व्याख्या: आकृति 4.2 से यह बहुत आसानी से निकाला जा सकता है कि देश भर में वर्षों के दौरान महिला साक्षरता दर में वृद्धि हो रही थी। आकृति से इसी प्रकार की अन्य व्याख्याएँ भी की जा सकती हैं। उदाहरण के लिए, आकृति दर्शाती है कि बिहार, झारखंड और उत्तर प्रदेश राज्यों में महिला साक्षरता में सबसे तीव्र वृद्धि हुई है, आदि।

तालिका 4.7 बिहार के एक जिले में विद्यालयों में लिंग के अनुसार नामांकन (प्रतिशत) 6-14 वर्ष आयु के बच्चों का

लिंग नामांकित (प्रतिशत) विद्यालय से बाहर (प्रतिशत)
लड़का 91.5 8.5
लड़की 58.6 41.4
सभी 78.0 22.0

डेटा स्रोत: अप्रकाशित डेटा

एक घटक स्तंभ आरेख स्तंभ और उसके दो या अधिक घटकों में विभाजन को दर्शाता है। उदाहरण के लिए, स्तंभ 6-14 वर्ष आयु-वर्ग के बच्चों की कुल जनसंख्या को दर्शा सकता है। घटक वे अनुपात दर्शाते हैं जो नामांकित हैं और जो नहीं हैं। एक घटक स्तंभ आरेख लड़कों, लड़कियों और दी गई आयु सीमा के बच्चों के कुल के लिए भिन्न घटक स्तंभ भी सम्मिलित कर सकता है, जैसा कि आकृति 4.3 में दिखाया गया है। एक घटक स्तंभ आरेख बनाने के लिए, सबसे पहले $\mathrm{x}$-अक्ष पर एक स्तंभ बनाया जाता है जिसकी ऊँचाई स्तंभ के कुल मान के समतुल्य होती है [प्रतिशत डेटा के लिए स्तंभ की ऊँचाई 100 इकाई की होती है (आकृति 4.3)]। अन्यथा ऊँचाई स्तंभ के कुल मान के बराबर होती है और घटकों की समानुपातिक ऊँचाइयाँ एकात्मक विधि का उपयोग करके निकाली जाती हैं। स्तंभ को विभाजित करने में छोटे घटकों को प्राथमिकता दी जाती है।

चित्र 4.3: बिहार के एक जिले में प्राथमिक स्तर पर नामांकन (घटक दंड आरेख)

पाई आरेख

पाई आरेख भी एक घटक आरेख है, लेकिन दंड आरेख के विपरीत, यहाँ यह एक वृत्त होता है जिसका क्षेत्रफल उन घटकों के बीच अनुपात में विभाजित होता है (चित्र 4.4) जिन्हें यह दर्शाता है। इसे पाई चार्ट भी कहा जाता है। वृत्त को केंद्र से परिधि तक सीधी रेखाएँ खींचकर उतने ही भागों में विभाजित किया जाता है जितने घटक होते हैं।

पाई चार्ट सामान्यतः किसी श्रेणी के निरपेक्ष मानों के साथ नहीं बनाए जाते। प्रत्येक श्रेणी के मानों को सबसे पहले सभी श्रेणियों के कुल मान का प्रतिशत के रूप में व्यक्त किया जाता है। पाई चार्ट में एक वृत्त, अपने त्रिज्या के मान की परवाह किए बिना, 100 समान भागों में सोचा जाता है, जिनमें से प्रत्येक भाग $3.6^{\circ}\left(360^{\circ} / 100\right)$ का होता है। यह ज्ञात करने के लिए कि कोई घटक वृत्त के केंद्र पर कितना कोण बनाएगा, प्रत्येक घटक के प्रतिशत आंकड़े को $3.6^{\circ}$ से गुणा किया जाता है। वृत्त के कोणीय घटकों में प्रतिशत घटकों के इस रूपांतरण का एक उदाहरण तालिका 4.8 में दिखाया गया है।

यह जानना रोचक हो सकता है कि एक घटक पट्टिका आरेख द्वारा प्रस्तुत किए गए डेटा को पाई चार्ट द्वारा भी समान रूप से अच्छी तरह से प्रस्तुत किया जा सकता है, एकमात्र आवश्यकता यह है कि घटकों के निरपेक्ष मानों को प्रतिशत में परिवर्तित करना होता है ताकि उन्हें पाई आरेख के लिए प्रयोग किया जा सके।

सारणी 4.8 भारतीय जनसंख्या का (2011) उनकी कार्य स्थिति के अनुसार वितरण (करोड़ों में)

स्थिति जनसंख्या प्रतिशत कोणीय घटक
सीमांत श्रमिक 12 9.9 $36^{\circ}$
मुख्य श्रमिक 36 29.8 $107^{\circ}$
गैर-श्रमिक 73 60.3 $217^{\circ}$
सभी 102 100.0 $360^{\circ}$

आकृति 4.4: कार्य स्थिति के अनुसार भारतीय जनसंख्या के विभिन्न वर्गों के लिए पाई आरेख 2011.


गतिविधियाँ

  • आकृति 4.4 द्वारा प्रस्तुत डेटा को एक घटक पट्टिका आरेख द्वारा प्रस्तुत करें।
  • क्या पाई का क्षेत्रफल डेटा के कुल मान पर कोई प्रभाव डालता है जिसे पाई आरेख द्वारा प्रस्तुत किया जाना है?

बारंबारता आरेख

समूहीकृत बारंबारता बंटन के रूप में डेटा को आमतौर पर हिस्टोग्राम, बारंबारता बहुभुज, बारंबारता वक्र और ओजाइव जैसे बारंबारता आरेखों द्वारा प्रस्तुत किया जाता है।

हिस्टोग्राम

एक हिस्टोग्राम एक द्वि-आयामी आरेख है। यह आयतों का एक समूह होता है जिसका आधार वर्ग सीमाओं के बीच के अंतराल होते हैं (X-अक्ष के अनुदिश) और जिसके क्षेत्रफल वर्ग आवृत्तियों के अनुपात में होते हैं (चित्र 4.5)। यदि वर्ग अंतराल समान चौड़ाई के हों, जैसा कि आमतौर पर होते हैं, तो आयतों के क्षेत्रफल उनकी संबंधित आवृत्तियों के अनुपात में होते हैं। हालांकि, कुछ प्रकार के आंकड़ों में, कभी-कभी वर्ग अंतरालों की भिन्न-भिन्न चौड़ाई का उपयोग करना सुविधाजनक होता है, कभी-कभी आवश्यक भी। उदाहरण के लिए, मृत्यु के समय आयु के अनुसार मृत्युओं की सारणी बनाते समय, आरंभ में बहुत छोटी आयु अंतरालों (0,1,2,… वर्ष/0,7,28,… दिन) का होना बहुत अर्थपूर्ण और उपयोगी होगा जब मृत्यु दर अन्य अधिकांश आयु वर्गों की तुलना में बहुत अधिक होती है। ऐसे आंकड़ों के आलेखीय निरूपण के लिए, आयत की ऊंचाई या क्षेत्रफल ऊंचाई (यहां आवृत्ति) और आधार (यहां वर्ग अंतराल की चौड़ाई) का भागफल होता है। जब अंतराल समान होते हैं, अर्थात् सभी आयतों का आधार समान होता है, तो तुलना के उद्देश्य से क्षेत्रफल को किसी भी अंतराल की आवृत्ति द्वारा सुविधाजनक रूप से निरूपित किया जा सकता है।

जब आधार की चौड़ाई भिन्न-भिन्न होती है, तो आयतों की ऊंचाइयों को तुलनात्मक माप देने के लिए समायोजित किया जाना चाहिए। ऐसी स्थिति में उत्तर आवृत्ति घनत्व (वर्ग आवृत्ति को वर्ग अंतराल की चौड़ाई से विभाजित करने पर) होता है, न कि निरपेक्ष आवृत्ति।

तालिका 4.9 एक कस्बे के क्षेत्र में दैनिक वेतन भोगी व्यक्तियों का वितरण

दैनिक कमाई (रु) मजदूरी कमाने वालों की संख्या (f)
45-49 2
50-54 3
55-59 5
60-64 3
65-69 6
70-74 7
75-79 12
80-84 13
85-89 9
90-94 7
95-99 6
100-104 4
105-109 2
110-114 3
115-119 3

स्रोत: अप्रकाशित आँकड़े

चूँकि हिस्टोग्राम आयताकार होते हैं, आधार रेखा के समानांतर और समान परिमाण की एक रेखा आधार रेखा से उस ऊर्ध्वाधर दूरी पर खींची जाती है जो वर्ग अंतराल की बारंबारता (या बारंबारता घनत्व) के बराबर होती है। हिस्टोग्राम कभी नहीं खींचा जाता। चूँकि, सतत चरों के लिए, किसी वर्ग अंतराल की निचली वर्ग सीमा पिछले अंतराल की ऊपरी वर्ग सीमा से मिल जाती है, चाहे वे समान हों या असमान, आयत सभी संलग्न होते हैं और दो क्रमागत आयतों के बीच कोई खुला स्थान नहीं होता। यदि वर्ग सतत नहीं हैं तो उन्हें पहले सतत वर्गों में बदला जाता है जैसा कि अध्याय 3 में चर्चा की गई है। कभी-कभी दो संलग्न आयतों के बीच की सामान्य भाग (चित्र 4.6) को छोड़ दिया जाता है जिससे सततता की बेहतर छाप मिलती है। परिणामी आकृति दोहरी सीढ़ी की छाप देती है।

एक हिस्टोग्राम एक बार आरेख के समान दिखता है। लेकिन पहली नज़र में लगने वाले से अधिक अंतर हैं, समानताओं की तुलना में। बारों के बीच की दूरी और चौड़ाई या क्षेत्रफल सभी मनमाने होते हैं। यह बार की चौड़ाई या क्षेत्रफल नहीं, बल्कि ऊँचाई है जो वास्तव में मायने रखती है। एक ही चौड़ाई की बार के समान उद्देश्य की पूर्ति एक एकल ऊर्ध्वाधर रेखा भी कर सकती है। इसके अतिरिक्त, हिस्टोग्राम में दो आयतों के बीच कोई स्थान नहीं छोड़ा जाता, परंतु बार आरेख में लगातार बारों के बीच कुछ स्थान अवश्य छोड़ा जाता है (बहु-बार या घटक-बार आरेख को छोड़कर)। यद्यपि बारों की समान चौड़ाई होती है, तुलना के उद्देश्य से बार की चौड़ाई महत्वहीन है। हिस्टोग्राम में चौड़ाई उतनी ही महत्वपूर्ण है जितनी इसकी ऊँचाई। हम विवृत और सतत चर दोनों के लिए बार आरेख बना सकते हैं, परंतु हिस्टोग्राम केवल सतत चर के लिए ही खींचा जाता है। हिस्टोग्राम आवृत्ति बंटन के बहुलक का मान आलेखीय रूप से भी देता है जैसा कि चित्र 4.5 में दिखाया गया है और बिंदित ऊर्ध्वाधर रेखा का $\mathrm{x}$-निर्देशांक बहुलक देता है।

आवृत्ति बहुभुज

एक बारंबारता बहुभुज एक समतल होता है जो सीधी रेखाओं से घिरा होता है, आमतौर पर चार या अधिक रेखाओं से। बारंबारता बहुभुज हिस्टोग्राम का एक विकल्प है और यह स्वयं हिस्टोग्राम से ही व्युत्पन्न भी किया जाता है। एक बारंबारता बहुभुज को किसी हिस्टोग्राम पर फिट किया जा सकता है ताकि वक्र के आकार का अध्ययन किया जा सके। बारंबारता बहुभुज खींचने की सबसे सरल विधि यह है कि हिस्टोग्राम के लगातार आयतों के ऊपरी भाग के मध्य-बिंदुओं को मिलाया जाए। इससे हमारे पास आधार रेखा से दूर दो सिरे रह जाते हैं, जिससे वक्र के नीचे के क्षेत्रफल की गणना नहीं हो पाती। समाधान यह है कि प्राप्त किए गए दो अंतिम बिंदुओं को वितरण के प्रत्येक सिरे पर शून्य बारंबारता वाली दो कक्षाओं की मध्य-मानों पर आधार रेखा से मिलाया जाए। टूटी हुई रेखाएँ या बिंदु इन दोनों सिरों को आधार रेखा से मिला सकते हैं। अब वक्र के नीचे का कुल क्षेत्रफल, हिस्टोग्राम की तरह, कुल बारंबारता या नमूना आकार को दर्शाता है।

आकृति 4.5: एक कस्बे के क्षेत्र में 85 दैनिक वेतन भोगियों के वितरण के लिए हिस्टोग्राम।

बारंबारता बहुभुज सामूहिक बारंबारता बंटन को प्रस्तुत करने की सबसे सामान्य विधि है। एक्स-अक्ष पर वर्ग सीमाएँ तथा वर्ग-चिह्न दोनों प्रयोग किए जा सकते हैं, दो क्रमागत वर्ग-चिह्नों के बीच की दूरी वर्ग अंतराल की चौड़ाई के अनुपातिक/समान होती है। यदि वर्ग-चिह्न ग्राफ पेपर की मोटी रेखाओं पर आ जाएँ तो आँकड़ों की बिंदु-स्थापना सरल हो जाती है। चाहे एक्स-अक्ष पर वर्ग सीमाएँ प्रयोग की गई हों या मध्य-बिंदु, बारंबारताएँ (ऑर्डिनेट के रूप में) सदैव वर्ग अंतराल के मध्य-बिंदु के विरुद्ध आलेखित की जाती हैं। जब सभी बिंदु ग्राफ में स्थापित कर दिए जाते हैं, तो उन्हें सावधानीपूर्वक छोटी-छोटी सीधी रेखाओं की श्रृंखला द्वारा मिलाया जाता है। आरंभ में तथा अंत में दो अंतरालों के मध्य-बिंदुओं को तोड़ी हुई रेखाएँ जोड़ती हैं, जो आलेखित वक्र के दोनों सिरों से मिलती हैं (चित्र 4.6)। जब एक ही अक्षों पर दो या अधिक बंटनों की तुलना की जाती है, तो बारंबारता बहुभुज अधिक उपयोगी हो सकता है, क्योंकि हिस्टोग्राम में दो या अधिक बंटनों की ऊर्ध्वाधर तथा क्षैतिज रेखाएँ संपाती हो सकती हैं।

चित्र 4.6: सारणी 4.9 में दिए गए आँकड़ों के लिए खींचा गया बारंबारता बहुभुज

चित्र 4.7: सारणी 4.9 के लिए बारंबारता वक्र

बारंबारता वक्र

बारंबारता वक्र प्राप्त किया जाता है बारंबारता बहुभुज के बिंदुओं से यथासंभव निकटता से गुजरने वाली एक सहज, हाथ से खींची गई मुलायम रेखा खींचकर। यह आवश्यक नहीं कि वह बारंबारता बहुभुज के सभी बिंदुओं से होकर गुजरे, परंतु वह उनसे यथासंभव निकटता से गुजरती है (चित्र 4.7)।

ओजाइव

ओजाइव को संचित बारंबारता वक्र भी कहा जाता है। चूंकि दो प्रकार की संचित बारंबारताएं होती हैं, उदाहरण के लिए “से कम” प्रकार और “से अधिक” प्रकार, इसलिए किसी भी समूहीकृत बारंबारता बंटन आंकड़ों के लिए दो ओजाइव होते हैं। यहां बारंबारता बहुभुज के मामले की भांति साधारण बारंबारताओं के स्थान पर, संचित बारंबारताओं को बारंबारता बंटन की वर्ग सीमाओं के विरुद्ध $y$-अक्ष पर आलेखित किया जाता है। “से कम” ओजाइव के लिए संचित बारंबारताओं को संबंधित वर्ग अंतरालों की ऊपरी सीमाओं के विरुद्ध आलेखित किया जाता है, जबकि “से अधिक” ओजाइवों के लिए संचित बारंबारताओं को संबंधित वर्ग अंतरालों की निचली सीमाओं के विरुद्ध आलेखित किया जाता है। दोनों ओजाइवों की एक रोचक विशेषता यह है कि उनका प्रतिच्छेद बिंदु बारंबारता बंटन की माध्यिका चित्र 4.8 (b) देता है। जैसा कि दोनों ओजाइवों के आकार सुझाते हैं, “से कम” ओजाइव कभी घटता नहीं है और “से अधिक” ओजाइव कभी बढ़ता नहीं है।

अंकगणितीय रेखा ग्राफ

एक अंकगणितीय रेखा ग्राफ को समय श्रेणी ग्राफ भी कहा जाता है। इस ग्राफ में समय (घंटा, दिन/तिथि, सप्ताह, माह, वर्ष आदि) को $\mathrm{x}$-अक्ष पर और चर का मान (समय श्रेणी डेटा) को y-अक्ष पर प्लॉट किया जाता है। इन प्लॉट किए गए बिंदुओं को मिलाकर बनाई गई रेखा ग्राफ को अंकगणितीय रेखा ग्राफ (समय श्रेणी ग्राफ) कहा जाता है। यह दीर्घकालिक समय श्रेणी डेटा में प्रवृत्ति, आवर्तिता आदि को समझने में मदद करता है।

TABLE 4.10 गणित में प्राप्त अंकों की आवृत्ति बंटन

Fig. 4.8(a): टेबल 4.10 में दिए गए डेटा के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

Fig. 4.8(b): टेबल 4.10 में दिए गए डेटा के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

यहाँ आप Fig. 4.9 से देख सकते हैं कि 1993-94 से 2013-14 की अवधि के दौरान, पूरे समय आयात निर्यात से अधिक थे। आप देख सकते हैं कि 2001-02 के बाद निर्यात और आयात दोनों के मान तेजी से बढ़ रहे हैं। साथ ही आयात और निर्यात के बीच का अंतर 2001-02 के बाद बढ़ गया है।

6. निष्कर्ष

अब तक आपने यह सीख लिया होगा कि डेटा को विभिन्न रूपों—पाठीय, सारणीबद्ध और आरेखीय—का उपयोग करके कैसे प्रस्तुत किया जा सकता है। अब आप किसी दिए गए डेटा समूह के लिए डेटा प्रस्तुति के उपयुक्त रूप और प्रयुक्त होने वाले आरेख के प्रकार का चयन भी कर सकते हैं। इस प्रकार आप डेटा की प्रस्तुति को सार्थक, व्यापक और उद्देश्यपूर्ण बना सकते हैं।

TABLE 4.11 भारत के निर्यात और आयात का मूल्य (100 करोड़ रुपये में)

वर्ष निर्यात आयात
1993-94 698 731
1994-95 827 900
1995-96 1064 1227
1996-97 1188 1389
1997-98 1301 1542
1998-99 1398 1783
1999-2000 1591 2155
2000-01 2036 2309
2001-02 2090 2452
2002-03 2549 2964
2003-04 2934 3591
2004-05 3753 5011
2005-06 4564 6604
2006-07 5718 8815
2007-08 6559 10123
2008-09 8408 13744
2009-10 8455 13637
2010-11 11370 16835
2011-12 14660 23455
2012-13 16343 26692
2013-14 19050 27154

स्रोत: DGCI&S, कोलकाता

Fig. 4.9: TABLE 4.11 में दिए गए समय श्रेणी डेटा के लिए अंकगणितीय रेखा आरेख

सारांश

  • आँकड़े (भी भारी मात्रा में) प्रस्तुति के माध्यम से अर्थपूर्ण रूप से बोलते हैं।
  • छोटे आँकड़ों (मात्रा) के लिए पाठात्मक प्रस्तुति अधिक उपयुक्त होती है।
  • बड़ी मात्रा के आँकड़ों के लिए सारणीबद्ध प्रस्तुति एक या अधिक चरों के लिए किसी भी मात्रा के आँकड़ों को समाहित करने में सहायक होती है।
  • सारणीबद्ध आँकड़ों को आरेखों के माध्यम से प्रस्तुत किया जा सकता है जो तथ्यों की तेज़ समझ में सहायक होते हैं।

अभ्यास

निम्नलिखित प्रश्नों 1 से 10 तक का उत्तर चुनकर दीजिए

1. दंड आरेख एक होता है

(i) एक-आयामी आरेख

(ii) दो-आयामी आरेख

(iii) बिना आयाम का आरेख

(iv) उपर्युक्त में से कोई नहीं

2. हिस्टोग्राम के माध्यम से प्रस्तुत आँकड़े ग्राफ़िक रूप से ज्ञात करने में सहायक हो सकते हैं

(i) माध्य

(ii) बहुलक

(iii) माध्यिका

(iv) उपर्युक्त सभी

3. ओजाइव्स ग्राफ़िक रूप से ज्ञात करने में सहायक हो सकते हैं

(i) बहुलक

(ii) माध्य

(iii) माध्यिका

(iv) उपर्युक्त में से कोई नहीं

4. अंकगणितीय रेखा ग्राफ़ के माध्यम से प्रस्तुत आँकड़े समझने में सहायक होते हैं

(i) दीर्घकालिक प्रवृत्ति

(ii) आँकड़ों में चक्रीयता

(iii) आँकड़ों में मौसमी प्रभाव

(iv) उपर्युक्त सभी

5. दंड आरेख में दंडों की चौड़ाई बराबर होनी आवश्यक नहीं है (सत्य/असत्य)।

6. हिस्टोग्राम में आयतों की चौड़ाई अनिवार्यतः बराबर होनी चाहिए (सत्य/असत्य)।

7. हिस्टोग्राम केवल सतत वर्गीकरण वाले आँकड़ों से ही बनाया जा सकता है (सत्य/असत्य)।

8. हिस्टोग्राम और स्तंभ आरेख आँकड़ों की प्रस्तुति की एक ही विधि हैं। (सत्य/असत्य)

9. बारंबारता बंटन की विधिमान को आरेख (हिस्टोग्राम) की सहायता से आलेखीय रूप से जाना जा सकता है। (सत्य/असत्य)

10. बारंबारता बंटन की माध्यिका को ओजाइव्स से नहीं जाना जा सकता। (सत्य/असत्य)

11. निम्नलिखित को चित्रित करने के लिए किस प्रकार के आरेख अधिक प्रभावी हैं?

(i) एक वर्ष में मासिक वर्षा

(ii) धर्म के आधार पर दिल्ली की जनसंख्या की संरचना

(iii) एक कारखाने में लागत के घटक

12. मान लीजिए आप भारत में शहरी गैर-श्रमिकों के हिस्से में वृद्धि और शहरीकरण के निम्न स्तर को उदाहरण 4.2 में दिखाए गए अनुसार जोर देना चाहते हैं। आप इसे सारणीबद्ध रूप में कैसे करेंगे?

13. जब बारंबारता सारणी में वर्ग अंतराल असमान होते हैं तो हिस्टोग्राम बनाने की प्रक्रिया समान वर्ग अंतरालों की तुलना में किस प्रकार भिन्न होती है?

14. इंडियन शुगर मिल्स एसोसिएशन ने रिपोर्ट किया कि, ‘दिसंबर 2001 के पहले पखवाड़े में चीनी उत्पादन लगभग 3,87,000 टन था, जबकि पिछले वर्ष (2000) की इसी अवधि में यह 3,78,000 टन था। दिसंबर 2001 के पहले पखवाड़े में कारखानों से चीनी की ऑफ-टेक 2,83,000 टन आंतरिक उपभोग के लिए और 41,000 टन निर्यात के लिए थी, जबकि पिछले सीजन की इसी अवधि में यह $1,54,000$ टन आंतरिक उपभोग के लिए और निर्यात के लिए शून्य थी।’

(i) आंकड़ों को सारणीबद्ध रूप में प्रस्तुत कीजिए।

(ii) मान लीजिए आपको इन आंकड़ों को आलेखीय रूप में प्रस्तुत करना है तो आप किस आरेख का उपयोग करेंगे और क्यों?

(iii) इन आंकड़ों को आलेखीय रूप में प्रस्तुत कीजिए।

15. निम्न तालिका में GDP के कारक लागत पर क्षेत्रीय वास्तविक वृद्धि दरों (पिछले वर्ष की तुलना में प्रतिशत परिवर्तन) का अनुमान दिया गया है।

वर्ष कृषि और संबद्ध क्षेत्र उद्योग सेवाएँ
1994-95 5.0 9.2 7.0
1995-96 -0.9 11.8 10.3
1996-97 9.6 6.0 7.1
1997-98 -1.9 5.9 9.0
1998-99 7.2 4.0 8.3
1999-2000 0.8 6.9 8.2

इस डेटा को एकाधिक समय श्रृंखला ग्राफों के रूप में प्रस्तुत करें।