SATHEE CUET: Chapter 02 Collection of Data

अध्याय 02 आंकड़ों का संग्रह

1. परिचय

पिछले अध्याय में आपने पढ़ा कि अर्थशास्त्र क्या है। आपने अर्थशास्त्र में सांख्यिकी की भूमिका और महत्व के बारे में भी अध्ययन किया। इस अध्याय में आप डेटा के स्रोतों और डेटा संग्रह के तरीकों का अध्ययन करेंगे। डेटा संग्रह का उद्देश्य किसी समस्या के समाधान के लिए ठोस और स्पष्ट प्रमाण प्रस्तुत करना है।

अर्थशास्त्र में आप अक्सर इस तरह के कथन से सामना करते हैं,

“कई उतार-चढ़ावों के बाद खाद्यान्न का उत्पादन 1970-71 में 108 मिलियन टन से बढ़कर 1978-79 में 132 मिलियन टन हो गया, लेकिन 1979-80 में फिर घटकर 108 मिलियन टन हो गया। इसके बाद खाद्यान्न का उत्पादन लगातार बढ़ता रहा और 2015-16 में 252 मिलियन टन तथा 2016-17 में 272 मिलियन टन तक पहुंच गया।”

इस कथन में आप देख सकते हैं कि विभिन्न वर्षों में खाद्यान्न का उत्पादन समान नहीं रहता। यह वर्ष दर वर्ष और फसल दर फसल बदलता रहता है। चूंकि ये मान बदलते रहते हैं, इन्हें चर कहा जाता है। चरों को आमतौर पर अक्षरों $\mathrm{X}, \mathrm{Y}$ या $\mathrm{Z}$ द्वारा दर्शाया जाता है। किसी चर का प्रत्येक मान एक प्रेक्षण होता है। उदाहरण के लिए, भारत में खाद्यान्न का उत्पादन निम्नलिखित तालिका में दिखाए अनुसार 1970-71 में 108 मिलियन टन से लेकर 2016-17 में 272 मिलियन टन तक बदलता रहा है। वर्षों को चर $X$ द्वारा और भारत में खाद्यान्न का उत्पादन (मिलियन टन में) चर $Y$ द्वारा दर्शाया गया है।

तालिका 2.1 भारत में खाद्यान्न का उत्पादन (मिलियन टन)

X	Y
1970-71	108
1978-79	132
1990-91	176
1997-98	194
2001-02	212
2015-16	252
2016-17	272

यहाँ इन चरों $X$ और $Y$ के मान ‘डेटा’ हैं, जिनसे हम भारत में खाद्यान्न उत्पादन के बारे में जानकारी प्राप्त कर सकते हैं। खाद्यान्न उत्पादन में उतार-चढ़ाव को जानने के लिए हमें विभिन्न वर्षों के लिए भारत में खाद्यान्न उत्पादन का ‘डेटा’ चाहिए। ‘डेटा’ एक उपकरण है जो जानकारी प्रदान करके समस्याओं को समझने में मदद करता है।

आप सोच रहे होंगे कि ‘डेटा’ आता कहाँ से है और हम इन्हें इकट्ठा कैसे करते हैं? आगे आने वाले खंडों में हम डेटा के प्रकारों, डेटा संग्रह की विधियों और उपकरणों तथा डेटा प्राप्त करने के स्रोतों पर चर्चा करेंगे।

2. डेटा के स्रोत क्या हैं?

सांख्यिकीय डेटा दो स्रोतों से प्राप्त किया जा सकता है। शोधकर्ता किसी पूछताछ आयोजित करके डेटा इकट्ठा कर सकता है। ऐसे डेटा को प्राथमिक डेटा कहा जाता है, क्योंकि ये प्रथम-हस्त जानकारी पर आधारित होते हैं। मान लीजिए आप किसी फिल्म स्टार की स्कूली छात्रों में लोकप्रियता के बारे में जानना चाहते हैं। इसके लिए आपको बड़ी संख्या में स्कूली छात्रों से पूछताछ करनी होगी, उनसे प्रश्न पूछकर वांछित जानकारी इकट्ठा करनी होगी। आपको जो डेटा मिलता है, वह प्राथमिक डेटा का एक उदाहरण है।

यदि डेटा किसी अन्य एजेंसी द्वारा एकत्रित और संसाधित (जांच-परख और सारणीबद्ध) किए गए हैं, तो उन्हें द्वितीयक डेटा कहा जाता है। इन्हें या तो प्रकाशित स्रोतों जैसे सरकारी रिपोर्ट, दस्तावेज़, समाचार-पत्र, अर्थशास्त्रियों द्वारा लिखी गई पुस्तकों से प्राप्त किया जा सकता है या किसी अन्य स्रोत से, उदाहरण के लिए, एक वेबसाइट। इस प्रकार, डेटा उस स्रोत के लिए प्राथमिक होते हैं जो उन्हें पहली बार एकत्रित और संसाधित करता है और द्वितीयक उन सभी स्रोतों के लिए जो बाद में ऐसे डेटा का उपयोग करते हैं। द्वितीयक डेटा के उपयोग से समय और लागत की बचत होती है। उदाहरण के लिए, छात्रों के बीच फिल्मस्टार की लोकप्रियता पर डेटा एकत्रित करने के बाद, आप एक रिपोर्ट प्रकाशित करते हैं। यदि कोई व्यक्ति समान अध्ययन के लिए आपके द्वारा एकत्रित डेटा का उपयोग करता है, तो वह द्वितीयक डेटा बन जाता है।

3. हम डेटा कैसे एकत्रित करते हैं?

क्या आप जानते हैं कि कोई निर्माता उत्पाद के बारे में कैसे निर्णय लेता है या कोई राजनीतिक दल उम्मीदवार के बारे में कैसे निर्णय लेता है? वे एक बड़े समूह से किसी विशेष उत्पाद या उम्मीदवार के बारे में प्रश्न पूछकर सर्वेक्षण करते हैं। सर्वेक्षणों का उद्देश्य कुछ विशेषताओं का वर्णन करना होता है जैसे मूल्य, गुणवत्ता, उपयोगिता (उत्पाद के मामले में) और लोकप्रियता, ईमानदारी, निष्ठा (उम्मीदवार के मामले में)। सर्वेक्षण का उद्देश्य डेटा एकत्रित करना है। सर्वेक्षण व्यक्तियों से सूचना एकत्रित करने की एक विधि है।

उपकरण की तैयारी

सर्वेक्षणों में प्रयोग किए जाने वाला सबसे सामान्य उपकरण प्रश्नावली/साक्षात्कार अनुसूची है। प्रश्नावली या तो उत्तरदाता स्वयं भरता है या शोधकर्ता (गणक) या प्रशिक्षित अन्वेषक द्वारा भरवाई जाती है। प्रश्नावली/साक्षात्कार अनुसूची तैयार करते समय निम्नलिखित बिंदुओं को ध्यान में रखना चाहिए;

प्रश्नावली अत्यधिक लंबी नहीं होनी चाहिए। प्रश्नों की संख्या न्यूनतम होनी चाहिए।

प्रश्नावली सरल होनी चाहिए और अस्पष्ट या कठिन शब्दों से बचना चाहिए।

प्रश्नों को ऐसे क्रम में व्यवस्थित किया जाना चाहिए कि उत्तर देने वाला व्यक्ति सहज महसूस करे।
प्रश्नों की श्रृंखला सामान्य से विशिष्ट की ओर बढ़नी चाहिए। प्रश्नावली सामान्य प्रश्नों से शुरू होकर अधिक विशिष्ट प्रश्नों की ओर आगे बढ़नी चाहिए। उदाहरण के लिए:

खराब $Q$

(i) बिजली के शुल्क में वृद्धि उचित है?

(ii) क्या आपके क्षेत्र में बिजली की आपूर्ति नियमित है?

अच्छा $Q$

(i) क्या आपके क्षेत्र में बिजली की आपूर्ति नियमित है?

(ii) बिजली के शुल्क में वृद्धि उचित है?

प्रश्न सटीक और स्पष्ट होने चाहिए। उदाहरण के लिए,

खराब $Q$

आप अपनी आय का कितना प्रतिशत भाग प्रस्तुतशील दिखने के लिए कपड़ों पर खर्च करते हैं?

अच्छा $Q$

आप अपनी आय का कितना प्रतिशत भाग कपड़ों पर खर्च करते हैं?

प्रश्न अस्पष्ट नहीं होने चाहिए। उन्हें उत्तरदाताओं को तेजी से, सही और स्पष्ट रूप से उत्तर देने में सक्षम बनाना चाहिए। उदाहरण के लिए:

खराब $Q$

क्या आप एक महीने में किताबों पर बहुत सारा पैसा खर्च करते हैं?

अच्छा $Q$

(उपयुक्त विकल्प पर टिक करें)

आप एक महीने में कितना खर्च करते हैं?

(i) 200 रुपये से कम

(ii) 200-300 रुपये

(iii) 300-400 रुपये

(iv) 400 रुपये से अधिक

प्रश्न में दोहले नकारात्मक शब्दों का प्रयोग नहीं होना चाहिए। “क्या आप नहीं” या “क्या आपको नहीं लगता” से शुरू होने वाले प्रश्नों से बचना चाहिए, क्योंकि ये पूर्वाग्रहित उत्तरों की ओर ले जा सकते हैं। उदाहरण के लिए:

खराब $Q$

क्या आपको नहीं लगता कि धूम्रपान पर प्रतिबंध होना चाहिए?

अच्छा $Q$

क्या आपको लगता है कि धूम्रपान पर प्रतिबंध होना चाहिए?

प्रश्न नेतृत्व करने वाला नहीं होना चाहिए, जो उत्तरदाता को यह संकेत दे कि उसे कैसे उत्तर देना है। उदाहरण के लिए:

खराब $Q$

आपको इस उच्च गुणवत्ता वाली चाय का स्वाद कैसा लगा?

अच्छा $Q$

आपको इस चाय का स्वाद कैसा लगा?

प्रश्न में उत्तर के विकल्पों का संकेत नहीं होना चाहिए। उदाहरण के लिए:

खराब $Q$

कॉलेज के बाद आप नौकरी करना चाहेंगी या गृहिणी बनना चाहेंगी?

अच्छा $Q$

कॉलेज के बाद आप क्या करना चाहेंगी?

प्रश्नावली बंद सिरे वाले (या संरचित) प्रश्नों या खुले सिरे वाले (या असंरचित) प्रश्नों से बनी हो सकती है। उपरोक्त प्रश्न जो एक छात्र कॉलेज के बाद क्या करना चाहता है, एक खुले सिरे वाला प्रश्न है।

बंद सिरे वाले या संरचित प्रश्न या तो दो-तरफा प्रश्न हो सकते हैं या बहुविकल्पीय प्रश्न। जब केवल दो संभावित उत्तर हों, ‘हाँ’ या ‘नहीं’, तो इसे दो-तरफा प्रश्न कहा जाता है।

जब दो से अधिक विकल्पों की संभावना हो, तो बहुविकल्पीय प्रश्न अधिक उपयुक्त होते हैं। उदाहरण,

प्र. आपने अपनी जमीन क्यों बेची?

(i) कर्ज चुकाने के लिए।

(ii) बच्चों की शिक्षा के लिए।

(iii) किसी अन्य सम्पत्ति में निवेश करने के लिए।

(iv) अन्य कोई (कृपया स्पष्ट करें)।

बंद-अंत वाले प्रश्नों का उपयोग करना, अंक देना और विश्लेषण के लिए कोड करना आसान होता है, क्योंकि सभी उत्तरदाता दिए गए विकल्पों में से चयन कर सकते हैं। परन्तु इन्हें लिखना कठिन होता है, क्योंकि विकल्पों को इतनी स्पष्टता से लिखना होता है कि वे मुद्दे के दोनों पक्षों को दर्शा सकें। यह भी सम्भावना रहती है कि किसी व्यक्ति की वास्तविक प्रतिक्रिया दिए गए विकल्पों में मौजूद न हो। इसके लिए ‘अन्य कोई’ का विकल्प दिया जाता है, जहाँ उत्तरदाता वह प्रतिक्रिया लिख सकता है जिसकी अनुसंधानकर्ता ने कल्पना नहीं की थी। इसके अतिरिक्त, बहुविकल्पी प्रश्नों की एक और सीमा यह है कि ये विकल्प देकर उत्तरों को सीमित कर देते हैं, जिनके बिना शायद उत्तरदाता कुछ और उत्तर देते।

खुले-अंत वाले प्रश्न अधिक व्यक्तिगत उत्तरों की अनुमति देते हैं, परन्तु इनकी व्याख्या करना कठिन होता है और इन्हें अंक देना भी कठिन होता है, क्योंकि उत्तरों में बहुत विविधता होती है। उदाहरण,

प्र. वैश्वीकरण के बारे में आपका क्या दृष्टिकोण है?

आँकड़ों संग्रह की विधि

क्या आपने कभी कोई टेलीविज़न शो देखा है जिसमें रिपोर्टर बच्चों, गृहिणियों या आम जनता से उनकी परीक्षा के प्रदर्शन या साबुन के किसी ब्रांड या किसी राजनीतिक दल के बारे में प्रश्न पूछते हैं? प्रश्न पूछने का उद्देश्य सर्वेक्षण करके आँकड़े एकत्र करना होता है। आँकड़े एकत्र करने के तीन मूलभूत तरीके हैं: (i) व्यक्तिगत साक्षात्कार, (ii) डाक (प्रश्नावली) सर्वेक्षण, और (iii) टेलीफोन साक्षात्कार।

व्यक्तिगत साक्षात्कार

यह विधि तब प्रयोग की जाती है जब शोधकर्ता को सभी सदस्यों तक पहुँच हो। शोधकर्ता (या जाँचकर्ता) उत्तरदाताओं से आमने-सामने साक्षात्कार करता है।

व्यक्तिगत साक्षात्कार को कई कारणों से प्राथमिकता दी जाती है। उत्तरदाता और साक्षात्कारकर्ता के बीच व्यक्तिगत संपर्क बनता है। साक्षात्कारकर्ता को अध्ययन को समझाने और उत्तरदाताओं के प्रश्नों का उत्तर देने का अवसर मिलता है। साक्षात्कारकर्ता उत्तरदाता से विशेष रूप से महत्वपूर्ण उत्तरों को विस्तार से समझाने का अनुरोध कर सकता है। गलत व्याख्या और भ्रांति से बचा जा सकता है। उत्तरदाताओं की प्रतिक्रियाओं को देखकर अतिरिक्त जानकारी प्राप्त की जा सकती है।

व्यक्तिगत साक्षात्कार के कुछ नुकसान भी हैं। यह महँगा होता है, क्योंकि इसमें प्रशिक्षित साक्षात्कारकर्ताओं की आवश्यकता होती है। सर्वेक्षण को पूरा करने में अधिक समय लगता है। शोधकर्ता की उपस्थिति उत्तरदाताओं को यह कहने से रोक सकती है कि वे वास्तव में क्या सोचते हैं।

प्रश्नावली मेल करना

जब सर्वेक्षण में डेटा डाक द्वारा एकत्र किया जाता है, तो प्रत्येक व्यक्ति को डाक द्वारा एक प्रश्नावली भेजी जाती है और एक निश्चित तिथि तक उसे भरकर वापस भेजने का अनुरोध किया जाता है। इस विधि के लाभ यह हैं कि यह कम खर्चीली होती है। यह शोधकर्ता को दूर-दराज के क्षेत्रों के लोगों तक भी पहुंचने की अनुमति देती है, जिन तक व्यक्तिगत रूप से या टेलीफोन द्वारा पहुंचना कठिन हो सकता है। यह साक्षात्कारकर्ता द्वारा उत्तरदाताओं को प्रभावित करने की अनुमति नहीं देती। यह उत्तरदाताओं को प्रश्नों के विचारपूर्ण उत्तर देने के लिए पर्याप्त समय लेने की भी अनुमति देती है।

इन दिनों ऑनलाइन सर्वेक्षण या लघु संदेश सेवा, अर्थात् एसएमएस के माध्यम से सर्वेक्षण लोकप्रिय हैं। क्या आप जानते हैं कि ऑनलाइन सर्वेक्षण कैसे आयोजित किया जाता है?

डाक सर्वेक्षण के नुकसान यह हैं कि निर्देशों को स्पष्ट करने में सहायता प्रदान करने का कम अवसर होता है, इसलिए प्रश्नों को गलत समझने की संभावना रहती है। डाक द्वारा सर्वेक्षण करने पर कुछ कारकों के कारण कम प्रतिक्रिया दर प्राप्त होने की संभावना भी रहती है, जैसे कि प्रश्नावली को पूरा किए बिना वापस भेजना, प्रश्नावली को बिल्कुल वापस न भेजना, डाक में ही प्रश्नावली के खो जाने आदि।

टेलीफोन साक्षात्कार

टेलीफोन साक्षात्कार में, अन्वेषक टेलीफोन के माध्यम से प्रश्न पूछता है। टेलीफोन साक्षात्कार के लाभ यह हैं कि ये व्यक्तिगत साक्षात्कार की तुलना में सस्ते होते हैं और कम समय में आयोजित किए जा सकते हैं। ये शोधकर्ता को प्रतिवादी को प्रश्नों को स्पष्ट करके सहायता करने की अनुमति देते हैं। टेलीफोनिक साक्षात्कार उन स्थितियों में बेहतर होता है जहां प्रतिवादी व्यक्तिगत साक्षात्कार में कुछ प्रश्नों का उत्तर देने में अनिच्छुक होते हैं।

इस विधि का अ disadvantage लोगों तक पहुंच है, क्योंकि कई लोगों के पास टेलीफोन नहीं हो सकते हैं।

पायलट सर्वेक्षण

एक बार प्रश्नावली तैयार हो जाने पर, इसे एक छोटे समूह के साथ आजमाना उचित होता है, जिसे पायलट सर्वेक्षण या प्रश्नावली की पूर्व-परीक्षण कहा जाता है। पायलट सर्वेक्षण सर्वेक्षण के बारे में प्रारंभिक विचार प्रदान करने में सहायक होता है। यह प्रश्नावली की पूर्व-परीक्षण में सहायक होता है, ताकि प्रश्नों की कमियों और खामियों को जाना जा सके। पायलट सर्वेक्षण प्रश्नों की उपयुक्तता, निर्देशों की स्पष्टता, गणनाकारों के प्रदर्शन और वास्तविक सर्वेक्षण में लगने वाले समय और लागत का आकलन करने में भी सहायक होता है।

गतिविधियाँ
आपको भारत के एक दूरस्थ गाँव में रहने वाले व्यक्ति से जानकारी एकत्र करनी है। डेटा संग्रह का कौन सा तरीका उपयुक्त होगा और क्यों? चर्चा करें।
आपको स्कूल में पढ़ाई की गुणवत्ता के बारे में अभिभावकों का साक्षात्कार करना है। यदि स्कूल का प्रधानाचार्य वहाँ मौजूद हो, तो किस प्रकार की समस्याएँ उत्पन्न हो सकती हैं?

4. जनगणना और प्रतिदर्श सर्वेक्षण

जनगणना या पूर्ण गणना

एक सर्वेक्षण, जिसमें जनसंख्या के प्रत्येक तत्व को शामिल किया जाता है, को जनगणना या पूर्ण गणना विधि के रूप में जाना जाता है। यदि कुछ एजेंसियां भारत में कुल जनसंख्या का अध्ययन करने में रुचि रखती हैं, तो उन्हें ग्रामीण और शहरी भारत के सभी घरों से जानकारी प्राप्त करनी होगी। यह हर दस वर्ष में किया जाता है। घर-घर जाकर पूछताछ की जाती है, जिसमें भारत के सभी घरों को शामिल किया जाता है। जन्म और मृत्यु दर, साक्षरता, रोजगार, जीवन प्रत्याशा, जनसंख्या का आकार और संरचना आदि पर जनसांख्यिकीय आंकड़े भारत के रजिस्ट्रार जनरल द्वारा एकत्र किए जाते हैं और प्रकाशित किए जाते हैं। भारत की अंतिम जनगणना 2011 में आयोजित की गई थी।

जनगणना 2011 के अनुसार, भारत की जनसंख्या 121.09 करोड़ थी, जो 2001 में 102.87 करोड़ थी। जनगणना 1901 से पता चला कि देश की जनसंख्या 23.83 करोड़ थी। तब से, 110 वर्षों की अवधि में, देश की जनसंख्या में 97 करोड़ से अधिक की वृद्धि हुई है। जनसंख्या की औसत वार्षिक वृद्धि दर, जो 1971-81 के दशक में प्रति वर्ष 2.2 प्रतिशत थी, 1991-2001 में घटकर 1.97 प्रतिशत और 2001-2011 के दौरान 1.64 प्रतिशत हो गई।

जनसंख्या और प्रतिदर्श

सांख्यिकी में जनसंख्या या ब्रह्मांड का अर्थ है अध्ययन के अधीन आइटमों की कुलता। इस प्रकार, जनसंख्या या ब्रह्मांड एक समूह है जिस पर अध्ययन के परिणाम लागू करने का इरादा होता है। एक जनसंख्या हमेशा वे सभी व्यक्ति/आइटम होते हैं जो सर्वेक्षण के उद्देश्य के अनुसार कुछ विशेषताएँ (या विशेषताओं का एक समूह) रखते हैं। नमूना चयन का पहला कार्य जनसंख्या की पहचान करना है। एक बार जनसंख्या की पहचान हो जाने पर, शोधकर्ता उसका अध्ययन करने की एक विधि चुनता है। यदि शोधकर्ता पाता है कि पूरी जनसंख्या का सर्वेक्षण संभव नहीं है, तो वह एक प्रतिनिधि नमूना चुनने का निर्णय ले सकता है। एक नमूना जनसंख्या के उस समूह या खंड को संदर्भित करता है जिससे सूचना प्राप्त की जानी है। एक अच्छा नमूना (प्रतिनिधि नमूना) आमतौर पर जनसंख्या से छोटा होता है और बहुत कम लागत और कम समय में जनसंख्या के बारे में उचित रूप से सटीक सूचना प्रदान करने में सक्षम होता है।

मान लीजिए आप किसी क्षेत्र के लोगों की औसत आय का अध्ययन करना चाहते हैं। जनगणना विधि के अनुसार आपको उस क्षेत्र के प्रत्येक व्यक्ति की आय ज्ञात करनी होगी, उन्हें जोड़ना होगा और व्यक्तियों की संख्या से विभाजित करना होगा ताकि क्षेत्र के लोगों की औसत आय प्राप्त हो सके। इस विधि में भारी व्यय की आवश्यकता होगी, क्योंकि बड़ी संख्या में गणनाकर्मियों को नियोजित करना होगा। इसके विपरीत, आप उस क्षेत्र से कुछ व्यक्तियों का एक प्रतिनिधि नमूना चुनते हैं और उनकी आय ज्ञात करते हैं। चयनित व्यक्तियों समूह की औसत आय को पूरे क्षेत्र के व्यक्तियों की औसत आय के अनुमान के रूप में प्रयुक्त किया जाता है।

उदाहरण

शोध समस्या: मणिपुर के चुराचंदपुर जिले के कृषि श्रमिकों की आर्थिक स्थिति का अध्ययन करना।
जनसंख्या: चुराचंदपुर जिले के सभी कृषि श्रमिक।
नमूना: चुराचंदपुर जिले के कृषि श्रमिकों का दस प्रतिशत।

अधिकांश सर्वेक्षण नमूना सर्वेक्षण होते हैं। ये सांख्यिकी में कई कारणों से पसंद किए जाते हैं। एक नमूना कम लागत और कम समय में उचित रूप से विश्वसनीय और सटीक सूचना प्रदान कर सकता है। चूंकि नमूने जनसंख्या से छोटे होते हैं, इसलिए गहन पूछताछ करके अधिक विस्तृत सूचना एकत्र की जा सकती है। चूंकि हमें गणनाकर्मियों की छोटी टीम की आवश्यकता होती है, इसलिए उन्हें प्रशिक्षित करना और उनके कार्य पर प्रभावी रूप से निगरानी रखना आसान होता है। अब प्रश्न यह है कि आप नमूना कैसे लेते हैं? नमूनाकरण के दो मुख्य प्रकार होते हैं, यादृच्छिक और अ-यादृच्छिक।

गतिविधियाँ

भारत और चीन में अगली जनगणना किन वर्षों में होगी?
यदि आपको कक्षा XI की नई अर्थशास्त्र की पाठ्यपुस्तक के बारे में विद्यार्थियों की राय जाननी है, तो आपकी जनसंख्या और नमूना क्या होंगे?
यदि कोई शोधकर्ता पंजाब में गेहूं की औसत पैदावार का अनुमान लगाना चाहता है, तो उसकी जनसंख्या और नमूना क्या होंगे?

निम्नलिखित विवरण उनके अंतर को स्पष्ट करेगा।

यादृच्छिक प्रतिदर्शन

जैसा कि नाम से स्पष्ट है, यादृच्छिक प्रतिदर्शन वह है जिसमें जनसंख्या से व्यक्तिगत इकाइयों (नमूनों) को यादृच्छिक रूप से चुना जाता है। सरकार किसी विशेष क्षेत्र में पेट्रोल की कीमतों में वृद्धि के घरेलू बजट पर प्रभाव को निर्धारित करना चाहती है। इसके लिए 30 घरों का एक प्रतिनिधि (यादृच्छिक) नमूना लेकर उसका अध्ययन करना होगा। उस क्षेत्र के सभी 300 घरों के नाम कागज पर लिखे जाते हैं और मिला दिए जाते हैं, फिर 30 नाम एक-एक करके साक्षात्कार के लिए चुने जाते हैं।

यादृच्छिक प्रतिदर्शन में, प्रत्येक व्यक्ति के चुने जाने की समान संभावना होती है। उपरोक्त उदाहरण में, जनसंख्या की सभी 300 प्रतिदर्श इकाइयों (जिन्हें प्रतिदर्श फ्रेम भी कहा जाता है) को 30 इकाइयों के नमूने में शामिल होने की समान संभावना मिली और इस प्रकार चुना गया नमूना एक यादृच्छिक नमूना है। इसे लॉटरी विधि भी कहा जाता है। आजकल यादृच्छिक नमूनों को चुनने के लिए कंप्यूटर कार्यक्रमों का उपयोग किया जाता है।

एग्जिट पोल

आपने देखा होगा कि जब चुनाव होता है, तो टेलीविजन नेटवर्क चुनाव कवरेज प्रदान करते हैं। वे परिणामों की भविष्यवाणी करने की भी कोशिश करते हैं। यह एग्जिट पोल के माध्यम से किया जाता है, जिसमें मतदान केंद्र से बाहर निकलने वाले मतदाताओं के एक यादृच्छिक नमूने से पूछा जाता है कि उन्होंने किसे वोट दिया है। मतदाताओं के नमूने के आंकड़ों से भविष्यवाणी की जाती है। आपने देखा होगा कि एग्जिट पोल हमेशा सही भविष्यवाणी नहीं करते। क्यों?

गतिविधि

आपको भारत में पिछले पचास वर्षों के खाद्यान्न उत्पादन के रुझान का विश्लेषण करना है। चूंकि सभी वर्षों के लिए आंकड़े इकट्ठा करना कठिन है, आपसे दस वर्षों के उत्पादन का एक नमूना चुनने को कहा गया है। यादृच्छिक संख्या सारणियों का उपयोग करके, आप अपने नमूने के वर्षों का चयन कैसे करेंगे?

गैर-यादृच्छिक प्रतिदर्श

ऐसी स्थिति हो सकती है कि आपको किसी क्षेत्र में 100 घरों में से 10 घरों का चयन करना है। आपको यह तय करना है कि कौन-सा घर चुनना है और कौन-से को छोड़ना है। आप सुविधाजनक रूप से स्थित घरों या उन घरों का चयन कर सकते हैं जो आपको या आपके मित्र को ज्ञात हैं। इस स्थिति में, आप 10 घरों के चयन में अपने विवेक (पूर्वाग्रह) का उपयोग कर रहे हैं। 100 में से 10 घरों का यह चयन यादृच्छिक चयन नहीं है। गैर-यादृच्छिक प्रतिदर्श विधि में जनसंख्या की सभी इकाइयों के चयनित होने की समान संभावना नहीं होती है और अन्वेषक की सुविधा या विवेक नमूने के चयन में महत्वपूर्ण भूमिका निभाता है। वे मुख्य रूप से विवेक, उद्देश्य, सुविधा या कोटे के आधार पर चुने जाते हैं और गैर-यादृच्छिक प्रतिदर्श होते हैं।

5. प्रतिदर्श और गैर-प्रतिदर्श त्रुटियाँ

प्रतिदर्श त्रुटियाँ

संख्यात्मक मानों वाली एक जनसंख्या के दो महत्वपूर्ण लक्षण होते हैं जो यहाँ प्रासंगिक हैं। पहला, केंद्रीय प्रवृत्ति जिसे माध्य, माध्यिका या बहुलक से मापा जा सकता है। दूसरा, विचरण, जिसे “मानक विचलन”, “माध्य विचलन”, “परास”, आदि की गणना करके मापा जा सकता है।

प्रतिदर्श का उद्देश्य जनसंख्या के प्राचलों का एक या अधिक अनुमान प्राप्त करना है। प्रतिदर्श त्रुटि से तात्पर्य प्रतिदर्श अनुमान और संगत जनसंख्या प्राचल (उदाहरण के लिए औसत आय आदि जनसंख्या के लक्षण का वास्तविक मान) के बीच के अंतर से है। इस प्रकार, जनसंख्या के किसी प्राचल के वास्तविक मान और उसके अनुमान (प्रतिदर्श से) के बीच का अंतर प्रतिदर्श त्रुटि है। बड़ा प्रतिदर्श लेकर प्रतिदर्श त्रुटि की मात्रा को कम किया जा सकता है।

उदाहरण

मान लीजिए मणिपुर के 5 किसानों की आय का मामला है। चर $\mathrm{x}$ (किसानों की आय) के मान 500, 550, $600,650,700$ हैं। हम देखते हैं कि $(500+550+600+650+700)$ $\div 5=3000 \div 5=600$ जनसंख्या औसत है।

अब, मान लीजिए हम दो व्यक्तियों का प्रतिदर्श चुनते हैं जहाँ $x$ के मान 500 और 600 हैं। प्रतिदर्श औसत $(500+600) \div 2$ $=1100 \div 2=550$ है।

यहाँ, अनुमान की प्रतिदर्श त्रुटि $=600$ (वास्तविक मान) -550 (अनुमान) $=50$ है।

गैर-प्रतिदर्श त्रुटियाँ

गैर-प्रतिदर्श त्रुटियाँ प्रतिदर्श त्रुटियों से अधिक गंभीर होती हैं क्योंकि प्रतिदर्श त्रुटि को बड़ा प्रतिदर्श लेकर कम किया जा सकता है। गैर-प्रतिदर्श त्रुटि को कम करना कठिन होता है, यहाँ तक कि बड़ा प्रतिदर्श लेने पर भी। एक जनगणना भी गैर-प्रतिदर्श त्रुटियों को समाहित कर सकती है। कुछ गैर-प्रतिदर्श त्रुटियाँ इस प्रकार हैं:

प्रतिदर्श पूर्वाग्रह

प्रतिदर्श पूर्वाग्रह तब होता है जब प्रतिदर्श योजना ऐसी हो कि लक्षित जनसंख्या के कुछ सदस्यों का समावेश प्रतिदर्श में संभव ही न हो।

अ-प्रतिक्रिया त्रुटियाँ

अ-प्रतिक्रिया तब होती है यदि साक्षात्कारकर्ता प्रतिदर्श में सूचीबद्ध किसी व्यक्ति से संपर्क नहीं कर पाता या प्रतिदर्श से लिया गया व्यक्ति प्रतिक्रिया देने से इनकार कर देता है। इस स्थिति में, प्रतिदर्श प्रेक्षण प्रतिनिधिक नहीं हो सकता।

आंकड़ा अर्जन में त्रुटियाँ

इस प्रकार की त्रुटि गलत प्रतिक्रियाओं के अभिलेखन से उत्पन्न होती है। मान लीजिए, शिक्षक छात्रों से कक्षा में शिक्षक की मेज की लंबाई मापने को कहता है। छात्रों द्वारा माप भिन्न हो सकती है। अंतर मापने वाली फीता में अंतर, छात्रों की लापरवाही आदि के कारण हो सकते हैं। इसी प्रकार, मान लीजिए हम संतरों की कीमतों पर आंकड़े इकट्ठा करना चाहते हैं। हम जानते हैं कि कीमतें दुकान से दुकान और बाजार से बाजार भिन्न होती हैं। कीमतें गुणवत्ता के अनुसार भी भिन्न होती हैं। इसलिए, हम केवल औसत कीमतों पर विचार कर सकते हैं। अभिलेखन त्रुटियाँ भी हो सकती हैं क्योंकि गणनाकार या उत्तरदाता आंकड़ों के अभिलेखन या प्रतिलेखन में त्रुटि कर सकते हैं, उदाहरण के लिए, वह 31 के बजाय 13 अभिलेखित कर सकता है।

6. भारत की जनगणना और NSSO

राष्ट्रीय और राज्य स्तर पर कुछ एजेंसियाँ हैं जो सांख्यिकीय आँकड़ों को एकत्र, प्रक्रमित और सारणीबद्ध करती हैं। राष्ट्रीय स्तर की कुछ एजेंसियाँ हैं भारत की जनगणना, राष्ट्रीय नमूना सर्वेक्षण (NSS), केंद्रीय सांख्यिकी कार्यालय (CSO), भारत के रजिस्ट्रार जनरल (RGI), व्यापारिक खुफिया और सांख्यिकी महानिदेशालय (DGCIS), श्रम ब्यूरो आदि।

भारत की जनगणना जनसंख्या का सबसे पूर्ण और निरंतर जनसांख्यिकीय अभिलेख प्रदान करती है। जनगणना 1881 से नियमित रूप से हर दस वर्ष में आयोजित की जाती रही है। स्वतंत्रता के बाद पहली जनगणना 1951 में आयोजित की गई थी। जनगणना अधिकारी जनसंख्या के विभिन्न पहलुओं जैसे आकार, घनत्व, लिंग अनुपात, साक्षरता, प्रवास, ग्रामीण-शहरी वितरण आदि की जानकारी एकत्र करते हैं। जनगणना के आँकड़ों की व्याख्या और विश्लेषण भारत में कई आर्थिक और सामाजिक मुद्दों को समझने के लिए किया जाता है।

एनएसएस (NSS) को भारत सरकार द्वारा सामाजिक-आर्थिक मुद्दों पर देशव्यापी सर्वेक्षण करने के लिए स्थापित किया गया था। एनएसएस लगातार क्रमिक दौरों में सर्वेक्षण करता है। एनएसएस द्वारा एकत्रित आंकड़े रिपोर्टों और इसकी त्रैमासिक पत्रिका सर्वेक्षण के माध्यम से जारी किए जाते हैं। एनएसएस साक्षरता, स्कूल नामांकन, शैक्षिक सेवाओं के उपयोग, रोजगार, बेरोजगारी, विनिर्माण और सेवा क्षेत्र के उद्यमों, रोगग्रस्तता, प्रसूति, बाल देखभाल, सार्वजनिक वितरण प्रणाली के उपयोग आदि के आवधिक अनुमान प्रदान करता है। एनएसएस का 60वां दौर सर्वेक्षण (जनवरी-जून 2004) रोगग्रस्तता और स्वास्थ्य सेवा पर था। एनएसएस का 68वां दौर सर्वेक्षण (2011-12) उपभोक्ता व्यय पर था। एनएसएस विभिन्न वस्तुओं के औद्योगिक गतिविधियों और खुदरा मूल्यों का विवरण भी एकत्र करता है। इनका उपयोग भारत सरकार योजना बनाने के उद्देश्यों के लिए करती है।

7. निष्कर्ष

आर्थिक तथ्य, जब संख्याओं के रूप में व्यक्त किए जाते हैं, तो उन्हें आंकड़े कहा जाता है। आंकड़े एकत्र करने का उद्देश्य किसी समस्या और उसके पीछे के कारणों को समझना, समझाना और विश्लेषण करना होता है। प्राथमिक आंकड़े किसी सर्वेक्षण करके प्राप्त किए जाते हैं। सर्वेक्षण में विभिन्न चरण शामिल होते हैं, जिनकी सावधानीपूर्वक योजना बनाने की आवश्यकता होती है। विभिन्न एजेंसियां हैं जो सांख्यिकीय आंकड़ों को एकत्रित, संसाधित, सारणीबद्ध और प्रकाशित करती हैं। इनका उपयोग द्वितीयक आंकड़ों के रूप में किया जाता है। हालांकि, आंकड़ों के स्रोत और आंकड़े एकत्र करने की विधि का चयन अध्ययन के उद्देश्य पर निर्भर करता है।

सारांश

डेटा एक ऐसा उपकरण है जो किसी भी समस्या पर उचित निष्कर्ष तक पहुँचने में मदद करता है।
प्राथमिक डेटा प्रथम-पक्ष की जानकारी पर आधारित होता है।
सर्वेक्षण व्यक्तिगत साक्षात्कार, प्रश्नावली भेजने और टेलीफोन साक्षात्कार द्वारा किया जा सकता है।
जनगणना जनसंख्या से संबंधित प्रत्येक व्यक्ति/इकाई को सम्मिलित करती है।
नमूना जनसंख्या से चयनित एक छोटा समूह है जिससे संबंधित जानकारी प्राप्त की जाती है।
यादृच्छिक नमूनाकरण में प्रत्येक व्यक्ति को जानकारी देने के लिए चयनित होने का समान अवसर दिया जाता है।
नमूनाकरण त्रुटि नमूना अनुमान के मान और संबंधित जनसंख्या प्राचल के मान के अंतर के कारण होती है।
गैर-नमूनाकरण त्रुटियाँ आँकड़ा अर्जन, अप्रतिसाद या चयन में पूर्वाग्रह के कारण उत्पन्न हो सकती हैं।
भारत की जनगणना और राष्ट्रीय नमूना सर्वेक्षण दो महत्वपूर्ण राष्ट्रीय स्तरीय एजेंसियाँ हैं जो कई महत्वपूर्ण आर्थिक और सामाजिक मुद्दों पर आँकड़े एकत्रित, संसाधित और सारणीबद्ध करती हैं।

अभ्यास

1. निम्नलिखित प्रश्नों के लिए कम-से-कम चार उपयुक्त बहुविकल्पी विकल्प बनाइए:

(i) जब आप एक नया पोशाक खरीदते हैं तो निम्नलिखित में से सबसे महत्वपूर्ण क्या है?

(ii) आप कितनी बार कंप्यूटर का उपयोग करते हैं?

(iii) आप नियमित रूप से कौन-सा समाचार-पत्र पढ़ते हैं?

(iv) पेट्रोल की कीमत में वृद्धि उचित है।

(v) आपके परिवार की मासिक आय कितनी है?

2. पाँच द्वि-मार्गी प्रश्न (‘हाँ’ या ‘नहीं’) बनाइए।

3. निम्नलिखित कथनों को सत्य या असत्य बताइए।

(i) डेटा के कई स्रोत होते हैं।

(ii) जब जनसंख्या साक्षर हो और एक बड़े क्षेत्र में फैली हो, तो टेलीफोन सर्वेक्षण आंकड़े एकत्र करने की सबसे उपयुक्त विधि होती है।

(iii) जांचकर्ता द्वारा एकत्र किए गए आंकड़ों को द्वितीयक आंकड़े कहा जाता है।

(iv) प्रतिदर्शों के यादृच्छिक चयन के बिना चयन में एक निश्चित पूर्वाग्रह शामिल होता है।

(v) गैर-प्रतिदर्श त्रुटियों को बड़े प्रतिदर्श लेकर न्यूनतम किया जा सकता है।

4. आप निम्नलिखित प्रश्नों के बारे में क्या सोचते हैं? क्या आपको इन प्रश्नों में कोई समस्या दिखती है? वर्णन कीजिए।

(i) आप सबसे निकटतम बाजार से कितनी दूर रहते हैं?

(ii) यदि प्लास्टिक थैलियाँ हमारे कूड़े-कचरे का केवल 5 प्रतिशत हैं, तो क्या उन्हें प्रतिबंधित किया जाना चाहिए?

(iii) क्या आप पेट्रोल की कीमत में वृद्धि के विरोधी नहीं होंगे?

(iv) क्या आप रासायनिक उर्वरकों के उपयोग से सहमत हैं?

(v) क्या आप अपने खेतों में उर्वरकों का उपयोग करते हैं?

(vi) आपके खेत में प्रति हेक्टेयर उपज क्या है?

5. आप बच्चों के बीच वेजिटेबल अट्टा नूडल्स की लोकप्रियता पर शोध करना चाहते हैं। इस जानकारी को एकत्र करने के लिए एक उपयुक्त प्रश्नावली तैयार कीजिए।

6. 200 खेतों वाले एक गाँव में फसलों की प्रणाली जानने के लिए एक अध्ययन किया गया। सर्वेक्षण किए गए 50 खेतों में से 50% केवल गेहूँ उगाते थे। जनसंख्या और प्रतिदर्श आकार क्या है?

7. प्रतिदर्श, जनसंख्या और चर के दो-दो उदाहरण दीजिए।

8. निम्नलिखित में से कौन-सी विधि बेहतर परिणाम देती है और क्यों?

(a) जनगणना

(b) प्रतिदर्श

9. निम्नलिखित में से कौन-सी त्रुटि अधिक गंभीर है और क्यों?

(a) प्रतिदर्श त्रुटि

(b) गैर-प्रतिदर्श त्रुटि

10. मान लीजिए आपकी कक्षा में 10 विद्यार्थी हैं। आप उनमें से तीन को चुनना चाहते हैं। कितने नमूने संभव हैं?

11. चर्चा कीजिए कि आप 10 में से 3 विद्यार्थियों को चुनने के लिए लॉटरी विधि का उपयोग कैसे करेंगे।

12. क्या लॉटरी विधि हमेशा आपको एक यादृच्छिक नमूना देती है? समझाइए।

13. यादृच्छिक संख्या सारणियों का उपयोग करके 10 में से 3 विद्यार्थियों के एक यादृच्छिक नमूने के चयन की प्रक्रिया समझाइए।

14. क्या नमूने सर्वेक्षणों की तुलना में बेहतर परिणाम देते हैं? अपने उत्तर के कारण दीजिए।

अध्याय 02 आंकड़ों का संग्रह

1. परिचय

2. डेटा के स्रोत क्या हैं?

3. हम डेटा कैसे एकत्रित करते हैं?

उपकरण की तैयारी

आँकड़ों संग्रह की विधि

पायलट सर्वेक्षण

4. जनगणना और प्रतिदर्श सर्वेक्षण

जनगणना या पूर्ण गणना

जनसंख्या और प्रतिदर्श

यादृच्छिक प्रतिदर्शन

गैर-यादृच्छिक प्रतिदर्श

5. प्रतिदर्श और गैर-प्रतिदर्श त्रुटियाँ

प्रतिदर्श त्रुटियाँ

गैर-प्रतिदर्श त्रुटियाँ

6. भारत की जनगणना और NSSO

7. निष्कर्ष

अभ्यास

CUET Preparation

Exam Pattern

International Students

NCERT Books

Important Resources

Forum