SATHEE: Chapter 02 Collection of Data

अध्याय 02 आंकड़ों का संग्रह

1. परिचय

पिछले अध्याय में आपने अर्थशास्त्र क्या है, इसके बारे में पढ़ा है। आपने अर्थशास्त्र में सांख्यिकी की भूमिका और महत्व के बारे में भी अध्ययन किया है। इस अध्याय में आप डेटा के स्रोतों और डेटा संग्रह की विधि के बारे में पढ़ेंगे। डेटा संग्रह का उद्देश्य किसी समस्या के समाधान के लिए ठोस और स्पष्ट प्रमाण प्रस्तुत करना है।

अर्थशास्त्र में आप अक्सर इस तरह के कथन से सामना करते हैं,

“कई उतार-चढ़ावों के बाद खाद्यान्न का उत्पादन 1970-71 में 108 मिलियन टन से बढ़कर 1978-79 में 132 मिलियन टन हो गया, लेकिन 1979-80 में फिर घटकर 108 मिलियन टन रह गया। खाद्यान्न का उत्पादन फिर लगातार बढ़ता रहा और 2015-16 में 252 मिलियन टन तथा 2016-17 में 272 मिलियन टन तक पहुँच गया।”

इस कथन में आप देख सकते हैं कि विभिन्न वर्षों में खाद्यान्न का उत्पादन समान नहीं रहता है। यह वर्ष दर वर्ष और फसल दर फसल बदलता रहता है। चूँकि ये मान बदलते हैं, इन्हें चर कहा जाता है। चरों को आमतौर पर अक्षरों $\mathrm{X}, \mathrm{Y}$ या $\mathrm{Z}$ से दर्शाया जाता है। किसी चर का प्रत्येक मान एक प्रेक्षण होता है। उदाहरण के लिए, भारत में खाद्यान्न का उत्पादन निम्नलिखित सारणी में दिखाए अनुसार 1970-71 में 108 मिलियन टन से लेकर 2016-17 में 272 मिलियन टन तक बदलता रहा है। वर्षों को चर $X$ और भारत में खाद्यान्न का उत्पादन (मिलियन टन में) को चर $Y$ से दर्शाया गया है।

सारणी 2.1 भारत में खाद्यान्न का उत्पादन (मिलियन टन)

X	Y
1970-71	108
1978-79	132
1990-91	176
1997-98	194
2001-02	212
2015-16	252
2016-17	272

यहाँ इन चरों $X$ और $Y$ के मान ‘डेटा’ हैं, जिनसे हम भारत में खाद्यान्न उत्पादन के बारे में जानकारी प्राप्त कर सकते हैं। खाद्यान्न उत्पादन में उतार-चढ़ाव को जानने के लिए हमें विभिन्न वर्षों के लिए भारत में खाद्यान्न उत्पादन का ‘डेटा’ चाहिए। ‘डेटा’ एक उपकरण है जो जानकारी प्रदान करके समस्याओं को समझने में मदद करता है।

आप सोच रहे होंगे कि ‘डेटा’ आता कहाँ से है और हम इन्हें इकट्ठा कैसे करते हैं? आगे आने वाले खंडों में हम डेटा के प्रकारों, डेटा संग्रह की विधियों और उपकरणों तथा डेटा प्राप्त करने के स्रोतों पर चर्चा करेंगे।

2. डेटा के स्रोत क्या हैं?

सांख्यिकीय डेटा दो स्रोतों से प्राप्त किया जा सकता है। शोधकर्ता किसी पूछताछ आयोजित करके डेटा इकट्ठा कर सकता है। ऐसे डेटा को प्राथमिक डेटा कहा जाता है, क्योंकि ये प्रथम-हस्त जानकारी पर आधारित होते हैं। मान लीजिए आप किसी फिल्म स्टार की स्कूली छात्रों में लोकप्रियता के बारे में जानना चाहते हैं। इसके लिए आपको बड़ी संख्या में स्कूली छात्रों से पूछताछ करनी होगी, उनसे प्रश्न पूछकर वांछित जानकारी इकट्ठा करनी होगी। आपको जो डेटा मिलता है, वह प्राथमिक डेटा का एक उदाहरण है।

यदि डेटा किसी अन्य एजेंसी द्वारा एकत्रित और संसाधित (जांचा और सारणीबद्ध) किया गया है, तो उन्हें द्वितीयक डेटा कहा जाता है। इन्हें या तो प्रकाशित स्रोतों जैसे सरकारी रिपोर्टों, दस्तावेजों, समाचार पत्रों, अर्थशास्त्रियों द्वारा लिखी गई पुस्तकों से प्राप्त किया जा सकता है या किसी अन्य स्रोत से, उदाहरण के लिए, एक वेबसाइट से। इस प्रकार, डेटा उस स्रोत के लिए प्राथमिक होते हैं जो उन्हें पहली बार एकत्रित और संसाधित करता है और द्वितीयक उन सभी स्रोतों के लिए होते हैं जो बाद में ऐसे डेटा का उपयोग करते हैं। द्वितीयक डेटा के उपयोग से समय और लागत की बचत होती है। उदाहरण के लिए, छात्रों के बीच फिल्म स्टार की लोकप्रियता पर डेटा एकत्रित करने के बाद, आप एक रिपोर्ट प्रकाशित करते हैं। यदि कोई व्यक्ति समान अध्ययन के लिए आपके द्वारा एकत्रित डेटा का उपयोग करता है, तो वह द्वितीयक डेटा बन जाता है।

3. हम डेटा कैसे एकत्रित करते हैं?

क्या आप जानते हैं कि कोई निर्माता किसी उत्पाद के बारे में कैसे निर्णय लेता है या कोई राजनीतिक दल उम्मीदवार के बारे में कैसे निर्णय लेता है? वे एक बड़े समूह से किसी विशेष उत्पाद या उम्मीदवार के बारे में प्रश्न पूछकर सर्वेक्षण करते हैं। सर्वेक्षणों का उद्देश्य कुछ विशेषताओं का वर्णन करना होता है जैसे मूल्य, गुणवत्ता, उपयोगिता (उत्पाद के मामले में) और लोकप्रियता, ईमानदारी, निष्ठा (उम्मीदवार के मामले में)। सर्वेक्षण का उद्देश्य डेटा एकत्रित करना है। सर्वेक्षण व्यक्तियों से जानकारी एकत्रित करने की एक विधि है।

उपकरण की तैयारी

सर्वेक्षणों में प्रयोग किए जाने वाला सबसे सामान्य उपकरण प्रश्नावली/साक्षात्कार अनुसूची होता है। प्रश्नावली या तो उत्तरदाता स्वयं भरता है या फिर शोधकर्ता (गणक) या प्रशिक्षित अन्वेषक द्वारा भरवाई जाती है। प्रश्नावली/साक्षात्कार अनुसूची तैयार करते समय आपको निम्नलिखित बातों का ध्यान रखना चाहिए;

प्रश्नावली अत्यधिक लंबी नहीं होनी चाहिए। प्रश्नों की संख्या यथासंभव न्यूनतम होनी चाहिए।

प्रश्नावली सरल होनी चाहिए और अस्पष्ट या कठिन शब्दों से बचना चाहिए।

प्रश्नों को ऐसे क्रम में व्यवस्थित करना चाहिए ताकि उत्तर देने वाला व्यक्ति सहज महसूस करे।
प्रश्नों की श्रेणी सामान्य से विशिष्ट की ओर बढ़नी चाहिए। प्रश्नावली सामान्य प्रश्नों से शुरू होकर अधिक विशिष्ट प्रश्नों की ओर आगे बढ़नी चाहिए। उदाहरण के लिए:

खराब $Q$

(i) बिजली के शुल्क में वृद्धि उचित है?

(ii) क्या आपके क्षेत्र में बिजली की आपूर्ति नियमित है?

अच्छा $Q$

(i) क्या आपके क्षेत्र में बिजली की आपूर्ति नियमित है?

(ii) बिजली के शुल्क में वृद्धि उचित है?

प्रश्न सटीक और स्पष्ट होने चाहिए। उदाहरण के लिए,

खराब $Q$

प्रस्तुतशील दिखने के लिए आप अपनी आय का कितना प्रतिशत कपड़ों पर खर्च करते हैं?

अच्छा $Q$

आप अपनी आय का कितना प्रतिशत कपड़ों पर खर्च करते हैं?

प्रश्न अस्पष्ट नहीं होने चाहिए। उन्हें उत्तरदाताओं को तेजी से, सही और स्पष्ट रूप से उत्तर देने में सक्षम बनाना चाहिए। उदाहरण के लिए:

खराब $Q$

क्या आप एक महीने में किताबों पर बहुत पैसा खर्च करते हैं?

अच्छा $Q$

(उपयुक्त विकल्प पर टिक लगाएं)

आप महीने में कितना खर्च करते हैं किताबों पर?

(i) ₹200 से कम

(ii) ₹200-300

(iii) ₹300-400

(iv) ₹400 से अधिक

प्रश्न में दोहला नकार नहीं होना चाहिए। “क्या आप नहीं” या “क्या आपको नहीं लगता” से शुरू होने वाले प्रश्नों से बचना चाहिए, क्योंकि वे पूर्वाग्रहित उत्तर दे सकते हैं। उदाहरण:

खराब $Q$

क्या आपको नहीं लगता कि धूम्रपान पर प्रतिबंध होना चाहिए?

अच्छा $Q$

क्या आपको लगता है कि धूम्रपान पर प्रतिबंध होना चाहिए?

प्रश्न मार्गदर्शक (leading) नहीं होना चाहिए, जो उत्तरदाता को यह संकेत दे कि उसे कैसे उत्तर देना है। उदाहरण:

खराब $Q$

आपको इस उच्च गुणवत्ता वाली चाय का स्वाद कैसा लगा?

अच्छा $Q$

आपको इस चाय का स्वाद कैसा लगा?

प्रश्न में उत्तर के विकल्पों का संकेत नहीं देना चाहिए। उदाहरण:

खराब $Q$

क्या आप कॉलेज के बाद नौकरी करना चाहेंगी या गृहिणी बनना?

अच्छा $Q$

कॉलेज के बाद आप क्या करना चाहेंगी?

प्रश्नावली बंद-अंत वाले (या संरचित) प्रश्नों या खुले-अंत वाले (या असंरचित) प्रश्नों से बनी हो सकती है। उपरोक्त प्रश्न—जिसमें पूछा गया कि विद्यार्थी कॉलेज के बाद क्या करना चाहता है—एक खुला-अंत वाला प्रश्न है।

बंद-अंत या संरचित प्रश्न या तो दो-उत्तरीय हो सकते हैं या बहु-विकल्पीय। जब केवल दो संभावित उत्तर हों, ‘हाँ’ या ‘नहीं’, तो उसे दो-उत्तरीय प्रश्न कहा जाता है।

जब दो से अधिक विकल्प संभव हों, तो बहु-विकल्पीय प्रश्न अधिक उपयुक्त होते हैं। उदाहरण,

प्र. आपने अपनी ज़मीन क्यों बेची?

(i) कर्ज़ चुकाने के लिए।

(ii) बच्चों की शिक्षा के लिए।

(iii) किसी अन्य संपत्ति में निवेश करने के लिए।

(iv) कोई अन्य (कृपया निर्दिष्ट करें)।

बंद-समाप्त प्रश्नों का उपयोग करना, अंक देना और विश्लेषण के लिए कोडबद्ध करना आसान होता है, क्योंकि सभी उत्तरदाता दिए गए विकल्पों में से चयन कर सकते हैं। लेकिन इन्हें लिखना कठिन होता है क्योंकि विकल्पों को स्पष्ट रूप से लिखा जाना चाहिए ताकि वे मुद्दे के दोनों पक्षों को दर्शा सकें। यह भी संभावना है कि किसी व्यक्ति की वास्तविक प्रतिक्रिया दिए गए विकल्पों में मौजूद न हो। इसके लिए ‘कोई अन्य’ का विकल्प दिया गया है, जहाँ उत्तरदाता ऐसी प्रतिक्रिया लिख सकता है जिसकी अनुसंधानकर्ता ने कल्पना नहीं की थी। इसके अतिरिक्त, बहुविकल्पी प्रश्नों की एक और सीमा यह है कि ये विकल्प प्रदान करके उत्तरों को सीमित कर देते हैं, जिनके बिना शायद उत्तरदाता कुछ और उत्तर देते।

खुले-समाप्त प्रश्न अधिक व्यक्तिगत उत्तरों की अनुमति देते हैं, लेकिन इनकी व्याख्या करना कठिन होता है और इनका मूल्यांकन भी कठिन होता है, क्योंकि उत्तरों में बहुत विविधता होती है। उदाहरण,

प्र. वैश्वीकरण के बारे में आपका क्या दृष्टिकोण है?

आंकड़ों संग्रह की विधि

क्या आपने कभी कोई टेलीविज़न शो देखा है जिसमें रिपोर्टर बच्चों, गृहिणियों या आम जनता से उनकी परीक्षा प्रदर्शन या साबुन की किसी ब्रांड या किसी राजनीतिक दल के बारे में प्रश्न पूछते हैं? प्रश्न पूछने का उद्देश्य सर्वेक्षण करके आंकड़े एकत्र करना होता है। आंकड़े एकत्र करने के तीन मूलभूत तरीके हैं: (i) व्यक्तिगत साक्षात्कार, (ii) डाक (प्रश्नावली) सर्वेक्षण, और (iii) टेलीफोन साक्षात्कार।

व्यक्तिगत साक्षात्कार

यह विधि तब प्रयोग की जाती है जब शोधकर्ता को सभी सदस्यों तक पहुंच होती है। शोधकर्ता (या अन्वेषक) उत्तरदाताओं के साथ आमने-सामने साक्षात्कार करता है।

व्यक्तिगत साक्षात्कार विभिन्न कारणों से पसंद किए जाते हैं। उत्तरदाता और साक्षात्कारकर्ता के बीच व्यक्तिगत संपर्क स्थापित होता है। साक्षात्कारकर्ता को अध्ययन की व्याख्या करने और उत्तरदाताओं के प्रश्नों के उत्तर देने का अवसर मिलता है। साक्षात्कारकर्ता उत्तरदाता से विशेष रूप से महत्वपूर्ण उत्तरों का विस्तार करने का अनुरोध कर सकता है। गलत व्याख्या और गलतफहमी से बचा जा सकता है। उत्तरदाताओं की प्रतिक्रियाओं को देखने से अतिरिक्त जानकारी प्राप्त हो सकती है।

व्यक्तिगत साक्षात्कार के कुछ नुकसान भी हैं। यह महंगा होता है, क्योंकि इसमें प्रशिक्षित साक्षात्कारकर्ताओं की आवश्यकता होती है। सर्वे को पूरा करने में अधिक समय लगता है। शोधकर्ता की उपस्थिति उत्तरदाताओं को वह कहने से रोक सकती है जो वे वास्तव में सोचते हैं।

मेल प्रश्नावली

जब किसी सर्वेक्षण में डेटा डाक द्वारा एकत्र किया जाता है, तो प्रत्येक व्यक्ति को डाक द्वारा एक प्रश्नावली भेजी जाती है और उसे एक निश्चित तिथि तक भरकर वापस भेजने का अनुरोध किया जाता है। इस विधि के लाभ यह हैं कि यह कम खर्चीली होती है। यह शोधकर्ता को दूरदराज के क्षेत्रों के लोगों तक भी पहुंचने की अनुमति देती है, जिन तक व्यक्तिगत रूप से या टेलीफोन द्वारा पहुंचना कठिन हो सकता है। यह साक्षात्कारकर्ता द्वारा उत्तरदाताओं को प्रभावित करने की अनुमति नहीं देता। यह उत्तरदाताओं को प्रश्नों के बारे में विचारपूर्ण उत्तर देने के लिए पर्याप्त समय लेने की भी अनुमति देता है।

इन दिनों ऑनलाइन सर्वेक्षण या लघु संदेश सेवा, अर्थात् SMS के माध्यम से सर्वेक्षण लोकप्रिय हैं। क्या आप जानते हैं कि ऑनलाइन सर्वेक्षण कैसे आयोजित किया जाता है?

डाक सर्वेक्षण के नुकसान यह हैं कि निर्देशों को स्पष्ट करने में सहायता प्रदान करने के कम अवसर होते हैं, इसलिए प्रश्नों को गलत समझने की संभावना होती है। डाक द्वारा सर्वेक्षण करने से कुछ कारकों के कारण कम प्रतिक्रिया दर मिलने की संभावना भी होती है, जैसे कि प्रश्नावली को भरकर वापस न भेजना, प्रश्नावली को बिल्कुल वापस न भेजना, डाक में ही प्रश्नावली के खो जाने आदि।

टेलीफोन साक्षात्कार

टेलीफोन साक्षात्कार में, अन्वेषक टेलीफोन पर प्रश्न पूछता है।
टेलीफोन साक्षात्कार के लाभ यह हैं कि ये व्यक्तिगत साक्षात्कार की तुलना में सस्ते होते हैं और कम समय में आयोजित किए जा सकते हैं।
ये शोधकर्ता को प्रतिवादी को प्रश्नों को स्पष्ट करके सहायता करने की अनुमति देते हैं।
टेलीफोनिक साक्षात्कार उन स्थितियों में बेहतर होता है जहाँ प्रतिवादी व्यक्तिगत साक्षात्कार में कुछ प्रश्नों का उत्तर देने में अनिच्छुक होते हैं।

इस विधि का नुकसान लोगों तक पहुँच है, क्योंकि बहुत से लोगों के पास टेलीफोन नहीं हो सकता है।

पायलट सर्वेक्षण

एक बार जब प्रश्नावली तैयार हो जाती है, तो एक छोटे समूह के साथ इसका प्रयास करना उचित होता है, जिसे पायलट सर्वेक्षण या प्रश्नावली की पूर्व-परीक्षण कहा जाता है।
पायलट सर्वेक्षण सर्वेक्षण के बारे में प्रारंभिक विचार प्रदान करने में सहायक होता है।
यह प्रश्नावली की पूर्व-परीक्षण में सहायक होता है, ताकि प्रश्नों की कमियों और खामियों को जाना जा सके।
पायलट सर्वेक्षण प्रश्नों की उपयुक्तता, निर्देशों की स्पष्टता, गणनाकारकों के प्रदर्शन और वास्तविक सर्वेक्षण में लगने वाले समय और लागत का आकलन करने में भी सहायक होता है।

गतिविधियाँ

आपको भारत के एक दूरदराज गाँव में रहने वाले व्यक्ति से जानकारी एकत्र करनी है।
डेटा संग्रह की कौन-सी विधि उपयुक्त होगी और क्यों? चर्चा करें।

आपको एक विद्यालय में शिक्षण की गुणवत्ता के बारे में अभिभावकों का साक्षात्कार करना है।
यदि विद्यालय का प्रधानाचार्य वहाँ मौजूद हो, तो किस प्रकार की समस्याएँ उत्पन्न हो सकती हैं?

4. जनगणना और प्रतिदर्श सर्वेक्षण

जनगणना या पूर्ण गणना

एक सर्वेक्षण, जिसमें जनसंख्या के प्रत्येक तत्व को शामिल किया जाता है, को जनगणना या पूर्ण गणना की विधि के रूप में जाना जाता है। यदि कुछ एजेंसियाँ भारत में कुल जनसंख्या का अध्ययन करने में रुचि रखती हैं, तो उन्हें ग्रामीण और शहरी भारत के सभी घरों से जानकारी प्राप्त करनी होती है। यह हर दस वर्ष में आयोजित किया जाता है। घर-घर जाकर पूछताछ की जाती है, जिसमें भारत के सभी घरों को शामिल किया जाता है। जन्म और मृत्यु दर, साक्षरता, रोजगार, जीवन प्रत्याशा, जनसंख्या का आकार और संरचना आदि पर जनसांख्यिकीय आंकडे भारत के रजिस्ट्रार जनरल द्वारा एकत्रित और प्रकाशित किए जाते हैं। भारत की अंतिम जनगणना 2011 में आयोजित की गई थी।

जनगणना 2011 के अनुसार, भारत की जनसंख्या 121.09 करोड़ थी, जो 2001 में 102.87 करोड़ थी। जनगणना 1901 से संकेत मिलता है कि देश की जनसंख्या 23.83 करोड़ थी। तब से, 110 वर्षों की अवधि में, देश की जनसंख्या में 97 करोड़ से अधिक की वृद्धि हुई है। जनसंख्या की औसत वार्षिक वृद्धि दर जो 1971-81 के दशक में प्रति वर्ष 2.2 प्रतिशत थी, वह 1991-2001 में घटकर 1.97 प्रतिशत और 2001-2011 के दौरान 1.64 प्रतिशत हो गई।

जनसंख्या और नमूना

सांख्यिकी में जनसंख्या या ब्रह्मांड का अर्थ उन वस्तुओं की कुलता है जिनका अध्ययन किया जा रहा है। इस प्रकार, जनसंख्या या ब्रह्मांड वह समूह है जिस पर अध्ययन के परिणाम लागू होने का इरादा होता है। एक जनसंख्या हमेशा वे सभी व्यक्ति/वस्तुएँ होती हैं जो सर्वेक्षण के उद्देश्य के अनुसार कुछ विशेषताएँ (या विशेषताओं का एक समूह) रखती हैं। नमूना चुनने का पहला कार्य जनसंख्या की पहचान करना है। एक बार जनसंख्या की पहचान हो जाने पर, शोधकर्ता उसका अध्ययन करने की विधि चुनता है। यदि शोधकर्ता पाता है कि पूरी जनसंख्या का सर्वेक्षण संभव नहीं है, तो वह एक प्रतिनिधि नमूना चुनने का निर्णय ले सकता है। नमूना उस समूह या खंड को संदर्भित करता है जो जनसंख्या से है और जिससे सूचना प्राप्त की जानी है। एक अच्छा नमूना (प्रतिनिधि नमूना) आमतौर पर जनसंख्या से छोटा होता है और बहुत कम लागत और कम समय में जनसंख्या के बारे में उचित रूप से सटीक सूचना देने में सक्षम होता है।

मान लीजिए आप किसी निश्चित क्षेत्र के लोगों की औसत आय का अध्ययन करना चाहते हैं। जनगणना विधि के अनुसार, आपको उस क्षेत्र के प्रत्येक व्यक्ति की आय ज्ञात करनी होगी, उन्हें जोड़ना होगा और व्यक्तियों की संख्या से विभाजित करना होगा ताकि उस क्षेत्र के लोगों की औसत आय प्राप्त हो सके। इस विधि में भारी व्यय की आवश्यकता होगी, क्योंकि बड़ी संख्या में गणनाकारों को नियोजित करना पड़ेगा। वैकल्पिक रूप से, आप उस क्षेत्र से कुछ व्यक्तियों का एक प्रतिनिधि नमूना चुनते हैं और उनकी आय ज्ञात करते हैं। चयनित व्यक्तियों समूह की औसत आय को पूरे क्षेत्र के व्यक्तियों की औसत आय के अनुमान के रूप में प्रयोग किया जाता है।

उदाहरण

अनुसंधान समस्या: मणिपुर के चुराचंदपुर जिले में कृषि श्रमिकों की आर्थिक स्थिति का अध्ययन करना।
जनसंख्या: चुराचंदपुर जिले के सभी कृषि श्रमिक।
नमूना: चुराचंदपुर जिले के कृषि श्रमिकों का दस प्रतिशत।

अधिकांश सर्वेक्षण नमूना सर्वेक्षण होते हैं। ये सांख्यिकी में कई कारणों से पसंद किए जाते हैं। एक नमूना कम लागत और कम समय में उचित रूप से विश्वसनीय और सटीक जानकारी प्रदान कर सकता है। चूंकि नमूने जनसंख्या से छोटे होते हैं, इसलिए गहन पूछताछ करके अधिक विस्तृत जानकारी एकत्र की जा सकती है। चूंकि हमें गणनाकारों की एक छोटी टीम की आवश्यकता होती है, इसलिए उन्हें प्रशिक्षित करना और उनके कार्य पर प्रभावी रूप से निगरानी रखना आसान होता है। अब प्रश्न यह है कि आप नमूना कैसे करते हैं? नमूनाकरण के दो मुख्य प्रकार होते हैं, यादृच्छिक और अ-यादृच्छिक।

गतिविधियाँ

भारत और चीन में अगली जनगणना किन वर्षों में होगी?

यदि आपको कक्षा XI की नई अर्थशास्त्र की पाठ्यपुस्तक के बारे में छात्रों की राय का अध्ययन करना है, तो आपकी जनसंख्या और नमूना क्या होंगे?

यदि कोई शोधकर्ता पंजाब में गेहूं की औसत पैदावार का अनुमान लगाना चाहता है, तो उसकी जनसंख्या और नमूना क्या होंगे?

निम्नलिखित विवरण उनके अंतर को स्पष्ट करेगा।

यादृच्छिक नमूनाकरण

जैसा कि नाम से स्पष्ट है, यादृच्छिक नमूनाकरण वह है जहाँ जनसंख्या से व्यक्तिगत इकाइयों (नमूने) को यादृच्छिक रूप से चुना जाता है। सरकार किसी विशेष क्षेत्र में पेट्रोल की कीमतों में वृद्धि के घरेलू बजट पर प्रभाव को निर्धारित करना चाहती है। इसके लिए, 30 घरों के एक प्रतिनिधि (यादृच्छिक) नमूने को लेकर अध्ययन किया जाना है। उस क्षेत्र के सभी 300 घरों के नाम कागज पर लिखे जाते हैं और मिलाए जाते हैं, फिर 30 नाम एक-एक करके साक्षात्कार के लिए चुने जाते हैं।

यादृच्छिक नमूनाकरण में, प्रत्येक व्यक्ति के चुने जाने की समान संभावना होती है। उपरोक्त उदाहरण में, जनसंख्या की सभी 300 नमूनाकरण इकाइयों (जिन्हें नमूनाकरण फ्रेम भी कहा जाता है) को 30 इकाइयों के नमूने में शामिल होने की समान संभावना मिली और इसलिए, इस प्रकार चुना गया नमूना एक यादृच्छिक नमूना है। इसे लॉटरी विधि भी कहा जाता है। आजकल यादृच्छिक नमूने चुनने के लिए कंप्यूटर प्रोग्रामों का उपयोग किया जाता है।

एग्ज़िट पोल्स

आपने देखा होगा कि जब कोई चुनाव होता है, तो टेलीविज़न नेटवर्क चुनाव कवरेज प्रदान करते हैं। वे परिणामों की भविष्यवाणी करने की भी कोशिश करते हैं। यह एग्ज़िट पोल्स के माध्यम से किया जाता है, जिसमें मतदान केंद्र से बाहर निकलने वाले मतदाताओं के एक यादृच्छिक नमूने से पूछा जाता है कि उन्होंने किसे वोट दिया है। मतदाताओं के इस नमूने के आंकड़ों से भविष्यवाणी की जाती है। आपने देखा होगा कि एग्ज़िट पोल्स हमेशा सही भविष्यवाणी नहीं करते। क्यों?

गतिविधि

आपको पिछले पचास वर्षों में भारत में खाद्यान्न उत्पादन की प्रवृत्ति का विश्लेषण करना है। चूंकि सभी वर्षों के लिए आंकड़े इकट्ठा करना कठिन है, आपसे दस वर्षों के उत्पादन का एक नमूना चुनने को कहा गया है। रैंडम नंबर टेबल्स का उपयोग करके आप अपने नमूने के वर्षों का चयन कैसे करेंगे?

गैर-यादृच्छिक प्रतिचयन

ऐसी स्थिति हो सकती है कि आपको किसी क्षेत्र में 100 घरों में से 10 घरों का चयन करना है। आपको यह तय करना है कि किस घर को चुनना है और किसे छोड़ना है। आप सुविधाजनक रूप से स्थित घरों या उन घरों का चयन कर सकते हैं जो आपको या आपके मित्र को ज्ञात हैं। इस स्थिति में, आप 10 घरों के चयन में अपने विवेक (पूर्वाग्रह) का उपयोग कर रहे हैं। 100 में से 10 घरों का चयन इस तरह से यादृच्छिक चयन नहीं है। गैर-यादृच्छिक प्रतिचयन विधि में जनसंख्या की सभी इकाइयों के चयनित होने का समान अवसर नहीं होता है और अन्वेषक की सुविधा या विवेक नमूने के चयन में एक महत्वपूर्ण भूमिका निभाता है। वे मुख्य रूप से विवेक, उद्देश्य, सुविधा या कोटा के आधार पर चुने जाते हैं और गैर-यादृच्छिक नमूने होते हैं।

5. प्रतिचयन और गैर-प्रतिचयन त्रुटियाँ

प्रतिचयन त्रुटियाँ

संख्यात्मक मानों वाली एक जनसंख्या में दो महत्वपूर्ण विशेषताएँ होती हैं जो यहाँ प्रासंगिक हैं। पहली, केंद्रीय प्रवृत्ति जिसे माध्य, माध्यिका या बहुलक द्वारा मापा जा सकता है। दूसरी, विचरण, जिसे “मानक विचलन”, “माध्य विचलन”, “परास”, आदि की गणना करके मापा जा सकता है।

नमूने का उद्देश्य जनसंख्या प्राचलों के एक या अधिक अनुमान प्राप्त करना है। प्रतिचयन त्रुटि नमूना अनुमान और संगत जनसंख्या प्राचल (उदाहरण के लिए औसत आय आदि जनसंख्या की विशेषता का वास्तविक मान) के बीच के अंतर को संदर्भित करती है। इस प्रकार, जनसंख्या के एक प्राचल के वास्तविक मान और उसके अनुमान (नमूने से) के बीच का अंतर प्रतिचयन त्रुटि है। बड़ा नमूना लेकर प्रतिचयन त्रुटि की मात्रा को कम किया जा सकता है।

उदाहरण

मणिपुर के 5 किसानों की आय के एक मामले पर विचार करें। चर $\mathrm{x}$ (किसानों की आय) में माप 500, 550, $600,650,700$ हैं। हम नोट करते हैं कि $(500+550+600+650+700)$ $\div 5=3000 \div 5=600$ की जनसंख्या औसत है।

अब, मान लीजिए हम दो व्यक्तियों का एक नमूना चुनते हैं जहाँ $x$ में 500 और 600 के माप हैं। नमूना औसत $(500+600) \div 2$ $=1100 \div 2=550$ है।

यहाँ, अनुमान की प्रतिचयन त्रुटि $=600$ (सत्य मान) -550 (अनुमान) $=50$ है।

गैर-प्रतिचयन त्रुटियाँ

गैर-प्रतिदर्श त्रुटियाँ प्रतिदर्श त्रुटियों से अधिक गंभीर होती हैं क्योंकि प्रतिदर्श त्रुटि को बड़ा प्रतिदर्श लेकर कम किया जा सकता है। गैर-प्रतिदर्श त्रुटि को बड़ा प्रतिदर्श लेकर भी कम करना कठिन होता है। एक जनगणना में भी गैर-प्रतिदर्श त्रुटियाँ हो सकती हैं। कुछ गैर-प्रतिदर्श त्रुटियाँ इस प्रकार हैं:

प्रतिदर्श पूर्वाग्रह

प्रतिदर्श पूर्वाग्रह तब होता है जब प्रतिदर्श योजना ऐसी हो कि लक्षित जनसंख्या के कुछ सदस्यों का समावेश प्रतिदर्श में संभव ही न हो।

अप्रतिसाद त्रुटियाँ

अप्रतिसाद तब होता है जब साक्षात्कारकर्ता प्रतिदर्श में सूचीबद्ध किसी व्यक्ति से संपर्क नहीं कर पाता या प्रतिदर्श से चुना व्यक्ति उत्तर देने से इनकार कर देता है। इस स्थिति में प्रतिदर्श प्रेक्षण प्रतिनिधि नहीं हो सकता।

आंकड़ा अर्जन में त्रुटियाँ

इस प्रकार की त्रुटि गलत उत्तरों के अभिलेखन से उत्पन्न होती है। मान लीजिए, शिक्षक छात्रों से कक्षा में शिक्षक की मेज की लंबाई मापने को कहता है। छात्रों द्वारा मापन भिन्न-भिन्न हो सकता है। अंतर मापक टेप में अंतर, छात्रों की लापरवाही आदि के कारण हो सकता है। इसी प्रकार, मान लीजिए हम संतरे की कीमतों पर आंकड़े इकट्ठा करना चाहते हैं। हम जानते हैं कि कीमतें दुकान से दुकान और बाजार से बाजार भिन्न होती हैं। कीमतें गुणवत्ता के अनुसार भी भिन्न होती हैं। इसलिए हम केवल औसत कीमतों पर विचार कर सकते हैं। अभिलेखन में गलतियाँ भी हो सकती हैं क्योंकि गणनाकार या उत्तरदाता आंकड़ों को अभिलेखित या ट्रांसक्राइब करते समय त्रुटि कर सकते हैं, उदाहरण के लिए, वह 31 के स्थान पर 13 अंकित कर सकता है।

6. भारत की जनगणना और एनएसएसओ

राष्ट्रीय और राज्य स्तर पर कुछ एजेंसियाँ हैं जो सांख्यिकीय आँकड़ों को एकत्र, प्रक्रमित और सारणीबद्ध करती हैं। राष्ट्रीय स्तर की कुछ एजेंसियाँ हैं भारत की जनगणना, राष्ट्रीय नमूना सर्वेक्षण (NSS), केंद्रीय सांख्यिकी कार्यालय (CSO), भारत के रजिस्ट्रार जनरल (RGI), व्यापारिक खुफिया और सांख्यिकी महानिदेशालय (DGCIS), श्रम ब्यूरो आदि।

भारत की जनगणना जनसंख्या का सबसे पूर्ण और निरंतर जनसांख्यिकीय अभिलेख प्रदान करती है। जनगणना 1881 से नियमित रूप से हर दस वर्ष में आयोजित की जाती रही है। स्वतंत्रता के बाद पहली जनगणना 1951 में आयोजित की गई थी। जनगणना अधिकारी जनसंख्या के विभिन्न पहलुओं जैसे आकार, घनत्व, लिंग अनुपात, साक्षरता, प्रवास, ग्रामीण-शहरी वितरण आदि की जानकारी एकत्र करते हैं। जनगणना के आँकड़ों की व्याख्या और विश्लेषण भारत में कई आर्थिक और सामाजिक मुद्दों को समझने के लिए किया जाता है।

NSS की स्थापना भारत सरकार ने सामाजिक-आर्थिक मुद्दों पर देशव्यापी सर्वेक्षण करने के लिए की थी। NSS लगातार क्रमिक दौरों में सर्वेक्षण करता है। NSS द्वारा एकत्रित आंकड़े रिपोर्टों और अपनी त्रैमासिक पत्रिका सर्वेक्षणा के माध्यम से जारी किए जाते हैं। NSS साक्षरता, स्कूल नामांकन, शैक्षिक सेवाओं के उपयोग, रोजगार, बेरोजगारी, विनिर्माण और सेवा क्षेत्र के उद्यमों, रोगजननता, प्रसूति, बाल देखभाल, सार्वजनिक वितरण प्रणाली के उपयोग आदि के आवधिक अनुमान प्रदान करता है। NSS का 60वां दौर सर्वेक्षण (जनवरी-जून 2004) रोगजननता और स्वास्थ्य सेवा पर था। NSS का 68वां दौर सर्वेक्षण (2011-12) उपभोक्ता व्यय पर था। NSS विभिन्न वस्तुओं के औद्योगिक गतिविधियों और खुदरा मूल्यों का विवरण भी एकत्र करता है। इनका उपयोग भारत सरकार योजना बनाने के उद्देश्य से करती है।

7. निष्कर्ष

आर्थिक तथ्य, जब संख्याओं के रूप में व्यक्त किए जाते हैं, तो उन्हें आंकड़े कहा जाता है। आंकड़े एकत्र करने का उद्देश्य किसी समस्या और उसके पीछे के कारणों को समझना, समझाना और विश्लेषण करना है। प्राथमिक आंकड़े किसी सर्वेक्षण करके प्राप्त किए जाते हैं। सर्वेक्षण में विभिन्न चरण होते हैं, जिनकी सावधानीपूर्वक योजना बनानी होती है। विभिन्न एजेंसियां हैं जो सांख्यिकीय आंकड़े एकत्र, प्रक्रमित, सारणीबद्ध और प्रकाशित करती हैं। इनका उपयोग द्वितीयक आंकड़ों के रूप में किया जाता है। हालांकि, आंकड़ों के स्रोत और आंकड़े एकत्र करने की विधि का चयन अध्ययन के उद्देश्य पर निर्भर करता है।

सारांश

डेटा एक ऐसा उपकरण है जो किसी भी समस्या पर एक सही निष्कर्ष तक पहुँचने में मदद करता है।

प्राथमिक डेटा प्रथम सूचना पर आधारित होता है।

सर्वेक्षण व्यक्तिगत साक्षात्कार, प्रश्नावली भेजने और टेलीफोन साक्षात्कार द्वारा किया जा सकता है।

जनगणना जनसंख्या से संबंधित प्रत्येक व्यक्ति/इकाई को सम्मिलित करती है।

नमूना जनसंख्या से चयनित एक छोटा समूह होता है जिससे संबंधित सूचना प्राप्त की जाएगी।

यादृच्छिक नमूने में प्रत्येक व्यक्ति को सूचना देने के लिए चयनित होने का समान अवसर दिया जाता है।

नमूने की त्रुटि नमूना अनुमान के मान और संबंधित जनसंख्या प्राचल के मान के बीच अंतर के कारण होती है।

गैर-नमूना त्रुटियाँ डेटा अधिग्रहण में, अनिरुत्तर के कारण या चयन में पूर्वाग्रह के कारण उत्पन्न हो सकती हैं।

भारत की जनगणना और राष्ट्रीय नमूना सर्वेक्षण दो महत्वपूर्ण राष्ट्रीय स्तर की एजेंसियाँ हैं जो कई महत्वपूर्ण आर्थिक और सामाजिक मुद्दों पर डेटा एकत्र, संसाधित और सारणीबद्ध करती हैं।

अभ्यास

1. निम्नलिखित प्रश्नों के लिए कम से कम चार उपयुक्त बहुविकल्पीय विकल्प बनाइए:

(i) निम्नलिखित में से कौन-सा सबसे महत्वपूर्ण है जब आप एक नया पोशाक खरीदते हैं?

(ii) आप कितनी बार कंप्यूटर का उपयोग करते हैं?

(iii) आप नियमित रूप से कौन-से समाचार-पत्र पढ़ते हैं?

(iv) पेट्रोल की कीमत में वृद्धि उचित है।

(v) आपके परिवार की मासिक आय क्या है?

2. पाँच द्वि-मार्गी प्रश्न (‘हाँ’ या ‘नहीं’ के साथ) बनाइए।

3. बताइए कि निम्नलिखित कथन सत्य हैं या असत्य।

(i) डेटा के कई स्रोत हैं।

(ii) जब जनसंख्या साक्षर हो और एक बड़े क्षेत्र में फैली हो, तो टेलीफोन सर्वेक्षण आंकड़े एकत्र करने की सबसे उपयुक्त विधि होती है।

(iii) जांचकर्ता द्वारा एकत्र किए गए आंकड़ों को द्वितीयक आंकड़े कहा जाता है।

(iv) प्रतिदर्शों के यादृच्छिक चयन के बिना चयन में एक निश्चित पूर्वाग्रह शामिल होता है।

(v) गैर-प्रतिदर्श त्रुटियों को बड़े प्रतिदर्श लेकर न्यूनतम किया जा सकता है।

4. आप निम्नलिखित प्रश्नों के बारे में क्या सोचते हैं? क्या आपको इन प्रश्नों में कोई समस्या दिखती है? वर्णन कीजिए।

(i) आप सबसे निकटतम बाजार से कितनी दूर रहते हैं?

(ii) यदि प्लास्टिक थैलियाँ हमारे कूड़े-कचरे का केवल 5 प्रतिशत हैं, तो क्या उन्हें प्रतिबंधित किया जाना चाहिए?

(iii) क्या आप पेट्रोल की कीमत में वृद्धि के विरोधी नहीं होंगे?

(iv) क्या आप रासायनिक उर्वरकों के उपयोग से सहमत हैं?

(v) क्या आप अपने खेतों में उर्वरकों का उपयोग करते हैं?

(vi) आपके खेत में प्रति हेक्टेयर उपज क्या है?

5. आप बच्चों के बीच वेजिटेबल अट्टा नूडल्स की लोकप्रियता पर शोध करना चाहते हैं। इस जानकारी को एकत्र करने के लिए एक उपयुक्त प्रश्नावली तैयार कीजिए।

6. 200 खेतों वाले एक गाँव में फसलों की प्रणाली जानने के लिए एक अध्ययन किया गया। सर्वेक्षण किए गए 50 खेतों में से 50% केवल गेहूँ उगाते थे। जनसंख्या और प्रतिदर्श आकार क्या है?

7. प्रतिदर्श, जनसंख्या और चर के दो-दो उदाहरण दीजिए।

8. निम्नलिखित में से कौन-सी विधि बेहतर परिणाम देती है और क्यों?

(a) जनगणना

(b) प्रतिदर्श

9. निम्नलिखित में से कौन-सी त्रुटि अधिक गंभीर है और क्यों?

(a) प्रतिदर्श त्रुटि

(b) गैर-प्रतिदर्श त्रुटि

10. मान लीजिए आपकी कक्षा में 10 विद्यार्थी हैं। आप उनमें से तीन को चुनना चाहते हैं। कितने नमूने संभव हैं?

11. चर्चा कीजिए कि आप 10 में से 3 विद्यार्थियों को चुनने के लिए लॉटरी विधि का प्रयोग कैसे करेंगे।

12. क्या लॉटरी विधि हमेशा आपको एक यादृच्छिक नमूना देती है? समझाइए।

13. यादृच्छिक संख्या सारणियों का प्रयोग करके 10 में से 3 विद्यार्थियों के यादृच्छिक नमूने का चयन करने की प्रक्रिया समझाइए।

14. क्या नमूने सर्वेक्षणों की तुलना में बेहतर परिणाम देते हैं? अपने उत्तर के कारण दीजिए।

अध्याय 01 परिचय

अध्याय 03 डेटा का संगठन

अध्याय 02 आंकड़ों का संग्रह

1. परिचय

2. डेटा के स्रोत क्या हैं?

3. हम डेटा कैसे एकत्रित करते हैं?

उपकरण की तैयारी

आंकड़ों संग्रह की विधि

पायलट सर्वेक्षण

4. जनगणना और प्रतिदर्श सर्वेक्षण

जनगणना या पूर्ण गणना

जनसंख्या और नमूना

यादृच्छिक नमूनाकरण

गैर-यादृच्छिक प्रतिचयन

5. प्रतिचयन और गैर-प्रतिचयन त्रुटियाँ

प्रतिचयन त्रुटियाँ

गैर-प्रतिचयन त्रुटियाँ

6. भारत की जनगणना और एनएसएसओ

7. निष्कर्ष

अभ्यास

Bank Preparation

Bank Courses

NCERT Books

Important Resources

Success Stories

Forums