अध्याय 04 आंकड़ों की प्रस्तुति

1. परिचय

आपने पिछले अध्यायों में सीखा है कि आँकड़ों को कैसे एकत्रित और संगठित किया जाता है। चूँकि आँकड़े आमतौर पर बड़ी मात्रा में होते हैं, उन्हें संक्षिप्त और प्रस्तुत करने योग्य रूप में रखना आवश्यक होता है। यह अध्याय आँकड़ों की सटीक प्रस्तुति से संबंधित है ताकि एकत्रित भारी-भरकम आँकड़ों को तुरंत उपयोगी बनाया जा सके और उन्हें आसानी से समझा जा सके। आमतौर पर आँकड़ों की प्रस्तुति के तीन रूप होते हैं:

  • पाठ्य या वर्णनात्मक प्रस्तुति
  • सारणीबद्ध प्रस्तुति
  • आरेखीय प्रस्तुति।

2. आँकड़ों की पाठ्य प्रस्तुति

पाठ्य प्रस्तुति में, आँकड़ों का वर्णन पाठ के भीतर किया जाता है। जब आँकड़ों की मात्रा अधिक नहीं होती है तो इस रूप की प्रस्तुति अधिक उपयुक्त होती है। निम्नलिखित उदाहरणों को देखें:

उदाहरण 1

08 सितंबर 2005 को पेट्रोल और डीज़ल की कीमतों में वृद्धि के विरोध में दिए गए बंद के आह्वान के दौरान, बिहार के एक कस्बे में 5 पेट्रोल पंप खुले पाए गए और 17 बंद थे जबकि 2 स्कूल बंद थे और शेष 9 स्कूल खुले पाए गए।

उदाहरण 2

भारत की जनगणना 2001 ने बताया कि भारत की जनसंख्या बढ़कर 102 करोड़ हो गई थी जिसमें केवल 49 करोड़ महिलाएँ थीं जबकि 53 करोड़ पुरुष थे। चौहत्तर करोड़ लोग ग्रामीण भारत में रहते थे और केवल 28 करोड़ लोग शहरों या कस्बों में रहते थे। जबकि पूरे देश में 62 करोड़ गैर-कार्यरत जनसंख्या थी जबकि 40 करोड़ कार्यरत थे। शहरी जनसंख्या में गैर-कार्यरत लोगों की हिस्सेदारी (19 करोड़) कार्यरत लोगों (9 करोड़) की तुलना में अधिक थी जबकि ग्रामीण जनसंख्या में 74 करोड़ की कुल जनसंख्या में से 31 करोड़ कार्यरत थे…

दोनों ही मामलों में आँकड़े केवल पाठ रूप में प्रस्तुत किए गए हैं। प्रस्तुति की इस विधि का एक गंभीर दोष यह है कि समझने के लिए किसी को प्रस्तुति के संपूर्ण पाठ को पढ़ना पड़ता है। परंतु यह भी सत्य है कि यह विधि प्रस्तुति के कुछ बिंदुओं पर बल देने में सहायक होती है।

3. आँकड़ों की सारणीबद्ध प्रस्तुति

सारणीबद्ध प्रस्तुति में आँकड़े पंक्तियों (क्षैतिज रूप से पढ़ी जाती हैं) और स्तंभों (ऊर्ध्वाधर रूप से पढ़े जाते हैं) में प्रस्तुत किए जाते हैं। उदाहरण के लिए सारणी 4.1 देखें जो साक्षरता दरों की जानकारी को सारणीबद्ध करता है। इसमें तीन पंक्तियाँ (पुरुष, महिला और कुल) और तीन स्तंभ (शहरी, ग्रामीण और कुल) हैं। इसे $3 \times 3$ सारणी कहा जाता है जो 9 बॉक्सों में 9 जानकारियाँ देती है, जिन्हें सारणी की “कोशिकाएँ” कहा जाता है। प्रत्येक कोशिका ऐसी जानकारी देती है जो लिंग के एक गुण (“पुरुष”, “महिला” या कुल) को एक संख्या (ग्रामीण लोगों, शहरी लोगों और कुल की साक्षरता प्रतिशत) से संबद्ध करती है। सारणीबद्ध करने का सबसे महत्वपूर्ण लाभ यह है कि यह आँकड़ों को आगांवित सांख्यिकीय विश्लेषण और निर्णय लेने के लिए संगठित करता है। सारणीबद्ध करने में प्रयुक्त वर्गीकरण चार प्रकार के होते हैं:

  • गुणात्मक
  • परिमाणात्मक
  • कालिक और
  • स्थानिक

गुणात्मक वर्गीकरण

जब वर्गीकरण सामाजिक स्थिति, शारीरिक स्थिति, राष्ट्रीयता आदि गुणों के अनुसार किया जाता है, तो इसे गुणात्मक वर्गीकरण कहा जाता है। उदाहरण के लिए, तालिका 4.1 में वर्गीकरण के लिए गुण लिंग और स्थान हैं जो प्रकृति में गुणात्मक हैं।

तालिका 4.1 लिंग और स्थान के अनुसार भारत में साक्षरता (प्रतिशत)

स्थान कुल
लिंग ग्रामीण शहरी
पुरुष 79 90 82
महिला 59 80 65
कुल 68 84 74

स्रोत: भारत की जनगणना 2011। (साक्षरता दर 7 वर्ष और उससे अधिक आयु की आबादी से संबंधित है)

मात्रात्मक वर्गीकरण

मात्रात्मक वर्गीकरण में, आंकड़ों को उन विशेषताओं के आधार पर वर्गीकृत किया जाता है जो प्रकृति में मात्रात्मक होती हैं। दूसरे शब्दों में, इन विशेषताओं को मात्रात्मक रूप से मापा जा सकता है। उदाहरण के लिए, आयु, ऊंचाई, उत्पादन, आय आदि मात्रात्मक विशेषताएं हैं। वर्ग उन मानों के लिए सीमा निर्धारित करके बनाए जाते हैं, जिन्हें वर्ग सीमाएं कहा जाता है, जिन पर विचार की जा रही विशेषता के मान होते हैं। मात्रात्मक वर्गीकरण का एक उदाहरण तालिका 4.2 में दिया गया है। तालिका में लापता आंकड़ों की गणना कीजिए।

तालिका 4.2 बिहार में एक चुनाव अध्ययन में उनकी आयु के अनुसार 542 उत्तरदाताओं का वितरण

आयु समूह (वर्ष) उत्तरदाताओं की संख्या प्रतिशत
20-30 3 0.55
30-40 61 11.25
40-50 132 24.35
50-60 153 28.24
60-70 $? $?
70-80 51 9.41
80-90 2 0.37
सभी ? 100.00

स्रोत: विधानसभा चुनाव पटना मध्य निर्वाचन क्षेत्र 2005, ए.एन. सिन्हा इंस्टीट्यूट ऑफ सोशल स्टडीज, पटना।

यहाँ वर्गीकृत लक्षण आयु वर्षों में है और यह मात्रात्मक है।

गतिविधियाँ

  • चर्चा करें कि तालिका 4.1 में कुल मान कैसे प्राप्त किए गए हैं
  • एक तालिका बनाएँ जो आपकी कक्षा के छात्रों की स्टार न्यूज़, ज़ी न्यूज़, बीबीसी वर्ल्ड, सीएनएन, आज तक और डीडी न्यूज़ के प्रति पसंदीदा रुचि को प्रस्तुत करे।
  • एक तालिका तैयार करें जिसमें शामिल हों

(i) ऊँचाइयाँ (सेंटीमीटर में) और

(ii) छात्रों के वज़न (किलोग्राम में) आपकी कक्षा के।

अस्थायी वर्गीकरण

इस वर्गीकरण में समय वर्गीकृत चर बन जाता है और आँकड़ों को समय के अनुसार श्रेणीबद्ध किया जाता है। समय घंटों, दिनों, सप्ताहों, महीनों, वर्षों आदि में हो सकता है। उदाहरण के लिए, तालिका 4.3 देखें।

तालिका 4.3 1995 से 2000 तक एक चाय की दुकान की वार्षिक बिक्री

वर्ष बिक्री (रुपये लाख में)
1995 79.2
1996 81.3
1997 8.4
1998 80.5
1999 100.2
2000 91.2

आँकड़ा स्रोत: अप्रकाशित आँकड़े।

इस तालिका में वर्गीकृत लक्षण एक वर्ष में बिक्री है और यह समय की स्केल में मान लेता है।

गतिविधि

  • अपने स्कूल के कार्यालय जाएँ और पिछले दस वर्षों में प्रत्येक कक्षा में अध्ययन करने वाले छात्रों की संख्या के आँकड़े एकत्र करें और उन्हें एक तालिका में प्रस्तुत करें।

स्थानिक वर्गीकरण

जब वर्गीकरण स्थान के आधार पर किया जाता है, तो इसे स्थानिक वर्गीकरण कहा जाता है। स्थान गाँव/नगर, ब्लॉक, ज़िला, राज्य, देश आदि हो सकता है।

तालिका 4.4 स्थान वर्गीकरण का एक उदाहरण है।

तालिका 4.4 वर्ष 2013-14 में भारत से शेष विश्व को निर्यात की कुल निर्यात में हिस्सेदारी (प्रतिशत में)

गंतव्य निर्यात हिस्सेदारी
USA 12.5
जर्मनी 2.4
अन्य EU 10.9
UK 3.1
जापान 2.2
रूस 0.7
चीन 4.7
पश्चिम एशिया - गल्फ सहयोग परिषद 15.3
अन्य एशिया 29.4
अन्य 18.8
सभी 100.0

(कुल निर्यात: US $\$$ 314.40 अरब)

गतिविधि

  • अपनी कक्षा के विद्यार्थियों से उनके मूल राज्यों/आवासीय क्षेत्र के अनुसार एकत्रित आँकड़ों को प्रस्तुत करने वाली एक तालिका बनाएँ।

4. आँकड़ों का सारणीबद्ध करना और तालिका के भाग

एक तालिका बनाने के लिए यह जानना आवश्यक है कि एक अच्छी सांख्यिकीय तालिका के भाग क्या होते हैं। जब इन भागों को क्रमबद्ध रूप से एक साथ रखा जाता है तो वे एक तालिका बनाते हैं। तालिका की अवधारणा का सबसे सरल तरीका यह है कि आँकड़ों को कुछ व्याख्यात्मक नोटों के साथ पंक्तियों और स्तंभों में प्रस्तुत किया जाए। सारणीबद्ध करना एकल-तरफा, द्वि-तरफा या त्रि-तरफा वर्गीकरण के अनुसार किया जा सकता है, जो इस बात पर निर्भर करता है कि कितनी विशेषताएँ शामिल हैं। एक अच्छी तालिका में अनिवार्य रूप से निम्नलिखित होना चाहिए:

(i) तालिका संख्या

सारणी संख्या सारणी की पहचान के लिए निर्धारित की जाती है। यदि एक से अधिक सारणियाँ प्रस्तुत की जाती हैं, तो सारणी संख्या ही एक सारणी को दूसरी से अलग करती है। यह सारणी के शीर्षक के ऊपर या शुरुआत में दी जाती है। आमतौर पर, यदि किताब में कई सारणियाँ हों, तो सारणी संख्याएँ आरोही क्रम में पूर्ण संख्याएँ होती हैं। उपस्क्रिप्ट संख्याएँ, जैसे $1.2,3.1$, आदि, भी सारणी की स्थिति के अनुसार पहचान के लिए प्रयुक्त होती हैं। उदाहरण के लिए, सारणी 4.5 को चौथे अध्याय की पाँचवीं सारणी के रूप में पढ़ा जाना चाहिए, और इसी तरह (सारणी 4.5 देखें)।

(ii) शीर्षक

सारणी का शीर्षक सारणी की सामग्री के बारे में बताता है। इसे स्पष्ट, संक्षिप्त और सावधानीपूर्वक शब्दों में लिखा जाना चाहिए ताकि सारणी से की गई व्याख्याएँ स्पष्ट हों और अस्पष्टता से मुक्त हों। यह सारणी संख्या के बाद या उसके ठीक नीचे सारणी के शीर्ष पर स्थित होता है (सारणी 4.5 देखें)।

(iii) कैप्शन या स्तंभ शीर्षक

सारणी में प्रत्येक स्तंभ के शीर्ष पर स्तंभ का नाम दिया जाता है ताकि स्तंभ के आँकड़ों की व्याख्या हो सके। इसे कैप्शन या स्तंभ शीर्षक कहा जाता है (सारणी 4.5 देखें)।

(iv) स्टब या पंक्ति शीर्षक

कैप्शन या स्तंभ शीर्षक की तरह, सारणी की प्रत्येक पंक्ति को भी एक शीर्षक देना होता है। पंक्तियों के नामों को स्टब या स्टब आइटम भी कहा जाता है, और पूरी बाईं ओर की स्तंभ को स्टब स्तंभ कहा जाता है। पंक्ति शीर्षकों का संक्षिप्त विवरण सारणी के बाईं ओर ऊपर भी दिया जा सकता है (सारणी $4.5$ देखें)।

(v) सारणी का मुख्य भाग

सारणी का मुख्य भाग उसका ‘बॉडी’ होता है और इसमें वास्तविक आँकड़े होते हैं। सारणी में किसी एक आँकड़े/डेटा का स्थान निश्चित होता है और यह सारणी की पंक्ति तथा स्तंभ द्वारा निर्धारित होता है। उदाहरण के लिए, दूसरी पंक्ति और चौथे स्तंभ में दिया गया आँकड़ा बताता है कि वर्ष 2001 में ग्रामीण भारत में 25 करोड़ महिलाएँ गैर-कार्यरत थीं (देखिए सारणी 4.5)।

(vi) मापन की इकाई

सारणी में दिखाए गए आँकड़ों (वास्तविक डेटा) की मापन की इकाई को हमेशा शीर्षक के साथ देना चाहिए। यदि सारणी की पंक्तियों या स्तंभों के लिए भिन्न इकाइयाँ हों, तो ये इकाइयाँ ‘स्टब्स’ या ‘कैप्शन’ के साथ अवश्य दी जानी चाहिए। यदि आँकड़े बड़े हों, तो उन्हें राउंड किया जाना चाहिए और राउंड करने की विधि भी बताई जानी चाहिए (देखिए सारणी 4.5)।

(नोट : सारणी 4.5 उसी डेटा को सारणीबद्ध रूप में प्रस्तुत करती है जिसे पहले डेटा के पाठ्य प्रस्तुति में केस 2 के माध्यम से दिखाया गया है)

(vii) स्रोत

यह एक संक्षिप्त कथन या वाक्यांश होता है जो सारणी में प्रस्तुत डेटा के स्रोत को दर्शाता है। यदि एक से अधिक स्रोत हों, तो सभी स्रोतों को स्रोत भाग में लिखा जाता है। स्रोत आमतौर पर सारणी के नीचे लिखा जाता है (देखिए सारणी 4.5)।

(viii) नोट

नोट सारणी का अंतिम भाग होता है। यह सारणी में दिए गए डेटा की उस विशेष विशेषता को समझाता है जो स्वतः स्पष्ट नहीं होती और जिसे पहले कहीं भी समझाया नहीं गया है।

गतिविधियाँ

  • एक सारणी बनाने के लिए न्यूनतम कितनी पंक्तियाँ और स्तम्भों की आवश्यकता होती है?
  • क्या सारणी के स्तम्भ/पंक्ति शीर्षलेख मात्रात्मक हो सकते हैं?
  • क्या आप सारणी 4.2 और 4.3 को आँकड़ों को उपयुक्त रूप से पूर्णांकित करके प्रस्तुत कर सकते हैं?
  • पृष्ठ 41 पर दिए गए केस 2 के पहले दो वाक्यों को सारणी के रूप में प्रस्तुत करें। इसके लिए कुछ विवरण इस अध्याय के अन्य भागों में मिलेंगे।

5. आँकड़ों की चित्रात्मक प्रस्तुति

यह आँकड़ों को प्रस्तुत करने की तीसरी विधि है। यह विधि तालिका या पाठ्य प्रस्तुति की तुलना में आँकड़ों द्वारा समझाए जाने वाली वास्तविक स्थिति को सबसे तेज़ी से समझने में सहायक होती है। आँकड़ों की चित्रात्मक प्रस्तुति संख्याओं में निहित अत्यंत अमूर्त विचारों को अधिक ठोस और सरलतः समझ में आने वाले रूप में अत्यंत प्रभावी ढंग से अनुवादित करती है।

चित्र सटीकता में कम हो सकते हैं, परंतु आँकड़ों को प्रस्तुत करने में सारणियों की तुलना में अधिक प्रभावी होते हैं।

सामान्य प्रयोग में आने वाले विभिन्न प्रकार के चित्र होते हैं। उनमें से महत्वपूर्ण निम्नलिखित हैं:

(i) ज्यामितीय चित्र

(ii) बारंबारता चित्र

(iii) अंकगणितीय रेखा ग्राफ

ज्यामितीय चित्र

बार चित्र और पाई चित्र ज्यामितीय चित्र की श्रेणी में आते हैं। बार चित्र तीन प्रकार के होते हैं - सरल, बहु और संघटक बार चित्र।

बार चित्र

सरल बार चित्र

दंड आरेख (Bar diagram) के प्रत्येक वर्ग या श्रेणी के लिए समान अंतराल व समान चौड़ाई के आयताकार दंडों का एक समूह होता है। दंड की ऊँचाई या लंबाई आँकड़े के परिमाण को दर्शाती है। दंड का निचला सिरा आधार रेखा को स्पर्श करता है ताकि दंड की ऊँचाई शून्य इकाई से प्रारंभ हो। दंड आरेख के दंडों की सापेक्ष ऊँचाई को दृष्टिगत रूप से तुलना किया जा सकता है और इस प्रकार आँकड़े शीघ्र समझे जाते हैं। इसके लिए आँकड़े बारंबारता (frequency) या अ-बारंबारता (non-frequency) प्रकार के हो सकते हैं। अ-बारंबारता प्रकार के आँकड़ों में किसी विशेष लक्षण, जैसे उत्पादन, उपज, जनसंख्या आदि के विभिन्न समय बिन्दुओं या विभिन्न राज्यों के मान नोट किए जाते हैं और संबंधित लक्षण के मानों के अनुरूप उनकी ऊँचाई के अनुरूप दंड बनाकर आरेख तैयार किया जाता है। लक्षणों के मान (मापे गए या गिने गए) प्रत्येक मान की पहचान बनाए रखते हैं। आकृति 4.1 एक दंड आरेख का उदाहरण है।

गतिविधि

  • अपने विद्यालय में वर्तमान वर्ष में अध्ययनरत प्रत्येक कक्षा में विद्यार्थियों की संख्या एकत्रित करें। उसी सारणी के लिए एक दंड आरेख बनाएँ।

विभिन्न प्रकार के आँकड़ों के लिए विभिन्न प्रकार के आरेखीय प्रस्तुति तरीकों की आवश्यकता हो सकती है। बार आरेख आवृत्ति प्रकार और गैर-आवृत्ति प्रकार के चर तथा गुण दोनों के लिए उपयुक्त होते हैं। पारिवारिक आकार, पासे के ऊपर बिंदु, परीक्षा में ग्रेड आदि जैसे विच्छिन्न चर और लिंग, धर्म, जाति, देश आदि जैसे गुणों को बार आरेखों द्वारा दर्शाया जा सकता है। बार आरेख आय-व्यय प्रोफ़ाइल, वर्षों के दौरान निर्यात/आयात आदि जैसे गैर-आवृत्ति आँकड़ों के लिए अधिक सुविधाजनक होते हैं।

एक श्रेणी जिसकी बार अधिक लंबी हो (केरल की साक्षरता) दूसरी श्रेणी (पश्चिम बंगाल की साक्षरता) की तुलना में मापे गए (या गिने गए) लक्षणों में अधिक होती है। बारों (जिन्हें स्तंभ भी कहा जाता है) का प्रयोग सामान्यतः समय श्रृंखला आँकड़ों में किया जाता है (1980 और 2000 के बीच खाद्यान्न उत्पादन, कार्य भागीदारी दर में दशकीय परिवर्तन, वर्षों के दौरान पंजीकृत बेरोज़गारी, साक्षरता दर आदि) (चित्र 4.2)।

TABLE 4.6 Literacy Rates of Major States of India

2001 2011
प्रमुख भारतीय राज्य पुरुष महिला पुरुष महिला
आंध्र प्रदेश (AP) 70.3 50.4 75.6 59.7
असम (AS) 71.3 54.6 78.8 67.3
बिहार (BR) 59.7 33.1 73.4 53.3
झारखंड (JH) 67.3 38.9 78.4 56.2
गुजरात (GJ) 79.7 57.8 87.2 70.7
हरियाणा (HR) 78.5 55.7 85.3 66.8
कर्नाटक (KA) 76.1 56.9 82.9 68.1
केरल (KE) 94.2 87.7 96.0 92.0
मध्य प्रदेश (MP) 76.1 50.3 80.5 60.0
छत्तीसगढ़ (CH) 77.4 51.9 81.5 60.6
महाराष्ट्र (MR) 86.0 67.0 89.8 75.5
ओडिशा (OD) 75.3 50.5 82.4 64.4
पंजाब (PB) 75.2 63.4 81.5 71.3
राजस्थान (RJ) 75.7 43.9 80.5 52.7
तमिलनाडु (TN) 82.4 64.4 86.8 73.9
उत्तर प्रदेश (UP) 68.8 42.2 79.2 59.3
उत्तराखंड (UK) 83.3 59.6 88.3 70.7
पश्चिम बंगाल (WB) 77.0 59.6 82.7 71.2
भारत 75.3 53.7 82.1 65.5

आकृति 4.1: भारत के प्रमुख राज्यों के पुरुष साक्षरता दर को दर्शाता दंड आरेख, 2011. (साक्षरता दर 7 वर्ष और उससे अधिक आयु की आबादी से संबंधित है)

दंड आरेखों के विभिन्न रूप हो सकते हैं जैसे बहु-दंड आरेख और घटक दंड आरेख।

गतिविधियाँ

  • 2011 में भारत के प्रमुख राज्यों में से कितने राज्यों में महिला साक्षरता दर राष्ट्रीय औसत से अधिक थी?
  • क्या 2001 और 2011 की दो क्रमिक जनगणना वर्षों में राज्यों की अधिकतम और न्यूनतम महिला साक्षरता दरों के बीच का अंतर घटा है?

बहु-बार आरेख

बहु-बार आरेख (चित्र 4.2) का उपयोग दो या अधिक डेटा समूहों की तुलना के लिए किया जाता है, उदाहरण के लिए विभिन्न वर्षों के लिए आय और व्यय या आयात और निर्यात, विभिन्न कक्षाओं में विभिन्न विषयों में प्राप्त अंक, आदि।

घटक बार आरेख

घटक बार आरेख या चार्ट (चित्र 4.3), जिन्हें उप-आरेख भी कहा जाता है, विभिन्न घटक भागों के आकारों की तुलना करने में बहुत उपयोगी होते हैं (वे तत्व या भाग जिनसे कोई वस्तु बनी होती है) और साथ ही इन अभिन्न भागों के बीच संबंध को स्पष्ट करने के लिए भी। उदाहरण के लिए, विभिन्न उत्पादों से बिक्री आय, एक विशिष्ट भारतीय परिवार में व्यय प्रतिरूप (घटक होते हैं भोजन, किराया, दवाई, शिक्षा, बिजली, आदि), प्राप्तियों और व्यय के लिए बजट व्यय, श्रम बल के घटक, जनसंख्या आदि। घटक बार आरेख सामान्यतः उपयुक्त रूप से छायांकित या रंगे होते हैं।

चित्र 4.2: भारत के प्रमुख राज्यों द्वारा 2001 और 2011 की दो जनगणना वर्षों में महिला साक्षरता दर दिखाता बहु-बार (स्तंभ) आरेख। (डेटा स्रोत तालिका 4.6)

व्याख्या: चित्र 4.2 से यह बहुत आसानी से निकाला जा सकता है कि देश भर में वर्षों से महिला साक्षरता दर में वृद्धि हो रही थी। चित्र से इसी प्रकार की अन्य व्याख्याएँ भी की जा सकती हैं। उदाहरण के लिए, चित्र दिखाता है कि बिहार, झारखंड और उत्तर प्रदेश राज्यों में महिला साक्षरता में सबसे तेज वृद्धि हुई है, आदि।

तालिका 4.7 बिहार के एक जिले में 6-14 वर्ष आयु वर्ग के बच्चों का लिंग के अनुसार स्कूल नामांकन (प्रतिशत में)

लिंग नामांकित (प्रतिशत) विद्यालय से बाहर (प्रतिशत)
लड़का 91.5 8.5
लड़की 58.6 41.4
सभी 78.0 22.0

डेटा स्रोत: अप्रकाशित आंकड़े

एक घटक स्तंभ आरेख स्तंभ और उसके दो या अधिक घटकों में विभाजन को दर्शाता है। उदाहरण के लिए, स्तंभ 6-14 वर्ष आयु वर्ग के बच्चों की कुल जनसंख्या को दिखा सकता है। घटक उन लोगों और उन लोगों के अनुपात को दिखाते हैं जो नामांकित हैं और जो नहीं हैं। एक घटक स्तंभ आरेख में दिए गए आयु वर्ग सीमा में लड़कों, लड़कियों और बच्चों के कुल के लिए भिन्न घटक स्तंभ भी हो सकते हैं, जैसा कि चित्र 4.3 में दिखाया गया है। एक घटक स्तंभ आरेख बनाने के लिए, सबसे पहले $\mathrm{x}$-अक्ष पर एक स्तंच बनाया जाता है जिसकी ऊँचाई स्तंभ के कुल मान के बराबर होती है [प्रतिशत आंकड़ों के लिए स्तंभ की ऊँचाई 100 इकाई की होती है (चित्र 4.3)]। अन्यथा ऊँचाई स्तंभ के कुल मान के बराबर की जाती है और घटकों की समानुपातिक ऊँचाइयाँ यूनिटरी विधि का उपयोग करके निकाली जाती हैं। छोटे घटकों को स्तंभ को विभाजित करने में प्राथमिकता दी जाती है।

चित्र 4.3: बिहार के एक जिले में प्राथमिक स्तर पर नामांकन (घटक दंड आरेख)

पाई आरेख

पाई आरेख भी एक घटक आरेख है, लेकिन दंड आरेख के विपरीत, यहाँ यह एक वृत्त होता है जिसका क्षेत्रफल समानुपातिक रूप से उन घटकों के बीच बाँटा जाता है (चित्र 4.4) जिनका यह प्रतिनिधित्व करता है। इसे पाई चार्ट भी कहा जाता है। वृत्त को उतने ही भागों में बाँटा जाता है जितने घटक होते हैं, केंद्र से परिधि तक सीधी रेखाएँ खींचकर।

पाई चार्ट सामान्यतः किसी श्रेणी के निरपेक्ष मानों के साथ नहीं बनाए जाते। प्रत्येक श्रेणी के मानों को पहले सभी श्रेणियों के कुल मान का प्रतिशत व्यक्त किया जाता है। पाई चार्ट में एक वृत्त, अपनी त्रिज्या के मान की परवाह किए बिना, 100 समान भागों में बाँटा जाता है जिनमें प्रत्येक $3.6^{\circ}\left(360^{\circ} / 100\right)$ होता है। यह ज्ञात करने के लिए कि कोई घटक वृत्त के केंद्र पर कितना कोण बनाएगा, प्रत्येक घटक के प्रतिशत आंकड़े को $3.6^{\circ}$ से गुणा किया जाता है। वृत्त के कोणीय घटकों में प्रतिशत घटकों के इस रूपांतरण का एक उदाहरण सारणी 4.8 में दिखाया गया है।

यह जानना रोचक हो सकता है कि एक संयुक्त स्तंभ आरेख द्वारा प्रदर्शित आँकड़ों को पाई चार्ट द्वारा भी समान रूप से अच्छी तरह प्रस्तुत किया जा सकता है, एकमात्र आवश्यकता यह है कि अवयवों के परम मानों को प्रतिशत में बदलना होता है, तभी उन्हें पाई आरेख के लिए प्रयोग किया जा सकता है।

TABLE 4.8 भारतीय जनसंख्या का वितरण (2011) उनकी कार्यशील स्थिति के अनुसार (करोड़ों में)

स्थिति जनसंख्या प्रतिशत कोणीय अवयव
सीमांत श्रमिक 12 9.9 $36^{\circ}$
मुख्य-श्रमिक 36 29.8 $107^{\circ}$
गैर-श्रमिक 73 60.3 $217^{\circ}$
सभी 102 100.0 $360^{\circ}$

Fig. 4.4: भारतीय जनसंख्या की विभिन्न श्रेणियों के लिए पाई आरेख कार्यशील स्थिति के अनुसार 2011।


गतिविधियाँ

  • आकृति 4.4 द्वारा प्रस्तुत आँकड़ों को एक संयुक्त स्तंभ आरेख द्वारा प्रस्तुत करें।
  • क्या पाई का क्षेत्रफल पाई आरेख द्वारा प्रस्तुत किए जाने वाले आँकड़ों के कुल मान से कोई संबंध रखता है?

बारंबारता आरेख

समूहीकृत बारंबारता बंटन के रूप में आँकड़े सामान्यतः बारंबारता आरेखों जैसे हिस्टोग्राम, बारंबारता बहुभुज, बारंबारता वक्र और ओजाइव द्वारा प्रस्तुत किए जाते हैं।

हिस्टोग्राम

हिस्टोग्राम एक द्वि-आयामी आरेख है। यह आयतों का एक समूह होता है जिसका आधार वर्ग सीमाओं के बीच के अंतराल होते हैं ($\mathrm{X}$-अक्ष के अनुदिश) और जिसके क्षेत्रफल वर्ग आवृत्तियों के अनुपात में होते हैं (चित्र 4.5)। यदि वर्ग अंतराल समान चौड़ाई के हों, जैसा कि आमतौर पर होता है, तो आयतों के क्षेत्रफल उनकी संबंधित आवृत्तियों के अनुपात में होते हैं। हालांकि, कुछ प्रकार के आंकड़ों में, वर्ग अंतरालों की भिन्न-भिन्न चौड़ाई का उपयोग करना सुविधाजनक होता है, कभी-कभी आवश्यक भी। उदाहरण के लिए, मृत्यु के समय आयु के अनुसार मृत्युओं की सारणी बनाते समय, आरंभ में बहुत छोटे आयु अंतराल $(0,1,2, \ldots$, वर्ष/ $0,7,28, \ldots$, दिन) रखना बहुत अर्थपूर्ण और उपयोगी होगा, जब मृत्यु दर अन्य अधिकांश आयु वर्गों की तुलना में बहुत अधिक होती है। ऐसे आंकड़ों की आलेखीय प्रस्तुति के लिए, आयत की ऊंचाई (यहां आवृत्ति) और आधार (यहां वर्ग अंतराल की चौड़ाई) का भागफल लिया जाता है। जब अंतराल समान हों, अर्थात् सभी आयतों का आधार समान हो, तो तुलना के उद्देश्य से क्षेत्रफल को किसी भी अंतराल की आवृत्ति से सुविधाजनक रूप से दर्शाया जा सकता है।

जब आधार की चौड़ाई भिन्न-भिन्न हो, तो आयतों की ऊंचाइयों को समान माप देने के लिए समायोजित किया जाता है। ऐसी स्थिति में उत्तर है आवृत्ति घनत्व (वर्ग आवृत्ति को वर्ग अंतराल की चौड़ाई से विभाजित करना) न कि निरपेक्ष आवृत्ति।

तालिका 4.9 एक कस्बे के क्षेत्र में दैनिक मजदूरी कमाने वालों का वितरण

दैनिक कमाई (रु) मजदूरी कमाने वालों की संख्या (f)
45-49 2
50-54 3
55-59 5
60-64 3
65-69 6
70-74 7
75-79 12
80-84 13
85-89 9
90-94 7
95-99 6
100-104 4
105-109 2
110-114 3
115-119 3

स्रोत: अप्रकाशित आंकड़े

चूँकि हिस्टोग्राम आयत होते हैं, आधार रेखा के समानांतर और समान परिमाण की एक रेखा आधार रेखा से ऊर्ध्वाधर दूरी पर खींची जाती है जो वर्ग अंतराल की बारंबारता (या बारंबारता घनत्व) के बराबर होती है। हिस्टोग्राम कभी नहीं खींचा जाता। चूँकि, सतत चरों के लिए, एक वर्ग अंतराल की निचली वर्ग सीमा पिछले अंतराल की ऊपरी वर्ग सीमा से मिल जाती है, समान या असमान, आयत सभी संलग्न होते हैं और दो क्रमागत आयतों के बीच कोई खुला स्थान नहीं होता। यदि वर्ग सतत नहीं हैं तो उन्हें पहले सतत वर्गों में बदला जाता है जैसा कि अध्याय 3 में चर्चा की गई है। कभी-कभी दो संलग्न आयतों के बीच की सामान्य भाग (चित्र 4.6) को छोड़ दिया जाता है जिससे सततता की बेहतर छाप मिलती है। परिणामी आकृति दोहरी सीढ़ी की छाप देती है।

एक हिस्टोग्राम एक बार आरेख से मिलता-जुलता दिखता है। लेकिन पहली नज़र में लगने वाले मिलने से ज़्यादा अंतर हैं। बारों के बीच की दूरी और उनकी चौड़ाई या क्षेत्रफल सभी मनमाने होते हैं। असल में बार की ऊँचाई मायने रखती है, न कि चौड़ाई या क्षेत्रफल। एक ही ऊँचाई की एकल ऊर्ध्वाधर रेखा भी उसी चौड़ाई की बार जितना ही उद्देश्य पूरी कर सकती है। इसके अतिरिक्त, हिस्टोग्राम में दो आयतों के बीच कोई खाली स्थान नहीं छोड़ा जाता, जबकि बार आरेख में लगातार बारों के बीच कुछ स्थान अवश्य छोड़ना पड़ता है (बहु-बार या घटक-बार आरेख को छोड़कर)। यद्यपि बारों की चौड़ाई समान होती है, तुलना के उद्देश्य से बार की चौड़ाई महत्वहीन है। हिस्टोग्राम में चौड़ाई उतनी ही महत्वपूर्ण है जितनी ऊँचाई। हम बार आरेख离散 और सतत दोनों चरों के लिए बना सकते हैं, पर हिस्टोग्राम केवल सतत चर के लिए ही खींचा जाता है। हिस्टोग्राम आवृत्ति बंटन के बहुलक का मान आलेखीय रूप से भी देता है, जैसा कि चित्र 4.5 में दिखाया गया है और बिंदित ऊर्ध्वाधर रेखा का $\mathrm{x}$-निर्देशांक बहुलक देता है।

आवृत्ति बहुभुज

एक बारंबारता बहुभुज (frequency polygon) एक समतल होता है जो सीधी रेखाओं से घिरा होता है, आमतौर पर चार या अधिक रेखाओं से। बारंबारता बहुभुज हिस्टोग्राम का विकल्प है और यह स्वयं हिस्टोग्राम से ही व्युत्पन्न किया जाता है। बारंबारता बहुभुज को किसी हिस्टोग्राम पर फिट किया जा सकता है ताकि वक्र के आकार का अध्ययन किया जा सके। बारंबारता बहुभुज बनाने की सबसे सरल विधि यह है कि हिस्टोग्राम के लगातार आयतों के ऊपरी भाग के मध्यबिंदुओं को मिलाया जाए। इससे दोनों सिरे आधार रेखा से दूर रह जाते हैं, जिससे वक्र के नीचे के क्षेत्रफल की गणना नहीं हो पाती। समाधान यह है कि प्राप्त दोनों सिरों को वितरण के दोनों छोरों पर शून्य बारंबारता वाली दोनों वर्गों के मध्य-मानों पर आधार रेखा से मिलाया जाए। दोनों सिरों को आधार रेखा से टूटी हुई रेखाओं या बिंदुओं द्वारा मिलाया जा सकता है। अब वक्र के नीचे का कुल क्षेत्रफल, हिस्टोग्राम की तरह, कुल बारंबारता या नमूना आकार को दर्शाता है।

आकृति 4.5: एक कस्बे के क्षेत्र में 85 दैनिक वेतनभोगी मजदूरों के वितरण के लिए हिस्टोग्राम।

बारंबारता बहुभुज (Frequency polygon) समूहीकृत बारंबारता बंटन को प्रस्तुत करने की सबसे सामान्य विधि है। $\mathrm{X}$-अक्ष पर वर्ग सीमाएँ और वर्ग-चिह्न दोनों प्रयोग किए जा सकते हैं, दो क्रमागत वर्ग-चिह्नों के बीच की दूरी वर्ग अंतराल की चौड़ाई के अनुपातिक/समान होती है। यदि वर्ग-चिह्न ग्राफ पेपर की मोटी रेखाओं पर आ जाएँ तो आँकड़ों को प्लॉट करना आसान हो जाता है। चाहे $\mathrm{X}$-अक्ष पर वर्ग सीमाएँ प्रयोग की गई हों या मध्य-बिंदु, बारंबारताएँ (ऑर्डिनेट के रूप में) हमेशा वर्ग अंतराल के मध्य-बिंदु के विरुद्ध प्लॉट की जाती हैं। जब सभी बिंदु ग्राफ में प्लॉट कर दिए जाते हैं, तो उन्हें ध्यानपूर्वक छोटी-छोटी सीधी रेखाओं की श्रृंखला से जोड़ा जाता है। टूटी हुई रेखाएँ दो अंतरालों के मध्य-बिंदुओं को जोड़ती हैं—एक प्रारंभ में और दूसरा अंत में—प्लॉट की गई वक्र के दोनों सिरों से (चित्र 4.6)। जब एक ही अक्षों पर दो या अधिक बंटनों की तुलना की जाती है, तो बारंबारता बहुभुज अधिक उपयोगी हो सकता है क्योंकि हिस्टोग्राम में दो या अधिक बंटनों की ऊर्ध्वाधर और क्षैतिज रेखाएँ संपात हो सकती हैं।

चित्र 4.6: सारणी 4.9 में दिए गए आँकड़ों के लिए खींचा गया बारंबारता बहुभुज

चित्र 4.7: सारणी 4.9 के लिए बारंबारता वक्र

बारंबारता वक्र

आवृत्ति वक्र प्राप्त किया जाता है आवृत्ति बहुभुज के बिंदुओं से यथासंभव निकटता से गुजरती हुई एक सहज फ्रीहैंड वक्र खींचकर। यह आवश्यक नहीं कि आवृत्ति बहुभुज के सभी बिंदुओं से गुजरे, परंतु यह उनसे यथासंभव निकटता से गुजरती है (चित्र 4.7)।

ओजाइव

ओजाइव को संचयी आवृत्ति वक्र भी कहा जाता है। चूँकि दो प्रकार की संचयी आवृत्तियाँ होती हैं, उदाहरण के लिए “से कम” प्रकार और “से अधिक” प्रकार, इसलिए किसी भी समूहीकृत आवृत्ति बंटन आँकड़ों के लिए दो ओजाइव होते हैं। यहाँ आवृत्ति बहुभुज के मामले में जैसे सरल आवृत्तियाँ होती हैं, उनके स्थान पर संचयी आवृत्तियाँ $y$-अक्ष के अनुदेश आवृत्ति बंटन की वर्ग सीमाओं के विरुद्ध आलेखित की जाती हैं। “से कम” ओजाइव के लिए संचयी आवृत्तियाँ वर्ग अंतरालों की संबंधित ऊपरी सीमाओं के विरुद्ध आलेखित की जाती हैं, जबकि “से अधिक” ओजाइव के लिए संचयी आवृत्तियाँ वर्ग अंतरालों की संबंधित निचली सीमाओं के विरुद्ध आलेखित की जाती हैं। दोनों ओजाइवों की एक रोचक विशेषता यह है कि उनका प्रतिच्छेदन बिंदु आवृत्ति बंटन की माध्यिका चित्र 4.8 (b) देता है। जैसा कि दोनों ओजाइवों के आकार सुझाते हैं, “से कम” ओजाइव कभी घटता नहीं और “से अधिक” ओजाइव कभी बढ़ता नहीं।

अंकगणितीय रेखा ग्राफ

एक समांतर रेखा आलेख को समय श्रेणी आलेख भी कहा जाता है। इस आलेख में समय (घंटा, दिन/तिथि, सप्ताह, माह, वर्ष आदि) को $\mathrm{x}$-अक्ष पर और चर का मान (समय श्रेणी आंकड़े) को y-अक्ष पर अंकित किया जाता है। इन अंकित बिंदुओं को मिलाकर बनाई गई रेखा आलेख को समांतर रेखा आलेख (समय श्रेणी आलेख) कहा जाता है। यह दीर्घकालिक समय श्रेणी आंकड़ों में प्रवृत्ति, आवर्तिता आदि को समझने में सहायक होता है।

TABLE 4.10 गणित में प्राप्त अंकों की बारंबारता बंटन

Fig. 4.8(a): TABLE 4.10 में दिए गए आंकड़ों के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

Fig. 4.8(b): TABLE 4.10 में दिए गए आंकड़ों के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

यहाँ आप Fig. 4.9 से देख सकते हैं कि 1993-94 से 2013-14 की अवधि के दौरान पूरे समय आयात निर्यात से अधिक रहे। आप देख सकते हैं कि 2001-02 के बाद निर्यात और आयात दोनों के मान तेजी से बढ़ रहे हैं। साथ ही दोनों (आयात और निर्यात) के बीच का अंतर 2001-02 के बाद और बढ़ गया है।

6. निष्कर्ष

अब तक आप यह सीख चुके होंगे कि डेटा को विभिन्न प्रस्तुति रूपों—पाठ्य, सारणीबद्ध और आरेखीय—का उपयोग करके कैसे प्रस्तुत किया जा सकता है। अब आप डेटा प्रस्तुति के उपयुक्त रूप के साथ-साथ किसी दिए गए डेटा सेट के लिए प्रयुक्त होने वाले आरेख के प्रकार का भी उचित चयन करने में सक्षम हैं। इस प्रकार आप डेटा की प्रस्तुति को अर्थपूर्ण, व्यापक और उद्देश्यपूर्ण बना सकते हैं।

TABLE 4.11 भारत के निर्यात और आयात का मूल्य (100 करोड़ रुपये में)

वर्ष निर्यात आयात
1993-94 698 731
1994-95 827 900
1995-96 1064 1227
1996-97 1188 1389
1997-98 1301 1542
1998-99 1398 1783
1999-2000 1591 2155
2000-01 2036 2309
2001-02 2090 2452
2002-03 2549 2964
2003-04 2934 3591
2004-05 3753 5011
2005-06 4564 6604
2006-07 5718 8815
2007-08 6559 10123
2008-09 8408 13744
2009-10 8455 13637
2010-11 11370 16835
2011-12 14660 23455
2012-13 16343 26692
2013-14 19050 27154

स्रोत: DGCI&S, कोलकाता

Fig. 4.9: TABLE 4.11 में दिए गए समय श्रृंखला डेटा के लिए अंकगणितीय रेखा आरेख

सारांश

  • आँकड़े (भी भारी मात्रा में) प्रस्तुति के माध्यम से अर्थपूर्ण रूप से बोलते हैं।
  • छोटे आँकड़ों (मात्रा) के लिए पाठात्मक प्रस्तुति अधिक उपयुक्त होती है।
  • बड़ी मात्रा के आँकड़ों के लिए सारणीबद्ध प्रस्तुति एक या अधिक चरों के लिए किसी भी मात्रा के आँकड़ों को समाहित करने में सहायक होती है।
  • सारणीबद्ध आँकड़ों को आरेखों के माध्यम से प्रस्तुत किया जा सकता है जो तथ्यों की तेज़ समझ में सहायक होते हैं।

अभ्यास

निम्नलिखित प्रश्नों 1 से 10 तक का उत्तर चुनकर दीजिए

1. दंड आरेख एक होता है

(i) एक-आयामी आरेख

(ii) दो-आयामी आरेख

(iii) बिना आयाम का आरेख

(iv) उपर्युक्त में से कोई नहीं

2. हिस्टोग्राम के माध्यम से प्रस्तुत आँकड़े ग्राफ़िक रूप से ज्ञात करने में सहायक हो सकते हैं

(i) माध्य

(ii) बहुलक

(iii) माध्यिका

(iv) उपर्युक्त सभी

3. ओजाइव्स ग्राफ़िक रूप से ज्ञात करने में सहायक हो सकते हैं

(i) बहुलक

(ii) माध्य

(iii) माध्यिका

(iv) उपर्युक्त में से कोई नहीं

4. अंकगणितीय रेखा ग्राफ़ के माध्यम से प्रस्तुत आँकड़े समझने में सहायक होते हैं

(i) दीर्घकालिक प्रवृत्ति

(ii) आँकड़ों में चक्रीयता

(iii) आँकड़ों में मौसमी प्रभाव

(iv) उपर्युक्त सभी

5. दंड आरेख में दंडों की चौड़ाई बराबर होनी आवश्यक नहीं है (सत्य/असत्य)।

6. हिस्टोग्राम में आयतों की चौड़ाई अनिवार्यतः बराबर होनी चाहिए (सत्य/असत्य)।

7. हिस्टोग्राम केवल सतत वर्गीकरण वाले आँकड़ों से ही बनाया जा सकता है (सत्य/असत्य)।

8. हिस्टोग्राम और स्तंभ आरेख आँकड़ों की प्रस्तुति की एक ही विधि हैं। (सत्य/असत्य)

9. आवृत्ति बंटन की बहुलक (मोड) को आयतालेख (हिस्टोग्राम) की सहायता से आलेखीय रूप से जाना जा सकता है। (सत्य/असत्य)

10. आवृत्ति बंटन की माध्यिका (मीडियन) को ओजाइव्स (ogives) से जाना नहीं जा सकता। (सत्य/असत्य)

11. निम्नलिखित को दर्शाने के लिए किस प्रकार के आरेख अधिक प्रभावी हैं?

(i) वर्ष में मासिक वर्षा

(ii) धर्म के अनुसार दिल्ली की जनसंख्या की संरचना

(iii) एक कारखाने में लागत के घटक

12. मान लीजिए आप भारत में शहरी गैर-कार्यकर्ताओं के हिस्से में वृद्धि और शहरीकरण के निम्न स्तर को उदाहरण 4.2 में दिखाए गए अनुसार जोर देना चाहते हैं। आप इसे सारणीबद्ध रूप में कैसे करेंगे?

13. जब आवृत्ति सारणी में वर्ग अंतराल असमान होते हैं तो आयतालेख बनाने की प्रक्रिया समान वर्ग अंतरालों की तुलना में किस प्रकार भिन्न होती है?

14. भारतीय चीनी मिल संघ ने रिपोर्ट किया कि, ‘दिसंबर 2001 के पहले पखवाड़े के दौरान चीनी उत्पादन लगभग 3,87,000 टन था, जबकि पिछले वर्ष (2000) की इसी अवधि के दौरान यह 3,78,000 टन था। दिसंबर 2001 के पहले पखवाड़े के दौरान कारखानों से चीनी की ऑफ-टेक 2,83,000 टन आंतरिक उपभोग के लिए और 41,000 टन निर्यात के लिए थी, जबकि पिछले सीजन की इसी अवधि के दौरान यह $1,54,000$ टन आंतरिक उपभोग के लिए और निर्यात के लिए शून्य थी।’

(i) आंकड़ों को सारणीबद्ध रूप में प्रस्तुत कीजिए।

(ii) मान लीजिए आपको इन आंकड़ों को आलेखीय रूप में प्रस्तुत करना है तो आप किस आरेख का उपयोग करेंगे और क्यों?

(iii) इन आंकड़ों को आलेखीय रूप में प्रस्तुत कीजिए।

15. निम्नलिखित सारणी कारक लागत पर GDP में अनुमानित क्षेत्रीय वास्तविक वृद्धि दरों (पिछले वर्ष की तुलना में प्रतिशत परिवर्तन) को दर्शाती है।

वर्ष कृषि और संबद्ध क्षेत्र उद्योग सेवाएँ
1994-95 5.0 9.2 7.0
1995-96 -0.9 11.8 10.3
1996-97 9.6 6.0 7.1
1997-98 -1.9 5.9 9.0
1998-99 7.2 4.0 8.3
1999-2000 0.8 6.9 8.2

इस डेटा को एकाधिक समय श्रेणी ग्राफ़ों के रूप में प्रस्तुत करें।