गणित बॉक्स और व्हिस्कर प्लॉट
Subject Hub
सामान्य Learning Resources
बॉक्स और व्हिस्कर प्लॉट
बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण की एक ग्राफिकल प्रस्तुति है। यह किसी डेटासेट के फाइव-नंबर सारांश—न्यूनतम, पहला क्वार्टाइल (Q1), माध्यिका, तीसरा क्वार्टाइल (Q3) और अधिकतम—को प्रदर्शित करने का एक मानकीकृत तरीका है।
बॉक्स और व्हिस्कर प्लॉट के घटक
एक बॉक्स और व्हिस्कर प्लॉट निम्नलिखित घटकों से बना होता है:
- माध्यिका: माध्यिका डेटासेट का मध्य मान होता है जब उसे संख्यात्मक क्रम में व्यवस्थित किया जाता है। यह बॉक्स के बीच में एक रेखा द्वारा दर्शाया जाता है।
- बॉक्स: बॉक्स इंटरक्वार्टाइल रेंज (IQR) को दर्शाता है, जो तीसरे क्वार्टाइल (Q3) और पहले क्वार्टाइल (Q1) के बीच का अंतर है। IQR डेटा के फैलाव का एक माप है।
- व्हिस्कर: व्हिस्कर बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैले होते हैं। व्हिस्कर डेटा की रेंज दिखाते हैं।
- आउटलायर: आउटलायर वे डेटा बिंदु होते हैं जो शेष डेटा से काफी भिन्न होते हैं। इन्हें व्हिस्कर के बाहर व्यक्तिगत बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और व्हिस्कर प्लॉट की व्याख्या
बॉक्स और व्हिस्कर प्लॉट का उपयोग विभिन्न डेटासेटों के वितरणों की तुलना करने के लिए किया जा सकता है। इसका उपयोग आउटलायरों की पहचान करने के लिए भी किया जा सकता है।
बॉक्स और व्हिस्कर प्लॉट की व्याख्या करते समय इन बातों पर ध्यान दें:
- माध्यिका: माध्यिका डेटा के केंद्र की माप है। एक उच्चतर माध्यिका इंगित करती है कि डेटा उच्च मानों की ओर झुका है, जबकि एक निम्न माध्यिका इंगित करती है कि डेटा निम्न मानों की ओर झुका है।
- अंतरचतुर्थक परास (IQR): IQR डेटा के फैलाव की माप है। एक बड़ा IQR इंगित करता है कि डेटा अधिक फैला हुआ है, जबकि एक छोटा IQR इंगित करता है कि डेटा अधिक संकुचित है।
- व्हिस्कर: व्हिस्कर डेटा की सीमा दिखाते हैं। लंबे व्हिस्कर इंगित करते हैं कि डेटा अधिक परिवर्तनशील है, जबकि छोटे व्हिस्कर इंगित करते हैं कि डेटा कम परिवर्तनशील है।
- आउटलायर: आउटलायर ऐसे डेटा बिंदु होते हैं जो शेष डेटा से काफी भिन्न होते हैं। ये डेटा संग्रह में त्रुटियों या असामान्य प्रेक्षणों की उपस्थिति के कारण हो सकते हैं।
बॉक्स और व्हिस्कर प्लॉट का उदाहरण
माध्यिका ऊंचाई 175 सेमी है। IQR 20 सेमी है। व्हिस्कर 150 सेमी से 200 सेमी तक फैले हैं। कोई आउटलायर नहीं है।
यह बॉक्स और व्हिस्कर प्लॉट दिखाता है कि इस समूह में लोगों की ऊंचाइयाँ सामान्य रूप से वितरित हैं। माध्यिका ऊंचाई माध्य ऊंचाई के निकट है, और IQR अपेक्षाकृत छोटा है। कोई आउटलायर नहीं है, जो इंगित करता है कि कोई असामान्य प्रेक्षण नहीं हैं।
निष्कर्ष
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्यमान बनाने के लिए एक उपयोगी उपकरण हैं। इनका उपयोग विभिन्न डेटासेट की तुलना करने और आउटलायर की पहचान करने के लिए किया जा सकता है।
बॉक्स और व्हिस्कर प्लॉट के तत्व
एक बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण की एक ग्राफिकल प्रतिनिधित्व है। यह डेटासेट के पांच-संख्या सारांश को प्रदर्शित करने का एक मानकीकृत तरीका है: न्यूनतम, पहला क्वार्टाइल (Q1), माध्यिका, तीसरा क्वार्टाइल (Q3), और अधिकतम।
बॉक्स और व्हिस्कर प्लॉट के तत्व
एक बॉक्स और व्हिस्कर प्लॉट निम्नलिखित तत्वों से बना होता है:
- माध्यिका: माध्यिका डेटासेट में वह मध्य मान होता है जब इसे संख्यात्मक क्रम में व्यवस्थित किया जाता है। यह बॉक्स के बीच में एक रेखा द्वारा दर्शाया जाता है।
- बॉक्स: बॉक्स इंटरक्वार्टाइल रेंज (IQR) को दर्शाता है, जो तीसरे क्वार्टाइल (Q3) और पहले क्वार्टाइल (Q1) के बीच का अंतर होता है। IQR डेटा की परिवर्तनशीलता का एक माप है।
- व्हिस्कर: व्हिस्कर बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैले होते हैं। व्हिस्कर डेटा की सीमा को दर्शाते हैं।
- आउटलायर: आउटलायर वे डेटा बिंदु होते हैं जो बाकी डेटा से काफी अलग होते हैं। इन्हें व्हिस्कर के बाहर बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और व्हिस्कर प्लॉट की व्याख्या
एक बॉक्स और व्हिस्कर प्लॉट का उपयोग विभिन्न डेटासेट के वितरणों की तुलना करने के लिए किया जा सकता है। डेटासेट की माध्यिकाओं, IQR और सीमाओं की तुलना करके, आप डेटा की केंद्रीय प्रवृत्ति, परिवर्तनशीलता और फैलाव में अंतर की पहचान कर सकते हैं।
बॉक्स और व्हिस्कर प्लॉट आउटलायर की पहचान करने के लिए भी उपयोगी होते हैं। आउटलायर डेटा में त्रुटियों का संकेत दे सकते हैं या वे असामान्य प्रेक्षणों का प्रतिनिधित्व कर सकते हैं जिनकी जांच करना उपयोगी होता है।
डेटासेट में दो आउटलायर हैं, जो 110 सेमी और 240 सेमी पर स्थित बिंदुओं द्वारा दर्शाए गए हैं। ये आउटलायर डेटा में त्रुटियों का संकेत हो सकते हैं या फिर वे असामान्य प्रेक्षण हो सकते हैं जिनकी जांच करना उपयोगी है।
बॉक्स और व्हिस्कर प्लॉट बनाने के चरण
बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण की एक ग्राफिकल प्रस्तुति है। यह किसी डेटासेट के पांच-संख्या सारांश—न्यूनतम, प्रथम चतुर्थांश (Q1), माध्यिका, तृतीय चतुर्थांश (Q3) और अधिकतम—को प्रदर्शित करने का एक मानकीकृत तरीका है।
बॉक्स और व्हिस्कर प्लॉट बनाने के चरण
- अपना डेटा इकट्ठा करें। आपके पास कम से कम पाँच डेटा बिंदुओं का एक डेटासेट होना आवश्यक है।
- पांच-संख्या सारांश की गणना करें। पांच-संख्या सारांश में न्यूनतम, प्रथम चतुर्थांश (Q1), माध्यिका, तृतीय चतुर्थांश (Q3) और अधिकतम शामिल होते हैं।
- न्यूनतम डेटासेट का सबसे छोटा मान है।
- प्रथम चतुर्थांश (Q1) डेटा के निचले आधे की माध्यिका है।
- माध्यिका डेटासेट का मध्य मान है।
- तृतीय चतुर्थांश (Q3) डेटा के ऊपरी आधे की माध्यिका है।
- अधिकतम डेटासेट का सबसे बड़ा मान है।
- एक बॉक्स बनाएं। बॉक्स Q1 से Q3 तक खींचा जाता है। माध्यिका को बॉक्स के भीतर एक रेखा से चिह्नित किया जाता है।
- व्हिस्कर खींचें। व्हिस्कर बॉक्स से न्यूनतम और अधिकतम मानों तक फैलते हैं।
- लेबल जोड़ें। प्लॉट की अक्षों को उपयुक्त इकाइयों के साथ लेबल करें। आप चाहें तो माध्यिका, Q1 और Q3 को भी लेबल कर सकते हैं।
उदाहरण
निम्नलिखित एक बॉक्स और व्हिस्कर प्लॉट का उदाहरण है:
इस प्लॉट को बनाने के लिए उपयोग किया गया डेटा है:
10, 15, 20, 25, 30, 35, 40, 45, 50
इस डेटा के लिए पांच-संख्या सारांश है:
- न्यूनतम: 10
- Q1: 17.5
- माध्य: 30
- Q3: 42.5
- अधिकतम: 50
बॉक्स 17.5 से 42.5 तक खींचा गया है। माध्य को बॉक्स के अंदर 30 पर एक रेखा से चिह्नित किया गया है। व्हिस्कर बॉक्स से 10 और 50 तक फैले होते हैं।
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्य बनाने का एक उपयोगी तरीका है। इनका उपयोग विभिन्न डेटासेट की तुलना करने, आउटलाइयर की पहचान करने और उस जनसंख्या के बारे में अनुमान लगाने के लिए किया जा सकता है जिससे डेटा लिया गया है।
बॉक्स और व्हिस्कर प्लॉट के तत्व
एक बॉक्स और व्हिस्कर प्लॉट निम्नलिखित तत्वों से बना होता है:
- माध्यिका: माध्यिका वह मध्य मान है जब डेटासेट को संख्यात्मक क्रम में व्यवस्थित किया जाता है। इसे बॉक्स के बीच में एक रेखा द्वारा दर्शाया जाता है।
- चतुर्थक: चतुर्थक वे तीन मान हैं जो डेटासेट को चार बराबर भागों में विभाजित करते हैं। पहला चतुर्थक (Q1) वह मान है जिसके नीचे 25% डेटा आता है। दूसरा चतुर्थक (Q2) माध्यिका है। तीसरा चतुर्थक (Q3) वह मान है जिसके नीचे 75% डेटा आता है।
- अंतरचतुर्थक सीमा (IQR): IQR Q3 और Q1 के बीच का अंतर है। यह डेटा के मध्य 50% के फैलाव को दर्शाता है।
- विस्कर: विस्कर चतुर्थकों से डेटासेट के सबसे चरम मानों तक फैले होते हैं। ये डेटा की सीमा दिखाते हैं।
- आउटलायर: आउटलायर वे मान हैं जो शेष डेटा से काफी भिन्न होते हैं। इन्हें विस्कर के बाहर बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और विस्कर प्लॉट्स का महत्व
बॉक्स और विस्कर प्लॉट्स निम्नलिखित कारणों से महत्वपूर्ण हैं:
- वे डेटा के वितरण का दृश्य सारांश प्रदान करते हैं। बॉक्स और व्हिस्कर प्लॉट आपको किसी डेटासेट की माध्यिका, क्वार्टाइल और चरम मानों को तुरंत देखने देते हैं। यह जानकारी डेटा के समग्र आकार को समझने और किसी असामान्य प्रतिरूप की पहचान करने में सहायक हो सकती है।
- वे आउटलायर की पहचान करने में मदद करते हैं। आउटलायर की पहचान महत्वपूर्ण हो सकती है क्योंकि वे डेटा में त्रुटियों या असामान्य प्रेक्षणों को दर्शा सकते हैं जो रुचि के हो सकते हैं।
- वे कई डेटासेट की आसान तुलना की अनुमति देते हैं। बॉक्स और व्हिस्कर प्लॉट का उपयोग कई डेटासेट के वितरणों की तुलना करने के लिए किया जा सकता है। यह समूहों या उपचारों के बीच अंतर की पहचान करने में सहायक हो सकता है।
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्य बनाने के लिए एक शक्तिशाली उपकरण हैं। इन्हें बनाना और व्याख्या करना आसान है, और ये डेटा में मूल्यवान अंतर्दृष्टि प्रदान कर सकते हैं।
बॉक्स और व्हिस्कर प्लॉट हल उदाहरण
एक बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का एक ग्राफिकल प्रतिनिधित्व है। यह किसी डेटासेट की माध्यिका, क्वार्टाइल और चरम मानों को दिखाता है।
उदाहरण 1: माध्यिका, क्वार्टाइल और चरम मानों की खोज
निम्नलिखित डेटासेट पर विचार करें:
10, 15, 20, 25, 30, 35, 40, 45, 50
माध्यिका, क्वार्टाइल और चरम मानों को खोजने के लिए, हम पहले डेटा को आरोही क्रम में सॉर्ट करते हैं:
10, 15, 20, 25, 30, 35, 40, 45, 50
माध्यिका सॉर्ट किए गए डेटासेट का मध्य मान है। इस मामले में, माध्यिका 30 है।
चतुर्थांक वे तीन मान हैं जो क्रमबद्ध डेटासेट को चार बराबर भागों में विभाजित करते हैं। पहला चतुर्थांक (Q1) डेटा के निचले आधे का माध्यक है, दूसरा चतुर्थांक (Q2) संपूर्ण डेटासेट का माध्यक है, और तीसरा चतुर्थांक (Q3) डेटा के ऊपरी आधे का माध्यक है।
Q1 खोजने के लिए, हम डेटा के पहले आधे का माध्यक निकालते हैं:
10, 15, 20, 25
इस डेटा का माध्यक 17.5 है।
Q3 खोजने के लिए, हम डेटा के दूसरे आधे का माध्यक निकालते हैं:
35, 40, 45, 50
इस डेटा का माध्यक 42.5 है।
चरम मान डेटासेट में सबसे छोटे और सबसे बड़े मान होते हैं। इस मामले में, चरम मान 10 और 50 हैं।
उदाहरण 2: बॉक्स और व्हिस्कर प्लॉट की व्याख्या
उदाहरण 2 में बॉक्स और व्हिस्कर प्लॉट दिखाता है कि डेटासेट का माध्यक 30 है। चतुर्थांक 17.5 और 42.5 हैं। चरम मान 10 और 50 हैं।
बॉक्स और व्हिस्कर प्लॉट यह भी दिखाता है कि डेटा दाईं ओर विषम है। इसका अर्थ है कि माध्यक से ऊपर माध्यक से नीचे की तुलना में अधिक मान हैं।
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्यमान बनाने के लिए एक उपयोगी उपकरण हैं। इनका उपयोग डेटासेट के माध्यक, चतुर्थांक और चरम मानों की पहचान करने के लिए किया जा सकता है। इनका उपयोग विभिन्न डेटासेटों की तुलना करने के लिए भी किया जा सकता है।
बॉक्स और व्हिस्कर प्लॉट अक्सर पूछे जाने वाले प्रश्न
बॉक्स और व्हिस्कर प्लॉट क्या है?
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण की एक ग्राफिकल प्रस्तुति है। यह डेटासेट के माध्यक, चतुर्थांक और आउटलायरों को दिखाता है।
बॉक्स और व्हिस्कर प्लॉट के विभिन्न भाग क्या होते हैं?
बॉक्स और व्हिस्कर प्लॉट के विभिन्न भाग इस प्रकार हैं:
- बॉक्स: बॉक्स डेटा के मध्य 50% को दर्शाता है। बॉक्स की निचली सीमा पहला क्वार्टाइल (Q1) है, और बॉक्स की ऊपरी सीमा तीसरा क्वार्टाइल (Q3) है।
- माध्यिका: माध्यिका डेटासेट का मध्य मान होता है। यह बॉक्स के बीच में एक रेखा द्वारा दर्शाया जाता है।
- व्हिस्कर: व्हिस्कर बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैले होते हैं।
- आउटलायर: आउटलायर ऐसे डेटा बिंदु होते हैं जो बाकी डेटा से काफी अलग होते हैं। इन्हें व्हिस्कर के बाहर बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और व्हिस्कर प्लॉट की व्याख्या कैसे करें?
बॉक्स और व्हिस्कर प्लॉट की व्याख्या करने के लिए, आप निम्नलिखित को देख सकते हैं:
- माध्यिका: माध्यिका डेटा के केंद्र की माप है। यह आउटलायर से प्रभावित नहीं होती।
- क्वार्टाइल: क्वार्टाइल डेटा को चार बराबर भागों में विभाजित करते हैं। पहला क्वार्टाइल (Q1) डेटा के निचले आधे की माध्यिका है, और तीसरा क्वार्टाइल (Q3) डेटा के ऊपरी आधे की माध्यिका है।
- व्हिस्कर: व्हिस्कर डेटा की सीमा दिखाते हैं। ये बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैले होते हैं।
- आउटलायर: आउटलायर ऐसे डेटा बिंदु होते हैं जो बाकी डेटा से काफी अलग होते हैं। इन्हें व्हिस्कर के बाहर बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और व्हिस्कर प्लॉट के कुछ उपयोग क्या हैं?
बॉक्स और व्हिस्कर प्लॉट का उपयोग निम्नलिखित के लिए किया जा सकता है:
- दो या अधिक डेटासेटों के वितरणों की तुलना करें।
- किसी डेटासेट में आउटलायर्स की पहचान करें।
- किसी डेटासेट की सीमा देखें।
- किसी डेटासेट के केंद्र का अनुमान लगाएं।
निष्कर्ष
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्यमान बनाने के लिए एक शक्तिशाली उपकरण हैं। इनका उपयोग डेटासेटों की तुलना करने, आउटलायर्स की पहचान करने और किसी डेटासेट की सीमा और केंद्र को देखने के लिए किया जा सकता है।