गणित बॉक्स और व्हिस्कर प्लॉट

Subject Hub

सामान्य Learning Resources

65%
Complete
12
Guides
8
Tests
5
Resources
7
Day Streak
Your Learning Path Active
2
3
🎯
Learn Practice Test Master
बॉक्स और व्हिस्कर प्लॉट

बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण की एक ग्राफिकल प्रस्तुति है। यह किसी डेटासेट के फाइव-नंबर सारांश—न्यूनतम, पहला क्वार्टाइल (Q1), माध्यिका, तीसरा क्वार्टाइल (Q3) और अधिकतम—को प्रदर्शित करने का एक मानकीकृत तरीका है।

बॉक्स और व्हिस्कर प्लॉट के घटक

एक बॉक्स और व्हिस्कर प्लॉट निम्नलिखित घटकों से बना होता है:

  • माध्यिका: माध्यिका डेटासेट का मध्य मान होता है जब उसे संख्यात्मक क्रम में व्यवस्थित किया जाता है। यह बॉक्स के बीच में एक रेखा द्वारा दर्शाया जाता है।
  • बॉक्स: बॉक्स इंटरक्वार्टाइल रेंज (IQR) को दर्शाता है, जो तीसरे क्वार्टाइल (Q3) और पहले क्वार्टाइल (Q1) के बीच का अंतर है। IQR डेटा के फैलाव का एक माप है।
  • व्हिस्कर: व्हिस्कर बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैले होते हैं। व्हिस्कर डेटा की रेंज दिखाते हैं।
  • आउटलायर: आउटलायर वे डेटा बिंदु होते हैं जो शेष डेटा से काफी भिन्न होते हैं। इन्हें व्हिस्कर के बाहर व्यक्तिगत बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और व्हिस्कर प्लॉट की व्याख्या

बॉक्स और व्हिस्कर प्लॉट का उपयोग विभिन्न डेटासेटों के वितरणों की तुलना करने के लिए किया जा सकता है। इसका उपयोग आउटलायरों की पहचान करने के लिए भी किया जा सकता है।

बॉक्स और व्हिस्कर प्लॉट की व्याख्या करते समय इन बातों पर ध्यान दें:

  • माध्यिका: माध्यिका डेटा के केंद्र की माप है। एक उच्चतर माध्यिका इंगित करती है कि डेटा उच्च मानों की ओर झुका है, जबकि एक निम्न माध्यिका इंगित करती है कि डेटा निम्न मानों की ओर झुका है।
  • अंतरचतुर्थक परास (IQR): IQR डेटा के फैलाव की माप है। एक बड़ा IQR इंगित करता है कि डेटा अधिक फैला हुआ है, जबकि एक छोटा IQR इंगित करता है कि डेटा अधिक संकुचित है।
  • व्हिस्कर: व्हिस्कर डेटा की सीमा दिखाते हैं। लंबे व्हिस्कर इंगित करते हैं कि डेटा अधिक परिवर्तनशील है, जबकि छोटे व्हिस्कर इंगित करते हैं कि डेटा कम परिवर्तनशील है।
  • आउटलायर: आउटलायर ऐसे डेटा बिंदु होते हैं जो शेष डेटा से काफी भिन्न होते हैं। ये डेटा संग्रह में त्रुटियों या असामान्य प्रेक्षणों की उपस्थिति के कारण हो सकते हैं।
बॉक्स और व्हिस्कर प्लॉट का उदाहरण

माध्यिका ऊंचाई 175 सेमी है। IQR 20 सेमी है। व्हिस्कर 150 सेमी से 200 सेमी तक फैले हैं। कोई आउटलायर नहीं है।

यह बॉक्स और व्हिस्कर प्लॉट दिखाता है कि इस समूह में लोगों की ऊंचाइयाँ सामान्य रूप से वितरित हैं। माध्यिका ऊंचाई माध्य ऊंचाई के निकट है, और IQR अपेक्षाकृत छोटा है। कोई आउटलायर नहीं है, जो इंगित करता है कि कोई असामान्य प्रेक्षण नहीं हैं।

निष्कर्ष

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्यमान बनाने के लिए एक उपयोगी उपकरण हैं। इनका उपयोग विभिन्न डेटासेट की तुलना करने और आउटलायर की पहचान करने के लिए किया जा सकता है।

बॉक्स और व्हिस्कर प्लॉट के तत्व

एक बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण की एक ग्राफिकल प्रतिनिधित्व है। यह डेटासेट के पांच-संख्या सारांश को प्रदर्शित करने का एक मानकीकृत तरीका है: न्यूनतम, पहला क्वार्टाइल (Q1), माध्यिका, तीसरा क्वार्टाइल (Q3), और अधिकतम।

बॉक्स और व्हिस्कर प्लॉट के तत्व

एक बॉक्स और व्हिस्कर प्लॉट निम्नलिखित तत्वों से बना होता है:

  • माध्यिका: माध्यिका डेटासेट में वह मध्य मान होता है जब इसे संख्यात्मक क्रम में व्यवस्थित किया जाता है। यह बॉक्स के बीच में एक रेखा द्वारा दर्शाया जाता है।
  • बॉक्स: बॉक्स इंटरक्वार्टाइल रेंज (IQR) को दर्शाता है, जो तीसरे क्वार्टाइल (Q3) और पहले क्वार्टाइल (Q1) के बीच का अंतर होता है। IQR डेटा की परिवर्तनशीलता का एक माप है।
  • व्हिस्कर: व्हिस्कर बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैले होते हैं। व्हिस्कर डेटा की सीमा को दर्शाते हैं।
  • आउटलायर: आउटलायर वे डेटा बिंदु होते हैं जो बाकी डेटा से काफी अलग होते हैं। इन्हें व्हिस्कर के बाहर बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और व्हिस्कर प्लॉट की व्याख्या

एक बॉक्स और व्हिस्कर प्लॉट का उपयोग विभिन्न डेटासेट के वितरणों की तुलना करने के लिए किया जा सकता है। डेटासेट की माध्यिकाओं, IQR और सीमाओं की तुलना करके, आप डेटा की केंद्रीय प्रवृत्ति, परिवर्तनशीलता और फैलाव में अंतर की पहचान कर सकते हैं।

बॉक्स और व्हिस्कर प्लॉट आउटलायर की पहचान करने के लिए भी उपयोगी होते हैं। आउटलायर डेटा में त्रुटियों का संकेत दे सकते हैं या वे असामान्य प्रेक्षणों का प्रतिनिधित्व कर सकते हैं जिनकी जांच करना उपयोगी होता है।

डेटासेट में दो आउटलायर हैं, जो 110 सेमी और 240 सेमी पर स्थित बिंदुओं द्वारा दर्शाए गए हैं। ये आउटलायर डेटा में त्रुटियों का संकेत हो सकते हैं या फिर वे असामान्य प्रेक्षण हो सकते हैं जिनकी जांच करना उपयोगी है।

बॉक्स और व्हिस्कर प्लॉट बनाने के चरण

बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण की एक ग्राफिकल प्रस्तुति है। यह किसी डेटासेट के पांच-संख्या सारांश—न्यूनतम, प्रथम चतुर्थांश (Q1), माध्यिका, तृतीय चतुर्थांश (Q3) और अधिकतम—को प्रदर्शित करने का एक मानकीकृत तरीका है।

बॉक्स और व्हिस्कर प्लॉट बनाने के चरण
  1. अपना डेटा इकट्ठा करें। आपके पास कम से कम पाँच डेटा बिंदुओं का एक डेटासेट होना आवश्यक है।
  2. पांच-संख्या सारांश की गणना करें। पांच-संख्या सारांश में न्यूनतम, प्रथम चतुर्थांश (Q1), माध्यिका, तृतीय चतुर्थांश (Q3) और अधिकतम शामिल होते हैं।
    • न्यूनतम डेटासेट का सबसे छोटा मान है।
    • प्रथम चतुर्थांश (Q1) डेटा के निचले आधे की माध्यिका है।
    • माध्यिका डेटासेट का मध्य मान है।
    • तृतीय चतुर्थांश (Q3) डेटा के ऊपरी आधे की माध्यिका है।
    • अधिकतम डेटासेट का सबसे बड़ा मान है।
  3. एक बॉक्स बनाएं। बॉक्स Q1 से Q3 तक खींचा जाता है। माध्यिका को बॉक्स के भीतर एक रेखा से चिह्नित किया जाता है।
  4. व्हिस्कर खींचें। व्हिस्कर बॉक्स से न्यूनतम और अधिकतम मानों तक फैलते हैं।
  5. लेबल जोड़ें। प्लॉट की अक्षों को उपयुक्त इकाइयों के साथ लेबल करें। आप चाहें तो माध्यिका, Q1 और Q3 को भी लेबल कर सकते हैं।
उदाहरण

निम्नलिखित एक बॉक्स और व्हिस्कर प्लॉट का उदाहरण है:

इस प्लॉट को बनाने के लिए उपयोग किया गया डेटा है:

10, 15, 20, 25, 30, 35, 40, 45, 50

इस डेटा के लिए पांच-संख्या सारांश है:

  • न्यूनतम: 10
  • Q1: 17.5
  • माध्य: 30
  • Q3: 42.5
  • अधिकतम: 50

बॉक्स 17.5 से 42.5 तक खींचा गया है। माध्य को बॉक्स के अंदर 30 पर एक रेखा से चिह्नित किया गया है। व्हिस्कर बॉक्स से 10 और 50 तक फैले होते हैं।

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्य बनाने का एक उपयोगी तरीका है। इनका उपयोग विभिन्न डेटासेट की तुलना करने, आउटलाइयर की पहचान करने और उस जनसंख्या के बारे में अनुमान लगाने के लिए किया जा सकता है जिससे डेटा लिया गया है।

बॉक्स और व्हिस्कर प्लॉट के तत्व

एक बॉक्स और व्हिस्कर प्लॉट निम्नलिखित तत्वों से बना होता है:

  • माध्यिका: माध्यिका वह मध्य मान है जब डेटासेट को संख्यात्मक क्रम में व्यवस्थित किया जाता है। इसे बॉक्स के बीच में एक रेखा द्वारा दर्शाया जाता है।
  • चतुर्थक: चतुर्थक वे तीन मान हैं जो डेटासेट को चार बराबर भागों में विभाजित करते हैं। पहला चतुर्थक (Q1) वह मान है जिसके नीचे 25% डेटा आता है। दूसरा चतुर्थक (Q2) माध्यिका है। तीसरा चतुर्थक (Q3) वह मान है जिसके नीचे 75% डेटा आता है।
  • अंतरचतुर्थक सीमा (IQR): IQR Q3 और Q1 के बीच का अंतर है। यह डेटा के मध्य 50% के फैलाव को दर्शाता है।
  • विस्कर: विस्कर चतुर्थकों से डेटासेट के सबसे चरम मानों तक फैले होते हैं। ये डेटा की सीमा दिखाते हैं।
  • आउटलायर: आउटलायर वे मान हैं जो शेष डेटा से काफी भिन्न होते हैं। इन्हें विस्कर के बाहर बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और विस्कर प्लॉट्स का महत्व

बॉक्स और विस्कर प्लॉट्स निम्नलिखित कारणों से महत्वपूर्ण हैं:

  • वे डेटा के वितरण का दृश्य सारांश प्रदान करते हैं। बॉक्स और व्हिस्कर प्लॉट आपको किसी डेटासेट की माध्यिका, क्वार्टाइल और चरम मानों को तुरंत देखने देते हैं। यह जानकारी डेटा के समग्र आकार को समझने और किसी असामान्य प्रतिरूप की पहचान करने में सहायक हो सकती है।
  • वे आउटलायर की पहचान करने में मदद करते हैं। आउटलायर की पहचान महत्वपूर्ण हो सकती है क्योंकि वे डेटा में त्रुटियों या असामान्य प्रेक्षणों को दर्शा सकते हैं जो रुचि के हो सकते हैं।
  • वे कई डेटासेट की आसान तुलना की अनुमति देते हैं। बॉक्स और व्हिस्कर प्लॉट का उपयोग कई डेटासेट के वितरणों की तुलना करने के लिए किया जा सकता है। यह समूहों या उपचारों के बीच अंतर की पहचान करने में सहायक हो सकता है।

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्य बनाने के लिए एक शक्तिशाली उपकरण हैं। इन्हें बनाना और व्याख्या करना आसान है, और ये डेटा में मूल्यवान अंतर्दृष्टि प्रदान कर सकते हैं।

बॉक्स और व्हिस्कर प्लॉट हल उदाहरण

एक बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का एक ग्राफिकल प्रतिनिधित्व है। यह किसी डेटासेट की माध्यिका, क्वार्टाइल और चरम मानों को दिखाता है।

उदाहरण 1: माध्यिका, क्वार्टाइल और चरम मानों की खोज

निम्नलिखित डेटासेट पर विचार करें:

10, 15, 20, 25, 30, 35, 40, 45, 50

माध्यिका, क्वार्टाइल और चरम मानों को खोजने के लिए, हम पहले डेटा को आरोही क्रम में सॉर्ट करते हैं:

10, 15, 20, 25, 30, 35, 40, 45, 50

माध्यिका सॉर्ट किए गए डेटासेट का मध्य मान है। इस मामले में, माध्यिका 30 है।

चतुर्थांक वे तीन मान हैं जो क्रमबद्ध डेटासेट को चार बराबर भागों में विभाजित करते हैं। पहला चतुर्थांक (Q1) डेटा के निचले आधे का माध्यक है, दूसरा चतुर्थांक (Q2) संपूर्ण डेटासेट का माध्यक है, और तीसरा चतुर्थांक (Q3) डेटा के ऊपरी आधे का माध्यक है।

Q1 खोजने के लिए, हम डेटा के पहले आधे का माध्यक निकालते हैं:

10, 15, 20, 25

इस डेटा का माध्यक 17.5 है।

Q3 खोजने के लिए, हम डेटा के दूसरे आधे का माध्यक निकालते हैं:

35, 40, 45, 50

इस डेटा का माध्यक 42.5 है।

चरम मान डेटासेट में सबसे छोटे और सबसे बड़े मान होते हैं। इस मामले में, चरम मान 10 और 50 हैं।

उदाहरण 2: बॉक्स और व्हिस्कर प्लॉट की व्याख्या

उदाहरण 2 में बॉक्स और व्हिस्कर प्लॉट दिखाता है कि डेटासेट का माध्यक 30 है। चतुर्थांक 17.5 और 42.5 हैं। चरम मान 10 और 50 हैं।

बॉक्स और व्हिस्कर प्लॉट यह भी दिखाता है कि डेटा दाईं ओर विषम है। इसका अर्थ है कि माध्यक से ऊपर माध्यक से नीचे की तुलना में अधिक मान हैं।

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्यमान बनाने के लिए एक उपयोगी उपकरण हैं। इनका उपयोग डेटासेट के माध्यक, चतुर्थांक और चरम मानों की पहचान करने के लिए किया जा सकता है। इनका उपयोग विभिन्न डेटासेटों की तुलना करने के लिए भी किया जा सकता है।

बॉक्स और व्हिस्कर प्लॉट अक्सर पूछे जाने वाले प्रश्न
बॉक्स और व्हिस्कर प्लॉट क्या है?

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण की एक ग्राफिकल प्रस्तुति है। यह डेटासेट के माध्यक, चतुर्थांक और आउटलायरों को दिखाता है।

बॉक्स और व्हिस्कर प्लॉट के विभिन्न भाग क्या होते हैं?

बॉक्स और व्हिस्कर प्लॉट के विभिन्न भाग इस प्रकार हैं:

  • बॉक्स: बॉक्स डेटा के मध्य 50% को दर्शाता है। बॉक्स की निचली सीमा पहला क्वार्टाइल (Q1) है, और बॉक्स की ऊपरी सीमा तीसरा क्वार्टाइल (Q3) है।
  • माध्यिका: माध्यिका डेटासेट का मध्य मान होता है। यह बॉक्स के बीच में एक रेखा द्वारा दर्शाया जाता है।
  • व्हिस्कर: व्हिस्कर बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैले होते हैं।
  • आउटलायर: आउटलायर ऐसे डेटा बिंदु होते हैं जो बाकी डेटा से काफी अलग होते हैं। इन्हें व्हिस्कर के बाहर बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और व्हिस्कर प्लॉट की व्याख्या कैसे करें?

बॉक्स और व्हिस्कर प्लॉट की व्याख्या करने के लिए, आप निम्नलिखित को देख सकते हैं:

  • माध्यिका: माध्यिका डेटा के केंद्र की माप है। यह आउटलायर से प्रभावित नहीं होती।
  • क्वार्टाइल: क्वार्टाइल डेटा को चार बराबर भागों में विभाजित करते हैं। पहला क्वार्टाइल (Q1) डेटा के निचले आधे की माध्यिका है, और तीसरा क्वार्टाइल (Q3) डेटा के ऊपरी आधे की माध्यिका है।
  • व्हिस्कर: व्हिस्कर डेटा की सीमा दिखाते हैं। ये बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैले होते हैं।
  • आउटलायर: आउटलायर ऐसे डेटा बिंदु होते हैं जो बाकी डेटा से काफी अलग होते हैं। इन्हें व्हिस्कर के बाहर बिंदुओं द्वारा दर्शाया जाता है।
बॉक्स और व्हिस्कर प्लॉट के कुछ उपयोग क्या हैं?

बॉक्स और व्हिस्कर प्लॉट का उपयोग निम्नलिखित के लिए किया जा सकता है:

  • दो या अधिक डेटासेटों के वितरणों की तुलना करें।
  • किसी डेटासेट में आउटलायर्स की पहचान करें।
  • किसी डेटासेट की सीमा देखें।
  • किसी डेटासेट के केंद्र का अनुमान लगाएं।
निष्कर्ष

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्यमान बनाने के लिए एक शक्तिशाली उपकरण हैं। इनका उपयोग डेटासेटों की तुलना करने, आउटलायर्स की पहचान करने और किसी डेटासेट की सीमा और केंद्र को देखने के लिए किया जा सकता है।