गणितीय प्रतिगमन रेखाएँ
Subject Hub
सामान्य Learning Resources
रिग्रेशन क्या है?
रिग्रेशन एक सांख्यिकीय विधि है जिसका उपयोग किसी सतत चर (आश्रित चर) के मान की भविष्यवाणी करने के लिए किया जाता है, जो एक या अधिक अन्य चरों (स्वतंत्र चरों) के मानों पर आधारित होता है। यह एक शक्तिशाली उपकरण है जिसका उपयोग चरों के बीच संबंध को समझने और भविष्य के परिणामों की भविष्यवाणी करने के लिए किया जा सकता है।
रिग्रेशन के प्रकार
रिग्रेशन के कई अलग-अलग प्रकार होते हैं, जिनमें से प्रत्येक की अपनी ताकतें और कमजोरियाँ होती हैं। सबसे सामान्य प्रकार के रिग्रेशन हैं:
- सरल रेखीय रिग्रेशन: यह रिग्रेशन का सबसे सरल प्रकार है, और इसमें एकल आश्रित चर के मान की भविष्यवाणी एकल स्वतंत्र चर के मान के आधार पर की जाती है।
- बहु रेखीय रिग्रेशन: इस प्रकार के रिग्रेशन में एकल आश्रित चर के मान की भविष्यवाणी दो या अधिक स्वतंत्र चरों के मानों के आधार पर की जाती है।
- अरेखीय रिग्रेशन: इस प्रकार के रिग्रेशन में आश्रित चर के मान की भविष्यवाणी एक या अधिक ऐसे स्वतंत्र चरों के मानों के आधार पर की जाती है जो रेखीय रूप से संबंधित नहीं होते।
- लॉजिस्टिक रिग्रेशन: इस प्रकार के रिग्रेशन का उपयोग किसी घटना के घटित होने की प्रायिकता की भविष्यवाणी करने के लिए किया जाता है, जो एक या अधिक स्वतंत्र चरों के मानों पर आधारित होती है।
रिग्रेशन के अनुप्रयोग
रिग्रेशन का उपयोग विभिन्न प्रकार के अनुप्रयोगों में किया जाता है, जिनमें शामिल हैं:
- बिक्री की भविष्यवाणी करना: व्यवसाय विज्ञापन पर खर्च, आर्थिक परिस्थितियाँ और उत्पाद की कीमत जैसे कारकों के आधार पर बिक्री की भविष्यवाणी करने के लिए रिग्रेशन का उपयोग कर सकते हैं।
- मौसम का पूर्वानुमान: मौसम वैज्ञानिक तापमान, आर्द्रता और हवा की गति जैसे कारकों के आधार पर मौसम का पूर्वानुमान लगाने के लिए रिग्रेशन का उपयोग करते हैं।
- चिकित्सा उपचारों का मूल्यांकन: डॉक्टर रोगी की उम्र, लिंग और चिकित्सा इतिहास जैसे कारकों के आधार पर चिकित्सा उपचारों की प्रभावशीलता का मूल्यांकन करने के लिए रिग्रेशन का उपयोग कर सकते हैं।
- वित्तीय डेटा का विश्लेषण: निवेशक वित्तीय डेटा का विश्लेषण करने और निवेश निर्णय लेने के लिए रिग्रेशन का उपयोग कर सकते हैं।
रिग्रेशन के फायदे और नुकसान
रिग्रेशन एक शक्तिशाली उपकरण है, लेकिन इसकी कुछ सीमाएँ भी हैं। रिग्रेशन के कुछ फायदे इस प्रकार हैं:
- सरलता: रिग्रेशन को समझना और उपयोग करना अपेक्षाकृत आसान है।
- लचीलापन: रिग्रेशन का उपयोग विभिन्न स्वतंत्र चरों के आधार पर विभिन्न प्रकार के आश्रित चरों की भविष्यवाणी करने के लिए किया जा सकता है।
- सटीकता: जब डेटा अच्छी तरह से व्यवहार करता है, तो रिग्रेशन बहुत सटीक हो सकता है।
रिग्रेशन के कुछ नुकसान इस प्रकार हैं:
- ओवरफिटिंग: रिग्रेशन डेटा पर ओवरफिट हो सकता है, जिसका अर्थ है कि यह एक ऐसा मॉडल बना सकता है जो बहुत जटिल होता है और नए डेटा पर अच्छी तरह जनरलाइज़ नहीं होता।
- बहु-सहरेखीयता: बहु-सहरेखीयता तब होती है जब दो या अधिक स्वतंत्र चर आपस में अत्यधिक सहसंबद्ध होते हैं, जिससे रिग्रेशन के परिणामों की व्याख्या करना कठिन हो जाता है।
- आउटलायर: आउटलायर वे डेटा बिंदु होते हैं जो शेष डेटा से उल्लेखनीय रूप से भिन्न होते हैं, और वे रिग्रेशन के परिणामों को विकृत कर सकते हैं।
रिग्रेशन एक शक्तिशाली सांख्यिकीय उपकरण है जिसका उपयोग चरों के बीच संबंध को समझने और भविष्य के परिणामों की भविष्यवाणी करने के लिए किया जा सकता है। हालांकि, इसे उपयोग में लाने से पहले रिग्रेशन की सीमाओं से अवगत होना महत्वपूर्ण है।
रिग्रेशन सूत्र
रिग्रेशन विश्लेषण एक सांख्यिकीय तकनीक है जिसका उपयोग एक आश्रित चर और एक या अधिक स्वतंत्र चरों के बीच संबंध निर्धारित करने के लिए किया जाता है। रिग्रेशन विश्लेषण का लक्ष्य सबसे उपयुक्त रेखा या वक्र खोजना होता है जो चरों के बीच संबंध का वर्णन करता है।
कई प्रकार के रिग्रेशन सूत्र होते हैं, प्रत्येक की अपनी ताकतें और कमजोरियाँ होती हैं। सबसे सामान्य प्रकार का रिग्रेशन सूत्र रैखिक रिग्रेशन सूत्र है, जिसका उपयोग चरों के बीच रैखिक संबंधों को मॉडल करने के लिए किया जाता है। अन्य प्रकार के रिग्रेशन सूत्रों में लॉजिस्टिक रिग्रेशन सूत्र शामिल है, जिसका उपयोग चरों के बीच गैर-रैखिक संबंधों को मॉडल करने के लिए किया जाता है, और बहुपद रिग्रेशन सूत्र, जिसका उपयोग चरों के बीच ऐसे संबंधों को मॉडल करने के लिए किया जाता है जो न तो रैखिक होते हैं और न ही गैर-रैखिक।
रैखिक रिग्रेशन सूत्र
रैखिक रिग्रेशन सूत्र रिग्रेशन सूत्रों का सबसे सरल प्रकार है, और इसका उपयोग चरों के बीच रैखिक संबंधों को मॉडल करने के लिए किया जाता है। रैखिक रिग्रेशन का सूत्र है:
$$ y = mx + b $$
जहाँ:
- y आश्रित चर है
- x स्वतंत्र चर है
- m रेखा की ढाल है
- b y-अंतःखंड है
रेखा की ढाल (m) आश्रित चर (y) में प्रत्येक इकाई परिवर्तन के लिए स्वतंत्र चर (x) में परिवर्तन को दर्शाती है। y-अंतःखंड (b) आश्रित चर (y) का वह मान दर्शाता है जब स्वतंत्र चर (x) शून्य के बराबर होता है।
लॉजिस्टिक रिग्रेशन सूत्र
लॉजिस्टिक रिग्रेशन सूत्र का उपयोग चरों के बीच गैर-रैखिक संबंधों को मॉडल करने के लिए किया जाता है। लॉजिस्टिक रिग्रेशन का सूत्र है:
$$ y = 1 / (1 + e^{(-(mx + b))}) $$
जहाँ:
- y आश्रित चर है
- x स्वतंत्र चर है
- m वक्र की ढाल है
- b y-अंतःखंड है
लॉजिस्टिक रिग्रेशन सूत्र एक सिग्मॉइड फंक्शन है, जिसका अर्थ है कि इसमें S-आकार की वक्र रेखा होती है। यह वक्र निर्भर चर (x) के नकारात्मक होने पर 0 से प्रारंभ होता है, और निर्भर चर (x) के बढ़ने के साथ यह 1 तक बढ़ता है।
पॉलिनोमियल रिग्रेशन सूत्र
पॉलिनोमियल रिग्रेशन सूत्र का उपयोग उन चरों के बीच संबंधों को मॉडल करने के लिए किया जाता है जो रैखिक या गैर-रैखिक नहीं होते हैं। पॉलिनोमियल रिग्रेशन का सूत्र है:
$$ y = a0 + a1x + a2x^2 + … + anxn $$
जहाँ:
- y आश्रित चर है
- x स्वतंत्र चर है
- a0, a1, a2, …, an पॉलिनोमियल के गुणांक हैं
पॉलिनोमियल रिग्रेशन सूत्र का उपयोग चरों के बीच किसी भी प्रकार के संबंध को मॉडल करने के लिए किया जा सकता है, चाहे उसकी आकृति कैसी भी हो। हालाँकि, जितना जटिल संबंध होगा, उतने ही अधिक पदों की पॉलिनोमियल में आवश्यकता होगी।
सही रिग्रेशन सूत्र चुनना
कौन-सा रिग्रेशन सूत्र उपयोग करना है, यह मॉडल किए जा रहे चरों के बीच संबंध के प्रकार पर निर्भर करता है। यदि संबंध रैखिक है, तो रैखिक रिग्रेशन सूत्र का उपयोग किया जाना चाहिए। यदि संबंध गैर-रैखिक है, तो लॉजिस्टिक रिग्रेशन सूत्र या पॉलिनोमियल रिग्रेशन सूत्र का उपयोग किया जाना चाहिए।
यह ध्यान रखना महत्वपूर्ण है कि रिग्रेशन विश्लेषण एक सांख्यिकीय तकनीक है, और यह हमेशा संभव नहीं होता कि डेटा और रिग्रेशन रेखा या वक्र के बीच एक perfect fit मिले। हालाँकि, रिग्रेशन विश्लेषण चरों के बीच संबंध को समझने और भविष्यवाणियाँ करने के लिए एक मूल्यवान उपकरण हो सकता है।
रिग्रेशन रेखा से संबंधित प्रायः पूछे जाने वाले प्रश्न
रिग्रेशन रेखा क्या है?
रिग्रेशन रेखा एक सीधी रेखा होती है जो डेटा बिंदुओं के समुच्चय को सबसे अच्छी तरह फिट करती है। इसका उपयोग एक चर (आश्रित चर) का मान दूसरे चर (स्वतंत्र चर) के मान के आधार पर भविष्यवाणी करने के लिए किया जाता है।
रिग्रेशन रेखा की गणना कैसे की जाती है?
रिग्रेशन रेखा की गणना एक सांख्यिकीय तकनीक ‘न्यूनतम वर्ग’ (least squares) का उपयोग करके की जाती है। यह तकनीक डेटा बिंदुओं और रेखा के बीच की वर्गित दूरियों के योग को न्यूनतम करती है।
रिग्रेशन रेखा की ढलान क्या है?
रिग्रेशन रेखा की ढलान वह मान है जिससे आश्रित चर में एक इकाई की वृद्धि होती है जब स्वतंत्र चर में एक इकाई की वृद्धि होती है।
रिग्रेशन रेखा का y-अंतःखंड क्या है?
रिग्रेशन रेखा का y-अंतःखंड आश्रित चर का वह मान है जब स्वतंत्र चर शून्य के बराबर होता है।
निर्धारण गुणांक क्या है?
निर्धारण गुणांक (R²) एक माप है जो दर्शाता है कि रिग्रेशन रेखा डेटा को कितनी अच्छी तरह फिट करती है। यह आश्रित चर और स्वतंत्र चर के बीच सहसंबंध गुणांक का वर्ग होता है।
रैखिक रिग्रेशन की क्या-क्या मान्यताएँ हैं?
रैखिक रिग्रेशन की मान्यताएँ हैं:
- आश्रित चर और स्वतंत्र चर के बीच संबंध रैखिक है।
- डेटा बिंदु एक-दूसरे से स्वतंत्र हैं।
- आश्रित चर का प्रसार स्वतंत्र चर के सभी मानों के लिए स्थिर है।
- त्रुटियाँ सामान्य रूप से वितरित हैं।
रैखिक प्रतिगमन की सीमाएँ क्या हैं?
रैखिक प्रतिगमन की सीमाएँ हैं:
- इसका उपयोग केवल एक आश्रित चर का मान एक स्वतंत्र चर के मान के आधार पर भविष्यवाणी करने के लिए किया जा सकता है।
- इसका उपयोग उस आश्रित चर के मान की भविष्यवाणी करने के लिए नहीं किया जा सकता जो स्वतंत्र चर से रैखिक रूप से संबंधित नहीं है।
- इसका उपयोग उस आश्रित चर के मान की भविष्यवाणी करने के लिए नहीं किया जा सकता जो मॉडल में अन्य चरों से स्वतंत्र नहीं है।
- इसका उपयोग उस आश्रित चर के मान की भविष्यवाणी करने के लिए नहीं किया जा सकता जो सामान्य रूप से वितरित नहीं है।
मुझे रैखिक प्रतिगमन कब उपयोग करना चाहिए?
रैखिक प्रतिगमन का उपयोग तब किया जाना चाहिए जब:
- आश्रित चर और स्वतंत्र चर के बीच संबंध रैखिक हो।
- डेटा बिंदु एक-दूसरे से स्वतंत्र हों।
- आश्रित चर का प्रसार स्वतंत्र चर के सभी मानों के लिए स्थिर हो।
- त्रुटियाँ सामान्य रूप से वितरित हों।
मुझे रैखिक प्रतिगमन कब उपयोग नहीं करना चाहिए?
रैखिक प्रतिगमन का उपयोग नहीं करना चाहिए जब:
- आश्रित चर और स्वतंत्र चर के बीच संबंध रैखिक नहीं है।
- डेटा बिंदु एक-दूसरे से स्वतंत्र नहीं हैं।
- आश्रित चर का प्रसरण स्वतंत्र चर के सभी मानों के लिए स्थिर नहीं है।
- त्रुटियाँ सामान्य रूप से वितरित नहीं हैं।