LASSO प्रतिगमन, जिसे L1 नियमितीकरण के रूप में भी जाना जाता है, एक लोकप्रिय तकनीक है जिसका उपयोग सांख्यिकीय मॉडलिंग और मशीन लर्निंग में चर के बीच संबंधों का अनुमान लगाने और भविष्यवाणियां करने के लिए किया जाता है। LASSO का मतलब है कम से कम निरपेक्ष सिकुड़न और चयन ऑपरेटर।LASSO प्रतिगमन का प्राथमिक लक्ष्य मॉडल सादगी और सटीकता के बीच संतुलन खोजना है।पायथन में रिज और लासो रिग्रेशन पारंपरिक रैखिक प्रतिगमन मॉडल में एक दंड शब्द जोड़कर इसे प्राप्त करता है, जो विरल समाधानों को प्रोत्साहित करता है जहां कुछ गुणांक बिल्कुल शून्य होने के लिए मजबूर होते हैं। यह सुविधा LASSO को सुविधा चयन के लिए विशेष रूप से उपयोगी बनाती है, क्योंकि यह स्वचालित रूप से अप्रासंगिक या अनावश्यक चर की पहचान कर सकती है और उन्हें हटा सकती है।
लैस्सो रिग्रेशन क्या है
what is lasso regression in hindi
लैस्सो रिग्रेशन एक नियमितीकरण तकनीक है। इसका उपयोग अधिक सटीक भविष्यवाणी के लिए प्रतिगमन विधियों पर किया जाता है। यह मॉडल सिकुड़न का उपयोग करता है। सिकुड़न वह है जहां डेटा मान माध्य के रूप में एक केंद्रीय बिंदु की ओर सिकुड़ जाते हैं। लैस्सो प्रक्रिया सरल, विरल मॉडल (यानी कम पैरामीटर वाले मॉडल) को प्रोत्साहित करती है। यह विशेष प्रकार का प्रतिगमन उन मॉडलों के लिए उपयुक्त है जो उच्च स्तर की बहुसंरेखता दिखाते हैं या जब आप मॉडल चयन के कुछ हिस्सों को स्वचालित करना चाहते हैं, जैसे कि चर चयन/पैरामीटर उन्मूलन।
लैस्सो रिग्रेशन L1 नियमितीकरण तकनीक का उपयोग करता है (इस लेख में बाद में चर्चा की जाएगी)। इसका उपयोग तब किया जाता है जब हमारे पास अधिक सुविधाएँ होती हैं क्योंकि यह स्वचालित रूप से सुविधा चयन करता है।
LASSO प्रतिगमन कैसे काम करता है इसकी चरण-दर-चरण व्याख्या यहां दी गई है:
1. लैस्सो रिग्रेशन रैखिक प्रतिगमन मॉडल – Lasso Regression Linear Regression Model in Hindi
LASSO प्रतिगमन मानक रैखिक प्रतिगमन मॉडल से शुरू होता है, जो स्वतंत्र चर (विशेषताओं) और आश्रित चर (लक्ष्य) के बीच एक रैखिक संबंध मानता है। रेखीय प्रतिगमन समीकरण को निम्नानुसार दर्शाया जा सकता है: मेकफ़ाइलकॉपी कोड y = β₀ + β₁x₁ + β₂x₂ + ... + βₚxₚ + ε
कहां:
y
आश्रित चर (लक्ष्य) है.β₀, β₁, β₂, ..., βₚ
अनुमानित किए जाने वाले गुणांक (पैरामीटर) हैं।x₁, x₂, ..., xₚ
स्वतंत्र चर (विशेषताएँ) हैं।ε
त्रुटि पद का प्रतिनिधित्व करता है.
2. लैस्सो L1 नियमितीकरण – Lasso L1 Regularization in Hindi
- LASSO प्रतिगमन गुणांक के निरपेक्ष मूल्यों के आधार पर एक अतिरिक्त दंड शब्द का परिचय देता है। L1 नियमितीकरण शब्द एक ट्यूनिंग पैरामीटर द्वारा गुणा किए गए गुणांक के निरपेक्ष मानों का योग है
λ
: scssCopy कोडL₁ = λ * (|β₁| + |β₂| + ... + |βₚ|)
जहां:λ
नियमितीकरण पैरामीटर है जो लागू नियमितीकरण की मात्रा को नियंत्रित करता है।β₁, β₂, ..., βₚ
गुणांक हैं.
3. उद्देश्य फ़ंक्शन – Objective function in Hindi
LASSO प्रतिगमन का उद्देश्य उन गुणांकों के मूल्यों को ढूंढना है जो अनुमानित मूल्यों और वास्तविक मूल्यों के बीच वर्ग अंतर के योग को कम करते हैं, जबकि L1 नियमितीकरण शब्द को भी कम करते हैं:मेकफ़ाइलकॉपी कोडMinimize: RSS + L₁
जहां:
RSS
वर्गों का अवशिष्ट योग है, जो अनुमानित मानों और वास्तविक मानों के बीच त्रुटि को मापता है।
4. श्रिंक गुणांक – Shrink coefficient in Hindi
L1 नियमितीकरण शब्द जोड़कर, LASSO प्रतिगमन गुणांक को शून्य तक सिकोड़ सकता है। जब λ
पर्याप्त रूप से बड़ा होता है, तो कुछ गुणांक बिल्कुल शून्य पर चला जाते हैं। LASSO की यह संपत्ति इसे फीचर चयन के लिए उपयोगी बनाती है, क्योंकि शून्य गुणांक वाले चर प्रभावी रूप से मॉडल से हटा दिए जाते हैं।
5. ट्यूनिंग पैरामीटरλλ
– Tuning parameters in Hindi
LASSO रिग्रेशन में नियमितीकरण पैरामीटर का चुनाव महत्वपूर्ण है। एक बड़ा λ
मूल्य नियमितीकरण की मात्रा को बढ़ाता है, जिससे अधिक गुणांक शून्य की ओर धकेल दिए जाते हैं। इसके विपरीत, एक छोटा λ
मान नियमितीकरण प्रभाव को कम कर देता है, जिससे अधिक चरों को गैर-शून्य गुणांक प्राप्त करने की अनुमति मिलती है।
6. मॉडल फिटिंग – Model fitting in Hindi
- LASSO प्रतिगमन में गुणांक का अनुमान लगाने के लिए, उद्देश्य फ़ंक्शन को कम करने के लिए एक अनुकूलन एल्गोरिदम का उपयोग किया जाता है। कोऑर्डिनेट डिसेंट आमतौर पर नियोजित किया जाता है, जो प्रत्येक गुणांक को स्थिर रखते हुए प्रत्येक गुणांक को पुनरावृत्त रूप से अद्यतन करता है।
LASSO प्रतिगमन भविष्यवाणी और सुविधा चयन दोनों के लिए एक शक्तिशाली रूपरेखा प्रदान करता है, खासकर जब उच्च-आयामी डेटासेट से निपटते समय जहां सुविधाओं की संख्या बड़ी होती है। सादगी और सटीकता के बीच संतुलन बनाकर, LASSO ओवरफिटिंग के जोखिम को प्रभावी ढंग से प्रबंधित करते हुए व्याख्या योग्य मॉडल प्रदान कर सकता है।
यह ध्यान देने योग्य है कि LASSO केवल एक प्रकार की नियमितीकरण तकनीक है, और इसके अन्य प्रकार भी हैं जैसे कि रिज रिग्रेशन (L2 नियमितीकरण) और इलास्टिक नेट
2024] आर्टिफिशियल इंटेलिजेंस चैटबॉट निर्माण | building chatbot from scratch in Hindi
लैस्सो का मतलब
meaning of lasso in hindi
शब्द “LASSO” का अर्थ L पूर्व A bsolute S रिंकेज और S चुनाव O पेरेटर है। लैस्सो का डेटा मॉडल और फीचर चयन के नियमितीकरण के लिए एक सांख्यिकीय सूत्र है।
पायथन में रिज और लासो रिग्रेशन नियमितीकरण
Ridge and Lasso Regression Regularization in Python in hindi
नियमितीकरण एक महत्वपूर्ण अवधारणा है जिसका उपयोग डेटा की ओवरफिटिंग से बचने के लिए किया जाता है, खासकर जब प्रशिक्षित और परीक्षण डेटा बहुत भिन्न होते हैं।
परीक्षण किए गए डेटा के साथ कम भिन्नता प्राप्त करने के लिए, प्रशिक्षित डेटा से प्राप्त सर्वोत्तम फिट में “दंड” शब्द जोड़कर नियमितीकरण लागू किया जाता है और उनके गुणांकों को संपीड़ित करके आउटपुट चर पर भविष्यवक्ता चर के प्रभाव को भी प्रतिबंधित किया जाता है।
नियमितीकरण में, हम आम तौर पर सुविधाओं की संख्या समान रखते हैं लेकिन गुणांकों के परिमाण को कम कर देते हैं। हम विभिन्न प्रकार की प्रतिगमन तकनीकों का उपयोग करके गुणांक के परिमाण को कम कर सकते हैं जो इस समस्या को दूर करने के लिए नियमितीकरण का उपयोग करता है। तो आइये उन पर चर्चा करते हैं। इससे पहले कि हम आगे बढ़ें, आप पायथन में लीनियर रिग्रेशन पर ऑनलाइन पाठ्यक्रमों की मदद से अपने कौशल को बढ़ा सकते हैं।
लैस्सो नियमितीकरण तकनीक
Lasso regularization technique in hindi
दो मुख्य नियमितीकरण तकनीकें हैं, अर्थात् रिज रिग्रेशन और लासो रिग्रेशन। वे दोनों गुणांकों पर जुर्माना लगाने के तरीके में भिन्न हैं। इस ब्लॉग में हम लैस्सो रेगुलराइजेशन तकनीक के बारे में और अधिक समझने की कोशिश करेंगे।
2024] आर्टिफिशियल इंटेलिजेंस चैटबॉट निर्माण | building chatbot from scratch in Hindi
पायथन में रिज और लासो रिग्रेशन – एल1 नियमितीकरण
Lasso L1 regularization in hindi
यदि कोई प्रतिगमन मॉडल L1 नियमितीकरण तकनीक का उपयोग करता है, तो इसे लासो प्रतिगमन कहा जाता है। यदि इसमें L2 नियमितीकरण तकनीक का उपयोग किया जाता है, तो इसे रिज रिग्रेशन कहा जाता है। हम इनके बारे में बाद के अनुभागों में और अधिक अध्ययन करेंगे।
L1 नियमितीकरण में एक जुर्माना जोड़ा जाता है जो गुणांक के परिमाण के पूर्ण मान के बराबर होता है। इस नियमितीकरण प्रकार के परिणामस्वरूप कुछ गुणांक वाले विरल मॉडल बन सकते हैं। कुछ गुणांक शून्य हो सकते हैं और मॉडल से समाप्त हो सकते हैं। बड़े दंडों के परिणामस्वरूप गुणांक मान शून्य के करीब होते हैं (सरल मॉडल बनाने के लिए आदर्श)। दूसरी ओर, L2 नियमितीकरण के परिणामस्वरूप विरल मॉडल या गुणांक का कोई उन्मूलन नहीं होता है।
इस प्रकार, रिज की तुलना में लैस्सो रिग्रेशन की व्याख्या करना आसान है। हालाँकि विषय को समझने में आपकी मदद के लिए ऑनलाइन पर्याप्त संसाधन उपलब्ध हैं, लेकिन प्रमाणपत्र से बेहतर कुछ नहीं है। डोमेन में कौशल बढ़ाने के लिए Panna Palto University का सर्वश्रेष्ठ कृत्रिम बुद्धिमत्ता पाठ्यक्रम ऑनलाइन देखें । यह कोर्स आपको नौकरी के लिए तैयार एआईएमएल कौशल विकसित करने के लिए शीर्ष रैंकिंग वाले वैश्विक स्कूल से सीखने में मदद करेगा। यह 12 महीने का कार्यक्रम शीर्ष संकाय और आकाओं के साथ व्यावहारिक सीखने का अनुभव प्रदान करता है। पूरा होने पर, आपको ऑस्टिन में टेक्सास विश्वविद्यालय और ग्रेट लेक्स एक्जीक्यूटिव लर्निंग से एक प्रमाणपत्र प्राप्त होगा।
2024] आर्टिफिशियल इंटेलिजेंस में विशेषज्ञ प्रणालियाँ | expert systems in ai in hindi
लैस्सो रिग्रेशन का गणितीय समीकरण
Lasso L1 regularization in hindi
वर्गों का अवशिष्ट योग + λ * (गुणांकों के परिमाण के निरपेक्ष मान का योग)
कहाँ,
- λ सिकुड़न की मात्रा को दर्शाता है।
- λ = 0 का तात्पर्य है कि सभी विशेषताओं पर विचार किया गया है और यह रैखिक प्रतिगमन के बराबर है जहां पूर्वानुमानित मॉडल बनाने के लिए केवल वर्गों के अवशिष्ट योग पर विचार किया जाता है
- λ = ∞ का तात्पर्य है कि किसी भी विशेषता पर विचार नहीं किया जाता है, जैसे ही λ अनंत के करीब आता है, यह अधिक से अधिक सुविधाओं को समाप्त कर देता है
- λ में वृद्धि के साथ पूर्वाग्रह बढ़ता है
- λ में कमी के साथ विचरण बढ़ता है
पायथन में लासो रिग्रेशन
Lasso Regression in Python in hindi
इस उदाहरण कोड के लिए, हम मशीन हैक के प्रीडिक्टिंग रेस्तरां फूड कॉस्ट हैकथॉन के डेटासेट पर विचार करेंगे ।
पायथन में रिज और लासो रिग्रेशन डेटा सेट के बारे में
यहां कार्य भोजन की औसत कीमत की भविष्यवाणी करने से संबंधित है। डेटा में निम्नलिखित विशेषताएं शामिल हैं।
- प्रशिक्षण सेट का आकार: 12,690 रिकॉर्ड
- परीक्षण सेट का आकार: 4,231 रिकॉर्ड
पायथन में रिज और लासो रिग्रेशन कॉलम/सुविधाएँ
रेस्तरां की वह विशेषता जो यह पहचानने में मदद कर सकती है कि यह किसके लिए और किसके लिए उपयुक्त है।
RESTAURANT_ID
प्रत्येक रेस्तरां के लिए एक अद्वितीय आईडी।
व्यंजन
रेस्तरां द्वारा पेश किए जाने वाले व्यंजनों की विविधता।
समय
रेस्तरां के खुले रहने का समय।
शहर
वह शहर जिसमें रेस्तरां स्थित है.
स्थान
रेस्तरां का स्थान.
रेटिंग
ग्राहकों द्वारा रेस्तरां की औसत रेटिंग।
वोट
रेस्तरां को प्राप्त कुल वोट।
पायथन में रिज और लासो रिग्रेशन लागत
दो व्यक्तियों के भोजन की औसत लागत।
फ़ीचर स्केलिंग (बहिष्कृत) तक सभी चरणों को पूरा करने के बाद, हम लासो रिग्रेशन के निर्माण के लिए आगे बढ़ सकते हैं। हम फीचर स्केलिंग से बच रहे हैं क्योंकि लैस्सो रिग्रेशन एक पैरामीटर के साथ आता है जो हमें मॉडल में फिट करते समय डेटा को सामान्य करने की अनुमति देता है।
2024] मशीन लर्निंग में पैटर्न पहचान | ai pattern recognition in hindi
लैस्सो प्रतिगमन उदाहरण
Lasso Regression Example in hindi
import numpy as np
एक नई ट्रेन और सत्यापन डेटासेट बनाना
from sklearn.model_selection import train_test_split data_train, data_val = train_test_split(new_data_train, test_size = 0.2, random_state = 2)
भविष्यवक्ताओं और लक्ष्य का वर्गीकरण
#Classifying Independent and Dependent Features #_______________________________________________ #Dependent Variable Y_train = data_train.iloc[:, -1].values #Independent Variables X_train = data_train.iloc[:,0 : -1].values #Independent Variables for Test Set X_test = data_val.iloc[:,0 : -1].values
आरएमएलएसई के साथ मॉडल का मूल्यांकन
def score(y_pred, y_true): error = np.square(np.log10(y_pred +1) – np.log10(y_true +1)).mean() ** 0.5 score = 1 – error return score actual_cost = list(data_val[‘COST’]) actual_cost = np.asarray(actual_cost)
लैस्सो रेजिस्टर का निर्माण
#Lasso Regression from sklearn.linear_model import Lasso #Initializing the Lasso Regressor with Normalization Factor as True lasso_reg = Lasso(normalize=True) #Fitting the Training data to the Lasso regressor lasso_reg.fit(X_train,Y_train) #Predicting for X_test y_pred_lass =lasso_reg.predict(X_test) #Printing the Score with RMLSE print(“\n\nLasso SCORE : “, score(y_pred_lass, actual_cost))
पायथन में रिज और लासो रिग्रेशन उत्पादन
0.7335508027883148
लासो रिग्रेशन ने दिए गए डेटासेट के साथ 73% की सटीकता प्राप्त की।
पायथन आर में लैस्सो रिग्रेशन
Lasso Regression in Python R in Hindi
आइए “द बिग मार्ट सेल्स” डेटासेट लें, हमारे पास एक श्रृंखला के कई आउटलेट के लिए उत्पाद-वार बिक्री है।
डेटासेट में, हम बेची गई वस्तु की विशेषताएं (वसा सामग्री, दृश्यता, प्रकार, कीमत) और आउटलेट की कुछ विशेषताएं (स्थापना का वर्ष, आकार, स्थान, प्रकार) और उस विशेष वस्तु के लिए बेची गई वस्तुओं की संख्या देख सकते हैं। . आइए देखें कि क्या हम इन सुविधाओं का उपयोग करके बिक्री का अनुमान लगा सकते हैं।
आइए डेटासेट का एक स्नैपशॉट लें:
आइए कोड करें!
त्वरित जाँच – गहन शिक्षण पाठ्यक्रम
Top 20] आर्टिफिशियल इंटेलिजेंस बुक 2024 | Best artificial intelligence books in hindi
पायथन में रिज और लासो रिग्रेशन
Ridge and Lasso Regression in Python in Hindi
लैस्सो रिग्रेशन रिज रिग्रेशन से अलग है क्योंकि यह सामान्यीकरण के लिए पूर्ण गुणांक मानों का उपयोग करता है।
चूंकि हानि फ़ंक्शन केवल पूर्ण गुणांक (भार) पर विचार करता है, अनुकूलन एल्गोरिदम उच्च गुणांक को दंडित करेगा। इसे L1 मानदंड के रूप में जाना जाता है।
उपरोक्त छवि में हम देख सकते हैं, बाधा कार्य (नीला क्षेत्र); बायां वाला लैस्सो के लिए है जबकि दायां रिज के लिए है, साथ ही लॉस फंक्शन यानी आरएसएस के लिए कंटूर (हरा ग्रहण) भी है।
उपरोक्त मामले में, दोनों प्रतिगमन तकनीकों के लिए, गुणांक का अनुमान पहले बिंदु द्वारा दिया जाता है जिस पर आकृति (एक ग्रहण) बाधा (सर्कल या हीरा) क्षेत्र से संपर्क करती है।
दूसरी ओर, हीरे के आकार के कारण लैस्सो बाधा में प्रत्येक अक्ष पर कोने होते हैं इसलिए ग्रहण अक्सर प्रत्येक अक्ष पर प्रतिच्छेद करेगा। उसके कारण, कम से कम एक गुणांक शून्य के बराबर होगा।
हालाँकि, लैस्सो प्रतिगमन, जब α पर्याप्त रूप से बड़ा होता है, तो कुछ गुणांक अनुमानों को घटाकर 0 कर देगा। यही कारण है कि लैस्सो विरल समाधान प्रदान करता है।
लैस्सो रिग्रेशन के साथ मुख्य समस्या यह है कि जब हमारे पास सहसंबद्ध चर होते हैं, तो यह केवल एक चर को बरकरार रखता है और अन्य सहसंबद्ध चर को शून्य पर सेट करता है। इससे संभवतः जानकारी की कुछ हानि होगी जिसके परिणामस्वरूप हमारे मॉडल में सटीकता कम हो जाएगी।
वह लैस्सो नियमितीकरण तकनीक थी, और मुझे आशा है कि अब आप इसे बेहतर तरीके से समझ सकते हैं। आप इसका उपयोग अपने मशीन लर्निंग मॉडल की सटीकता में सुधार के लिए कर सकते हैं।
2024] सबसे अधिक भुगतान वाली इंजीनियरिंग नौकरियां | Highest Paying Engineering Jobs in hindi
रिज रिग्रेशन और लासो रिग्रेशन के बीच अंतर
Difference Between Ridge Regression and Lasso Regression in hindi
रिज रिग्रेशन और लासो रिग्रेशन के बीच अंतर
रिज प्रतिगमन | लैस्सो प्रतिगमन |
---|---|
दंड अवधि गुणांकों (L2 नियमितीकरण) के वर्गों का योग है। | दंड अवधि गुणांकों (एल1 नियमितीकरण) के निरपेक्ष मूल्यों का योग है। |
गुणांकों को छोटा करता है लेकिन किसी भी गुणांक को शून्य पर सेट नहीं करता है। | फीचर चयन को प्रभावी ढंग से निष्पादित करते हुए, कुछ गुणांकों को शून्य तक सिकोड़ सकता है। |
बड़े गुणांकों को सिकोड़कर ओवरफिटिंग को कम करने में मदद करता है। | सिकुड़न और कम महत्व वाली सुविधाओं का चयन करके ओवरफिटिंग को कम करने में मदद करता है। |
बड़ी संख्या में सुविधाएँ होने पर यह अच्छा काम करता है। | कम संख्या में सुविधाएँ होने पर अच्छा काम करता है। |
गुणांकों की “सॉफ्ट थ्रेशोल्डिंग” करता है। | गुणांकों की “हार्ड थ्रेशोल्डिंग” करता है। |
संक्षेप में, रिज एक सिकुड़न मॉडल है, और लैस्सो एक फीचर चयन मॉडल है। रिज गुणांकों को कम करके पूर्वाग्रह-विचरण व्यापार को संतुलित करने का प्रयास करता है, लेकिन यह किसी भी सुविधा का चयन नहीं करता है और उन सभी को रखता है। लैस्सो कुछ गुणांकों को शून्य तक सिकोड़कर पूर्वाग्रह-विचरण व्यापार को संतुलित करने का प्रयास करता है। इस तरह, लैस्सो को फीचर चयन के लिए एक अनुकूलक के रूप में देखा जा सकता है।
लासो रिग्रेशन व्याख्याएँ और सामान्यीकरण
Lasso Regression Explanations and Generalizations in hindi
व्याख्याएँ :
- ज्यामितीय व्याख्याएँ
- बायेसियन व्याख्याएँ
- उत्तल विश्राम व्याख्याएँ
- सटीकता-सरलता के साथ λ की व्याख्या करना आसान बनाना
सामान्यीकरण
- इलास्टिक नेट
- समूह लासो
- फ़्यूज्ड लैस्सो
- अनुकूली लैस्सो
- पूर्व लैस्सो
- अर्ध-मानदंड और पुल प्रतिगमन
निष्कर्ष (conclusion)
LASSO प्रतिगमन एक मूल्यवान सांख्यिकीय मॉडलिंग और मशीन लर्निंग तकनीक है जो मॉडल की सादगी और सटीकता को संतुलित करती है। गुणांकों के पूर्ण मूल्यों के आधार पर दंड शब्द जोड़कर, LASSO मॉडल में विरलता को प्रोत्साहित करता है, जिससे स्वचालित सुविधा चयन और प्रासंगिक चर की पहचान होती है। नियमितीकरण पैरामीटर λ लागू नियमितीकरण की मात्रा को नियंत्रित करता है, और एक बड़ा λ मान अधिक गुणांक को शून्य की ओर धकेलता है। उच्च-आयामी डेटासेट से निपटने में LASSO प्रतिगमन महत्वपूर्ण है, क्योंकि यह प्रभावी ढंग से ओवरफिट करने और व्याख्या करने योग्य मॉडल प्रदान करने का प्रबंधन कर सकता है। कुल मिलाकर, LASSO रिग्रेशन भविष्यवाणी और फीचर चयन के लिए एक शक्तिशाली उपकरण है, जो विभिन्न डेटा विश्लेषण और मशीन लर्निंग अनुप्रयोगों के लिए एक व्यावहारिक समाधान प्रदान करता है।
Top 10] क्लाउड कंप्यूटिंग में करियर विकल्प | Best Career Options in Cloud Computing in hindi
पायथन में रिज और लासो रिग्रेशन के बारे में अक्सर पूछे जाने वाले सवाल(FAQ)
Ans. लासो और रिज रिग्रेशन मॉडल मशीन लर्निंग का उपयोग करके भविष्य की भविष्यवाणी करने में जादू की तरह काम करते हैं। इनका उपयोग करके, व्यवसाय भविष्य की खरीदारी की भविष्यवाणी कर सकते हैं और बेहतर जानकारी वाले निर्णय और भविष्य की योजनाएं बना सकते हैं।
Ans. फीचर चयन के लिए रिज रिग्रेशन क्यों? रिज रिग्रेशन के बारे में सबसे महत्वपूर्ण चीजों में से एक यह है कि भविष्यवाणियों के बारे में कोई भी जानकारी बर्बाद किए बिना यह उन चरों को निर्धारित करने का प्रयास करता है जिनका बिल्कुल शून्य प्रभाव होता है।
Ans. फ़ीचर चयन: लैस्सो प्रभावी ढंग से फ़ीचर चयन करते हुए गुणांक को शून्य पर सेट कर सकता है, जबकि रिज केवल गुणांक को शून्य के करीब ही सिकोड़ सकता है। बायस-वेरिएंस ट्रेडऑफ़: दोनों विधियाँ अनुमानों में पूर्वाग्रह लाती हैं लेकिन भिन्नता को कम करती हैं, जिससे संभावित रूप से बेहतर समग्र मॉडल भविष्यवाणियाँ होती हैं।
Ans. रिज रिग्रेशन एक सिकुड़न विधि का एक उदाहरण है: कम से कम वर्गों की तुलना में, यह विचरण को कम करने, भविष्यवाणी सटीकता में सुधार करने और व्याख्या में सहायता करने की उम्मीद में पैरामीटर अनुमान को सिकोड़ता है।
Ans.यदि कम संख्या में महत्वपूर्ण पैरामीटर हैं और अन्य शून्य के करीब हैं तो लैस्सो अच्छा प्रदर्शन करता है (अर्थात्: जब केवल कुछ भविष्यवक्ता ही वास्तव में प्रतिक्रिया को प्रभावित करते हैं)। यदि समान मूल्य के कई बड़े पैरामीटर हों तो रिज अच्छी तरह से काम करता है (अर्थात: जब अधिकांश भविष्यवक्ता प्रतिक्रिया को प्रभावित करते हैं)।
ग्रिड सर्चसीवी के साथ हाइपरपैरामीटर ट्यूनिंग | hyperparameter tuning in machine learning in Hindi