सुदृढीकरण सीखना Reinforcement Learning
सुदृढीकरण सीखना एक व्यवहारिक शिक्षण मॉडल है। इसमें निर्णयों का क्रम बनाने के लिए मशीन लर्निंग मॉडल या "एजेंट" को प्रशिक्षित करना शामिल है। सुदृढीकरण सीखने में एक एल्गोरिदम डेटा के विश्लेषण से प्रतिक्रिया प्राप्त करता है ताकि एजेंट को सर्वोत्तम परिणाम के लिए निर्देशित किया जा सके।
सुदृढीकरण सीखने में, मॉडल को नमूना डेटासेट के साथ प्रशिक्षित नहीं किया जाता है। बल्कि, मॉडल परीक्षण और त्रुटि के माध्यम से सीखता है। इसलिए, सफल निर्णयों के अनुक्रम के परिणामस्वरूप प्रक्रिया "मजबूत" हो जाएगी क्योंकि यह मौजूदा समस्या का सबसे अच्छा समाधान करती है।
सुदृढीकरण सीखने के सबसे आम अनुप्रयोगों में से एक रोबोटिक्स या गेम खेलना है। सीढ़ियों के एक सेट को नेविगेट करने के लिए रोबोट को प्रशिक्षित करने का उदाहरण लें।
रोबोट अपने कार्यों के परिणाम के आधार पर इलाके में नेविगेट करने के लिए अपना दृष्टिकोण बदलता है। जब रोबोट गिरता है, तो डेटा को पुन: कैलिब्रेट किया जाता है, इसलिए चरणों को अलग-अलग तरीके से नेविगेट किया जाता है, जब तक कि रोबोट सीढ़ियों पर चढ़ न सके। दूसरे शब्दों में, रोबोट क्रियाओं के सफल अनुक्रम के आधार पर सीखता है।
सीखने के एल्गोरिदम को बिना गिरे सीढ़ियों पर सफलतापूर्वक चढ़ने के लक्ष्य और उस परिणाम तक पहुंचने वाली घटनाओं के अनुक्रम के बीच संबंध खोजने में सक्षम होना चाहिए।
इकाई २ मशीन लर्निंग के प्रकार पर अपनी प्रगति जांचें
आपकी सीखने की यात्रा
आइए इकाई 3 से आरंभ करें।
1 मशीन लर्निंग का परिचय (पूर्ण)
2 मशीन लर्निंग के प्रकार (पूर्ण)
3 मशीन लर्निंग में नैतिक मुद्दे (अगला)
4 मशीन लर्निंग के उपयोग मामले (आगामी)
5 मशीन लर्निंग एल्गोरिदम और मेट्रिक्स (आगामी)
6 मशीन लर्निंग फ्रेमवर्क (आगामी)