MARL الخصومي
توازن ناش
حالة مستقرة حيث لا يمكن لأي عامل تحسين استراتيجيته بتغيير سلوكه من جانب واحد، حاسمة لتحليل نقاط التوازن في التعلم المعزز متعدد العوامل العدائي.
← رجوعحالة مستقرة حيث لا يمكن لأي عامل تحسين استراتيجيته بتغيير سلوكه من جانب واحد، حاسمة لتحليل نقاط التوازن في التعلم المعزز متعدد العوامل العدائي.
← رجوع