🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة
📖
التعلم بالتعزيز متعدد الأهداف المستمر

التعلم المعزز القائم على التفضيلات

نهج يتم فيه دمج تفضيلات الإنسان حول الموازنة بين الأهداف في عملية التعلم لتوجيه الوكيل نحو حلول مرغوبة في جبهة باريتو.

← رجوع