قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
التحقق المتقاطع K-Fold
تقنية تقييم النموذج تقسم مجموعة البيانات إلى أقسام K متساوية، حيث يخدم كل قسم بدوره كمجموعة اختبار بينما تخدم الأقسام K-1 الأخرى كتدريب. تتيح هذه الطريقة الحصول على تقدير أكثر قوة لأداء النموذج عن طريق تقليل تباين التقييم.
التحقق المتقاطع K-Fold الطبقي
نوع مختلف من K-Fold يحافظ على توزيع الفئات في كل قسم، وهو أمر أساسي لمجموعات البيانات غير المتوازنة. يضمن هذا النهج أن كل قسم يمثل بدقة التوزيع العام لفئات مجموعة البيانات الأصلية.
طريقة الاحتفاظ
طريقة تقييم بسيطة تقسم مجموعة البيانات إلى مجموعتين منفصلتين: التدريب والاختبار، عادة بنسب 70/30 أو 80/20. على الرغم من سرعة التنفيذ، يمكن أن تنتج هذه الطريقة تقديرات أداء متحيزة حسب طريقة تقسيم البيانات.
التحقق المتقاطع المتكرر
تقنية تكرر عملية K-Fold عدة مرات بتقسيمات عشوائية مختلفة لتقليل تباين تقدير الأداء. يجمع هذا النهج مزايا K-Fold مع قوة إحصائية أكبر مقابل تكلفة حسابية متزايدة.
التحقق بالبوتستراب
طريقة تقييم تستخدم أخذ العينات مع الاستبدال لإنشاء مجموعات تدريب واختبار متعددة من البيانات الأصلية. يسمح البوتستراب بتقدير تباين أداء النموذج وهو مفيد بشكل خاص مع مجموعات البيانات الصغيرة.
البحث الشبكي مع التحقق المتقاطع
تقنية تحسين منهجية تختبر بشكل شامل جميع تركيبات المعلمات المفرطة المحددة باستخدام التحقق المتقاطع لتقييم كل تكوين. تضمن هذه الطريقة العثور على أفضل تركيبة في الشبكة المحددة ولكن يمكن أن تكون مكلفة جداً في الحساب.
البحث العشوائي مع التحقق المتقاطع
بديل للبحث الشبكي يأخذ عينات عشوائية لعدد ثابت من تركيبات المعلمات المفرطة بدلاً من استكشاف جميع الاحتمالات بشكل شامل. غالباً ما يكون هذا النهج أكثر فعالية للعثور على معلمات مفرطة جيدة بتقييمات أقل من البحث الشبكي.
منحنى التعلم
رسم بياني يظهر تطور أداء النموذج بناءً على حجم مجموعة التدريب، يُستخدم لتشخيص الإفراط في التعلم أو نقص التعلم. تساعد منحنيات التعلم في تحديد ما إذا كانت المزيد من البيانات يمكن أن تحسن أداء النموذج.
منحنى التحقق
أداة تشخيصية تعرض تأثير معامل تشغيل واحد على أداء التدقيق والتحقق. تتيح منحنيات التحقق تحديد القيم المثلى لمعاملات التشغيل واكتشاف مشكلات الانحياز والتباين.
الإنتروبيا المتقاطعة
دالة خسارة تقيس الاختلاف بين توزيعين احتماليين، تُستخدم على نطاق واسع في مشكلات التصنيف. تعاقب الإنتروبيا المتقاطعة التوقعات غير الصحيحة بقدر أكبر كلما كانت أكثر ثقة، مما يجعلها مقياسًا ممتازًا للتدريب.
متوسط الخطأ التربيعي
مقياس تقييم يحسب متوسط مربعات الفروق بين القيم المتوقعة والحقيقية، حساس بشكل خاص للأخطاء الكبيرة. يُستخدم MSE عادةً لمشكلات الانحدار ويعاقب الأخطاء الكبيرة أكثر من MAE.
متوسط الخطأ المطلق
مقياس انحدار يقيس متوسط القيم المطلقة للأخطاء بين التوقعات والقيم الحقيقية، ويوفر تفسيرًا مباشرًا بوحدات المتغير المستهدف. على عكس MSE، فإن MAE أقل حساسية للقيم المتطرفة ويمثل متوسط الخطأ المطلق.
درجة R²
معامل التحديد الذي يقيس نسبة التباين في المتغير المستهدف الذي يفسره النموذج، ويتراوح بين -∞ و1. تشير R² بقيمة 1 إلى توقع مثالي، بينما تشير القيم السالبة إلى أن النموذج يؤدي أداءً أقل من المتوسط البسيط.
درجة F1
مقياس تصنيف يحسب المتوسط التوافقي للدقة والاستدعاء، مفيد بشكل خاص لمجموعات البيانات غير المتوازنة. توازن درجة F1 قدرة النموذج على تجنب الإيجابيات الكاذبة والسلبيات الكاذبة في قياس واحد.
منحنى الدقة والاستدعاء
رسم بياني يوضح المقايضة بين الدقة والاستدعاء لعتبات تصنيف مختلفة، أساسي لتقييم النماذج على البيانات غير المتوازنة. توفر المساحة تحت هذا المنحنى (AUC-PR) قياسًا مجمعًا للأداء مستقل عن العتبة.
منحنى ROC
منحنى يمثل معدل الإيجابيات الحقيقية مقابل معدل الإيجابيات الكاذبة عند عتبات قرار مختلفة، ويعرض قدرة النموذج على التمييز. يُعد منحنى ROC ومساحته (AUC-ROC) معيارين لتقييم الأداء العام للمصنفات الثنائية.
AUC Score
Aire sous la courbe ROC mesurant la probabilité qu'un classificateur donne un score plus élevé à une instance positive aléatoire qu'à une instance négative. L'AUC fournit une mesure de performance seuil-indépendante, particulièrement utile pour comparer différents modèles.
Group K-Fold Cross-Validation
Variante du K-Fold garantissant que les mêmes groupes ne apparaissent jamais dans différents ensembles d'entraînement et test simultanément. Cette approche est cruciale lorsque les données présentent une structure de groupes (patients, utilisateurs) où les observations d'un même groupe sont corrélées.