التحقق المتقاطع K-Fold

📖

المصطلحات

تقنية تقييم النموذج تقسم مجموعة البيانات إلى أقسام K متساوية، حيث يخدم كل قسم بدوره كمجموعة اختبار بينما تخدم الأقسام K-1 الأخرى كتدريب. تتيح هذه الطريقة الحصول على تقدير أكثر قوة لأداء النموذج عن طريق تقليل تباين التقييم.

📖

المصطلحات

التحقق المتقاطع K-Fold الطبقي

نوع مختلف من K-Fold يحافظ على توزيع الفئات في كل قسم، وهو أمر أساسي لمجموعات البيانات غير المتوازنة. يضمن هذا النهج أن كل قسم يمثل بدقة التوزيع العام لفئات مجموعة البيانات الأصلية.

📖

المصطلحات

طريقة الاحتفاظ

طريقة تقييم بسيطة تقسم مجموعة البيانات إلى مجموعتين منفصلتين: التدريب والاختبار، عادة بنسب 70/30 أو 80/20. على الرغم من سرعة التنفيذ، يمكن أن تنتج هذه الطريقة تقديرات أداء متحيزة حسب طريقة تقسيم البيانات.

📖

المصطلحات

التحقق المتقاطع المتكرر

تقنية تكرر عملية K-Fold عدة مرات بتقسيمات عشوائية مختلفة لتقليل تباين تقدير الأداء. يجمع هذا النهج مزايا K-Fold مع قوة إحصائية أكبر مقابل تكلفة حسابية متزايدة.

📖

المصطلحات

التحقق بالبوتستراب

طريقة تقييم تستخدم أخذ العينات مع الاستبدال لإنشاء مجموعات تدريب واختبار متعددة من البيانات الأصلية. يسمح البوتستراب بتقدير تباين أداء النموذج وهو مفيد بشكل خاص مع مجموعات البيانات الصغيرة.

📖

المصطلحات

البحث الشبكي مع التحقق المتقاطع

تقنية تحسين منهجية تختبر بشكل شامل جميع تركيبات المعلمات المفرطة المحددة باستخدام التحقق المتقاطع لتقييم كل تكوين. تضمن هذه الطريقة العثور على أفضل تركيبة في الشبكة المحددة ولكن يمكن أن تكون مكلفة جداً في الحساب.

📖

المصطلحات

البحث العشوائي مع التحقق المتقاطع

بديل للبحث الشبكي يأخذ عينات عشوائية لعدد ثابت من تركيبات المعلمات المفرطة بدلاً من استكشاف جميع الاحتمالات بشكل شامل. غالباً ما يكون هذا النهج أكثر فعالية للعثور على معلمات مفرطة جيدة بتقييمات أقل من البحث الشبكي.

📖

المصطلحات

منحنى التعلم

رسم بياني يظهر تطور أداء النموذج بناءً على حجم مجموعة التدريب، يُستخدم لتشخيص الإفراط في التعلم أو نقص التعلم. تساعد منحنيات التعلم في تحديد ما إذا كانت المزيد من البيانات يمكن أن تحسن أداء النموذج.

📖

المصطلحات

منحنى التحقق

أداة تشخيصية تعرض تأثير معامل تشغيل واحد على أداء التدقيق والتحقق. تتيح منحنيات التحقق تحديد القيم المثلى لمعاملات التشغيل واكتشاف مشكلات الانحياز والتباين.

📖

المصطلحات

الإنتروبيا المتقاطعة

دالة خسارة تقيس الاختلاف بين توزيعين احتماليين، تُستخدم على نطاق واسع في مشكلات التصنيف. تعاقب الإنتروبيا المتقاطعة التوقعات غير الصحيحة بقدر أكبر كلما كانت أكثر ثقة، مما يجعلها مقياسًا ممتازًا للتدريب.

📖

المصطلحات

متوسط الخطأ التربيعي

مقياس تقييم يحسب متوسط مربعات الفروق بين القيم المتوقعة والحقيقية، حساس بشكل خاص للأخطاء الكبيرة. يُستخدم MSE عادةً لمشكلات الانحدار ويعاقب الأخطاء الكبيرة أكثر من MAE.

📖

المصطلحات

متوسط الخطأ المطلق

مقياس انحدار يقيس متوسط القيم المطلقة للأخطاء بين التوقعات والقيم الحقيقية، ويوفر تفسيرًا مباشرًا بوحدات المتغير المستهدف. على عكس MSE، فإن MAE أقل حساسية للقيم المتطرفة ويمثل متوسط الخطأ المطلق.

📖

المصطلحات

درجة R²

معامل التحديد الذي يقيس نسبة التباين في المتغير المستهدف الذي يفسره النموذج، ويتراوح بين -∞ و1. تشير R² بقيمة 1 إلى توقع مثالي، بينما تشير القيم السالبة إلى أن النموذج يؤدي أداءً أقل من المتوسط البسيط.

📖

المصطلحات

درجة F1

مقياس تصنيف يحسب المتوسط التوافقي للدقة والاستدعاء، مفيد بشكل خاص لمجموعات البيانات غير المتوازنة. توازن درجة F1 قدرة النموذج على تجنب الإيجابيات الكاذبة والسلبيات الكاذبة في قياس واحد.

📖

المصطلحات

منحنى الدقة والاستدعاء

رسم بياني يوضح المقايضة بين الدقة والاستدعاء لعتبات تصنيف مختلفة، أساسي لتقييم النماذج على البيانات غير المتوازنة. توفر المساحة تحت هذا المنحنى (AUC-PR) قياسًا مجمعًا للأداء مستقل عن العتبة.

📖

المصطلحات

منحنى ROC

منحنى يمثل معدل الإيجابيات الحقيقية مقابل معدل الإيجابيات الكاذبة عند عتبات قرار مختلفة، ويعرض قدرة النموذج على التمييز. يُعد منحنى ROC ومساحته (AUC-ROC) معيارين لتقييم الأداء العام للمصنفات الثنائية.

📖

المصطلحات

AUC Score

Aire sous la courbe ROC mesurant la probabilité qu'un classificateur donne un score plus élevé à une instance positive aléatoire qu'à une instance négative. L'AUC fournit une mesure de performance seuil-indépendante, particulièrement utile pour comparer différents modèles.

📖

المصطلحات

Group K-Fold Cross-Validation

Variante du K-Fold garantissant que les mêmes groupes ne apparaissent jamais dans différents ensembles d'entraînement et test simultanément. Cette approche est cruciale lorsque les données présentent une structure de groupes (patients, utilisateurs) où les observations d'un même groupe sont corrélées.

قاموس الذكاء الاصطناعي

التحقق المتقاطع K-Fold

التحقق المتقاطع K-Fold الطبقي

طريقة الاحتفاظ

التحقق المتقاطع المتكرر

التحقق بالبوتستراب

البحث الشبكي مع التحقق المتقاطع

البحث العشوائي مع التحقق المتقاطع

منحنى التعلم

منحنى التحقق

الإنتروبيا المتقاطعة

متوسط الخطأ التربيعي

متوسط الخطأ المطلق

درجة R²

درجة F1

منحنى الدقة والاستدعاء

منحنى ROC

AUC Score

Group K-Fold Cross-Validation

لم يتم العثور على نتائج