-
Title:
K-Fold Cross Validation - Intro to Machine Learning
-
Description:
-
حسنًا يا Katie، لقد أخبرتِ الجميع بشأن
-
.مجموعات الاختبار والتدريب، وأتمنى أن يمارسها الأفراد قليلاً
-
.هل هذا صحيح؟ >> نعم هذا صحيح
-
>> والآن سأتحدث عن شيء ما يعمل على تعميم ذلك بشكل طفيف
-
.ويُطلق عليه اسم التحقق المقطعي
-
وللدخول في التحقق المقطعي، دعونا نتحدث أولاً عن المشكلات بشأن
-
.تقسيم مجموعة البيانات إلى بيانات تدريب وبيانات اختبار
-
.لنفترض أن هذه هي بياناتكم
-
،وبفعل ما تمليه عليكم Katie
-
.تلتزمون الآن بقول أي أجزاء البيانات اختبار وأيها تدريب
-
.والمشكلة التي ستكونون بصددها هي أنكم تفضلون مضاعفة كلتا المجموعتين
-
فأنتم تريدون وجود الكثير من نقاط البيانات في مجموعات التدريب بهدف
-
الحصول على أفضل نتائج للتعليم، وترغبون في الحصول على أعلى عدد من
-
.عناصر البيانات في مجموعة الاختبار للحصول على أفضل تقييم
-
ولكن بشكل واضح، توجد مقايضة متأصلة هنا، حيث كل نقطة بيانات
-
.تأخذها من مجموعة التدريب إلى الاختبار تكون مفقودة بالنسبة لمجموعة التدريب
-
.لذا قمنا بإعادة ضبط عملية المقايضة
-
.وهذه هي الطريقة التي تسببت في وجود التحقق المقطعي
-
.الفكرة الأساسية هي أنكم تقدمون مجموعة البيانات إلى فئات k ذات أحجام متساوية
-
،فعلى سبيل المثال، إذا كانت لديكم 200 نقطة بيانات
-
.وعشر فئات
-
.بسرعة شديدة
-
ما هو عدد نقاط البيانات لكل فئة؟
-
.من الواضح جدًا، أنه 20
-
.لذا ستكون لديكم 20 نقطة بيانات في كل فئة من الفئات العشر
-
.إذًا هذه هي الصورة
-
وكما أوضحت Katie لكم، أنتم تختارون فقط فئة واحدة من هذه الفئات
-
.لتكون فئة اختبار والأخرى فئة تدريب
-
.في التحقق المقطعي لعدد k من المرات، أنتم تجرون تجارب تعلم k منفصلة
-
.وفي كل تجربة منها، تختارون واحدة من مجموعات k الفرعية لتكون مجموعة الاختبار
-
،سيتم وضع k المتبقية ناقص فئة واحدة في مجموعة التدريب
-
ثم تدربون خوارزمية التعلم الآلي
-
.وكما كان الأمر من قبل، سوف تختبرون الأداء في مجموعة الاختبار
-
.الشيء الأساسي في التحقق المقطعي هو أنكم تجربون هذا مرات متعددة
-
في هذه الحالة عشر مرات، ثم تعادلون العشرة أداءات المختلفة
-
لمجموعة الاختبار بالنسبة للمجموعات العشر المختلفة، لذا
-
.فأنتم تعادلون نتائج الاختبارات من تجارب k هذه
-
لذا وبشكل واضح، يستغرق هذا الأمر الكثير من الوقت للحساب بسبب أنكم الآن تضطرون لخوض
-
تجارب تعلم k المنفصلة، ولكن
-
.تقييم خوارزمية التقييم سيكون أكثر دقة
-
وبطريقة ما، أنتم استخدمتم جميع البيانات من أجل
-
.التدريب وجميع البيانات من أجل الاختبار، وهذا شيء رائع
-
.لنقل إننا طرحنا مجرد سؤال واحد
-
لنفترض أن لديكم الخيار لتنفيذ منهجية اختبار التدريب الاستاتيكي التي أخبرتكم
-
- Katie بشأنها، أو لنقل إنكم نفذتم التحقق المقطعي عشر مرات - السيرة الذاتية
-
.وقد اهتممتم جيدًا بشأن تقليل وقت التدريب
-
ويمكنكم تقليل مدة التشغيل بعد التدريب باستخدام خوارزمية التعلم الآلي
-
.لإخراج مدة التدريب السابقة وتعزيز الدقة
-
في هذه المواقف الثلاثة، يمكنكم الاختيار من بين التدريب/الاختبار أو
-
.التحقق المقطعي عشر مرات
-
.أعطوني أفضل تخمين لديكم
-
أي واحدة سوف تختارون؟
-
،إذن بالنسبة لكل مدة تدريب دنيا
-
.اختاروا واحدة من الاثنتين هنا في الجانب الأيمن