0:00:07.360,0:00:11.760 يعد التعلم الآلي جيداً فقط عندما تكون[br]بيانات التدريب المدخلة جيدة أيضاً. 0:00:11.800,0:00:15.820 لذا، من الأهمية القصوى أن تستخدم بيانات ذات جودة عالية، وبأعداد كبيرة منها. 0:00:16.760,0:00:21.960 لكن، إذا كانت البيانات هامة، هنا يجدر التساؤل عن المصدر الذي تأتي منه؟ 0:00:22.280,0:00:26.260 غالبا، يعمل الحاسوب على تجميع البيانات من الأشخاص امثالنا، 0:00:26.260,0:00:27.860 بدون بذل اي جهد. 0:00:28.440,0:00:31.480 تعمل خدمة تتبع الفيديو على تتبع ما تشاهده، ثم، يمكنها تمييز المحتوى ووضعه في شكل أنماط 0:00:31.660,0:00:36.000 توصي لك بما قد تشاهده لاحقاً. 0:00:37.420,0:00:43.200 وفي أحيان أخرى، قد يطلب منك المساعدة مباشرة، مثلاً عند طلب استكشاف إشارات الشوارع والصور، 0:00:43.780,0:00:49.280 فأنت تقدم بيانات تدريبية [br]لمساعدة الآلة على تعلم الرؤية، وحتى على تولي القيادة يوماً ما. 0:00:52.320,0:00:56.440 يمكن للباحثين الطبيين استخدام[br]الصور الطبية باعتبارها بيانات تدريبية من أجل تعليم 0:00:56.520,0:00:59.900 أجهزة الحاسوب طريقة التعرف على الأمراض وتشخيصها. 0:01:00.300,0:01:05.560 يحتاج التعلم الآلي لمئات وآلاف الصور، وتوجيه تدريبي من الطبيب 0:01:05.640,0:01:09.920 الذي يعلم ما يتم البحث عنه قبل أن يتم التعرف على المرض بصورة صحيحة. 0:01:10.520,0:01:15.540 حتى في ظل وجود آلاف الأمثلة، فقد توجد مشكلات مع عمليات التنبؤ التي يقوم بها الحاسوب. 0:01:15.880,0:01:20.660 ففي حالة تجميع بيانات الأشعة السينية من قبل الرجال فقط، فقد تصيح كل عمليات التنبؤ التي يقوم بها الحاسوب صالحة للرجال دون غيرهم. 0:01:21.880,0:01:26.300 وقد لا يتمكن الحاسوب من تحديد الأمراض عندما[br]يطلب منه إجراء تشخيص بالأشعة السينية على السيدات. 0:01:26.620,0:01:30.820 هذه النقطة العمياء في البيانات التدريبية[br]التي تقوم بإنشاء شيء ما يطلق عليه اسم "التحيز". 0:01:31.260,0:01:36.420 هذه البيانات التحيزية تعمل على تفضيل بعض الأشياء عن بعضها البعض، أو لا تضع أشياء في أولوياتها، أو تستثني أخرى. 0:01:36.780,0:01:41.800 بحسب الطريقة التي يتم بها تجميع بيانات التدريب، ومن القائم على تجميعها، وطريقة تغذية البيانات، 0:01:41.800,0:01:45.340 توجد احتمالية بأن يكون[br]التحيز البشري متضمناً في البيانات. 0:01:45.880,0:01:50.700 وبتعلم البيانات التحيزية، فقد يقوم الحاسوب بإجراء عمليات تنبؤ متحيزة، 0:01:50.780,0:01:54.320 سواء كأن الأشخاص الذين يدربون الحاسوب[br]على إدراك بهذا الأمر أم لا. 0:01:54.760,0:01:58.400 عند قيامك بالبحث عن بيانات التدريب، اطرح على نفسك سؤالين: 0:01:58.640,0:02:01.600 هل هذه البيانات كافية لتدريب الحاسوب بدقة؟ 0:02:02.320,0:02:06.860 وهل تمثل هذه البيانات كل السيناريوهات الممكنة والمستخدمين بدون أي تحيز؟ 0:02:07.460,0:02:11.040 ومن هنا يجب أن يلعب التدريب البشري دوراً حيوياً. 0:02:11.160,0:02:14.500 الأمر يرجع إليك في مسألة تقديم بيانات غير متحيزة لآلتك. 0:02:14.500,0:02:18.160 ويعني هذا تجميع أطنان من الأمثلة، ومن الكثير من المصادر. 0:02:19.300,0:02:22.580 تذكر بأنه عند قيامك بانتقاء البيانات واختيارها من أجل التعلم الآلي، 0:02:22.580,0:02:26.660 فأنك تقوم بشكل فعلي ببرمجة الخورزاميات باستخدام بيانات التدريب بدلاً من التعليمات البرمجية. 0:02:27.100,0:02:29.780 البيانات هي التعليمات البرمجية. 0:02:30.180,0:02:34.680 كلما قدمت بيانات أفضل، كلما تعلم الحاسوب بشكل أفضل.