Return to Video

TfIdf Feature Selection Solution - Intro to Machine Learning

  • 0:00 - 0:05
    ،في الواقع، ستعمل وسيطة max df على تقليل حجم مصطلحاتي
  • 0:06 - 0:09
    وستستخدمها استنادًا إلى عدد المستندات التي
  • 0:09 - 0:11
    .تتواجد فيها كلمة معينة
  • 0:11 - 0:14
    ،إذن، إذا كانت هناك كلمة تتواجد بنسبة أكبر من 50% من المستندات
  • 0:14 - 0:18
    ،فستشير الوسيطة إلى أنها لا تُستخدَم في tfidf
  • 0:18 - 0:21
    .لأنه من المحتمل ألا تحتوي على الكثير من المعلومات
  • 0:21 - 0:23
    .وهذا بسبب أنها شائعة
  • 0:23 - 0:25
    وهذا مثال لمكان آخر يمكنكم فيه
  • 0:25 - 0:30
    .تقليل بعض الميزات، أو كما نطلق عليه عادة تقليل الأبعاد
  • 0:30 - 0:30
    لكنكم بالتأكيد
  • 0:30 - 0:34
    .ستكونون على استعداد - كما كنتم من قبل - لتنفيذ شيء كهذا، SelectPercentile
  • 0:35 - 0:38
    وآمل أن ما تجدونه في تمرين التعليمة البرمجية هذا يؤكد هذه النقطة التي
  • 0:38 - 0:43
    .نتحدث بشأنها الآن، وهي أن الميزات ليست مثل المعلومات
  • 0:43 - 0:46
    لقد تخلصتم من نسبة 90% من الميزات النصية، ولكن
  • 0:46 - 0:50
    .دقة المصنف لديك لا تعاني تمامًا
  • 0:50 - 0:53
    وفي الواقع، في بعض الأساليب، يكون تحسن الأداء بسبب أنه يكون قادرًا على التحريك
  • 0:53 - 0:56
    .بسرعة أكبر في الأعداد الأصغر للميزات
  • 0:56 - 0:57
    ،إذا، يتضح
  • 0:57 - 0:59
    .أن الأمر سيكون شيئًا ترغبون في وضعه في اعتباركم
  • 0:59 - 1:02
    .وبشكل خاص، عندما تعملون على بيانات ذات أبعاد عالية جدًا
  • 1:02 - 1:04
    .البيانات التي لها الكثير والكثير من الميزات
  • 1:04 - 1:07
    ،أنتم تريدون أن تكونوا متشككين بشأن جميع تلك الميزات وتتفكرون بشأن
  • 1:07 - 1:10
    أي من هذه سوف توفر لي أكثر العوامل لقاعدتي التعريفية؟
Title:
TfIdf Feature Selection Solution - Intro to Machine Learning
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
ud120 - Intro to Machine Learning
Duration:
01:12

Arabic subtitles

Revisions