Return to Video

Stopwords - Intro to Machine Learning

  • 0:00 - 0:03
    .بعض الكلمات لا تحتوي عادة على الكثير من المعلومات
  • 0:03 - 0:06
    .وقد يكون الاطلاع على تلك الكلمات أمرًا ذا قيمة حقيقية
  • 0:06 - 0:09
    وللتمكن من مجرد حذف تلك الكلمات من المتن الخاص بكم، إذن
  • 0:09 - 0:10
    .عليكم عدم اعتبارها
  • 0:10 - 0:13
    .لا تسمحوا لها أن تسبب تشويشًا في مجموعة البيانات الخاصة بكم
  • 0:14 - 0:17
    .وبشكل عام، يُطلق على هذه القائمة من الكلمات اسم الكلمات المستبعدة
  • 0:17 - 0:20
    .ويتباين التعريف الدقيق للكلمة المستبعدة
  • 0:20 - 0:24
    .ولكن بشكل عام، هي كلمة تتكرر كثيرًا وتحتوي على قدر ضئيل من المعلومات
  • 0:24 - 0:29
    .ومن بين الأمثلة على هذه الكلمات and وthe وI وyou وhave
  • 0:30 - 0:34
    ،وتتمثل خطوة المعالجة المسبقة الشائعة جدًا في تحليل النص
  • 0:34 - 0:38
    .في إزالة الكلمات المستبعدة قبل فعل أي شيء آخر بالنسبة للبيانات
  • 0:38 - 0:44
    .لنفترض أن مجموعة الكلمات المستبعدة لدينا هي the وin وfor وyou وwill وhave وbe
  • 0:44 - 0:48
    .لنقل إنني أعطيتكم تلك الكلمات وقلت لكم، بالأمر، إنها كلمات مستبعدة
  • 0:49 - 0:51
    ،سؤالي لكم في الاختبار هو
  • 0:51 - 0:55
    ،كم عدد الكلمات التي سيتم حذفها عند حذف الكلمات المستبعدة من الرسالة
  • 0:55 - 0:58
    .hi Katie, the machine learning class will be great
  • 0:58 - 0:59
    Best, Sebastian
Title:
Stopwords - Intro to Machine Learning
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
ud120 - Intro to Machine Learning
Udacity Robot edited Arabic subtitles for 10-14 Stopwords

Arabic subtitles

Revisions