Return to Video

Familiarize Yourself with the Dataset - Data Wranging with MongoDB

  • 0:00 - 0:03
    ،حسنًا، لنتعرف على المزيد عن مجموعة البيانات هذه
  • 0:03 - 0:06
    وأقصد هنا في حقيقة الأمر فهم مشروع خريطة الشارع المفتوحة في حد ذاته على نحوٍ أفضل
  • 0:06 - 0:09
    والشروع في معرفة ما نحتاج إلى معرفته
  • 0:09 - 0:12
    من أجل إنجاز
  • 0:12 - 0:15
    دراسة الحالة المحددة هذه. حسنًا، سأنتقل بإجراء بحث
  • 0:15 - 0:19
    عن كلمة Chicago إلى خريطة الشارع المفتوحة
  • 0:19 - 0:22
    .وستلاحظ أنني أتلقى عددًا من النتائج المختلفة هنا
  • 0:22 - 0:25
    وإحدى هذه النتائج الذي جذبت انتباهي هي هذه النتيجة المتمثلة في
  • 0:25 - 0:28
    Chicago, Cook County, Illinois, United States of America. ,وسيؤدي هذا الرابط
  • 0:28 - 0:32
    ،في الأساس إلى تحديد تلك البيانات المنتمية إلى مجموعة بيانات خريطة الشارع المفتوحة
  • 0:32 - 0:34
    والتي لها صلة بمدينة
  • 0:34 - 0:37
    شيكاغو. سأعمد إذًا إلى النقر من خلال هذا الرابط، ويمكنك
  • 0:37 - 0:41
    ملاحظة المخطط التفصيلي الوارد هنا والذي يميز حدود المدينة. فالبيانات
  • 0:41 - 0:43
    التي أتعامل معها هنا تتمثل في أي شيء يوجد
  • 0:43 - 0:46
    ،(داخل النطاق المحدد هنا. وإذا نقرت الآن فوق Export (تصدير
  • 0:46 - 0:50
    فسيظهر لي خطا الطول والعرض ورسالة تفيد
  • 0:50 - 0:53
    بأن حجم البيانات كبير جدًا بحيث يتعذر تصديرها. حسنًا، ولكن
  • 0:53 - 0:56
    إذا مرّرت لأسفل، فسأجد
  • 0:56 - 1:01
    ،مقتطفات من مجموعة البيانات هذه جاهزة بالفعل. حسنًا
  • 1:01 - 1:02
    دعني أكبر الصورة قليلاً. تظهر الآن
  • 1:02 - 1:06
    مقتطفات من مجموعة البيانات المحددة هذه مجهزة مسبقًا
  • 1:06 - 1:11
    .وهذه مقتطفات لمناطق حضرية كبرى ،
  • 1:11 - 1:14
    إذًا، يمكنك ملاحظة أنني نقرت بالفعل فوق رابط Chicago
  • 1:14 - 1:16
    من قبل. وسأنتقل بالنقر فوق ذلك الرابط
  • 1:16 - 1:21
    لتتاح لي فرصة هنا لتنزيل نسخة مضغوطة من نوع Zip لبيانات OSM هذه
  • 1:21 - 1:23
    بتنسيق XML. فسأنقر فوق هذا الرابط
  • 1:23 - 1:26
    وسيبدأ تنزيل النسخة. فور الانتهاء من التنزيل، يمكننا عندئذٍ
  • 1:26 - 1:31
    المتابعة وإلقاء نظرة عليها. حسنًا، تم تنزيل هذه البيانات وسألقي
  • 1:31 - 1:33
    .نظرة عليها
  • 1:33 - 1:36
    إنها موجودة في دليل التنزيلات الخاص بي. قمت بالفعل بفك الضغط
  • 1:38 - 1:40
    لتظهر على النحو التالي. كم هائل من
  • 1:40 - 1:43
    البيانات بتنسيق XML. من المفترض أن تبدو مألوفة لك. لقد اطلعنا على
  • 1:43 - 1:47
    علامات الملاحظات هذه من قبل، واستخرجنا كمًا قليلاً من البيانات
  • 1:47 - 1:51
    المنتمية إلى مجموعة البيانات هذه سابقًا. حسنًا، سأستخدم
  • 1:51 - 1:54
    .أمر shell المتمثل في LS، وأرى حجم مجموعة البيانات هذه
  • 1:54 - 1:57
    يمكنك ملاحظة أن حجمها يبلغ تقريبًا 1.8 جيجابايت. إذًا، فهي
  • 1:57 - 2:00
    مجموعة بيانات هائلة الحجم. ويعني ذلك أنه من أجل
  • 2:00 - 2:03
    .معالجة هذه البيانات، تتعذر علينا فعلاً قراءتها من الذاكرة
  • 2:03 - 2:05
    وكما ستلاحظ بعد قليل، سنستخدم
  • 2:05 - 2:09
    نهجًا لتحليل هذه البيانات من خلال محلل SAX، والذي ألقينا نظرة
  • 2:09 - 2:13
    سريعة عليه في درس سابق. حسنًا، تعودت دائمًا
  • 2:13 - 2:15
    في موقف كهذا أن أستكشف البيانات نفسها
  • 2:15 - 2:18
    قليلاً. وقد أكتب أيضًا تعليمة برمجية قصيرة لتحليل
  • 2:18 - 2:21
    ما يجري هنا فقط لعلي أستوعبه. سنحتاج بعد ذلك
  • 2:21 - 2:24
    قراءة الوثائق قراءةً كافية
  • 2:24 - 2:28
    .للإجابة عن أي أسئلة تجول بخاطرنا أو حتى للبدء
  • 2:28 - 2:31
    حسنًا، سأعمد هنا إلى إجراء استعلام بشكل عادي عن
  • 2:31 - 2:35
    وثائق خريطة الشارع المفتوحة، ويمكنني ملاحظة وجود ارتباط
  • 2:35 - 2:37
    ،Wiki لخريطة الشارع المفتوحة. وإذا نقرت للانتقال من خلاله
  • 2:37 - 2:40
    فسأصل إلى صفحة Wiki التي تتيح لي قدرًا
  • 2:40 - 2:42
    من المعلومات حول خريطة الشارع المفتوحة. سأعمد الآن إلى المبالغة في تكبير الحجم
  • 2:42 - 2:45
    ،ليتسنى لك الاطلاع عليها من شاشتك. وإذا مرّرنا لأسفل
  • 2:45 - 2:48
    .فيمكننا ملاحظة وجود كم كبير لقراءته هنا
  • 2:48 - 2:53
    يمكنك إذًا ملاحظة وجود دليل للمبتدئين ومعلومات للمطورين ومعلومات أخرى
  • 2:53 - 2:56
    .تتمثل في ميزات الخريطة وأشياء من هذا القبيل
  • 2:56 - 2:59
    أعلم من خلال اطلاعي على هذه الصفحة من قبل بوجود
  • 2:59 - 3:03
    وثائق فعليًا تتعلق بتنسيق XML ستكون
  • 3:03 - 3:06
    مفيدة لنا كلما مضينا قُدمًا. هذا مثال
  • 3:06 - 3:08
    لأنواع مختلفة من العلامات التي
  • 3:08 - 3:10
    ستظهر لك في مجموعة البيانات هذه مع قليل
  • 3:10 - 3:14
    من الشرح المتعلق بها. على سبيل المثال، يمكننا أن نستنتج من هذه الوثائق
  • 3:14 - 3:19
    .أن هذه البيانات هي في الأساس مثيلات تنتمي إلى 3 أنواع بدائية مختلفة من البيانات
  • 3:19 - 3:22
    تتمثل أنواع البيانات البدائية هذه في العُقد والطرق والعلاقات؛ وإذا نقرنا
  • 3:22 - 3:23
    ،للانتقال إلى أي منها
  • 3:23 - 3:25
    فسنحصل على قدر قليل من المعلومات الإضافية
  • 3:25 - 3:28
    عنها، مفهوم؟ لذلك، أحثك على إلقاء نظرة على
  • 3:28 - 3:30
    هذه الوثائق لصالحك. تأكد من
  • 3:30 - 3:33
    ،فهم العُقد والطرق والعلاقات
  • 3:33 - 3:36
    .وسيكون ذهنك حاضرًا فيما هو آت. فما عليك سوى الاضطلاع بقدر من القراءة الآن
Tytuł:
Familiarize Yourself with the Dataset - Data Wranging with MongoDB
Video Language:
English
Team:
Udacity
Projekt:
UD032: Data Wrangling with MongoDB
Duration:
03:36

Arabic subtitles

Revisions