YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Arabic subtitles

Iterative Sax XML Parsing - Data Wranging with MongoDB

Get Embed Code
4 Languages

Showing Revision 1 created 06/09/2016 by Udacity Robot.

  1. Okay. لننفذ أحد التمارين. تتمثل مهمتك الآن في هذا التمرين في الاطلاع على
  2. مجموعة بيانات OSM الخاصة بمدينة شيكاغو والبحث عن جميع علامات المستوى العلوي الموجودة في مجموعة البيانات هذه. وما نقصده بعلامات المستوى العلوي
  3. بشكل أساسي هو
  4. جميع الأنواع المختلفة المميزة من العلامات
  5. التي ستظهر لك في مجموعة البيانات هذه. مثل osm وbounds وnode وtag
  6. وهكذا. أعمد هنا إلى
  7. تكرار الإجراء عبر مجموعة البيانات هذه بالكامل وإنشاء قاموس
  8. بحيث تتم إضافة العلامات غير الموجودة فيه من قبل
  9. .كلما ظهرت لك
  10. وفي النهاية، من المفترض ملء القاموس
  11. بجميع الأنواع المختلفة من العلامات المضمنة في
  12. مجموعة البيانات هذه. يكمن التحدي الآن في ضخامة
  13. ،هذا الملف. فإذا ألقينا نظرة على حجمه
  14. وقد فعلت ذلك منذ قليل. فيمكننا ملاحظة
  15. أنه يحتوي على ما يقرب من 2 جيجابايت من البيانات. تحدثنا الآن
  16. عن نوعين مختلفين لتحليل مستند XML في
  17. هذه الدورة التدريبية. أحدهما يتمثل في التحليل المستند إلى شجرة إذ نعمد فيه بشكل أساسي إلى قراءة
  18. المستند بأكمله في الذاكرة، ثم نتعامل معه
  19. على هيئة عُقد في شجرة. والنوع الآخر الذي تحدثنا عنه يتمثل في
  20. تحليل مستند XML باستخدام محلل SAX أو إجراء
  21. تحليل تكراري. سبق وألقينا نظرة على أسلوب iterparse الخاص بشجرة
  22. العناصر في الدرس الثالث. وذلك ما
  23. سنضطلع به هنا. فبدلاً من قراءة هذا
  24. الملف بأكمله في الذاكرة. سنعمد إلى تحليل أسلوب iterparse
  25. بواقع علامة واحدة في المرة
  26. وما يتعين علينا تنفيذه هنا
  27. هو التعامل مع العلامة كلما ظهرت لنا باعتبارها حدثًا
  28. والتحقق من كل حدث
  29. من خلال القاموس
  30. .لمعرفة ما إذا كانت العلامة قد ظهرت لنا من قبل أم لا. ولا أقصد بذلك علامة محددة
  31. .بل ما أقصده هو علامة مقترنة بهذا الاسم. مثل bounds وnode وtag وما إلى ذلك
  32. إذا لم تظهر لك من قبل، فأنشئ مفتاحًا جديدًا في القاموس. وبحلول الوقت
  33. الذي تكون انتهيت فيه من تحليل الملف، ستتوفر لديك
  34. !جميع أسماء العلامات فريدة. Good luck