< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    کیفیت یادگیری ماشینی بستگی به داده‌های آموزشی‌ای دارد که در اختیار آن می‌گذارید.
  • 0:12 - 0:16
    بنابراین استفاده از داده‌ها با کیفیت بالا و با حجم زیاد، اهمیت زیادی دارد.
  • 0:17 - 0:22
    ولی اگر داده‌ها مهم هستند، جا داره بپرسیم این داده‌های آموزشی از کجا می‌آیند؟
  • 0:22 - 0:26
    کامپیوترها اغلب داده‌های آموزشی را از افرادی مثل من و شما جمع آوری می‌کنند،
  • 0:26 - 0:28
    آن هم بدون هیچ تلاشی از سوی ما.
  • 0:28 - 0:34
    یک سرویس پخش ویدیو ممکن است چیزی که تماشا می‌کنید را پیگیری کند،بعد می‌تواند الگوهای موجود در آن داده‌ها را تشخیص دهد تا
  • 0:34 - 0:37
    شاید چیزی که می‌خواهید بعداً تماشا کنید را به شما پیشنهاد کند.
  • 0:37 - 0:43
    در مواقع دیگر، مستقیماً از خودتان درخواست کمک می‌کند، مثل وقتی که یک وب‌سایت از شما می‌خواهد تابلوهای خیابان و تصاویر را ببینید،
  • 0:44 - 0:50
    دارید داده‌های آموزشی‌ای را در اختیار آن می‌گذارید که به یک ماشین کمک می‌کند دیدن را یاد بگیرد و شاید حتی یک روز رانندگی کند.
  • 0:52 - 0:56
    محققان پزشکی می‌توانند از تصاویر پزشکی به عنوان داده‌های آموزشی استفاده کنند
  • 0:56 - 0:59
    تا به کامپیوترها نحوه شناسایی و تشخیص بیماری‌ها را آموزش دهند.
  • 1:00 - 1:06
    یادگیری ماشینی به صدها و هزاران تصویر و راهنمایی آموزشی از سوی پزشک نیاز دارد.
  • 1:06 - 1:10
    پزشکی که می‌داند قبل از تشخیص درست بیماری، باید دنبال چه چیزی باشد.
  • 1:11 - 1:15
    حتی با وجود هزاران نمونه، باز هم ممکن است مشکلاتی در پیش‌بینی کامپیوتر وجود داشته باشد.
  • 1:16 - 1:21
    اگر داده‌های اشعه ایکس فقط از مردها جمع‌آوری شود، پیش‌بینی کامپیوتر ممکن است فقط برای مردها مفید باشد
  • 1:22 - 1:26
    و وقتی از آن خواسته شود که عکس اشعه ایکس یک زن را شناسایی کند، ممکن است نتواند بیماری او را تشخیص دهد.
  • 1:27 - 1:31
    این نقطه کور در داده‌های آموزشی چیزی به نام «سوگیری» ایجاد می‌کند.
  • 1:31 - 1:37
    داده‌های جانب‌دارانه به نفع برخی چیزها هستند و سایر موارد را در اولویت‌بندی پایین‌تری قرار داده یا حذف می‌کنند.
  • 1:37 - 1:42
    بسته به اینکه داده‌های آموزشی چگونه جمع آوری می‌شوند، چه کسی آن‌ها را جمع آوری می‌کند و چطور کامپیوترها از آن تغذیه می‌شوند،
  • 1:42 - 1:45
    این احتمال وجود دارد که سوگیری انسانی در داده‌ها دیده شود.
  • 1:46 - 1:51
    با یادگیری از داده‌های جانب‌دارانه، ممکن است کامپیوتر پیش‌بینی‌های مغرضانه‌ای انجام بدهد،
  • 1:51 - 1:54
    فارغ از اینکه افرادی که کامپیوتر را آموزش می‌دهند از آن آگاه هستند یا نه.
  • 1:55 - 1:58
    پس وقتی به داده‌های آموزشی نگاه می‌کنید، دو سوال از خودتان بپرسید:
  • 1:59 - 2:02
    آیا این داده‌ها برای آموزش دقیق یک کامپیوتر کافی هستند؟
  • 2:02 - 2:07
    و آیا این داده‌ها همه سناریوها و کاربران ممکن را بدون سوگیری نشان می‌دهند؟
  • 2:07 - 2:11
    اینجاست که شما به عنوان یک مربی انسانی، نقش تعیین‌کننده‌ای ایفا می‌کنید.
  • 2:11 - 2:14
    این وظیفه شماست که داده‌هایی بدون سوگیری به دستگاهتان بدهید
  • 2:14 - 2:18
    و این به معنی جمع‌آوری نمونه‌های بسیار از منابع مختلف است.
  • 2:19 - 2:23
    یادتان باشد وقتی داده‌ها را برای یادگیری ماشین انتخاب می‌کنید،
  • 2:23 - 2:27
    در واقع الگوریتم را برنامه‌نویسی کرده و از داده‌های آموزشی به جای کد استفاده می‌کنید.
  • 2:27 - 2:30
    داده، همان کد است.
  • 2:30 - 2:34
    هر چقدر داده‌های بهتری ارائه کنید، کامپیوتر بهتر یاد می‌گیرد.
Title:
AI: Training Data & Bias
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41

Persian subtitles

Revisions Compare revisions