< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    یادگیری ماشینی تنها به اندازه داده های آموزشی که
    درون آن می گذارید خوب است.
  • 0:12 - 0:16
    بنابراین، بسیار مهم است که از داده های با کیفیت خوب
    و داده های بسیار استفاده کرد.
  • 0:17 - 0:22
    اما اگر داده مهم است، جای دارد بپرسیم که
    داده های آموزشی از کجا می آیند؟
  • 0:22 - 0:26
    کامپیوترها اغلب داده های آموزشی را
    از افرادی مثل من و شما جمع می کنند
  • 0:26 - 0:28
    بدون اینکه از طرف ما تلاشی شود.
  • 0:28 - 0:31
    یک سرویس پخش ویدئو ممکن است آنچه را
    که شما تماشا می کنید ردیابی کند، سپس می تواند
  • 0:32 - 0:36
    الگوهای موجود در داده را بشناسد تا توصیه کند
    شما بعدا ممکن است چه چیزی تماشا کنید.
  • 0:37 - 0:43
    مواقع دیگر، از شما مستقیما کمک خواسته می شود،
    مثل وقتی که یک وبسایت از شما می خواهد علائم خیابان
  • 0:44 - 0:49
    و تصاویر را شناسایی کنید. در این حال، داده های آموزشی ارائه می کنید
    تا به ماشین کمک کنید یاد بگیرد که ببیند و شاید روزی رانندگی کند.
  • 0:52 - 0:56
    محققان پزشکی می توانند از تصاویر پزشکی
    به عنوان داده های آموزشی استفاده کنند
  • 0:57 - 1:00
    تا به کامپیوترها یاد دهند چگونه
    بیماری ها را شناسایی و درمان کنند.
  • 1:00 - 1:06
    یادگیری ماشینی نیازمند صدها و هزاران تصویر
    و مسیر آموزشی از سوی یک پزشک است
  • 1:06 - 1:10
    که می داند دنبال چه چیزی بگردد،
    قبل از اینکه بتواند به درستی بیماری را شناسایی کند.
  • 1:11 - 1:16
    حتی با وجود هزاران مثال، ممکن است
    پیش بینی های کامپیوتر مشکلاتی داشته باشد.
  • 1:16 - 1:21
    اگر اشعه ایکس فقط از مردان جمع شده باشد، بنابراین
    پیش بینی کامپیوتر ممکن است فقط برای مردان کار کند.
  • 1:22 - 1:26
    ممکن است وقتی از آن خواسته می شود اشعه ایکس زنان را
    شناسایی کند نتواند بیماری را شناسایی کند.
  • 1:27 - 1:31
    نقطه کور در داده های آموزشی باعث چیزی می شود
    که سوگیری نام دارد.
  • 1:31 - 1:36
    داده های سودار از چیزی دفاع می کنند، و چیزهای
    دیگر را خارج و بی اهمیت می سازند.
  • 1:37 - 1:42
    بسته به اینکه داده های آموزشی چگونه جمع شده اند
    چه کسی آنها را جمع کرده و چگونه تغذیه می شوند
  • 1:42 - 1:45
    این احتمال هست که سوگیری انسان وارد
    داده ها شود.
  • 1:46 - 1:51
    کامپیوتربا یادگیری از داده های سودار، ممکن است
    پیش بینی های سودار بکند
  • 1:51 - 1:54
    چه افراد آموزنده کامپیوتر از آن آگاه باشند یا نباشند.
  • 1:55 - 1:58
    وقتی که به داده های آموزشی نگاه می کنید، از خودتان دو سوال بپرسید:
  • 1:59 - 2:02
    آیا این داده ها برای آموزش دقیق یک کامپیوتر
    کافی هستند؟
  • 2:02 - 2:07
    و آیا این داده ها همه حالتها و کاربران ممکن را
    بدون سوگیری نمایندگی می کند؟
  • 2:07 - 2:11
    اینجاست که شما، به عنوان آموزش دهنده انسانی، نقش مهمی
    ایفا می کنید.
  • 2:11 - 2:14
    این منوط به شماست که به ماشین خود
    داده های غیرسودار بدهید.
  • 2:14 - 2:18
    که به معنای جمع کردن هزاران مثال از منابع بسیار است.
  • 2:19 - 2:23
    به یاد داشته باشید، وقتی که داده هایی برای یادگیری ماشینی
    جمع و انتخاب می کنید،
  • 2:23 - 2:27
    شما درواقع دارید با استفاده از داده های آموزشی
    به جای کدها، به الگوریتمها برنامه می دهید
  • 2:27 - 2:30
    این داده ها کد هستند.
  • 2:30 - 2:35
    هرچه داده هایی که ارائه می کنید بهتر باشد،
    کامپیوتر بهتر یاد می گیرد.
Title:
AI: Training Data & Bias
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41

Persian subtitles

Revisions Compare revisions