< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    Kualitas pembelajaran mesin adalah sebanyak data pelatihan yang Anda masukkan ke dalamnya.
  • 0:12 - 0:16
    Jadi, sangat penting menggunakan data berkualitas tinggi, dan dalam jumlah yang sangat banyak.
  • 0:17 - 0:22
    Namun, jika data itu penting, perlu ditanyakan dari mana data pelatihan itu berasal?
  • 0:22 - 0:26
    Sering kali komputer mengumpulkan data pelatihan dari orang-orang seperti Anda dan saya,
  • 0:26 - 0:28
    tanpa upaya apa pun pada sisi kita.
  • 0:28 - 0:31
    Layanan streaming video mungkin melacak apa yang Anda tonton, lalu ia dapat mengenali pola
  • 0:32 - 0:36
    pada data itu untuk merekomendasikan apa yang mungkin ingin Anda tonton selanjutnya.
  • 0:37 - 0:43
    Di lain waktu, Anda secara langsung diminta untuk membantu, seperti ketika sebuah situs web meminta Anda untuk menemukan rambu jalan dan foto,
  • 0:44 - 0:49
    Anda memberikan data pelatihan untuk membantu
    mesin belajar melihat, dan bahkan mungkin mengemudi pada suatu hari.
  • 0:52 - 0:56
    Peneliti medis dapat menggunakan
    gambar medis sebagai data pelatihan untuk mengajar
  • 0:57 - 1:00
    komputer cara mengenali dan mendiagnosis penyakit.
  • 1:00 - 1:06
    Pembelajaran Mesin membutuhkan ratusan dan ribuan gambar, dan arahan pelatihan dari seorang dokter
  • 1:06 - 1:10
    yang mengetahui apa yang mesti dicari, sebelum ia dapat mengidentifikasi penyakit secara benar.
  • 1:11 - 1:16
    Bahkan dengan ribuan contoh, bisa jadi terdapat masalah dengan prediksi komputer.
  • 1:16 - 1:21
    Jika sinar-X hanya dikumpulkan dari pria, maka prediksi komputer mungkin hanya berguna untuk pria.
  • 1:22 - 1:26
    Ia mungkin tidak mengenali penyakit ketika
    diminta mendiagnosis sinar-X pada seorang wanita.
  • 1:27 - 1:31
    Titik buta ini pada data pelatihan
    menimbulkan sesuatu yang disebut bias.
  • 1:31 - 1:36
    Data yang bias mengutamakan hal-hal tertentu, dan tidak mementingkan atau meniadakan yang lainnya.
  • 1:37 - 1:42
    Tergantung pada cara pengumpulan data pelatihan, siapa yang mengumpulkannya, dan bagaimana data diumpan,
  • 1:42 - 1:45
    ada kemungkinan bahwa bias
    manusia masuk ke dalam data.
  • 1:46 - 1:51
    Dengan belajar dari data bias, komputer dapat membuat prediksi yang bias,
  • 1:51 - 1:54
    terlepas apakah orang yang melatih komputer
    menyadarinya atau tidak.
  • 1:55 - 1:58
    Ketika Anda meneliti data pelatihan, ajukan dua pertanyaan ke diri Anda:
  • 1:59 - 2:02
    Apakah data ini cukup untuk melatih komputer secara akurat?
  • 2:02 - 2:07
    Dan, apakah data ini mewakili semua skenario dan pengguna yang mungkin tanpa bias?
  • 2:07 - 2:11
    Di sinilah Anda, sebagai pelatihan manusia, memainkan peran yang krusial.
  • 2:11 - 2:14
    Semuanya terserah Anda apakah akan memberikan mesin Anda data yang tidak bias.
  • 2:14 - 2:18
    Itu berarti mengumpulkan contoh yang sangat banyak, dari banyak sumber.
  • 2:19 - 2:23
    Ingat, ketika Anda memilih dan memilah data untuk pembelajaran mesin,
  • 2:23 - 2:27
    Anda sebenarnya sedang memprogram algoritme dengan menggunakan data pelatihan alih-alih kode.
  • 2:27 - 2:30
    Data itu adalah Kodenya.
  • 2:30 - 2:35
    Semakin baik data yang Anda berikan, semakin baik pula pembelajaran komputer.
Title:
AI: Training Data & Bias
Description:

The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.

Start learning at http://code.org/

Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41
TranslateByHumans edited Indonesian subtitles for AI: Training Data & Bias

Indonesian subtitles

Revisions