< Return to Video

AI: Training Data & Bias

  • 0:04 - 0:07
    INTEL·LIGÈNCIA ARTIFICIAL
    DADES D'ENTRENAMENT I BIAIX
  • 0:07 - 0:11
    L'aprenentatge automàtic és tan bo
    com les dades d'entrenament que li dónes.
  • 0:11 - 0:16
    Així que és important
    usar dades d'alta qualitat, i moltes.
  • 0:17 - 0:18
    Però si les dades són importants,
  • 0:18 - 0:21
    ens hem de preguntar
    d'on vénen les dades d'entrenament?
  • 0:22 - 0:24
    Sovint, els ordinadors
    treuen dades d'entrenament
  • 0:24 - 0:28
    de la gent com tu i com jo,
    sense cap esforç per part nostra.
  • 0:28 - 0:31
    Una plataforma de vídeo
    pot guardar què veus,
  • 0:31 - 0:36
    i reconèixer-hi patrons
    per recomanar-te més coses per veure.
  • 0:38 - 0:40
    Altres cops,
    se't demana ajuda directament,
  • 0:40 - 0:43
    com quan un web et demana que cliquis
    als semàfors de les fotos.
  • 0:44 - 0:47
    Estàs aportant dades d'entrenament
    perquè una màquina aprengui a veure-hi,
  • 0:48 - 0:49
    i potser a conduir algun dia.
  • 0:52 - 0:55
    Els investigadors mèdics usen
    imatges mèdiques com dades d'entrenament
  • 0:55 - 0:59
    per ensenyar als ordinadors
    com reconèixer i diagnosticar malalties.
  • 1:00 - 1:04
    L'aprenentatge automàtic requereix
    centenars de milers d'imatges,
  • 1:04 - 1:07
    i consell formatiu d'un metge
    que sap què buscar,
  • 1:07 - 1:10
    abans de poder identificar bé
    una malaltia.
  • 1:10 - 1:12
    Fins i tot amb milers d'exemples,
  • 1:12 - 1:15
    hi pot haver problemes
    amb les prediccions d'un ordinador.
  • 1:16 - 1:21
    Si només es recullen radiografies d'homes,
    les prediccions només valdran per homes.
  • 1:22 - 1:26
    Pot no reconèixer-la bé,
    si ha de diagnosticar-ne una d'una dona.
  • 1:27 - 1:30
    Aquest punt cec en les dades d'entrenament
    crea una cosa que es diu biaix.
  • 1:31 - 1:33
    Les dades esbiaixades
    afavoreixen unes bandes
  • 1:33 - 1:36
    i en perjudiquen o exclouen
    unes altres.
  • 1:36 - 1:38
    En funció de com es recullen
    les dades d'entrenament,
  • 1:38 - 1:42
    qui les recull
    i com s'introdueixen,
  • 1:42 - 1:45
    hi ha opcions que les dades
    incloguin biaix humà.
  • 1:46 - 1:50
    Si aprèn de dades esbiaixades,
    la màquina farà prediccions esbiaixades,
  • 1:50 - 1:54
    encara que la gent que l'entrena
    no en sigui conscient.
  • 1:55 - 1:58
    Quan veus dades d'entrenament,
    fes-te dues preguntes:
  • 1:58 - 2:01
    Hi ha prou dades
    per entrenar un ordinador?
  • 2:01 - 2:03
    I aquestes dades representen
  • 2:03 - 2:06
    qualsevol context
    o usuari possible sense biaix?
  • 2:07 - 2:11
    Aquí és on tu, com a humà entrenador,
    tens un paper vital.
  • 2:11 - 2:14
    Depèn de tu que donis
    dades sense biaix a la màquina.
  • 2:14 - 2:18
    Això vol dir recollir milers d'exemples,
    de moltes fons.
  • 2:19 - 2:22
    Recorda, quan esculls dades
    per entrenament automàtic,
  • 2:22 - 2:27
    estàs programant l'algorisme,
    amb dades enlloc de codi.
  • 2:27 - 2:29
    Les dades són el codi.
  • 2:30 - 2:33
    Com millors siguin les dades,
    millor aprendrà l'ordinador.
Title:
AI: Training Data & Bias
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41

Catalan subtitles

Revisions