-
Mësimi i makinerisë është i mirë vetëm aq sa të dhënat që futen në të.
-
Atëherë është shumë e rëndësishme për të përdorur të dhëna me kualitet të lartë, dhe shumë nga ato.
-
Por nëse të dhënat janë të rëndësishme, duhet pyetur se nga vijnë këto të dhëna?
-
Shpesh, kompjuterët mbledhin të dhëna nga njerëz si unë dhe ti,
-
pa asnjë përpjekje nga ana jonë.
-
Një shërbim për transmetim të videove mund të mbajë gjurmë të atyre që shikoni, pastaj mund të njohë modelet
-
se çfarë të dhëna të rekomandoj që ju mund të shikoni në të ardhmen.
-
Herave të tjera, jeni të pyetur direkt për të ndihmuar, si kur një webfaqe ju kërkon të zgjedhni shenja të rrugës apo foto,
-
ju jeni duke siguruar të dhëna për të ndihmuar makinën të mësojë të shoh, dhe ndoshta një ditë të ngas.
-
Kërkuesit mjekësor mund të përdorin imazhe mjekësore si të dhëna për të mësuar
-
kompjuterët si të vërejnë dhe diagnostifikojnë sëmundje.
-
Mësimi i Makinerisë ka nevojë për qindra e mijëra imazhe dhe drejtim të trajnimit nga një mjek,
-
një person që di çfarë të kërkojë, para se të mund të identifikojë sëmundjen me saktësi.
-
Edhe me mijëra shembuj, mund të ketë probleme me parashikimet e kompjuterit.
-
Nëse të dhënat e rentgenit janë të mbledhura vetëm nga meshkujt, atëherë parashikimet e kompjuterit mund të funksionojnë vetëm për meshkujt.
-
Ajo mund të mos njohë sëmundjet kur i kërkohet të diagnostikojë rentgenin e një gruaje.
-
Kjo zbrazje në të dhënat e trajnimit krijon diçka quhet paragjykim.
-
Të dhënat e paragjykuara favorizojnë disa gjëra dhe i kthejnë në prioritete të ulëta ose përjashtojnë të tjera.
-
Varësisht nga mënyra se si janë të mbledhura të dhënat e trajnimit, kush është personi që i mbledh të dhënat dhe se si ato janë futur,
-
ka një mundësi që paragjykimi njerëzor të përfshihet në të dhënat.
-
Duke mësuar nga të dhënat me paragjykim, kompjuteri mund të bëjë parashikime me paragjykim,
-
pa marrë parasysh nëse ata që e trajnojnë kompjuterin janë të vetëdijshëm për këtë apo jo.
-
Kur po shikoni të dhënat e trajnimit, pyesni veten dy pyetje:
-
A janë këto të dhëna të mjaftueshme për të trajnuar me saktësi një kompjuter?
-
Dhe, a përfaqësojnë këto të dhëna të gjitha skenarët dhe përdoruesit e mundshëm pa paragjykim?
-
Këtu është vendi ku ju, si personi që trajnon, luani një rol kyç.
-
Përsëri, është detyra juaj të siguroni që kompjuteri të ketë të dhëna të paanëshme.
-
Kjo do të thotë të mbledhni një sasi të madhe shembujsh, nga burime të shumta.
-
Më kujtohet, kur zgjidhni të dhëna për mësimin e makinave,
-
po programoni algoritmin, duke përdorur të dhëna të trajnimit në vend të kodit.
-
Të dhënat JANË kodi.
-
Sa më të mira të dhënat që furnizoni, aq më mirë do të mësojë kompjuteri.