< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    मशीन अभ्यास तेवढाच चांगला असू शकेल
    जेवढा चांगला त्यात वापरलेला शिकवणीचा डेटा असेल.
  • 0:12 - 0:16
    म्हणूनच, उच्च प्रतीचा डेटा वापरणे आणि
    खूपसा डेटा वापरणे दोन्ही फार महत्त्वाच्या बाबी आहेत.
  • 0:17 - 0:22
    पण जर डेटा एवढा महत्त्वाचा आहे, तर
    शिकवणीचा डेटा कुठून येतो हा प्रश्नसद्धा महत्त्वाचाच आहे.
  • 0:22 - 0:26
    अनेकदा, कॉम्प्युटर्स शिकवणीचा डेटा
    तुमच्या आणि माझ्यासारख्या लोकांकडूनच घेतात,
  • 0:26 - 0:28
    त्यासाठी आपल्याला काही करावे लागत नाही.
  • 0:28 - 0:31
    एखादी व्हिडिओ स्ट्रीमिंग करणारी सेवा
    लक्षात ठेवू शकते की तुम्ही काय पाहाता,
  • 0:32 - 0:36
    त्या आधारे ती सेवा त्यातील पॅटर्न पाहून तुम्हाला
    आणखी काय पाहायला आवडेल हे ठरवू शकते.
  • 0:37 - 0:43
    किंवा, तुम्हाला मदत करण्यासाठी विचारले ही जाऊ शकते, जसे जेव्हा एखाद्या वेबसाइटवर
    तुम्हाला रस्त्याच्या पाट्या आणि फोटो ओळखायला सांगितले जाते,
  • 0:44 - 0:49
    तेव्हा तुम्ही एखाद्या मशीनीला पाहायला शिकवण्यासाठी
    किंवा वाहन चालवण्यासाठी सुद्धा शिकवणीचा डेटा देत असता.
  • 0:52 - 0:56
    वैद्यकीय शोधकर्ते वैद्यकीय फोटोंना
    शिकवणीच्या डेटा प्रमाणे वापरून
  • 0:57 - 1:00
    कॉम्प्युटर्सना आजारांची ओळख आणि
    निदान कसे करावे ते शिकवू शकतात.
  • 1:00 - 1:06
    मशीन अभ्यासासाठी लाखोंच्या संख्येने फोटोंची गरज असते,
    तसेच अशा डॉक्टरांकडून शिक्षण दिले गेले पाहिजे
  • 1:06 - 1:10
    जे त्या क्षेत्रातील तज्ञ असतील, त्यानंतरच
    कॉम्प्युटर आजारांची योग्य ओळख करू शकेल.
  • 1:11 - 1:16
    हजारो उदाहरणे दिल्या नंतर सुद्धा,
    कॉम्प्युटरने ओळखण्यात चुका होण्याचा संभव असतो.
  • 1:16 - 1:21
    जर क्ष-किरणांचा डेटा फक्त पुरुषांचा असला, तर अशी शक्यता असते
    की कॉम्प्युटरचे भाकीत फक्त पुरुषांसाठीच बरोबर असेल.
  • 1:22 - 1:26
    त्याला जर एखाद्या महिलेचा क्ष-किरणांचा फोटो दाखवला
    तर त्याला बहुतेक आजाराची ओळख करता येणार नाही.
  • 1:27 - 1:31
    शिकवणीच्या डेटामधील या दोषामुळे
    पूर्वाग्रह निर्माण होतो.
  • 1:31 - 1:36
    पूर्वाग्रह असलेल्या डेटामुळे काही गोष्टींना
    प्राधान्य मिळते आणि इतर गोष्टींवर लक्ष दिले जात नाही.
  • 1:37 - 1:42
    शिकवणीचा डेटा कसा गोळा केला आहे, कोणी गोळा केला आहे
    आणि तो कसा कॉम्प्युटरमध्ये फीड केला गेला आहे
  • 1:42 - 1:45
    यावर ही गोष्ट अवलंबून असते की
    त्यात मानवी पूर्वाग्रह शिरले आहेत की नाही.
  • 1:46 - 1:51
    पूर्वाग्रह असलेल्या डेटापासून शिकल्याने
    कॉम्प्युटर पूर्वाग्रह-दूषित भाकीत करू शकेल,
  • 1:51 - 1:54
    कॉम्प्युटरला शिकवीत असलेल्या लोकांना
    त्याबद्दल माहिती असो किंवा नसो.
  • 1:55 - 1:58
    जेव्हा तुम्ही शिकवणीचा डेटा पाहाता,
    तेव्हा स्वतःला दोन प्रश्न विचारा:
  • 1:59 - 2:02
    एखाद्या कॉम्प्युटरला अचूकपणे
    शिकवण्यासाठी हा डेटा पुरेसा आहे का?
  • 2:02 - 2:07
    तसेच, शक्य असलेल्या सर्व परिस्थिती आणि
    उपयोगकर्ते पूर्वाग्रहाशिवाय या डेटामध्ये समाविष्ट आहेत का?
  • 2:07 - 2:11
    इथेच शिकवणारा एक मानव म्हणून
    तुमची भूमिका महत्त्वाची ठरते.
  • 2:11 - 2:14
    तुमच्या मशीनीला पूर्वाग्रह-विरहित डेटा देणे
    तुमच्यावर अवलंबून आहे.
  • 2:14 - 2:18
    याचा अर्थ होतो खूपशा स्रोतांपासून
    खूपशी उदाहरणे गोळा करणे.
  • 2:19 - 2:23
    लक्षात ठेवा, जेव्हा तुम्ही
    मशीन अभ्यासासाठी डेटा निवडता,
  • 2:23 - 2:27
    तेव्हा तुम्ही खरेतर प्रोग्रामिंग करीत आहात,
    फक्त त्यासाठी कोड ऐवजी डेटा वापरत आहात.
  • 2:27 - 2:30
    डेटाच तुमचा कोड आहे.
  • 2:30 - 2:35
    जेवढा चांगला डेटा तुम्ही द्याल,
    तुमचा कॉम्प्युटर तेवढाच चांगला शिकेल.
Title:
AI: Training Data & Bias
Description:

The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.

Start learning at http://code.org/

Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41
TranslateByHumans edited Marathi subtitles for AI: Training Data & Bias

Marathi subtitles

Revisions