< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:11
    Machine learning उतना ही बेहतर
    होगा जितना ट्रेनिंग डाटा आप उसमें डालेंगे।
  • 0:11 - 0:16
    तो, बहुत सारे हाई क्वालिटी डाटा
    का उपयोग करना काफी आवश्यक है।
  • 0:16 - 0:22
    लेकिन यदि डाटा महत्वपूर्ण है, फिर यह पूछना
    जरूरी है कि यह ट्रेनिंग डाटा कहां से आता है?
  • 0:22 - 0:26
    अक्सर, कंप्यूटर मेरे और आपके जैसे
    लोगों से ट्रेनिंग डाटा इकट्ठा करती है,
  • 0:26 - 0:28
    इसके लिए हमें कोई
    प्रयास नहीं करना पड़ता।
  • 0:28 - 0:34
    एक वीडियो स्ट्रीमिंग सेवा आप क्या देखते हैं उसे ट्रैक कर
    रहा होता है, फिर वह डाटा में पैटर्न को पहचानने लगता है
  • 0:34 - 0:37
    जिससे की वह आपको सलाह दे सके
    की आपको अगला क्या देखना चाहिए।
  • 0:37 - 0:40
    अन्य समय में, आपको मदद
    करने के लिए सीधा कहा जाता है,
  • 0:40 - 0:44
    जैसे जब कोई वेबसाइट आपको स्ट्रीट साइन
    या फोटो को चिन्हित करने के लिए कहता है,
  • 0:44 - 0:49
    जिससे मशीन सीख सके या शायद कभी ड्राइव भी कर
    सके इसलिए आप ट्रेनिंग डाटा मुहैया करा रहे हैं।
  • 0:52 - 0:56
    मेडिकल शोधकर्ता कंप्यूटर को बीमारियों
    का निदान कैसे करना है यह सिखाने के लिए
  • 0:57 - 1:00
    प्रशिक्षण डेटा के रूप में मेडिकल
    तस्वीरों का उपयोग कर सकते हैं।
  • 1:00 - 1:06
    Machine Learning को सैकड़ों और हजारों तस्वीरों की
    आवश्यकता होती है, और एक डॉक्टर से प्रशिक्षण दिशा
  • 1:06 - 1:10
    जो जानता है कि उसे क्या देखना है,
    इससे पहले कि वह बीमारी की सही पहचान कर सके।
  • 1:10 - 1:16
    यहां तक की हजारों उदाहरणों के बावजूद,
    कंप्यूटर के भविष्यवाणी में गड़बड़ी हो सकती है।
  • 1:16 - 1:19
    यदि X-ray डाटा केवल पुरुषों से इकट्ठा की गई हो,
  • 1:19 - 1:21
    फिर हो सकता है कंप्यूटर की भविष्यवाणी
    केवल पुरुषों के लिए ही काम करें।
  • 1:21 - 1:26
    अगर किसी महिला के X-ray को पहचानने के लिए दिया
    जाए तो हो सकता है कि यह बीमारी का निदान ना कर पाए।
  • 1:26 - 1:31
    प्रशिक्षण डेटा में यह अस्पष्ट
    बिंदु पूर्वाग्रह को जन्म देता है।
  • 1:31 - 1:36
    पक्षपातपूर्ण डाटा कुछ चीजों का पक्ष लेती है और
    बाकियों को कम प्राथमिकता या दरकिनार कर देती है।
  • 1:36 - 1:38
    इस बात पर निर्भर करते हुए की ट्रेनिंग
    डाटा को कैसे इकट्ठा किया जाता है,
  • 1:38 - 1:42
    कौन इसे इकट्ठा कर रहा है, और
    कैसे इस डाटा को कंप्युटर मे डाला जा रहा है
  • 1:42 - 1:45
    संभावना है कि इंसानी पूर्वाग्रह
    भी इस डाटा में शामिल है।
  • 1:46 - 1:50
    पूर्वाग्रह ग्रस्त डाटा से सीख कर, कंप्यूटर
    पूर्वाग्रह युक्त भविष्यवाणियां कर सकता है,
  • 1:50 - 1:54
    चाहे कंप्यूटर को ट्रेनिंग देने वाले
    लोग इससे अवगत हो या नहीं हो।
  • 1:54 - 1:58
    जब आप ट्रेनिंग डाटा को देख रहे हैं,
    अपने आप से दो सवाल पूछिए:
  • 1:58 - 2:01
    क्या यह डाटा पर्याप्त है इस
    कंप्यूटर को प्रशिक्षण देने के लिए?
  • 2:01 - 2:07
    और, क्या यह डाटा बिना पूर्वाग्रह के सभी यूजर और
    संभावित परिदृश्यों का प्रतिनिधित्व कर रहा है?
  • 2:07 - 2:11
    यहीं पर आप, एक इंसानी ट्रैनर के रूप
    में एक महत्वपूर्ण भूमिका निभा सकते हैं।
  • 2:11 - 2:14
    यह आप पर निर्भर करता है कि आप
    मशीन को पूर्वाग्रह रहित डाटा प्रदान करें।
  • 2:14 - 2:18
    इसका अर्थ है कि कई सारे स्रोतों से,
    बहुत सारे उदाहरण इकट्ठा करना है।
  • 2:19 - 2:22
    याद रखें, जब आप मशीन लर्निंग
    के लिए डाटा का चयन कर रहे हैं,
  • 2:22 - 2:27
    तो आप असल में कोड के बजाय ट्रेनिंग डाटा का उपयोग
    एल्गोरिदम के प्रोग्रामिंग के लिए कर रहे हैं
  • 2:27 - 2:30
    डाटा ही कोड है।
  • 2:30 - 2:33
    जितना बेहतर डाटा आप मुहैया
    कराएंगे, उतना ही बेहतर कंप्यूटर सीखेगा।
Title:
AI: Training Data & Bias
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41
TranslateByHumans edited Hindi subtitles for AI: Training Data & Bias
TranslateByHumans edited Hindi subtitles for AI: Training Data & Bias

Hindi subtitles

Revisions Compare revisions