WEBVTT 00:00:07.360 --> 00:00:11.760 ನೀವು ಹಾಕುವ ಡೇಟಾ ಎಷ್ಟು ಉತ್ತಮವೋ ಅಷ್ಟೇ ಮಶಿನ್ ಲರ್ನಿಂಗ್ ಉತ್ತಮವಾಗಿರುತ್ತದೆ. 00:00:11.800 --> 00:00:15.820 ಹೀಗಾಗಿ, ಉನ್ನತ ಗುಣಮಟ್ಟದ ಮತ್ತು ಭಾರಿ ಪ್ರಮಾಣದ ಡೇಟಾ ಅತ್ಯಂತ ಮುಖ್ಯ. 00:00:16.760 --> 00:00:21.960 ಆದರೆ, ಡೇಟಾ ಮುಖ್ಯವಾದರೆ, ಎಲ್ಲಿಂದ ತರಬೇತಿ ಡೇಟಾ ಬರುತ್ತದೆ ಎಂದು ಕೇಳುವುದೂ ಮುಖ್ಯವಲ್ಲವೇ? 00:00:22.280 --> 00:00:26.260 ಸಾಮಾನ್ಯವಾಗಿ, ನೀವು ಮತ್ತು ನಮ್ಮಂತಹವರಿಂದ ಕಂಪ್ಯೂಟರ್ ತರಬೇತಿ ಡೇಟಾ ಸಂಗ್ರಹಿಸುತ್ತದೆ. 00:00:26.260 --> 00:00:27.860 ಇದರಲ್ಲಿ ನಮ್ಮ ಪಾತ್ರ ಏನೂ ಇರೊಲ್ಲ. 00:00:28.440 --> 00:00:31.480 ನೀವು ವೀಕ್ಷಿಸುವುದನ್ನು ವೀಡಿಯೋ ಸ್ಟ್ರೀಮಿಂಗ್‌ ಟ್ರ್ಯಾಕ್ ಮಾಡಬಹುದು, ನಂತರ 00:00:31.660 --> 00:00:36.000 ಪ್ಯಾಟರ್ನ್‌ ಗುರುತಿಸಿ ಮುಂದಿನ ವೀಕ್ಷಣೆಯನ್ನು ನಿಮಗೆ ಶಿಫಾರಸು ಮಾಡಬಹುದು. 00:00:37.420 --> 00:00:43.200 ಕೆಲವು ಬಾರಿ ನೀವೇ ಸಹಾಯ ಕೇಳುತ್ತೀರಿ. ಬೀದಿ ಚಿಹ್ನೆ, ಫೋಟೋ ಗುರುತಿಸುವಂತೆ ವೆಬ್‌ಸೈಟ್ ಕೇಳಿದಾಗ 00:00:43.780 --> 00:00:49.280 ಮಶಿನ್ ಕಲಿಯಲು ನೀವು ತರಬೇತಿ ಡೇಟಾ ಒದಗಿಸುತ್ತೀರಿ ಹಾಗೂ ಒಂದು ದಿನದ ಡ್ರೈವ್ ಕೂಡಾ ಒದಗಿಸುತ್ತೀರಿ. 00:00:52.320 --> 00:00:56.440 ವೈದ್ಯಕೀಯ ಸಂಶೋಧಕರು ವೈದ್ಯಕೀಯ ಚಿತ್ರಗಳನ್ನು ಬಳಸಿ ರೋಗಗಳನ್ನು ಹೇಗೆ ಗುರುತಿಸುವುದು ಮತ್ತು 00:00:56.520 --> 00:00:59.900 ಪತ್ತೆ ಮಾಡುವುದು ಎಂದು ಕಂಪ್ಯೂಟರ್‌ಗೆ ಬೋಧಿಸಲು ತರಬೇತಿ ನೀಡಬಹುದು. 00:01:00.300 --> 00:01:05.560 ಮಶಿನ್ ಲರ್ನಿಂಗ್‌ಗೆ ಸಾವಿರಾರು ಚಿತ್ರಗಳು ಬೇಕು ಮತ್ತು ಬಲ್ಲ ವೈದ್ಯರಿಂದ ತರಬೇತಿ ಅಗತ್ಯವಿರುತ್ತದೆ 00:01:05.640 --> 00:01:09.920 ನಂತರವೇ ಅದು ಸರಿಯಾಗಿ ರೋಗ ಗುರುತಿಸಬಹುದು. 00:01:10.520 --> 00:01:15.540 ಸಾವಿರಾರು ಉದಾಹರಣೆ ಇದ್ದರೂ, ಕಂಪ್ಯೂಟರ್ ಊಹೆಯಲ್ಲಿ ಸಮಸ್ಯೆ ಇದ್ದಿರಬಹುದು. 00:01:15.880 --> 00:01:20.660 ಪುರುಷರಿಂದ ಮಾತ್ರ ಎಕ್ಸ್‌ರೇ ಡೇಟಾ ಸಂಗ್ರಹ ಮಾಡಿದ್ದರೆ, ಪುರುಷರಿಗೆ ಮಾತ್ರ ಕೆಲಸ ಮಾಡಬಹುದು. 00:01:21.880 --> 00:01:26.300 ಮಹಿಳೆ ಎಕ್ಸ್‌ ರೇ ಕೊಟ್ಟರೆ ಅದು ರೋಗ ಗುರುತು ಮಾಡದೇ ಇರಬಹುದು. 00:01:26.620 --> 00:01:30.820 ತರಬೇತಿಯಲ್ಲಿನ ಈ ಕುರುಡು ಡೇಟಾದಿಂದಾಗಿ ಬಯಾಸ್ ಉಂಟಾಗುತ್ತದೆ. 00:01:31.260 --> 00:01:36.420 ಬಯಾಸ್ ಡೇಟಾ ಕೆಲವಕ್ಕೆ ಆದ್ಯತೆ ನೀಡಿದರೆ ಇನ್ನು ಕೆಲವಕ್ಕೆ ಆದ್ಯತೆ ನೀಡುದೇ ಹೊರಗಿಡುತ್ತೆ. 00:01:36.780 --> 00:01:41.800 ಟ್ರೇನಿಂಗ್ ಡೇಟಾ ಸಂಗ್ರಹಿಸಿದ ವಿಧಾನ, ಯಾರು ಸಂಗ್ರಹಿಸಿದ್ದಾರೆ ಮತ್ತು ಹೇಗೆ ಫೀಡ್ ಮಾಡಲಾಗಿದೆ 00:01:41.800 --> 00:01:45.340 ಎಂಬುದನ್ನು ಆಧರಿಸಿ ಡೇಟಾದಲ್ಲಿ ಮಾನವ ಬಯಾಸ್ ಇರುತ್ತದೆ. 00:01:45.880 --> 00:01:50.700 ಬಯಾಸ್ ಡೇಟಾದಿಂದ ಕಲಿತು, ಕಂಪ್ಯೂಟರ್ ಬಯಾಸ್ಡ್ ಊಹೆ ಮಾಡಬಹುದು 00:01:50.780 --> 00:01:54.320 ಕಂಪ್ಯೂಟರ್‌ಗೆ ತರಬೇತಿ ನೀಡಿದ ಜನರಿಗೆ ಇದರ ಬಗ್ಗೆ ತಿಳಿದಿರಲಿ ಅಥವಾ ಇಲ್ಲದಿರಲಿ. 00:01:54.760 --> 00:01:58.400 ನೀವು ತರಬೇತಿ ಡೇಟಾ ನೋಡುತ್ತಿರುವಾಗ, ಎರಡು ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿಕೊಳ್ಳಿ: 00:01:58.640 --> 00:02:01.600 ಕಂಪ್ಯೂಟರ್‌ಗೆ ತರಬೇತಿ ನೀಡಲು ಸಾಕಷ್ಟು ಡೇಟಾ ಇದೆಯೇ? 00:02:02.320 --> 00:02:06.860 ಬಯಾಸ್ ಇಲ್ಲದೇ ಎಲ್ಲ ಸಂಭಾವ್ಯ ಸನ್ನಿವೇಶ ಮತ್ತು ಬಳಕೆದಾರರನ್ನು ಇದು ಪ್ರತಿನಿಧಿಸುತ್ತದೆಯೇ? 00:02:07.460 --> 00:02:11.040 ಇಲ್ಲಿ ಮಾನವ ತರಬೇತಿ ಮುಖ್ಯ ಪಾತ್ರ ವಹಿಸುತ್ತದೆ. 00:02:11.160 --> 00:02:14.500 ನಿಮ್ಮ ಮಶಿನ್‌ಗೆ ಬಯಾಸ್ ಇಲ್ಲದ ಡೇಟಾ ನೀಡುವುದು ನಿಮ್ಮ ಜವಾಬ್ದಾರಿ. 00:02:14.500 --> 00:02:18.160 ಅಂದರೆ, ಹಲವು ಮೂಲಗಳಿಂದ ಟನ್‌ಗಟ್ಟಲೆ ಉದಾಹರಣೆ ಸಂಗ್ರಹ ಮಾಡುವುದು. 00:02:19.300 --> 00:02:22.580 ನೆನಪಿಡಿ, ಮಶಿನ್ ಲರ್ನಿಂಗ್‌ನಿಂದ ಡೇಟಾ ಆಯ್ದುಕೊಂಡರೆ 00:02:22.580 --> 00:02:26.660 ಕೋಡ್ ಬದಲಿಗೆ ತರಬೇತಿ ಡೇಟಾ ಬಳಸಿ ಅಲ್ಗೊರಿಥಂ ಪ್ರೋಗ್ರಾಮ್ ಮಾಡುತ್ತಿರುತ್ತೀರಿ. 00:02:27.100 --> 00:02:29.780 ಇಲ್ಲಿನ ಡೇಟಾ ಎಂಬುದೇ ಕೋಡ್. 00:02:30.180 --> 00:02:34.680 ನೀವು ನೀಡುವ ಡೇಟಾ ಚೆನ್ನಾಗಿದ್ದಷ್ಟೂ, ಕಂಪ್ಯೂಟರ್ ಚೆನ್ನಾಗಿ ಕಲಿಯುತ್ತದೆ.