1 00:00:00,909 --> 00:00:02,250 Adriana thu thập dữ liệu 2 00:00:02,250 --> 00:00:04,249 về tỉ lệ phần trăm thắng của các trường 3 00:00:04,249 --> 00:00:07,968 và mức lương hằng năm trên trung bình của huấn luyện viên 4 00:00:07,968 --> 00:00:12,225 theo triệu đô từ năm 2000 tới 2011 5 00:00:12,225 --> 00:00:15,619 cô ấy tạp biểu đồ phân phối và đường xu hướng sau 6 00:00:15,619 --> 00:00:17,604 đây là lương theo triệu đô 7 00:00:17,604 --> 00:00:19,936 và tỉ lệ phần trăm thắng 8 00:00:19,936 --> 00:00:24,056 và ở đây, ta có huấn luyện viên kiếm được 4 triệu đô 9 00:00:24,056 --> 00:00:28,413 và có vẻ họ thắng trên 80% trận đấu 10 00:00:28,413 --> 00:00:29,831 nhưng bạn có huấn luyện viên này 11 00:00:29,831 --> 00:00:31,313 có lương thấp hơn 12 00:00:31,313 --> 00:00:32,823 1,5 triệu đô 13 00:00:32,823 --> 00:00:35,451 và họ thắng trên 85% 14 00:00:35,451 --> 00:00:38,119 nên mỗi điểm dữ liệu này 15 00:00:38,119 --> 00:00:39,576 là một huấn luyện viên 16 00:00:39,576 --> 00:00:41,701 và cái này biểu diễn lương của họ 17 00:00:41,701 --> 00:00:44,770 hoặc tỉ lệ phần trăm thắng dựa theo lương 18 00:00:44,770 --> 00:00:48,326 giả sử đường này biểu diễn chính xác xu hướng của dữ liệu 19 00:00:48,326 --> 00:00:49,625 và giả sử 20 00:00:49,625 --> 00:00:51,070 có các giá trị ngoại lai ở đây 21 00:00:51,070 --> 00:00:53,508 cách mô hình khá xa 22 00:00:53,508 --> 00:00:54,679 và đây không phải 23 00:00:54,679 --> 00:00:55,911 có vẻ có 24 00:00:55,911 --> 00:00:58,050 một mối quan hệ tuyến tính dương ở đây 25 00:00:58,050 --> 00:00:59,582 nhưng nó không quá hẹp 26 00:00:59,582 --> 00:01:01,121 có 1 loạt các huấn luyện viên ở đây 27 00:01:01,121 --> 00:01:03,781 ở khu vực lương thấp 28 00:01:03,781 --> 00:01:05,875 đi từ khoảng 20% 29 00:01:05,875 --> 00:01:07,483 tới 60% 30 00:01:07,483 --> 00:01:10,209 giả sử đường này biểu diễn đúng xu hướng của dữ liệu 31 00:01:10,209 --> 00:01:15,169 tung độ góc là 39 nghĩa là sao? 32 00:01:15,169 --> 00:01:16,786 nếu bạn tin mô hình này 33 00:01:16,786 --> 00:01:19,784 tung độ góc 39 34 00:01:19,784 --> 00:01:22,357 nghĩa là 35 00:01:22,357 --> 00:01:24,437 nếu có ai đó không kiếm được tiền 36 00:01:24,437 --> 00:01:26,583 0 đô 37 00:01:26,583 --> 00:01:28,054 mà họ có thể thắng 38 00:01:28,054 --> 00:01:31,666 mô hình sẽ biểu diễn họ thắng 39% trận đấu 39 00:01:31,666 --> 00:01:33,230 có vẻ không thực tế lắm 40 00:01:33,230 --> 00:01:36,072 vì ít nhất tát cả các huấn luyện viên phải được trả chứ 41 00:01:36,072 --> 00:01:37,760 nhưng hãy xem các đáp án 42 00:01:37,760 --> 00:01:40,323 nào biểu diễn điều đó 43 00:01:40,323 --> 00:01:42,984 mình nhin đáp án 44 00:01:42,984 --> 00:01:46,124 lương trung bình là 39 triệu đô, không 45 00:01:46,124 --> 00:01:48,108 không ai kiếm được 39 triệu đô 46 00:01:48,108 --> 00:01:50,350 trên trung bình, khi lương tăng 1 triệu đô 47 00:01:50,350 --> 00:01:52,765 sẽ tăng 39% trong tỉ lệ phần trăm thắng 48 00:01:52,765 --> 00:01:56,686 đó sẽ là cái gì đó liên quan tới hệ số góc 49 00:01:56,686 --> 00:01:58,735 và hệ số góc chắc chắn không phải 39 50 00:01:58,735 --> 00:02:01,353 tỉ lệ thắng trung bình là 39% 51 00:02:01,353 --> 00:02:02,692 ta biết cái đó là sai 52 00:02:02,692 --> 00:02:05,248 mô hình biểu diễn đội nào có huấn luyện viên 53 00:02:05,248 --> 00:02:06,781 kiếm được 0 triệu đô 54 00:02:06,781 --> 00:02:09,971 sẽ có tỉ lệ phần trăm thắng trung bình là 39% 55 00:02:09,971 --> 00:02:12,717 đây là kết luận gần đúng 56 00:02:12,717 --> 00:02:14,264 với cái ta vừa nói 57 00:02:14,264 --> 00:02:15,740 nếu bạn nghĩ mô hình này 58 00:02:15,740 --> 00:02:17,285 khá là lớn 59 00:02:17,285 --> 00:02:19,452 nếu bạn tin mô hình này 60 00:02:20,916 --> 00:02:23,375 thi ai đó kiếm được 0 triệu đô 61 00:02:23,375 --> 00:02:24,966 sẽ được 39% 62 00:02:24,966 --> 00:02:27,446 và đây là lí do bạn phải xét kĩ mô hình 63 00:02:27,446 --> 00:02:28,688 chúng không đúng tuyệt đối 64 00:02:28,688 --> 00:02:31,249 nhất là trong nhiều trường hợp 65 00:02:31,249 --> 00:02:32,247 nhưng ai biết được 66 00:02:32,247 --> 00:02:34,873 hy vọng bạn thấy bài học này bổ ích