[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:06.40,Default,,0000,0000,0000,,Trong vài video trước, ta đã tính tổng biến thiên của 9 điểm dữ liệu Dialogue: 0,0:00:06.40,0:00:11.53,Default,,0000,0000,0000,,và được 30, đó là tổng bình phương. Rồi ta tự hỏi Dialogue: 0,0:00:11.53,0:00:19.53,Default,,0000,0000,0000,,bao nhiêu biến thiên là do sự biến thiên trong mỗi nhóm với bao nhiêu biến thiên giữa các nhóm? Dialogue: 0,0:00:19.53,0:00:24.93,Default,,0000,0000,0000,,sự biến thiên trong các nhóm ta có tổng biến thiên trong các nhóm Dialogue: 0,0:00:24.93,0:00:26.93,Default,,0000,0000,0000,,và ta có 6 Dialogue: 0,0:00:26.93,0:00:32.53,Default,,0000,0000,0000,,rồi cân bằng, 30, cân bằng của sự biến thiên này, Dialogue: 0,0:00:32.53,0:00:36.33,Default,,0000,0000,0000,,xuất hiện từ sự biến thiên giữa các nhóm và ta đã tính được Dialogue: 0,0:00:36.33,0:00:39.87,Default,,0000,0000,0000,,nó bằng 24 Dialogue: 0,0:00:39.87,0:00:43.60,Default,,0000,0000,0000,,trong video này, mình muốn dùng thông tin đó Dialogue: 0,0:00:43.60,0:00:49.27,Default,,0000,0000,0000,,để suy luận thống kê Dialogue: 0,0:00:49.27,0:00:53.20,Default,,0000,0000,0000,,để đưa ra 1 vài kết luận hoặc không Dialogue: 0,0:00:53.20,0:00:56.87,Default,,0000,0000,0000,,mình sẽ đặt các nhóm này vào ngữ cảnh Dialogue: 0,0:00:56.87,0:01:00.27,Default,,0000,0000,0000,,ta đã xử lí chúng một cách trừu tượng, nhưng bạn có thể coi chúng Dialogue: 0,0:01:00.27,0:01:03.13,Default,,0000,0000,0000,,là kết quả thí nghiệm Dialogue: 0,0:01:03.13,0:01:11.87,Default,,0000,0000,0000,,cho là mình có 3 loại thuốc khác nhau hoặc 3 loại đồ ăn khác nhau để kiểm tra Dialogue: 0,0:01:11.87,0:01:13.93,Default,,0000,0000,0000,,và đây là điểm của bài kiểm tra Dialogue: 0,0:01:13.93,0:01:25.33,Default,,0000,0000,0000,,đây là đồ ăn 1, đồ ăn 2, rồi đồ ăn 3 Dialogue: 0,0:01:25.33,0:01:33.40,Default,,0000,0000,0000,,và mình muốn tính liệu loại thức ăn có ảnh hưởng tới điểm của họ hay không Dialogue: 0,0:01:33.40,0:01:40.27,Default,,0000,0000,0000,,nếu bạn nhìn vào trung bình, có vẻ họ làm tốt nhất trong nhóm 3 hơn nhóm 2 hoặc 1 Dialogue: 0,0:01:40.27,0:01:44.73,Default,,0000,0000,0000,,nhưng đó chỉ là sự khác biệt ngẫu nhiên phải không? Dialogue: 0,0:01:44.73,0:01:50.60,Default,,0000,0000,0000,,hoặc ta có chắc chắn đó là tại vì sự khác nhau Dialogue: 0,0:01:50.60,0:01:56.87,Default,,0000,0000,0000,,trong trung bình của tổng thể, của tất cả những người ăn loại đồ ăn 3 với 2 với 1 không? Dialogue: 0,0:01:56.87,0:02:03.73,Default,,0000,0000,0000,,câu hỏi là, các trung bình và trung bình thực của tổng thể có bằng nhau không? Dialogue: 0,0:02:03.73,0:02:10.33,Default,,0000,0000,0000,,đây là trung bình của 3 mẫu. nhưng nếu mình biết trung bình thực của tổng thể-- Dialogue: 0,0:02:10.33,0:02:17.80,Default,,0000,0000,0000,,câu hỏi là: liệu trung bình của tổng thể của những người ăn đồ ăn 1 có bằng trung bình của loại đồ ăn 2 không? Dialogue: 0,0:02:17.80,0:02:22.00,Default,,0000,0000,0000,,rõ ràng là mình sẽ không thể đưa đồ ăn đó cho mỗi người Dialogue: 0,0:02:22.00,0:02:25.67,Default,,0000,0000,0000,,từng đang sống rồi bắt họ làm kiểm tra được Dialogue: 0,0:02:25.67,0:02:30.00,Default,,0000,0000,0000,,nhưng có trung bình thực, không chỉ là có thể đo được Dialogue: 0,0:02:30.00,0:02:35.67,Default,,0000,0000,0000,,câu hỏi là: "cái này" bằng "cái này" bằng trung bình là 3, trung bình tổng thể là 3 Dialogue: 0,0:02:35.67,0:02:38.93,Default,,0000,0000,0000,,và câu hỏi là, chúng có bằng nhau không? Dialogue: 0,0:02:38.93,0:02:47.80,Default,,0000,0000,0000,,vì chúng không bằng nhau, nghĩa là loại đồ ăn có tác động tới Dialogue: 0,0:02:47.80,0:02:50.07,Default,,0000,0000,0000,,người ta làm bài tốt trên bài kiểm tra Dialogue: 0,0:02:50.07,0:02:55.00,Default,,0000,0000,0000,,vậy hãy kiểm tra giả thuyết. Đây là giả thuyết không Dialogue: 0,0:02:55.00,0:03:01.27,Default,,0000,0000,0000,,là trung bình đều bằng nhau. đồ ăn không ảnh hưởng Dialogue: 0,0:03:01.27,0:03:07.20,Default,,0000,0000,0000,,"đồ ăn không ảnh hưởng" Dialogue: 0,0:03:07.20,0:03:17.00,Default,,0000,0000,0000,,và giả thuyết thay thế là nó có ảnh hưởng. "có ảnh hưởng" Dialogue: 0,0:03:17.00,0:03:19.00,Default,,0000,0000,0000,,và cách nghĩ theo số lượng Dialogue: 0,0:03:19.00,0:03:20.93,Default,,0000,0000,0000,,là nếu nó không ảnh hưởng, Dialogue: 0,0:03:20.93,0:03:24.00,Default,,0000,0000,0000,,trung bình thực của tổng thể của các nhóm sẽ bằng nhau Dialogue: 0,0:03:24.00,0:03:28.73,Default,,0000,0000,0000,,trung bình thực của tổng thể của nhóm mà ăn loại đồ ăn 1 sẽ bằng Dialogue: 0,0:03:28.73,0:03:35.40,Default,,0000,0000,0000,,với nhóm ăn loại đồ ăn 2, bằng với nhóm ăn loại đồ ăn 3 Dialogue: 0,0:03:35.40,0:03:40.87,Default,,0000,0000,0000,,nếu giả thuyết thay thế là đúng, mấy trung bình này sẽ không bằng nhau Dialogue: 0,0:03:40.87,0:03:43.07,Default,,0000,0000,0000,,ta kiểm tra bằng cách nào? Dialogue: 0,0:03:43.07,0:03:47.20,Default,,0000,0000,0000,,ta sẽ giả sử giả thuyết không, là cái ta luôn làm khi Dialogue: 0,0:03:47.20,0:03:49.80,Default,,0000,0000,0000,,kiểm tra giả thuyết Dialogue: 0,0:03:49.80,0:03:52.60,Default,,0000,0000,0000,,ta sẽ giả sử giả thuyết không Dialogue: 0,0:03:52.60,0:03:56.27,Default,,0000,0000,0000,,rồi tính khả năng được Dialogue: 0,0:03:56.27,0:03:59.27,Default,,0000,0000,0000,,số liệu lớn như vầy? Dialogue: 0,0:03:59.27,0:04:01.20,Default,,0000,0000,0000,,và mình chưa định nghĩa số liệu đó là gì Dialogue: 0,0:04:01.20,0:04:05.27,Default,,0000,0000,0000,,ta sẽ giả sử giả thuyết không Dialogue: 0,0:04:05.27,0:04:08.67,Default,,0000,0000,0000,,rồi tính số liệu gọi là số F Dialogue: 0,0:04:08.67,0:04:11.93,Default,,0000,0000,0000,,số F Dialogue: 0,0:04:11.93,0:04:16.60,Default,,0000,0000,0000,,sẽ có phân phối F-- và ta sẽ không đi chi tiết Dialogue: 0,0:04:16.60,0:04:19.07,Default,,0000,0000,0000,,về phân phối F, nhưng bạn có thể coi nó Dialogue: 0,0:04:19.07,0:04:23.80,Default,,0000,0000,0000,,là tỉ lệ của hai phân phối chi bình mà có hoặc không có mức độ tự do khác nhau Dialogue: 0,0:04:23.80,0:04:31.93,Default,,0000,0000,0000,,số liệu F sẽ bằng tỉ lệ của tổng bình phương giữa các mẫu-- Dialogue: 0,0:04:31.93,0:04:37.07,Default,,0000,0000,0000,,tổng bình phương giữa Dialogue: 0,0:04:37.07,0:04:41.73,Default,,0000,0000,0000,,chia cho, mức độ tự do giữa Dialogue: 0,0:04:41.73,0:04:46.33,Default,,0000,0000,0000,,và thỉnh thoảng cái này được gọi là MSB, Dialogue: 0,0:04:46.33,0:04:52.33,Default,,0000,0000,0000,,chia cho tổng bình phương trong Dialogue: 0,0:04:52.33,0:04:56.53,Default,,0000,0000,0000,,vậy đó là SSW viết bằng màu xanh Dialogue: 0,0:04:56.53,0:05:01.13,Default,,0000,0000,0000,,chia cho SSW Dialogue: 0,0:05:01.13,0:05:07.80,Default,,0000,0000,0000,,chia cho mức độ tự do của SSW Dialogue: 0,0:05:07.80,0:05:12.27,Default,,0000,0000,0000,,bằng m(n-1), giờ hãy xét cái này đang làm gì Dialogue: 0,0:05:12.27,0:05:18.33,Default,,0000,0000,0000,,nếu số này, tử số, cao hơn mẫu số rất nhiều, Dialogue: 0,0:05:18.33,0:05:27.33,Default,,0000,0000,0000,,thì ta biết sự biến thiên trong dữ liệu này sẽ chủ yếu là vì Dialogue: 0,0:05:27.33,0:05:31.60,Default,,0000,0000,0000,,sự khác nhau giữa trung bình thực Dialogue: 0,0:05:31.60,0:05:35.93,Default,,0000,0000,0000,,và không phải vì sự biến thiên giữa các trung bình Dialogue: 0,0:05:35.93,0:05:40.87,Default,,0000,0000,0000,,nếu tử số này cao hơn mẫu số Dialogue: 0,0:05:40.87,0:05:45.73,Default,,0000,0000,0000,,ta nên tin là có sự khác biệt Dialogue: 0,0:05:45.73,0:05:47.20,Default,,0000,0000,0000,,trong trung bình thực của tổng thể Dialogue: 0,0:05:47.20,0:05:48.73,Default,,0000,0000,0000,,nếu số này rất lớn, Dialogue: 0,0:05:48.73,0:05:51.33,Default,,0000,0000,0000,,nó cho ta biết xác suất mà Dialogue: 0,0:05:51.33,0:05:53.60,Default,,0000,0000,0000,,giả thuyết không là đúng sẽ thấp hơn Dialogue: 0,0:05:53.60,0:05:58.53,Default,,0000,0000,0000,,nếu số này rất nhỏ và mẫu số lớn hơn, Dialogue: 0,0:05:58.53,0:06:02.07,Default,,0000,0000,0000,,nghĩa là sự biến thiên trong mỗi mẫu Dialogue: 0,0:06:02.07,0:06:05.47,Default,,0000,0000,0000,,dẫn đến phần lớn tổng sự biến thiên nhiều hơn là Dialogue: 0,0:06:05.47,0:06:07.33,Default,,0000,0000,0000,,sự biến thiên giữa các mẫu. nghĩa là sự biến thiên Dialogue: 0,0:06:07.33,0:06:12.73,Default,,0000,0000,0000,,giữa mỗi mẫu sẽ là tỉ lệ phần trăm tổng biến thiên Dialogue: 0,0:06:12.73,0:06:15.20,Default,,0000,0000,0000,,với biến thiên giữa các mẫu lớn hơn Dialogue: 0,0:06:15.20,0:06:17.80,Default,,0000,0000,0000,,ta sẽ tin là, bất kì sự khác biệt nào Dialogue: 0,0:06:17.80,0:06:21.00,Default,,0000,0000,0000,,giữa các trung bình đều chỉ là ngẫu nhiên Dialogue: 0,0:06:21.00,0:06:24.40,Default,,0000,0000,0000,,và như vậy thì sẽ khó loại giả thuyết không hơn Dialogue: 0,0:06:24.40,0:06:26.87,Default,,0000,0000,0000,,hãy tính nào Dialogue: 0,0:06:26.87,0:06:34.20,Default,,0000,0000,0000,,trong bài này, số SSB là 24 Dialogue: 0,0:06:34.20,0:06:37.93,Default,,0000,0000,0000,,và ta có mức độ tự do là 2 Dialogue: 0,0:06:37.93,0:06:49.80,Default,,0000,0000,0000,,và SSW là 6 và mức độ tự do là Dialogue: 0,0:06:49.80,0:06:52.67,Default,,0000,0000,0000,,6 Dialogue: 0,0:06:52.67,0:06:58.60,Default,,0000,0000,0000,,cái này sẽ bằng 24/2 bằng 12, chia 1 Dialogue: 0,0:06:58.60,0:07:05.87,Default,,0000,0000,0000,,số liệu F mà ta đã tính bằng 12 Dialogue: 0,0:07:05.87,0:07:10.87,Default,,0000,0000,0000,,F nghĩa là Fischer - một nhà sinh học và số liệu học người đã nghĩ ra nó Dialogue: 0,0:07:10.87,0:07:15.27,Default,,0000,0000,0000,,vậy số liệu F bằng 12 Dialogue: 0,0:07:15.27,0:07:18.07,Default,,0000,0000,0000,,ta sẽ thấy số này sẽ hơi lớn Dialogue: 0,0:07:18.07,0:07:19.80,Default,,0000,0000,0000,,mình quên đề cập là, với bất kì bài kiểm tra giả thuyết nào Dialogue: 0,0:07:19.80,0:07:22.27,Default,,0000,0000,0000,,ta sẽ cần mức độ quan trọng Dialogue: 0,0:07:22.27,0:07:24.73,Default,,0000,0000,0000,,cho là mức độ quan trọng Dialogue: 0,0:07:24.73,0:07:28.33,Default,,0000,0000,0000,,cho kiểm tra giả thuyết này là 10% Dialogue: 0,0:07:28.33,0:07:32.27,Default,,0000,0000,0000,,0,10 nghĩa là Dialogue: 0,0:07:32.27,0:07:36.20,Default,,0000,0000,0000,,nếu ta giả sử giả thuyết không, có Dialogue: 0,0:07:36.20,0:07:40.07,Default,,0000,0000,0000,,10% ít khả năng được kết quả mà ta có hơn, Dialogue: 0,0:07:40.07,0:07:41.67,Default,,0000,0000,0000,,được số liệu F này Dialogue: 0,0:07:41.67,0:07:44.80,Default,,0000,0000,0000,,khi đó ta sẽ loại giả thuyết không Dialogue: 0,0:07:44.80,0:07:48.67,Default,,0000,0000,0000,,vậy ta sẽ phải tính số liệu F Dialogue: 0,0:07:48.67,0:07:54.00,Default,,0000,0000,0000,,mà được giá trị lớn như vậy hoặc hơn nữa, là 10% Dialogue: 0,0:07:54.00,0:07:57.13,Default,,0000,0000,0000,,và nếu cái này lớn hơn #giá trị F quan trọng, Dialogue: 0,0:07:57.13,0:07:59.53,Default,,0000,0000,0000,,ta sẽ loại giả thuyết không, Dialogue: 0,0:07:59.53,0:08:01.40,Default,,0000,0000,0000,,nếu nó nhỏ hơn, ta không thể loại giả thuyết không Dialogue: 0,0:08:01.40,0:08:06.27,Default,,0000,0000,0000,,mình sẽ tính số liệu F, Dialogue: 0,0:08:06.27,0:08:09.07,Default,,0000,0000,0000,,nhưng ta phải hiểu là mỗi tổng bình phương Dialogue: 0,0:08:09.07,0:08:12.53,Default,,0000,0000,0000,,có phân phối chi bình. "cái này" có phân phối chi bình Dialogue: 0,0:08:12.53,0:08:15.20,Default,,0000,0000,0000,,và "cái này" có phân phối chi bình khác Dialogue: 0,0:08:15.20,0:08:17.53,Default,,0000,0000,0000,,đây là phân phối chi bình với mức độ tự do là 2, Dialogue: 0,0:08:17.53,0:08:21.33,Default,,0000,0000,0000,,đây là phân phối chi bình Dialogue: 0,0:08:21.33,0:08:24.07,Default,,0000,0000,0000,,với mức độ tự do là 6, Dialogue: 0,0:08:24.07,0:08:29.80,Default,,0000,0000,0000,,vậy phân phối F thực ra là tỉ lệ của 2 phân phối chi bình Dialogue: 0,0:08:29.80,0:08:34.93,Default,,0000,0000,0000,,đây là hình chụp từ 1 khoá học ở UCLA, Dialogue: 0,0:08:34.93,0:08:38.53,Default,,0000,0000,0000,,mình cần phải tìm bảng F để nhìn Dialogue: 0,0:08:38.53,0:08:41.80,Default,,0000,0000,0000,,phân phối F sẽ nhìn giống vầy Dialogue: 0,0:08:41.80,0:08:43.27,Default,,0000,0000,0000,,rõ ràng là nó khác Dialogue: 0,0:08:43.27,0:08:46.60,Default,,0000,0000,0000,,dựa trên mức độ tự do của tử số và mẫu số Dialogue: 0,0:08:46.60,0:08:49.20,Default,,0000,0000,0000,,có 2 mức độ tự do Dialogue: 0,0:08:49.20,0:08:52.53,Default,,0000,0000,0000,,mức độ tự do của tử và mức độ tự do của mẫu Dialogue: 0,0:08:52.53,0:08:56.93,Default,,0000,0000,0000,,hãy tính số liệu F Dialogue: 0,0:08:56.93,0:09:02.87,Default,,0000,0000,0000,,cho alpha bằng 0,10 Dialogue: 0,0:09:02.87,0:09:06.53,Default,,0000,0000,0000,,và bạn sẽ thấy bảng F khác cho mỗi số alpha khác nhau, Dialogue: 0,0:09:06.53,0:09:11.93,Default,,0000,0000,0000,,mà mức độ tự do của tử số là 2, và mức độ tự do của mẫu số là 6 Dialogue: 0,0:09:11.93,0:09:17.40,Default,,0000,0000,0000,,vậy bảng này là cho alpha 10% Dialogue: 0,0:09:17.40,0:09:23.73,Default,,0000,0000,0000,,hoặc 0,1, và mức độ tự do của tử số là 2 và mẫu số Dialogue: 0,0:09:23.73,0:09:30.13,Default,,0000,0000,0000,,là 6. vậy giá trị F quan trọng là 3,46 Dialogue: 0,0:09:30.13,0:09:40.00,Default,,0000,0000,0000,,là giá trị này Dialogue: 0,0:09:40.00,0:09:43.53,Default,,0000,0000,0000,,giá trị ta có dựa vào dữ liệu lớn hơn rất nhiều, Dialogue: 0,0:09:43.53,0:09:46.27,Default,,0000,0000,0000,,rất nhiều. nó sẽ có giá tri p rất nhỏ Dialogue: 0,0:09:46.27,0:09:48.00,Default,,0000,0000,0000,,xác suất được một số lớn như vầy, Dialogue: 0,0:09:48.00,0:09:50.67,Default,,0000,0000,0000,,ngẫu nhiên, dựa theo giả thuyết không, Dialogue: 0,0:09:50.67,0:09:54.73,Default,,0000,0000,0000,,sẽ rất nhỏ. nó nhỏ hơn số liệu F quan trọng với Dialogue: 0,0:09:54.73,0:09:56.93,Default,,0000,0000,0000,,mức độ quan trọng là 10% Dialogue: 0,0:09:56.93,0:10:01.73,Default,,0000,0000,0000,,vì vậy, ta có thể loại giả thuyết không Dialogue: 0,0:10:01.73,0:10:04.40,Default,,0000,0000,0000,,nên, ta sẽ tin là Dialogue: 0,0:10:04.40,0:10:06.60,Default,,0000,0000,0000,,có sự khác nhau trong trung bình của tổng thể Dialogue: 0,0:10:06.60,0:10:09.60,Default,,0000,0000,0000,,có sự khác nhau trong phần làm bài Dialogue: 0,0:10:09.60,0:10:13.47,Default,,0000,0000,0000,,nếu bạn đưa họ các loại đồ ăn khác nhau