< Return to Video

Mẫu khoảng tin cậy cỡ mẫu nhỏ|Xác xuất và thống kê|Khan Academy

  • 0:01 - 0:03
    Mẫu huyết áp của 7 bệnh nhân được đo
  • 0:03 - 0:06
    sau khi sử dụng loại thuốc mới trong 3 tháng.
  • 0:06 - 0:08
    Huyết áp của họ tăng, và đề bài cho ta
  • 0:08 - 0:12
    7 điểm dữ liệu
  • 0:12 - 0:17
    với đơn vị đo huyết áp nào đấy.
  • 0:17 - 0:20
    Hãy xây 95% khoảng tin cậy cho mức tăng huyết áp
  • 0:20 - 0:24
    dự kiến thực cho tổng thể tất cả các bệnh nhân.
  • 0:24 - 0:26
    Đây là một số phân bố tổng thể.
  • 0:26 - 0:29
    Có căn cứ khi ta cho rằng đây là một điều bình thường.
  • 0:29 - 0:33
    Đó là quá trình sinh học.
  • 0:33 - 0:39
    Vậy nếu bạn đưa loại thuốc này cho tất cả những ai đang sống
  • 0:39 - 0:42
    và kết quả sẽ là mức tăng trung bình,
  • 0:42 - 0:45
    hoặc mức giảm trung bình.
  • 0:45 - 0:47
    Và cũng sẽ có một độ lệch chuẩn.
  • 0:47 - 0:49
    Đây gọi là phân phối chuẩn.
  • 0:49 - 0:52
    Và lí do ta nói nó có căn cứ khi cho rằng
  • 0:52 - 0:53
    đó là phân phối chuẩn
  • 0:53 - 0:55
    bởi vì đó là quá trình sinh học bình thường.
  • 0:55 - 0:59
    Nó sẽ là kết quả của hàng nghìn và hàng trăm các sự kiện ngẫu nhiên.
  • 0:59 - 1:01
    Và thứ mà là kết quả đó
  • 1:01 - 1:03
    là phân phối chuẩn.
  • 1:03 - 1:08
    Vậy đây chính là phân phối tổng thể.
  • 1:08 - 1:11
    Và ta không biết cái gì ngoài
  • 1:11 - 1:13
    những mẫu ta có ở đây hết.
  • 1:13 - 1:17
    Giờ, ta có thể, và cho rằng đây là một điều tốt.
  • 1:17 - 1:19
    Khi bạn có một mẫu
  • 1:19 - 1:21
    hãy đi tìm hiểu tất cả những gì bạn có thể
  • 1:21 - 1:22
    từ mẫu đó.
  • 1:22 - 1:24
    Vậy ta có 7 điểm dữ liệu.
  • 1:24 - 1:27
    Và ta có thể cộng chúng lại và chia cho 7
  • 1:27 - 1:29
    để có được trung bình mẫu.
  • 1:29 - 1:34
    Vậy trung bình mẫu ở đây là 2,34.
  • 1:34 - 1:35
    Và bạn có thể tính toán được
  • 1:35 - 1:37
    độ lệch chuẩn mẫu.
  • 1:37 - 1:39
    Tìm bình phương độ của các giá trị
  • 1:39 - 1:43
    so với giá trị trung bình, cộng chúng lại, chia cho n - 1
  • 1:43 - 1:46
    bởi vì nó là mẫu, rồi lấy căn bậc 2
  • 1:46 - 1:47
    rồi lấy độ lệch chuẩn mẫu.
  • 1:47 - 1:50
    Mình đã làm trước để tiết kiệm thời gian rồi.
  • 1:50 - 1:53
    Độ lệch chuẩn mẫu là 1,04.
  • 1:53 - 1:55
    Và khi ta không biết gì về phân phối tổng thể
  • 1:55 - 1:57
    điều ta đã làm từ đầu đến giờ là
  • 1:57 - 2:05
    ước lượng đặc tính đó với độ lệch chuẩn mẫu của ta.
  • 2:05 - 2:08
    Vậy ta đã ước lượng được độ lệch chuẩn
  • 2:08 - 2:16
    của tổng thể bằng độ lệch chuẩn mẫu.
  • 2:16 - 2:20
    Giờ ta sẽ đi vào một vấn đề.
  • 2:20 - 2:25
    Ta đang ước lượng độ lệch chuẩn với n là 7.
  • 2:25 - 2:31
    Vậy đây có lẽ không phải là một sự ước lượng tốt
  • 2:31 - 2:41
    vì n là số nhỏ.
  • 2:41 - 2:44
    Nói chung, nó sẽ là một sự ước lượng không chính xác
  • 2:44 - 2:46
    nếu n nhỏ hơn 30.
  • 2:46 - 2:50
    Lớn hơn 30 thì là một sự áng chừng tốt hơn.
  • 2:50 - 2:53
    Vấn đề chính của video này là ta nghĩ về
  • 2:53 - 2:55
    phân phối mẫu, tức là
  • 2:55 - 2:59
    ta sẽ tạo ra khoảng, thay vì cho rằng
  • 2:59 - 3:02
    phân phối xác suất của giá trị mẫu là bình thường giống như ta đã làm
  • 3:02 - 3:05
    ở các video khác sử dụng định lý giới hạn trung tâm,
  • 3:05 - 3:08
    ta sẽ chỉnh sửa phân phối mẫu.
  • 3:08 - 3:11
    Ta sẽ không cho rằng nó là phân phối chuẩn
  • 3:11 - 3:12
    bởi vì đây là một sự ước lượng không chính xác.
  • 3:12 - 3:14
    Ta sẽ gọi nó là
  • 3:14 - 3:16
    phân phối t.
  • 3:16 - 3:18
    Về cơ bản phân phối t là
  • 3:18 - 3:23
    nó gần như được thiết kế để đưa ra
  • 3:23 - 3:25
    đánh giá tốt hơn về những khoảng tin cậy
  • 3:25 - 3:29
    và những thứ khác, khi ta có một cỡ mẫu nhỏ.
  • 3:29 - 3:35
    Nó nhìn rất giống một phân phối chuẩn.
  • 3:35 - 3:39
    Đường thẳng đứng này là giá trị trung bình
  • 3:39 - 3:40
    của phân phối mẫu của chúng ta.
  • 3:40 - 3:46
    Phần đuôi của phân phối này lớn hơn chút.
  • 3:46 - 3:50
    Mình nghĩ lí do nó có phần đuôi lớn hơn là khi
  • 3:50 - 3:53
    ta có giả thiết là nó chính là độ lệch chuẩn của,
  • 3:53 - 3:56
    để mình làm thêm một bước nữa.
  • 3:56 - 3:59
    Thường thì ta sẽ tìm ước lượng đúng của
  • 3:59 - 4:02
    độ lệch chuẩn thực, và rồi ta nói
  • 4:02 - 4:08
    độ lệch chuẩn của phân phối xác suất của giá trị mẫu bằng với
  • 4:08 - 4:11
    độ lệch chuẩn tổng thể thực chia cho
  • 4:11 - 4:13
    căn bậc hai của n.
  • 4:13 - 4:16
    Trong trường hợp này, n bằng 7.
  • 4:16 - 4:19
    Và ta nói, được rồi, ta không bao giờ biết được độ lệch chuẩn thực sự,
  • 4:19 - 4:21
    hay ta khó mà biết được.
  • 4:21 - 4:25
    Vậy nếu ta không biết, thì cái tốt nhất để đưa vào đây
  • 4:25 - 4:32
    là độ lệch chuẩn mẫu của chúng ta.
  • 4:32 - 4:36
    Và ở đây, đây là lí do tại sao chúng ta không nói
  • 4:36 - 4:39
    đó chỉ là 95 khoảng xác suất đáng tin cậy.
  • 4:39 - 4:41
    Đây là lí do tại sao ta gọi đó là
  • 4:41 - 4:43
    khoảng tin cậy, vì ta đang có những giả thiết ở đây.
  • 4:43 - 4:47
    Nó sẽ thay đổi từ mẫu qua mẫu.
  • 4:47 - 4:50
    Và đặc biệt, nó sẽ là một đánh giá rất sai lầm
  • 4:50 - 4:53
    khi ta có cỡ mẫu nhỏ,
  • 4:53 - 4:55
    nhỏ hơn 30.
  • 4:55 - 4:59
    Nếu bạn có cho rằng một độ lệch chuẩn nào đó mà bạn chưa biết,
  • 4:59 - 5:01
    bạn ước lượng nó bằng độ lệch chuẩn mẫu,
  • 5:01 - 5:04
    và khi mẫu của bạn nhỏ,
  • 5:04 - 5:07
    bạn sẽ sử dụng cái này để ước lượng
  • 5:07 - 5:10
    độ lệch chuẩn của phân phối mẫu của bạn,
  • 5:10 - 5:14
    chứ bạn không giả định rằng phân phối mẫu đó là phân phối chuẩn.
  • 5:14 - 5:17
    Bạn giả dụ rằng phần đuôi của nó lớn hơn.
  • 5:17 - 5:20
    Và phần đuôi của nó lớn hơn bởi vì
  • 5:20 - 5:22
    bạn đã đánh giá thấp
  • 5:22 - 5:24
    độ lệch chuẩn ở đây.
  • 5:24 - 5:26
    Dù sao thì, với những điều đó, hãy giải quyết
  • 5:26 - 5:27
    những vấn đề ở đây.
  • 5:27 - 5:30
    Ta cần phải xem xét cái 95% khoảng tin cậy
  • 5:30 - 5:33
    xung quanh đường trung bình này.
  • 5:33 - 5:37
    Vậy 95% khoảng tin cậy, nếu đây là phân phối chuẩn
  • 5:37 - 5:39
    ta chỉ cần nhìn vào bảng Z thôi.
  • 5:39 - 5:45
    Nhưng nó không phải, nó là một phân phối t.
  • 5:45 - 5:48
    Ta đang đi tìm 95% khoảng tin cậy.
  • 5:48 - 5:51
    Vậy một số khoảng nào đó xung quanh đường trung bình
  • 5:51 - 5:54
    bao gồm 95% diện tích của nó.
  • 5:54 - 5:56
    Đối với một phân phối t, ta dùng bảng t
  • 5:56 - 5:59
    và mình có một bảng t ở ngay đây.
  • 5:59 - 6:02
    Và ta sẽ sử dụng những thông tin này
  • 6:02 - 6:04
    để giúp ta tìm ra câu trả lời.
  • 6:04 - 6:06
    Và cách tốt nhất là
  • 6:06 - 6:09
    ta xét trục đối xứng quanh đường trung bình.
  • 6:09 - 6:11
    Nó có hai bên như thế này.
  • 6:11 - 6:15
    Nó là một loại tỷ lệ phần trăm tích lũy lên tới một ngưỡng nào đó
  • 6:15 - 6:19
    Nhưng trong trường hợp này, nó là hai mặt, chúng đối xứng.
  • 6:19 - 6:20
    Hoặc nói cách khác,
  • 6:20 - 6:22
    chúng ta loại trừ cả hai mặt.
  • 6:22 - 6:25
    Vậy ta muốn 95% ở chính giữa.
  • 6:25 - 6:33
    Và đây là phân phối xác suất của giá trị mẫu
  • 6:33 - 6:37
    của trung bình mẫu của n bằng 7.
  • 6:37 - 6:39
    Và mình sẽ không đi sâu vào chi tiết hơn,
  • 6:39 - 6:45
    nhưng khi n bằng 7 ta có 6 bậc tự do, nghĩa là n - 1.
  • 6:45 - 6:48
    Và nhìn vào bảng t đã có sẵn,
  • 6:48 - 6:50
    ta tìm được các bậc tự do.
  • 6:50 - 6:53
    Vậy ta không đi tìm n, ta tìm n - 1.
  • 6:53 - 6:55
    Vậy ta đi đến 6, ở ngay đây.
  • 6:55 - 6:59
    Nếu ta muốn gói gọn 95% của cái này,
  • 6:59 - 7:01
    và ta có n của 6,
  • 7:01 - 7:06
    ta sẽ phải đi 2,447 độ lệch chuẩn từ mỗi hướng.
  • 7:06 - 7:11
    Và bảng t này giả định rằng ta đang áng chừng,
  • 7:11 - 7:14
    độ lệch chuẩn bằng độ lệch chuẩn mẫu.
  • 7:14 - 7:18
    Nói cách khác, ta sẽ phải đi thêm
  • 7:18 - 7:21
    2,447 độ lệch chuẩn 'áng chừng' này.
  • 7:21 - 7:22
    Để mình ghi lại.
  • 7:22 - 7:28
    Khoảng cách ở đây là 2,447
  • 7:28 - 7:36
    nhân với xấp xỉ độ lệch chuẩn ở đây.
  • 7:36 - 7:40
    Và đôi khi bạn sẽ thấy điều này ở một số sách về thống kê
  • 7:40 - 7:42
    Số ở ngay đây,
  • 7:42 - 7:44
    được thể hiện như thế này.
  • 7:44 - 7:47
    Cho nó một cái mũ ở đây, trên độ lệch chuẩn
  • 7:47 - 7:50
    để thể hiện nó đã được xấp xỉ hóa sử dụng
  • 7:50 - 7:51
    độ lệch chuẩn mẫu.
  • 7:51 - 7:53
    Cho nó thêm một chiếc mũ vì
  • 7:53 - 7:56
    thành thật mà nói, đó là thứ duy nhất ta có thể tính.
  • 7:56 - 7:58
    Vậy đây là khoảng cách ta cần đi từ mỗi hướng.
  • 7:58 - 8:00
    Và ta đã biết giá trị của nó.
  • 8:00 - 8:02
    Ta đã biết phân phối mẫu là gì.
  • 8:02 - 8:11
    Hãy lấy máy tính ra nào.
  • 8:11 - 8:17
    Vậy ta đã biết độ lệch chuẩn mẫu của ta là 1,04.
  • 8:17 - 8:24
    Và ta muốn chia nó với căn bậc hai của 7.
  • 8:24 - 8:29
    Vậy ta có 0,39.
  • 8:29 - 8:36
    Vậy ở đây là 0,39.
  • 8:36 - 8:40
    Nếu ta muốn tìm khoảng cách quanh
  • 8:40 - 8:43
    số bình quân của tổng thể chung thể hiện 95% của tổng thể,
  • 8:43 - 8:46
    hoặc của phân phối xác suất của giá trị mẫu,
  • 8:46 - 8:51
    ta phải nhân 0,39 với 2,447.
  • 8:51 - 9:01
    Nhân với 2,447 là bằng 0,96.
  • 9:01 - 9:10
    Vậy khoảng cách ở đây là 0,96.
  • 9:10 - 9:14
    Và khoảng cách ở đây cũng là 0,96.
  • 9:14 - 9:16
    Nếu ta lấy một mẫu bất kì,
  • 9:16 - 9:20
    đó chính xác là những gì ta đã làm khi lấy 7 mẫu này.
  • 9:20 - 9:23
    Vậy ta lấy 7 mẫu này và tính trung bình,
  • 9:23 - 9:26
    số đó có thể được xem là mẫu bất kì
  • 9:26 - 9:27
    từ phân phối mẫu.
  • 9:27 - 9:31
    Cũng như vậy đối với xác xuất, như ta có thể thấy
  • 9:31 - 9:36
    có 95% cơ hội,
  • 9:36 - 9:39
    ta phải dự báo trước mọi thứ với sự tự tin,
  • 9:39 - 9:41
    vì giờ ta đang chỉ ước lượng thôi.
  • 9:41 - 9:44
    Nó không phải chính xác là 95% cơ hội.
  • 9:44 - 9:48
    Chúng ta chỉ tự tin cho rằng có 95% cơ hội rằng
  • 9:48 - 9:53
    tổng thể ngẫu nhiên, hay trung bình mẫu ngẫu nhiên, ở đây bằng
  • 9:53 - 9:56
    2,34 ở đây,
  • 9:56 - 10:00
    ta lấy 2,34 từ khoảng phân phối ở đây.
  • 10:00 - 10:12
    Vậy có 95% cơ hội rằng 2,34 nằm trong khoảng 0,96 của
  • 10:12 - 10:16
    phân phối mẫu thực,
  • 10:16 - 10:22
    giống như trung bình tổng.
  • 10:22 - 10:25
    Hoặc ta chỉ cần sắp xếp lại câu từ và nói rằng
  • 10:25 - 10:33
    có 95% cơ hội rằng, trung bình thực,
  • 10:33 - 10:40
    giống như trung bình phân phối mẫu,
  • 10:40 - 10:45
    nằm trong 0,96 của trung bình mẫu, của 2,34.
  • 10:45 - 10:52
    Vậy nếu ta lấy 2,34 trừ
  • 10:52 - 10:56
    0,96, đó là cận dưới của khoảng tin cậy của ta.
  • 10:56 - 10:58
    1,38.
  • 10:58 - 11:02
    Còn cận trên của khoảng tin cậy này là
  • 11:02 - 11:05
    2,34 + 0,96 = 3,3.
  • 11:05 - 11:11
    Vậy 95% khoảng tin cậy của ta là từ 1,38 tới 3,3.
Title:
Mẫu khoảng tin cậy cỡ mẫu nhỏ|Xác xuất và thống kê|Khan Academy
Description:

Xây dựng khoảng tin cậy cỡ mẫu nhỏ sử dụng phân phối t

Xem bài học tiếp theo: https://www.khanacademy.org/math/probability/statistics-inferential/margin-of-error/v/mean-and-variance-of-bernoulli-distribution-example?utm_source=YT&utm_medium=Desc&utm_campaign=ProbabilityandStatistics

Bỏ lỡ bài học trước? https://www.khanacademy.org/math/probability/statistics-inferential/confidence-intervals/v/confidence-interval-example?utm_source=YT&utm_medium=Desc&utm_campaign=ProbabilityandStatistics

Xác suất và thống kê trên Học viện Khan: Hãy thách mình qua một ngày mà không xem xét hoặc sử dụng xác suất. Hôm nay, bạn đã có kiểm tra dự báo thời tiết chưa? Bạn đã có quyết định liệu mình nên lái xe hoặc đi bộ đến một địa điểm nào đó? Trong đời thường sống, chúng ta sẽ luôn tạo ra các giả thuyết, đưa ra dự đoán, thử nghiệm và phân tích. Cuộc sống đầy những xác suất, và những thống kê liên quan đến xác suất. Phần lớn các dữ liệu chúng ta thường sử dụng để xác định những chuyện có thể xảy ra đến từ hiểu biết về thống kê. Trong các bài hướng dẫn này, chúng tôi sẽ đề cập đến một loạt các chủ đề bao gồm: sự kiện độc lập, xác suất phụ thuộc, toán học tổ hợp, kiểm tra giả thuyết, thống kê mô tả, biến ngẫu nhiên, phân phối xác suất, hồi quy và thống kê suy luận. Xác suất và thống kê trên Học viện Khan: Hãy thách mình qua một ngày mà không xem xét hoặc sử dụng xác suất. Hôm nay, bạn đã có kiểm tra dự báo thời tiết chưa? Bạn đã có quyết định liệu mình nên lái xe hoặc đi bộ đến một địa điểm nào đó? Trong đời thường sống, chúng ta sẽ luôn tạo ra các giả thuyết, đưa ra dự đoán, thử nghiệm và phân tích. Cuộc sống đầy những xác suất, và những thống kê liên quan đến xác suất. Phần lớn các dữ liệu chúng ta thường sử dụng để xác định những chuyện có thể xảy ra đến từ hiểu biết về thống kê. Trong các bài hướng dẫn này, chúng tôi sẽ đề cập đến một loạt các chủ đề bao gồm: sự kiện độc lập, xác suất phụ thuộc, toán học tổ hợp, kiểm tra giả thuyết, thống kê mô tả, biến ngẫu nhiên, phân phối xác suất, hồi quy và thống kê suy luận. Bạn hãy thắt dây an toàn và bắt đầu phiêu liêu cũng Khan Academy. Chúng tôi biết rằng trong quá trình học, bạn chắc sẽ được thử thách!

Về Khan Academy: Khan Academy là một tổ chức phi lợi nhuận có nhiệm vụ cung cấp giáo dục miễn phí, đẳng cấp thế giới cho bất kỳ ai, bất cứ nơi nào. Chúng tôi tin rằng mọi người bất kể lứa tuổi nên có quyền truy cập không giới hạn vào nội dung giáo dục miễn phí và học theo tốc độ riêng của mình. Sử dụng phần mềm thông minh, phân tích dữ liệu sâu và giao diện người dùng trực quan, Khan Academy tự hào mang đến cho người dùng những bài luyện tập, các video hướng dẫn, và một bảng quá trình học tập cho hơn 50 môn học, có gồm Toán học, Khoa học, Lập trình máy tính, Lịch sử, Lịch sử nghệ thuật, Kinh tế và hơn thế nữa. Chúng tôi đang cùng đồng hành với các viện nghiên cứu như NASA, Bảo tàng Nghệ thuật Hiện đại (The Museum of Modern Art), Viện Khoa Học California (The California Academy of Sciences), và những học viện uy tín như MIT để mang đến các nội dung mang tính chuyên ngành. Hiện giờ, Khan Academy đã được dịch sang hàng chục ngôn ngữ, và đã có hơn 100 triệu người trên toàn thế giới sử dụng nền tảng của chúng tôi mỗi năm. Để biết thêm thông tin, hãy truy cập www.khanacademy.org, tham gia Facebook của chúng tôi hoặc theo dõi chúng tôi trên twitter tại @khanacademy.

Miễn phí. Cho tất cả mọi người. Mãi mãi. #YouCanLearnAnything

Theo dõi kênh Xác xuất và thống kê của Khan Academy:
https://www.youtube.com/channel/UCRXuOXLW3LcQLWvxbZiIZ0w?sub_confirmation=1
Theo dõi kênh Khan Academy: https://www.youtube.com/subscription_center?add_user=khanacademy

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
11:11

Vietnamese subtitles

Revisions Compare revisions