< Return to Video

Giới thiệu Phân Phối Chuẩn

  • 0:02 - 0:05
    Phân phối chuẩn có lẽ là khái niệm
  • 0:05 - 0:06
    quan trọng nhất trong thống kê.
  • 0:06 - 0:09
    Tất cả những gì ta làm hay hầu hết trong thống kê
  • 0:09 - 0:11
    suy luận, suy luận
  • 0:11 - 0:15
    dựa trên điểm dữ liệu á, đều dựa trên một phần nào đó
  • 0:15 - 0:16
    phân phối chuẩn.
  • 0:16 - 0:23
    Nên mình tính trong video này, trong bảng tính này,
  • 0:23 - 0:26
    sẽ đào càng sâu vào phân phối chuẩn
  • 0:26 - 0:28
    càng tốt.
  • 0:28 - 0:31
    Sau này nếu ai hỏi về
  • 0:31 - 0:33
    phân phối chuẩn thì còn biết trả lời
  • 0:33 - 0:34
    đây là công thức và tui biết
  • 0:34 - 0:35
    dùng luôn vâng vâng.
  • 0:35 - 0:39
    À bảng tính này có thể tải về tại
  • 0:39 - 0:44
    www.khanacademy.org/downlads/
    cứ vào là thấy
  • 0:44 - 0:46
    mấy tài liệu tải về được trong đó hết.
  • 0:46 - 0:50
    Vào download/normalintro.xls là ra
  • 0:50 - 0:51
    cái bảng tính này.
  • 0:53 - 0:56
    À nếu vào Wiki và tìm
  • 0:56 - 0:59
    phân phối chuẩn hay google
  • 0:59 - 1:03
    phân phối chuẩn -- để mình lấy cây bút --
  • 1:03 - 1:05
    thì sẽ thấy cái này.
  • 1:05 - 1:07
    Mình mới copy từ Wikipedia luôn á.
  • 1:07 - 1:10
    Nhìn hơi sợ nhỉ, toàn ký tự Hy Lạp,
  • 1:10 - 1:14
    mà đây chỉ là -- cái xichma này --
  • 1:14 - 1:16
    là độ lệch chuẩn của phân phối thôi.
  • 1:16 - 1:19
    Xí nữa sẽ xài trong cái đồ thị này
  • 1:19 - 1:21
    và biết nó là gì à.
  • 1:21 - 1:23
    Bạn biết độ lệch chuẩn là gì nhưng
  • 1:23 - 1:26
    đây là độ lệch chuẩn của phân phối này, của
  • 1:26 - 1:28
    hàm mật độ xác suất á.
  • 1:28 - 1:30
    À xem lại video về
  • 1:30 - 1:32
    hàm mật độ xác suất nha vì có nhắc về
  • 1:32 - 1:35
    chuyển tiếp từ phân phối nhị thức.
  • 1:36 - 1:39
    Phân phối nhị thức là, ví như xác suất
  • 1:39 - 1:42
    ra 5 là nhiêu, rồi bạn nhìn vào biểu đồ tần suất
  • 1:42 - 1:44
    hay biểu đồ cột rồi tìm xác suất.
  • 1:44 - 1:48
    Nhưng trong phân phối xác suất liên tục hay
  • 1:48 - 1:51
    hàm mật độ xác suất liên tục, bạn không chỉ ra
  • 1:51 - 1:53
    xác suất ra 5 được.
  • 1:53 - 1:56
    Bạn phải nói xác suất mình ra giữa
  • 1:56 - 2:00
    hmm, ví dụ 4,5 và 5,5 là nhiêu.
  • 2:00 - 2:02
    Ý là phải cho một phạm vi dữ liệu nào đó.
  • 2:02 - 2:05
    Rồi xác suất đó không phải
  • 2:05 - 2:06
    đọc biểu đồ là ra.
  • 2:06 - 2:09
    Xác suất là diện tích dưới đường cong.
  • 2:12 - 2:13
    Nó là diện tích này nè.
  • 2:13 - 2:17
    Cho các bạn biết phép tính vi tích phân, nếu p của x là
  • 2:17 - 2:19
    hàm mật độ xác suất -- không cần phải là phân phối chuẩn
  • 2:19 - 2:24
    mặc dù nó thường là phân phối chuẩn --
  • 2:24 - 2:29
    cách bạn tìm xác suất, giả sử giữa
  • 2:29 - 2:30
    4,5 và 5,5.
  • 2:30 - 2:34
    Xác suất, hay khả năng mình ra 4,5 và
  • 2:34 - 2:36
    5,5 inch nước mưa ngày mai là nhiêu?
  • 2:36 - 2:42
    Nó sẽ là tích phân từ 4,5 đến 5,5
  • 2:42 - 2:47
    của hàm mật độ xác suất hay
  • 2:47 - 2:51
    hàm mật độ, x.
  • 2:51 - 2:52
    Đó là diện tích trong đường cong.
  • 2:52 - 2:54
    Còn ai không biết phép tính vi tích phân
  • 2:54 - 2:56
    thì nên xem lại playlist đó nha.
  • 2:56 - 2:58
    Mà nãy giờ là nói diện tích trong đường cong
  • 2:58 - 3:01
    từ đây đến đây.
  • 3:01 - 3:03
    Nếu là cho phân phối chuẩn, thì hơi
  • 3:03 - 3:06
    khó tính theo kiểu phân tích nên tính
  • 3:06 - 3:08
    theo kiểu số học nha.
  • 3:08 - 3:10
    Không cần thấy mình không thông minh khi tính số học đâu
  • 3:10 - 3:14
    kiểu, á làm sao tích phân cái này?
  • 3:14 - 3:15
    Có mấy hàm cho nó để
  • 3:15 - 3:16
    ra giá trị xấp xỉ.
  • 3:16 - 3:18
    Một cách để ra xấp xỉ là bạn dùng nó theo cách
  • 3:18 - 3:20
    bạn tính xấp xỉ tích phân á.
  • 3:20 - 3:22
    Ví dụ như: diện tích này là nhiêu nhỉ?
  • 3:22 - 3:25
    Nó cỡ cỡ diện tích hình thang này.
  • 3:25 - 3:27
    Bạn có thể tìm diện tích của hình thang, lấy
  • 3:27 - 3:30
    trung bình của điểm đó và điểm đó và nhân nó
  • 3:30 - 3:31
    cho cơ số.
  • 3:37 - 3:41
    chiều cao
  • 3:41 - 3:43
    nhân nó cho cơ số.
  • 3:43 - 3:46
    Thì sẽ ra diện tích của hình chữ nhật này, nó là
  • 3:46 - 3:49
    phép tính xấp xỉ cho diện tích dưới đường cong á.
  • 3:50 - 3:52
    Vì dư ra ở đây tí nhưng
  • 3:52 - 3:54
    cũng mất đây tí nên nó là
  • 3:54 - 3:55
    phép tính xấp xỉ tốt á.
  • 3:55 - 3:57
    Mình sẽ làm trong video khác,
  • 3:57 - 4:00
    tính xấp xỉ diện tích dưới đường cong và nói sơ
  • 4:00 - 4:04
    phân phối chuẩn cũng xấp xỉ phân phối nhị thức
  • 4:04 - 4:08
    nếu có nhiều lần thử.
  • 4:08 - 4:11
    Cái hay của phân phối chuẩn là --
  • 4:11 - 4:12
    mình nói chưa ta -- cái này nè,
  • 4:12 - 4:15
    biểu đồ này á.
  • 4:17 - 4:19
    Chỉ là từ khác thôi, mọi người có thể nói về
  • 4:19 - 4:20
    định lý giới hạn trung tâm.
  • 4:20 - 4:23
    Mà cái này siêu quan trọng
  • 4:23 - 4:26
    trong tự nhiên luôn, định lý
  • 4:26 - 4:28
    giới hạn trung tâm á
  • 4:28 - 4:31
    Mình không chứng minh ở đây nhưng bạn
  • 4:31 - 4:33
    có thể tìm hiểu trong video
  • 4:33 - 4:35
    mình nói về tung đồng xu.
  • 4:35 - 4:38
    Nếu ta tung đồng xu nhiều lần --
  • 4:38 - 4:41
    đều là lần thử độc lập hết -- nếu ta lấy tổng
  • 4:41 - 4:42
    số lần tung, giả sử có tính điểm nếu
  • 4:42 - 4:45
    mặt ngửa, và lấy tổng của chúng
  • 4:45 - 4:48
    khi tung vô hạn lần, bạn ra
  • 4:48 - 4:50
    phân phối chuẩn.
  • 4:50 - 4:53
    Cái hay của nó là mỗi lần thử
  • 4:53 - 4:55
    khi tung đồng xu, mỗi lần thử là 1 lần
  • 4:55 - 4:58
    tung, mỗi lần đó không cần phải là
  • 4:58 - 5:00
    phân phối chuẩn.
  • 5:00 - 5:04
    Ta có thể nói về tương tác phân tử và
  • 5:04 - 5:10
    mỗi lần phân tử x tương tác với phân tử y thì
  • 5:10 - 5:13
    có thể sẽ không ra phân phối chuẩn.
  • 5:13 - 5:15
    Nhưng nếu lấy tổng của những lần
  • 5:15 - 5:18
    tương tác này, tự nhiên cuối cùng lại ra
  • 5:18 - 5:20
    phân phối chuẩn.
  • 5:20 - 5:23
    Nên phân phối này siêu quan trọng.
  • 5:23 - 5:28
    Nó luôn luôn xuất hiện trong tự nhiên và nếu bạn lấy
  • 5:28 - 5:31
    điểm dữ liệu từ thứ gì rất phức tạp, ví dụ như
  • 5:31 - 5:37
    tổng vô hạn lần thử độc lập,
  • 5:37 - 5:39
    ta có thể giả sử sẽ ra
  • 5:39 - 5:40
    phân phối chuẩn.
  • 5:40 - 5:43
    Mình sẽ làm video khác để nói về khi nào
  • 5:43 - 5:45
    giả sử tốt khi nào không.
  • 5:45 - 5:47
    Mà giờ ngồi nhồi nhét cái này vô và
  • 5:47 - 5:49
    để mình viết lại.
  • 5:49 - 5:51
    Đây là cái bạn thấy trên Wikipedia nhưng nó có thể
  • 5:51 - 5:58
    viết lại thành 1 trên xichma nhân căn bậc 2 của 2 pi nhân
  • 5:58 - 6:00
    x là e mũ
  • 6:00 - 6:05
    e mũ nguyên cụm này, trừ
  • 6:05 - 6:13
    x trừ trung bình bình phương trên 2 xichma bình phương.
  • 6:13 - 6:14
    Đây là độ lệch chuẩn.
  • 6:14 - 6:17
    Độ lệch chuẩn bình phương thì là phương sai.
  • 6:17 - 6:18
    Nói để cho bạn biết dùng thế nào.
  • 6:18 - 6:21
    Wow, nhiều ký tự Hy Lạp ghê, sao giờ?
  • 6:21 - 6:23
    Cái này cho ta biết chiều cao của
  • 6:23 - 6:24
    một hàm phân phối chuẩn.
  • 6:24 - 6:38
    Giả sử đây là phân phối của những người
  • 6:38 - 6:39
    cao trên 5'9.
  • 6:39 - 6:41
    Giả sử đây là 5'9, không phải 0.
  • 6:44 - 6:52
    Cái này cho ta biết, nếu ta muốn tìm
  • 6:52 - 6:56
    xác suất kiếm người nào cao hơn
  • 6:56 - 6:58
    5 inch trên trung bình, ta sẽ
  • 6:58 - 7:03
    bỏ số vàp đây, 5 này vào x.
  • 7:03 - 7:05
    Ta biết độ lệch chuẩn,
  • 7:05 - 7:07
    làm quá trời bài rồi mà.
  • 7:07 - 7:09
    Ta biết phương sai, là độ lệch chuẩn bình phương á.
  • 7:09 - 7:12
    Ta biết trung bình, bỏ x vào và nó
  • 7:12 - 7:14
    cho ta biết chiều cao của hàm.
  • 7:14 - 7:16
    Rồi ta chỉ cần cho 1 phạm vi dữ liệu.
  • 7:16 - 7:19
    Ý là không thể nói có chính xác bao nhiêu người
  • 7:19 - 7:21
    cao hơn 5 inch trên trung bình được.
  • 7:21 - 7:23
    Ta phải nói bao nhiêu người cao trong khoảng
  • 7:23 - 7:26
    5,1 inch và 4,9 inch hơn trung bình.
  • 7:26 - 7:27
    Ý là phải cho tí phạm vi dữ liệu
  • 7:27 - 7:31
    vì không có chuyện chính xác đâu, gần như không thể tìm ra nguyên tử nào
  • 7:31 - 7:32
    cao đúng 5'9.
  • 7:32 - 7:35
    Thực ra định nghĩa inch cũng không
  • 7:35 - 7:36
    cụ thể đến thế.
  • 7:36 - 7:39
    Nên đó là cách dùng hàm này.
  • 7:39 - 7:43
    Dùng cái này siêu nhiều luôn, vì xuất hiện trong tự nhiên
  • 7:43 - 7:46
    và cả thống kê suy luận nữa, nó khiến
  • 7:46 - 7:49
    bạn quen dần với công thức này.
  • 7:49 - 7:52
    Mình cũng cố cho bạn quen nè.
  • 7:52 - 7:54
    Giờ thì dọc cái công thức này tí
  • 7:54 - 7:58
    cho bạn hiểu sơ ha.
  • 7:58 - 8:02
    Nếu mình phải dùng cái này
  • 8:02 - 8:05
    thì thôi viết lại thành, nếu ta lấy xichma
  • 8:05 - 8:07
    bỏ vào căn bậc 2, nếu lấy độ lệch chuẩn bỏ vào
  • 8:07 - 8:12
    thì ra 1 trên căn bậc 2 của 2
  • 8:12 - 8:14
    pi xichma bình phương.
  • 8:14 - 8:16
    Thực ra mình chưa thấy ai viết vầy bao giờ mà nó
  • 8:16 - 8:19
    cho mình cảm giác xichma bình phương, luôn là xichma
  • 8:19 - 8:21
    bình phương nha, mà thực ra nó chỉ là phương sai mà phương sai
  • 8:21 - 8:23
    là thứ tính trước khi tính độ lệch chuẩn
  • 8:23 - 8:25
    rồi, nên cũng hay á.
  • 8:25 - 8:29
    Và cái này có thể viết thành e mũ
  • 8:29 - 8:36
    -1/2 nhân, hai cái này đều
  • 8:36 - 8:41
    bình phương nên ta có thể nói x trừ trung bình
  • 8:41 - 8:44
    trên xichma bình phương.
  • 8:44 - 8:47
    Chắc dễ hiểu hơn
  • 8:47 - 8:48
    tí rồi ha.
  • 8:48 - 8:50
    Vì, cái này là gì?
  • 8:50 - 8:53
    x trừ xichma là khoảng cách giữa điểm
  • 8:53 - 8:55
    mình muốn tìm.
  • 8:55 - 8:58
    Giả sử ta ở đây.
  • 8:58 - 9:03
    x trừ muy, muy là trung bình là ở đây,
  • 9:03 - 9:06
    là khoảng cách này, và độ lệch chuẩn
  • 9:06 - 9:07
    là khoảng cách này
  • 9:07 - 9:12
    Vậy cái này cho ta biết bao nhiêu độ lệch chuẩn
  • 9:12 - 9:13
    cách xa trung bình.
  • 9:13 - 9:15
    Hay còn gọi là điểm z, mình
  • 9:15 - 9:16
    có nói trong video khác.
  • 9:16 - 9:19
    Rồi ta bình nó rồi nhân
  • 9:19 - 9:20
    cho -1/2.
  • 9:20 - 9:21
    Để viết lại
  • 9:21 - 9:26
    viết thành e mũ -1/2 nhân a,
  • 9:26 - 9:31
    giống như e mũ a mũ -1/2 á.
  • 9:31 - 9:32
    Nếu lấy gì đó lên luỹ thừa rồi lại
  • 9:32 - 9:35
    luỹ thừa nữa thì chỉ cần nhân mấy luỹ thừa lại với nhau thôi.
  • 9:35 - 9:39
    Tương tự, cái này viết lại thành
  • 9:39 - 9:46
    1 trên căn bậc 2 của 2 pi xichma bình phương,
  • 9:46 - 9:48
    là phương sai á.
  • 9:48 - 9:49
    Mình mò mò công thức này tí để
  • 9:49 - 9:51
    bạn nhìn thấy cách và
  • 9:51 - 9:52
    hiểu hơn.
  • 9:52 - 9:54
    À cứ email mình nếu nghiệm ra
  • 9:54 - 9:57
    sao ra cái này được nha.
  • 9:57 - 9:59
    Mình thấy cũng hay khi tự nhiên ta có
  • 9:59 - 10:02
    công thức mới này có pi và e.
  • 10:05 - 10:08
    Nhiều hiện tượng được mô tả bởi mấy số này
  • 10:08 - 10:11
    pi và e xuất hiện cùng nhau như e mũ i pi
  • 10:11 - 10:12
    bằng -1.
  • 10:12 - 10:15
    Nó cho ta biết thêm về vũ trụ.
  • 10:15 - 10:25
    Tóm lại, ta có thể viết lại thành e mũ x trừ muy trên xichma
  • 10:25 - 10:29
    bình phương, rồi tất cả mũ -1/2.
  • 10:29 - 10:31
    Mũ -1/2 chỉ là 1 trên
  • 10:31 - 10:33
    căn bậc 2 của đống này thôi.
  • 10:33 - 10:41
    Ta có thể viết lại thành 1 trên căn bậc 2
  • 10:41 - 10:52
    của 2 pi nhân phương sai nhân e mũ
  • 10:52 - 10:54
    điểm z bình phương.
  • 10:54 - 10:59
    Nếu z là cái này, z sẽ là số độ lệch chuẩn
  • 10:59 - 11:02
    cách trung bình, điểm z bình phương
  • 11:02 - 11:06
    Tự nhiên cái dễ hiểu ghê ha.
  • 11:06 - 11:09
    Ta chỉ cần nói 2 pi nhân phương sai nhân e mũ
  • 11:09 - 11:12
    số độ lệch chuẩn cách trung bình
  • 11:12 - 11:13
    rồi bình lên.
  • 11:13 - 11:17
    Ta căn bậc 2 cái đó rồi nghịch đảo lại
  • 11:17 - 11:18
    và đó là phân phối chuẩn.
  • 11:19 - 11:21
    Mình nghĩ cũng khá vui
  • 11:21 - 11:21
    khi mò mò thế này.
  • 11:21 - 11:24
    Nếu bạn thấy trong những dạng khác
  • 11:24 - 11:26
    sau này bạn sẽ không bất ngờ nữa
  • 11:26 - 11:29
    sẽ không còn đóng khung phân phối chuẩn nữa.
  • 11:29 - 11:31
    Giờ mò thêm tí với
  • 11:31 - 11:34
    phân phối chuẩn ha.
  • 11:34 - 11:36
    Bảng tính này, mình đã vẽ
  • 11:36 - 11:37
    phân phối chuẩn rồi á.
  • 11:37 - 11:39
    Bạn có thể đổi mấy biến
  • 11:39 - 11:41
    xanh xanh này.
  • 11:41 - 11:44
    Giờ đang có biểu đồ với trung bình là 0 và
  • 11:44 - 11:45
    độ lệch chuẩn là 4.
  • 11:45 - 11:48
    Mình mới viết phương sai ở đây á,
  • 11:48 - 11:50
    phương sai chỉ là độ lệch chuẩn bình phương thôi.
  • 11:50 - 11:53
    Vậy chuyện gì xảy ra khi đổi cái trung bình?
  • 11:53 - 11:57
    Nếu trung bình đi từ 0 đến 5 đi,
  • 11:57 - 12:01
    để ý nè, biểu đồ sang trái đúng 5 luôn
  • 12:01 - 12:03
    Đỉnh nó từng ở đây, giờ chạy sang đây.
  • 12:03 - 12:07
    Vậy nếu là trừ 5 thì sao?
  • 12:07 - 12:10
    Nguyên đường cong chuông sang trái 5 đơn vị thôi.
  • 12:11 - 12:13
    Giờ chuyện gì xảy ra khi đổi độ lệch chuẩn?
  • 12:13 - 12:20
    Phương sai là bình phương khoảng cách từ trung bình,
  • 12:20 - 12:22
    còn độ lệch chuẩn là căn bậc 2 đống đó.
  • 12:22 - 12:25
    Nó tựa tựa, không chính xác nha,
  • 12:25 - 12:26
    khoảng cách trung bình từ trung bình.
  • 12:26 - 12:30
    Nên độ lệch chuẩn càng nhỏ mấy điểm
  • 12:30 - 12:31
    càng gần điểm trung bình hơn.
  • 12:31 - 12:34
    Ta sẽ có biểu đồ hẹp hơn
  • 12:34 - 12:35
    xem thử ha.
  • 12:35 - 12:39
    Khi độ lệch chuẩn là 2, thấy không
  • 12:39 - 12:42
    Biểu đồ nó gần hơn
  • 12:42 - 12:43
    trung bình nhiều.
  • 12:43 - 12:46
    Nếu cho độ lệch chuẩn là 10,
  • 12:46 - 12:48
    tự nhiên sẽ biểu đồ phẳng hơn nhiều
  • 12:48 - 12:50
    cái này cứ kéo dài mãi.
  • 12:50 - 12:53
    Đó là điểm khác nhau căn bản: phân phối nhị thức
  • 12:53 - 12:54
    luôn hữu hạn.
  • 12:54 - 12:56
    Bạn chỉ có số giá trị hữu hạn còn
  • 12:56 - 13:00
    phân phối chuẩn là dựa trên
  • 13:00 - 13:02
    dãy số thực.
  • 13:02 - 13:06
    Vậy xác suất, nếu có trung bình là -5 và
  • 13:06 - 13:09
    độ lệch chuẩn là 10, xác suất nhận được
  • 13:09 - 13:15
    1000 là rất thấp nhưng vẫn có xác suất.
  • 13:15 - 13:19
    Giống như có khả năng tất cả nguyên tử trong cơ thể mình
  • 13:19 - 13:21
    sắp xếp hoàn hảo khi mình té
  • 13:21 - 13:21
    xuống ghế.
  • 13:21 - 13:24
    Nó rất khó xảy ra ngoài đời
  • 13:24 - 13:27
    nhưng có có khả năng.
  • 13:27 - 13:29
    Và nó được mô tả bởi phân phối chuẩn vì
  • 13:29 - 13:32
    nó có khả năng xảy ra mặc dù
  • 13:32 - 13:32
    rất hiếm.
  • 13:35 - 13:37
    Mình có nói ở đầu video khi
  • 13:37 - 13:41
    bạn tìm phân phối chuẩn bạn không thể
  • 13:41 - 13:44
    nhìn vào điểm này trên biểu đồ -- để bỏ công cụ
  • 13:44 - 13:48
    bút này đi -- bạn phải tìm diện tích dưới đường cong
  • 13:48 - 13:51
    giữa hai điểm.
  • 13:51 - 13:53
    Nếu mình nói -- giả sử đây là phân phối --
  • 13:53 - 13:56
    mình hỏi xác suất ra 0 là nhiêu.
  • 13:56 - 13:58
    Mình không biết mình đang mô tả hiện tượng nào
  • 13:58 - 13:59
    mà 0 xảy ra.
  • 13:59 - 14:05
    Nếu đúng 0 luôn, xác suất là 0
  • 14:05 - 14:07
    vì diện tích dưới đường cong,
  • 14:07 - 14:10
    dưới 0, là không có diện tích, mỗi đường thôi.
  • 14:10 - 14:11
    Nên bạn phải cho 1 phạm vi dữ liệu.
  • 14:11 - 14:17
    Ví dụ xác suất giữa --
  • 14:17 - 14:28
    thực ra mình có thể nhập trên đây -- giữa -0,005 và 0,05
  • 14:28 - 14:34
    -- nó làm tròn luôn rồi -- cũng gần với 0.
  • 14:34 - 14:38
    Để đổi, giữa -1 và 1.
  • 14:38 - 14:40
    Nó tính ra 7% và mình sẽ cho bạn xem
  • 14:40 - 14:43
    mình tính sao.
  • 14:43 - 14:45
    Để lấy cái màn hình vẽ.
  • 14:45 - 14:46
    Vậy làm sao?
  • 14:46 - 14:50
    Giữa -1 và 1 -- mình cũng sẽ cho bạn thấy
  • 14:50 - 14:53
    Excel làm sao luôn -- ta đi từ -1,
  • 14:53 - 14:57
    là ở đây, đến 1.
  • 14:57 - 15:01
    Ta đang tính diện tích dưới đường cong.
  • 15:01 - 15:05
    Ta đang tính diện tích hay cho những ai biết
  • 15:05 - 15:12
    phép tính vi tích phân, ta tính tích phân từ -1 đến 1
  • 15:12 - 15:14
    của hàm, độ lệch chuẩn ở đây
  • 15:14 - 15:19
    là 10 và trung bình là -5.
  • 15:19 - 15:20
    Giờ bỏ số vào
  • 15:20 - 15:23
    Ta tính, với ví dụ này cách nó vẽ
  • 15:23 - 15:28
    ở đây, hàm phân phối chuẩn,
  • 15:28 - 15:35
    độ lệch chuẩn nhân là 10 nhân căn bậc 2 của 2 pi nhân e
  • 15:35 - 15:40
    mũ -1/2 nhân x trừ trung bình.
  • 15:40 - 15:42
    Trung bình hiện đang âm.
  • 15:42 - 15:47
    Trung bình là -5 nên x + 5 trên độ lệch chuẩn
  • 15:47 - 15:50
    bình phương, phương sai á, bằng
  • 15:50 - 15:56
    100 bình phương dx.
  • 15:56 - 15:59
    Cái này là con số này nè, 7%
  • 15:59 - 16:02
    hay 0,07 là diện tích ở đây.
  • 16:02 - 16:05
    Giờ hơi tiếc vì đây không phải là
  • 16:05 - 16:07
    tích phân dễ để phân tích, cho cả những ai biết
  • 16:07 - 16:09
    phép tính vi tích phân.
  • 16:09 - 16:12
    Nên làm theo kiểu số học thôi.
  • 16:12 - 16:15
    Một cách làm khá dễ là
  • 16:15 - 16:19
    hàm được định nghĩa bởi hàm
  • 16:19 - 16:22
    phân phối tích luỹ để dễ tìm
  • 16:22 - 16:23
    diện tích này.
  • 16:23 - 16:25
    Vậy hàm phân phối tích luỹ là
  • 16:25 - 16:28
    -- để gọi là hàm phân phối tích luỹ
  • 16:28 - 16:32
    -- hàm của x.
  • 16:32 - 16:35
    Nó cho ta diện tích dưới đường cong.
  • 16:35 - 16:39
    Giả sử đây là x, đây là x.
  • 16:39 - 16:42
    Nó cho ta biết diện tích dưới đường cong đến x.
  • 16:42 - 16:44
    Một cách nghĩ khác, nó cho ta biết
  • 16:44 - 16:47
    xác suất bạn dừng tại vài giá trị nào đó
  • 16:47 - 16:48
    ít hơn giá trị x.
  • 16:48 - 16:54
    Nó là diện tích từ âm vô cực đến x của
  • 16:54 - 16:55
    hàm mật độ xác suất.
  • 17:00 - 17:04
    Khi bạn dùng hàm phân phối chuẩn của Excel,
  • 17:08 - 17:12
    bạn phải cho một giá trị x, bạn cho
  • 17:12 - 17:14
    trung bình, bạn cho độ lệch chuẩn.
  • 17:14 - 17:17
    Rồi bạn nói bạn muốn hàm
  • 17:17 - 17:20
    phân phối tích luỹ, thì chọn đúng, hay là
  • 17:20 - 17:22
    phân phối chuẩn, thì chọn sai.
  • 17:22 - 17:25
    Nếu muốn biểu đồ ở đây, thì
  • 17:25 - 17:28
    ghi FALSE in hoa.
  • 17:28 - 17:29
    Nếu muốn biểu đồ của hàm phân phối
  • 17:29 - 17:33
    tích luỹ, cái ở dưới này -- để kéo xuống
  • 17:33 - 17:46
    tí -- thì ghi TRUE
  • 17:46 - 17:47
    trông ô Excel đó.
  • 17:47 - 17:49
    Đây là hàm phân phối tích luỹ cho cái này.
  • 17:51 - 17:53
    Đây là phân phối chuẩn đây là hàm phân phối
  • 17:53 - 17:54
    tích luỹ.
  • 17:54 - 17:56
    Hiểu sơ rồi ha.
  • 17:56 - 17:57
    Nếu muốn biết, xác suất
  • 17:57 - 18:00
    nhận được giá trị nhỏ hơn 20 là nhiêu?
  • 18:00 - 18:02
    Thì ta có thể lấy giá trị bất kỳ nhỏ hơn 20
  • 18:02 - 18:04
    dựa trên phân phối này.
  • 18:04 - 18:07
    Hàm phân phối tích luỹ này
  • 18:07 - 18:11
    nếu muốn 20 thì bạn đến
  • 18:11 - 18:14
    điểm này và bạn thấy xác suất
  • 18:14 - 18:16
    để nhận 20 hay thấp hơn khá cao á.
  • 18:16 - 18:17
    Gần 100% luôn.
  • 18:17 - 18:19
    Cũng hợp lý vì hầu như diện tích dưới
  • 18:19 - 18:21
    đường cong là nhỏ hơn 20.
  • 18:21 - 18:23
    Hay nếu thắc mắc xác suất
  • 18:23 - 18:26
    nhỏ hơn -5.
  • 18:26 - 18:28
    -5 là trung bình nên một nửa kết quả
  • 18:28 - 18:29
    sẽ nằm trên và một nửa nằm dưới.
  • 18:29 - 18:31
    Nếu đến điểm này bạn sẽ thấy
  • 18:31 - 18:33
    đây là 50%.
  • 18:33 - 18:36
    Nên xác suất nhận giá trị nhỏ hơn -5 là
  • 18:36 - 18:38
    đúng 50%.
  • 18:38 - 18:43
    Nếu ta muốn biết xác suất
  • 18:43 - 18:47
    nhận từ -1 đến 1 thì ta -- để
  • 18:47 - 18:54
    lấy công cụ vẽ -- ta tìm xác suất
  • 18:54 - 18:57
    nhận -1 hoặc thấp hơn.
  • 18:57 - 19:01
    Là tìm diện tích này.
  • 19:01 - 19:03
    Rồi tìm xác suất nhận 1 hay
  • 19:03 - 19:05
    hấp hơn là nguyên diện tích này --
  • 19:05 - 19:11
    để lấy màu khác -- 1 hay thấp hơn là ở đây.
  • 19:11 - 19:15
    Ta trừ diện tích vàng từ diện tích đỏ và
  • 19:15 - 19:19
    ta sẽ nhận được phần còn lại.
  • 19:19 - 19:21
    Đó là cách làm trong bảng tính á.
  • 19:23 - 19:25
    Để kéo xuống.
  • 19:25 - 19:28
    Mỗi lần chụp màn hình
  • 19:28 - 19:30
    máy bị gì hay sao.
  • 19:30 - 19:33
    Mình biểu diễn hàm phân phối tích luỹ
  • 19:33 - 19:39
    tại 1 ở đây.
  • 19:39 - 19:43
    Mình biểu diễn hàm phân phối tích luỹ
  • 19:43 - 19:45
    tại -1, là ở đây.
  • 19:45 - 19:48
    Rồi hiệu giữa hai số, mình trừ
  • 19:48 - 19:53
    số này bằng số này và nó cho ta biết
  • 19:53 - 19:55
    xác suất mình đứng giữa 2 số này.
  • 19:55 - 20:02
    Hay là diện tích ở đây.
  • 20:02 - 20:05
    Bạn cứ mò từ từ và khám phá mấy
  • 20:05 - 20:07
    công thức Excel nha.
  • 20:07 - 20:12
    Diện tích này từ -1 đến 1.
  • 20:14 - 20:15
    Thứ mà xuất hiện khá nhiều là xác suất
  • 20:16 - 20:17
    bạn dừng trong độ lệch chuẩn của --
  • 20:18 - 20:21
    à cho bạn biết biểu đồ này, đường trung tâm
  • 20:21 - 20:22
    này, đây là trung bình.
  • 20:22 - 20:25
    Và hai đường mình vẽ này, một cái
  • 20:25 - 20:27
    1 độ lệch chuẩn dưới trung bình và 1 độ lệch chuẩn
  • 20:27 - 20:30
    trên trung bình.
  • 20:30 - 20:32
    Xác suất ta dừng trong
  • 20:32 - 20:34
    1 độ lệch chuẩn của trung bình là nhiêu nhỉ?
  • 20:34 - 20:35
    Dễ thôi.
  • 20:35 - 20:37
    Mình chỉ cần nhấn vào đây.
  • 20:37 - 20:40
    Xác suất ta dừng tại giữa
  • 20:40 - 20:44
    1 độ lệch chuẩn -- trung bình là -5 --
  • 20:44 - 20:48
    1 độ lệch chuẩn dưới trung bình là -15 và
  • 20:48 - 20:53
    1 độ lệch chuẩn trên trung bình là 10 cộng -5 là 5.
  • 20:53 - 20:55
    Là giữa 5 và 15.
  • 20:55 - 20:57
    Là 68,3%.
  • 20:57 - 21:00
    Vậy là có 68,3%
  • 21:00 - 21:05
    xác suất dừng tại trong 1 độ lệch chuẩn
  • 21:05 - 21:07
    của trung bình, giả sử đây là phân phối chuẩn.
  • 21:07 - 21:12
    Con số này đại diện cho diện tích dưới
  • 21:12 - 21:17
    đường cong ở đây, diện tích này dưới đường cong.
  • 21:17 - 21:20
    Cách bạn ra được là nhờ hàm
  • 21:20 - 21:21
    phân phối tích luỹ.
  • 21:21 - 21:23
    Để xuống đây.
  • 21:23 - 21:27
    Mỗi khi mình dịch cái này mình lại phải bỏ cái công cụ bút.
  • 21:27 - 21:33
    Ta biểu diễn nó tại 5, là ở đây.
  • 21:33 - 21:36
    Đây là 1 độ lệch chuẩn trên trung bình,
  • 21:36 - 21:37
    số nằm quanh đây.
  • 21:37 - 21:40
    Hình như là khoảng 80 mấy phần trăm,
  • 21:40 - 21:41
    khoảng 90% luôn hay sao.
  • 21:42 - 21:44
    Rồi ta biểu diễn nó tại 1 độ lệch chuẩn dưới
  • 21:44 - 21:46
    trung bình là -15.
  • 21:46 - 21:51
    Này khoảng 15% hay cỡ vậy, 15, 16,
  • 21:51 - 21:54
    17%, thôi chắc 18% á.
  • 21:54 - 21:57
    Tóm gọn là khi ta trừ giá trị
  • 21:57 - 22:01
    từ giá trị này ta ra xác suất
  • 22:01 - 22:02
    dừng giữa hai số đó.
  • 22:02 - 22:05
    Vì giá trị này nói xác suất
  • 22:05 - 22:07
    bạn ít hơn
  • 22:07 - 22:08
    Nên khi dùng hàm phân phối tích luỹ
  • 22:08 - 22:10
    bạn sẽ ra đây.
  • 22:13 - 22:16
    Nó cứ qua lại như vậy.
  • 22:21 - 22:28
    Khi đến 5 -- chỉ cần đến chỗ này --
  • 22:28 - 22:30
    nó cho ta biết diện tích dưới đường cong,
  • 22:30 - 22:31
    xác suất bạn ít hơn hoặc bằng
  • 22:31 - 22:32
    5, những gì trên đây.
  • 22:32 - 22:35
    Rồi bạn biểu diễn nó tại -15 dưới này,
  • 22:35 - 22:38
    nó cho ta biết xác suất bạn trở lại đây.
  • 22:38 - 22:42
    Nên khi trừ cái này từ thứ lớn hơn bạn
  • 22:42 - 22:46
    sẽ ra cái dưới đường cong này.
  • 22:46 - 22:50
    Nói để hiểu bảng tính này hơn
  • 22:50 - 22:54
    vì mình cũng muốn bạn mò thử xem xảy ra
  • 22:54 - 22:57
    chuyện gì với phân phối có trung bình
  • 22:57 - 22:59
    -5, giờ đổi sang 5 ha.
  • 22:59 - 23:01
    Nó chạy sang phải.
  • 23:01 - 23:03
    Sang phải 5 đơn vị.
  • 23:03 - 23:04
    Oops
  • 23:04 - 23:05
    Để dùng công cụ bút.
  • 23:05 - 23:07
    Nó chạy sang trái 5 đơn vị.
  • 23:11 - 23:14
    Nếu muốn độ lệch chuẩn nhỏ lại
  • 23:14 - 23:16
    thì nguyên cái này sẽ hợp hơn.
  • 23:16 - 23:18
    Thử đổi thành 6 ha.
  • 23:18 - 23:20
    Tự nhiên đường cong nó hẹp hơn hẳn, đổi
  • 23:20 - 23:24
    sang 2, còn hẹp hơn nữa.
  • 23:24 - 23:27
    Nên cứ mò mấy công thức thử
  • 23:27 - 23:30
    và làm quen dần hàm phân phối
  • 23:30 - 23:32
    tích luỹ sau đó nghĩ về
  • 23:32 - 23:36
    phân phối nhị thức mình nói trong video trước.
  • 23:36 - 23:38
    Để vẽ mình phải lấy từng điểm á.
  • 23:38 - 23:42
    Mình vẽ từng điểm từ -20 đến 20
  • 23:42 - 23:44
    mình mới tăng cho 1.
  • 23:45 - 23:48
    Nên đây không phải đường cong liên tục, nó chỉ là
  • 23:48 - 23:49
    chấm từng điểm rồi nối
  • 23:49 - 23:51
    lại thành đường
  • 23:51 - 23:53
    Mình cũng làm luôn khoảng cách giữa
  • 23:53 - 23:55
    mỗi điểm và trung bình.
  • 23:55 - 24:01
    Mình lấy 0 - 5, đây là khoảng cách.
  • 24:01 - 24:04
    Cái này cho ta biết điểm -20
  • 24:04 - 24:07
    ít hơn 25 so với trung bình.
  • 24:07 - 24:08
    Đó là những gì mình làm.
  • 24:08 - 24:11
    Rồi mình chia cho độ lệch chuẩn và đây là
  • 24:11 - 24:15
    điểm z, điểm số tiêu chuẩn.
  • 24:15 - 24:18
    Cái này cho ta biết bao nhiêu độ lệch chuẩn
  • 24:18 - 24:20
    từ -20 đến trung bình.
  • 24:20 - 24:24
    Nó là 12,5 độ lệch chuẩn dưới trung bình.
  • 24:24 - 24:26
    Rồi mình dùng nó rồi bỏ vào
  • 24:26 - 24:29
    công thức để tìm chiều cao của hàm.
  • 24:29 - 24:34
    Giả sử tại -20 chiều cao rất thấp.
  • 24:34 - 24:36
    Giả sử tại -2 thì chiều cao đỡ tí.
  • 24:36 - 24:38
    chiều cao nó sẽ nằm đâu đây
  • 24:38 - 24:42
    chỗ này nè.
  • 24:42 - 24:44
    Vậy là ra giá trị đó.
  • 24:44 - 24:48
    Rồi để tìm xác suất, ta phải
  • 24:48 - 24:51
    tính hàm phân phối
  • 24:51 - 24:53
    tích luỹ.
  • 24:53 - 24:56
    Đây là xác suất mà bạn ít hơn đó.
  • 24:56 - 25:00
    Nên diện tích dưới đường cong cũng nhỏ luôn.
  • 25:00 - 25:02
    Nó không phải 0, trông như 0 là vì
  • 25:02 - 25:04
    mình làm tròn nó.
  • 25:04 - 25:06
    Nó cỡ 0001
  • 25:06 - 25:07
    số siêu nhỏ luôn.
  • 25:07 - 25:10
    Có xác suất ra âm ngàn mấy mà
  • 25:10 - 25:13
    Một thứ khác bạn nên quen dần là
  • 25:13 - 25:18
    tích phân trên nguyên diện tích của đường cong
  • 25:18 - 25:21
    phải là 1 vì khi đó nó tính hết
  • 25:21 - 25:22
    tất cả các trường hợp.
  • 25:22 - 25:25
    Và nó nên xảy ra khi ta dùng số nhỏ vừa phải
  • 25:25 - 25:27
    ở đây và số lớn vừa phải.
  • 25:27 - 25:29
    Nè, 100% đây.
  • 25:29 - 25:30
    Thực ra đây không hoàn toàn là 100%
  • 25:30 - 25:32
    Muốn ra 100% thì phải
  • 25:32 - 25:33
    đi từ âm vô cực đến dương vô cực lận.
  • 25:33 - 25:35
    Cái này chỉ làm tròn lên 100% thôi.
  • 25:35 - 25:40
    Chắc là 99,9999% cỡ vậy.
  • 25:40 - 25:44
    Và để tính cái này, mình sẽ lấy
  • 25:44 - 25:47
    hàm phân phối tích luỹ của điểm này và mình
  • 25:47 - 25:49
    trừ từ hàm phân phối tích luỹ
  • 25:49 - 25:50
    của điểm kia.
  • 25:50 - 25:52
    Thế là ra 100% nãy á.
  • 25:52 - 25:58
    Mong bạn hiểu
  • 25:58 - 26:00
    phân phối chuẩn rồi ha.
  • 26:00 - 26:02
    Nhớ mò mò thử bảng tính
  • 26:02 - 26:03
    và biến bảng tính thành của bản thân luôn.
  • 26:03 - 26:06
    Trong các bài tập sau này ta có thể dùng
  • 26:06 - 26:09
    bảng tính kiểu vầy làm dữ liệu cho mấy mô hình khác.
  • 26:09 - 26:12
    Ví dụ như mô hình kinh tế và doanh thu chúng ta
  • 26:12 - 26:15
    có phân phối chuẩn quanh giá trị nào đó,
  • 26:15 - 26:18
    thì phân phối chuẩn của thu nhập ròng ra sao?
  • 26:18 - 26:20
    Hay còn nhiều ví dụ
  • 26:20 - 26:21
    khác nhau nữa.
  • 26:21 - 26:24
    Thôi gặp video sau nha.
Title:
Giới thiệu Phân Phối Chuẩn
Description:

Khám phá phân phối chuẩn.

Xem bài học tiếp theo: https://www.khanacademy.org/math/probability/statistics-inferential/normal_distribution/v/normal-distribution-excel-exercise?utm_source=YT&utm_medium=Desc&utm_campaign=ProbabilityandStatistics

Bỏ lỡ bài học trước?
https://www.khanacademy.org/math/probability/regression/regression-correlation/v/covariance-and-the-regression-line?utm_source=YT&utm_medium=Desc&utm_campaign=ProbabilityandStatistics

Xác suất và thống kê trên Khan Academy: Chúng mình thách bạn trải qua một ngày mà không xem xét hoặc sử dụng xác suất. Bạn đã xem dự báo thời tiết? Bạn quyết định lái xe hay đi bộ? Chúng ta không ngừng tạo ra các giả thuyết, đưa ra dự đoán, thử nghiệm và phân tích. Cuộc sống của chúng ta đầy rẫy những xác suất! Thống kê có liên quan đến xác suất vì phần lớn dữ liệu chúng ta sử dụng khi xác định kết quả đến từ kiến thức về thống kê. Trong các bài giảng này, chúng mình sẽ đề cập đến một loạt các chủ đề, bao gồm: biến cố độc lập, xác suất phụ thuộc, tổ hợp, kiểm tra giả thuyết, thống kê mô tả, biến ngẫu nhiên, phân phối xác suất, hồi quy và thống kê suy luận. Vì vậy, thắt dây an toàn và bắt đầu một chuyến du ngoạn mới nào. Bạn sẽ liên tục được thử thách VÀ yêu thích nó cho xem!

Giới thiệu về Khan Academy: Khan Academy cung cấp các bài tập thực hành, video bài giảng và bảng điều khiển học tập được cá nhân hóa giúp người học có thể tự học theo tốc độ của họ trong và ngoài lớp học. Chúng mình bao gồm toán học, khoa học, lập trình máy tính, lịch sử, lịch sử nghệ thuật, kinh tế học, v.v. Nhiệm vụ toán học của chúng mình là giúp đỡ các bạn từ mẫu giáo đến lúc học giải tích bằng cách sử dụng công nghệ tiên tiến, thích ứng để xác định điểm mạnh và khoảng cách học tập. Chúng mình cũng đã hợp tác với các tổ chức như NASA, Bảo tàng Nghệ thuật Hiện đại, Học viện Khoa học California và MIT để cung cấp nội dung chuyên biệt.

Miễn phí. Dành cho tât cả. Mãi mãi. #Bancothehocbatcudieugi

Đăng ký kênh Thống kê và Xác suất của KhanAcademy:
https://www.youtube.com/channel/UCRXuOXLW3LcQLWvxbZiIZ0w?sub_confirmation=1
Đăng ký KhanAcademy: https://www.youtube.com/subscription_center?add_user=khanacademy

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
26:24

Vietnamese subtitles

Incomplete

Revisions Compare revisions