< Return to Video

Central Limit Theorem

  • 0:01 - 0:03
    trong video này, mình muốn nói về
  • 0:03 - 0:07
    khái nhiệm đơn giản nhưng ý nghĩa nhất trong thống kê
  • 0:07 - 0:09
    và có thể là trong toán học
  • 0:09 - 0:10
    đó là định lí giới hạn trung tâm
  • 0:17 - 0:18
    nó cho biết ta có thể
  • 0:18 - 0:21
    bắt đầu với bất kì sự phân phối nào có trung bình
  • 0:21 - 0:23
    và phương sai rõ ràng-- và
  • 0:23 - 0:25
    đô lệch tiêu chuẩn rõ ràng
  • 0:25 - 0:28
    nó có thể là phân phối liên tục hoặc rời rạc
  • 0:28 - 0:30
    mình vẽ phân phối rời rạc vì nó dễ hơn
  • 0:30 - 0:33
    ít nhất cho video này
  • 0:33 - 0:36
    mình có hàm phân phối
  • 0:36 - 0:37
    rời rạc
  • 0:37 - 0:39
    mình phải cẩn thận không làm
  • 0:39 - 0:41
    cho nó nhìn giống phân phối tiêu chuẩn
  • 0:41 - 0:44
    vì mình muốn cho bạn thấy tiềm năng của định lí
  • 0:44 - 0:44
    giới hạn trung tâm
  • 0:44 - 0:46
    mình có phân phối
  • 0:46 - 0:48
    nó có giá trị từ 1 tới 6
  • 0:48 - 0:51
    1,2,3,4,5,6
  • 0:51 - 0:53
    đó là xúc xắc
  • 0:53 - 0:54
    có khả năng được 1
  • 0:54 - 0:56
    để mình
  • 0:56 - 0:57
    vẽ đường thẳng
  • 0:57 - 0:59
    bạn có khả năng được 1 cao
  • 0:59 - 1:01
    không thể nào được 2
  • 1:01 - 1:03
    có khả năng sẽ được 3 hoặc 4
  • 1:03 - 1:05
    không thể nào được 5
  • 1:05 - 1:08
    khả năng được 6 sẽ rất cao
  • 1:08 - 1:10
    đó là hàm phân phối xác suất
  • 1:10 - 1:12
    còn trung bình
  • 1:12 - 1:15
    sẽ nhìn giống vầy
  • 1:15 - 1:16
    giữa đoạn
  • 1:16 - 1:18
    đó sẽ là trung bình
  • 1:18 - 1:19
    độ lệch tiêu chuẩn có thể
  • 1:19 - 1:21
    nhìn giống vầy-- nó sẽ cách trung bình
  • 1:21 - 1:23
    cỡ nhiêu đó trên và dưới
  • 1:23 - 1:26
    đó là hàm phân phối
  • 1:26 - 1:26
    rời rạc
  • 1:26 - 1:29
    giờ mình sẽ, thay vì lấy mẫu
  • 1:29 - 1:31
    của biến ngẫu nhiên
  • 1:31 - 1:34
    được mô tả bởi hàm phân phối xác suất này,
  • 1:34 - 1:36
    mình sẽ lấy mẫu của nó
  • 1:36 - 1:38
    nhưng tính trung bình của mẫu
  • 1:38 - 1:39
    rồi nhìn các mẫu này và xem
  • 1:39 - 1:42
    tần số của trung bình
  • 1:42 - 1:44
    khi mình nói trung bình, ý mình là trung bình
  • 1:44 - 1:45
    hãy định nghĩa vài thứ nào
  • 1:45 - 1:48
    kích thước mẫu-- mình chọn bất kì số nào ở đây
  • 1:48 - 1:58
    nhưng đầu tiên ta thử kích thước mẫu với n bằng 4
  • 1:58 - 2:00
    nó có nghĩa là mình sẽ lấy 4 mẫu
  • 2:00 - 2:03
    lần đầu tiên mình lấy 4 mẫu
  • 2:03 - 2:06
    vậy kích thước mẫu là 4-- mình được 1
  • 2:06 - 2:08
    thêm 1 nữa
  • 2:08 - 2:09
    được 3
  • 2:09 - 2:11
    được 6
  • 2:11 - 2:15
    đó là mẫu đầu tiên có kích thước là 4
  • 2:15 - 2:16
    mình biết tên gọi có thể hơi rối
  • 2:16 - 2:20
    vì đây là mẫu gồm 4 mẫu
  • 2:20 - 2:23
    nhưng khi ta nói về trung bình mẫu và phân phối
  • 2:23 - 2:25
    xác suất của trung bình mẫu,
  • 2:25 - 2:28
    ta sẽ nói nhiều hơn trong video sau,
  • 2:28 - 2:32
    thường thì mẫu sẽ đề cập đến tập hợp mẫu
  • 2:32 - 2:33
    từ phân phối của bạn
  • 2:33 - 2:36
    và kích thước mẫu cho bạn biết bạn lấy
  • 2:36 - 2:37
    bao nhiêu từ phân phối
  • 2:37 - 2:39
    nhưng thuật ngữ có thể hơi rối
  • 2:39 - 2:42
    vì bạn có thể coi cái này là mẫu
  • 2:42 - 2:44
    nhưng ta sẽ lấy 4 mẫu từ đó
  • 2:44 - 2:46
    mẫu kích thước là 4
  • 2:46 - 2:48
    mình sẽ tính trung bình của chúng
  • 2:48 - 2:51
    mình phải cẩn thận khi
  • 2:51 - 2:51
    nói trung bình
  • 2:51 - 2:55
    trung bình của mẫu kích cỡ 4 này là gì?
  • 2:55 - 2:56
    1 cộng 1 là2
  • 2:56 - 2:58
    2 cộng 3 là 5
  • 2:58 - 3:00
    5 cộng 6 là 11
  • 3:00 - 3:06
    11 chia 4 bằng 2,75
  • 3:06 - 3:11
    đó là trung bình mẫu đầu tiên
  • 3:11 - 3:12
    làm cái tiếp theo
  • 3:12 - 3:19
    mẫu thứ 2 có kích thước là 4, mình được 3, 4
  • 3:19 - 3:21
    mình được thêm 3 nữa
  • 3:21 - 3:22
    rồi được 1
  • 3:22 - 3:24
    mình không được 6 lần đó
  • 3:24 - 3:26
    và để ý mình không thể được 2 hoặc 5
  • 3:26 - 3:27
    không thể đối với phân phối này
  • 3:27 - 3:29
    khả năng được 2 hoặc 5 là 0
  • 3:29 - 3:31
    mình không thể được 2 hoặc 5 nào
  • 3:31 - 3:38
    cho mẫu kích thước là 4 thứ 2
  • 3:38 - 3:42
    trung bình mẫu sẽ bằng 3 cộng 4 là 7
  • 3:42 - 3:46
    cộng 3 là 10 cộng 1 là 11
  • 3:46 - 3:50
    chia 4 là 2,75
  • 3:50 - 3:51
    mình muốn làm rõ
  • 3:51 - 3:53
    ta đang làm gì
  • 3:53 - 3:54
    mình làm thêm nữa
  • 3:54 - 3:55
    ta sẽ làm thêm tỉ tỉ lần
  • 3:55 - 3:57
    nhưng mình sẽ làm chi tiết thêm 1 cái nữa
  • 3:57 - 4:01
    mẫu thứ 3 có kích thước là 4--
  • 4:01 - 4:04
    mình lấy 4 mẫu
  • 4:04 - 4:06
    4 mẫu
  • 4:06 - 4:08
    từ phân phối kì dị này
  • 4:08 - 4:13
    được 1, 1, 6 và 6
  • 4:13 - 4:19
    vậy trung bình sẽ bằng 1 cộng 1 là 2
  • 4:19 - 4:20
    cộng 6 là 8
  • 4:20 - 4:21
    cộng 6 là 14
  • 4:21 - 4:30
    14 chia 4 bằng 3 1/2
  • 4:30 - 4:32
    khi tính mỗi trung bình này
  • 4:32 - 4:35
    cho mỗi mẫu có kích thước là 4 này,
  • 4:35 - 4:37
    mình tính trung bình
  • 4:37 - 4:38
    mình sẽ biểu diễn chúng
  • 4:38 - 4:41
    trên biểu đồ phân phối xác suất
  • 4:41 - 4:44
    bạn sẽ ngạc nhiên liền
  • 4:44 - 4:47
    biểu diễn tất cả
  • 4:47 - 4:49
    với mẫu đầu tiên,
  • 4:49 - 4:52
    trung bình mẫu là 2,75
  • 4:52 - 4:55
    vậy mình vẽ tần số mẫu thực của trung bình mẫu
  • 4:55 - 4:56
    cho mỗi mẫu
  • 4:56 - 4:59
    2,75. được 1 lần
  • 4:59 - 5:00
    biểu diễn ở đây
  • 5:00 - 5:02
    đó
  • 5:02 - 5:05
    rồi tiếp theo, mình có 2,75
  • 5:05 - 5:06
    đó là 2,75
  • 5:06 - 5:08
    2 lần
  • 5:08 - 5:10
    mình biểu diễn tần số ở đó
  • 5:10 - 5:11
    rồi được 3 và 1/2
  • 5:11 - 5:14
    vậy với các giá trị này, mình có 3
  • 5:14 - 5:17
    mình có thể có 3,25, có 3 và 1/2
  • 5:17 - 5:19
    rồi có 3 và 1/2, biểu diễn ngay đây
  • 5:19 - 5:21
    và chắc chắn mình sẽ
  • 5:21 - 5:23
    tiếp tục lẫy mẫu này
  • 5:23 - 5:25
    có thể mình sẽ lấy 10000
  • 5:25 - 5:27
    tiếp tục lấy mẫu
  • 5:27 - 5:30
    lên tới 10000
  • 5:30 - 5:31
    làm 1 loạt
  • 5:31 - 5:34
    và dần dần, nó sẽ nhìn giống
  • 5:34 - 5:36
    mình sẽ biến nó thành chấm, vì mình
  • 5:36 - 5:37
    phải phóng to ra
  • 5:37 - 5:41
    dần dần-- nó vẫn
  • 5:41 - 5:43
    có tất cả các giá trị có thể có
  • 5:43 - 5:46
    2,75 có thể ở đây
  • 5:46 - 5:48
    chấm đầu tiên này sẽ là--
  • 5:48 - 5:50
    cái này sẽ ở ngay đây
  • 5:50 - 5:53
    và cái thứ 2 sẽ ở đây
  • 5:53 - 5:56
    rồi cái đó ở 3,5 sẽ nhìn như vầy
  • 5:56 - 5:58
    nhưng mình sẽ làm 10000 lần
  • 5:58 - 5:59
    vì mình có 10000 chấm
  • 5:59 - 6:02
    cho là khi mình làm, mình cứ tiếp tục biểu diễn
  • 6:02 - 6:04
    mấy tần số này
  • 6:04 - 6:06
    tiếp tục biểu diễn chúng
  • 6:06 - 6:08
    nữa và nữa
  • 6:08 - 6:10
    và bạn sẽ thấy
  • 6:10 - 6:12
    khi mình lấy nhiều mẫu kích cỡ 4, mình
  • 6:12 - 6:14
    sẽ có cái mà ước tính
  • 6:14 - 6:18
    phân phối tiêu chuẩn
  • 6:18 - 6:23
    vậy mỗi chấm này biểu diễn 1 trung bình mẫu
  • 6:23 - 6:25
    khi mình tiếp tục thêm vào cột này,
  • 6:25 - 6:28
    nghĩa là mình tiếp tục được trung bình mẫu là 2,75
  • 6:28 - 6:29
    dần dần
  • 6:29 - 6:30
    mình sẽ có cái
  • 6:30 - 6:33
    nhìn giống phân phối trung bình
  • 6:33 - 6:36
    và nó là cái hay của định lý giới hạn trung tâm
  • 6:39 - 6:42
    vậy màu cam là n bằng 4
  • 6:42 - 6:45
    đó là kích thước mẫu bằng 4
  • 6:45 - 6:48
    nếu mình làm tương tự với
  • 6:48 - 6:52
    mẫu kích cỡ 20-- thay vì chỉ lấy 4 mẫu
  • 6:52 - 6:55
    từ phân phối kì dị này, mỗi mẫu
  • 6:55 - 6:58
    mình lấy 20 biến ngẫu nhiên
  • 6:58 - 7:00
    và tính trung bình của 20 biến đó
  • 7:00 - 7:03
    rồi mình biểu diễn trung bình mẫu
  • 7:03 - 7:04
    mình sẽ có
  • 7:04 - 7:07
    phân phối nhìn giống vầy
  • 7:07 - 7:09
    và ta sẽ bàn luận về nó trong các video sau
  • 7:09 - 7:12
    nhưng hoá ra nếu mình vẽ 10000 trung bình
  • 7:12 - 7:14
    mẫu, mình sẽ có
  • 7:14 - 7:18
    2 cái-- nó sẽ gần giống với
  • 7:18 - 7:19
    phân phối tiêu chuẩn
  • 7:19 - 7:20
    và ta sẽ thấy trong video sau
  • 7:20 - 7:22
    để mình
  • 7:22 - 7:23
    làm rõ
  • 7:23 - 7:26
    nó sẽ có cùng trung bình
  • 7:26 - 7:27
    đó là trung bình
  • 7:27 - 7:29
    nó sẽ có cùng trung bình
  • 7:29 - 7:32
    nó sẽ có độ lệch tiêu chuẩn nhỏ hơn
  • 7:32 - 7:34
    mình nên vẽ từ dưới lên
  • 7:34 - 7:35
    vì bạn sẽ chồng chất nó
  • 7:35 - 7:37
    được 1, rồi được 1 số khác
  • 7:37 - 7:39
    nhưng cái này sẽ giống
  • 7:39 - 7:40
    phân phối tiêu chuẩn
  • 7:40 - 7:45
    đây là cái hay của định lý giới hạn
  • 7:45 - 7:46
    trung tâm
  • 7:46 - 7:53
    khi mẫu của bạn lớn hơn--
  • 7:53 - 7:55
    hoặc nó tiến tới vô cực
  • 7:55 - 7:56
    nhưng bạn không cần phải tiến tới
  • 7:56 - 7:59
    gần vô cực để được gần giống phân phối tiêu chuẩn
  • 7:59 - 8:01
    kể cả khi bạn có mẫu 10 hoặc 20,
  • 8:01 - 8:04
    bạn sẽ được gần giống phân phối tiêu chuẩn
  • 8:04 - 8:06
    thực ra là gần giống
  • 8:06 - 8:08
    với cái ta thấy mỗi ngày
  • 8:08 - 8:12
    nhưng cái hay là ta có thể bắt đầu với phân phối kì dị
  • 8:12 - 8:15
    nó không liên quan gì tới phân phối tiêu chuẩn
  • 8:15 - 8:17
    cái này có n bằng 4, nhưng nếu mình có mẫu kích thước n
  • 8:17 - 8:20
    bằng 10 hoặc 100,
  • 8:20 - 8:22
    ta sẽ sẽ lấy 100, thay vì 4,
  • 8:22 - 8:24
    và tính trung bình rồi biểu diễn chúng
  • 8:24 - 8:27
    tần số, rồi lấy 100 lần nữa, tính trung bình
  • 8:27 - 8:29
    biểu diễn lần nữa, và nếu ta
  • 8:29 - 8:30
    làm 1 loạt, thực ra
  • 8:30 - 8:32
    nếu ta làm vô hạn lần,
  • 8:32 - 8:33
    ta sẽ thấy
  • 8:33 - 8:35
    nhất là đối với mẫu có kích thước vô hạn
  • 8:35 - 8:38
    ta được phân phối tiêu chuẩn hoàn hảo
  • 8:38 - 8:39
    đó là cái hay
  • 8:39 - 8:42
    nó không chỉ áp dụng với mỗi việc lấy trung bình mẫu
  • 8:42 - 8:44
    ở đây ta lấy trung bình mẫu
  • 8:44 - 8:46
    nhưng bạn cũng có thể lấy tổng của mẫu
  • 8:46 - 8:49
    định lý giới hạn trung tâm vẫn dùng được
  • 8:49 - 8:51
    đó là cái hay của nó
  • 8:51 - 8:54
    trong đời sống, có nhiều loại quá trình,
  • 8:54 - 8:57
    protein va chạm nhau,
  • 8:57 - 9:01
    người ta làm chuyện điên khùng, con người tương tác kì lạ với nhau
  • 9:01 - 9:03
    và bạn không biết hàm phân phối xác suất
  • 9:03 - 9:04
    cho mấy chuyện này
  • 9:04 - 9:06
    định lý giới hạn trung tâm
  • 9:06 - 9:09
    cho ta biết nếu ta cộng 1 đống các hành động
  • 9:09 - 9:11
    này với nhau, giả sử chúng đều có cùng phân phối
  • 9:11 - 9:14
    hoặc nếu ta lấy trung bình của mấy hoạt động đó
  • 9:14 - 9:17
    nếu ta biểu diễn tần số của trung bình,
  • 9:17 - 9:19
    ta sẽ được phân phối tiêu chuẩn
  • 9:19 - 9:22
    đó là lí do phân phối tiêu chuẩn xuất hiện
  • 9:22 - 9:26
    nhiều trong thống kê và lí do nó
  • 9:26 - 9:28
    là sự ước tính tốt cho tổng
  • 9:28 - 9:31
    hoặc trung bình của rất nhiều quá trình
  • 9:31 - 9:34
    phân phối tiêu chuẩn
  • 9:34 - 9:36
    trong video sau, mình sẽ cho bạn thấy
  • 9:36 - 9:39
    khi bạn tăng
  • 9:39 - 9:41
    kích thước mẫu, khi tăng n,
  • 9:41 - 9:43
    và khi bạn lấy trung bình mẫu nhiều
  • 9:43 - 9:46
    bạn sẽ được tần số nhìn rất giống với
  • 9:46 - 9:48
    phân phối tiêu chuẩn
Title:
Central Limit Theorem
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
09:49

Vietnamese subtitles

Incomplete

Revisions