Trung bình và độ lệch chuẩn so với trung vị và khoảng tứ phân vị |Xác Suất Thống Kê| Khan Academy
-
0:01 - 0:08Chúng mình có tất cả 9 sinh viên ở trong một niên khoá ở một ngôi trường nhỏ. Và 9 sinh viên này vừa tốt nghiệp.
-
0:08 - 0:08
-
0:08 - 0:14Và họ muốn tìm xu hướng trung tâm của tiền lương của 9 bạn sinh viên đó một năm sau khi tốt nghiệp.
-
0:14 - 0:14
-
0:14 - 0:20Và họ cũng muốn tìm hiểu về độ lan toả xung quanh xu hướng trung tâm của tiền lương một năm sau khi tốt nghiệp.
-
0:20 - 0:20
-
0:20 - 0:23Vì vậy họ sẽ ghi tất cả những tiền lương của 9 sinh viên đó vào máy tính.
-
0:23 - 0:25Và đây chính là tiền lương của 9 bạn sinh viên.
-
0:25 - 0:27Và nó được đo bằng hàng nghìn nhé.
-
0:27 - 0:30Đây là 35 nghìn; 50 nghìn; 50 nghìn; 50 nghìn; 56 ngìn
-
0:30 - 0:372 người làm được 60 nghìn; một người làm được 75 nghìn và một người làm được 250 nghìn.
-
0:37 - 0:37
-
0:37 - 0:41Và rồi máy tính cho chúng mình các tham số ngay đây
-
0:41 - 0:43dựa vào những dữ liệu này.
-
0:43 - 0:47Và máy tính cho chúng mình 2 số đo điển hình của xu hướng trung tâm.
-
0:47 - 0:50Trung bình sẽ là khoảng 76.2.
-
0:50 - 0:54Máy vi tính sẽ tính trung bình bằng cách cộng 9 số này lại.
-
0:54 - 0:56Và rồi chia cho 9.
-
0:56 - 1:00Mình còn biết được trung vị là 56, và trung vị khá là dễ để tính.
-
1:00 - 1:02Bạn cần sắp xếp các số theo thứ tự
-
1:02 - 1:06và số ngay chính giữa trong trường hợp này là 56 sẽ là trung vị.
-
1:06 - 1:08Và mình muốn các bạn thử dừng video này lại,
-
1:08 - 1:10và đối với tập dữ liệu này,
-
1:10 - 1:14đối với tổng thể của các mức lương này,
-
1:14 - 1:19số đo nào của xu hướng trung tâm sẽ là số đo tốt hơn?
-
1:19 - 1:21Hãy cùng nghĩ về nó nhé!
-
1:21 - 1:23Mình sẽ vẽ nó lên đường thẳng ngay đây.
-
1:23 - 1:26Mình sẽ vẽ các dữ liệu lên biểu đồ này
-
1:26 - 1:29Mình không muốn các bạn chỉ xem đây là những con số,
-
1:29 - 1:32mà mình muốn bạn có thể thấy vị trí của các số này nằm ở đâu trên biểu đồ.
-
1:32 - 1:33
-
1:33 - 1:35Mình sẽ cho ở đây là 0 nhé,
-
1:36 - 1:42và đây là 1, 2, 3, 4, 5
-
1:42 - 1:51Vậy ngay đây là 250, 50, 100, 150, 200,
-
1:51 - 1:53Để mình xem nào,
-
1:53 - 1:56nếu khoảng này là 50,
-
1:56 - 1:59thì 40 sẽ ở đây, mình đang ước chừng thôi nhé.
-
1:59 - 2:03Ngay đây sẽ là 60, 70, 80, 90.
-
2:03 - 2:05Mình có thể vẽ nó chính xác hơn một chút,
-
2:05 - 2:0860, 70, 80, 90.
-
2:09 - 2:12Để mình vẽ lại điểm ngay đây cho chính xác hơn luôn nhé,
-
2:12 - 2:14mình vẽ lại điểm 40 này,
-
2:14 - 2:17mình sẽ dời nó gần 50 hơn.
-
2:18 - 2:22Mình sẽ để nó ở đây nhé.
-
2:22 - 2:24Vậy là 40,
-
2:24 - 2:27và cái này sẽ là 30, 20, 10.
-
2:27 - 2:29Nó khá là chính xác rồi đấy.
-
2:29 - 2:31Hãy cùng đưa dữ liệu này vào biểu đồ nào!
-
2:31 - 2:35Có một học sinh kiếm được 35000, vậy là sẽ nằm ngay đây.
-
2:36 - 2:38Có 3 học sinh kiếm được 50000,
-
2:38 - 2:42Vậy là 1, 2, 3.
-
2:42 - 2:44Mình sẽ để như vậy.
-
2:44 - 2:50Có một học sinh kiếm được 56000, vậy là mình sẽ để ngay đây.
-
2:50 - 2:54Có 2 học sinh kiếm được 60000 và mình sẽ vẽ như vậy.
-
2:54 - 2:54
-
2:54 - 3:02Có một học sinh kiếm được 75000, vậy là 60, 70, 75000 sẽ khoảng ngay đây.
-
3:02 - 3:02
-
3:02 - 3:04Và có một học sinh kiếm được 250000,
-
3:04 - 3:08vậy là mình sẽ vẽ nó tận trên này.
-
3:08 - 3:11Và khi mình tính trung bình tức mình được 76,2.
-
3:11 - 3:13Nó là số đo xu hướng trung tâm của mình.
-
3:13 - 3:17Và 76,2 sẽ nằm ở ngay đây.
-
3:17 - 3:21Vậy liệu trung bình có phải là số đo thích hợp cho xu hướng trung tâm trong trường hợp này?
-
3:21 - 3:23Đối với mình, nó không thích hợp lắm.
-
3:23 - 3:26Nếu mình dùng trung bình làm số đo của xu hướng trung tâm
-
3:26 - 3:29thì nó sẽ cao hơn so với tất cả các điểm dữ liệu ngoại trừ một điểm.
-
3:29 - 3:34Và lý do là vì dữ liệu của chúng mình bị nghiêng khá nhiều
-
3:34 - 3:38tại vì điểm dữ liệu ngay đây, điểm 250 nghìn.
-
3:38 - 3:41Điểm này quá xa so với phần còn lại của phân phối.
-
3:41 - 3:45Nó quá xa so với các dữ liệu còn lại, vì vậy điểm này làm nghiêng trung bình của chúng mình.
-
3:45 - 3:47Và bạn sẽ thấy điều này ở dạng tổng quát.
-
3:47 - 3:51Nếu bạn có dữ liệu bị nghiêng và đặt biệt với các dữ liệu về tiền lương,
-
3:51 - 3:53phần lớn mọi người kiếm được 50, 60, 70 nghìn đô la.
-
3:53 - 3:57Nhưng lại có một người nào đó kiếm được 2 triệu đô la.
-
3:57 - 4:03Và điều đó sẽ làm trung bình bị nghiêng, khi bạn cộng tất cả dữ liệu lại và chia cho số điểm dữ liệu mà bạn có.
-
4:03 - 4:03
-
4:03 - 4:03
-
4:03 - 4:08Và trong trường hợp này, đặt biệt khi bạn có điểm dữ liệu mà làm trung bình bị nghiêng
-
4:08 - 4:11thì trung vị sẽ là số đo chuẩn xác hơn cho xu hướng trung tâm.
-
4:11 - 4:13Và trung vị là 56, sẽ nằm ở ngay đây,
-
4:13 - 4:17và trung vị sẽ biểu thị xu hướng trung tâm tốt hơn trong trường hợp này.
-
4:17 - 4:19Hãy nghĩ về nó nhé.
-
4:19 - 4:22Ngay cả khi thay đổi số tiền lương ngay đây,
-
4:22 - 4:26mình sẽ thêm 3 số 0 sau 250 nghìn đô la nữa,
-
4:26 - 4:29vậy sẽ là 250 triệu đô la, tức là sẽ rất nhiều tiền.
-
4:29 - 4:32Nó sẽ làm trung bình nghiêng đi rất nhiều,
-
4:32 - 4:36nhưng nó không ảnh hưởng đến trung vị nên trung vị sẽ không thay đổi.
-
4:36 - 4:37Vì đối với trung vị,
-
4:37 - 4:40mình không cần quan tâm là số ngay đây tăng lên bao nhiêu,
-
4:40 - 4:40
-
4:40 - 4:42nó có thể là 1 tỷ đô.
-
4:42 - 4:43Và trung vị vẫn sẽ không đổi.
-
4:43 - 4:48Vì thế, trung vị sẽ là số đo chuẩn hơn vì nó đỡ bị ảnh hưởng khi bạn có một tập dữ liệu bị nghiêng.
-
4:48 - 4:48
-
4:48 - 4:52Và sử dụng trung bình sẽ hợp lý hơn khi bạn có một tập dữ liệu đối xứng.
-
4:52 - 4:56Hoặc là bạn có một tập dữ liệu mà các số nằm xấp xỉ trên và dưới trung bình.
-
4:56 - 4:57
-
4:57 - 5:00Hoặc là một tập dữ liệu mà không bị nghiêng quá nhiều về một hướng.
-
5:00 - 5:01
-
5:01 - 5:04Như trong trường hợp này, tập dữ liệu đã bị nghiêng quá nhiều vì số 250 nghìn ngay đây.
-
5:04 - 5:10Vậy trong trường hợp này, sẽ tốt hơn rất nhiều khi bạn sử dụng trung vị làm số đo của xu hướng trung tâm.
-
5:10 - 5:10
-
5:10 - 5:12Vậy còn đối với độ lan toả thì sao?
-
5:12 - 5:14Có thể bạn đã nghe mình nói rằng:
-
5:14 - 5:16"trung bình không tốt lắm trong trường hợp này"
-
5:16 - 5:18Và độ lệch chuẩn thì dựa vào trung bình.
-
5:18 - 5:23Mình lấy mỗi điểm dữ liệu, tìm khoảng cách từ trung bình, và bình phương nó lên.
-
5:23 - 5:26Mình làm như vậy với mỗi điểm dữ liệu và rồi cộng hết chúng lại.
-
5:26 - 5:30Rồi chia cho số điểm dữ liệu nếu mình đang tìm độ lệch chuẩn tổng thể
-
5:30 - 5:34và rồi mình căn bậc 2 tất cả những gì mình vừa tìm được.
-
5:34 - 5:35
-
5:35 - 5:37Bởi vì độ lệch chuẩn dựa vào trung bình,
-
5:37 - 5:41và trung bình không phải là một số đo tốt cho xu hướng trung tâm trong trường hợp này,
-
5:41 - 5:45và điểm dữ liệu ngay đây, 250 nghìn đô la cũng sẽ làm nghiêng độ lệch chuẩn.
-
5:45 - 5:50Và vì vậy độ lệch chuẩn (số đo độ lan toả) mà bạn tính được
-
5:50 - 5:50
-
5:50 - 5:53sẽ lớn hơn rất nhiều so với khi bạn nhìn vào độ lan toả thực tế trên biểu đồ
-
5:53 - 5:56Sẽ có một điểm dữ liệu cách rất xa
-
5:56 - 6:00nó cách xa trung bình hay trung vị tuỳ theo cách mà bạn nghĩ về nó.
-
6:00 - 6:03Tuy nhiên, các điểm dữ liệu còn lại có vẽ như rất gần,
-
6:03 - 6:05và trong trường hợp đó,
-
6:05 - 6:07mình không chỉ sử dụng trung vị,
-
6:07 - 6:12mà mình còn có thể sử dụng khoảng tứ phân vị vì nó ít bị ảnh hưởng khi tập dữ liệu bị nghiêng.
-
6:12 - 6:13Và mình tìm nó như thế nào?
-
6:13 - 6:15Mình sẽ lấy trung vị của cả tập dữ liệu,
-
6:15 - 6:19và rồi mình lấy các số của nhóm dưới và tìm trung vị của chúng.
-
6:19 - 6:21Vậy nó sẽ là 50 ngay đây.
-
6:21 - 6:25Và rồi bạn lấy các số của nhóm trên,
-
6:25 - 6:29và trung vị ở đây, bằng 60 cộng 75 và chia cho 2, vậy là bằng 67,5.
-
6:29 - 6:31Nếu bạn thấy cái này hơi khó hiểu
-
6:31 - 6:35thì bạn có thể xem lại các video về khoảng tứ phân vị, tính độ lệch chuẩn, trung vị và trung bình.
-
6:35 - 6:35
-
6:35 - 6:36
-
6:36 - 6:40Và khoảng tứ trung vị sẽ bằng hiệu của 2 cái này, tức là bằng 17.5.
-
6:40 - 6:43Bạn có thể thấy, khoảng cách giữa 2 cái này là 17,5.
-
6:43 - 6:45khoảng tứ phân vị này sẽ không thay đổi
-
6:45 - 6:48kể cả khi 250.000 này tăng lên thành 250 tỉ đô.
-
6:48 - 6:52Và một lần nữa, trung vị và khoảng tứ phân vị,
-
6:52 - 6:56sẽ chính xác hơn vì nó đỡ bị ảnh hưởng khi chúng mình có tập dữ liệu bị nghiêng.
-
6:56 - 6:59Và điều quan trọng bạn cần ghi nhớ đó là,
-
6:59 - 7:02bạn có thể dùng trung bình và độ lệch chuẩn làm số đo
-
7:02 - 7:04nếu như bạn có một tập dữ liệu đối xứng
-
7:04 - 7:07và không có giá trị ngoại lai nào quá lớn làm nghiêng cả tập dữ liệu.
-
7:07 - 7:11Trong trường hợp đó, bạn hoàn toàn có thể sử dụng trung bình và độ lệch chuẩn.
-
7:11 - 7:14Nhưng nếu bạn có một tập dữ liệu bị nghiêng do các điểm dữ liệu,
-
7:14 - 7:19bạn nên sử dụng trung vị làm số đo của xu hướng trung tâm,
-
7:19 - 7:19
-
7:19 - 7:23và bạn nên sử dụng khoảng tứ phân vị cho độ lan toả xung quanh xu hướng trung tâm.
-
7:23 - 7:27Vì vậy bạn sẽ thấy khi làm về tiền lương thì mọi người thường hay nói đến trung vị.
-
7:27 - 7:27
-
7:27 - 7:30Bởi vì tiền lương có thể bị nghiêng đặc biệt là ở phía trên.
-
7:30 - 7:32Và khi có tập dữ liệu về giá nhà,
-
7:32 - 7:36thì bạn sẽ thấy mọi người thường sử dụng trung vị hơn là trung bình.
-
7:36 - 7:41Bởi vì nhiều nhà trong khu phố, hoặc nhà trong thành phố giá của chúng
-
7:41 - 7:44sẽ ở trong phạm vi 200 nghìn đô la, hay 300 nghìn đô la
-
7:44 - 7:44
-
7:44 - 7:48Và có thể sẽ có một căn biệt thự to lớn nào đó có giá 100 triệu đô,
-
7:48 - 7:51và khi bạn tính trung bình, nó sẽ bị nghiêng và bạn sẽ có một cái nhìn thiếu chính xác
-
7:51 - 7:56về trung bình, hay xu hướng trung tâm của giá nhà ở trong thành phố.
- Title:
- Trung bình và độ lệch chuẩn so với trung vị và khoảng tứ phân vị |Xác Suất Thống Kê| Khan Academy
- Description:
-
Chọn số đo thích hợp cho xu hướng trung tâm và độ lan toả khi có giá trị ngoại lai trong tập dữ liệu.
Luyện tập trên Khan Academy:
http://www.khanacademy.org/math/ap-statistics/summarizing-quantitative-data-ap/measuring-spread-quantitative/v/mean-and-standard-deviation-versus-median-and-iqr?utm_source=youtube&utm_medium=desc&utm_campaign=apstatisticsXác suất và thống kê trên Học viện Khan: Hãy thách mình qua một ngày mà không xem xét hoặc sử dụng xác suất. Hôm nay, bạn đã có kiểm tra dự báo thời tiết chưa? Bạn đã có quyết định liệu mình nên lái xe hoặc đi bộ đến một địa điểm nào đó? Trong đời thường sống, chúng ta sẽ luôn tạo ra các giả thuyết, đưa ra dự đoán, thử nghiệm và phân tích. Cuộc sống đầy những xác suất, và những thống kê liên quan đến xác suất. Phần lớn các dữ liệu chúng ta thường sử dụng để xác định những chuyện có thể xảy ra đến từ hiểu biết về thống kê. Trong các bài hướng dẫn này, chúng tôi sẽ đề cập đến một loạt các chủ đề bao gồm: sự kiện độc lập, xác suất phụ thuộc, toán học tổ hợp, kiểm tra giả thuyết, thống kê mô tả, biến ngẫu nhiên, phân phối xác suất, hồi quy và thống kê suy luận. Xác suất và thống kê trên Học viện Khan: Hãy thách mình qua một ngày mà không xem xét hoặc sử dụng xác suất. Hôm nay, bạn đã có kiểm tra dự báo thời tiết chưa? Bạn đã có quyết định liệu mình nên lái xe hoặc đi bộ đến một địa điểm nào đó? Trong đời thường sống, chúng ta sẽ luôn tạo ra các giả thuyết, đưa ra dự đoán, thử nghiệm và phân tích. Cuộc sống đầy những xác suất, và những thống kê liên quan đến xác suất. Phần lớn các dữ liệu chúng ta thường sử dụng để xác định những chuyện có thể xảy ra đến từ hiểu biết về thống kê. Trong các bài hướng dẫn này, chúng tôi sẽ đề cập đến một loạt các chủ đề bao gồm: sự kiện độc lập, xác suất phụ thuộc, toán học tổ hợp, kiểm tra giả thuyết, thống kê mô tả, biến ngẫu nhiên, phân phối xác suất, hồi quy và thống kê suy luận. Bạn hãy thắt dây an toàn và bắt đầu phiêu liêu cũng Khan Academy. Chúng tôi biết rằng trong quá trình học, bạn chắc sẽ được thử thách!
Về Khan Academy: Khan Academy là một tổ chức phi lợi nhuận có nhiệm vụ cung cấp giáo dục miễn phí, đẳng cấp thế giới cho bất kỳ ai, bất cứ nơi nào. Chúng tôi tin rằng mọi người bất kể lứa tuổi nên có quyền truy cập không giới hạn vào nội dung giáo dục miễn phí và học theo tốc độ riêng của mình. Sử dụng phần mềm thông minh, phân tích dữ liệu sâu và giao diện người dùng trực quan, Khan Academy tự hào mang đến cho người dùng những bài luyện tập, các video hướng dẫn, và một bảng quá trình học tập cho hơn 50 môn học, có gồm Toán học, Khoa học, Lập trình máy tính, Lịch sử, Lịch sử nghệ thuật, Kinh tế và hơn thế nữa. Chúng tôi đang cùng đồng hành với các viện nghiên cứu như NASA, Bảo tàng Nghệ thuật Hiện đại (The Museum of Modern Art), Viện Khoa Học California (The California Academy of Sciences), và những học viện uy tín như MIT để mang đến các nội dung mang tính chuyên ngành. Hiện giờ, Khan Academy đã được dịch sang hàng chục ngôn ngữ, và đã có hơn 100 triệu người trên toàn thế giới sử dụng nền tảng của chúng tôi mỗi năm. Để biết thêm thông tin, hãy truy cập www.khanacademy.org, tham gia Facebook của chúng tôi hoặc theo dõi chúng tôi trên twitter tại @khanacademy.
Miễn phí. Cho tất cả mọi người. Mãi mãi. #YouCanLearnAnything
Theo dõi kênh [Toán Xác Suất Thống Kê] của Khan Academy:
https://www.youtube.com/watch?v=uhxtUt_-GyM&list=PL1328115D3D8A2566Theo dõi kênh Khan Academy:
https://www.youtube.com/subscription_center?add_user=khanacademy - Video Language:
- English
- Team:
Khan Academy
- Duration:
- 07:59
![]() |
dungnguyen412 edited Vietnamese subtitles for Mean and standard deviation versus median and IQR | |
![]() |
dungnguyen412 edited Vietnamese subtitles for Mean and standard deviation versus median and IQR | |
![]() |
dungnguyen412 edited Vietnamese subtitles for Mean and standard deviation versus median and IQR | |
![]() |
dungnguyen412 edited Vietnamese subtitles for Mean and standard deviation versus median and IQR | |
![]() |
dungnguyen412 edited Vietnamese subtitles for Mean and standard deviation versus median and IQR | |
![]() |
dungnguyen412 edited Vietnamese subtitles for Mean and standard deviation versus median and IQR | |
![]() |
dungnguyen412 edited Vietnamese subtitles for Mean and standard deviation versus median and IQR | |
![]() |
dungnguyen412 edited Vietnamese subtitles for Mean and standard deviation versus median and IQR |