0:00:00.000,0:00:06.650 Bây giờ chúng ta sẽ bắt đầu hành trình[br]tìm hiểu về thế giới của thống kê nhé, 0:00:06.650,0:00:09.750 đây chính là một cách để hiểu 0:00:09.750,0:00:11.520 về dữ liệu. 0:00:11.520,0:00:14.670 Thống kế hoàn toàn là về dữ liệu. 0:00:14.670,0:00:19.000 Và khi chúng ta bắt đầu hành trình khám [br]phá về thế giới thống kê, 0:00:19.000,0:00:20.610 chúng ta sẽ thực hiện rất nhiều [br]thứ mà 0:00:20.610,0:00:23.210 chúng ta có thể gọi là thống kê miêu tả. 0:00:23.210,0:00:25.470 Vậy tức là nếu như chúng ta có một đống [br]dữ liệu, và nếu chúng ta 0:00:25.470,0:00:27.990 muốn đề cập đến một điều gì về những[br]dữ liệu đó 0:00:27.990,0:00:29.890 mà không cần phải cung cấp toàn [br]bộ dữ liệu, 0:00:29.890,0:00:33.870 Liệu chúng ta có thể diễn tả chúng theo [br]cách nào đó với một bộ số nhỏ hơn không? 0:00:33.870,0:00:35.720 Đó chính là thứ mà chúng ta sẽ[br]tập trung nghiên cứu. 0:00:35.720,0:00:37.360 Một khi chúng ta đã xây dựng được [br]bộ công cụ của mình 0:00:37.360,0:00:39.260 về thống kê miêu tả, chúng ta 0:00:39.260,0:00:41.710 có thể bắt đầu suy luận về[br]dữ liệu đó, 0:00:41.710,0:00:44.200 bắt đầu đưa ra kết luận và[br]đánh giá. 0:00:44.200,0:00:49.430 Chúng ta sẽ bắt đầu làm rất nhiều[br]bài tập về thống kê miêu tả, 0:00:49.430,0:00:51.160 cũng như suy luận. 0:00:51.160,0:00:53.110 Với phương pháp đó, hãy thử nghĩ xem 0:00:53.110,0:00:56.390 chúng ta có thể biểu diễn dữ liệu như [br]thế nào. 0:00:56.390,0:01:00.710 Giả sử chúng ta có một bộ các chữ số. 0:01:00.710,0:01:02.360 Chúng ta có thể coi cái này là dữ liệu. 0:01:02.360,0:01:04.580 Có thể chúng ta đang đo chiều cao của [br]các loại cây 0:01:04.580,0:01:05.740 trong khu vườn. 0:01:05.740,0:01:07.400 Giả sử chúng ta có sáu cái cây. 0:01:07.400,0:01:13.870 Và chiều cao của chúng lần lượt là 4 inch,[br]3 inch, 1 inch, 6 inch, 0:01:13.870,0:01:17.990 Và thêm một cái cây nữa cũng cao 1 inch, [br]môt cái nữa thì cao 7 inch. 0:01:17.990,0:01:20.934 Và giả sử một ai đó nói rằng-- từ một [br]căn phòng khác, không 0:01:20.934,0:01:22.350 nhìn vào những cái cây của bạn, [br]chỉ hỏi rằng, 0:01:22.350,0:01:24.657 chà, bạn biết đấy, những cái cây của bạn[br]cao bao nhiêu? 0:01:24.657,0:01:26.240 Và họ chỉ muốn nghe một con số. 0:01:26.240,0:01:30.560 Họ muốn một con số có thể 0:01:30.560,0:01:33.410 đại diện cho tất cả các số đo chiều cao [br]khác nhau của những cái cây này. 0:01:33.410,0:01:36.580 Bạn sẽ tìm con số đó bằng cách nào? 0:01:36.580,0:01:38.810 Làm cách nào để mình có thể tìm một[br]thứ gì 0:01:38.810,0:01:40.990 mà-- có thể mình muốn một con số[br]cụ thể. 0:01:40.990,0:01:44.060 Có thể mình muốn con số mà bằng cách [br]nào đó ở tầm giữa giữa. 0:01:44.060,0:01:46.250 Có thể mình muốn một con số chung nhất. 0:01:46.250,0:01:48.830 Có thể mình muốn con số mà bằng cách nào[br]đó biểu diễn 0:01:48.830,0:01:51.270 chung cho tất cả các con số này. 0:01:51.270,0:01:53.220 Và nếu bạn đã nghĩ đến một trong những[br]cách làm như vậy, 0:01:53.220,0:01:55.189 thì thực ra bạn cũng sẽ làm những điều[br]tương tự 0:01:55.189,0:01:57.730 mà những người mới lần đầu tiếp cận[br]với thống kê miêu tả 0:01:57.730,0:01:58.230 đã nói. 0:01:58.230,0:02:00.150 Họ đã nói rằng, chà, chúng ta có thể[br]thực hiện nó như thế nào đây? 0:02:00.150,0:02:04.960 Và rồi chúng ta sẽ bắt đầu bằng cách nghĩ[br]đến ý tưởng về trung bình cộng. 0:02:04.960,0:02:07.610 Trong thuật ngữ chuyên ngành của đời sống[br]hàng ngày, trung bình cộng 0:02:07.610,0:02:09.720 có ý nghĩa rất cụ thể, chúng ta sẽ tìm[br]hiểu xem nhé. 0:02:09.720,0:02:11.570 Khi nhiều người nói về khái niệm[br]trung bình cộng, 0:02:11.570,0:02:13.070 ý của họ đang muốn đề cập đến[br]trung bình cộng đơn giản 0:02:13.070,0:02:14.960 cũng chính là thứ mà chúng ta [br]sẽ thấy ngay sau đây. 0:02:14.960,0:02:18.100 Nhưng trong thống kê, trung bình cộng [br]nghĩa là một điều gì đó tổng quát hơn. 0:02:18.100,0:02:22.980 Nó thực sự có nghĩa là đưa cho mình[br]một con số cụ thể, 0:02:22.980,0:02:29.810 hoặc cho mình một số ở giữa, hoặc--[br]những cái này chính là trường hợp của hoặc. 0:02:29.810,0:02:31.930 Và thực sự cần nỗ lực để tìm ra 0:02:31.930,0:02:33.490 một số đo tập trung. 0:02:38.550,0:02:40.560 Vậy là một lần nữa, bạn có một loạt [br]các con số. 0:02:40.560,0:02:42.970 Bằng một cách nào đó, bạn đang cố gắng[br]để biểu diễn những số này 0:02:42.970,0:02:45.840 bằng một con số mà chúng ta sẽ gọi nó là[br]trung bình cộng, nó chính là con số 0:02:45.840,0:02:49.130 cụ thể, hoặc ở giữa, hoặc bằng một cách [br]nào đó ở trung tâm 0:02:49.130,0:02:50.450 của các con số này. 0:02:50.450,0:02:54.110 Và như chúng ta sẽ thấy, có nhiều loại[br]trung bình cộng. 0:02:54.110,0:02:56.690 Dạng đầu tiên chắc chắn là dạng mà bạn[br]thấy quen thuộc nhất. 0:02:56.690,0:02:58.398 Đó chính là-- kiểu mọi người [br]bàn luận về 0:02:58.398,0:03:00.840 điểm số trung bình của bài kiểm tra lần[br]này hay chiều cao trung bình chẳng hạn. 0:03:00.840,0:03:02.970 Đó chính là trung bình cộng đơn giản. 0:03:02.970,0:03:05.470 Để mình viết nó ra. 0:03:05.470,0:03:13.100 Mình sẽ viết bằng màu vàng, [br]trung bình cộng đơn giản. 0:03:13.100,0:03:16.010 Khi số học là một danh từ, ta chỉ cần gọi[br]nó là số học thôi. 0:03:16.010,0:03:19.960 Khi nó là một tính từ như thế này, [br]ta gọi nó là 0:03:19.960,0:03:21.620 trung bình cộng đơn giản. 0:03:21.620,0:03:25.300 Đây thực sự chỉ là tổng của tất cả [br]các số chia cho-- 0:03:25.300,0:03:28.180 đây là một định nghĩa do con người [br]tạo ra mà chúng ta 0:03:28.180,0:03:31.630 thấy hữu ích-- tổng của tất cả các số này[br]chia cho 0:03:31.630,0:03:34.460 số các chữ số mà chúng ta có. 0:03:34.460,0:03:36.830 Căn cứ vào đó, trung bình cộng đơn giản 0:03:36.830,0:03:39.114 của bộ dữ liệu này là gì? 0:03:39.114,0:03:40.280 Hãy thử tính xem nhé. 0:03:40.280,0:03:46.160 Nó sẽ bằng 4 cộng 3 cộng 1 cộng 6[br]cộng 1 0:03:46.160,0:03:51.210 cộng 7 trên số các điểm dữ liệu mà [br]chúng ta có. 0:03:51.210,0:03:53.210 Chúng ta có 6 điểm dữ liệu. 0:03:53.210,0:03:54.860 Vậy nên chúng ta sẽ chia cho 6. 0:03:54.860,0:04:01.840 Và chúng ta có 4 cộng 3 bằng 7, [br]cộng 1 bằng 8, cộng 6 bằng 14, 0:04:01.840,0:04:04.934 cộng 1 bằng 15, cộng 7. 0:04:04.934,0:04:07.927 15 cộng 7 bằng 22. 0:04:07.927,0:04:09.135 Để mình tính lại nhé. 0:04:09.135,0:04:15.180 Có 7, 8, 14, 15, 22, tất cả trên 6. 0:04:15.180,0:04:17.070 Và chúng ta có thể viết kết quả này [br]dưới dạng một hỗn số. 0:04:17.070,0:04:21.120 22 chia 6 được 3, dư 4. 0:04:21.120,0:04:25.200 Vậy kết quả là 3 và 4 phần 6, tương đương[br]với 3 và 2 phần 3. 0:04:25.200,0:04:28.670 Chúng ta có thể viết cái này dưới dạng một[br]số thâp phân vô hạn tuần hoàn 3.6. 0:04:28.670,0:04:32.360 Vậy kết quả ở đây cũng là 3.6 0:04:32.360,0:04:34.380 Chúng ta có thể viết theo một trong[br]những cách đó. 0:04:34.380,0:04:36.700 Nhưng đây chỉ là một loại số đại diện. 0:04:36.700,0:04:39.820 Đây là cách để lấy một số bình quân. 0:04:39.820,0:04:41.620 Mình nhắc lại một lần nữa nhé, đây là [br]phương pháp do con người tạo ra. 0:04:41.620,0:04:43.590 Chưa một ai từng-- nó không phải kiểu[br]như một ai đó 0:04:43.590,0:04:46.140 tìm thấy vài tài liệu tôn giáo ghi rằng, 0:04:46.140,0:04:47.990 đây là cách để xác định được [br] 0:04:47.990,0:04:49.180 trung bình cộng đơn giản. 0:04:49.180,0:04:52.700 Nó không đơn thuần như một phép tính, [br]giống như, 0:04:52.700,0:04:55.005 giả dụ như, như việc tìm chu vi của [br]hình tròn, 0:04:55.005,0:04:56.880 đó là một phạm trù khá là-- chúng ta 0:04:56.880,0:04:57.840 đã nghiên cứu về vũ trụ. 0:04:57.840,0:05:00.600 Và công thức đó được đúc kết từ [br]nghiên cứu của chúng ta từ vũ trụ. 0:05:00.600,0:05:02.250 Đó là một định nghĩa được tạo ra [br]bởi nhân loại 0:05:02.250,0:05:04.110 mà chúng ta thấy hữu ích. 0:05:04.110,0:05:07.260 Giờ đây có những cách khác để tìm [br]trung bình cộng 0:05:07.260,0:05:10.130 hoặc tìm một giá trị cụ thể hoặc nằm [br]ở giữa. 0:05:10.130,0:05:14.470 Có một cách làm điển hình khác gọi là[br]số trung vị. 0:05:14.470,0:05:15.667 Và mình sẽ viết trung vị đây. 0:05:15.667,0:05:16.750 Mình đang hết màu rồi. 0:05:16.750,0:05:18.660 Mình sẽ viết chữ trung vị bằng màu hồng. 0:05:18.660,0:05:21.280 Vậy đây là trung vị. 0:05:21.280,0:05:25.160 Trung vị về cơ bản chính là tìm số[br]ở giữa. 0:05:25.160,0:05:27.350 Vậy nếu bạn sắp xếp các con số [br]trong bộ số của mình 0:05:27.350,0:05:31.460 và tìm con số ở giữa, thì số đó [br]chính là trung vị. 0:05:31.460,0:05:34.050 Căn cứ vào đó, trung vị của bộ số này 0:05:34.050,0:05:35.806 sẽ là bao nhiêu nhỉ? 0:05:35.806,0:05:36.930 Hãy thử tìm xem nhé. 0:05:36.930,0:05:38.170 Hãy thử sắp xếp nó nào. 0:05:38.170,0:05:39.810 Chúng ta có 1. 0:05:39.810,0:05:41.010 Và chúng ta lại có thêm một số 1 nữa. 0:05:41.010,0:05:42.860 Rồi chúng ta có 3. 0:05:42.860,0:05:46.630 Chúng ta có cả 4, 6 và 7. 0:05:46.630,0:05:48.700 Tất cả những gì mình đã làm chính là[br]sắp xếp lại các con số này. 0:05:48.700,0:05:50.890 Vậy số ở giữa là con số nào nhỉ? 0:05:50.890,0:05:52.320 Bạn nhìn vào đây nhé. 0:05:52.320,0:05:54.960 Chúng ta có số các con số là số chẵn, [br]có tổng cộng 6 con số mà, 0:05:54.960,0:05:57.260 nên sẽ không có số nào ở giữa. 0:05:57.260,0:05:59.650 Thực ra bạn sẽ có hai số ở giữa. 0:05:59.650,0:06:02.050 Bạn có hai số ở giữa ở ngay đây. 0:06:02.050,0:06:03.160 Đó là số 3 và 4. 0:06:03.160,0:06:05.940 Trong trường hợp này, bạn có hai số ở giữa. 0:06:05.940,0:06:09.640 thực ra bạn đã đi được nửa đường[br]giữa hai số này rồi đấy. 0:06:09.640,0:06:12.080 Bạn chỉ cần tìm trung bình cộng đơn giản[br]cua hai số này 0:06:12.080,0:06:14.272 để tìm ra trung vị. 0:06:14.272,0:06:16.230 Vậy là trung vị sẽ ở giữa hai số[br] 0:06:16.230,0:06:19.190 3 và 4, tức là sẽ bằng 3.5. 0:06:19.190,0:06:24.424 Vậy trường hợp này trung vị bằng 3.5. 0:06:24.424,0:06:26.590 Nếu như bạn có số các chữ số là số chẵn, [br]thì trung vị 0:06:26.590,0:06:28.714 hoặc hai số ở giữa, trung bình cộng [br]đơn giản 0:06:28.714,0:06:31.329 của hai số ở giữa, hoặc đoạn ở giữa[br]hai số đó. 0:06:31.329,0:06:32.870 Nếu bạn có số các chữ số là số lẻ, 0:06:32.870,0:06:34.270 thì việc tính toán sẽ dễ hơn một chút. 0:06:34.270,0:06:35.644 Và như chúng ta đã tìm hiểu, 0:06:35.644,0:06:36.920 để mình cho bạn một bộ dữ liệu khác. 0:06:36.920,0:06:39.030 Giả sử bộ dữ liệu của chúng ta-- và [br]mình sẽ 0:06:39.030,0:06:41.740 sắp xếp nó luôn-- giả sử bộ dữ liệu[br]của chúng ta 0:06:41.740,0:06:55.689 là 0, 7, 50, mình không biết nữa, 10,000 [br]và 1 triệu. 0:06:55.689,0:06:56.980 Giả sử đây là bộ dữ liệu của chúng ta. 0:06:56.980,0:06:58.450 Một bộ dữ liệu khá khủng bố đây. 0:06:58.450,0:07:02.400 Nhưng trong trường hợp này, [br]trung vị của chúng ta là gì? 0:07:02.400,0:07:04.045 Ở đây chúng ta có năm con số. 0:07:04.045,0:07:05.420 Chúng ta có số lượng các chữ số là[br]số lẻ. 0:07:05.420,0:07:07.200 Nên sẽ dễ hơn để chọn ra số ở giữa. 0:07:07.200,0:07:12.040 Số ở giữa chính là số lớn hơn hai số[br]trong bộ số 0:07:12.040,0:07:13.540 và nhỏ hơn hai số trong bộ số. 0:07:13.540,0:07:14.760 Đó chính xác là số ở giữa. 0:07:14.760,0:07:18.840 Trong trường hợp này, trung vị của[br]chúng ta là 50. 0:07:18.840,0:07:20.742 Bây giờ đến số đo bình quân thứ ba, 0:07:20.742,0:07:22.200 và đây chắc chắn là nó rồi, [br]đó chắc chắn 0:07:22.200,0:07:26.426 là cái được sử dụng ít nhất trong [br]đời sống, chính là yếu vị. 0:07:26.426,0:07:27.800 Và mọi người thường hay lãng quên[br]về nó. 0:07:27.800,0:07:29.852 Nó giống như một cái gì đó rất phức tạp. 0:07:29.852,0:07:31.310 Nhưng những gì chúng ta sẽ thấy[br]thực chất là 0:07:31.310,0:07:33.080 một ý tưởng rất dễ hiểu. 0:07:33.080,0:07:36.180 Và trong một vài phương pháp, [br]nó chính là ý tưởng đơn giản nhất. 0:07:36.180,0:07:40.510 Yếu vị thực ra là con số chung nhất[br]trong một bộ dữ liệu, 0:07:40.510,0:07:41.885 nếu như có một con số chung nhất. 0:07:41.885,0:07:43.801 Nếu tất cả các con số đều được biểu diễn[br]một cách đồng đều, 0:07:43.801,0:07:45.760 nếu không có một con số chung nào, 0:07:45.760,0:07:47.320 thì bạn không có yếu vị. 0:07:47.320,0:07:50.240 Nhưng căn cứ vào đó, định nghĩa của[br]yếu vị, 0:07:50.240,0:07:54.190 Đâu là con số chung duy nhất trong bộ[br]dữ liệu nguyên bản của chúng ta, 0:07:54.190,0:07:58.300 trong bộ dữ liệu ở ngay đây? 0:07:58.300,0:08:00.100 Chúng ta có một con số 4 duy nhất. 0:08:00.100,0:08:01.490 Chúng ta có một con số 3 duy nhất. 0:08:01.490,0:08:03.370 Nhưng chúng ta có hai số 1. 0:08:03.370,0:08:04.880 Chúng ta có một số 6 và một số 7. 0:08:04.880,0:08:08.730 Vậy con số xuất hiện nhiều nhất [br]ở đây 0:08:08.730,0:08:11.060 chính là số 1. 0:08:11.060,0:08:14.070 Vậy nên yếu vị, con số điển hình nhất, [br]con số phổ biến nhất 0:08:14.070,0:08:17.610 ở đây là 1. 0:08:17.610,0:08:19.590 Vậy, như bạn thấy đấy, đây đều là các cách[br]khác nhau 0:08:19.590,0:08:23.320 để tìm một giá trị trung bình, giá trị [br]giữa và giá trị xuất hiện thường xuyên nhất. 0:08:23.320,0:08:25.600 Nhưng chúng biểu đạt theo những [br]cách rất khác nhau. 0:08:25.600,0:08:27.350 Và khi chúng ta càng nghiên cứu kỹ hơn[br]về thống kê, 0:08:27.350,0:08:29.760 chúng ta sẽ thấy được rằng chúng có ích [br]cho nhiều thứ khác nhau. 0:08:29.760,0:08:31.730 Chúng được sử dụng rất thường xuyên. 0:08:31.730,0:08:34.574 Trung vị rất hữu ích nếu như bạn [br]có một vài con số lớn 0:08:34.574,0:08:35.990 ở đây khiến 0:08:35.990,0:08:38.100 lệch đi giá trị trung bình đơn giản. 0:08:38.100,0:08:41.449 Yếu vị cũng có thể hữu ích ở các [br]trường hợp như thế, 0:08:41.449,0:08:43.240 đặc biệt nếu như bạn có một [br]con số 0:08:43.240,0:08:45.960 xuất hiện thường xuyên hơn. 0:08:45.960,0:08:47.570 Dù sao thì, mình sẽ kết thúc ở đây. 0:08:47.570,0:08:51.710 Và chúng ta sẽ-- ở vài video tiếp theo, [br]chúng ta sẽ khám phá về thống kê 0:08:51.710,0:08:53.260 thậm chí ở mức độ sâu rộng hơn.