1 00:00:09,061 --> 00:00:12,162 Các kì thi chuẩn hóa đầu tiên mà chúng ta biết 2 00:00:12,162 --> 00:00:16,342 diễn ra ở Trung Quốc cách đây hơn 2.000 năm 3 00:00:16,342 --> 00:00:18,223 dưới thời nhà Hán. 4 00:00:18,223 --> 00:00:23,483 Quan lại tổ chức các kì thi để tìm người có năng lực cho các vị trí cầm quyền. 5 00:00:23,483 --> 00:00:25,572 Các môn thi bao gồm triết học, 6 00:00:25,572 --> 00:00:26,637 nông nghiệp, 7 00:00:26,637 --> 00:00:28,963 và thậm chí là chiến thuật quân sự. 8 00:00:28,963 --> 00:00:33,790 Thi cử chuẩn hóa vẫn tồn tại trên thế giới suốt 2 thiên niên kỉ tiếp theo 9 00:00:33,790 --> 00:00:35,882 và ngày nay, mọi thứ do thi cử quyết định 10 00:00:35,882 --> 00:00:39,838 từ đánh giá khả năng leo cầu thang của lính cứu hỏa ở Pháp 11 00:00:39,838 --> 00:00:43,323 đến kiểm tra năng lực ngôn ngữ của các nhà ngoại giao ở Canada 12 00:00:43,323 --> 00:00:45,914 cho đến đánh giá học sinh ở trường. 13 00:00:45,914 --> 00:00:48,024 Một số kì thi xác định điểm của một thí sinh 14 00:00:48,024 --> 00:00:51,784 bằng cách so với kết quả của các thí sinh khác. 15 00:00:51,784 --> 00:00:57,455 Số khác đánh giá bằng mức độ thí sinh đáp ứng các tiêu chuẩn có sẵn. 16 00:00:57,455 --> 00:00:59,713 Bài thi leo cầu thang của một lính cứu hỏa 17 00:00:59,713 --> 00:01:02,594 có thể được xác định nhờ so sánh thời gian thực hiện của anh 18 00:01:02,594 --> 00:01:05,604 với thời gian của những lính cứu hỏa khác. 19 00:01:05,604 --> 00:01:09,443 Điều này được thể hiện bởi một thứ được gọi là đường cong hình chuông. 20 00:01:09,443 --> 00:01:13,414 Hoặc bài thi có thể được đánh giá dựa trên những tiêu chí định sẵn, 21 00:01:13,414 --> 00:01:17,004 như mang được một khối lượng nhất định suốt một quãng đường nhất định 22 00:01:17,004 --> 00:01:19,924 qua một số bậc thang nhất định. 23 00:01:19,924 --> 00:01:24,702 Tương tự, một nhà ngoại giao có thể được so sánh với các nhà ngoại giao khác, 24 00:01:24,702 --> 00:01:27,145 hoặc so với một bộ tiêu chí cố định 25 00:01:27,145 --> 00:01:31,054 thể hiện nhiều trình độ thành thạo ngôn ngữ. 26 00:01:31,054 --> 00:01:35,785 Tất cả các kết quả này đều có thể được thể hiện bằng một thứ gọi là bách phân vị. 27 00:01:35,785 --> 00:01:41,774 Nếu một nhà ngoại giao có bách phân vị là 70, có 70% thí sinh thấp điểm hơn cô ấy. 28 00:01:41,774 --> 00:01:47,335 Nếu cô ấy đạt bách phân vị là 30, có 70% thí sinh cao điểm hơn cô ấy. 29 00:01:47,335 --> 00:01:50,746 Dù các kì thi chuẩn hóa đôi lúc vẫn còn gây tranh cãi, 30 00:01:50,746 --> 00:01:52,525 chúng đơn thuần chỉ là công cụ. 31 00:01:52,525 --> 00:01:56,676 Cũng như thử nghiệm tư duy, 1 kỳ thi chuẩn hóa như 1cây thước. 32 00:01:56,676 --> 00:01:59,395 Sự hữu dụng của một cây thước phụ thuộc vào hai yếu tố. 33 00:01:59,395 --> 00:02:02,157 Thứ nhất: Bản chất công việc. 34 00:02:02,157 --> 00:02:04,986 Cây thước không thể đo nhiệt độ ngoài trời 35 00:02:04,986 --> 00:02:07,446 hoặc cường độ âm thanh của giọng hát của một ai đó. 36 00:02:07,446 --> 00:02:10,865 Thứ hai: Thiết kế của công cụ. 37 00:02:10,865 --> 00:02:14,146 Giả sử bạn cần đo chu vi của một quả cam. 38 00:02:14,146 --> 00:02:17,397 Cây thước đo độ dài, vậy là đã đúng đại lượng, 39 00:02:17,397 --> 00:02:22,238 nhưng nó không được thiết kế với độ đàn hồi cần thiết để đo chu vi. 40 00:02:22,238 --> 00:02:25,366 Vì vậy, nếu các bài kiểm tra không tương thích với đối tượng, 41 00:02:25,366 --> 00:02:27,237 hoặc không được thiết kế phù hợp, 42 00:02:27,237 --> 00:02:31,627 kết quả là chúng sẽ đánh giá sai. 43 00:02:31,627 --> 00:02:32,907 Trong trường học, 44 00:02:32,907 --> 00:02:36,678 các học sinh mắc chứng lo lắng thi cử có thể khó thể hiện hết khả năng 45 00:02:36,678 --> 00:02:38,408 trong một bài thi chuẩn hóa. 46 00:02:38,408 --> 00:02:40,116 Họ không phải không biết trả lời, 47 00:02:40,116 --> 00:02:43,735 mà vì họ quá căng thẳng đến nỗi không thể chia sẻ những gì họ đã học. 48 00:02:43,735 --> 00:02:45,418 Các học sinh gặp khó trong việc đọc 49 00:02:45,418 --> 00:02:48,078 có thể bị cách diễn đạt của một bài toán làm rối trí, 50 00:02:48,078 --> 00:02:50,878 nên kết quả thi của họ phản ánh khả năng đọc-viết 51 00:02:50,878 --> 00:02:53,518 hơn là khả năng tính toán. 52 00:02:53,518 --> 00:02:55,578 Những học sinh bỡ ngỡ với các bài thi 53 00:02:55,578 --> 00:02:59,168 trong đó có những hàm ý lạ về văn hóa 54 00:02:59,168 --> 00:03:00,617 có thể làm bài không tốt, 55 00:03:00,617 --> 00:03:03,409 qua đó giúp ta biết mức độ hiểu biết văn hóa của thí sinh 56 00:03:03,409 --> 00:03:05,698 thay vì khả năng học thuật của họ. 57 00:03:05,698 --> 00:03:11,090 Trong những trường hợp này, các bài thi cần được thiết kế theo hướng khác. 58 00:03:11,090 --> 00:03:13,419 Thi cử chuẩn hóa còn gặp khó khăn 59 00:03:13,419 --> 00:03:16,638 trong việc đánh giá những khái niệm hoặc kĩ năng trừu tượng, 60 00:03:16,638 --> 00:03:20,658 như sự sáng tạo, khả năng tư duy phản biện, và khả năng hợp tác. 61 00:03:20,658 --> 00:03:22,378 Nếu ta thiết kế bài thi không đúng, 62 00:03:22,378 --> 00:03:24,300 hoặc sử dụng chúng sai mục đích, 63 00:03:24,300 --> 00:03:26,553 hay không khai thác hết chúng, 64 00:03:26,553 --> 00:03:29,849 kết quả bài thi sẽ không đáng tin hoặc không hợp lí. 65 00:03:29,849 --> 00:03:32,939 Sự tin cậy và sự hợp lí là hai khía cạnh quan trọng 66 00:03:32,939 --> 00:03:35,619 để hiểu được các bài thi chuẩn hóa. 67 00:03:35,619 --> 00:03:37,300 Để hiểu sự khác biệt giữa chúng, 68 00:03:37,300 --> 00:03:40,389 chúng ta có thể lấy hình ảnh ẩn dụ về hai chiếc nhiệt kế hỏng. 69 00:03:40,389 --> 00:03:42,289 Một chiếc nhiệt kế không ổn định 70 00:03:42,289 --> 00:03:45,542 sẽ cho ra kết quả khác nhau sau mỗi lần đo, 71 00:03:45,542 --> 00:03:51,191 còn chiếc nhiệt kế ổn định nhưng không tin cậy sẽ luôn cho kết quả cao hơn 10 độ. 72 00:03:51,191 --> 00:03:55,460 Sự hợp lí còn phụ thuộc vào độ chính xác trong việc thể hiện kết quả. 73 00:03:55,460 --> 00:03:58,771 Nếu kết quả không phản ánh đúng kì thi, 74 00:03:58,771 --> 00:04:01,934 kì thi đó gặp vấn đề về sự hợp lí. 75 00:04:01,934 --> 00:04:06,442 Cũng như chúng ta không thể dùng thước để đo cân nặng của một con voi, 76 00:04:06,442 --> 00:04:08,302 hoặc để xác định nó ăn gì vào bữa sáng, 77 00:04:08,302 --> 00:04:14,181 ta không thể dùng mỗi kiểm tra chuẩn hóa để biết một người thông minh đến đâu, 78 00:04:14,181 --> 00:04:16,323 nhà ngoại giao giải quyết vấn đề ra sao, 79 00:04:16,323 --> 00:04:20,622 hoặc lính cứu hỏa có thể dũng cảm đến đâu. 80 00:04:20,622 --> 00:04:25,412 Thi cử chuẩn hóa sẽ giúp ta biết một chút về nhiều người 81 00:04:25,412 --> 00:04:26,562 trong thời gian ngắn, 82 00:04:26,562 --> 00:04:31,013 nhưng nó không thể giúp ta biết nhiều về một cá nhân. 83 00:04:31,013 --> 00:04:35,732 Các nhà khoa học xã hội e ngại kết quả thi cử sẽ gây ra những thay đổi rõ rệt 84 00:04:35,732 --> 00:04:38,846 và thường là thay đổi tiêu cực đối với các thí sinh, 85 00:04:38,846 --> 00:04:42,388 đôi khi còn đi kèm với những hậu quả kéo dài suốt đời. 86 00:04:42,388 --> 00:04:44,389 Dù vậy, ta không thể đổ lỗi cho thi cử. 87 00:04:44,389 --> 00:04:48,179 Chính chúng ta mới là người cần tiến hành thi cử đúng mục đích, 88 00:04:48,179 --> 00:04:51,063 đồng thời thể hiện kết quả thi cử một cách thỏa đáng.