Return to Video

我們應否摒棄標準測驗?- 阿洛·肯普夫

  • 0:09 - 0:12
    我們所知的第一個標準測驗
  • 0:12 - 0:18
    是在 2000 年前
    時值漢朝的中國
  • 0:18 - 0:23
    中國官員透過測驗決定應試者
    是否勝任各類政府職務
  • 0:23 - 0:26
    考試範圍包括哲學
  • 0:26 - 0:27
    農耕
  • 0:27 - 0:29
    甚至軍事謀略
  • 0:29 - 0:34
    往後二千年,
    標準測驗在世界各地繼續沿用
  • 0:34 - 0:36
    今天,測驗用於各種事情
  • 0:36 - 0:40
    由法國評估消防員爬樓梯的能力
  • 0:40 - 0:43
    以至加拿大外交官的語言考試
  • 0:43 - 0:46
    乃至學校學生
  • 0:46 - 0:52
    有些標準測驗按其他人的成績來評量分數
  • 0:52 - 0:57
    另一些按預設標準來評量表現
  • 0:57 - 1:00
    因此消防員爬樓梯的能力
  • 1:00 - 1:06
    能按其他消防員
    爬樓梯需要的時間來評量
  • 1:06 - 1:09
    這可用鐘形曲線來表示
  • 1:09 - 1:13
    或按預設標準來評量
  • 1:13 - 1:17
    例如攜帶相當重量行走特定距離
  • 1:17 - 1:20
    並爬上特定數量的梯級
  • 1:20 - 1:25
    同理,外交官可按
    其他應試外交官的表現來評量
  • 1:25 - 1:27
    或按預設標準
  • 1:27 - 1:31
    來顯示應試者精通語言的程度
  • 1:31 - 1:36
    而這些結果可用百分位數來表達
  • 1:36 - 1:42
    若外交官在第 70 百分位數,
    70% 應試者的分數低於她
  • 1:42 - 1:47
    若得分在第 30 百分位數,
    70% 應試者的分數高於她
  • 1:47 - 1:51
    雖然標準測驗有時備受爭議
  • 1:51 - 1:53
    但它們其實只是工具
  • 1:53 - 1:57
    試作思想實驗:標準測驗是把直尺
  • 1:57 - 1:59
    直尺是否有用視乎兩件事
  • 1:59 - 2:02
    第一,我們將它應用在甚麼工作
  • 2:02 - 2:05
    我們的直尺不能量度室外温度
  • 2:05 - 2:07
    或某人唱歌的聲調高低
  • 2:07 - 2:11
    第二,直尺是否合用視乎其設計
  • 2:11 - 2:14
    譬如你需要量度一個柳橙的圓周
  • 2:14 - 2:17
    雖然圓周是長度,
    而我們的直尺能量度長度
  • 2:17 - 2:22
    但它的設計未能有彈性量度曲線
  • 2:22 - 2:25
    所以,如果標準測驗錯配工作
  • 2:25 - 2:27
    或設計不善
  • 2:27 - 2:32
    最後可能會量度錯誤
  • 2:32 - 2:33
    以學校為例
  • 2:33 - 2:38
    對測驗感到焦慮的學生
    或在測驗中難有最佳表現
  • 2:38 - 2:40
    不是因為他們不懂得回答問題
  • 2:40 - 2:44
    而是因為太緊張以致無法呈現成果
  • 2:44 - 2:45
    有閱讀困難的學生
  • 2:45 - 2:48
    也許難於明白數學題的文句
  • 2:48 - 2:51
    因此他們的測驗成績
    或較能反映他們閱讀文字的能力
  • 2:51 - 2:54
    而非算術能力
  • 2:54 - 2:59
    一些學生礙於文化隔閡,
    未能明白測驗中的例子
  • 2:59 - 3:01
    可能表現欠佳
  • 3:01 - 3:03
    這些測驗較能得知
    應試者的文化熟悉度
  • 3:03 - 3:06
    而非他們的學術知識
  • 3:06 - 3:10
    這些例子中,測驗或需要更改設計
  • 3:11 - 3:13
    標準測驗也難於
  • 3:13 - 3:17
    量度抽象的性格或技能
  • 3:17 - 3:21
    例如創意、批判思考和合作能力
  • 3:21 - 3:22
    如果測驗設計不良
  • 3:22 - 3:24
    或用之不當
  • 3:24 - 3:27
    或用之不善
  • 3:27 - 3:30
    結果可能會不可靠或無效
  • 3:30 - 3:33
    可靠性和有效性是兩個重要概念
  • 3:33 - 3:36
    來理解標準測驗
  • 3:36 - 3:37
    要理解兩者的差異
  • 3:37 - 3:40
    我們能夠用兩支壞的温度計作比喻
  • 3:40 - 3:42
    一支不可靠的温度計
  • 3:42 - 3:46
    每次你測量自己體温時,
    都的到不同的讀數
  • 3:46 - 3:51
    另一支是可靠但不準確的温度計
    總是比正確温度高出十度
  • 3:51 - 3:55
    有效性也在於恰當解讀結果
  • 3:55 - 3:59
    如果分析不符合測驗結果
  • 3:59 - 4:02
    該測驗的有效性就會成疑
  • 4:02 - 4:06
    正如我們不會
    以直尺量度大象的重量
  • 4:06 - 4:08
    或問直尺大象吃了甚麼早餐
  • 4:08 - 4:11
    我們不能認為單靠標準測驗
  • 4:11 - 4:14
    便可知某人有多聰明
  • 4:14 - 4:16
    外交官有多能應對困難情況
  • 4:16 - 4:21
    或消防員將會有多勇敢
  • 4:21 - 4:27
    因此標準測驗或能助我們
    短時間內簡略了解很多人
  • 4:27 - 4:31
    但我們通常不能
    從中詳細知道一個人
  • 4:31 - 4:36
    很多社會科學家擔心測驗分數籠統
  • 4:36 - 4:39
    並經常為應試者帶來負面影響
  • 4:39 - 4:42
    有時影響一生
  • 4:42 - 4:44
    但是,我們不能錯怪測驗
  • 4:44 - 4:48
    而是在於我們是否用得其所
  • 4:48 - 4:51
    並合理分析結果
Title:
我們應否摒棄標準測驗?- 阿洛·肯普夫
Description:

免費下載有聲書,支持 TED-Ed 的非營利使命: http://www.audible.com/teded

觀看完整課堂:https://ed.ted.com/lessons/should-we-get-rid-of-standardized-testing-arlo-kempf

雖然標準測驗是現今教育討論中的熱門話題,但這量度方法已被沿用二千年。標準測驗的結果能夠幫助我們理解一些事情,但如果被誤用,它們也可以誤導我們。那麼這些測驗實際上量度了甚麼?它們是否有價值?阿洛·肯普夫一探究竟。

課堂內容:阿洛·肯普夫
動畫創作:CUB 動畫

謝謝贊助人的支持!沒有你們,此影片不能成事。
Silas Schwarz, Fabio Peters, MJ Tan Mingjie, Yansong Li, Jason A Saslow, Michael Aquilina, Joanne Luce, Ayaan Heban, Henry Li, Elias Wewel, Nina, Bijan Bayat Mokhtari, Kyle Nguyen, Taylor Hunter, Noa Shore, Lex Azevedo, Merit Gamertsfelder, Bev Millar, John Christian S. Ramos, Rishi Pasham, Jhuval.

瀏覽我們的 Patreon 頁面:https://www.patreon.com/teded

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
05:41

Chinese, Traditional subtitles

Revisions