1905 年,心理學家
阿爾弗雷德·比奈和西奧多·西蒙
在法國設計了一個測驗,
對象是學校裡表現不佳的孩子。
測驗的目的是要判斷
哪些孩子需要個別化的關注,
他們的方法成了智力測驗的基礎。
從十九世紀末開始,
研究者便假設認知能力,
如語文推理、
工作記憶,和視覺空間技能,
能反映出能力背後的一般智能,
或普通因素(G 因素)。
西蒙和比奈設計了一系列測驗
來測量上述每一種能力,
並將結果整合成單一個分數。
題目會根據不同年齡層來調整,
孩子的分數反映出相對於
他們這個年齡層的表現如何。
把受測者的分數除以他們的年齡,
再把得到的數字乘以一百,
就是他們的智力商數,
或智商(IQ)。
現今,一百分代表
樣本母體的平均水平,
68% 的人分數落在
八十五分到一百分之間。
西蒙和比奈認為,
這測驗中評估的那些技能
會反映出一般智能。
但,當時和現在,
都沒有任何一個一般智能的定義
是大家都能認同的。
因此就開了一扇門,
讓使用這項測驗的人
可以套用他們自己對於
智力的先入為主假設。
測驗的目的,一開始只是
要找出需要學術協助的人,
很快卻被拿來
以其他方式將人做分類,
通常被有缺陷的意識型態所利用。
最早期的大規模應用之一
發生在一次大戰時期的美國,
當時的軍隊使用智力測驗
將招募的新兵分類
並針對軍官訓練做篩選。
在當時,有很多人相信優生學,
他們的想法是,
想要和不想要的基因特性
可以/應該透過
精選育種的方式來控制。
這種想法有許多問題,
其中一個問題是認為智力
不僅是固定不變且天生的,
還和種族有關聯。
在優生學的影響下,
科學家根據這項軍方計畫的結果,
做出錯誤的聲明,宣稱某些種族
在智力上比其他種族更優越。
他們並沒有考慮到,
許多受測新兵是美國的新移民,
新移民沒受過正式教育,
或很少接觸英語,
他們就這樣直接建立了
一個錯誤的人種智力階層。
優生學和智力測驗的結合
不僅影響到科學,也影響到政策。
1924 年,維吉尼亞州
制定了一項政策,
允許對智商分數低的人
進行強制絕育——
美國最高法庭還支持這項決策。
在納粹德國,
政府授權謀殺智商低的孩童。
在大屠殺和民權運動之後,
智力測驗在歧視上的應用
受到道德和科學領域的挑戰。
科學家開始收集證據,
證明環境對智力的影響。
比如,在二十世紀時,
定期重新校調智力測驗,
新世代做舊測驗時得到的分數
一直都會比前一個世代更高。
這個現象就是
一般所知的弗林效應,
它發生得太快了,不可能
是由先天演化特性所造成,
成因反而比較有可能是環境——
改善的教育、較佳的健康照護,
以及更好的營養。
在二十世紀中期,
心理學家也嘗試把智力測驗
用在評估一般智能以外的地方,
特別是思覺失調(精神分裂)症、
憂鬱症,及其他精神病。
這些診斷有部分要仰賴
評估者的臨床判斷,
並使用判斷智力測驗的一部分——
後來研究發現,這種做法並不能
產生出在臨床上有用的資訊。
現今,智力測驗採用了許多
和早期測驗類似的
設計元素和問題類型,
不過我們有比較好的技術,
可辨視出測驗中可能的偏見。
智力測驗已經不再
被用來診斷精神病,
但像這樣只採用部分測驗
來計分的不當做法
在診斷學習障礙時偶爾還會看到,
違反了許多專家的建議。
世界各地的心理學家
仍然會用智力測驗
來找出智能障礙,
結果可以被用來判定
何種教育支持、工作訓練,
及輔助式生活會比較適合。
智力測驗結果曾被作為正當理由,
用於駭人政策
和無科學根據的意識型態。
那並不表示測驗本身毫無價值——
事實上,它原本的目的是要
測量推理和解決問題的技能,
而在這方面它很成功。
但這和測量人的潛能是兩回事。
雖然智力測驗中包裝了許多複雜的
政治、歷史、科學、文化議題,
仍然有越來越多
研究者認同這一點,
並排拒用單一分數數字
來將個人分類的想法。