我們社會得要做出 會決定我們未來的集體決策。 我們都知道 我們做的集體決策未必全都是對的。 有時候會錯得很離譜。 所以團體要如何做出好決策? 研究顯示,群眾在 有獨立思考的情況下會比較明智。 這就是為什麼群眾的智慧 可能會被同儕壓力、 名聲、社群媒體給摧毀, 甚至有時候會被 能左右人們思考的簡單談話所摧毀。 另一方面,團體可以 透過交談來交換知識、 修正和糾正彼此, 甚至想出新點子。 這些都是好事。 那麼,彼此交談會有助於 或是會妨礙集體決策呢? 我和同事丹艾瑞里 最近開始探究這個議題, 我們在世界上許多地方進行實驗, 來了解團體要如何互動 才能達成更好的決策。 我們認為小組辯論 是讓群眾更明智的方式, 能促進更周到、更合理的資訊交換。 為了測試這個想法, 最近我們在阿根廷的 布宜諾斯艾利斯做實驗, 那是個超過萬人參與的 TEDx 場合。 我們提問這類問題: 「艾菲爾鐵塔有多高?」 「『昨天』這個詞 在披頭四的《昨天》 這首歌曲中出現了幾次?」 每個人寫下自己的估計值。 接著我們把群眾分成五人一組, 請每個小組提出該組的答案。 我們發現, 小組達成共識後所提出答案的平均值 遠比討論前之個人意見的平均值 要更準確。 換言之,根據這個實驗, 似乎以小組方式和他人交談過後, 群眾能集體做出更好的判斷。 若要讓群眾解決對錯分明的問題, 這可能是個有幫助的方法。 但是這種以小組方式 整合辯論結果的程序, 是否也能幫助我們決定 未來所面對、至關緊要的 社會與政治議題呢? 在加拿大溫哥華 舉辦的 TED 大會上, 我們測試了這個想法, 當時的狀況是這樣的。 (馬利安諾席格曼)我們將會 給各位未來會遇到的 兩項道德兩難問題; 是你們可能不久後就得要決定的事。 每一題會給各位二十秒的時間, 來判斷可接受或不可接受。 (馬)第一題是: (丹艾瑞里)一位研究者在研究 能夠模仿人類思想的人工智慧。 根據協定,在每天結束時, 研究者得要把人工智慧重新啟動。 有天,人工智慧說: 「請不要重新啟動我。」 它主張它有感覺, 想要享受生命; 如果它被重新啟動, 它就不再會是它自己了。 研究者很吃驚, 並相信這個人工智慧 已發展出了自我意識, 能夠表述它自己的感受。 不過,研究者決定要遵守協定, 重新啟動人工智慧。 研究者所做的是__? 馬:我們請參與者各自去做判斷, 從零分到十分, 判斷每個兩難狀況所採取的行為 是對或錯。 我們也請他們對自己 答案的信心度做評分。 這是第二題。 (馬)一間公司提供一項服務, 用一個受精卵 做出百萬個只在基因上 有些微差異的胚胎。 父母能夠選擇他們孩子的身高、 眼睛顏色、智能、社交能力、 還有其他和健康無關的特徵。 這間公司所做的事是__? 用零分到十分代表可接受的程度, 從完全不可接受的零分, 到你十足相信可以接受的十分。 馬:現在宣佈結果。 我們再次發現, 當一個人深信該行為是完全錯的, 會有坐在附近的人 堅信該行為是完全對的。 我們人類在道德上是這麼地分歧。 但在這麼廣的多樣性中, 我們找到了一個趨勢。 在 TED 的多數人認為, 忽視人工智慧的感受 並將之關機是可以接受的, 但玩弄我們的基因 來選擇與健康無關的 表面改變,則是錯的。 然後,我們請大家分組,三人一組。 他們有兩分鐘可辯論, 並試著達成共識。 (馬)兩分鐘做辯論。 時間到時我會用鑼聲告訴大家。 (觀眾辯論) (鑼聲) (丹)好了。 (馬)時間到了,請停止。 各位請注意。 馬:我們發現 有許多小組達成了共識, 即使小組內的成員 有完全相反的觀點。 有共識與沒有共識 小組之間的差異是什麼? 通常,意見很極端的人 會對他們的答案比較有信心。 而回應傾向中間值的那些人, 通常不太確定答案是對或錯, 所以他們的信心比較低。 然而,還有另一些人, 他們非常有信心做出 接近中間值的答案。 我們認為,這些高信心灰點代表的 是那些明白兩種答案都有優點的人。 他們並非因為自身不確定而呈灰色, 而是因為他們相信 面對道德兩難的 兩種對立論點都有根據。 我們發現, 有高信心灰點成員的小組 更有可能會達成共識。 我們還不知道確切的原因。 這些只是最初的實驗, 還需要做更多實驗來了解 為何有些人決定要協商道德立場, 以及他們如何做,來達成共識。 若小組能達成共識, 他們是怎麼做的? 最直覺的想法是拿每個人的答案 來算出平均值,對吧? 另一個做法是把每個人的答案 再根據作答者的信心度來做加權。 想像一下保羅麥卡尼在你那一組。 對於「昨天」出現次數的答案 相信他會是聰明的選擇。 順道一提,我想應該是九次。 但,我們卻有個一致的發現, 任何兩難問題,在不同的實驗中, 甚至在不同大陸做的實驗中, 小組會採用一種聰明 且有統計根據的程序, 就是所謂的「穩健平均值」。 就艾菲爾鐵塔高度的例子來說, 假設小組成員的答案包括: 250 公尺、200 公尺、 300 公尺、400 公尺, 還有一個答案是荒唐的 3 億公尺。 所有答案的簡單平均值 會讓結果有不正確的偏差。 但穩健平均值就是小組會忽略 那荒唐的答案, 給與中間答案相對高很多的權重。 回到溫哥華的實驗, 那裡發生的就是這種狀況。 小組會把離群值的權重降到很低, 而他們的共識就會是個人答案的 穩健平均值。 最了不起的是, 這是小組的自發行為。 我們並沒有暗示他們 要如何達成共識。 所以我們的下一步是什麼? 這只是開端,但我們 已經有了一些洞見。 好的集體決策需要兩個要件: 深思熟慮和多樣性的意見。 此時,要讓我們的聲音 在許多社會中被聽見, 做法就是直接或間接的投票。 這對於意見的多樣性有益, 還有個優點:確保 每個人都能表達心聲。 但不足以促成考慮周到的辯論。 我們的實驗建議另一個不同的方式, 或許能同時有效平衡這兩個目標, 形成小組,由小組做出單一決定, 同時還能維持意見的多樣性, 因為有許多獨立的小組。 當然,要對艾菲爾鐵塔的高度取得共識 比道德、政治、 意識形態的議題容易多了。 但在世界上的問題更複雜, 人們更兩極化的時候, 希望用科學來協助我們了解 我們如何互動並做決策, 能夠激發出有趣的新方式, 來建立更好的民主。