Als maatschappij nemen we
collectieve beslissingen
die onze toekomst bepalen
en we weten allemaal
dat collective beslissingen
niet altijd goed aflopen.
Soms gaat het zelfs helemaal fout.
Dus hoe kunnen groepen
goede beslissingen nemen?
Uit onderzoek blijkt dat groepen wijs zijn
wanneer er onafhankelijk nagedacht wordt.
Daarom kan de groepswijsheid
vernietigd worden door groepsdruk,
publiciteit, sociale media
of soms zelfs simpele gesprekken
die iemands denken beïnvloeden.
Aan de andere kant kan een groep
door te praten kennis uitwisselen,
elkaar verbeteren
en zelfs nieuwe ideeën bedenken.
En dat is allemaal goed.
Dus is praten met elkaar goed of slecht
bij het nemen van groepsbeslissingen?
Met mijn collega, Dan Ariely,
ben ik onlangs begonnen dit te onderzoeken
door experimenten uit te voeren
over de hele wereld
om uit te dokteren hoe groepen
tot betere beslissingen kunnen komen.
We dachten dat groepen wijzer waren
als ze in kleine groepjes debatteerden
vanwege de meer doordachte
uitwisseling van informatie.
Om dit idee te testen
voerden we onlangs een experiment uit
in Buenos Aires, Argentinië,
met meer dan tienduizend deelnemers
aan een TEDx evenement.
We stelden hen vragen zoals
"Hoe hoog is de Eiffeltoren?"
en "Hoe vaak hoor je het woord 'Yesterday'
in het gelijknamige lied van de Beatles?"
Iedereen schreef
zijn of haar schatting neer.
Dan verdeelden we de hele groep
in groepjes van vijf
en nodigden hen uit
een antwoord als groep te geven.
We ontdekten dat het gemiddelde
van de antwoorden van de groepjes
nadat er overlegd was
veel juister was dan het gemiddelde
van al de individuele schattingen
vóór het overleg.
Met andere woorden, volgens dit experiment
lijkt het dat na gesprekken
in kleinere groepjes
grote groepen samen
juistere oordelen vellen.
Dus dat is mogelijk een goede methode
om groepen te helpen bij problemen
die vragen om een simpel
juist-of-fout-antwoord.
Maar kan die procedure van het samenvoegen
van overleg in kleine groepjes
ons ook helpen bij beslissingen
rond sociale en politieke zaken
die kritiek zijn voor onze toekomst?
Dat onderzochten we op de TED conferentie
in Vancouver, Canada,
en het ging zo ...
We leggen jullie
twee morele dilemma's voor
van de toekomstige jij;
zaken waarover we misschien al
in de nabije toekomst moeten beslissen.
En we geven je 20 seconden per dilemma
om te bepalen of je vindt
dat het acceptabel is of niet.
Dit was het eerste dilemma:
Een onderzoeker werkt aan een AI,
kunstmatige intelligentie
die menselijke gedachten kan produceren.
Volgens het protocol moet de wetenschapper
aan het eind van elke dag
de AI herstarten.
Op een dag zegt de AI:
"Herstart me alsjeblieft niet."
Het beweert gevoelens te hebben
en van het leven te willen genieten,
en dat het na het herstarten
niet langer zichzelf zal zijn.
De onderzoeker is verwonderd
en gelooft dat de AI
een zelfbewustzijn heeft ontwikkeld
en zijn eigen gevoel kan uitdrukken.
Toch besluit de onderzoeker
het protocol uit te voeren
en de AI te herstarten.
Wat de onderzoeker deed is ... ?
We vroegen deelnemers
individueel te beoordelen
op een schaal van nul tot tien
of de acties beschreven in de dilemma's
juist of fout waren.
We vroegen hen ook aan te geven
hoe zeker ze waren van hun antwoorden.
Dit was het tweede dilemma:
Een bedrijf heeft als dienst
een bevrucht eitje te nemen
en miljoenen embryo's te produceren
met lichte genetische variaties.
Zo kunnen ouders de lengte, oogkleur,
intelligentie, sociale vaardigheid
en andere niet aan de gezondheid
gerelateerde eigenschappen kiezen.
Wat het bedrijf doet is ... ?
Op een schaal van nul tot tien,
volledig acceptabel
tot volledig onacceptabel
en hoe zeker ben je daarvan?
Hier zijn de resultaten.
Opnieuw ondervonden we
dat wanneer iemand ervan overtuigd is
dat het gedrag helemaal verkeerd is,
iemand die vlakbij zit
het juist helemaal goed vindt.
Zo divers zijn wij mensen
als het gaat om moraliteit.
Maar we zagen wel een trend
in die verscheidenheid.
De meerderheid van de TED-bezoekers
vond het acceptabel
om de gevoelens van de AI te negeren
en het uit te schakelen
en vond dat het fout was
met onze genen te spelen
om uiterlijkheden te selecteren
die niets te maken hebben met gezondheid.
Hierna vroegen we iedereen
groepjes van drie personen te vormen.
Ze kregen twee minuten om te debatteren
en te trachten tot een consensus te komen.
Twee minuten voor overleg.
De gong geeft aan wanneer de tijd om is.
(Publiek overlegt)
(Geluid van de gong)
Oké.
Tijd om te stoppen.
Mensen, mensen --
En we zagen dat veel groepen
een consensus bereikt hadden,
ook al hadden de groepsleden
volledig uiteenlopende visies.
Waarin verschilden de groepen
met consensus dan
van de groepen zonder?
Mensen met extreme meningen
hebben meer vertrouwen
in hun antwoorden.
Degenen die meer naar het midden neigen,
zijn vaak onzeker of iets goed of fout is,
dus hun vertrouwen ligt lager.
Er is echter nog een groep mensen
die vol vertrouwen
ergens in het midden antwoorden.
Volgens ons zijn die
zelfzekere grijzerds díe mensen
die begrijpen dat beide
argumenten iets hebben.
Ze zijn niet grijs omdat ze onzeker zijn,
maar omdat ze geloven
dat het morele dilemma
twee valide, tegengestelde
argumenten confronteert.
We ontdekten dat groepen
met zelfzekere grijzerds
veel waarschijnlijker consensus bereiken.
We weten nog niet precies waarom.
Dit waren de eerste experimenten
en er zijn er nog veel meer nodig
om te begrijpen hoe en waarom
sommigen willen onderhandelen
over hun morele standpunt
om een akkoord te bereiken.
Als groepen consensus bereiken,
hoe doen ze dat dan?
Je intuïtie zegt
dat het gewoon het gemiddelde
van alle antwoorden in de groep is, toch?
Een andere optie is dat de groep
een gewicht geeft aan elke stem
gebaseerd op de zekerheid
van de persoon erachter.
Stel dat Paul McCartney
een lid van jouw groep is.
Het zou wijs zijn om zijn idee te volgen
omtrent hoe vaak
'Yesterday' herhaald wordt --
wat trouwens negen keer is, denk ik.
Maar in plaats daarvan vonden we steeds,
in alle dilemma's,
in verschillende experimenten,
zelfs op verschillende continenten,
dat groepen gebruik maken
van een slim, statistisch concept,
namelijk het 'robuuste gemiddelde'.
Stel dat in het geval van de Eiffeltoren
een groep deze antwoorden heeft:
250 meter, 200 meter, 300 meter, 400 meter
en een volledig absurd antwoord
van 300 miljoen meter.
Een simpel gemiddelde van die getallen
zou het resultaat scheeftrekken.
Maar bij het robuuste gemiddelde
negeert de groep grotendeels
het absurde antwoord
door meer gewicht te geven
aan de stemmen in het midden.
Terug naar het experiment in Vancouver:
dat is precies wat er gebeurde.
Groepen gaven veel minder gewicht
aan de uitschieters
en de consensus bleek overeen te komen
met het robuuste gemiddelde
van de individuele antwoorden.
Het meest opvallende hieraan
is dat de groep dit spontaan deed.
Het gebeurde zonder
dat we hen een hint moesten geven.
Hoe gaan we hier nu mee verder?
Dit is nog maar het begin,
maar we hebben al wel wat inzicht.
Goede collectieve beslissingen
vereisen twee componenten:
overleg en verscheiden meningen.
Hoe we vandaag doorgaans onze stem
laten horen in de maatschappij,
is door directe en indirecte stemming.
Dit is goed voor verscheiden meningen
en het heeft het grote voordeel
dat iedereen zijn of haar stem
kan laten horen.
Maar het is niet zo goed
voor bedachtzame debatten.
Onze experimenten suggereren
een andere methode
die deze twee doelen in balans kan brengen
door kleine groepen te vormen
die samen tot één besluit komen,
wat de verscheidenheid
aan meningen behoudt
omdat er veel onafhankelijke groepen zijn.
Het is natuurlijk veel makkelijker
om het eens te zijn over de Eiffeltoren
dan over morele, politieke
en ideologische kwesties.
Maar in tijden waarin
wereldproblemen zo complex zijn
en de mensen zo gepolariseerd,
kan de wetenschap ons leren
hoe we met elkaar om moeten gaan
om beslissingen te nemen die hopelijk
tot een betere democratie leiden.