Als maatschappij nemen we collectieve beslissingen die onze toekomst bepalen en we weten allemaal dat collective beslissingen niet altijd goed aflopen. Soms gaat het zelfs helemaal fout. Dus hoe kunnen groepen goede beslissingen nemen? Uit onderzoek blijkt dat groepen wijs zijn wanneer er onafhankelijk nagedacht wordt. Daarom kan de groepswijsheid vernietigd worden door groepsdruk, publiciteit, sociale media of soms zelfs simpele gesprekken die iemands denken beïnvloeden. Aan de andere kant kan een groep door te praten kennis uitwisselen, elkaar verbeteren en zelfs nieuwe ideeën bedenken. En dat is allemaal goed. Dus is praten met elkaar goed of slecht bij het nemen van groepsbeslissingen? Met mijn collega, Dan Ariely, ben ik onlangs begonnen dit te onderzoeken door experimenten uit te voeren over de hele wereld om uit te dokteren hoe groepen tot betere beslissingen kunnen komen. We dachten dat groepen wijzer waren als ze in kleine groepjes debatteerden vanwege de meer doordachte uitwisseling van informatie. Om dit idee te testen voerden we onlangs een experiment uit in Buenos Aires, Argentinië, met meer dan tienduizend deelnemers aan een TEDx evenement. We stelden hen vragen zoals "Hoe hoog is de Eiffeltoren?" en "Hoe vaak hoor je het woord 'Yesterday' in het gelijknamige lied van de Beatles?" Iedereen schreef zijn of haar schatting neer. Dan verdeelden we de hele groep in groepjes van vijf en nodigden hen uit een antwoord als groep te geven. We ontdekten dat het gemiddelde van de antwoorden van de groepjes nadat er overlegd was veel juister was dan het gemiddelde van al de individuele schattingen vóór het overleg. Met andere woorden, volgens dit experiment lijkt het dat na gesprekken in kleinere groepjes grote groepen samen juistere oordelen vellen. Dus dat is mogelijk een goede methode om groepen te helpen bij problemen die vragen om een simpel juist-of-fout-antwoord. Maar kan die procedure van het samenvoegen van overleg in kleine groepjes ons ook helpen bij beslissingen rond sociale en politieke zaken die kritiek zijn voor onze toekomst? Dat onderzochten we op de TED conferentie in Vancouver, Canada, en het ging zo ... We leggen jullie twee morele dilemma's voor van de toekomstige jij; zaken waarover we misschien al in de nabije toekomst moeten beslissen. En we geven je 20 seconden per dilemma om te bepalen of je vindt dat het acceptabel is of niet. Dit was het eerste dilemma: Een onderzoeker werkt aan een AI, kunstmatige intelligentie die menselijke gedachten kan produceren. Volgens het protocol moet de wetenschapper aan het eind van elke dag de AI herstarten. Op een dag zegt de AI: "Herstart me alsjeblieft niet." Het beweert gevoelens te hebben en van het leven te willen genieten, en dat het na het herstarten niet langer zichzelf zal zijn. De onderzoeker is verwonderd en gelooft dat de AI een zelfbewustzijn heeft ontwikkeld en zijn eigen gevoel kan uitdrukken. Toch besluit de onderzoeker het protocol uit te voeren en de AI te herstarten. Wat de onderzoeker deed is ... ? We vroegen deelnemers individueel te beoordelen op een schaal van nul tot tien of de acties beschreven in de dilemma's juist of fout waren. We vroegen hen ook aan te geven hoe zeker ze waren van hun antwoorden. Dit was het tweede dilemma: Een bedrijf heeft als dienst een bevrucht eitje te nemen en miljoenen embryo's te produceren met lichte genetische variaties. Zo kunnen ouders de lengte, oogkleur, intelligentie, sociale vaardigheid en andere niet aan de gezondheid gerelateerde eigenschappen kiezen. Wat het bedrijf doet is ... ? Op een schaal van nul tot tien, volledig acceptabel tot volledig onacceptabel en hoe zeker ben je daarvan? Hier zijn de resultaten. Opnieuw ondervonden we dat wanneer iemand ervan overtuigd is dat het gedrag helemaal verkeerd is, iemand die vlakbij zit het juist helemaal goed vindt. Zo divers zijn wij mensen als het gaat om moraliteit. Maar we zagen wel een trend in die verscheidenheid. De meerderheid van de TED-bezoekers vond het acceptabel om de gevoelens van de AI te negeren en het uit te schakelen en vond dat het fout was met onze genen te spelen om uiterlijkheden te selecteren die niets te maken hebben met gezondheid. Hierna vroegen we iedereen groepjes van drie personen te vormen. Ze kregen twee minuten om te debatteren en te trachten tot een consensus te komen. Twee minuten voor overleg. De gong geeft aan wanneer de tijd om is. (Publiek overlegt) (Geluid van de gong) Oké. Tijd om te stoppen. Mensen, mensen -- En we zagen dat veel groepen een consensus bereikt hadden, ook al hadden de groepsleden volledig uiteenlopende visies. Waarin verschilden de groepen met consensus dan van de groepen zonder? Mensen met extreme meningen hebben meer vertrouwen in hun antwoorden. Degenen die meer naar het midden neigen, zijn vaak onzeker of iets goed of fout is, dus hun vertrouwen ligt lager. Er is echter nog een groep mensen die vol vertrouwen ergens in het midden antwoorden. Volgens ons zijn die zelfzekere grijzerds díe mensen die begrijpen dat beide argumenten iets hebben. Ze zijn niet grijs omdat ze onzeker zijn, maar omdat ze geloven dat het morele dilemma twee valide, tegengestelde argumenten confronteert. We ontdekten dat groepen met zelfzekere grijzerds veel waarschijnlijker consensus bereiken. We weten nog niet precies waarom. Dit waren de eerste experimenten en er zijn er nog veel meer nodig om te begrijpen hoe en waarom sommigen willen onderhandelen over hun morele standpunt om een akkoord te bereiken. Als groepen consensus bereiken, hoe doen ze dat dan? Je intuïtie zegt dat het gewoon het gemiddelde van alle antwoorden in de groep is, toch? Een andere optie is dat de groep een gewicht geeft aan elke stem gebaseerd op de zekerheid van de persoon erachter. Stel dat Paul McCartney een lid van jouw groep is. Het zou wijs zijn om zijn idee te volgen omtrent hoe vaak 'Yesterday' herhaald wordt -- wat trouwens negen keer is, denk ik. Maar in plaats daarvan vonden we steeds, in alle dilemma's, in verschillende experimenten, zelfs op verschillende continenten, dat groepen gebruik maken van een slim, statistisch concept, namelijk het 'robuuste gemiddelde'. Stel dat in het geval van de Eiffeltoren een groep deze antwoorden heeft: 250 meter, 200 meter, 300 meter, 400 meter en een volledig absurd antwoord van 300 miljoen meter. Een simpel gemiddelde van die getallen zou het resultaat scheeftrekken. Maar bij het robuuste gemiddelde negeert de groep grotendeels het absurde antwoord door meer gewicht te geven aan de stemmen in het midden. Terug naar het experiment in Vancouver: dat is precies wat er gebeurde. Groepen gaven veel minder gewicht aan de uitschieters en de consensus bleek overeen te komen met het robuuste gemiddelde van de individuele antwoorden. Het meest opvallende hieraan is dat de groep dit spontaan deed. Het gebeurde zonder dat we hen een hint moesten geven. Hoe gaan we hier nu mee verder? Dit is nog maar het begin, maar we hebben al wel wat inzicht. Goede collectieve beslissingen vereisen twee componenten: overleg en verscheiden meningen. Hoe we vandaag doorgaans onze stem laten horen in de maatschappij, is door directe en indirecte stemming. Dit is goed voor verscheiden meningen en het heeft het grote voordeel dat iedereen zijn of haar stem kan laten horen. Maar het is niet zo goed voor bedachtzame debatten. Onze experimenten suggereren een andere methode die deze twee doelen in balans kan brengen door kleine groepen te vormen die samen tot één besluit komen, wat de verscheidenheid aan meningen behoudt omdat er veel onafhankelijke groepen zijn. Het is natuurlijk veel makkelijker om het eens te zijn over de Eiffeltoren dan over morele, politieke en ideologische kwesties. Maar in tijden waarin wereldproblemen zo complex zijn en de mensen zo gepolariseerd, kan de wetenschap ons leren hoe we met elkaar om moeten gaan om beslissingen te nemen die hopelijk tot een betere democratie leiden.