Onderzoek 2. Najaar 2020.

Eén replicatie ís geen replicatie

Replicatiestudies moeten bijdragen aan waarheidsvinding. Maar herhaalonderzoek lijkt juist vaak verwarring te scheppen. Betekent een failed replication ook meteen dat de originele conclusie onjuist was? ‘Vaak zijn meerdere replicaties nodig en ligt de uitkomst genuanceerd.’

replicatie-01.jpg
Tekst: Gaby van Caulil, beeld: Vincent van Gurp

Voor zijn vondst dat een pen in je mond je doet glimlachen én voor zijn ontdek­king dat dit toch niet zo was, kreeg Fritz Strack dit jaar de Ig Nobelprijs – een parodie op de Nobelprijs – voor Psychologie. De Duitse psycholoog re­ageerde sportief (‘The pen procedure may not be effective to alter moods.’) toen zijn onderzoek uit 1988 niet te repliceren bleek in 2017. Meestal leidt herhaalonderzoek niet tot een duidelijke bevestiging óf verwerping van de oorspronkelijke conclusie. Volgens een Scien­ce-artikel uit 2008 zouden conservatieve men­sen banger zijn. Na een replicatiestudie aan de Universiteit van Amsterdam bleek dat een wel erg vergaande conclusie. Dat het lezen van lite­ratuur je empathischer maakt – in 2013 in Scien­ce – bleek vijf jaar later wel weer mee te vallen. Ook is het nog maar de vraag of je echt langza­mer gaat lopen na het lezen van woorden die te maken hebben met ouderdom.

Vooraf registreren en strengere statistiek

Dat replicaties geen stand houden komt niet door opzettelijk bedrog bij het oorspronkelijke onderzoek, leert een rondgang langs replicatie­deskundigen. Zij zien publicatiebias als belang­rijkste oorzaak. Daardoor komen er te veel studies met een positief resultaat in de weten­schappelijke literatuur terecht.

Als een onderzoeker wil dat een resultaat positief is, dan is hij gevaarlijk bezig

Joost de Winter

Dat is op te los­sen, volgens de Delftse biomechanicus en ‘repli­ceerder’ Joost de Winter. ‘Door het vooraf registreren van onderzoek en een strengere sta­tistiek. Maar cruciaal is de kritische houding van de onderzoeker. Als een onderzoeker wil dat een resultaat positief is, bijvoorbeeld omdat hij of zij daar belang bij heeft, dan is hij gevaarlijk bezig.’

Replicatiecrisis in de psychologie

De wetenschappelijke aandacht voor replicatie is terug te voeren op de zogenaamde replicatie­crisis: in 2015 werden honderd psychologische experimenten herhaald en bij meer dan de helft van de studies werd het oorspronkelijke effect niet aangetoond. In 2016 bleken ook zeven van de achttien economische studies niet repliceer­baar. Herhalen is dus belangrijk – falsificatie is een grondbeginsel in de wetenschap. Toch kwa­men ook bij NWO replicatievoorstellen niet aan de bak, omdat vernieuwing een belangrijk crite­rium is. Bovendien vinden weinig wetenschap­pers het inspirerend om werk van anderen over te doen. Psycholoog Daniel Lakens stelde daar­om voor om replicatie te stimuleren met aparte middelen. In 2016 startte NWO als eerste ter wereld met subsidies uitsluitend voor her­haalonderzoek. Inmiddels draaien zeventien projecten en zijn twee studies afgerond.

Mannelijk naakt: pupil wijder

Hoe lastig het overdoen van een oude studie kan zijn en hoe belangrijk meervoudige replica­tie is, laat Joost de Winter zien. Hij had in 2017 de ambitie om een exacte replicatie uit te voe­ren. ‘Dit leverde meteen een dilemma op, want we wisten dat de originele methode beperkin­gen had.’ In het klassieke experiment uit 1960 concludeerde de Amerikaanse psycholoog Eck­hard Hess dat je emoties kunt afleiden uit de grootte van iemands pupil. Hess liet proefperso­nen verschillende foto’s zien en filmde de pupil. Bij vrouwelijke proefpersonen werd de pupil tot wel twintig procent wijder bij het zien van een baby en bij mannelijk naakt. Een landschap deed de pupillen van vrouwen een paar procent vernauwen. De pupillen van mannen werden bijna twintig procent groter bij het zien van vrouwelijk bloot. Kortom, als je iets ziet dat je interessant vindt, wordt de pupil wijder. Een af­schuwwekkende afbeelding maakt de pupil klei­ner, aldus Hess. Science publiceerde de con-clusie, waarna die 790 maal werd geciteerd. Jaren later schreef Hess dat hij een belang had: hij was consultant voor een reclamebureau dat wilde nagaan of reclames van bijvoorbeeld Coca-Cola aantrekkelijk werden gevonden.

Pupilvernauwing nooit gemeten

Het team van De Winter analyseerde het werk van Hess – 48 dozen met notities en tabellen –, maakte kopieën van de gebruikte foto’s, bestel­de op eBay eenzelfde projector als destijds werd gebruikt en bouwde de houten opstelling na. De resultaten bleken maar ten dele stand te houden. De effecten op de pupildiameter blijken voor een groot deel te wijten aan verschillen in helderheid van de afbeelding. Een methodologi­sche fout dus. De Winter herhaalde het experi­ment met een vernieuwde opzet. ‘We hebben plaatjes getoond met enkel contouren, zodat de lichtintensiteit gelijk blijft. De door Hess be­schreven pupilvernauwing hebben we geen en­kele keer gemeten. Andere resultaten van Hess repliceerden wel. Sterker nog: enkel het tonen van een prikkelend woord als nude leidt al tot pupilverwijding.’ Een ander aspect om rekening mee te houden zijn de zogeheten verborgen moderators die een replicatie kunnen hinderen. De Winter: ‘In ons geval is bijvoorbeeld niet uit te sluiten dat culturele context een rol speelt. Plaatjes die men interessant vond in de jaren zestig zijn mogelijk minder boeiend in 2019. Ook sluit ik niet uit dat de setting een effect heeft, bijvoorbeeld als deelnemers ver­moeden dat de studie over seksuele aantrekkingskracht gaat. Het uitslui­ten van dergelijke verborgen mode­rators vergt weer nieuwe replicaties.’

Reproduceren vanuit artikel

Repliceren is een betrekkelijk jong vak. Maar volgens Nederlands meest ervaren ‘repliceerder’, cognitief psy­choloog Rolf Zwaan, is wel duidelijk dat een failed replication nog niet betekent dat de conclusie van het originele onderzoek onjuist was. Zwaan is lid van de NWO-program­macommissie Replicatiestudies en auteur van Making replication main­stream. ‘Vaak zijn meerdere replica­ties nodig en ligt de uitkomst genu­anceerd. Ook is het moeilijk een studie te reproduceren op basis van de informatie in een artikel. Daarom is het cruciaal dat onderzoekers data beschikbaar maken voor anderen.’ De replicatiespecialisten vinden het nog te vroeg om te concluderen dat repli­catiestudies tot meer robuuste we­tenschap leiden. Daarvoor moeten meer herhaalonderzoeken worden af­gerond. Zwaan vindt wel dat de we­tenschap betrouwbaarder is gewor­den, omdat replicatie verborgen moderators blootlegt. ‘Bij het herhalen van de penstudie van Fritz Strack werd het effect niet gevonden in experimen­ten waarbij proefpersonen gefilmd werden. Mogelijk is het gedrag van mensen anders als ze weten dat ze ge­filmd worden. Dit kun je testen met een experiment waarin je condities met en zonder camera vergelijkt. Dat zou ik vooruitgang noemen. Overigens is zo’n experiment al gedaan, maar niet goed uitge­voerd. Repliceren is ook een vak, zullen we maar zeggen.’

Onderzoek 2019_2_herhaalonderzoek-1.jpg