Zener-kaarten

De Zener-kaarten werden ontworpen in de vroege jaren 30 van de 20ste eeuw door Karl Zener (1903-1963), een collega van J. B. Rhine, voor gebruik in ESP-experimenten. (Randi, 1995)

Er zijn vijf soorten kaarten: een doorlopende curve die een cirkel vormt, twee rechte lijnen die loodrecht op elkaar staan en kruisen in het midden, drie gegolfde verticale  lijnen die parallel staan ten opzichte van elkaar, vier rechte lijnen die een vierkant vormen, en een vijfpuntige ster. Precies omwille van de duidelijke onderlinge verschillen kan er geen dubbelzinnigheid zijn over de symbolen. Een set Zener-kaarten bevat vijf kaarten van elk symbool. Het is de bedoeling dat ze worden geschud en dat een ontvanger dan probeert de kaarten te raden die een zender telepathisch probeert te versturen. Of een proefpersoon kan ook proberen te raden welk symbool er staat op de volgende kaart die zal worden omgedraaid. Rhine besefte dat deze test geen onderscheid kan maken tussen telepathie en helderziendheid. Het zou immers niet mogelijk zijn om te achterhalen of een ontvanger boodschappen ontving van de zender zelf, of veeleer informatie binnen kreeg onafhankelijk van de zender. Rhine kon natuurlijk onmogelijk weten of de informatie afkomstig was van het onderbewustzijn van de proefpersoon zelf, van buitenaardse wezens uit de Plejaden, van het Akashic record of zelfs van Zeus of de bakker om de hoek. Maar hij was wel zeker dat hij een methode had om toeval uit te sluiten als verklaring voor vermeende overdracht van informatie bij zijn experimenten.

Omdat een set vijfentwintig kaarten bevat en er vijf verschillende symbolen zijn, is de kans één op vijf (of 20%) dat een bepaald symbool bovenaan de stapel ligt, of door een zender wordt bekeken. De kansberekening verandert uiteraard zodra er een kaart uit de set wordt verwijderd. De kans kan alleen identiek blijven als elke gekozen kaart meteen opnieuw aan de set wordt toegevoegd, en die dan grondig wordt geschud voor er een nieuwe selectie gebeurt. Voor de persoon die de kaarten probeert te raden, echter, blijft de kans dat een bepaalde kaart bovenaan de stapel ligt op elk moment één op vijf – tenminste als er met een zender wordt gewerkt en er geen feedback wordt gegeven over de kaarten die al aan de beurt kwamen. Een juiste "gok" wordt een "treffer" genoemd. Scores die significant hoger liggen dan 20% treffers op lange termijn wijzen erop dat er iets anders dan toeval meespeelt. Op korte termijn mogen er af en toe hogere scores worden verwacht door toeval. Concreet: als een proefpersoon negen symbolen correct raadt op vijfentwintig (36%) bij het eenmaal doorlopen van de kaartenset, dat hoeft dat niet noodzakelijk iets bijzonders te betekenen. Als de proefpersoon 36% juist scoort na de set van 25 kaarten 100 maal te hebben doorlopen (in totaal dus 2.500 gokken), dan wijst dat er wel op dat er een andere factor dan toeval een rol speelt. Misschien bent u paranormaal begaafd, misschien zijn er lekken waardoor zintuiglijk waarneembare informatie overgedragen wordt of misschien speelt u vals. (We weten bijvoorbeeld dat sommige van de sets Zener-kaarten die werden gedrukt voor Rhines lab erg dun en lichtdoorlatend waren, zodat proefpersonen door de kaarten heen konden zien naar welk symbool de zender aan het kijken was.)

Rhine was uitermate opgetogen wanneer ze iemand op het spoor kwamen die significant beter scoorde dan 20%. Sommigen presteerden zo fenomenaal (zoals Adam J. Linzmayer, George Zirkle, Sara Ownbey en Hubert E. Pearce, Jr.) dat skeptici ervan uitgaan dat ze bedrog hebben gepleegd. Rhine ontkende dat. Hij dacht dat hij niet kon worden bedrogen en dat zijn testmethodes degelijk waren. Toch waren de beschuldigingen van bedrog voor Rhine een doorn in het oog. Niemand ging ervan uit dat Rhine bedrog pleegde, maar velen dachten dat hij herhaalde malen de dupe was van zijn proefpersonen. Volgens Milbourne Christopher “zijn er ten minste een dozijn manieren waarop een proefpersoon, die vals wou spelen onder de omstandigheden die Rhine beschreef, de onderzoeker om de tuin kon leiden" (Christopher 1970: 24-25). Zodra Rhine overigens zijn methode had bijgestuurd als reactie op de kritiek, was hij niet meer in staat om nog proefpersonen te vinden die even hoog scoorden als zijn eerdere successen (Christopher 1970: 28). Rhine schakelde zelfs een goochelaar in om Pearce te observeren; zijn prestaties zakten naar het niveau dat kan worden verwacht door toeval. Als hij niet werd geobserveerd, scoorde hij significant hoger.

Rhine verloor de moed niet door de kritiek. Hij beweerde in zijn eerste boek (Extra-Sensory Perception, 1934) dat hij meer dan 90.000 pogingen had uitgevoerd en dat het gerechtvaardigd was om te besluiten dat ESP “een echt en aantoonbaar verschijnsel” is. Er werden pogingen ondernomen om deze resultaten te herhalen door onderzoekers van Princeton, Johns Hopkins, Colgate, Southern Methodist en Brown, maar zonder succes. Critici konden in Rhines verslag geen bewijs vinden dat hij even systematisch en zorgvuldig te werk was gegaan als men kan verwachten van een wetenschapper die een dergelijke buitengewone bewering doet. Er was bijvoorbeeld geen bewijs dat Rhine er zich van bewust was hoe belangrijk het is om te bespreken hoe de kaarten worden geschud tijdens de test. Hij leek er zich ook niet van bewust te zijn dat de kans van 1 op 5 (wat de standaard kans is bij een set Zener-kaarten) kan veranderen als de kaarten niet perfect zijn (en dat waren ze niet), niet compleet willekeurig worden aangeboden (en dat werden ze niet) en dat bepaalde reeksen gokken uitgesloten zijn in een universum met slechts 25 entiteiten. Bijvoorbeeld: iemand met voldoende gezond verstand zou geen 6 of meer opeenvolgende keren op een cirkel gokken omdat de set kaarten er maar 5 bevat, maar in een echte willekeurige verdeling van symbolen mag je verwachten dat 6 opeenvolgende keren hetzelfde symbool af en toe voorkomt. Het is wellicht onwaarschijnlijk dat er vaak 4 keer op rij of zelfs 3 keer op rij op hetzelfde symbool werd gegokt, terwijl in een echte willekeurige verdeling van 5 mogelijke symbolen 3 en 4 keer op rij hetzelfde symbool zou voorkomen met een berekenbare frequentie. Als je bovendien in acht neemt dat het om een kleine set gaat, dan kan de echte kans op een juiste gok zelfs significant verschillen van de theoretische kans, die uitgaat van de veronderstelling dat er extreem groot aantal pogingen gebeurt, waarbij elk item telkens exact dezelfde kans heeft om voor te komen. Gokkers "en proefpersonen in ESP-experimenten hebben de neiging om niet twee maal na elkaar dezelfde keuze te maken" (Zusne and Jones 1989: 176) en in proeven met feedback verhoogt dit de kans op treffers zodat de kans veeleer dichter bij 6/25 ligt dan bij 5/25 (Gatlin 1979). In werkelijkheid, in deze situatie waarbij er slechts 25 kaarten moeten worden gememoriseerd, lijkt het zeer waarschijnlijk dat er vaak sprake was van het tellen van de kaarten of vooringenomen keuzes. 

Het is zelfs duidelijk dat Rhine en zijn collega’s geen rekening hielden met het verband tussen theoretische waarschijnlijkheden en echte waarschijnlijkheden. Anderen hadden dit echter wel gedaan. In de jaren 30 van de twintigste eeuw vroeg de goochelaar John Mulholland aan Walter Pitkin van de Columbia University hoe men de kans moest berekenen op twee maal opeenvolgend hetzelfde object bij gebruik van vijf mogelijke objecten. Uiteraard beschikte Mulholland niet over een computer om het vuile werk op te knappen, en daarom drukte hij 200.000 kaarten, de helft rood en de helft blauw, met dus 40.000 van elk van de vijf ESP-symbolen. De kaarten werden mechanisch geschud en gelezen door een machine. Zo verkreeg hij twee lijsten met elk 100.000 willekeurig gekozen symbolen. De ene lijst moest de verdeling van de symbolen door toeval voorstellen en de andere moest het raden van de symbolen door toeval voorstellen. In welke mate kwamen die overeen? Helemaal niet, zo bleek. De vastgestelde overeenkomsten weken af van wat verwacht mocht worden volgens de theoretische kansberekening. Het totale aantal lag 2% onder de wiskundige verwachting. Reeksen van 5 overeenstemmende paren kwamen 25% minder voor en reeksen van 7 kwamen 59% meer voor dan de wiskundige verwachting (Christopher 1970: 27-28). Het gaat er daarbij niet om of dergelijke reeksen typerend zijn in een echte ‘random’ wereld, en evenmin of er zich een of andere eigenaardigheid voordoet bij het schudden van de kaarten door de machine. Het punt is dat Rhine ervan uitging dat de statistische waarschijnlijkheid—die uitgaat van echte willekeur en een heel groot aantal pogingen—zonder verdere beschouwing van toepassing is bij een set van 25 kaarten waarbij niet duidelijk is hoe en hoe vaak ze werden geschud. 

Rhine en alle andere onderzoekers van het paranormale zijn van de veronderstelling uitgegaan dat elke significante afwijking van de wetten van de kansberekening bewijs vormt van iets paranormaals. Paranormale onderzoekers moeten natuurlijk altijd opletten dat er geen bedrog in het spel is, maar ze zouden nog meer moeten opletten met deze veronderstelling. Afgezien van Pitkins onderzoek heeft ook ander onderzoek aangetoond dat zelfs wanneer er geen gebruik wordt gemaakt van proefpersonen, er een significante afwijking is van wat theoretisch kan worden verwacht door toeval (Alcock 1981: 159). Harvie, bijvoorbeeld, “selecteerde 50.000 cijfers uit diverse bronnen van willekeurige getallen en gebruikte ze als “doelkaarten” in een ESP-experiment. In plaats van proefpersonen te laten raden, werd er een reeks van 50.000 willekeurige getallen aangemaakt door een computer.” Het aantal treffers bleek significant lager te zijn dan wat door de werking van het toeval zou worden voorspeld. “Als dergelijke significante variatie kan ontstaan door willekeurige reeksen te vergelijken met andere willekeurige reeksen, dan lijkt de veronderstelling dat elke significante afwijking van het toeval toe te schrijven is aan het paranormale onhoudbaar.” (Alcock 1981: 158-159). 

Een ander voorbeeld waaruit blijkt dat Rhine niet echt vertrouwd was met de finesses van de waarschijnlijkheid is het feit dat wanneer proefpersonen consistent lager dan het toeval scoorden, hij dit niet beschouwde als iets wat kan worden verwacht door de wetten van de kansberekening. Hij beschouwde dit veeleer als het bewijs van een bovennatuurlijk fenomeen. Hij beweerde dat proefpersonen die hem niet mochten fout zouden gokken om hem tegen te werken (Park 2000: 42). Parapsychologen accepteerden deze verklaring als het fenomeen dat ze nu omschrijven als psi-missing

Nog een aanwijzing dat Rhine en zijn collega’s niet echt sterk waren in de toepassing van theoretische statistiek in het echte leven is hun verbazing over het feit dat hoe langer een goed scorende proefpersoon werd getest, hoe meer zijn scores neigden naar het niveau dat door toeval kan worden verwacht. In plaats van dit te beschouwen als normale regressie naar het gemiddelde (na verloop van tijd zouden alle proefpersonen moeten evolueren in de richting van wat door toeval kan worden verwacht als er zich niets paranormaals voordoet), kwamen Rhine en andere parapsychologen op de proppen met een andere verklaring dan regressie: de saaiheid van de tests. Ze hadden er zelfs een naam voor: het afnemend effect.

Rhine bracht in de loop der jaren wel een aantal verbeteringen aan in zijn testmethodes. Hij legde bijvoorbeeld uit dat het een tijd duurde voordat onderzoekers er zich bewust van werden dat er een aantal mogelijkheden tot bedrog voortvloeiden uit het feit dat proefpersonen de kaarten, of de enveloppen die de kaarten bevatten, zelf mochten vasthouden. In de vroegste experimenten werden de onderzoeker en de proefpersoon bovendien alleen maar door een scherm van elkaar gescheiden. Daarna werden ze in aparte kamers gezet of aparte gebouwen om te vermijden dat er kans was op bedrog of ongewilde zintuiglijke signalen. En Rhine was er zich goed van bewust dat er geen onderscheid kon worden gemaakt tussen telepathie en helderziendheid of voorkennis. Als hij een controlemethode zou hebben voorzien, dan zou hij niet hebben kunnen voorkomen dat die controle zou worden gestuurd door ESP of psychokinese van een of andere entiteit in dit of een ander universum.
Rhine slaagde er in elk geval niet in om de wetenschap ervan te overtuigen dat zijn onderzoek sterke bewijzen aandroeg voor het bestaan van ESP, ondanks zijn beweringen dat zijn proefpersonen zorgvuldig waren geobserveerd en dat hij “speciale omstandigheden” had gecreëerd die “elke kans op bedrog compleet uitsloten” (Christopher 1970). Zener-kaarten hebben het misschien wel gemakkelijk gemaakt om de prestaties van een paranormale proefpersoon mathematisch in te schatten in vergelijking met het toeval, maar het is een grove overdrijving om te beweren – zoals Dean Radin doet – dat Rhines “statistische analyse in essentie correct is.” (Radin 1997: 95-96).


Met dank aan Jan Van Haver voor de vertaling van dit artikel.