Een onderzoek met controlegroep gebruikt een controlegroep om die te vergelijken met een experimentele groep in een test van een oorzakelijke hypothese. De controle- en experimentele groepen moeten op alle relevante manieren identiek zijn, met uitzondering van de invoering van een vermoedelijk oorzakelijke agens in de experimentele groep. Indien de vermoedelijke oorzakelijke agens inderdaad een oorzakelijke factor is, dan zegt de logica dat het gevolg sterker moet voorkomen in de experimentele groep dan in de controlegroep. Bijvoorbeeld, indien 'C' de oorzaak is van 'E', en we voeren 'C' toe aan de experimentele groep maar niet in de controlegroep, dan moeten we 'E' significant vaker terugvinden in de experimentele groep dan in de controlegroep. Wat significant is, wordt beoordeeld aan de hand van het toeval: als een gevolg waarschijnlijk niet aan toeval te wijten is, dan is het gevolg significant aanwezig.

Een dubbelblinde test is een controlegroeptest waarbij noch de onderzoeker, noch de patiënt weet wat precies wordt gecontroleerd. Een willekeurige gemaakte test is een test dat willekeurig onderdelen toevoegt aan de controle- en experimentele groepen.

Met controles, dubbelblinde en willekeurig gemaakte testen wil men fouten, zelfbedrog en voorkeur beperken. Een voorbeeld verduidelijkt waarom deze maatregelen nodig zijn.

De DKL LifeGuard Model 2 van DielectroKinetic Laboratories kan volgens de ontwerpers een menselijk wezen waarnemen door het signaal van de hartslag tot op 20 meter door om het even welke stof te ontvangen. Sandia Labs testte het toestel met een dubbelblinde, willekeurig gemaakte testmethode. Sandia is een nationaal veiligheidslaboratorium dat voor het Amerikaanse ministerie van energie door de Sandia Corporation, een onderdeel van Lockheed Martin Co, wordt beheerd. De oorzakelijke hypothese die zij testten kan als volgt worden omschreven: de menselijke hartslag veroorzaakt een gericht signaal dat in de Lifeguard wordt geactiveerd en waardoor de gebruiker van de Lifeguard in staat is om een verborgen mens (het doel) tot op een afstand van 20 meter te vinden, ongeacht welke voorwerpen zich tussen de LifeGuard en het doel bevinden.

De testprocedure was heel eenvoudig: vijf grote plastieken vaten stonden op een lijn op tien meter van elkaar. De testbediener probeerde met de DKL LifeGuard Model 2 waar te nemen in welke van de vijf vaten een mens verborgen zat. Of een vat leeg was of een persoon bevatte werd bij elke test door willekeur bepaald zodat de bediener niet een bepaalde patroon kon vinden. Hun testen toonden aan dat het toestel het niet beter deed dan iemand die louter gokte. De testbediener was een afgevaardigde van DKL. De enige maal de testbediener er wel in slaagde om de doelen waar te nemen, was wanneer hij vooraf wist waar de doelen zouden zitten. LifeGuard slaagde er tien keer op tien in toen de bediener wist waar het doel zich bevond. Het kan belachelijk lijken om het toestel te testen door de bediener te vertellen waar de personen zich bevinden, maar dit bevestigt dat het toestel werkt. Enkel wanneer de bediener ervan overtuigd is dat zijn toestel werkt, kan naar de tweede fase van de test, de dubbelblinde test, worden overgegaan. Immers, als de bediener op voorhand akkoord is dat het toestel goed werkt, dan kan hij het falen in de dubbelblinde test niet verklaren met een ad hoc hypothese.

Indien het toestel werkt zoals beweerd, dan zou de bediener geen signalen mogen hebben ontvangen vanuit de lege vaten maar wel van de vaten met mensen in. Bij de belangrijkste test van de LifeGuard, waarbij zowel de testbediener als de onderzoeker geen weet hebben van het resultaat van het toestel, scoorde de bediener slecht (zes op 25) en duurde het ongeveer vier keer langer dan wanneer de bediener de locatie van het doel kende. Als het toestel een menselijke hartslag kan waarnemen, dan zou men toch een beter resultaat verwachten dan 6 op 25, wat het resultaat is dat bij gokken zou verkregen worden.

Het verschil in resultaat--10 op 10 versus 6 op 25 --toont duidelijk aan dat het nodig is om de proefpersoon blind te houden: het voorkomt zelfbedrog en subjectieve validatie. De onderzoeker wordt ook blind gehouden om te voorkomen dat hij of zij op subtiele manier bewust of onbewust de proefpersoon zou inlichten. Als de onderzoeker weet welke vaten leeg zijn en welke mensen bevatten, dan kan hij of zij een visueel signaal geven door enkel naar de vaten te kijken waar mensen in zitten. Om dus bedrog of voorkeur tegen te gaan, wordt de onderzoeker niet ingelicht.

Het gebrek aan onderzoek in beheerste omstandigheden verklaart waarom vele paranormaal begaafden, grafologen, astrologen, wichelroedelopers, New Age-therapeuten en dergelijke geloven in hun krachten. Om een wichelroedeloper te testen, volstaat het niet dat de wichelroedeloper en zijn vrienden jou vertellen dat het werkt door te wijzen op alle bronnen die werden uitgegraven op advies van de wichelroedeloper. Wat nodig is, is een willekeurig gemaakte, dubbelblinde test, zoals die van Amerikaans professor psychologie Ray Hyman bij een ervaren wichelroedeloper op het PBS-programma Frontiers of Science (Nov. 19, 1997). De wichelroedeloper verklaarde dat hij begraven metalen voorwerpen kon vinden, evenals water. Hij ging akkoord met een test waarbij willekeurig gekozen getallen overeenkwamen met emmers die ondersteboven op een veld werden geplaatst. De nummers bepaalden onder welke emmers een metalen voorwerp zou worden geplaatst. De persoon die de voorwerpen plaatste was niet dezelfde als diegene die de wichelroede begeleidde toen deze de voorwerpen trachtte te vinden. De kans om per toeval een metalen voorwerp te vinden kon worden berekend. Bijvoorbeeld, als er 100 emmers zijn waarvan er tien een metalen voorwerp bevatten, dan zou men volgens de kansberekening 10% juist kunnen hebben. Uiteraard zou een resultaat van 10%, gespreid over heel veel pogingen, een normaal resultaat zijn voor iedereen, met of zonder wichelroede. Anderzijds, als iemand herhaaldelijk 80% of 90% haalt, en we zeker zijn dat hij of zij geen bedrog pleegt, dan zou dit de gaven van de wichelroedeloper bevestigen.

De wichelroedeloper wandelde tussen de emmers maar zei dat hij geen sterke signalen kreeg. Toen hij een emmer selecteerde, zei hij er meteen bij dat hij dacht foutief te zijn. He had gelijk dat hij nooit gelijk had! Hij vond geen enkel metalen voorwerp ondanks diverse pogingen. Zijn prestatie is typisch voor wichelroedelopers die in beheerste omstandigheden worden getest. Zijn reactie was evenzeer typisch: hij was oprecht verbaasd. Zoals de meesten onder ons, beseft de wichelroedeloper niet welke factoren ons kunnen hinderen bij het maken van een grondige analyse: zelfbedrog, wishful thinking, suggestie, onbewuste voorkeur, selectief denken, subjectieve validatie, gemeenschapsversterking, en dergelijke.

Vele onderzoeken met controlegroepen gebruiken een placebo in de controlegroepen zodat de proefpersonen niet weten of ze met de oorzakelijke agens worden getest of niet. Bijvoorbeeld, zowel de controle- als experimentele groepen krijgen identiek lijkende pillen in een onderzoek om de doeltreffendheid van een nieuw geneesmiddel te testen. Slechts één pil zal de geteste agens bevatten; de andere pil is een placebo. In een dubbelblind onderzoek, weet de onderzoeker niet welke personen de placebo krijgen totdat zijn of haar evaluatie van de resultaten achter de rug is. Zo wordt vermeden dat de voorkeur van de onderzoeker de waarnemingen en metingen beïnvloedt.