Content area
Critical notice: The art of abduction
Review of Douven’s The Art of Abduction, also known as: inference to the best explanation. Douven eschews the crucial issues what ‘an explanation’ is and what ‘the best’ explanation is, but argues that if explanations contribute to confirmatory power, and confirmatory power is cashed out in Bayesian terms as probability-rising via updating rules, then other updating rules than the Bayesian one can be considered. Douven then shows that some updating rules perform better than Bayesian one, which judgements are achieved by considering so-called scoring rules. Our criticism is that the new updating rules need not have anything to do with abduction; other criticism is levelled against the interpretation of the results some cognitive-psychological experiment, and on Douven’s claim to throw new light on skepticism. These criticisms notwithstanding, we judge the book book to be masterful, revolutionary, and a must-read for anyone in epistemology.
Deze bonkige boekbespreking is als volgt georganiseerd. Eerst richten we het toneel in om de opvoering van het boek begrijpelijk te maken (1. Bayesianisme, 2. Abductie); daarna de opvoering van het boek, vergezeld van enig kritisch commentaar vanuit de coulissen, bestaande uit diverse Akten (3. Opvoering); en tot slot een staande ovatie vermengd met boe-geroep (4. Finale).
1. Voorspel: Bayesianisme
In het oude en eerbiedwaardige vertoogdomein van de kwalitatieve kenleer (epistemologie) poogt men erachter te komen: (a) wat kennis is; (b) wat de bronnen van kennis zijn; (c) wat de middelen van kennisverwerving zijn; (d) wat kennisclaims rechtvaardigt en hoe rechtvaardiging in haar werk gaat; en (e) wat de waarde is van kennis. Zodra bekend is welke de betrouwbare middelen van kennisverwerving zijn (c), kan de kentheoreticus richtsnoeren voor kennisverwerving uitvaardigen, de zg. regulatieve kenleer. Wie zich laat leiden door deze richtsnoeren handelt doxastisch rationeel; wie ze in de wind slaat en toch denkt kennis te kunnen verwerven, handelt doxastisch irrationeel.
De regulatieve kenleer was het kloppend hart van de kenleer vanaf de vroegmoderne periode, met o.a. Descartes en Locke. Ze verdween op de achtergrond toen analytisch filosofen in het post-Gettier tijdvak (vanaf de jaren ‘60 van de 20ste eeuw) zich voornamelijk met de explicatie à la Carnap van kennis bezighielden (a): een voorwaarde vinden voor ‘subject S weet dat p’ die voldoende en noodzakelijk is. Onderdelen (b) en (d) zijn nooit weg geweest, doch (e) wel. In de afgelopen decennia is er weer aandacht geschonken aan wat de waarde van kennis is (e).
In het betrekkelijk jonge en florerende vertoogdomein van de kwantitatieve kenleer draait het uitsluitend en alleen om een deel van (d), met een antwoord op (a) en (c) als mogelijke bijvangst. In de kwantitatieve kenleer modelleert men het kennende subject (noemen we voor het gemak Epie) met de waarschijnlijkheidsleer. Men kent aan Epie graden van overtuiging tussen (en soms gelijk aan) 0 en 1 toe (Eng.: degrees of belief ), en vervolgens berekent men hoe deze graden van overtuiging veranderen wanneer Epie verse kennis tot zich neemt, zoals waarnemingen, geconstateerde feiten, meetresultaten, argumenten, bewijzen, archief-texten, en wat dies meer zij. Dit veranderen gaat, in een notendop, als volgt.
Epie begint met een graad van overtuiging Pr0(p) ∈ [0, 1] in propositie p op moment t = t0 (in het jargon: de prior). Op enig later moment, t = t1 > t0, consumeert Epie verse kennis. Dat kan een enkele propositie zijn, zeg q; indien deze verse kennis bestaat uit meerdere proposities, dan neme men voor q de conjunctie van deze proposities. De nieuwe graad van overtuiging van Epie (in het jargon: de posterior), is gelijk aan het product van een veranderingsfactor v(p, q) ∈ [0, m], die in het algemeen van p en q afhangt, en de prior:
Pr1(p) = v(p, q) x Pr0(p) .
De veranderingsfactor is minimaal 0, in welk geval Pr1(p) = 0 (maximaal ongeloof), en maximaal m := 1 / Pr0(p), in welk geval Pr1(p) = 1 (maximale overtuiging bereikt). Hoe komen we aan deze veranderingsfactor? In 1774 stelde Pierre Simon de Laplace de Aanpassingsregel van Bayes op. Deze regel is niet bedacht door dominee Thomas Bayes, maar is wel geformuleerd in termen van het begrip voorwaardelijke kans, dat bedacht is door Bayes: de kans op p gegeven q:
Pr(p) = Pr(p|q) := Pr(p ∧ q) / Pr(q) .
De veranderingsfactor van de Aanpassingsregel van Bayes ziet er als volgt uit:
De laatste uitdrukking verkrijgt men door enig jongleren met formules uit de waarschijnlijkheidsleer; zij is handiger te gebruiken dan de eerste uitdrukking, ofschoon zij er ingewikkelder uitziet; en zij is van centraal belang voor Douven en daarmee voor deze bespreking (lege infra). Er is een verband tussen rationeel willen zijn, d.w.z. coherente overtuigingen willen hebben, en de Aanpassingsregel van Bayes volgen (iterum lege infra).
Voor toepassing in de wetenschapsfilosofie neme men een uitputtende verzameling hypothesen: H = {h1, h2, … , hn}, waarvan hn (om een wiskundige reden waar we niet op ingaan) de negatie is van de conjunctie van de andere hypothesen (Eng.: the catch-all hypothesis). Komt er empirische evidentie e beschikbaar, dan is de posterior in hj volgens de Aanpassingsregel van Bayes:
v(hj, e, h) = Pr0(e|hj) / [Pr0(h1) Pr0(e|h1) + Pr0(h2) Pr0(e|h2) + … + Pr0(hn) Pr0(e|hn)] .
Waarom zou men de normatieve Aanpassingsregel van Bayes moeten volgen? Epie behoort toch vrij te zijn haar overtuigingsgraad aan te passen op een manier die zij wil? Een manier die Epie zelf als redelijk of correct aanmerkt? Het klinkt welhaast tiranniek om voor te schrijven: Gij zult uw graad van overtuiging aanpassing volgens de Regel van Bayes!
Epie is inderdaad zo vrij als een vogel. Echter niet indien Epie rationeel wil zijn. En wie wil niet rationeel zijn wanneer het gaat om de verwerving van kennis en de jacht op waarheid?
Tja, rationeel, daar zeg je wat. Hoe fietsen we een dergelijk meerduidig, kwalitatief en zelfs omstreden begrip de kwantitatieve kenleer binnen? Als volgt. Operationaliseer eerst de overtuigingsgraden via de bereidheid om weddenschappen af te sluiten. Stel Epie raakt overtuigd met graad 0.40 dat het aantal ogen van de geworpen dobbelsteen onder de beker even is, bijvoorbeeld omdat Epie te horen krijgt dat onder de beker de zijde met 6 ogen niet boven ligt (1, 3 en 5 ogen van de vijf mogelijkheden blijven dan over: 3/5 = 0.40). Dan moet Epie bereid zijn de volgende weddenschap af te sluiten: inleg € 10; bij verlies (oneven aantal ogen boven) is Epie haar inleg kwijt, en bij winst (even aantal ogen boven) volgt een uitbetaling van € 10 / 0.40 = € 25 (i.h.a. moet de kans op winst gelijk zijn aan de verhouding inleg : uitbetaling).
Bij bepaalde graden van overtuiging zou Epie een weddenschap afsluiten die altijd tot verlies lijdt. Stel dat Epie met graad 0.80 gelooft dat het morgen gaat regenen, en ook met graad 0.80 gelooft dat het morgen niet gaat regenen. Dan zou Epie voor € 10 een weddenschap moeten afsluiten die € 12.50 uitkeert bij regen, en ook voor € 10 euro een weddenschap moeten afsluiten die € 12.50 uitkeert wanneer het droog blijft. Maar als Epie beide weddenschappen afsluit, dan betaalt Epie € 20 euro voor een weddenschap die altijd € 12.50 uitkeert. Een dergelijke weddenschap, die altijd tot verlies leidt (€ 7.50 in dit geval), heet in het jargon van de kwantitatieve kenleer een Nederlandse weddenschap (Eng.: Dutch book).
F.P. Ramsey en later B. De Finetti waren de eersten die (reeds voor WO II) stellingen bewezen met de strekking dat wie doxastisch rationeel wil zijn, hetgeen betekent: nooit Nederlandse weddenschappen afsluit op basis van de eigen overtuigingsgraden, verplicht is de Aanpassingsregel van Bayes te gebruiken en de axioma’s van de waarschijnlijkheidsleer te eerbiedigen, en dus al haar stellingen. Wie in dit opzicht verzaakt, is gedoemd Nederlandse weddenschappen af te sluiten, en is dan aantoonbaar een sukkel die zal eindigen als een platzak. Op deze manier is rationaliteit de Bayesiaanse kenleer in gefietst, die door deze stellingen op ijzersterke pijlers rust. Men noemt ze Nederlandse-Weddenschap-Stellingen (Eng.: Dutch Book Theorems). Bayes or bust! (Aan de koppeling tussen irrationaliteit en geld verliezen zullen we dadelijk enkele volzinnen wijden.)
In The Art of Abduction presenteert Igor Douven een frontale aanval op de Bayesiaanse kenleer. Allerminst op het gebruik en eerbiedigen van de kansleer om overtuigingsgraden te modelleren, maar door de Regel van Bayes te vervangen door andere regels, en door kwantitatief aan te tonen dat deze andere regels in realistisch aandoende gevallen ‘beter scoren’ dan de Aanpassingsregel van Bayes. Als Douven gelijk heeft, dan wankelt het Bayesiaanse bouwwerk dat de afgelopen decennia is aangewend om verscheidene epistemische problemen op te lossen, binnen en buiten de wetenschapsfilosofie. Wij zullen dadelijk hier met meer bijzonderheden op ingaan. Eerst dienen we in het tweede deel van ons Voorspel aandacht te schenken aan het onderwerp van het boek genoemd in de titel: abductie.
2. Voorspel: abductie
Abductie (anglicisme van abduction) betekent niet ‘ontvoering’ doch ‘de beste verklaring kiezen’. Wat heeft abductie van doen met het aanpassen van overtuigingsgraden? Immers, onze overtuigingsgraad in een hypothese aanpassen op basis van empirische evidentie, verkregen door verschijnselen te bestuderen, veelal door gegevens te verzamelen of door metingen te verrichten, is de Bayesiaanse sleutel om het begrip empirische bevestiging te ontsluiten (Eng.: confirmation). Empirische bevestiging is de wetenschappelijke rechtvaardiging van kennisclaims bij uitstek (onderwerp (d) uit de Kenleer). Een verklaring geeft daarentegen antwoord op de vraag waarom verschijnselen en regelmatigheden optreden, waarbij we ons baseren op verworven wetenschappelijke kennis, die reeds empirisch bevestigd is. Bevestiging en verklaring zijn twee geheel verschillende concepten, met navenant geheel verschillende analysen en explicaties. Dit maakt de vraag prangend wat abductie te maken heeft met Bayesianisme en in het bijzonder met de Aanpassingsregel van Bayes.
De insteek van Douven (en anderen) is als volgt. Wanneer een hypothese h een verschijnsel verklaart, een bevredigend antwoord geeft op de vraag waarom het verschijnsel optreedt, en we gebruiken evidentie onttrokken aan dat verschijnsel ten einde h te toetsen, dan behoren we niet langer de Aanpassingsregel van Bayes te gebruiken om de overtuigingsgraad in h aan te passen, doch een andere regel, die de overtuigingsgraad sterker aanpast. Verklarende hypothesen krijgen een voorkeursbehandeling, een epistemische bonus. We kunnen dan de Aanpassingsregel van Bayes vervangen door een andere aanpassingsregel.
Dit is meteen het moment om te vertellen waarom Douven niet onder de indruk is van Nederlandse-weddenschaps-stellingen. Wanneer men een aanpassingsregel aanwendt die een epistemische bonus uitdeelt aan verklarende hypothesen, en dus verschilt van de Aanpassingsregel van Bayes, handelt men doxastisch irrationeel, omdat men op de lange duur geld verliest. Douven merkt op dat men niet elke weddenschap hoeft aan te nemen. Zijn kernpunt is dat hij anders tegen alternatieve aanpassingsregels aankijkt; bij sommige regels verliest men geen geld, doch betaalt men voor een epistemische bevrediging: verklaringen. Men krijgt iets terug voor het betaalde (‘verloren’) geld. Dit kan praktische gevolgen hebben, zoals Douven aantoont met een uitgebreid voorbeeld over artsen die behandelingen moeten kiezen (zie Akte 3.5 hieronder).
We kunnen dit ook anders verwoorden. Hoewel we hieronder Douven gaan bekritiseren, willen we opmerken dat zijn vertrekpunt belangrijk is: de traditionele kwantitatieve kenleer gaat er stilzwijgend vanuit dat kennis verkrijgen of verzamelen en gebruiken in berekeningen kosteloos is. Deze idealisering doet vaak geen kwaad, maar bij (c) en (d) kan het wringen. We kunnen de bonus die Douven aan een verklarende hypothese geeft, beter begrijpen als een korting op de kosten van kennisverwerving, in casu wetenschappelijk onderzoek.
Er is niets irrationeels aan de erkenning dat er geen free lunches bestaan, ook niet in de kenleer. Het casino als model voor rationele kennisverwerving, waar winnen of verliezen dom geluk resp. domme pech is, lijkt ons ook dubieus. De epistemische supermarkt, waar men epistemische heerlijkheden kiest en er eerlijk voor betaalt, biedt een aanlokkelijker aanblik. En bij de kassa behoort men af te rekenen.
3. De opvoering
Akte 3.1. Verklaren versus bevestigen
We zijn meteen in het hart van het bonkige boek beland, dat zich richt op filosofen, psychologen, cognitief neurowetenschapsbeoefenaren en taalkundigen (blz. 1). In het openingshoofdstuk (1. Introduction) warmt Douven de geesten op met gevallen waaruit blijkt dat wij verklarende hypothesen waarderen. Het verklarende karakter van een hypothese is onafhankelijk van de waarheid van de hypothese, zodat men door een verklarende hypothese te geloven in een onware hypothese kan gaan geloven. Hieruit blijkt dat er geen sprake kan zijn van een afleiding naar de beste verklaring, die de waarheid van de afgeleide conclusie garandeert indien de premissen waar zijn. Er bestaan immers geen abductieve afleidingsregels, die garanderen dat we geen onware hypothesen uit (ware) evidentie afleiden, zoals er wel talloze deductieve afleidingsregels bestaan die dat wel garanderen. Wat men hier evenwel bedoelt met ‘afleiding’ is dat er keuzecriteria zijn waarmee men de verzameling hypothesen H = {h1, h2, … , hn} afloopt, opdat er een enkele hypothese overblijft. Die heet dan ‘abductief afgeleid’. Er is evenwel geen enkel keuzecriterium waar zelfs maar een begin van consensus over is te ontwaren onder filosofen. (Kreten als Kies de meest eenvoudige hypothese! is het probleem verplaatsen: over eenvoud is even weinig consensus.) De voorbeelden die aannemelijk moeten maken dat zulke criteria toch moeten bestaan in de wetenschap, bestaan meestal uit moeten kiezen tussen een algemeen aanvaarde hypothese of theorie, en een fantastische hypothese, zoals de banen van de planeten in het zonnestelsel verklaren door de zwaartetheorie van Newton, of door de hypothese dat onzichtbare engeltjes verliefd zijn op ellipsen en de planeten magisch in zulke banen dwingen. Och, welk Epistemisch Dilemma! Met wetenschapsbeoefening heeft dit geen sikkepit te maken. Douven is zich bewust van deze problemen (en zet ze krachtig uiteen in hoofdstuk 2. What is Abduction?), om te eindigen met de conclusie dat de enige manier om chocola te maken van abductie is door de waarschijnlijkheidsleer te omarmen, en in het bijzonder door de Aanpassingsregel van Bayes te vervangen door een regel die een bonus geeft aan verklarende hypothesen (Bonusregel). We moeten toch wat met abductie, lijkt Douven te hebben gedacht, dat alomtegenwoordig lijkt in alle kennisverwervende praktijken, en dit is het enige wat ik kan verzinnen wanneer ik in een probabilistisch raamwerk woon.
Zoals Douven schrijft, wat realisten in de wetenschapsfilosofie doen in het aangezicht van de Onderbepalingsthese (elkaar uitsluitende hypothesen die even goed bevestigd worden door het aanwezige, en soms zelfs door al het mogelijke, empirische bewijsmateriaal), is zich beroepen op verklaringskracht als een epistemische waarde: Kies de hypothese die het best verklaart! Dat is de weg die tot kennis leidt. Welnu, neem eens de quantummechanica, die bijvoorbeeld verklaart waarom de electromagnetische emissie- en absorbtiespectra van atomen en moleculen discreet zijn en niet continu. De pilootgolfmechanica van De Broglie en Bohm is een empirisch equivalente theorie die zulks ook verklaart. Onderbepalingsprobleem uit de natuurkunde! Voorstanders van laatstgenoemde theorie claimen dat hun theorie een heuse verklaring voor de verschijnselen biedt, of in ieder geval een betere verklaring dan de qantummechanica, en kunnen dan de verklaringsbonus claimen. Hun theorie zal dan beter empirisch bevestigd zijn dan de qantummechanica. Onderbepalingsprobleem opgelost. Doch de voorstanders van de qantummechanica kunnen met recht en rede dezelfde verklaringsbonus claimen, bijvoorbeeld door erop te wijzen dat hun verklaring een instantiatie is van Hempel zijn deductiefnomologische verklaringsmodel: discrete spectra volgen deductief uit de qantum-natuurwetten die de qantummechanica postuleert. Welke verklaring is nou de beste? Wie heeft recht op de verklaringsbonus en wie niet? Onbeslisbaar. En zo zal het altijd gaan in de wetenschap, denken wij, en hebben kreten als Kies de beste verklaring! de kracht van een nat papieren servetje om het onderbepalingsprobleem op te lossen. Terzijde zij opgemerkt dat de overweldigende meerderheid van de natuurkundigen voor de qantummechanica heeft gekozen, dus indien de pilootmechanica de betere verklaringen zou geven, dan lappen natuurkundigen abductie aan hun laars. (In andere takken van wetenschapsbeoefening, zoals de evolutietheorie in de biologie, kan dat uiteraard anders liggen.)
De constructief empirist B.C. van Fraassen ontnam, in het licht van bovengenoemde (en andere) problemen, ‘afleiding naar de beste verklaring’ iedere epistemische waarde en kende abductie een louter pragmatische rol toe. Deze weg wil Douven pertinent niet bewandelen. In het eerste deel van hoofdstuk 2 laat Douven een parade voorbeelden voorbij marcheren die ons moet overtuigen van de epistemische waarde van verklarende hypothesen. We zullen een dergelijk voorbeeld eens nader beschouwen.
Akte 3.2. Verslag van een onthoofding
Op 11 Juni 2017 rapporteerde de Amerikaanse nieuwszender CNN dat in Jacksonville, Arizona, een hoofd was gevonden op het bordes van een huis, en dat minder dan een mijl verderop een onthoofd lichaam was gevonden. Douven concludeerde, met snedige intelligentie, onmiddellijk dat hoofd en lichaam bij elkaar horen, zelfs voordat medisch onderzoek zulks had uitgewezen. Waarom? Omdat deze hypothese het aantreffen van deze twee ruimtelijk gescheiden lichaamsdelen die bij elkaar lijken te horen het beste verklaart. Tel uit uw epistemische winst! Want dit bleek achteraf kennis.
Het bij elkaar horen van de lichaamsdelen verklaart echter geenszins de onthoofding – de vraag waarom de persoon is onthoofd, onderstelt immers reeds dat de lichaamsdelen bij elkaar horen. Douven wilde niet verklaren waarom deze lichaamsdelen zijn gevonden, doch waarom hij overtuigd was van de bewering dat de lichaamsdelen bij elkaar horen, en zijn verklaring luidt dat hij een afleiding naar de beste verklaring gebruikte. Hoe weet Douven dat hij niet lijdt aan bevestigingsvertekening (Eng.: confirmation bias)? Misschien concludeerde hij dat onmiddellijk omdat het de meest waarschijnlijke hypothese is. Douven ontkent, omdat hij geen statistische evidentie heeft geraadpleegd waaruit zou blijken dat het de meest waarschijnlijke hypothese is, alvorens deze conclusie te kunnen trekken. Doch dat hoeft helemaal niet. De schier talloze prior overtuigingsgraden van personen zijn zelden gebaseerd op raadpleging van corpora met statistische data. Niemand heeft ooit kennisgenomen van een onthoofd lichaam en een hoofd vlak bij elkaar in de buurt gevonden die niet bij elkaar horen; en iedereen weet dat wanneer je iemand onthoofdt, het hoofd dichtbij het lichaam terecht komt. Precies hierom schatten we de hypothese dat de gevonden lichaamsdelen in Jacksonville wel bij elkaar horen heel veel waarschijnlijker dan de negatie. Dat Douven doxastisch rationeel is, en we zijn snedige intelligentie kunnen modelleren met de Bayesiaanse kenleer, levert onzes inziens een niet minder aannemelijke verklaring voor het feit dat Douven terstond het correcte oordeel velde dan de abductieve verklaring die hij zelf ophoest.
Akte 3.3. Aanpassingsregels met Bonus waarvoor?
Van Fraassen heeft als eerste een aanpassingsregel met verklaringsbonus (kortweg: Aanpassingsregel met Bonus) voorgesteld, met de volgende veranderingsfactor:
v* (hj, e) = [Pr0(e | hj) + f(hj, e, hk)] / [Pr0(h1) Pr0(e | h1) + Pr0(h2) Pr0(e | h2) + … + Pr0(hn) Pr0(e | hn) + f(hj, e, hk)],
waarin f(hj; e, hk) / Pr0(hj) ∈ [0, 1), om te garanderen dat de posterior in [0, 1] blijft vallen. De kwantitatieve verklaringsbonus is voor hypothese hj, en is een functie van e, en mogelijk van alle andere hypothesen, zodanig dat bonusterm f(hj, e, hk) = 0 indien hj niet verklaart, en f(hj, e, hk) > 0 indien hj wel verklaart. Het springende punt is nu dat alle rekenpartijen in het boek identiek blijven wanneer we f(hj; e, hk) opvatten als een esthetische bonus, zodat we de mooiste hypothese gaan belonen, of opvatten als een nationaliteitsbonus, zodat hypothesen verzonnen door een Nederlander een Dutch bonus krijgen toebedeeld, of opvatten als een jeugdbonus, zodat hypothesen verzonnen door mensen van 21 jaren of jonger een aanpassingsduw krijgen. Douven zijn explanationism kan een ander met evenveel recht estheticism of nationalism noemen. De Aanpassingsregel met Bonus zegt niets over waar de bonus voor staat.
De alarmerende conclusie lijkt dat het boek tittel noch iota zegt over verklaringen en abductie, in weerwil van de titel The Art of Abduction. Is het boek mislukt? Geenszins. The Art of Updating had de titel behoren te zijn, want de meeste hoofdstukken gaan over doxastische aanpassingsregels, en over hoe dier effectiviteit te bepalen, met als de eerdergenoemde sensationele uitkomst: de gedwongen abdicatie van de Aanpassingsregel van Bayes, die tot op de dag van vandaag op de troon zit, en de troonsbestijging van een Aanpassingsregel met Bonus.
Akte 3.4. De psychologie van abductie
In hoofdstuk 3, The Psychology of Abduction, rapporteert Douven psychologisch onderzoek naar abductief redeneren, door anderen en door hemzelf uitgevoerd. Proefpersonen, waaronder we voor het gemak onze Epie scharen, krijgen twee urnen met 40 knikkers te zien, verhouding witte/zwarte knikkers in urn A: 10/30, en in urn B: 15/25. Vervolgens worden uit een urn 10 knikkers blind gehaald en gepresenteerd aan Epie, die op een schaal de verklaringskracht moet kiezen van de hypothese (i) dat de 10 knikkers uit urn A komen, en (ii) dat ze uit urn B komen, en daarnaast de waarschijnlijkheid dat de trekking uit urn A komt. Door diverse statistische modellen toe te passen op de verkregen gegevens, concludeert Douven (blz. 87–88) o.a. dat de Aanpassingsregel met Bonus tot betere voorspellingen leidt over wat de proefpersonen zeggen dan de Regel van Bayes; en dat verklaringsoverwegingen de toekenning van overtuigingsgraden beïnvloeden.
Een andere, strijdige conclusie is ook mogelijk: Epie is niet in staat de toekenning van overtuigingsgraden en verkaringsgraden uit elkaar te houden. Er is empirisch bewijs verzameld voor conceptuele verwarring. Wat nu?
Men kan zelfs volhouden dat de herkomst van de trekking van 10 knikkers (urn A of urn B), de trekking niet kan verklaren: de precieze individuele hand- en vingerbewegingen van de trekker die in de urn graait, verklaart de trekking van de getrokken knikker: de toevoeging dat de knikker uit urn A of uit urn B komt maakt deze echte verklaring niet beter of slechter. Het is trouwens in het algemeen een statistische drogreden te denken dat kansverdelingen iets zeggen over individuele uitkomsten. De glanzende voorbeelden van verklaringen die Douven presenteert in Hoofdstuk 1 zijn, veelzeggend genoeg, dan ook nimmer van dit statistische urn-type. De opzet van dit psychologische experiment was gedoemd tot falen: de beslissende redeneerstap van het empirische resultaat dat de Aanpassingsregel met Bonus beter presteert dan de Aanpassingsregel van Bayes, naar een loflied op abductie, kan men eenvoudigweg niet zetten. Voegen we een premisse toe volgens dewelke de bonus een verklaringsbonus is, dan kan men de beslissende redeneerstap wel zetten, doch op straffe van zelfverhanging in een circulus vitiosus.
Akte 3.5. Het paradepaard
De Aanpassingsregel met Bonus voorgesteld door Van Fraassen voegt een term toe aan noemer en teller in die van Bayes. Algemenere Aanpassingsregels met Bonus zijn voorhanden, met een factor die de graad van verklaring van een hypothese moet meten. Dit zou betekenen dat de bonus inderdaad een verklaringsbonus is, en niet een esthetische bonus, een nationaliteitsbonus of een leeftijdsbonus, of nog een andersoortige bonus (zie Akte 3.3). Voor de functie f(hj, e, hk) in de veranderingsfactor v*(hj, e) beschouwt Douven vier voorstellen die de verklarende kracht van hypothese hj moeten meten:
Bayes : f(hj, e, hk) = 0 .Van Fraassen : f(hj, e, hk) = constante, in het interval (0, Pr0(hj)].
Popper : f(hj, e, hk) = [Pr0(e|hj) – Pr0(e)] / [ Pr0(e|hj) + Pr0(e)].
Good : f(hj, e, hk) = ln[Pr0(e|hj) / Pr0(e)].
Bij Van Fraassen mag men een constante kiezen, op basis van een intuïtief oordeel ‘hoe groot’ men de verklarende kracht van een hypothese inschat. De voorstellen van Popper en Good zijn een functie van de ingeschatte aannemelijkheid Pr0(e|hj) en van Pr0(e). Doch deze voorstellen doen meteen de wenkbrauwen fronsen. In het geval waarin de hypothese (hj) de evidentie (e) impliceert, zodat Pr0(e|hj) = 1, zien de factoren er als volgt uit:
Popper: f(hj, e, hk) = 1 / [ 2 – Pr0(¬e)].Good: f(hj, e, hk) = ln[1 / Pr0(e)].
In beide gevallen hangen deze factoren niet langer af van de hypothese waarvan ze juist de verklarende kracht meten. Onaanvaardbaar.
We zijn er evenwel nog niet. Want hoe gaan we de navenante aanpassingsregels vergelijken? Hier doet Douven een beroep op zg. scoringsregels, die een kwantitatief antwoord mogelijk maken. Ter illustratie, een weervoorspeller die telkens kans 1 toekent aan de hypothese over het weer van morgen die steeds waar blijkt, scoort maximaal, en wie daar kans 0 aan toekent, scoort minimaal; realistische voorspellers zitten daar ergens tussenin. In Hoofdstuk 5 (A Closer Look at Scoring) bespreekt Douven diverse scoringsregels die voor handen zijn. Geen enkele scoringsregel komt uit de bus als superieur, oordeelt Douven, die het gestagneerde debat hierover vlot wil trekken door een scoringsregel voor te stellen die afhangt van een nieuw element: hoe ver een hypothese verwijderd is van de waarheid, een idee afkomstig uit de wetenschapsfilosofische literatuur over waarheidsgelijkenis (Eng.: verisimilitude). Enigszins curieus in dit licht is dat Douven in het opvolgende paradehoofdstuk (Hoofdstuk 6) terugvalt op de eerste en oudste scoringsregel, die van Brier.
Het paradepaard bestaat uit een computationeel gedachte-experiment. Welkom ecologische rationaliteit: we gaan ons afvragen wat de beste aanpassingregel is in een omgeving met een expliciet doel voor degenen die beslissingen moeten nemen op basis van wat ze geloven. Het gedachteexperiment behelst artsen werkzaam op de intensieve-zorg-afdeling, die op basis van een positieve of negatieve uitkomst van een test moeten besluiten om in te grijpen. Maar liefst 200 artsen ontvangen ieder 100 patiënten; de gemiddelde score na hun behandeling is berekend; de 100 succesrijkste artsen mogen blijven en de andere 100 worden vervangen door klonen van de succesrijksten. Opnieuw behandelt iedere arts 100 patiënten. Dit herhaalt zich 250 keer. De bijzonderheden zijn nogal overweldigend.
Zij behelzen het modelleren van verschillende factoren die een rol spelen door parameters in de kansverdelingen op sterven en genezen van de patiënt; aan zulke parameters worden steeds willekeurig waarden toegekend per patiënt. Door artsen hun graad van geloof te laten aanpassen met de vier verschillende aanpassingsregels, krijgen we een beeld welke regel in welke omstandigheden op den duur de beste resultaten boekt (doel is uiteraard genezing van de zieke patiënt met minimale kosten). Douven presenteert (in Sectie 6.3) een indringende bespreking van hoe de aanpassingsregels scoren in welke omstandigheden. De resultaten zijn ronduit opmerkelijk. De Aanpassingsregel van Bayes scoort belabberd. Artsen die de aanpassingsregels van Van Fraassen en van Popper volgen, strijden om een veel betere score in veel gevallen (van toekenning van waarden aan de parameters). De aanpassingsregel van Good hangt er tussenin. Dat in verschillende omstandigheden verschillende aanpassingsregels verschillend scoren bevestigt cognitief-psychologisch onderzoek naar het ecologische karakter van rationaliteit, zo benadrukt Douven. Er is niet een enkele gulden regel die onafhankelijk van de omstandigheden en het doel immer de beste resultaten geeft. Exit Bayesianisme.
Dat er scoringsregels nodig zijn om aanpassingsregels te vergelijken, betekent dat men kan vragen of een aanpassingsregel ecologisch robuust is. De meerwaarde van Douven’s boek ligt erin dat deze ecologische robuustheid kwantitatief en met computersimulaties zichtbaar wordt gemaakt en zodoende aangetoond. Douven opent de deur naar een fijnmaziger regulatieve kenleer. Zo kunnen we ons voorstellen dat we op termijn een systematische kosten-batenanalyse van aanpassingsregels en scoringsregels voor verschillende kentheoretische keuzelandschappen gaan krijgen. Hetgeen op termijn aantrekkelijk kan zijn voor beleidsmakers.
Opmerkelijk is dat Douven, na zijn destructieve werk, in de Epiloog ineens kopjes begint te geven aan de Bayesianen, en zijn resultaten zelfs bagatelliseert: de afwijking van de concurrerende aanpassingsregels van de Bayesiaanse is slechts gering (!), op blz. 259: ‘far from a radical departure of Bayesianism’. Terwijl het in zijn computationele gedachte-experiment gaat om duizenden doden verschil. Nou moe.
Akte 3.6. Scepticisme
In het laatste hoofdstuk (An Abductive Response to the Skeptic) neemt Douven het op zich om aan te tonen dat men scepticisme over de externe wereld kan bestrijden met abductie. Zowaar een toepassing op een aloud filosofisch probleem. Het is een klassiek abductief idee dat, ofschoon onze zintuiglijke ervaringen logisch verenigbaar zijn met het niet-bestaan van de fysische werkelijkheid, het wel bestaan van de fysische werkelijkheid veruit de beste verklaring is voor onze zintuiglijke ervaringen (realisme), en we dus een goede reden hebben om daarin te geloven. (Douven verwijst naar Bertrand Russell zijn The Problems of Philosophy uit 1912 als de vroegste aan hem bekende vindplaats van het idee; wij konden deze redenering reeds vinden bij Mary Shepherd in haar Essay on the Perception of an External Universe uit 1827.) Dit argument zal echter alleen een scepticus overtuigen die reeds gelooft in de betrouwbaarheid van abductie – hetgeen ons niet bepaald kenmerkend lijkt voor scepticisme.
Omgekeerd zou men kunnen proberen om abductie te ondersteunen door te laten zien dat het vaak correcte empirische voorspellingen oplevert. Maar dat zal alleen een scepticus overtuigen die gelooft dat onze zintuigelijke waarnemingen betrouwbaar zijn. Zodoende lijken scepticisme over de waarneming en scepticisme over abductie aan elkaar geklonken, waarbij het er sterk op lijkt dat ze beide helemaal niet, of alleen gezamenlijk overwonnen kunnen worden.
Douven neemt de uitdaging van het scepticisme aan, waarbij hij overigens slechts een zwak resultaat najaagt: hij wil laten zien dat het onder epistemisch ideale omstandigheden mogelijk is scepticisme te weerleggen, dat wil zeggen, om via een aanpassingsregel die scepticisme niet bij voorbaat uitsluit, toch tot een willekeurig hoge waarschijnlijkheid voor het bestaan van de fysische werkelijkheid en de betrouwbaarheid van abductie te geraken. Deze epistemisch ideale omstandigheden bestaan eruit dat we een oneindige rij waarnemingen doen die allemaal minimaal even bevestigend zijn voor de niet-sceptische hypothesen als voor de sceptische hypothese. Nu is een oneindige rij tamelijk lang, en daardoor is de onderstelling dat men een dergelijke reeks waarneemt loodzwaar (want nimmer realiseerbaar); dit gewicht lijkt het resultaat bijna te verpletteren, en in ieder geval te verzwakken. Daartegenover staat dat een empirisch argument tegen de scepticus niet lijkt te kunnen bestaan, zodat zelfs het zwakke resultaat van Douven een opmerkelijke prestatie zou zijn.
Het gaat te ver om de wiskundige bijzonderheden van het argument hier uiteen te zetten (ook Douven zelf verbant ze naar Appendix D van zijn boek), maar het algemene idee is als volgt. Wanneer we willen weten welke conclusies we uit bepaalde evidentie kunnen trekken, terwijl we nog niet weten of we de scepticus of de anti-scepticus moeten geloven, kunnen we gebruik maken van zogeheten expertfuncties. We stellen de kans op anti-sceptische hypothese h gegeven evidentie e, Pr(h|e), gelijk aan een gewogen gemiddelde van wat een sceptische deskundige en een anti-sceptische deskundige zouden willen concluderen over h gegeven e. De weging van de deskundigen hangt af van hoe betrouwbaar we hen achten; en dat kan veranderen naarmate de ene deskundige succesrijker blijkt te zijn dan de andere. Stel dat we een oneindige rij evidentie krijgen die afwisselt tussen evidentie die ons iets kan leren over de betrouwbaarheid van de zintuigen (met behulp van abductie), en evidentie die ons iets kan leren over de betrouwbaarheid van abductie (met behulp van de realistische hypothese dat onze zintuigen ons de fysische werkelijkheid tonen). We kunnen ons voorstellen dat er een effect optreedt waarbij een kleine prior dat de zintuigen betrouwbaar zijn, ons in staat stelt om de waarschijnlijkheid dat abductie betrouwbaar is, te verhogen; en omgekeerd; en dat ze elkaar op deze manier aan de laarsveters uit het moeras trekken totdat we vrijwel zeker mogen zijn van deze betrouwbaarheidshypothese.
Werkt dit? Zonder de kaarten bij voorbaat in het nadeel van de scepticus te schudden? De scepticus zal in het algemeen gebruik maken van een ononderscheidbaarheidsargument om te beweren dat alle mogelijke empirische evidentie logischerwijs even verenigbaar is met scepticisme als met realisme. Het wekt dan ook verbazing dat Douven tegelijkertijd scepticisme serieus kan nemen en kan bewijzen dat empirische evidentie het verschil kan maken. Hoe krijgt hij dit voor elkaar? Het formele bewijs dat Douven in Appendix D van zijn boek geeft, is helaas filosofisch weinig inzichtelijk. Bij nadere beschouwing blijkt echter dat de conclusie die hij uit stellingen 8.1 tot en met 8.9 trekt, waarbij stellingen 8.5-8.7 het empirische bewijsmateriaal beschrijven, net zo goed getrokken kan worden uit alleen de stellingen 8.1, 8.2, 8.8, en 8.9. De eerste twee hiervan stellen de zogeheten expertfuncties voor, de laatste twee stellen dat de niet-sceptische deskundigen in de limiet de waarheid van de niet-sceptische hypothese, en daarmee het gewicht dat aan elkaars deskundigheid wordt toegekend, op 1 mogen stellen. Met enige elementaire wiskunde blijkt vervolgens dat in die limiet dan ook de waarschijnlijkheid van de anti-sceptische hypotheses naar 1 gaat. Wat we hier zien gebeuren is geen bewijs dat het scepticisme empirisch weerlegd kan worden (want hypothesen over empirische evidentie zijn niet eens nodig), maar een aanwijzing dat er iets heel erg verkeerd gaat wanneer we een expertfunctie indirect gebruiken om de betrouwbaarheid van de deskundigen vast te stellen die in deze functie zelf voorkomen – een aanwijzing die ons aan Baron Münchhausen doet denken.
We illustreren dit in iets meer detail. De eerste expertfunctie 8.1 is in vereenvoudigde weergave als volgt, voor willekeurige hypothese h:
Pr(h|e) = Pr(R|e) M(h|e) + Pr(¬R |e) S(h|e) ,
waarin R de niet-sceptische hypothese is van de Reliability of sense perception (betrouwbaarheid van onze zintuigelijke waarneming). De Mooreaanse deskundige krijgt een wegingsfactor M die identiek is aan de voorwaardelijke waarschijnlijkheid dat R waar is (gegeven de nieuwe evidentie e), terwijl de scepticus een wegingsfactor S krijgt die identiek is aan de voorwaardelijke waarschijnlijkheid dat R onwaar is. Het is duidelijk dat deze formule tot problemen leidt wanneer we de waarschijnlijkheid van R zelf gaan bepalen, waarin we immers hevig geïnteresseerd zijn. Dan krijgen we namelijk:
Pr(R|e) = Pr(R|e) M(R|e) + Pr(¬R|e) S(R|e).
Mocht de Mooreaan de kans op R gelijkstellen aan 1 (dus M(R|e) = 1), terwijl de scepticus een kans tussen 0 en 1 geeft, dan volgt met wiskundige onverbiddelijkheid dat P(R|e) = 1. Er volgt dan ook onmiddellijk dat de Mooreaan altijd als enige deskundige geloofd moet worden ten koste van de scepticus. Een deskundige kan zichzelf op deze manier tot de enige autoriteit kronen. Nu is dit niet precies wat er gebeurt in het argument van Douven, maar daar gebeurt wel iets wat hier heel erg op lijkt. Douven gebruikt namelijk twee expertfuncties, eentje waar de Mooreaan het tegen de scepticus opneemt, en een andere waar de Russelliaan – die gelooft in de betrouwbaarheid van abductie – het tegen een andere scepticus opneemt. De Mooreaanse expertfunctie wordt gebruikt om de betrouwbaarheid van de Russelliaan vast te stellen, en de Russelliaanse om de betrouwbaarheid van de Mooreaan vast te stellen. Met andere woorden, de deskundigen mogen niet hun eigen, doch wel elkaars wegingsfactor vaststellen. Verder stelt Douven in stellingen 8.8 en 8.9 dat in de limiet wanneer alle evidentie binnen is, de Russelliaan waarschijnlijkheid 1 zal toekennen aan R (en dus de wegingsfactor van de Mooreaan op 1 zal zetten), en omgekeerd de Mooreaan kans 1 toe zal kennen aan de betrouwbaarheid van abductie (en dus de wegingsfactor van de Russelliaan op 1 zal zetten). Zonder deze stelling 8.8 en 8.9 valt het bewijs dat in Appendix D gegeven wordt in duigen, dus dit is geen optioneel of aan te passen onderdeel van het argument. Maar het resultaat is precies hetzelfde als in het eenvoudiger voorbeeld hierboven: doordat deze twee deskundigen hun eigen wegingsfactoren op 1 zetten, volgt dat ze beiden tot absolute autoriteit gekroond moeten worden, en dus ook dat het zeker is dat abductie werkt en dat de zintuigen betrouwbaar zijn. Het lijkt ons dat hiermee niets is aangetoond over de relatie tussen scepticisme en empirisch bewijs. De enige les luidt dat we expertfuncties niet moeten gebruiken om de betrouwbaarheid van de in die functies optredende deskundigen te bepalen – of dat we daar in ieder geval veel voorzichtiger mee moeten zijn dan Douven in dit hoofdstuk is.
4. Finale
We menen dat het boek van Douven weinig met abductie te maken heeft en dat het daarom in dit opzicht teleurstellend is. Toch valt ons oordeel overwegend positief uit. En wel om drie redenen. De eerste reden is, zoals we reeds hebben laten zien, dat het boek op een pregnante wijze de verschillende aspecten van de Aanpassingsregel van Bayes zichtbaar en bespreekbaar maakt. We kennen geen werk dat de afhankelijkheidsrelatie tussen scoringsregels en aanpassingsregels dermate indringend op het netvlies zet. Om onze tweede en derde redenen te benoemen, moeten we eerst een stap terugzetten.
In de statistiek, de wetenschapsfilosofie en de beslissingstheorie (Eng.: decision theory) is Bayesianisme al meer dan een halve eeuw gestadig in opmars. In de statistiek heeft dit tot een laaiende discussie geleid tussen zogenaamde Frequentisten en Bayesianen. Binnen de wetenschapsfilosofie en de beslissingstheorie is er nooit een discussie ontstaan over de Aanpassingsregel van Bayes, hoogstens enige schermutselingen over wel of geen kwantitatieve kenleer. Bayesianen en niet-Bayesianen kunnen vrienden zijn, maar inhoudelijk negeren ze elkaar. Bayesianen noemen zichzelf vaak the only game in town (denk aan de titel van Earman zijn monografie over bevestiging: Bayes or Bust!); zij wijzen op het feit dat er in de kwantitatieve kenleer geen systematisch alternatief is voor Bayesianisme. Dit is een ongezonde situatie.
Goed aan het boek van Douven is dat hij bekende aanvallen op de dominantie van Bayes binnen de wetenschapsfilosofie en beslissingstheorie mobiliseert, en ze systematisch analyseert en explosief bekrachtigt. Hij doet dit op een kwantitatieve wijze, waardoor hij de tegenstelling met de Bayesianen op scherp stelt: een aanval met de kwantitatieve middelen waar Bayesianen prat op gaan. In het bijzonder door simulaties, door kwantitatieve gedachte-experimenten te gebruiken, brengt Douven een methodologische vernieuwing aan in de kwantitatieve kenleer, en maakt hij enkele filosofische tegenstellingen zelfs ‘experimenteel’ toegankelijk en zelfs beslisbaar. Dit is onze tweede reden.
Deze tweede reden wijst ook naar de toekomst (en dat is onze derde reden). Wat Douven laat zien, is dat kritiek op het Bayesianisme, dat voorheen borrelpraat was, nu tot academische hoogte is opgestegen en tot systematische onderzoeksvragen leidt. In het bijzonder dat er nieuwe onderzoeksvragen vrij precies onderzocht kunnen worden. Bij elke aanpassingsregel kan men nu bijvoorbeeld een kosten-batenbalans maken over hoe die scoort in verschillende contexten (‘ecologieën’), mogelijk met verschillende scoringsregels, en hoe robuust de gebruikte scoringsregels zijn in veranderende omstandigheden. Dit kan er op termijn voor zorgen dat men betere aanpassingsregels in kennisverwervende praxes aanwendt. Douven zorgt voor een wederopstanding van de regulatieve kenleer. Dat is geen klein bier.
Vanwaar, ten slotte, onze warme aanbeveling: geen Bayesiaan en geen anti-Bayesaan mag The Art of Abduction ongelezen laten. En iedereen geïnteresseerd in het hoe en wat van de kennisverwerving idem dito, en, om niet te vergeten, hoe de abdicatie van Bayes van de troon van de kwantitatieve kenleer zich voltrekt. De alleenheerschappij van de Aanpassingsregel van Bayes in de kwantitatieve kenleer is voorbij. Lang leve de kwantitatieve kenleer! Bayesianen, ken uw plaats. Douven is de Revolutie.
Over de auteurs
Dr. V.A. Gijsbers is universitair hoofddocent aan de Universiteit Leiden.
Prof. Dr. F.A. Muller is hoogleraar filosofie van de natuurwetenschappen aan de Erasmus Universiteit Rotterdam en verbonden aan de research master History and Philosophy of Science van de Universiteit Utrecht.
Prof. Dr. E. Schliesser is hoogleraar politieke filosofie aan de Universiteit van Amsterdam. Tevens is hij als Visiting Faculty Fellow verbonden aan Center for Ethics, Murphy Center, Tulane University.
Victor Gijsbers; F.A. Muller; Eric Schliesser
Universiteit Leiden; Erasmus Universiteit Rotterdam, Universiteit Utrecht; Universiteit van Amsterdam
Copyright Amsterdam University Press 2025