Den amerikanske
naturvetenskapsmannen och filosofen Charles Sanders Pierce, död 1914,
funderade, långt före dataåldern, på vad som krävs för att beskriva
kommunikation, för att beskriva språkets
funktion, det matematiska eller vardagliga. Språk förutsätter tecken. Du har
inte en elefant inne i huvudet när du tänker på en elefant. Du har ett tecken.
Men det Pierce kallar ett tecken är en triad som består av ett objekt,
ett primärt tecken och en uttolkare. "Alla som tänker förnuftigt", säger Pierce,
"måste ha en eller annan generell föreställning om vad det vill säga att tänka
förnuftigt, och detta är en teori om logik."
Vilka logiska lagar gäller då vid användandet
av rationella argument och bedömning av vad erfarenheten säger oss, antingen erfarenheten
består av vetenskapliga experiment eller naturen talar till oss i
mer vardagliga sammanhang? Hur språkar vi bäst med naturen? Finns det en
idealmodell för sunt förnuft?
Den amerikanske biltillverkaren Henry Ford sa
en gång, att en bra idé är en idé man kan göra en maskin av. Idén om sunt
förnuft är en av de svåraste idéerna
att automatisera, att göra en programmerbar modell (en maskin) av. I själva verket
blir vi ständigt påminda om det kloka i att använda alla former av
automatiserat beslutstöd med sunt förnuft och inte med blind tilltro, annars
kan det gå riktigt galet. Detta är i själva verket ett av de bästa exemplen på
just sunt förnuft.
Men vad jag tjatar om sunt förnuft! Är inte en rationell varelse en som följer logikens
lagar, även om de skulle råka strida mot just sunt förnuft? Den deduktiva
logiken är förvisso en del i rationalitetsbegreppet, men bara som ett gränsfall. Det följande är ett försök att visa att den behöver utvidgas med
någon form av sunt förnuft.
Den deduktiva logiken härrör i sin helhet
ytterst från två slutledningsregler:
1. Om det är så att när A är
sant så är B sant, så kan man av att A är sant sluta sig till att B är sant.
2. Om det är så att när A är
sant så är B sant, så kan man av att B är osant sluta sig till att A är osant.
Sedan länge finns en fungerande programmerbar
modell, Booleansk algebra, som täcker in hela fältet av kombinationer och upprepningar av dessa
regler i en formell syntax. Lägg märke till att i en maskin som fungerar enligt denna
syntax så orsakar "icke-B" "icke-A" (enligt sats 2), men
detta är inget förhållande som en maskin som uppvisar sunt förnuft skulle tillskriva naturliga
förhållanden i sin omgivning.
Om A i maskinens omgivning är den fysiska orsaken till B,
så är det naturligtvis inte därmed troligt att frånvaron av B skulle orsaka
frånvaron av A!
En autonom robot som har att klara sig på egen
hand i verkligheten behöver alltså ha betydligt
fler verktyg än deduktiv logik till hands. Till att börja med behöver den en modell för sunt förnuft bara för att klara de flesta
förekommande situationer där man behöver dra troliga slutsatser av i deduktiv mening otillräcklig information.
Vi behöver en fungerande programmerbar modell för åtminstone tre former av
slutledningar som vi dagligen gör med sunda förnuftet:
1. Om det är så att när A är
sant så är B sant, så kan man av att B är sant sluta sig till att A är mer
sannolikt.
2. Om det är så att när A är
sant så är B sant, så kan man av att A är osant sluta sig till att B är mindre
sannolikt.
3. Om det är så att när A är
sant så är B mer sannolikt, så kan man av att B är
sant sluta sig till att A är mer sannolikt.
Som framgår av formuleringarna har vi
förflyttat oss från den deduktiva logiken till någon form av sannolikhetslära.
Vilka grundanspråk bör man ställa på en
modell för ett idealiserat sunt
förnuft?
Man kan som bekant inte jämföra äpplen med
päron, såvida man inte jämför dem efter en gemensam skala, t ex deras vikt. Ju mer vi lär oss hur
saker och ting hänger ihop, ju fler saker kan vi faktiskt jämföra efter en gemensam
skala. Som en första idealisering av det sunda förnuftet antas att allt kan bedömas
efter sin rimlighetsgrad och därmed jämföras med avseende på rimlighet.
De associativa och kommutativa reglerna i Booleansk
algebra leder emellertid till att om vi
vill kunna göra jämförelser av typen "hur rimligt är A givet C" i
förhållande till "B givet C" så måste vi kunna åsätta förhållandet
ett numeriskt värde, ett sannolikhetsvärde, annars blir sådana jämförelser i
förlängningen motsägande. Vi vill också kunna ange rimlighetsgraden på en
kontinuerlig skala så att bara en anings högre grad av rimlighet hos ett
påstående inte ger mer än en anings större sannolikhet för att påståendet skulle vara
sant. Det finns också en fundamental princip som ligger bakom varje korrekt
slutledning: Man bör kalkylera sannolikheten för att något är sant med
beaktande av all förhandenvarande erfarenhet!
Vi måste kunna lita på vårt idealiserade
sunda förnuft. Därför har vi också två grundanspråk på dess
"användargränssnitt".
1. En idealiserad modell måste ta med alla tidigare
erfarenheter som är relevanta för ett nytt problem, och inte av ideologiska
eller andra skäl bortse från viss erfarenhet.
2. Samma kunskap måste i alla situationer
tillmätas samma sannolikhet, d v s en rationellt handlande enhet måste i sina relationer till
omvärlden bete sig konsekvent.
Dessa regler tillsammans med konventionen att
sannolikheten (p) för att A är sant om B är sant skrivs p(A|B) är allt
som krävs för att logiskt härleda Bayes teorem.
Om vi har en hypotes och har samlat in data (D) för att undersöka
hypotesens giltighet så behöver vi inte bara bedöma sannolikheten ( p) för
dessa data givet hypotesen (H) och annan förhandenvarande initial
erfarenhet (I) - p(D|HI) - utan också bedöma
sannolikheten för dessa data enbart givet denna andra
förhandenvarande initiala erfarenhet - p(D|I)
- samt bedöma sannolikheten också för hypotesen enbart givet den
initiala erfarenheten - p(H|I).
Kvoten av de två första leden i beräkningarna
- p(D|HI)
och p(D|I) - kallas hypotesens
"rimlighet" (likelihood). I Bayes teorem fås sannolikheten för att en hypotes är sann givet data och annan förhandenvarande
initial erfarenhet (något som kallas dess "posterior", som betyder ungefär det som kommer efter, i logisk
mening inte nödvändigtvis temporärt eller kausalt!)
genom att multiplicera "rimligheten" med sannolikheten för att
hypotesen är sann enbart med avseende på den initiala erfarenheten enligt det
tredje ledet i beräkningarna ovan - p(H|I) - (denna sannolikhet kallas "prior", som betyder ungefär det som kommer före, igen i
logisk mening inte nödvändigtvis temporärt eller kausalt! ). Sannolikheten
för hypotesens giltighet givet data
och initial erfarenhet - p(H|DI) - ges därför på följande sätt av Bayes teorem:
.gif)
Detta teorem kan utläsas som att den
beräknade sannolikheten (posterior) är lika med den initiala sannolikheten (prior) multiplicerad med rimligheten.
Hur man delar upp all förhandenvarande
erfarenhet mellan data och annan erfarenhet är egentligen oviktigt eftersom beräkningarna
ändå, enligt våra grundanspråk på rationalitet, skall leda till samma resultat.
Det blir mest en fråga om att hitta en uppdelning
där vi kan utföra beräkningarna. Att göra rationella slutledningar blir därmed
en kreativ aktivitet i utgångsläget. Det är t ex viktigt att hitta en hypotes ( ur mängden av alla tänkbara )
som är rimlig och kan testas och beräknas!
Den deduktiva logikens två slutledningsregler kan i vårt vidgade perspektiv skivas om på följande vis:
1. Sannolikheten för att B
är sant givet A gränsar till 1 givet summan av alla våra erfarenheter C.
2. Sannolikheten för att A
är sant givet icke-B gränsar till 0 givet summan av alla våra erfarenheter C.
Hela den deduktiva logiken reduceras till
dessa gränsfall, där något antingen är helt
rimligt eller fullständigt orimligt, medan Bayes teorem är det mest kraftfulla
verktyget för alla slutledningar i den meningen att det uttömmande säger vilka
sannolikheter man bör räkna med givet viss information.
Bayes teorem garanterar bland annat att alla
rationella sätt att nå en slutledning på ger samma resultat (vilket inte
hindrar rationella konflikter beroende på olika utgångspunkter!)
Sannolikhetsläran och de därpå grundade
statistiska slutledningsmetoderna är en utbyggnad på deduktiv logik och omfattar denna som ett
gränsfall. Statistiska resonemang som anlägger detta synsätt
kallas ibland Bayesiansk analys.
Att göra Bayesiansk analys är att vara rationell.
Inom evolutionen, såväl den biologiska som den kunskapsmässiga fungerar Bayes teorem som en slags gravitationslag, en regel som i det långa loppet är den utslagsgivande. För de som
likt Casti
inte erkänner evolutionens vetenskapliga status, därför att de inte hittat en
matematisk modell motsvarande de matematiska modeller som används inom den övriga
naturvetenskapen, är det nu dags att kasta
in handduken. Hur Bayes teorem, matematiska modeller och abstrakta idéer i allmänhet knyter ihop
idéutveckling med biologisk utveckling återkommer jag till i nästa kapitel.
Statistik handlar oftast om vilka utfall
man kan förvänta sig. Den berömda normalfördelningen, formad som en kyrkklocka,
visar hur man förväntar sig att t ex längden av alla nyinryckta värnpliktiga
fördelar sig när man mäter dem. Sådana sannolikhetsfördelningar förmedlar information, blir en kunskap i sig och är viktiga att hitta. Men för naturvetenskapsmän är det
oftast inte att se om data passar med den förväntade fördelningen som är det mest pressande
slutledningsproblemet, utan att se om hittade data stöder en viss hypotes, och i så fall med vilken sannolikhet. Sannolikhet blir då en fråga om graden av tilltro till en tes, eller
om man så vill, styrkan i kunskapen.
Det blir då också uppenbart att alla
sannolikhetsberäkningar är beroende av ingående kunskapsförhållanden (medvetna
eller omedvetna förutsättningar). Normalfördelningen är ofta användbar när man inte
vet vad man kan förvänta sig av data. Man kan jämföra resultatet med den som grundförutsättning. Många
sådana sannolikhetsfördelningar finns och flera kommer till
hela tiden. Det viktiga är att dessa matematiska modeller nu kan ackumuleras
och byggas upp till en vetenskaplig kunskapsteori.
Om man gör Bayesiansk analys "baklänges" kan den också
användas för att mäta styrkan i våra uppfattningar i olika frågor. Vilka
alternativa uppfattningar kan vi tänka oss om vår favoritkäpphäst inte slår in?
Jag har i mångt och mycket skrivit den här boken för att reda ut hur mycket
tilltro jag ställer till naturvetenskaparnas nyvunna optimism att snart ha
svaren på de yttersta frågorna.
Bayesiansk slutledningsteori brukar ibland beskyllas för att
vara subjektiv därför att bland all förhandenvarande erfarenhet som måste beaktas finns
naturligtvis den subjektiva uppfattningen av situationen. Detta är emellertid
styrkan hos Bayesiansk slutledningsteori, vilket i praktiken förvandlar den till en kunskapsteori. Och eftersom Bayesiansk
slutledningsteori är en matematisk teori förvandlar den den hopplösa
filosofiska grenen kunskapsteori till en vetenskapsgren med potentiellt omvälvande
implikationer.
Vilken objektiv betydelse den
subjektiva uppfattningen av situationen har för olika utfalls sannolikhet belyses kristallkart med
följande exempel. Data talar aldrig för sig själva!
För några år sedan diskuterades problemet med
bilen och getterna livligt i en del tidskrifter.
Vid en TV-tävling fick den tävlande chansen
att vinna en bil om han/hon kunde välja rätt dörr bland tre. Bakom en dörr
fanns en bil och bakom de två övriga stod en get. Oavsett vilken dörr den
tävlande pekade på så valde tävlingsledaren att öppna en av de två andra - och
där stod en get! Han erbjöd därefter den tävlande att hålla fast vid sitt
ursprungliga val eller byta dörr och peka på den andra av de två ännu ej
öppnade dörrarna.
Problemet är: Kan den tävlande öka sin chans
att vinna bilen genom att byta dörr?
Svaret är: Det beror på hur den tävlande
subjektivt uppfattar situationen!
Om den tävlande uppfattar programledarens
strategi så att han alltid öppnar en "getdörr" för att kunna öka spänningen i
tävlingen genom att ge den tävlande erbjudandet att byta dörr så ökar han/hon
sin chans till bilen genom att byta.
Om den tävlande tror att programledaren är en
elak typ som bara erbjuder den tävlande att byta dörr om han/hon valt
vinstdörren så förlorar naturligtvis han/hon sin chans till bilen genom att
byta.
Om den tävlande tror att programledaren är en
snäll typ som bara erbjuder den tävlande att byta dörr om han/hon valt en
getdörr så vinner han/hon naturligtvis bilen genom att byta.
Om den tävlande tror att programledaren är
berusad och slumpmässigt öppnar en av de kvarvarande dörrarna oavsett om där
finns en bil eller get bakom, och det därför bara råkade vara en get bakom den
öppnade dörren, så spelar det ingen roll om han/hon byter dörr eftersom chansen
att det står en bil bakom den slutligt valda dörren förblir densamma.
När man resonerar rationellt måste man ta med
i beräkningen all information man har om situationen
(inklusive den egna förmågan att intuitivt bedöma andras personligheter) och
liknande situationer i det förgångna. Ackumulationen av information genom
erfarenhet ger, i bästa fall, den mogna människan den mentala stabiliteten
att motstå diverse fantasier.
Samtidigt måste man hålla i minnet att alla
erfarna samband inte är orsakssamband och att sådana samband aldrig kan ersätta
förnuftigt resonerande. På vad sätt en explosionsmotor kan sluta att fungera vet
oftast den som konstruerat den mycket bättre än vad en mängd tester och
statistiska beräkningar kan leda till. Den kunskapen skall alltså tas med,
liksom kunskap om naturlagar och annat. Slumpmässiga tester
är egentligen bäst lämpade för att upptäcka helt oväntade saker.
Induktionsproblemet: Vid opinionsundersökningar drar man slutsatser om åsikterna hos människor som
inte tillfrågats i en viss undersökning utifrån svaren från de som tillfrågats.
På vad sätt skiljer sig det från att dra slutsatsen att 10 sexor i rad, i en
experimentserie där utfallen kan variera mellan 1 till 6, ökar sannolikheten
att nästa utfall är just 6?
Det beror på bakomliggande information. Om vi får reda på att det senare handlar om tärningskast och om vi
får kontrollera tärningen - och tror att kastaren är ärlig - så drar vi
slutsatsen att sannolikheten för 6 i nästa kast är 1 på 6. Om vi inte får
kontrollera tärningen kan vi dra den induktiva slutsatsen att något förmodligen
systematiskt influerar tärningskastet på samma sätt varje gång och att
sannolikheten för 6 i nästa utfall är större än 1 på 6. Om vi får reda på att
tärningen består av sex sidor med samma nummer, men inte vilket, är
naturligtvis sannolikheten för 6 i nästa kast lika med 1. Om det finns en
mekanism som ser till att efter 90 kast
så är antalet möjliga utfall exakt 15 av varje, så får vi använda oss av en
annan regel för att beräkna sannolikheten för 6 i nästa utfall.
Det finns alltså inte någon generell regel
för att göra induktiva slutledningar, utan man får använda olika medel beroende
på vilken bakomliggande information man har tillgång till. Men
detta är naturligtvis inte detsamma som att induktion är omöjlig, som filosoferna
Hume och Popper hävdat.
Induktiva resonemang visar vilka
förutsägelser vi kan göra utifrån den information vi väljer att använda vid våra
beräkningar. Det kan ofta vara bra att göra beräkningar utifrån hypoteser vi
inte tror på, eller till och med är säkra på är fel, för att se vilka
förutsägelser de leder till. När man sätter upp ett experiment är det ofta genom att göra
sådana beräkningar man kan bestämma vad man ska leta efter och vad man hoppas
inte skall dyka upp om de förmodat felaktiga alternativa teorierna är riktiga.
Och utan induktiva resonemang skulle vetenskapsmän aldrig veta hur de skulle
kunna testa sina teorier.
Om en teori fortsätter att ge förväntade
experimentella resultat, d v s göra riktiga förutsägelser, blir
vetenskapsmännen mer och mer säkra på att den innehåller mer än ett korn av
sanning, men det är viktigt att inse att lyckade förutsägelser inte leder till
någon ny kunskap, bara att man med större
tilltro kan planera utifrån en kunskap man redan har.
När förutsägelserna visar sig vara fel är de
som mest användbara! Då är den kunskap vi utgår från fel eller
ofullständig och sättet förutsägelsen falsifierades på kan ge ledtrådar till
hur kunskapen bör förändras för att bli bättre. Det är ju ingenting i
verkligheten som har förändrats utan bara
sannolikheterna som representerar vår kunskap.
Att fråga vad sannolikheten är att vissa
resultat ska uppkomma är att fråga om sannolikheten för de förhållanden som
leder till dessa resultat, och har vi kläm på hela den kausala kedjan under
experimentet är det sannolikheten för de olika ingångsförhållandena till
experimentet som vi frågar om. Den som vet om att rotationsmomentet bevaras när
man singlar slant kan ganska lätt öva upp förmågan att få krona eller klave "på
beställning"!
Men
vilka kausala förhållanden leder till ingångsförhållandena? När vi har kläm på
det har vi förflyttat frågan om sannolikheten ytterligare en nivå bort. Detta
kommer med ökande kunskap att fortgå hela tiden. Det verkar aldrig som vi kommer till en av
vår kunskap oberoende sannolikhet! När man formulerar sannolikheten i termer av logik är det just för att undkomma
denna regress, allteftersom de olika
empiriska vetenskaperna utökar sina kunskapsdomäner.
Men om sannolikheter inte är fysiska av oss
oberoende entiteter, hur kan man då använda statistiska metoder för att
utvärdera t ex effektiviteten eller biverkningar av medicinska behandlingar?
Ja, egentligen vore den enda säkra metoden att följa varje kemisk reaktion i
detalj som följer på att inta en viss medicin hos personer i alla tänkbara
hälsostadier. Då skulle vi kunna förutsäga vilken effekt medicinen skulle få
hos varje ny patient som får den ordinerad. Eftersom detta inte är praktiskt
möjligt ger man medicinen till en grupp personer som är tillräckligt stor för
att man ska kunna anta att individerna skiljer sig initialt väldigt mycket i
relevanta hälsoaspekter. Man noterar så frekvensen som blir hjälpta av
medicinen och antar induktivt att om inget oförutsett inträffar håller sig
denna relativa frekvens även vid framtida behandlingar. Men om matvanor eller
andra livsstilsförändringar inträffar är det mycket möjligt att frekvensen som
blir hjälpta går upp eller ner, vilket då blir en indikation på att just
levnadsvanor hos allmänheten har ändrats.
Det finns alltid en fysisk
mekanism som orsak till att ett fenomen uppträder återkommande. En induktiv hypotes som inte förutsatte det vore inte något annat än ren vidskepelse.
Vissa populärvetenskapliga journalister som rapporterar om hur djur
ändamålsenligt anpassar sig till sin omgivning tycks inte ha fattat att ett osubstansiellt ändamål naturligtvis
inte kan åstadkomma fysiska förändringar i djuret. Man har ställt Darwin på
huvudet. Istället uppkommer en mutation i djuret först, som därefter söker upp en miljö där det kan
överleva. Bara de som lyckas med detta finns kvar att rapportera om och det ser
därför ut som om de varit fantastiska på att anpassa sig till "sin" omgivning.
En sjua och en åtta i en kortlek har lika
stor chans att dyka upp i en bridgehand, därför att det bara är de mekaniska krafterna vid blandningen som
bestämmer vilka kort jag får i min hand och inte vad som är tryckt på kortet.
Vid kortblandning är situationen symmetrisk med avseende på vad som är tryckt
på korten, vi kan därför med nästan lika hög säkerhet som vid deduktivt
resonerande tro att åttan och sjuan har samma chans att hamna i en bridgehand.
Symmetrier under situationens
förutsättningar leder till exakta förutsägelser (samma informationsinnehåll skall ge samma sannolikhet) och kan omvänt användas vid experimentella resultat som avviker från
dessa förutsägelser för att hitta systematiska förändringar av den fysiska mekanismen bakom
de förväntade upprepningarna.
Om vi inte vet tillräckligt om en situation
kan vi inte säga att vi kan utesluta okända influenser. T ex om vi inte
studerat slanten kan vi bara antaga att det är fifty-fifty om den kommer upp
krona eller klave vid första singlingen, men efter hand kanske en trend uppkommer som inte stämmer, och
vi måste leta efter okända influenser. Symmetriargument är ett sätt att sätta
initiala sannolikheter. När vi inte har kunskap om några klara symmetrier är
frågan om hur vi sätter initiala sannolikheter öppen från varje speciell
situation till nästa. En total okunnighet skulle innebära att man kan använda
sig av principen om maximal oordning.
Om jag har en förkunskap måste jag försöka ta
med i beräkningen inte bara den, utan också alla möjligheter som inte
begränsas av denna min förkunskap och erkänna full osäkerhet beträffande dessa. Det ger ett
mått på min information om situationen. Den maximala oordningen är den som det absolut
övervägande antalet faktiska möjliga "grupperingar" är godtyckligt nära.
Shannon, grundaren av informationsteorin, kallar informationsmängden "ett mått
på vår osäkerhet". Det är här man ser sambandet mellan statistik, empiriska
mätningar och kommunikationsteori. I alla används samma slutledningsprinciper. Varje gång vi använder
oss av normalfördelningskurvan för att sätta initiala sannolikheter är det bara
en enkel användning av principen om maximal oordning. Principen förhindrar att vi använder initiala
sannolikhetsfördelningar som vår kunskap