Draget från oändligheten av   Lennart Nilsson (Del 1)    
    ©2001 2002 2003
  
Lennart Nilsson  

      "En beprövad strategi för att få grepp om ett förbryllande  ämne är att skriva en bok om det." David Wick

   NATURENS SPRÅK
   SPRÅKA MED NATUREN
   KULTURVETENSKAP
   NATURVETENSKAP
   STANDARDMODELLEN
   KOSMOLOGIN





Webdesign Indexkompaniet Nilsson HB


Introduktion
Intermezzo 1
Intermezzo 2
Intermezzo 3
Ordlista

ATT SPRÅKA MED NATUREN

 

Den amerikanske naturvetenskapsmannen och filosofen Charles Sanders Pierce, död 1914, funderade, långt före dataåldern, på vad som krävs för att beskriva kommunikation, för att beskriva språkets funktion, det matematiska eller vardagliga. Språk förutsätter tecken. Du har inte en elefant inne i huvudet när du tänker på en elefant. Du har ett tecken. Men det Pierce kallar ett tecken är en triad som består av ett objekt, ett primärt tecken och en uttolkare.[1]  "Alla som tänker förnuftigt", säger Pierce, "måste ha en eller annan generell föreställning om vad det vill säga att tänka förnuftigt, och detta är en teori om logik."

Vilka logiska lagar gäller då vid användandet av rationella argument och bedömning av vad erfarenheten säger oss, antingen erfarenheten består av vetenskapliga experiment eller naturen talar till oss i mer vardagliga sammanhang? Hur språkar vi bäst med naturen? Finns det en idealmodell för sunt förnuft?[2]

Den amerikanske biltillverkaren Henry Ford sa en gång, att en bra idé är en idé man kan göra en maskin av. Idén om sunt förnuft är en av de svåraste idéerna att automatisera, att göra en programmerbar modell (en maskin) av. I själva verket blir vi ständigt påminda om det kloka i att använda alla former av automatiserat beslutstöd med sunt förnuft och inte med blind tilltro, annars kan det gå riktigt galet. Detta är i själva verket ett av de bästa exemplen på just sunt förnuft.

Men vad jag tjatar om sunt förnuft! Är inte en rationell varelse en som följer logikens lagar, även om de skulle råka strida mot just sunt förnuft? Den deduktiva logiken är förvisso en del i rationalitetsbegreppet, men bara som ett gränsfall. Det följande är ett försök att visa att den behöver utvidgas med någon form av sunt förnuft.

Den deduktiva logiken härrör i sin helhet ytterst från två slutledningsregler:

 

1. Om det är så att när A är sant så är B sant, så kan man av att A är sant sluta sig till att B är sant.

 

2. Om det är så att när A är sant så är B sant, så kan man av att B är osant sluta sig till att A är osant.

 

Sedan länge finns en fungerande programmerbar modell, Booleansk algebra, som täcker in hela fältet av kombinationer och upprepningar av dessa regler i en formell syntax. Lägg märke till att i en maskin som fungerar enligt denna syntax så orsakar "icke-B" "icke-A" (enligt sats 2), men detta är inget förhållande som en maskin som uppvisar sunt förnuft skulle tillskriva naturliga förhållanden i sin omgivning.

Om A i maskinens omgivning är den fysiska orsaken till B, så är det naturligtvis inte därmed troligt att frånvaron av B skulle orsaka frånvaron av A!

En autonom robot som har att klara sig på egen hand i verkligheten behöver alltså ha betydligt fler verktyg än deduktiv logik till hands. Till att börja med behöver den en modell för sunt förnuft bara för att klara de flesta förekommande situationer där man behöver dra troliga slutsatser av i deduktiv mening otillräcklig information.

Vi behöver en fungerande programmerbar modell för åtminstone tre former av slutledningar som vi dagligen gör med sunda förnuftet:

 

1. Om det är så att när A är sant så är B sant, så kan man av att B är sant sluta sig till att A är mer sannolikt.

 

2. Om det är så att när A är sant så är B sant, så kan man av att A är osant sluta sig till att B är mindre sannolikt.

 

3. Om det är så att när A är sant så är B mer sannolikt, så kan man av att B är sant sluta sig till att A är mer sannolikt.

 

Som framgår av formuleringarna har vi förflyttat oss från den deduktiva logiken till någon form av sannolikhetslära.

Vilka grundanspråk bör man ställa på en modell för ett idealiserat sunt förnuft?

Man kan som bekant inte jämföra äpplen med päron, såvida man inte jämför dem efter en gemensam skala, t ex deras vikt. Ju mer vi lär oss hur saker och ting hänger ihop, ju fler saker kan vi faktiskt jämföra efter en gemensam skala. Som en första idealisering av det sunda förnuftet antas att allt kan bedömas efter sin rimlighetsgrad och därmed jämföras med avseende på rimlighet.

De associativa och kommutativa reglerna i Booleansk[3] algebra leder emellertid till att om vi vill kunna göra jämförelser av typen "hur rimligt är A givet C" i förhållande till "B givet C" så måste vi kunna åsätta förhållandet ett numeriskt värde, ett sannolikhetsvärde, annars blir sådana jämförelser i förlängningen motsägande. Vi vill också kunna ange rimlighetsgraden på en kontinuerlig skala så att bara en anings högre grad av rimlighet hos ett påstående inte ger mer än en anings större sannolikhet för att påståendet skulle vara sant. Det finns också en fundamental princip som ligger bakom varje korrekt slutledning: Man bör kalkylera sannolikheten för att något är sant med beaktande av all förhandenvarande erfarenhet!

Vi måste kunna lita på vårt idealiserade sunda förnuft. Därför har vi också två grundanspråk på dess "användargränssnitt".

 

1. En idealiserad modell måste ta med alla tidigare erfarenheter som är relevanta för ett nytt problem, och inte av ideologiska eller andra skäl bortse från viss erfarenhet.

 

2. Samma kunskap måste i alla situationer tillmätas samma sannolikhet, d v s en rationellt handlande enhet måste i sina relationer till omvärlden bete sig konsekvent.

 

Dessa regler tillsammans med konventionen att sannolikheten (p) för att A är sant om B är sant skrivs p(A|B) är allt som krävs för att logiskt härleda Bayes teorem.

Om vi har en hypotes och har samlat in data (D) för att undersöka hypotesens giltighet så behöver vi inte bara bedöma sannolikheten ( p) för dessa data givet hypotesen (H) och annan förhandenvarande initial erfarenhet (I) - p(D|HI) - utan också bedöma sannolikheten för dessa data enbart givet denna andra förhandenvarande initiala erfarenhet - p(D|I) - samt bedöma sannolikheten också för hypotesen enbart givet den initiala erfarenheten - p(H|I).

Kvoten av de två första leden i beräkningarna -  p(D|HI) och p(D|I) - kallas hypotesens "rimlighet" (likelihood). I Bayes teorem fås sannolikheten för att en hypotes är sann givet data och annan förhandenvarande initial erfarenhet (något som kallas dess "posterior", som betyder ungefär det som kommer efter, i logisk mening  inte nödvändigtvis temporärt eller kausalt!) genom att multiplicera "rimligheten" med sannolikheten för att hypotesen är sann enbart med avseende på den initiala erfarenheten enligt det tredje ledet i beräkningarna ovan  - p(H|I) - (denna sannolikhet kallas "prior", som betyder ungefär det som kommer före, igen i logisk mening inte nödvändigtvis temporärt eller kausalt! ). Sannolikheten för hypotesens giltighet givet data och initial erfarenhet - p(H|DI) - ges därför på följande sätt av Bayes teorem:

 

 Figur 1 – Bayes teorem

 

Detta teorem kan utläsas som att den beräknade sannolikheten (posterior) är lika med den initiala sannolikheten (prior) multiplicerad med rimligheten.

Hur man delar upp all förhandenvarande erfarenhet mellan data och annan erfarenhet är egentligen oviktigt eftersom beräkningarna ändå, enligt våra grundanspråk på rationalitet, skall leda till samma resultat.

Det blir mest en fråga om att hitta en uppdelning där vi kan utföra beräkningarna. Att göra rationella slutledningar blir därmed en kreativ aktivitet i utgångsläget. Det är t ex viktigt att hitta en hypotes ( ur mängden av alla tänkbara ) som är rimlig och kan testas och beräknas!

Den deduktiva logikens två slutledningsregler kan i vårt vidgade perspektiv skivas om på följande vis:

 

1. Sannolikheten för att B är sant givet A gränsar till 1 givet summan av alla våra erfarenheter C.

 

2. Sannolikheten för att A är sant givet icke-B gränsar till 0 givet summan av alla våra erfarenheter C.

 

Hela den deduktiva logiken reduceras till dessa gränsfall, där något antingen är helt rimligt eller fullständigt orimligt, medan Bayes teorem är det mest kraftfulla verktyget för alla slutledningar i den meningen att det uttömmande säger vilka sannolikheter man bör räkna med givet viss information.

Bayes teorem garanterar bland annat att alla rationella sätt att nå en slutledning på ger samma resultat (vilket inte hindrar rationella konflikter beroende på olika utgångspunkter!)

Sannolikhetsläran och de därpå grundade statistiska slutledningsmetoderna är en utbyggnad på deduktiv logik och omfattar denna som ett gränsfall. Statistiska resonemang som anlägger detta synsätt kallas ibland Bayesiansk analys.[4] Att göra Bayesiansk analys är att vara rationell.[5] Inom evolutionen, såväl den biologiska som den kunskapsmässiga fungerar Bayes teorem som en slags gravitationslag, en regel som i det långa loppet är den utslagsgivande. För de som likt Casti[6] inte erkänner evolutionens vetenskapliga status, därför att de inte hittat en matematisk modell motsvarande de matematiska modeller som används inom den övriga naturvetenskapen, är det nu dags att kasta in handduken. Hur Bayes teorem, matematiska modeller och abstrakta idéer i allmänhet knyter ihop idéutveckling med biologisk utveckling återkommer jag till i nästa kapitel.

Statistik handlar oftast om vilka utfall man kan förvänta sig. Den berömda normalfördelningen, formad som en kyrkklocka, visar hur man förväntar sig att t ex längden av alla nyinryckta värnpliktiga fördelar sig när man mäter dem. Sådana sannolikhetsfördelningar förmedlar information, blir en kunskap i sig och är viktiga att hitta. Men för naturvetenskapsmän är det oftast inte att se om data passar med den förväntade fördelningen som är det mest pressande slutledningsproblemet, utan att se om hittade data stöder en viss hypotes, och i så fall med vilken sannolikhet. Sannolikhet blir då en fråga om graden av tilltro till en tes, eller om man så vill, styrkan i kunskapen.

Det blir då också uppenbart att alla sannolikhetsberäkningar är beroende av ingående kunskapsförhållanden (medvetna eller omedvetna förutsättningar). Normalfördelningen är ofta användbar när man inte vet vad man kan förvänta sig av data. Man kan jämföra resultatet med den som grundförutsättning. Många sådana sannolikhetsfördelningar finns och flera kommer till hela tiden. Det viktiga är att dessa matematiska modeller nu kan ackumuleras och byggas upp till en vetenskaplig kunskapsteori.

Om man gör Bayesiansk analys "baklänges" kan den också användas för att mäta styrkan i våra uppfattningar i olika frågor. Vilka alternativa uppfattningar kan vi tänka oss om vår favoritkäpphäst inte slår in? Jag har i mångt och mycket skrivit den här boken för att reda ut hur mycket tilltro jag ställer till naturvetenskaparnas nyvunna optimism att snart ha svaren på de yttersta frågorna.

Bayesiansk slutledningsteori brukar ibland beskyllas för att vara subjektiv därför att bland all förhandenvarande erfarenhet som måste beaktas finns naturligtvis den subjektiva uppfattningen av situationen. Detta är emellertid styrkan hos Bayesiansk slutledningsteori, vilket i praktiken förvandlar den till en kunskapsteori. Och eftersom Bayesiansk  slutledningsteori är en matematisk teori förvandlar den den hopplösa filosofiska grenen kunskapsteori till en vetenskapsgren med potentiellt omvälvande implikationer.

Vilken objektiv betydelse den subjektiva uppfattningen av situationen har för olika utfalls sannolikhet belyses kristallkart med följande exempel. Data talar aldrig för sig själva!

För några år sedan diskuterades problemet med bilen och getterna livligt i en del tidskrifter.

Vid en TV-tävling fick den tävlande chansen att vinna en bil om han/hon kunde välja rätt dörr bland tre. Bakom en dörr fanns en bil och bakom de två övriga stod en get. Oavsett vilken dörr den tävlande pekade på så valde tävlingsledaren att öppna en av de två andra - och där stod en get! Han erbjöd därefter den tävlande att hålla fast vid sitt ursprungliga val eller byta dörr och peka på den andra av de två ännu ej öppnade dörrarna.

Problemet är: Kan den tävlande öka sin chans att vinna bilen genom att byta dörr?

Svaret är: Det beror på hur den tävlande subjektivt uppfattar situationen!

Om den tävlande uppfattar programledarens strategi så att han alltid öppnar en "getdörr" för att kunna öka spänningen i tävlingen genom att ge den tävlande erbjudandet att byta dörr så ökar han/hon sin chans till bilen genom att byta.

Om den tävlande tror att programledaren är en elak typ som bara erbjuder den tävlande att byta dörr om han/hon valt vinstdörren så förlorar naturligtvis han/hon sin chans till bilen genom att byta.

Om den tävlande tror att programledaren är en snäll typ som bara erbjuder den tävlande att byta dörr om han/hon valt en getdörr så vinner han/hon naturligtvis bilen genom att byta.

Om den tävlande tror att programledaren är berusad och slumpmässigt öppnar en av de kvarvarande dörrarna oavsett om där finns en bil eller get bakom, och det därför bara råkade vara en get bakom den öppnade dörren, så spelar det ingen roll om han/hon byter dörr eftersom chansen att det står en bil bakom den slutligt valda dörren förblir densamma.

När man resonerar rationellt måste man ta med i beräkningen all information man har om situationen (inklusive den egna förmågan att intuitivt bedöma andras personligheter) och liknande situationer i det förgångna. Ackumulationen av information genom erfarenhet ger, i bästa fall, den mogna människan den mentala stabiliteten att motstå diverse fantasier.

Samtidigt måste man hålla i minnet att alla erfarna samband inte är orsakssamband och att sådana samband aldrig kan ersätta förnuftigt resonerande. På vad sätt en explosionsmotor kan sluta att fungera vet oftast den som konstruerat den mycket bättre än vad en mängd tester och statistiska beräkningar kan leda till. Den kunskapen skall alltså tas med, liksom kunskap om naturlagar och annat. Slumpmässiga tester är egentligen bäst lämpade för att upptäcka helt oväntade saker.

Induktionsproblemet: Vid opinionsundersökningar drar man slutsatser om åsikterna hos människor som inte tillfrågats i en viss undersökning utifrån svaren från de som tillfrågats. På vad sätt skiljer sig det från att dra slutsatsen att 10 sexor i rad, i en experimentserie där utfallen kan variera mellan 1 till 6, ökar sannolikheten att nästa utfall är just 6?

Det beror på bakomliggande information. Om vi får reda på att det senare handlar om tärningskast och om vi får kontrollera tärningen - och tror att kastaren är ärlig - så drar vi slutsatsen att sannolikheten för 6 i nästa kast är 1 på 6. Om vi inte får kontrollera tärningen kan vi dra den induktiva slutsatsen att något förmodligen systematiskt influerar tärningskastet på samma sätt varje gång och att sannolikheten för 6 i nästa utfall är större än 1 på 6. Om vi får reda på att tärningen består av sex sidor med samma nummer, men inte vilket, är naturligtvis sannolikheten för 6 i nästa kast lika med 1. Om det finns en mekanism som ser till att efter 90 kast så är antalet möjliga utfall exakt 15 av varje, så får vi använda oss av en annan regel för att beräkna sannolikheten för 6 i nästa utfall.

Det finns alltså inte någon generell regel för att göra induktiva slutledningar, utan man får använda olika medel beroende på vilken bakomliggande information man har tillgång till. Men detta är naturligtvis inte detsamma som att induktion är omöjlig, som filosoferna Hume och Popper hävdat.[7]

Induktiva resonemang visar vilka förutsägelser vi kan göra utifrån den information vi väljer att använda vid våra beräkningar. Det kan ofta vara bra att göra beräkningar utifrån hypoteser vi inte tror på, eller till och med är säkra på är fel, för att se vilka förutsägelser de leder till. När man sätter upp ett experiment är det ofta genom att göra sådana beräkningar man kan bestämma vad man ska leta efter och vad man hoppas inte skall dyka upp om de förmodat felaktiga alternativa teorierna är riktiga. Och utan induktiva resonemang skulle vetenskapsmän aldrig veta hur de skulle kunna testa sina teorier.

Om en teori fortsätter att ge förväntade experimentella resultat, d v s göra riktiga förutsägelser, blir vetenskapsmännen mer och mer säkra på att den innehåller mer än ett korn av sanning, men det är viktigt att inse att lyckade förutsägelser inte leder till någon ny kunskap, bara att man med större tilltro kan planera utifrån en kunskap man redan har.

När förutsägelserna visar sig vara fel är de som mest användbara! Då är den kunskap vi utgår från fel eller ofullständig och sättet förutsägelsen falsifierades på kan ge ledtrådar till hur kunskapen bör förändras för att bli bättre. Det är ju ingenting i verkligheten som har förändrats utan bara sannolikheterna som representerar vår kunskap.

Att fråga vad sannolikheten är att vissa resultat ska uppkomma är att fråga om sannolikheten för de förhållanden som leder till dessa resultat, och har vi kläm på hela den kausala kedjan under experimentet är det sannolikheten för de olika ingångsförhållandena till experimentet som vi frågar om. Den som vet om att rotationsmomentet bevaras när man singlar slant kan ganska lätt öva upp förmågan att få krona eller klave "på beställning"!

 Men vilka kausala förhållanden leder till ingångsförhållandena? När vi har kläm på det har vi förflyttat frågan om sannolikheten ytterligare en nivå bort. Detta kommer med ökande kunskap att fortgå hela tiden. Det verkar aldrig som vi kommer till en av vår kunskap oberoende sannolikhet! När man formulerar sannolikheten i termer av logik är det just för att undkomma denna regress, allteftersom de olika empiriska vetenskaperna utökar sina kunskapsdomäner.[8]

Men om sannolikheter inte är fysiska av oss oberoende entiteter, hur kan man då använda statistiska metoder för att utvärdera t ex effektiviteten eller biverkningar av medicinska behandlingar? Ja, egentligen vore den enda säkra metoden att följa varje kemisk reaktion i detalj som följer på att inta en viss medicin hos personer i alla tänkbara hälsostadier. Då skulle vi kunna förutsäga vilken effekt medicinen skulle få hos varje ny patient som får den ordinerad. Eftersom detta inte är praktiskt möjligt ger man medicinen till en grupp personer som är tillräckligt stor för att man ska kunna anta att individerna skiljer sig initialt väldigt mycket i relevanta hälsoaspekter. Man noterar så frekvensen som blir hjälpta av medicinen och antar induktivt att om inget oförutsett inträffar håller sig denna relativa frekvens även vid framtida behandlingar. Men om matvanor eller andra livsstilsförändringar inträffar är det mycket möjligt att frekvensen som blir hjälpta går upp eller ner, vilket då blir en indikation på att just levnadsvanor hos allmänheten har ändrats.

Det finns alltid en fysisk mekanism som orsak till att ett fenomen uppträder återkommande. En induktiv hypotes som inte förutsatte det vore inte något annat än ren vidskepelse. Vissa populärvetenskapliga journalister som rapporterar om hur djur ändamålsenligt anpassar sig till sin omgivning tycks inte ha fattat att ett osubstansiellt ändamål naturligtvis inte kan åstadkomma fysiska förändringar i djuret. Man har ställt Darwin på huvudet. Istället uppkommer en mutation i djuret först, som därefter söker upp en miljö där det kan överleva. Bara de som lyckas med detta finns kvar att rapportera om och det ser därför ut som om de varit fantastiska på att anpassa sig till "sin" omgivning.

En sjua och en åtta i en kortlek har lika stor chans att dyka upp i en bridgehand, därför att det bara är de mekaniska krafterna vid blandningen som bestämmer vilka kort jag får i min hand och inte vad som är tryckt på kortet. Vid kortblandning är situationen symmetrisk med avseende på vad som är tryckt på korten, vi kan därför med nästan lika hög säkerhet som vid deduktivt resonerande tro att åttan och sjuan har samma chans att hamna i en bridgehand.

Symmetrier under situationens förutsättningar leder till exakta förutsägelser (samma informationsinnehåll skall ge samma sannolikhet) och kan omvänt användas vid experimentella resultat som avviker från dessa förutsägelser för att hitta systematiska förändringar av den fysiska mekanismen bakom de förväntade upprepningarna.

Om vi inte vet tillräckligt om en situation kan vi inte säga att vi kan utesluta okända influenser. T ex om vi inte studerat slanten kan vi bara antaga att det är fifty-fifty om den kommer upp krona eller klave vid första singlingen, men efter hand kanske en trend uppkommer som inte stämmer, och vi måste leta efter okända influenser. Symmetriargument är ett sätt att sätta initiala sannolikheter. När vi inte har kunskap om några klara symmetrier är frågan om hur vi sätter initiala sannolikheter öppen från varje speciell situation till nästa. En total okunnighet skulle innebära att man kan använda sig av principen om maximal oordning.

Om jag har en förkunskap måste jag försöka ta med i beräkningen inte bara den, utan också alla möjligheter som inte begränsas av denna min förkunskap och erkänna full osäkerhet beträffande dessa. Det ger ett mått på min information om situationen. Den maximala oordningen är den som det absolut övervägande antalet faktiska möjliga "grupperingar" är godtyckligt nära. Shannon, grundaren av informationsteorin, kallar informationsmängden "ett mått på vår osäkerhet". Det är här man ser sambandet mellan statistik, empiriska mätningar och kommunikationsteori. I alla används samma slutledningsprinciper. Varje gång vi använder oss av normalfördelningskurvan för att sätta initiala sannolikheter är det bara en enkel användning av principen om maximal oordning. Principen förhindrar att vi använder initiala sannolikhetsfördelningar som vår kunskap