Brus i maskineriet
Den som sett en fotbollsmatch vet att domare ibland dömer fel. Nu har man börjat använda teknikstöd. Domarna har fått videoassistenter på vars inrådan de kan ändra sina domslut. Men det är fortfarande domaren som dömer. Fotbollsdomare är en utsatt yrkeskår. Deras domslut väcker starka känslor och när det blir fel är det många som reagerar. Men även om det kan handla om mycket pengar är fotboll en lek och snart är det match igen. Det är viktigare att det blir rätt när domare dömer i brottmål, läkare ställer diagnos, politiker, befälhavare och företagsledare fattar strategiska beslut.
Att det ofta blir fel när lagmän dömer och läkare ställer diagnos har visats av forskningen i beteendeekonomi, särskilt av dess två pionjärer Amos Tversky och Daniel Kahneman. Kahneman sammanfattade mycket av den forskningen i boken Tänka snabbt och långsamt (2013). Nu är han tillbaka med en uppföljare, Noise (2021), som han skrivit tillsammans med Olivier Sibony och Cass Sunstein. Jag läser den med stor behållning. Med Kahneman är man i gott sällskap.
Beteendeekonomin handlar om hur människor fattar beslut i ekonomiska frågor, men Tversky och Kahneman hade ett särskilt intresse för experters beslutsfattande och det är temat i den här boken. Allt beslutsfattande lider av ensidighet (bias) och brus (noise). Diskussionen handlar som regel om bias, risken för ensidiga beslut, men enligt författarna behöver risken för brus eller variation få mer uppmärksamhet. Det finns ofta en medveten strävan efter opartiskhet, en vilja att undvika bias i besluten. Däremot är vi mer sällan medvetna om den stora variation, det brus som kännetecknar beslutsfattande, även om forskningen på senare år även visat på detta. Att domare utdelar hårdare straff strax före lunch när de är hungriga än efter lunch när de är mätta är bara ett exempel på sådant brus.
Kahneman, Sibony och Sunstein åskådliggör skillnaderna mellan ensidighet och brus med en enkel illustration. När vi skjuter prick på en måltavla vill vi som regel träffa mitten. Om alla skotten hamnar till vänster om mitten talar vi om ensidighet (bias). Om träffarna har stor spridning är det i stället fråga om brus. Vi kan vända på tavlan och på baksidan se hur stor spridningen är. För att bedöma eventuell partiskhet måste vi studera framsidan.
Ensidighet (bias) beror på personlighet, fördomar, politiska uppfattningar, okunnighet, världsbild, tidsandan, allt det bagage vi bär på som färgar våra beslut. Det bästa vi kan hoppas på är att bli medvetna om att vi bär på fördomar och försöka kompensera för dem genom öppenhet och ödmjukhet inför andras omdömen.
Brus däremot är variation i besluten mellan olika beslutsfattare på grund av skillnader i personlighet, fördomar, etc., och mellan olika tillfällen för samma beslutsfattare på grund av att de påverkas av tillfälliga händelser. Brus är mycket mer utbrett än människor vanligen tror vilket är en anledning till att så litet görs för att komma till rätta med det. Ändå går det att med rätt enkla medel minska bruset betydligt så att olika domare dömer någorlunda lika, socialtjänstemän fattar någorlunda lika beslut och läkare ställer samma diagnos.
I boken vrider och vänder författarna på fenomenet brus och diskuterar mängder av intressanta aspekter av mänskligt beslutsfattande. Vi får lära oss lite grundläggande statistik och om minstakvadratmetoden, bekanta oss med Paul Meehls banbrytande resultat att enkla mekaniska modeller är bättre på att förutsäga psykisk sjukdom än experter i psykiatri. Vi får exempel på alla de genvägar vi tar när vi fattar beslut, genvägar som ofta leder oss vilse när vi förenklar och jämför, föredrar goda berättelser framför statistiska överväganden. Vi får naturligtvis många exempel på brus och förklaringar till varför det uppkommer, men vi får också en teori om tänkandet som förklarar varför vi har så svårt att se bruset i vårt beslutsfattande.
Det är så mycket brus i mänskligt beslutsfattande att förutsägelser nästan alltid blir bättre även med rätt enkla regler. Om vi kan använda AI kan vi dessutom ta hänsyn till mycket mer information än människor klarar av att hantera. Ändå föredrar vi mänskliga beslut framför mekaniska, mänskligt omdöme framför maskiner, och man kan undra varför. En anledning är att vi av maskinerna kräver ofelbarhet. När en självkörande Tesla orsakade ett dödsfall var vi snabba att döma ut de självkörande bilarna trots att mänskliga förare i USA varje år orsakar mer än 30 tusen dödsfall.
Som professor fattar jag beslut om andra människors framtid. Jag antar doktorander, godkänner doktorsavhandlingar, värderar projektansökningar, rangordnar sökande av högre tjänster. Beslutsprocessen har blivit mer reglerad under den tid jag varit professor. Ibland kan detta irritera mig. För 30 år sedan kunde jag använda mitt goda omdöme och min erfarenhet när jag fattade beslut. De som var föremål för besluten måste ha uppfattat dem som godtyckliga och ogenomskinliga, men jag var trygg i min professionella kompetens. Nu vet jag bättre.
Även om mekaniska modeller, regler, algoritmer genom att undvika brus ofta ger bättre beslut än människor så är de inte perfekta. Vi vet helt enkelt för lite för att kunna förutsäga framtiden och kan därför inte formulera tillräckligt bra regler. Det innebär att människor kommer fortsätta att fatta beslut och göra förutsägelser om framtiden, men just därför måste vi mer uppmärksamma och åtgärda det brus som präglar sådant beslutsfattande.
Man kan förvånas över att samhällsvetare och psykologer kan hävda att de förstår sig på samhällen och individer när de är så dåliga på att förutsäga framtiden. Vari består deras förståelse om de inte kan peka på orsakssamband som kan ligga till grund för förutsägelser? När något väl har hänt är det ofta lätt att hitta förklarande orsaker och vi tycker oss förstå. Men de orsakerna hjälper oss föga när vi försöker förutsäga framtiden. Då behöver vi i stället tänka statistiskt och göra väl grundande sannolikhetsbedömningar, något som inte kommer sig naturligt för oss och som vi därför inte är särskilt bra på. Att vi är så omedvetna om allt brus i vårt beslutsfattande beror just på att vi måste tänka statistiskt för att se bruset.
Den självklara åtgärden för att minska bruset i beslutsfattande innebär att formulera regler för hur besluten ska fattas. Professionella beslutsfattare invänder att reglerna blir fyrkantiga och gör det omöjligt att ta hänsyn till särskilda omständigheter. Regler som tar hänsyn till alla omständigheter blir alldeles för komplexa och kan inte formuleras på förhand. I stället måste man lita på experternas omdöme att fatta de riktiga besluten. Den sortens auktoritetstro var väl vanligare förr.
Jeff Bezos har hävdat att alla hans bästa beslut har byggt på magkänsla snarare än analys. Beslutsfattare hänvisar ofta till sin intuition: de vet något utan att kunna motivera det. Det är detta som gör dem till experter. Kahneman m. fl. menar att intuitionen i själva verket är den känsla vi får när vi äntligen bestämmer oss. Men den positiva upplevelsen av att kunna avsluta en tankeprocess, att bli klar med något, är just en känsla och ska inte förväxlas med förnuft. Att man är övertygad om att beslutet är riktigt, att det känns bra, innebär inte att beslutet är riktigt.
Det är intressant att följa hur dragkampen mellan regler och omdöme har utvecklats. Under 1900-talets andra hälft kom diskussionen ofta att utgå från Michael Polanyis idéer om tyst kunskap. Det blev nästan självklart att hävda att professionell kunskap i stor utsträckning är intuitiv, oformulerad och omöjlig att göra explicit. Datoriseringen kritiserades för att den i expertsystem försökte ersätta den tysta kunskapen med regler. Sedan dess har tidsandan förändrats. Datorerna har blivit häpnadsväckande kraftfulla och med AI fått den förmåga till mönsterigenkänning som för 50 år sedan var typexemplet på tyst kunskap.
På många områden gör kanske komplexiteten det praktiskt omöjligt att ersätta experter med regler, men då kanske ett AI-program löser problemet. En majoritet av svenskarna är idag positiva till AI, men det innebär inte att de vill att AI ska fatta beslut om försörjningsstöd, föräldrapenning, lån, försäkring eller a-kassa. Människor ska fatta besluten, inte maskiner. Jag tror att detta kommer att ändra sig när vi blir mer vana vid AI.
När man ersätter människor med maskiner, mänskligt beslutsfattande med algoritmer, blir besluten fria från brus. De blir genomskinliga, förutsägbara och mer rättvisa. Ändå är det många som invänder. Människor vill inte bli bedömda av maskiner, säger man, regler är fyrkantiga och konservativa, de inbjuder till försök att hitta kryphål, och verkar inte lika avskräckande som att ställas inför mänskliga beslut. Kahneman m. fl. avvisar den här sortens invändningar i en intressant diskussion som utan förenklingar leder fram till att betona värdet och vikten av brusreducering.
Författarna ger oss till slut sex principer för beslutshygien för att reducera brus. Den första principen betonar att beslut inte är rätta tillfället att uttrycka sin personlighet. Det är just skillnader i personlighet som leder till brus och därför är det viktigt att hålla tillbaka sina särdrag när man fattar beslut. Princip nummer två uppmanar oss att tänka statistiskt, att gå utanför det aktuella fallet och fråga oss hur besluten sett ut i liknande fall. Alltför stark fokusering på uppgiften uppfattar den gärna som unik och leder därför lätt till brus. Den tredje principen råder oss att dela upp beslut i oberoende delar så att vi inte förleds att bortse från motstridig information.
Princip nummer fyra ber oss att inte lita till vår intuition och fatta beslut på basis av det första intrycket. När man fattar ett beslut upphävs en osäkerhet och det känns bra. Det är lätt att tolka den känslan som att beslutet var välgrundat. Det är därför klokare att vänta med beslutet tills man i lugn och ro gått igenom underlaget. Den femte principen innebär att utjämna variationen genom att väga samman besluten från flera experter. Det är viktigt att experterna är oberoende av varandra. Om de tillåts överlägga och diskutera ärendet, som man normalt gör i en ledningsgrupp blir det snarare mera brus. Gruppdynamiken skapar polariseringar och vissa hörs mer än andra. Massans visdom övergår i galenskap när människor umgås. Den sista principen säger att vi om möjligt ska fatta relativa, jämförande beslut snarare än absoluta. Vi är mycket bättre på att göra parvisa jämförelser än att uppskatta värdet på ett enda objekt.
Avslutningsvis drömmer Kahneman, Sibony och Sunstein om en värld där organisationer som fattar viktiga beslut bestämmer sig för att försöka komma till rätta med allt sitt brus. Sådana organisationer kommer att förlita sig mycket mer på regler i sitt beslutsfattande, inse betydelsen av beslutshygien och följa dess föreskrifter. En värld med mindre brus kommer att vara mer rättvis, ha en bättre hälsovård, göra färre misstag och spara mycket pengar.
Kommer författarnas dröm om en mer brusfri värld snart att förverkligas och i så fall på vilka områden? Man behöver inte vara Einstein för att förutsäga att fotbollsdomarna med tiden kommer att ersättas av teknik. Alla inspelade fotbollsmatcher med domslut ger så stora datamängder att det räcker för att träna en AI till att bli en fotbollsdomare utan ensidighet eller brus. Men på vilka andra områden kommer vi att ersätta beslutsfattare med tekniska system?
Jag tror att man har anledning att vara optimistisk. Även om många av 1900-talets hantverkare – läkare, lärare, advokater, ekonomer, socionomer – alltjämt försvarar sin professionella särart mot invasionen av regler, algoritmer, digitalisering och artificiell intelligens så leder den fantastiska vetenskapliga och tekniska utvecklingen till en stadig ökning av mer evidensbaserade metoder och mindre brus.
Bo Dahlbom