Malin Holm och Björn Sahlberg skriver i Psykologtidningen: ”Statistik är inte mer tillförlitlig än professionellt omdöme” –

Malin Holm och Björn Sahlberg är legitimerade psykologer och ger sin syn på evidensbaserat urval i senaste uppdateringen av Psykologtidningen. De oroas bla av den kulturella påverkan som Big Data innebär och uppmanar till försiktighet att använda statistik för att fatta beslut i urvalssituationer. Nedan kan ni läsa hela artikeln.

____________________________________

Av Malin Holm och Björn Sahlberg

När det gäller tester och chefsurval finns i samtiden en tilltagande och alltmer högljudd argumentation som menar att statistik är tillförlitligare än det professionella omdömet, att en matematisk formel som beslutsgrund är att föredra. Tonfallet är självsäkert.

Man talar om evidensbaserat urval och alternativet beskrivs ofta i termer av ett mer eller mindre kvalificerat beslutsfattande med magen. Grundläggande i denna statistiska linje – eller Big Data som den också benämnts – är att:
1) kandidater i en rekryteringsprocess bör rangordnas med hjälp av kvoten från ett traditionellt intelligenstest och vissa delskalor i ett självskattningsinventorium, och
2) erfarenhet hos en professionell yrkesperson kan – tillsammans med intervjuer, referenstagning eller försök att använda omdömesgillt tänkande – bara störa bedömningen.

Big Data-ideologin har en fördel i att den minskar utrymmet för godtycke i bedömningar, men vi menar att flera fakta manar till ödmjukhet:
• Metoden anger inte om personen även tillhör någon oönskad grupp, till exempel gruppen patologiska lögnare eller rasister
• Det som gäller för en grupp i allmänhet gäller inte med nödvändighet för alla individer i gruppen. I det enskilda fallet kan ovanliga men kritiska faktorer göra att den renodlade statistiska bedömningen blir gravt missvisande.

Hur fel det kan gå belyses till exempel av en kvinna som kontaktade en av oss och berättade att hon blev nekad ett chefsjobb i en svensk kommun eftersom hennes resultat på BASIQ ”enbart” var stanine 5 jämfört med normalpopulationen. Det hade varit okej om resultatet hade varit 5 jämfört med akademikergruppen.

Vi menar inte att begåvning är oviktigt, men man kan och bör tänka längre än en kvot eller siffra. Man bör relatera detta till annat som omdöme, strategisk förmåga, tolerans för osäkerhet och komplexitet, typen av försvarsmönster och reaktioner på stress, personlig och känslomässig mognad. Sedan – och detta är avgörande – bör man som professionell bedömare kunna väga samman intryck, ställa sig nya frågor och till sist med hjälp av sitt omdöme ta ställning. Man överlåter inte avgörandet till metoden utan tar ansvar för en egen bedömning.

Inom rättspsykiatrin, där kostnaderna för felaktiga beslut pressar på metodutvecklingen, brukar Big Data hänföras till den andra generationens bedömningar; ett redan lämnat steg på vägen mot mer användbarara system. I stället har en tredje generationens metod utvecklats; En syntes av klinisk bedömning och Big Data, ofta kallad strukturerad klinisk bedömning. Där ska bedömaren låta sig styras av checklistor med empiriskt välstuderade faktorer, men utifrån klinisk erfarenhet och även sunt förnuft kunna lägga till och dra ifrån specifika faktorer av betydelse.

Vi oroas också av den kulturella påverkan som Big Data innebär. Om tänkande och berättande helt ersätts av empiri och statistik blir det svårt att skapa begrepp kring personligt ansvar och moral. Att alla sidor hittar stöd i forskning visar bara att ämnet är komplext, och vi skulle önska att vi psykologer kunde göra gemensam sak i en verkligt vetenskaplig ansats – att ackumulera kunskap med de landvinningar vi gör i stället för att på ett arrogant sätt påstå att någon har det enda rätta synsättet.

SKRIBENTER

Malin Holm och Björn Sahlberg, psykologer

Publicerat av Anders Sjöberg

Anders Sjöberg är docent i psykologi och har lång erfarenhet av bedömningsmetoder in arbetslivet. Anders har utvecklat psykologiska bedömningssystem som används av både privata och offentliga organisationer. Anders har publicerat böcker och vetenskapliga artiklar inom organisationspsykologi och psykologisk metodutveckling.

Delta i diskussionen

6 kommentarer

  1. En del tänkvärt och bra, fram tills ni skriver om "sunt förnuft". Alltid lika tråkigt att se leg. psykologer som missat grundkurserna, hur subjektiv vi är i vår perception och kognition.

    Sunt förnuft är jordaxeln i fontallen.

  2. Författarna har onekligen en och annan poäng. Visst kan det enskilda fallet avvika från den generella principen. Jag skulle dock vilja veta mer om hur författarna vill råda bot på det? Dom kan väl omöjligen mena att subjektiva bedömningar baserade på så kallat "sunt förnuft" är lösningen?

    1. Håller med, evidensbaserat urval är en transparant metod som går att kritisera, naturligtvis, men det är ett sätt att vara tydlig vad som händer i en urvalssituation. Författarnas kritik är svår att bemöta för det finns ingen definition eller operationalisering av "sunt förnuft". Anledningen till att intelligenstest och personlighetstest används i EBU är för vi vet hur vi ska definiera begreppen, operationalisera begreppen och hur bra dessa är på grupp nivå för att förutsäga prestation.

      1. Av texten att döma tycks ju författarna förespråka att annan information utöver testresultat vägs in med ambitionen att predicera exempelvis benägenhet att fara med osanning, rasism, försvarsmönster (vad det nu är), känslomässig mognad. Vet du Anders om det finns några oåerationaliseringar och erkända sätt att mäta sådant? Eller är det så att psykologen i egenskap av sin profession utgör själva instrumentet? Om så, anser jag det hela ganska oetiskt. Om någon vill uttala sig om mitt försvarsmönster eller min benägenhet att fara med osanning blir det ytterst viktigt för mig att se referenser till sund vetenskap. Dessvärre känner jag inte till någon sådan forskning. Vad har du för etiska reflektioner kring författarnas förslag Anders?

  3. Vad jag vet finns det inte vedertagna definitioner av dessa begrepp och därmed inte hållbara operationaliseringar, men saken är att även om det skulle finnas så bör de läggas in i samma formel som testen, på det sättet får du en kompensatorisk modell som tar hänsyn till samtliga faktorer. Vill du väga in fara med osanning eller rasism högre än IQ så är det bara att göra detta, men som sagt det behövs evident att det funkar innan det kan kallas evidensbaserat. Jag tror att författarna fått en begränsad förklaring till vad EBU, genom att de endast fokuserar på testresultat.

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Denna webbplats använder Akismet för att minska skräppost. Lär dig hur din kommentardata bearbetas.