Vad betyder ordet arbetsprestation?

rating2En av vanlig fråga jag får när jag föreläser om testning och bedömning är vad betyder egentligen arbetsprestation? Naturligtvis varierar detta beroende vem man frågar och vem som bedömer prestationen. Men för att få en utgångspunkt för en djupare förståelse är det viktigt att gå till forskningen för att hitta en definition av fenomenet arbetsprestation, dvs minsta gemensamma nämnare som kan inkludera så många perspektiv som möjlgt. Först då, när det finns en enhetlig definition, kan vi börja förstå vad som påverkar arbetsprestation. I forskningslitteraturen (se Sofia Sjöbergs avhandling) finns föreslås tre aspekter av arbetsprestation, dessa är Uppgiftsprestation , organisationsmedborgarskap och kontraproduktiva arbetsbeteenden.

Det finns en mängd mer eller mindre empiriskt förankrade modeller och perspektiv på kriteriet arbetsprestation, dess betydelse, innebörd och definition. Den modell som i dagsläget har starkast stöd inom forskningen definierar arbetsprestation i en hierarkisk struktur. Längst upp i denna hierarki finns en generell och mycket övergripande prestationsfaktor. Denna generella faktor omfattar alla handlingar och beteenden som är kopplade till och/eller bidrar till organisationens mål, det innebär att såväl prestation i konkreta arbetsuppgifter som förmågan att hantera de sociala aspekterna av arbetet ryms inom begreppet. Generell arbetsprestation fungerar i sin tur som ett paraplybegrepp till de tre relaterade men konceptuellt distinkta dimensionerna; uppgiftsprestation (eng; Task Performance (TP), organisationsmedborgarskap (eng; Organizational Citizenship Behavior (OCB), och kontraproduktiva arbetsbeteenden (eng; Counterproductive Work Behavior (CWB).

TP omfattar den prestation i faktiska och konkreta arbetsuppgifter som bidrar till produktionen av företagets varor eller tjänster som formellt erkänns av arbetsgivaren. I allmänhet motsvarar detta beteenden och handlingar som bidrar till fullgörandet av uppgifter och det ansvar som är förknippat med en viss uppgift; att utföra arbetet med god kvalitet och att bli klar i tid är goda exempel på hög TP.

OCB definieras som alla de frivilliga och positiva beteenden som inte omfattas av TP men som på olika sätt främjar organisationens mål. Organ’s (1988) definition är förmodligen den mest vedertagna:

“Organizational Citizenship Behavior are individual behaviors that are discretionary, not directly or explicitly recognized by the formal reward system, and in the aggregate promote the efficient and effective functioning of the organization” (Organ, 1988, s. 4).

Denna typ av uppsåtliga beteenden, som bidrar till en väl fungerande organisation genom att stödja den övergripande organisatoriska, sociala eller psykologiska miljön, omfattar beteenden som inte direkt eller uttryckligen erkänns i organisationens formella belöningssystem. 15

I den hierarkiska strukturen av arbetsprestation görs distinktion mellan den mellan den ”goda” arbetsprestationen (som representeras av TP och OCB) och ”skadliga” eller kontraproduktiva beteenden (eng., Counterproductive Work Behavior) som är relaterade till arbetet eller organisationen. Den vanligaste och mest allmänt vedertagna definitionen av CWB är:

“any intentional behavior on the part of an organization member viewed by the organization as contrary to its legitimate interests” (Sackett & DeVore, 2001, s. 145).

CWB är således ett samlingsbegrepp för alla medvetna och avsiktliga beteenden utförda av en medarbetare inom en organisation och som på något sätt har en negativ inverkan på eller skadar organisationen eller dess anställda.

När arbetsprestation bedöms, av både arbetsgivare och medarbetare, brukar till olika grad TP, OCB och CWB påverka den övergripande bedömningen av arbetsprestation. Ibland fokuseras det på TP, tex när lön ska sättas, ibland är det OCB som är i fokus, tex vid medarbetarsamtalet och hos vissa organisationer är det CWB som man vill förhindra, tex inom detaljhandeln. TP, OCB och CWB är en framkomlig väg vid undersökningar om prestation på arbetsplatsen.

 

Tips på litteratur

Borman, W. C., & Motowidlo, S. J. (1993). Expanding the criterion domain to include elements of contextual performance. In N. Schmitt, & W. C. Borman (Eds.), Personnel selection in organizations (pp. 71–98). San Francisco, CA: Jossey-Bass.

Conway, J. M. (1999). Distinguishing contextual performance from task performance for managerial jobs. Journal of Applied Psychology, 84, 3–13.

ISO/IEC, (2011). ISO/IEC 10667:2011 Bedömningstjänster i arbetslivet – Processer och metoder för bedömning av människor i organisationer. Del 1: Krav på uppdragsgivare. Del 2: Krav på leverantör. Bryssel: Author.

Organ, D. W. 1988. Organizational citizenship behavior: The good soldier syndrome. Lexington, MA: Lexington Books.

Rotundo, M. & Sackett, P. R. (2002). The relative importance of task, citizenship, and counterproductive performance to global ratings of job performance: A policy-capturing approach. Journal of Applied Psychology, 87, 66–80.

Sackett, P. R., & DeVore, C. J. (2001). Counterproductive behaviours at work. In N. Anderson, D. S. Ones, H. K. Sinangil, & V. Viswesvaran (Eds.), International Handbook of Work Psychology (Vol. 1, pp. 145–164). London, UK: Sage Publications.

Sjöberg, S., Sjöberg, A., Näswall, K., Sverke, M. (2012). Using individual differences to predict job performance: Correcting for direct and indirect restriction of range. Scandinavian Journal of Psychology, DOI: 10.1111/j.1467-9450.2012.00956.x

Sjöberg, A., Sjöberg, S., & Forssén, K. (2006). Predicting Job Performance. Manual. Stockholm: Assessio International.

Sjöberg, S., Svensson, C., & Sjöberg, A. (2011). MAP: Measuring and Assessing Individual Potential. Technical manual. Stockholm: Assessio International.

Viswesvaran, C., Schmidt, F. L., & Ones, D. S. (2005). Is there a general factor in ratings of job performance? A meta-analytic framework for disentangling substantive and error influences. Journal of Applied Psychology, 90, 108–131.

Viswesvaran, C., & Ones, D. S. (2000). Perspectives on models of job performance. International Journal of Selection and Assessment, 8, 216–226.

Övertro på sin egen förmåga vid rekrytering leder till dyrbara beslut

ebu1Evidensbaserat urval™ (EBU) betyder att information om kandidaten samlas in på ett standardiserat sätt och att viktningen av denna information vägs ihop mekaniskt med en statistisk ekvation. Den direkta motsatsen till EBU™ är att informationen samlas in på ett subjektivt sätt och att denna information inutitivt vägs ihop till en helhetsbedömning. Varför är då den mekaniska tolkningen överlägsen den intuitiva? Och vad finns det för risk att blanda ihop EBU™ med en mindre tillförlitliga intervjuer? Ny forskning presenteras.

Psykologiska test i urvalsprocesser utgör standardiserade verktyg för att samla information om de aktuella kandidaterna, på detta sätt uppfyller psykologiska test det första kravet om EBU, givet att testen i sig är validerade, förstås. Att samla information är dock inte tillräckligt för att kunna fatta ett urvalsbeslut. Informationen behöver tolkas/vägas ihop till en sammantagen bedömning som utgör grunden för beslutet.

Den andra kravet på EBU, hur informationen viktas ihop, kan bygga på intuition eller genomföras mekaniskt. Den intuitiva modellen fungerar så att personbedömaren själv i sitt huvud väger in information från tex en intervju och ett test. Det mekaniska tillvägagångsättet använder ofta en statitsik funktion för att vikta samma information. För att uppfylla EBU kravet krävs alltså både att informationen är standardiserad och att viktningen sker på ett mekaniskt sätt, det är själva poängen med EBU.

Varför är då den mekaniska modellen överlägsenhet den intuitiva?

För det första så påverkas validiteten i urvalsbeslutet av hur de olika informationskällorna viktas. Vid den mekaniska tolkningen viktas samma information exakt på samma sätt för alla kandidater, detta betyder är att även om viktningen inte är optimal är den reliabel. Vid den intuitiva subjketiva tolkningen är det näst omöjligt att behålla samma viktning för alla kandidater, särskilt om kandidaterna är många.

För det andra så utgör den mekaniska modellen möjlighet att använda statistiska modeller som alltid vinner över den kognitiva förmågan hos den enskilda personbedömaren. En annan fördel är att erfarenheten (i form av data) kan sparas och viktningen förfinas, vilket inte fungerar med den intuitiva tolkningen där den subjektiva känslan hos bedömaren hela tiden ändrar viktningen utan att ta hänsyn till kriteriet, tex arbetsprestation.

Och för det tredje så leder den intuitiva modellen att mer ”fel” petas in i beslutsmodellen. Intuitiva beslutsfattare har unika viktningar som många gånger ändras över tid utifrån upplevelser av nuvarande medarbetare. Endast kandidater som bekräftar beslutsfattarens upplevda viktning av informationen vid det enstaka tillfället väljs samtidigt som information som förkastar hypotesen bortses ifrån. Den mekaniska modellen reducerar risken att hela tiden fylla på med fel i beslutsprocessen.

Och för det fjärde så har det visat sig att ju mer information som petas in i beslutsprocessen desto mer lider det intuitiva sättet att fatta beslut av sk ”cognitive overload”. När rekryteraren själv ska väga ihop en stor mängd information om flera kandidater så tar ”hårdisken slut” och rekryteraren behöver istället förlita sig på genvägar som bygger på tidigare erfarenhet. Minnet ”tar slut” och denna genväg leder ofta till att tillförlitlig information om kandidaten försvinner på vägen fram till ett urvalsbeslut.

Ett ofta förekommet senario som jag stöter på är att EBU ibland används tillsammans med en intervju. Intervjun är nästan aldrig validerad, det finns alltså inget empriskt stöd för att intervjun på ett träffsäkert sätt verkligen plockar ut rätt kandidat. Om EBU steget innan intervjun använder data från validerade bedömningar (tex intelligens test och personlighetstest), dessa testpoäng vägs ihop statistiskt uppfylls kravet på EBU. Men vad händer om rekryteraren även vill väga in en intervju tillsammans med EBU poängen? Spännande ny forskning visar upp ett mycket tydligt resultat.

En forskargrupp genomförde tre experiment (Kausel, Culbertsson, & Madrid, 2016) där övertro på sin egen förmåga att tolka data från både testresultat och intervju undersöktes.

Övertro är brist på förmåga att känna var gränsen går för sin egen förmåga att fatta urvalsbeslut. Forskarna genomförde två studier med personer som är ansvariga för anställningsbeslut. I studierna presenterades oilka information för olika grupper. Den ena gruppen presenterades endast resultat från psykologiska test (testpoäng från ett intelligenstest och från ett test som mäter målmedvetenhet) och den andra gruppen fick förutom testresultatet även tillgång till resultatet från en intervju.

Resultaten visade att personer som hade tillgång till intervjuresultatet uppvisade större övertro än individer som presenteras med endast testresultat. Dessutom, vilket i sig inte är nytt, vann den statistiska viktningen över den intuitiva tolkningens förmåga att plocka ut rätt kandidater. Förklaringen, menar forskarna, att det blir så här är att när intervjun (som i detta fall inte var valid) introduceras till rekryterarna tas mer hänsyn till irrelevant information och på detta sätt ”viktar” rekryteraren bort valid information (i detta fall intelligens och målmedvetenhet).

I en tredje studie fick rekryterarna samma information som ovan samt ingå i en vadslagning, de fick helt enkelt satsa pengar på den kandidat som de bedömde som bäst. Resultatet var tydligt, de som presenterades med ej tillförlitlig information i form av en intervju hade större tilltro på sin egen förmåga (trots att den var fel) samt satsade större summa pengar på sina kandidater.

Forskarna kunde med denna studie konstatera att informationen från intervjun gör att anställande chefer sannolikt erbjuder för mycket pengar till fel personer när de använder en ostrukturerad intervju tillsammans med valid data från psykologiska test.

Det övergripande resultatet av tre studier kan sammanfattas i en mening.

När beslutsfattare efter EBU petar in egen ostrukturerad information kommer de övervärdera ”fel” information samt betala dessa personer mer i lön för att utföra arbetet.

Detta får naturligtvis praktiska konsekvener och mina förslag är.

  • Använd EBU, samla in data strukturerat och använd en statistisk ekvation för att vikta informationen.
  • Undvik ej validerade metoder tillsammans med EBU poängen.

Men om det inte går att undvika att cheferna vill träffa kandidaterna och ”känna om de passar i gruppen, typ”, vad gör jag då?

Gör detta i slutet av urvalet, då gör det minst skada men ta aldrig in EBU poängen tillsammans med denna information.

Referens

Kausel, E.E.,  Culbertsson, S.S.,  & Madrid, H.P. (2016). Overconfidence in personnel selection: When and why unstructured interview information can hurt hiring decisions. Organizational Behavior and Human Decision Processes, 137, 27-44.

 

Motståndet i rekryteringsbranschen att arbeta evidensbaserat, ett exempel

för2ISO 10667 – Bedömningstjänster i arbetslivet – processer och metoder för bedömning av människor i arbetsrelaterade syften har funnits i snart 5 år på den svenska och internationella marknaden. ISO 10667 har ett evidensbaserat synsätt på bedömningstjänster (tex rekrytering och urvalstjänster). Fram tills idag är det endast ett fåtal organisationer som certifieras sig mot ISO 10067. Certfiering är inget krav, utan vem som helst kan köpa standarden från SIS och börja arbeta enligt standarden. Men varför denna tröghet att arbeta med evidensbaserat urval? Min hypotes är att de stora rekryteringsbyråerna finner ingen orsak att ändra sitt arbetssätt så länge uppdragsgivarna inte ställer krav på rekryteringen. Detta kan spåras i en dom i förvaltningsrätten i Göteborg (mål nr 501-15) från 2015. Leverantören överklagar beslutet att förkasta deras anbud till Göteborgs Stad.

Som argument hävdar Leverantören att det alldeles för kostnadskrävande att certfiera sig och att det strider mot de grundläggande principerna om transparens, proportionalitetsprincipen och likabehandlingsprincipen som ska gälla vid offentlig upphandling. Men vilka krav ställde då Göteborgs stad? Detta är taget direkt från anbudsförfrågan (mina kommentarer inom parantes).

Leverantören ska ange vilka standardiserade processer som används.
Är Leverantörens rekryteringsprocess certfierad enligt ISO10667 ska kopia på certfieringen bifogas. (Här finns det alltså möjlighet för leverantören att certfiera sig av tredje part, tex DNV).

I annat fall ska Leverantören till anbudet bifoga dokumentaion som beskirver de arbetsmoment och metoder som används i samband med rekryteringsprocessen (även om man inte har certiferats kan man här bifoga information om den evidensbaserade processen). Detta omfattar dokumentation för varje enskild metod.

Dokumentationen ska innehålla.

en beskrivning av den modell, teori eller logik som bedömningsmetoden eller processen grundar sig på, t.ex. en teori om organisationskultur, en modell för arbetstillfredsställelse, en teori om individuella intelligensskillnader eller en modell för profilering av arbetsrelaterade kompetenskrav,

när och var evidensen anskaffades och senast uppdaterades,

information om vilken typ av data som samlats in, t.ex. testpoäng, skattningar av assesment-centerövningar, intervjuskattningar, och kollegieskattningar,

information beträffande fastställande av eventuella gränsvärden,

innebörden av slutsatser för användning av metoden eller processen vid bedömningar, inklusive begränsningar i användningen.

Om flera bedömningsmetoder rekommenderas av Leverantören, för att dra slutsatser om de som blir bedömda, ska förklaringen för den integrering av data som utgör grunden för slutsatserna anges liksom evidensen för slutsatserna.

Denna text är mer eller mindre tagen direkt från ISO 10667, vilket betyder att Levernatören har två val, antingen certifiera sig där dessa och en hel del andra krav ställs på leverenatören, eller beskriva i ovan nämnda punkter hur rekyteringsprocessen går till.

Inget av detta kunde verifieras i anbudet ansåg Göteborgs Stad, detta kunde däremot andra leverantörer göra och de fick därför uppdraget. Och det är därför Leverantören överklagar.

Leverantören hävdar vidare i sin argumentation att dessa krav är otydliga och högst subjektiva och att upphandlaren inte har förmåga att bedöma underlaget. Vidare säger Levarantören att ISO 9001 borde gälla som krav (vilket leverantören har certfierat sig mot). Dessutom har Levarantören bifogat andra process- och metodbeskrivningar i anbudet, men eftersom de innehåller företagshemligheter lämnas inte dessa ut som bevis i detta mål. Leverantören, har enligt egen utsaga, lidit skada av att anbudet inte kvalificerad sig till utvärdering.

Detta är inget ovanligt mål, och ingen ovanlig argumentation. Det man tycka är synd är att leverantören inte tar reda på hur ISO 10667 är uppbyggd och hur det kan underlätta arbetet med rekryteringsprocesser. Sedan är det ödets ironi att leverantören hävdar att kraven strider på transparens när det i själva verket var en stor drivkraft att publicera ISO 10667. Sedan är det intressant att leverantören har hemliga processer, snacka om krav på transparens.

Vad sa förvaltningsrätten kanske ni undrar?

Förvaltningsrätten avslår ansökan. Argumentation från förvaltningsrätten var att detta inte strider mot upphandlingsprincipen. Om Göteborgs Stad endast ställt krav på certifiering hade det dock kunna strida mot proportionalitetsprincipen eftersom det skulle utesluta anbudsgivare som har en motsvarande certfiering eller som i och för sig uppfyller kraven på certfiering men ändå saknar en sådan. Men eftersom Göteborgs Stad ställt upp ett alternativt metodkrav för att ge anbudsgivaren (leverantören) möjlighet att visa att de tillämpar evidensbaserade processer så bryter de inte mot proportionalitetsprincipen.

Detta är bara ett exempel mot det motstånd som idag finns i Sverige att arbeta evidensbaserat med urval, jag hoppas nu med denna dom att fler uppdragsgivare börjar ställa högre krav på rekryterare att arbeta vetenskapligt med urval. Inte minst pga av den senaste diskussionen om Riksrevisonens rekryteringsmetoder.

Ytterligare information om polisurvalet

rek2I tidigare inlägg har jag varit kritisk mot både nuvarande polisurvalet och utredningen (Polis i framtiden) om det kommande inträdet på polisutbildningen. Kritiken mot det nuvarande urvalet handlar främst om transparensen i urvalet och hur begåvningspoängen används. Nu har jag fått ny information från både sökande från polisprogrammet och personal på Rekryteringsmyndigheten.

Till skillnad från utredningen beskrivs urvalsprocessen idag var betydligt mer stringent än vad som framgår av utredningen. Gissningsvis har det tagit en tid att skriva utredningen och under den tiden har urvalsprocessen gjorts om av Rekryteringsmydnigheten och Polisen. Det verkar som urvalsprocessen har standardiserats eftersom begåvningstestet unIQ, personlighetstestet NEO och intervjun idag tolkas mekaniskt i processen. Har inte fått information exakt hur dessa saker viktas samman, men definitivt ett steg i rätt riktning.

Psykologintervjun idag utgår från Polisens kravprofil vilken brutits ner i nio aspekter, oklart vilka. Intervjun följer en intervjuguide där psykologerna för varje aspekt har obligatoriska frågor, valfria frågor och tillvalfrågor. Varje aspekt bedöms på en femgradig skala med ankare på varje skalsteg. Ingen helhetsbedömningen görs längre utan informationen vägs istället samman statistiskt dvs mekaniskt. Psykologerna tar löpande anteckningar och måste vid bedömningen dokumentera skälen till sina bedömningar för varje aspekt. Men hitintills har inga studier visat på att denna intervju är valid.

Inget utlåtande lämnas till de sökande istället får de sökande en standardiserad återkoppling med sina resultat och en förklaring till vad de står för. Den nya intervjun är alltså betydligt mer strukturerad än den tidigare även om den inte är helt strukturerad. Och en viss återkoppling sker redan idag.

En stor svaghet, vilken jag hörde att chefspsykologen för 10 år sedan var ytterst kritisk till redan då, är den webbaserade screening som sker före nästa steg när den mer standardiserade processen tar vid med test och betygssållningen. Målet är här att identifiera personer med otillräckliga medicinska med även psykologiska förutsättningar och personer som på annat sätt bedöms som olämpliga för polisyrket (t.ex. på grund av kriminell belastning). Instrumentet som används kallas Polisens webbaserade ansökningsformulär (PWA), en form av biodataformulär. Trots att ett relativt omfattande arbeta ligger bakom formuläret saknas ännu studier som belyser mätegenskaperna och kriterievalditet. Frågorna är relativt transparenta (tex Har du någon gång använt ett annat prestationshöjande preparat än anabola steroider?) så risken för socialt önskvärda svar är stor. Särskilt eftersom samma frågor genomförs även för de som söker om flera gånger. Det är också oklart hur alla dessa frågor bedöms för att komma vidare till nästa steg i processen vilket gör det ytterst tveksamt att använda detta underlag för urvalsbeslut. En annan brist i dagens modell är fysisk kondition, en förhållandevis god prediktor av polisprestation och hälsa, inte vägs in i den slutliga rangordningen. Den nya modellen har mött visst internt motstånd bland psykologer som uppger att de känner sig misstroda, men många psykologer tycker också att modellen är bättre än den tidigare då de kan se de metodologiska fördelarna.

Dr Stefan Annell verkar vara arkitekten bakom denna uppsträckning av urvalsprocessen, förmodligen ville Stefan få igenom än mer standardisering av processen, men enligt uppgift är Stefan helt bortkopplad från arbetet med polisurvalet, vilket naturligtvis är underligt.

Sammannfattningsvis är detta ett steg i rätt riktning, det går att skruva mer på detta, och särskilt angeläget ur ett urvalsperspektiv är att få resursstarka personer att söka utbildningen, en 3:a i begåvning och oklara gränser för hur personlighet och fysik bedöms gör att det finns risk att ”fel” personer tar sig in på utbildningen. Och även om utbildningen stärks så är det naivt att tro att inte urvalet spelar någon roll. Enligt den statliga utredningen är det på förslag att både begåvningstest och personlighetstest tas bort och endast betyg, högskoleprov och psykologbedömningen kvarstår när polisprogrammet går upp i den vanliga högskolan. Innan detta beslut tas borde oberoende forskare få uppdraget att med resultat från Stefan Annells avhandling göra en resultatsammanställning vilka metoder som funkar och vilka som inte funkar. Efter detta borde metod som på bästa möjliga sätt förutsäger både bra och dålig arbetsprestation bland nuvarande poliser väljas. Denna utredning bör inte ledas av personer varken från rekryteringsmyndighet eller polis, för mycket politik kommer då att överskugga logik och rational för vald process.

Tillträde till Polisutbildningen, ny utredning som kommer försämra urvalsprocessen

polis1I maj 2016 kom den nya utredningen om polisutbildningen i Sverige. Utredningen föreslår att grundutbildningen till polisman omformas till en högskoleutbildning. Idag är polisprogrammet upplagt efter 1997 utredning ”Ny grundutbildning för poliser, Polisprogrammet”. Dagens system för antagning till grundutbildningen till polis har kritiserats i vissa delar. Kritiken gäller främst att det inte är tydligt och att processen för urval inte är transparent. Det är Polismyndigheten som idag bestämmer vem som ska antas till utbildningen. Beslutet går inte att överklaga. De som söker idag och inte kommer vidare till sista uttagningsproverna får ingen information om varför de sorterats bort. Senaste tiden har även kritiken varit hård avseende sänkta krav på begåvningsnivå för att bli polis. Med den samlade kunskapen som idag finns i Sverige, tre avhandlingar under senaste åren som försvarats på stockholms universitet om rekrytering och urval, är det bara förvåning jag känner när jag läser kapitel 9 (Tillträde till utbildningen) i den senaste utredningen. Men innan jag går in på detaljer, hur går det till idag för att kunna bli Polis i Sverige?

Ansökning sker via Rekryteringsmyndighetens hemsida.  De sökande som uppfyller kraven får sig tillsänt inloggningsuppgifter och en inbjudan att komplettera ansökan. Den sökande besvarar frågor om hälsa, skolgång, intressen med mera i ett databaserat formulär och Rekryteringsmyndigheten kontrollerar ålder och medborgarskap

Universitets- och högskolerådet kontrollerar sedan den sökandes betyg och omdömen för att kontrollera studiebehörigheten, och räknar ut meritvärdet. De bäst meriterade sökande kallas till tester under två dagar. Simprov, begåvningstest och ett personlighetstest, fysiska och medicinska tester samt en psykologintervju.

Intressant är att inga nivågränser anges i utredningen avseende fysiska och medicinska tester. Inte heller specificeras vad som mäts i psykologintervjun och personlighetstestet.

Vad föreslår utredarna?

Utredarna föreslår att de regler som gäller för krav på grundläggande behörighet för tillträde till högskoleutbildning generellt, ska gälla som utgångspunkt för tillträdeskraven också för den utbildning som leder till polisexamen.

Sedan säger utredarna ”Vår utgångspunkt är att systemet för antagning till utbildningen som leder till polisexamen ska vara transparent och rättssäkert, men också funktionellt, av hög kvalitet och forskningsgrundat”. Därför föreslår utredarna.

De regler som gäller för krav på grundläggande behörighet för tillträde till högskoleutbildning generellt, ska gälla som utgångspunkt för tillträdeskraven också för den utbildning som leder till polisexamen.

OK, jag fattar galoppen. Utredarna vill att  antagningen till polisen ska fungera på samma sätt som vilken högskoleutbildning som helst, en kombination av Högskoleprovet och betyg. Detta uttalas också av företrädare av både Rekryteringsmyndigheten och polisen de senaste veckorna i olika medier.

Utredarna föreslår följande.

Vi anser att Universitets- och högskolerådet bör föreskriva om att en psykologbedömning ska genomföras för antagning till utbildning som leder till polisexamen. Däremot bör begåvningstestet och personlighetstestet
slopas.

Utredarna menar att forskning visat att betyg från gymnasiet och högskoleprov ger goda möjligheter att välja ut studenter som har goda förutsättningar att klara av högskoleutbildning. För detta hänvisar man sedan till Stefan Annells avhandling om hållbar rekrytering.

Anledningen att de vill slopa begåvningstest grundar sig inte på att det inte fungerar, utan snarare ett resonemang att det skulle vara tillräckligt bra utan. Men att just psykologbedömningen skulle vara kvar, den bedömning idag som det inte finns något som helst stöd för att det fungerar, där finns det ingen hänvisning till forskning. Det finns inget i Annells avhandling som varken stödjer att ta bort begåvningstest eller att behålla intervjun.

Utredarna upprepar sedan samma resonemang senare i utredningen.

”Vi har ovan föreslagit att det begåvningstest och det personlighetstest som i dag utgör tillträdeskrav slopas eftersom forskning visar att betyg från gymnasiet och resultat från högskoleprovet utgör ett väl så bra underlag vid bedömningen av vilka sökanden som har goda förutsättningar att klara ut bildningen.”

Vad utredarna fått detta ifrån är oklart. Utredarnas fortsätter sedan, utan att ha något empiriskt stöd och i svepande ordalag, att ”det är viktigt att en psykolog gör en adekvat bedömning av om en sökande utifrån sina förutsättningar är lämplig att utbilda sig till polisman”.

Vi föreslår att psykologintervjun blir en del av prövningen av sökandens lämplighet för utbildningen.

De menar att psykologen har en möjlighet till att göra en intervju som på ett adekvat sätt kan bedöma varje indvids personliga mognad, lyhördhet, flexibelitet, engagemang och ansvarsfullhet.

Nej, det finns inget stöd i forskningen för detta. Det finns ingen begreppsvalidering av att intervjun mäter personliga mognad, lyhördhet, flexibelitet, engagemang och ansvarsfullt  Och det finns ingen prediktiv studie som visar att intervjun förutsäger prestation på utbildning och i polisyrket.

Sedan kommer en obegriplig mening till som handlar om att använda offentliga medel på ett effektivt sätt.

”En lämplighetsprövning i ett tidigt skede, det vill säga innan sökanden blir antagen till utbildningen, minskar risken för att olämpliga personer genomgår utbildningen utan att kunna fullfölja den eller utan att senare kunna bli anställda av Polismyndigheten. Detta medför i sin tur således även en bättre användning av offentliga medel”

Bättre än vaddå? undrar undrar jag. Finns det något stöd för att en psykologintervju i ett tidigt skede skulle vara ett bra sätt att använda offentliga medel? Vad jag vet är just intervjun det dyraste av alla sätt, långt dyrare än att använda betyg, högskoleprov, intelligenstest och personlighetstest!

Sedan utan att närmare specificera hur detta hänger ihop med befintlig forskning för utredarna ett resonemang om hur man gör i officerurvalet vid försvarshögskolan. Och där gör utredarna det vanliga misstaget att hänvisa till den berömda magkänslan där bedömaren på ett magiskt sätt väger ihop all information till en lämplighetsbedömning.

Utredarna beskriver hur en lämplighetsbedömning inför antagning till Officersprogrammet genomförs med Inskrivningsprovet (som jag tror inte utredarna vet är just ett intelligenstest), psykologisk bedömning, intervjuformulär, professionsintervju och psykologintervju, där de tre första momenten genomförs före professions- och psykologintervjuerna och fungerar som ett underlag främst inför psykologintervjun.

Det hänvisas sedan att det är psykologen som ansvarar för analys och bedömning av alla dessa moment. Efter intervjuerna görs en sammanvägning av resultaten från de två delarna, psykologintervjun och professionsintervjun. Denna holistiska sammanvägning kommissionen uttrycks i en heltalsskala 0–3, där 0 innebär att den sökande inte uppfyller kravprofilen för utbildningen, medan 3 betyder att den sökande mycket väl uppfyller kraven för utbildningen.

Precis detta visar Sofia Sjöberg i sin avhandling är ett slöseri med resurser i pengar och ören samt ger en lägre validitet i jämförelse med om samma poäng vägs ihop i en mekanisk ekvation. Snacka om att slösa resurser.

Betyg och prestation

Jag har också berättat att den samlade kunskapen om betygs relation medarbetsprestation, att detta samband försvinner när indvidens intelligens tas hänsyn till, med andra ord intelligens predicerar arbetsprestation bättre i jämförelse med betyg. Jag har också tillsammans med Stefan Annell och Magnus Sverke visat att generell intelligens är en god prediktor till betyg på Polisprogramet och när jag var provopponent på Stefan Annells avhandling visade jag att intelligens samvarierar med betyg som i sin tur samvarierar med inledande praktisk prestation bland poliser. Det vill säga begåvning förutsäger prestation på utbildningen som i sin tur förutsäger prestation som polis i det praktiska arbetet.

Slutsats 

Utredningens kapitel 9 är en efterkonstruktion av ett tänkt svar att överföra Polisprogrammet till en högskoleutbildning och på detta sätt ta bort personlighetstest och begåvningstest men behålla psykolologintervjun. Jag kan köpa att begåvningstest och personlighetstest försvinner utifrån att detta inte finns på andra högskoleutbildningar. Men samtidigt behålla psykologintervjun blir svårsmält eftersom det inte idag finns en enda studie som stödjer intervjun som en god predikar för poliser i Sverige. Förslaget kommer leda till att de valida delarna i polisurvalet tas bort och det dyraste sättet blir kvar där vi inte har något belägg för att det fungerar. Det kommer att försvaga urvalet och det kommer att kosta skattebetalarna mera pengar.

Rekommendationer

Detta säger utredarna är framtidens poliser.

”För att möta dessa krav måste polismän i framtiden i högre utsträckning än i dag ha förmåga att ta till sig och analysera kunskap, att självständigt och kritiskt göra egna bedömningar, urskilja problem och föreslå lösningar”.

Mitt förslag är att tidigt i processen testa begåvning och personlighet till en rimlig kostnad (och detta kan man få tillstånd för av högskoleverket, bland annat läkarlinjen vid KI har använt intelligenstest i många år). De bäst meriterade sökande (de med högst poäng på begåvning och målmedvetenhet och emotionell stabilitet) kallas till simprov, fysiska och medicinska tester samt ett samtal med en erfaren polis/lärarer som beskriver utbildningen och den senare yrkesutövningen. Efter intervjun kan den godkända kandidaten ta ett medvetet beslut om Polisprogrammet är rätt utbildning för hen.

På detta sätt kommer vi få en mer begåvad och personlig lämpad poliskår, som samtidigt är fysisk kapabel att klara de kommande uppgifterna som beskrivs av utredarna. Och processen kommer bli mer jämställd.

 

 

 

Sänkta begåvningskrav på poliser. Men vad betyder det i praktiken?

I våras kunde inte alla platser fyllas på polisutbildningen. Men nu ska antalet poliser öka kraftigt. För att fler ska kunna komma in på polisutbildningen har begåvningskraven sänkts. Även DN rapporterar detta. Lyssna på intervjuer av representanter från Totalförvarets rekryteringsmyndighet och Polisen.

Polisförbundet uttrycker sin oro för att kraven att bli Polis sänks, men är det så att begåvningstest har någon betydelse? Nej, i själva verket används inte poängen på begåvningstest vid polisurvalet, sist jag såg data på detta 2014 så låg korrelationen mellan begåvningstestningen och antagningsbeslutet på .13. Däremot var den samlade subjektiva bedömningen av polis och psykolog helt avgörande, korrelationen av den samlade bedömningen var .82!! Och korrelationen mellan den subjektiva bedömningen och intelligens låg på .12. Med andra ord det spelar ingen roll hur kandidaterna presterar på begåvningstestet, det är psykologen och polisen som intervjuar och tycker sig finna de lämpliga personerna som blir helt avgörande.

För 13 år sedan (2003) när jag jämförde läkarurvalet till Karolinska med urval till Poliser var skillnaden stor. Titta i grafen nedan där jag räknat om poängen på exakt samma testitem till en IQ skala. Eftersom 100 utgör medel i populationen så representerade varken läkare eller poliser någon normalpopulation, med andra ord inte till fördel för polisen. När det gäller läkarurvalet skedde 2003 en mekanisk bedömning av begåvningstestet, kandidaten rangordnades och de som hade högst resultat fick komma på intervju som sedan blev avgörande (dessförinnan användes högskoleprov och betyg).

Polis Läkare

Låt nu säga att vi följer polisens logik när de säger att normalbegåvade ligger mellan 4-6 staninepoäng. Detta bygger på att det är ett mätfel i ett begåvningstest på ca 1 staninepoäng, och den medelbegåvade kandidaten får 5 staninerpoäng. Om man nu sänker kravet från 4 till 3 staninepoäng betyder det att kandidater som ligger ca 1 standardavvikelse under normalbegåvning kan komma in på utbildningen. Det är då bara de (ca 16%) som ligger lägst i Sverige på begåvningstest som inte kan komma in på polisutbildningen (lägger vi till lite mätfel så blir det i stort sätt alla i hela Sverige).

Med denna data kan bara en logisk slutsats dras, strunta i begåvningstestet, det är oetiskt att administrera ett test som inte har någon som helst betydelse för antagningen. Till detta ska läggas till att kandidaterna kan ej överklaga urvalsbeslutet, så all makt till psykologerna och poliserna som utövar holistisk tolkning, som vi vet inte funkar speciellt bra.

Med tanke på den samlade kunskapen om urval som finns idag vid Försvarsmaktens HR Centrum (tack o lov intelligenstestas militären fortfarande) och vid svenska lärosäten (tre avhandlingar har lägst fram senaste åren) kan detta starkt ifrågasättas, särskilt med tanke på att polisutbildningen ska vila på vetenskaplig grund.

Vill du läsa mina tidigare inlägg klicka här

ITC dag 3 och sammanfattning

itc tag2Sammanfattningsvis visar min namnskylt till höger lite om denna konferens, lite slarvigt upplägg. De stackars utställarna (bla Cut-e och Pearson) hade knappt några besökare, liksom vi som hade posters, eftersom denna lokal med posters och utställare inte hängde ihop med de lokaler där seminarierna hölls.

Flera av de seminarier jag var på liknade lite väl mycket ”klubben för egen beundran”, dvs alla vara överens, och då händer ingenting väsentligt för publiken. Några av de som brukar överprestera på dessa konferenser läste innantill, och jag misstänker att arrangörerna mörkade hur många som var där. Officellt skulle det vara 350 personer på ITC i år, jag såg högst 150 tillsammans. Så kan det vara ibland, jag hade ändå intressanta diskussioner med en hel del forskare som jag har nytta av både i forskningen och praktiken.

Sista dagen på ITC bjöd på en Keynote av Anna Brown som idag är ”Senior Lecturer in Psychological Methods and Statistics and Chair of Ethics at University at Kent, UK”. Anna anställdes av Dave Bartram på SHL på 90-talet och Anna är psykometrikern bakom senaste versionen OPQ, ett av världens mest använda personlighetstest. OPQ bygger på den sk Thurstone skalningen med tvingande svarsalternativ. Anna menar att alla de metoder idag som finns för att ”korrigera” för skönmålning av testresultat är tämligen värdelösa. Särskilt de som använder sk lögnskalor som sedan i sin tur korrigerar svaren på tex Big Five test. Anna kunde övertygande visa att hennes forskning att använda tvingande svarsalternativ (tillsammans med modern psykometri) kan var ett sätt att hindra ”bias” i personlighetsmätning, men var samtidigt ödmjuk inför att det är mycket forskning som behöver göras för att vara säker på att detta verkligen sker. En viktig fråga av mer filosofisk art är, finns det någon sanning i testresultat?

Efter detta lyssnade jag på några seminarier som gav mig noll, så jag pendlade mellan ett par olika. Nigel Evans från UK höll ett underbart bra 20 minuters tal om att använda sig av Standards när man ska bedöma personer. Han visade på ett övertygande sätt hur man i England har uppdaterat sin standard för Assessment Center (AC) och hur denna standard sammanflätas med ISO 10667, bedömningstjänster i arbetslivet. I en paus pratade jag med Nigel för jag vet att denna standard förespråkar 100% mekanisk tolkning av bedömningsresultat i ett AC. Det hade blivit ett himla liv om detta i UK bland praktiker när den nya standarden levererades, särskilt bland psykologerna som gillade att diskutera deras AC bedömninagr i en sk konsensusbedömning. Hur är det i Sverige frågade Nigel mig? Samma sak här sa jag, det finns inga i Sverige idag som följer den mekaniska modellen till 100% i ett AC .

Sedan ramlade jag in på ett ytterst intressant seminarium om personlighetens mörka, och då menar jag MÖRKA sida. Det var Professor Paulhus som var med och myntade uttrycket ”den mörka triaden”: machiavellianism, narcissism, och psykopati. Denna typ av forskning genömförs ofta på djupt kriminella personer som sitter bakom lås och bom. Paulhus & Co har gjort en kortversion av deras mörka-triad-test som han redovisade på konferensen. Dessutom meddelande han att ytterligare en dimension till triaden har adderats, sadism, som enligt Paulhus handlar om ”an appetite to hurt other people”.  Kanske inte något som passar i arsenalen av rekryteringstest…..eller? Vill ni läsa mer om detta klicka här.

Sammantaget får ITC 2016 en svag trea i betyg (tänk relativt system, gamla hederliga svenska betygsystemet). Det som förgyllde denna konferens var Deniz Ones, vilken forskare, WOW.

ITC dag 2

ITC2Dagens första keynote hölls av Maria Araceli Ruiz-Primo och handlade om formativa bedömningar inom skolans värld.

Formativa bedömnningar används i undervisningen för att utveckla studenter för ett djupare lärande i skolan. Detta skiljer från traditionella tentor eller prov som endast ska användas för betygsättning av elevens kunskap, enkelt uttryckt. Detta, menar Maria, har gjort det möjligt för testbranschen att sälja sk interim testing, alltså kunskapsmätande bedömningar mellan proven. Maria menar att ingenting i forskningen visar att dessa formativa bedömningar ger något för inlärningen, dvs att bara mäta saker betyder ingenting för lärande, vilket naturligtvis är ganska självklart kan jag tycka. Givet att dessa mätningar är reliabla och valida så är det vad som händer mellan mätningarna som betyder något, dvs vad läraren gör för att ge återkoppling av resultatet så att ett lärande kan ske.

Det råder inget tvivel på att mätningar av kunskap kan identifiera svagpresterande, men det enda som händer är att läraren ger mer undervisning till eleven, så mätningen betyder inget för lärandet i klassrummet. Dock har det formativa mätningen en effekt om läraren kontiunerligt upprepar verbalt varför man ska göra vissa saker i klassrummet och hur detta är kopplat till lärandemålet för kursen.

Tyvärr visar Marias forskning på nedslående resultat om lärares förmåga att koppla undervisningen till lärandemål. När lärare videofilmades under 429 dagar nämnde inte lärararna lärandemålen under 296 av dagarna (69%). Kontentan är att vi undervisar utan att nämna varför, hur ska då eleverna förstå varför man är i skolan? Resultatet blir än mer nedslående när lärarna intervjuas, de flesta kan inte tydligt förklara varför man gör som man gör i klassrummet. The ”take home message” av denna föreläsning är att jobba med lärandemålen.

  1. Definera lärandemålen
  2. Förklara lärandemålen
  3. Förklara vilka steg som finns i undervisningen
  4. Förklara hur dessa steg samvarierar med lärandemålet
  5. Samt förklara hur bedömningen mäter om eleven/studenten uppnått lärandemålen.

Nästa keynote talare var ingen mindre än Professor Deniz Ones vid University of Minnesota där hon leder ett sk Industrial-Organizational Psychology program. Deniz fick sin Ph.D från University of Iowa 1993 under handledning av Frank Schmidt. Hennes forskning, är publicerad i ca 200 artiklar och bokkapitel. Deniz forskning fokuserar på urval, mätning av personlighet, integritet och kognitiv förmåga och hennes forskning har citerats över 12 500 gånger! i den vetenskapliga litteraturen. Dessutom har hon fått ett gäng av de finaste utmärkelserna man kan tänka sig som akademiker inom psykologiområdet. Deniz har även varit ordförande för American Psychological Associations kommitté för psykologiska test och bedömningar. När hon jobbar som konsult (i USA kan man faktiskt kombinera forskning med praktik!!) fokuserar hon på att hjälpa organisationer utforma valida och rättvisa urvalsprocesser. RESPEKT.

Personlighetsmätning delade Deniz in i två kategorier, den första är det sätt som vi känner till från urvalsforskningen att vi mäter typiska personlighetsbeteenden i normalpopulationen. Den andra sättet är personlighetens extrema beteenden, dvs kliniska tillstånd som tex antisocialt beteende. Deniz visade att dessa sätt skiljer sig åt eftersom det skiljer sig att mäta vanligt förekommande personlighetsdrag och motsvarande extrema tillstånd hos individen. Låt säga att vi ska mäta normala tillstånd kanske ett item kan lyda: ”ibland litar jag aldrig på andra”, om detta påstående dras till sin ytterlighet skulle samma item lyda, ”jag har aldrig litat på någon i hela mitt liv” (båda item indikerar på låg sympatiskhet och som ingår som markör för antisocialt beteende).

Deniz menar att forskningen framöver kommer att fokusera på förhöjda eller låga värden på personlighetsskalor (+/- 1 SD), mörka sidan av personlighet (+/- 2 SD över medel) och extremvärden (+-3 SD), de senare värdena som är extrema kan jämföras med instrument som används inom den kliniska forskningen. Det som förenar den kliniska forskningen med den normala är just nu att båda forskningstraditionerna har en Big Five modell, den liknar varandra men har också olikheter. En olikhet är öppenhet som inte finns i den kliniska forskningen såsom den finns i övrig personlighetsforskning. Deniz gick igenom en stor del av forskningen som försöker förklara strukturen hos människans personlighet, ett ämne som kommer att forskas om mycket i framtiden. Det som stod klart är att strukturen är komplicerad, mycket mer komplicerad i jämförelse med den kognitiva forskningens generella faktor och underfaktorer. Förmodligen finns det ett antal olika nivåer även i personlighet och man kan inte utesluta att det rör sig om fem sex olika nivåer, allt från en generell faktor ned till mindre underfaktorer. Spännande att följa kommande publicering i form av en meta-analys där Deniz & Co har samlat in alla testmanualer som publicerat en korrelationsmatris, denna meta korrelationsmatris ska sedan ska ligga till grund för en ny klassifceringen över personlighetens domän som har syfte att gifta olika forskningstraditioner. Det är ytterst spännande att följa, inte minst för att jag och Sofia Sjöberg har bidragit med resultat från de test vi själva har utvecklat, MINT, MAP och PJP.

Efter lunch hade jag en egen poster presentation, sedan gick jag vidare på några seminarier som inte riktigt lyfte.  Avslutade dagen med en god middag i hamnen med familjen, och laddar nu inför morgondagen.

harbour2

ITC började idag i Vancouver

ITC2International Test Comission, ITC, håller vartannat år sin återkommande konferens, i år i Vancouver, Canada. Efter några dagar i New York är jag och 400-500 andra testintresserade personer i Vancouver för att träffas och diskutera samtliga testområden; kliniska test, test inom skolans område och test inom arbetslivet.

Detta är mitt femte ITC och fördelen med denna konferens är att den är relativt liten och behändig, många av deltagarna känner man igen både från testförlagsbranshen och forskningen. De allra flesta deltagarna är just forskare eller representanter från testförlag och/eller konsultverksamheter. Programmet innehåller traditionsenligt både workshop, symposium och posters. Själv kommer jag hålla två presentationer (posters), en om ålderskillnader vid testning av intelligens, och en poster som handlar om hur man på ett enkelt sätt kan överföra statistiska resonemang till praktiker inom rekrytering och urval, en metod som jag också använder i undervisningen på universitetet. Ni som inte är här i Vancouver kan följa min rapportering några dagar framöver.

Första dagen bjöd på en öppningscermoni där samtliga inblandande tackades för allt arbete inför denna konferens, den tionde i ordningen. Men inledningen präglades tyvärr av sorg över att två ITC medlemmar har dött den senaste tiden, professorerna Tom Oakland och Robert Roe, båda djupt engagerade i ITC. Professor Ron Hambleton, som tilldelades ”Tom Oakland Award for Distingushed Contribution to Testing and Assessment”, höll ett känslomässigt tal om sin vän Tom Oakland som mördades i sitt hem förra året. Ron berättade om den glädje och motivation som han känt under alla år han arbetat med Tom.

Efter detta hade Dave Bartram sitt inledningstal som nuvarande ordförande för ITC (och vad jag hört kommer Dave att pensionera sig efter ITC). Dave berättade om sin personliga resa i testvärlden från 70-talet när datorer började ta över poängsättningen av test till dagens interaktiva testning över internet. Dave berättade, med en portion av torr brittisk humor, om sitt inledande arbete med testning inom militären på 70 -talet genom 80 talet och sedan sitt engagemang i SHL (från 1998) där han redan då utvecklade test för mobila enheter. Dave avslutade sitt intressanta tal med att säga att det är viktigt att vi professionella testutvecklare inte glömmer bort de begrepp vi försöker mäta och inte förlita oss helt på nya datainsamlingsmetoder. För detta (och mycket annat) har flertal guidelines/standards utvecklats av ITC med ledning av Dave, som ni kan ladda ned från ITC homepage, helt gratis.

Efter ett mindre break gick jag på en presentation om nya sätt att poängsätta personlighetstest sk ”forced choice scale, eller ”att tvingas ta ställning till skalor”, detta kallas för ”ideal point scaling”, eller Thurstone scaling efter hen som lanserade idén. Thurstone menade att individer tenderar att instämma i påståenden (JA eller NEJ) som bäst liknar dem själva, inte som i vanligskalning, mer eller mindre. Flera olika metoder presenterades där kandidater får ta ställning till parvisa påståenden som sedan poängsätts enligt den ”nya modellen”. Det visade sig att alla presentationer på detta seminarium var mer eller mindre kopplade till CEB (fd SHL) som förlitar sig på denna psykometriska modell vid poängsättning av personlighetstest och kompetensmodelering. Även om denna typ av modell visat sig användbar kan jag konstatera att det är en hel del kvar att lösa, inte minst kandidaternas upplevelse att ta ställning till vilket påstående som passat bäst av ”att gå på fest” eller ”vara snäll mot människor”!!!. Drivkraften bakom den forskning som presenterades på detta seminarium fokuserade mycket på att denna metod skulle förhindra social önskvärdhet i kandidaternas svar, detta tycker jag inte de kunde visa på denna timme.

Efter en god lunch pratade jag med flera kollegor, besökte utställningen (som var väldigt tunn i år) samt kollade in en poster som presenterade av Mats Englund på cut-e. Frågeställningen var hur antalet bedömda anställda per chef kan påverka studiers prediktiva valditet, och Mats slutsats är ”that the number of employees that managers rate is not an immediate threat to the validity estimates in a study. However, it may be a problem in situations where the absolute values of the ratings are of import rather than the relative values. Mats hade som vanligt koll på analyserna.

Efter lunchen hann jag med att höra fem presentationer om kapitel i en helt ny bok om testning, The ITC International Handbook of Testing and Assessment ”Edited by Frederick T. L. Leong, Dave Bartram, Fanny Cheung, Kurt F. Geisinger, and Dragos Iliescu”. Nedan ser ni en ”summary” (kan varmt rekommendera boken).

ITC book2

The ITC International Handbook of Testing and Assessment is dedicated to the advancement of theory, research, and practice in the area of international testing and assessment in psychology, education, counseling, organizational behavior, human resource management, and related disciplines. Bringing together international contributors from a range of disciplines, each chapter provides a review of testing and assessment research and practices around the world as well as a discussion of conceptual and methodological challenges to help advance the field. As The ITC International Handbook of Testing and Assessment, it also provides a historical perspective of international testing, the development of the ITC, and its guidelines. Recognizing that cultural and international contexts are essential to a true and accurate psychology, the authors describe how cultural, economic, political, and social factors in different countries frame the science and practice of testing and assessment. The ITC International Handbook of Testing and Assessment is a must-have resource for testing professionals and graduate students from psychology and related disciplines.

Efter en underbar middag på Joe Fortes Seafood & Chop House (mycket god tonfisk och lax, samt underbar service) känner jag mig rätt trött, nu laddar jag om inför morgondagen.

joe2

Finns det en generell faktor av personlighet?

GFP bild2Det har tvistats länge om den generella faktorn av intelligens sedan Francis Galton på 1800-talet lanserade en generell ”mental ability” faktor. Galton lyckdades inte testa och bekräfta denna generella kognitiva faktor, mycket pga att han hade taskiga mätinstrument, vilket lade grunden för den klassiska testetorin först formulerad av Charles Spearman som föreslåg att förutom mätfel så kan en generell intelligensfaktor vara en stor förklaring till en mängd olika beteenden. Liksom alla stora upptäckter kritiserades Spearmans för hans teori om en generell intelligensfaktor, och även om denna g faktor bland de allra flesta seriösa forskare nu är fast förankrad så höjs det röster både från den akademiska världen, och inte minst från praktiker, att denna faktor inte finns, och finns den då är den inte värd att ta hänsyn till när praktiska beslut ska vägleda oss. Vad många inte vet är att Francis Galton hade en teori att det även kan finnas en generell personlighetsfaktor. Galton hann inte testa detta men det finns faktisk resultat från tidiga 1900-talet (Webb, 1915) som stödjer denna tanke. 

Idag kan vi säga att det råder stor konsensus kring den sk Fem Faktor Modellen (FFM) av personligheten. FFM är en taxonomi som utgörs av fem breda personlighetsdimensioner. De ingående dimensionerna är: Målmedvetenhet, (förkortat CO efter engelskans Conscientiousness), Emotionell stabilitet, ES (eng. Emotional Stability), Sympatiskhet, AG (eng. Agreeableness), Extraversion, EX (eng. Extraversion), samt Öppenhet, OP (eng. Openness). FFM har en självklar roll i beskrivningar av personligheten och är är även den modell som har starkast stöd i forskningen vad gäller att förutsäga (predicera) beteenden på arbetsplatsen. FFM modellen har under senaste tiden också fått sin motsvarighet inom den kliniska psykologiska forksningen där FFM används för att förstå hälsotillstånd hos människor. Tex kan man idag förstå antisociala beteenden i ljuset av FFM:s olika facetter, mycket spännande som jag får anledning att återkomma till.

Men nu tillbaka till en generell faktor av personlighet. Det är forskarna van der Linden, Dunkel & Pettrides (2016) som i det ett senste numret av Personality and Individual Differences som sammannfattar var forskningen idag står avseende en (1) bred personlighetsfaktor. Nu ska det sägas att författarna argumenterar för att det verkligen finns en sådan, och dera slutsats är således JA det finns en General Factor of Personality (GFP), men de tar även upp den kritik som riktats mot deras argumentation, och konstaterar att det är ungefär samma kritik som den som Galton/Spearman fick stå ut med när de föreslog en (1) kognitiv faktor som ett sätt att förstå intelligens (se Jensen, 1998).

Egentligen argumenterar van der Linden & Co exakt på samma sätt som Galton/Spearman, dvs eftersom det finns ett positivt samband mellan faktorer som innehållsmässigt är olika saker (läs FFM) då borde det finns en orsak bakom detta positiva samband, något gemensamt som gör att detta samvarierar, en generell faktor.

Låt mig ta ett exempel från min egen erfarenhet att utveckla personlighetstest. När vi utvecklade MAP (Sjöberg, Svensson & Sjöberg, 2011), ett personlightetstest som ska mäta FFM, jobbade vi stenhårt för att de fem faktorerna skulle vara oberoende av varandra. För att pröva den övergripande modellen genomfördes en sk konfirmatorisk faktoranalys (Confirmatory Factor Analysis, CFA). Eftersom den teoretiska modellen i MAP specificerar fem faktorer med fem underskalor i varje enskild faktor testades den modellen först. Vi fick inte fullständigt stöd för detta då vi fann att alla faktorer hade en låg till moderat positiv korrelation med varandra.

Detta kan tolkas utifrån två utgångpunkter, den första är att vi är dåliga testutvecklare (vilket kan vara fallet), hade vi varit bättre hade vi fått oberoende faktorer. Den andra tolkningen är att det går inte att mäta dessa oberoende av varandra eftersom det finns något som ”orsakar” detta samband, det är den linjen som drivs av van der Linden & Co.

Om vi nu antar att det inte går att göra dessa fem faktorer oberoende av varandra, vad är det som orsakar detta? Van der Linden & Co anger tre olika möjligheter til förklaring.

Den första förklaringen är att GFP finns och är en en mänsklig faktor som kan definieras som en social effektivitetetsfaktor. Enligt denna tolkning, så har individer högt på GFP de kunskaper, färdigheter och motivation att agera på ett sätt att andra anser dem socialt önskvärda, vilket i sin tur ökar deras chanser att uppnå sociala mål. Individer som har en hög GFP har högre sannolikhet att väljas som partner, som medarbetare och som chef i jämförelse med personer som har låg GFP. Argumentet utifrån ett utvecklingsperspektiv är att dessa människor tenderar att ta sig framåt i sociala samhällen och på detta sätt är GFP en överlevnadsfaktor precis som kognitiv förmåga är.

Men kritik finns, där den andra förklaringen är att denna faktor består endast av att de som svarar på personlighetstest förställer sig i en social önskvärdhetsfaktor som försvinner när man formulerar om frågor i en mer neutral ton (se Bäckström, Björklund & Larsson,2009). Denna manipulation menar kritikerna har ingenting med social effektivitet att göra utan är en bluff faktor.

Den tredje förklaring kan vara, menar författarna, att det blir så rent statististisk eftersom en person ofta svarar på samma frågor, denna statistiska bluff har ingenting med en social faktor att göra menar kritikerna.

Någon sanning kan inte presenteras här och nu, men spännande är det att följa denna forskning och jag kommer få anledning att återkomma till den. Inte minst för ett en del författare menar att denna GFP faktor också har ett samband med generell intelligens.

Referenser

Bäckström,M., Björklund, F., & Larsson, M. R. (2009). Five-factor inventories have a major general factor related to social desirability which can be reduced by framing items neutrally. Journal of Research in Personality, 43, 335–344.

Sjöberg, S. Svensson, C., & Sjöberg, A. (2011). Measuring and Assessing individual Potential (MAP). Svensk & Engelsk version. Manual. Stockholm: Assessio International.

Jensen, A. R. (1998). The g Factor. The science of Mental Ability. Westport, CT: Praeger Publisher.

van der Linden, D., Dunker, C.S., Petrides, K.V. (2016)  The General Factor of Personality (GFP) as social effectiveness: Review of the literature. Personality and Individual Differences, 101, 98-105.

Webb, E. (1915). Character and intelligence. An attempt at an exact study of character. London: Cambridge University Press.