Extrem låg grad av Sympatiskhet och den mörka sidan av personligheten. Nya forskningsresultat om ”the Dark side of Personality” och Fem Faktor Modellens A skala.

I vår bok Personlighet i arbete har vi ett kapitel om extrema personlighetsdrag i arbete. Där tar vi upp olika modeller för att förklara hur den mörka sidan av personligheten kan vara både en fördel och en nackdel för individen och organisationen. Nu har det kommit nya forskningsresultat som tar upp det gemensamma med Fem Faktor Modellens A skala, Agreeableness eller Sympatiskhet, som vi valt att kalla det på svenska och den mörka sidan av personlighet. Först är det viktigt att tydliggöra vad som avses med extrema personlighetsdrag. Eftersom personlighetsdrag är ungefärligt normalfördelade i populationen, betyder det att de allra flesta, närmare 70 procent, har genomsnittliga nivåer. Inkluderar man dem som har ytterligare något över respektive under genomsnittet av ett personlighetsdrag omfattar det totalt omkring 95 procent av populationen. Det betyder att det är en mycket liten andel personer (ungefär 2,5 procent vardera) som har så pass låg respektive hög nivå av ett personlighetsdrag att de kan kallas extrema. Detta resonemang syftar på skillnader mellan individer inom ett personlighetsdrag. Sympatiskhet som består av följande facetter (se bild nedan).

En viktig frågeställning, inte minst inom arbetslivet, är förstås om det är bra eller dåligt med extrema nivåer av personlighetsdrag. Som med många andra frågor är det svårt att ge ett enkelt svar. Först och främst kan en allmän beskrivning av en person nivå av Sympatiskhet, där varje facett betraktas var för sig, innehålla egenskaper som kan uppfattas som både bra och dåliga. Extrema nivåer (höga och låga) på flera av sympatiskhets facetter kan beskrivas i såväl positiva som mer negativa termer.  Om en extrem nivå ska kunna sägas vara bra eller dålig, eller snarare vara en tillgång, en belastning eller en behöver man sätta egenskapen i relation till något ett kriterium, inom arbetslivet handlar det om vad man gör på jobbet. Det vill säga svara på frågan: Är det bra eller dåligt för vad som ska göras och när? En individ skulle till exempel kunna beskrivas som avsaknad av medkänsla (A6) men prestera mycket bra i en roll som ställer krav på att man kan ta tuffa beslut och bana väg för andra. 

När dysfunktionalitet och problematiska beteenden är i fokus använder man ofta termer som ”personlighetens mörka sida” för att beskriva dessa egenskaper. Forskningen om kopplingen mellan personlighet och dysfunktionella beteenden har delvis pågått parallellt med forskningen om FFM. 

Forskningen om den mörka sidan föreslår flera olika modeller för att förklara dessa drag, vilket vi skriver om i vår på Personlighet i arbete (kapitel 6). En av dessa modeller är ”the general Dark factor of personality”, D-faktorn, till vilken alla mörka personlighetsdrag kan härledas som tex pyskopati och narcissism. Precis som inom den kognitiva delen av forskningen föreslås här en generell (g) faktor som gemensamt kan förklara en mängd olika mörka sidor hos en person. D-faktorn föreslås representera en gemensam kärna som ligger till grund för samtliga mörka egenskaper och därmed illvilliga beteenden: till exempel mobbning, fusk, hot, förolämpningar, utnyttjande, trakasserier, förödmjukelser, sårande, lögner, manipulation, stöld, hot om våld, och så vidare. 

Definitionen av D bygger på att beteenden är kopplade till två olika typer av måluppfyllelse, dels att maximera den egna nyttan: ”Jag gör vad som helst för att få det jag vill”, dels att orsaka andra en förlust i nytta för andra: ”Jag är villig att själv drabbas av negativa konsekvenser för att någon annan, som jag tycker förtjänar det, ska straffas.” Detta ramas in av att beteendena rättfärdigas av illvilliga övertygelser: ”Jag förtjänar helt enkelt mer än andra.” Personer med hög nivå av D motiveras alltså inte av att öka andras nytta, till exempel hjälpa andra i nöd, om inte de själva också drar nytta av det. De får heller inte egen nytta från eller genom andras nytta, till exempel att vara glad för någon annans framgånga. 

När D-faktorn definieras i termer av FFM:s faktorer är det särskilt en låg nivå av sympatiskhet (eng Agreeableness, A) som är framträdande, om man vänder på skalan betyder det hög nivå av Antagonism, en faktor som används delvis i psykiatriska diagnoser. Att vara känslomässigt distanserad, skeptisk och misstänksam mot andra och deras intentioner, sakna empati och ödmjukhet, att tänka på sig själv i första hand och att vara manipulativ för att maximera den egna nyttan är alltså utmärkande karaktärsdrag för D-faktorn, men kan också indikera låg nivå av Sympatiskhet. 

I en nyligen publicerad artikel menar forskarna (Leigha et al, 2022) att D faktorn inte är något nytt, det är helt enkelt låg nivå av Sympatiskhet, med andra ord hög nivå av Antagonism. Detta är inget nytt inom den psykologiska forskningen, det kallas för ”the Jangle fallacy”, vilket betyder ett felaktigt antagande om att två identiska eller nästan identiska psykologiska begrepp är olika eftersom de är benämns på olika sätt (i detta fall D faktorn och Sympatiskhet, A).

Och det är precis detta som forskarna testar i sin studie, om låg nivå av Sympatiskhet är samma sak som hög nivå av D. Resultatet pekar på att mycket tyder på detta (mer om detta senare). Sambandet mellan de två olika psykologiska begreppen är högt (R=.70), och när jag jag räknar om resultatet från studien. Och när jag sedan fördelar sambandet på de olika facetterna får jag detta resultat.

Jag beräknade sambandet mellan A1-A6 på data från sammanlagt 4 700 testningar av Personality150 (Assessment Engine) samtidigt som korrelationerna mellan A1-A6 togs från refererade studie (Leigha et al, 2022, table 4). Den sammanfattade korrelationsmatrisen användes som input i en relativ regressionsanalys som tar hänsyn till varje facetts unika bidrag till D-faktorn, när alla andra ingående facetter hålls konstanta. Den förklarade variansen uppskattades i steg 1 till ca 50%. All beräkningar genomfördes i (package YHAT) programmeringsspråket R. YHAT fördelar sedan variationen för varje unik facett uttryckt i %. Den förklarade variansen uppskattades i steg 1 till ca 50%.

De två facetter som har högst negativa samband inom Sympatiskhet är A2 (Rättframhet) och A4 (Följsamhet). Låg nivå på A2 innebär att personen har en väl utvecklad förmåga att kunna anpassa sitt sätt att kommunicera med andra för att uppnå de mål personen vill nå. Personer med låg nivå tillämpar ofta denna förmåga och anser att det är en viktig och önskvärd kompetens att manipulera för att få sin vilja fram. Detta innebär att personen är benägen och skicklig på att använda smicker, list och att tänja på sanningen i syfte att nå dit man vill. Personen använder även smicker och lögner, för att göra interaktionen med andra smidigare och på detta sätt få som hen vill. 

Låg nivå på A4 innebär att personen har ytterst svårt att vara följsam, mycket skarp i kommunikationen och stark i sitt sätt att argumentera för sina åsikter och ställningstaganden. Håller fast vid sina åsikter, ändrar sig nästan aldrig trots att motargument är övertygande, och personen är tydlig med sin ilska och frustration när hen känner missnöje. Personen står fast vid sina åsikter och hävdar sin rätt gentemot andra utan att tveka, samt tycker mer om tävling och konkurrens och betraktar kompromisser och konsensus som ett nederlag (Sjöberg, Sjöberg, Henrysson Eidvall, 2021). Som sagts ovan, dessa personer motiveras inte av att öka andras nytta, till exempel hjälpa andra i nöd, om inte de själva också drar nytta av det, att vara glad för någon annans framgångar händer aldrig. 

Rent kvalitativt är det inte riktigt samma nivå som D faktorn, dvs att beteenden är kopplade så tydligt som i D faktorn, dvs både maximera den egna nyttan och samtidigt orsaka andra en förlust. Även om en låg nivå på Sympatiskhet kanske är ett måste om personen ska komma högt i D faktorn. Min ståndpunkt är att även om det finns ett högt samband mellan A och D, kommer vi inte åt D med de instrument vi idag har och använder i arbetslivet. Låga nivåer på A betyder inte nödvändigtvis att vi på ett korrekt sätt mäter D faktorn, eftersom de typer av frågor som mäter D faktorn inte går att ställa i tex urvalssituationer. Låga nivåer av A2 och A4 kommmer inte så lågt helt enkelt. Nedan är några påståenden som mäter D faktorn.

Payback needs to be quick and nasty.

When I get annoyed, tormenting people makes me feel better.

Det handlar således om extrema nivåer, nivåer som traditionellt inte låter sig bedömas med de metoder och verktyg som finns tillgängliga i dag för användning i arbetslivet. Detta gäller alla slags verktyg: intervjuer, personlighetstest och så vidare. Majoriteten av dessa verktyg är utvecklade för att mäta och skilja mellan individer som är inom normalspannet på de aktuella personlighetsdragen, med en viss variation förstås. De är inte utvecklade för att bedöma eller kunna skilja mellan de mer extrema nivåerna. För att komma åt dessa nivåer krävs det att verktyget redan från operationaliseringen (dvs hur vi mäter det) av konstrukten fokuserar på dessa extrema nivåer, det vill säga redan när verktyget utvecklas. Och dessutom är det etiskt tveksamt om vi bör ställa dessa typer av frågor i en urvalssituation.

Implikationer för praktiker

A och D har mycket gemensamt, men som praktiker ska man inte utgå ifrån att vi fullt ut fångar drag som psykopati, sadism etc med vår vanliga metoder. Bra instrument kan dock fånga extrema nivåer av normal personligheten, som mycket väl kan ställa till skada både skada och nytta för både anställda och arbetsgivare. Är D en Jangle fallacy? Det går idag inte att svara på helt säkert, men min tolkning är att det handlar om på vilken nivå man mäter Sympatiskhet på, normala nivåer av både A och D har beröringspunkter, men ytterligheten, dvs ytterst extrema nivåer av D är något annat än låg grad av A. Alla som är inblandade i bedömningstjänster i arbetslivet bör därför verkligen överväga lämpligheten i att använda denna typ av verktyg, vara noga med att utvärdera kvaliteten i verktygen och vara mycket försiktiga när resultatet används för urvalsbeslut, karriärrådgivning eller för att beskriva individer. 

Vågar du testa din mörka sidan klicka här

Referens

Leigha Rose1, Chelsea E. Sleep , Donald R. Lynam , and Joshua D. Miller (2022). Welcome to the Jangle: Comparing the Empirical Profiles of the “Dark” Factor and Antagonism. ASSESSMENTS. 1–18.

Matrigma och Ravens Matriser är inte ett ”rent” mått på g. Implikationer för bedömning av generell problemlösning i urvalsprocesser

År 2009 utvecklade jag tillsammans med Hunter Mabon ett test; Matrigma. Matrigma byggde på principen matriser, först föreslaget av Charles Spearman som som en god indikator på generell intelligens, förkortat g. Det mest kända matristestet är Ravens Matriser (Raven var student till Spearman). Matrigma och Ravens Matriser hävdas ibland av både akademiker och praktiker att mäta g. Men läser man Spearman noga menade han aldrig att g kan mätas med en typ av problemlösningsfrågor (item), istället var hans utgångspunkt att en närmast oändlig variation av uppgifter i ett test är kapabla att mäta g, eftersom den generella faktorn finns i alla typer av problemlösning. Olyckligtvis hör jag ofta från konsulter och användare av psykologiska test att matriser är ett test som mäter g, men trots att jag och Hunter Mabon skrev att det inte var så i manualen till Matrigma, verkar marknadskrafter förenklat argumentet, nämligen att g kan mätas med ett test, eller en typ av problemlösningsuppgift. Matriser har sin fördel i att det är ett icke-verbalt test, men det väger inte upp nackdelarna att begränsa intelligens till ett test. Nedan kommer jag föreslå ett betydligt bättre sätt att mäta g på i urvalssammanhang, samtidigt som fördelen med Matriser bibehålls.

Först ska jag presentera vad en matris är för något (se nedan exempel).

Ett matristest börjar med enklare uppgifter och sedan blir uppgifterna svårare och svårare. Spearmans teoretiska utgångspunkter var att g-faktorn inte är relaterad till en specifik problemlösning. Spearman benämner detta som ”indifferences of the indicator” – item som tex innehåller verbal, spatial och numerisk information mäter alla g-faktorn. Detta visar sig i att om vi faktoranalyserar verbala, spatiala och numeriska item framkommer det att de item (oberoende av typ) som bäst fångar g-faktorn är de som utmanar förmågan till att se dolda samband, fylla i luckor där information saknas, se relationer mellan objekt, hitta beröringspunkter mellan figurer som skiljer sig åt – det vill säga typer av problemlösning som Spearman benämner ”education of relations and correlates”. Det viktiga är principen att se relationer mellan objekt, oberoende om det är verbala, spatiala eller numeriska item. Faktum är att ju fler typer av problemlösning som handlar om detta, desto bättre mått är det på g. På forskningsspråk benämns detta som konstruktrelevans. Om det är endast en typ av problemlösningsuppgift så benämns mätningen vara underepresentera konstruktet. I klarspråk, matriser är inte enskilt, ett tillräckligt bra mått på g.

Test som består av matriser har funnits på den kommersiella marknaden i över 100 år och det finns idag många väletablerade och välkända så kallade matristest. På senare tid har dock kritik framkommit som pekar på att flera grundläggande antaganden har glömts bort, missförståtts eller åsidosatts när man konstruerat nya, vidareutvecklat befintliga och/eller marknadsfört befintliga matristest (Raven, 2021). En del kritik handlar om själva konstruktionen av uppgifterna ett annat exempel är att det har blivit mer regel än ett undantag att marknadsföra matristest som ”det är bästa sättet att mäta generell problemlösningsförmåga”. Detta påstående kommer att särskådas nedan.

En studie som definitivt slår hål på påståendet att Matriser skulle vara den gyllene vägen att mäta g är en artikel som är skriven av Gilles E. Gignac och publicerad 2015 i tidskriften Intelligens, och titeln är;

Raven’s is not a pure measure of general intelligence: Implications for g factor theory and the brief measurement of g

Data i studien hämtades från sammanlagt tre stora databaser som finns tillgängliga för forskare där personer har fått genomföra en stor mängd olika intelligenstest (16-42 deltest av olika karaktär per individ). När alla dessa test analyserades visade det sig att Matriser EJ stod ut som den bästa indikatorn på g, det var snarare så att Matriser var ”medelbra” i jämförelser med särkilt numeriska och verbala test. I den data som var insamlad i Sverige var det Talserier som visades ha högst samband med g.

Slutsatsen är; för att mäta g finns det oändliga antal sätt att konstruera test. Ett bra mått på g är ett test som tar hänsyn till så många typer av problemlösning som möjligt, därför bör ett matristest kompletteras med deltest som mäter verbala, numeriska och även spatiala förmågor.

Assessment Engine – marknadens vassaste mått på problemlösningsförmåga och personlighet?

Assessment Engine strävar vi alltid efter att bli bättre och att leverera effektiva processer som följer den senaste forskningen på området. Ett led i det arbetet är att vässa vårt mått på generell problemlösningsförmåga, som är en viktig komponent i de flesta bedömningsprocesser som görs i samband med urval. Vi följer alltid den senaste forskningen och reagerar alltid när nya resultat presenteras. Därför har vi inte bara utvecklat ytterligare ett matris test, vi har följt Spearmans och Ravens grundintentioner när vi utvecklat vårt nya matris test, Logiska Matriser, och kan säga att det är just nu vassaste matristestet på marknaden som ska användas för rekrytering och urval. Men vi nöjer inte med ett test som mäter g utan vårt nya matristest, Logiska Matriser, kombineras med, våra redan utvecklade test, Logiska Talserier (numeriskt test) och Logiska Instruktioner (ett kombinerat verbalt och spatialt test). Även om vi inte kan säga att vi täcker hela konstruktet generell intelligens vågar vi säga att det är det bästa på marknaden som på ett snabbt och korrekt sätt fångar vår generella problemlösningsförmåga. Från 1 oktober finns vårt nya mått på intelligens för alla våra användare på Assessment Engine (utan att man behöver betala för ytterligare ett test). Vill du prova på Assessment Engine, en modern licensfri fri tjänst som bygger på ISO10667 (bedömningstjänster i arbetslivet), så bjuder vi på upp till 5 testningar beroende på om du kombinerar vårt nya mått på g med vårt ”Big Five” personlighetstest (P150) och intresse motivationstest (AIM). Alla våra bedömningstjänster bygger på den absolut senaste forskningen. Vill du veta mer om hur vi bedömer personlighet rekommenderas vår bok, Personlighet i arbete.

Referens

Gignac, Gilles E.( 2015). Raven’s is not a pure measure of general intelligence: Implications for g factor theory and the brief measurement of g. Intelligence, Volume 52, Pages 71-79.

Stabilitet och förändring av din personlighet. Ny forskning, delvis nya slutsatser.

En fråga som jag ofta får är om personligheten förändras över tid. Vi svarar på den frågan i vår bok Personlighet i arbete. Men forskningen går hela tiden framåt så nedan kan du läsa om det absolut senaste forskningen om personlighet i förändring. Tack till Stefan Söderfjäll som tipsade om artikeln).

Ett grundläggande antagande inom den s k traitpsykologin, är att personlighetsdrag är stabila över tid. Detta antagande har fått kritik och går ofta även stick i stäv med vad enskilda individer vittnar om i sina enskilda betraktelser. Ofta hör jag personer prata om sin egen utveckling och att olika livshändelser påverkat deras personlighet, dvs jag som individ ”är inte är samma person som jag var förut innan detta hände mig”. Modern traitbaserad personlighetspsykologi grundar sig istället på antagandet att personlighetsdrag är relativt stabila över tid men att det finns en viss dynamik både inom och mellan personlighetsdrag som kan bidra till förändring över tid. Nu har en intressant studie (se referens nedan) försökt svara på hur och på vilket sätt personlighetsdrag är stabila eller instabila över lång tid sett ur ett individuellt perspektiv.

Det vi skriver om i vår bok är hur forskningen traditionellt undersökt två typer av stabilitet. En typ är absolut stabilitet. Absolut stabilitet talar om hur stabilt ett personlighetsdrag är över tid om personen jämförs med en större grupp, tex om medelvärdet sjunker eller höjs för individen över tid. En annan typ av stabilitet fokuserar på hur stabil rangordningen är mellan människor med en viss nivå av en personlighetsegenskap. Vi konstaterar i vår bok Personlighet i arbete att medelvärdet och rangordningen förvisso kan förändras i riktade beteendeförändringar, men forskningen tyder på att personlighetsdrag är stabila både i medelvärde och rangordning, även om vissa drag som till exempel extraversion sjunker något på ålderns höst (särskilt energin går ned med högre ålder).

Även om dessa typer av förändring är intressanta så missar dessa analyser en viktig aspekt och det är att se till hela personlighetsprofilen i en och samma analys. Detta kallas på forskningsspråk personcentrerad personlighet, mer tekniskt för ipsativ personlighet.

Nedan kan ni se en personlighetsprofil av en individ vid ett tillfälle avseende personlighetsfaktorn Extraversion, vi kan kalla hen Anders (Anders heter egentligen något annat). Vi ser att Anders karaktärsdrag (vi kan säga att han är 58 år), i faktorn Extraversion, när han så sakteliga är påväg till pension, ligger nästan 1 standardavvikelse (58.08 T-poäng) högre än genomsnittet i den grupp individer som han jämförs med och som består av personer i arbete i Sverige.

Anders nivåer på faktorn Extraversion och dess facetter

Detta är en sk normativ absolut jämförelse: Anders nivå jämförs med en annan grupp individer. Om vi hade haft Anders T-värde på Extraversion när han var 20 år (med samma normgrupp och samma instrument för att mäta Extraversion) så skulle vi kunna jämföra Anders absoluta stabilitet över 38 år. Hade vi dessutom för hela gruppen haft en korrelation mellan två tillfällen på Extraversion så skulle vi kunna säga något om både hela gruppens relativa stabilitet, och även Anders relativa stabilitet, dvs om man jämförs med övriga i gruppen hur mycket mer eller mindre extravert har Anders blivit. Vi kan även undersöka den relativa stabiliteten i de s k facetter som ingår i faktorn Extraversion (Sällskaplighet, Dominans, Energi, Spänningssökande och Gladlynthet). Inom forskningen är det ofta normativ och relativ jämförelse som undersöks när man pratar om stabilitet eller förändring av personlighetsdrag.

Ett personcentrerat synsätt på stabilitet och förändring tar istället utgångspunkt i den sammantagna profilen, dvs att Anders karaktärsdrag är hög Energi och lågt Spänningssökande, förhöjd Dominans och Gladlynthet och genomsnittlig nivå på Sällskaplighet. När denna analys genomförs struntar man i andras värden på Extraversion utan ser enbart på den individuella profilen över tid, men andra ord en ipsativ jämförelse, även kallad inom-individ variation.

Den studie som nu publicerats undersöker hela profilen i femfaktormodellen och undersöker stabiliteten för sammanlagt 21 616 personer där den längsta tiden mellan mätningarna av personlighetsprofiler är 34 år!

Innan jag redovisar resultatet bör frågeställningen klargöras och hypoteserna som testas tydliggöras. Det finns, som alltid inom forskningen, olika synsätt där olika forskningsgrupper hävdar ”sin hypotes”. Om vi först skiljer på de mest extrema hypoteserna. Den första hypotesen är att personligheten endast kan förklaras av situationen, dvs miljön som personen befinner sig i. Det individen upplever i form av tidig uppväxt, partnerskap och senare arbete har en direkt påverkan på personligheten vid en bestämd tidpunkt. Då situationer ofta (men inte alltid) är mer eller mindre slumpmässiga skulle detta betyda att personlighet inte är stabil, alla dessa situationer ger upphov till att vem som helst kan uppvisa alla typer av kombinationer av personlighetsdrag över tid, beroende på upplevelser. Omsatt i exemplet Anders skulle detta betyda att det han har upplevt fram till 58 års ålder resulterat i den ovan redovisad profilen av Extraversion. En förklaring till den låga nivån av Spänningssökande skulle på så sätt vara resultatet av en händelse (slumpmässig eller inte) där Anders i tidigt liv sökte spänning och råkade ut för en olycka, vilket i sin tur sänkte hans nivå av spänningssökande.

Den andra extrema hypotesen är att allt beror på genetik och arv, att vi fullt ut ärver vår personlighet av våra biologiska föräldrar. Genetikens påverkan är ofta kontroversiell och ses som deterministisk och förutbestämd, trots att även det genetiska anlaget bjuder på både elasticitet och variation.

Det är bra att känna till att när man inom personlighetsforskningen talar om vikten av genetik och miljö menar man vanligtvis skillnaden mellan individer. Det vill säga, hur stor del av variationen mellan individer när det gäller till exempel personlighetsegenskapen extraversion som kan förklaras av eller härledas till genetiska faktorer. Man avser inte att ett visst antal procent av varje enskild individs nivå av extraversion kan härledas till genetiska faktorer, det är således inte ett perspektiv inom individen utan mellan individer. Vi vet inte heller hur mycket varje person får från sin mamma eller pappa, i genomsnitt är det 50% men i extrema fall så kan en individ få 90% från den ena föräldern och 10% av den andra. Forskning visar att genetiska faktorer förklarar omkring 40 procent av den variation som finns mellan individer när det gäller personlighet. Arv borde även bidra till att den individuella personlighetsprofilen är stabil över tid, dvs den ipsativa jämförelsen uppvisar stabilitet.

Det är få forskare idag som intar någon av dessa extrema positioner (100% arv alternativt miljö) och eftersom de genetiska faktorerna endast står för cirka 40% av variationen mellan individer så är förmodligen en kompromiss mellan arv och miljö en mer rimlig förklaring. Trots att det finns starka bevis för att personligheten beror på både arv och miljö kan jag höra från akademiska kollegor att det är väldigt svårt att acceptera att hela 40% skulle bero på arv.

Ett tredje perspektiv är att personligheten blir stabilare och stabilare över tid, situationer som inträffar i livet antas här inte vara slumpmässiga. Individen antas först ha en viss genetisk uppsättning som bestämmer nivån på t ex Extraversion. På grund av den medfödda nivån söker sig sedan individen till vissa situationer som bekräftar behovet av Extraversion. För Anders del så skulle det betyda att Spänningssökande kunde ligga på högre eller lägre nivåer i yngre ålder, men över tid har nivån av spänningssökande stabiliserats runt 30 T-poäng beroende på medvetna val han gjort, dvs ”play safe” (Anders har aldrig gillat gå på gröna Lund för att åka fritt fall).

Ett fjärde perspektiv är att det finns en skillnad i förändringsbenägenhet mellan individer, dvs att vissa individer har lättare eller större benägenhet att förändra sin personlighet i jämförelse med andra. Detta skulle betyda om man jämför en större grupp över tid skulle en del förändra sig och andra skulle uppvisa stabilitet, oberoende av vilken situationer eller miljöer personerna befinner sig i. Detta perspektiv kan antingen ha en direkt påverkan på personligheten, oberoende av arv och miljö men kan också samvariera med arv och miljö för att påverka en individs personlighetsprofil.

Alla dessa perspektiv kan naturligtvis tillsammans förklara en individs förändring och stabilitet i personlighet över tid. Vad kommer då forskarna fram till i sin studie?

På ett övergripande plan kan man dra slutsatsen att personlighetsprofilerna är stabila över tid: de allra flesta ”behåller” sin personlighetsprofil genom sin livscykel. Men, det finns också individer som kontinuerligt förändrar sin personlighet. Detta förklaras av en individuell differens som INTE kan förklaras av slumpmässiga situationer.

Den genetiska faktorn och sökandet av situationer som bekräftar personligheten har betydligt större effekt i jämförelse med livshändelser. Ett intressant fynd är att de som tidigt förändrar sin personlighet tenderar att fortsätta med det genom livet, medan de som är stabila från början följer den trenden livet ut.

En slutsats som dras är att dessa resultat pekar på att situationer har en högst begränsad effekt på en individs personlighet över tid. Detta säger å andra sidan inte att livshändelser inte kan påverka personligheten på kort tid, men det tyder på att individen sedan oftast går tillbaka till det karaktärsdrag som man hade innan händelsen.

När det gäller ålder så finns det en skillnad mellan yngre och äldre. Efter man nått åldern 30 verkar de flesta personer uppvisa en stabil personlighetsprofil. Tidigare normativa jämförelser visar att Målmedvetenhet och Sympatiskhet höjs med åldern medan Neuroticism sjunker ju äldre man blir. Dock är det relativt små skillnader. Omsatt i Anders resultat kan han under vissa omständigheter i livet visat på en betydligt lägre nivå i Extraversion men över tid kommer han återvända till 58.08 poäng.

Den övergripande slutsatsen som forskarna drar är att vår personlighet är stabil över tid men att vissa individer tidigt kan visa på större förändringsbenägenhet än andra. Denna förändringsbenägenhet består sedan senare i livet. Forskarna föreslår att det är genetiska faktorer och det faktum att vi söker bekräftelse av vår personlighet som står för stabiliteten.

Jag föreslår därför att man bör lägga till en faktor i FemFaktorModellen: grad förändringsbenägenhet/stabilitet.

Vad kan vi då säga om Anders resultat? Inte mycket mer än att det än att hans nivå på Extraversion ser ut såhär idag, Det hade varit intressant och se hans resultat vid 5, 10, 15, 20, 25, 30 etc års ålder, då hade vi vetat mer om han har förändrat sin personlighet genom livet.

Vad får denna forskning för praktiska implikationer?

När det kommer till att använda personlighetstest i arbetslivet betyder det att resultat från personlighetstest för vissa personer kan vara färskvara. Dessa individer är dock få, de allra flesta har en personlighet som är stabil även under längre tidsperioder. Relevansen i att använda personlighetstest är dock oförändrad. Men att slentrianmässigt, eller strategiskt, ”återanvända” resultat från personlighetstest i rekryteringssammanhang, dvs spara ett resultat för att använda till återkommande urvalsbeslut är inte att rekommendera. Detta gäller särskilt för yngre kandidater där personligheten inte stabiliserats.

Om det finns en individuell skillnad i förändring så kan det bli missvisande resultat, särskilt om resultat återanvänds efter en längre tid. I urvalssammanhang är det viktigt att matcha personlighetsprofilen med det tilltänkta arbetet vid ett tillfälle. Nu blir det än viktigare att göra en seriös arbetsanalys av vilken profil som behövs på arbetet vid ett tillfälle, därför har vi på Assessment Engine utvecklat en metod för detta där man på ett enkelt sätt matchar femfaktormodellen mellan individen och arbetet (ska inte tolkas som en kompetensmodell). Hör av er om ni vill veta mer.

Om personlighetstest används i utvecklingssammanhang är det viktigt, baserat på ovan att undersöka individens stabilitet i personlighetsprofilen. För att veta om individen är mottaglig för förändring bör man mäta personligheten vid minst tvår tillfällen, helst fler. Assessment Engine har utvecklat en metod för att undersöka även detta, hör av er om ni är intresserade.

Jag finns på info@psychometrics.se

Referens

Wright, A. J., & Jackson, J. J. (2022). Are some people more consistent? Examining the stability and underlying processes of personality profile consistency. Journal of Personality and Social Psychology. Advance online publication. https://doi.org/10.1037/pspp0000429

Psykometribabbel

Med psykobabbel avses ”Användning av psykologiska termer och i synnerhet av dagens modeord inom psykologin på ett sätt som bara delvis eller inte alls stämmer med ordens vetenskapliga innebörd”. Sedan mer än 20 år har jag arbetat med att anpassa och utveckla psykologiska test som idag används inom klinisk psykologi (utredning av kognitiva svårigheter hos barn), skolpsykologi (tex läs- och skrivdiagnostik, utredning av dyslexi) och arbetspsykologi (test som används för urval och vägledning). Under dessa år har jag stött på ett antal ”buzzwords” inom dessa områden, här kommer jag dock fokusera på begrepp som används inom arbetspsykologisk testning, dvs psykometribabbel inom arbetslivets psykologi.

Som alla ser här är detta en tre parameters IRT modell

Artificiell intelligens (AI)

Artificiell intelligens (AI) eller maskinintelligens är förmågan hos datorprogram och robotar att efterlikna människors och andra djurs naturliga intelligens, främst kognitiva funktioner såsom förmågan att lära sig saker av tidigare erfarenheter, förstå naturligt språk, lösa problem, planera en sekvens av handlingar och att generalisera. AI är förmodligen ett av psykometribabbel som används mest osorterat idag. Det kan i stort sätt betyda vad som helst. När man skrapar på ytan hos vissa leverantörer av test kan det vara att summera en skala.

Maskininlärning

Maskininlärning (engelska: machine learning) är ett område inom AI, och därmed inom datavetenskapen. Det handlar om metoder för att med data ”träna” datorer att upptäcka och ”lära” sig regler för att lösa en uppgift, utan att datorerna har programmerats med regler för just den uppgiften. Detta är inget nytt! På ett teoretiskt plan uppfanns detta för många år sedan, men datakraften att räkna på detta sätt saknades. Idag säger flera leverantörer av test att de använder sig av ”machine learning” och det låter ju häftigt!
Har själv prövat detta och jämfört med betydligt enklare och mer kostnadseffektiva metoder, och de ger i princip samma resultat. Det finns stora fördelar med maskininlärning på en mängd olika områden, men på testområdet har jag inte funnit stöd för detta, dvs avseende hur väl en testpoäng förutsäger senare arbetsprestation. 

Kompetensmodeller

Runt 2005 började olika sk kompetensmodeller dyka upp hos traditionella leverantörer av psykologiska test. Dessförinnan var ett personlighetstest ett test som mäter personlighet (tex Extraversion), och ett kompetenstest ett test som mäter en färdighet som är något annat än personlighet (tex kunskap i programmering). Idag finns det leverantörer som har ett personlighetstest med ofta goda psykometriska egenskaper men kunder förleds tro att testet mäter kompetenser, oftast efter en hemmasnickrad modell som inte är kvalitetssäkrad. Ibland kan till och med användare få sätta ihop sin egen kompetensmodell! Detta är helt klart ett cirkelresonemang. Jag har själv varit med att utveckla ett personlighetstest som idag säljs tillsammans med en mycket diffus kompetensmodell; de psykometriska egenskaperna har blivit godkända av DNV:s granskning enligt EFPA:s kriterier gäller för evidensen och kvalitet som ett personlighetstest.  Trots det marknadsförs och användes detta test tillsammans med en helt ovaliderad kompetensmodell, något som inte framgår i marknadsföringen.

Fem Faktor Modellen

FFM är det modell av personlighet som idag har tydligast stöd inom forskningen, många testleverantörer säger sig ha ett FFM test. Vid närmare granskning av hur test utvecklats är det inte många test på den arbetspsykologiska marknaden som uppfyller kravet på att verkligen mäta FFM av den anledningen att det inte framgår hur item (frågorna eller påståendena i testet) konstruerats och hur varje item är länkat till respektive konstrukt som ligger till grund för facetter, aspekter och faktorer. Idag finns det, enligt min mening, tre-fyra test på marknaden som har manualer som beskriver att det var FFM som låg till grund när item (frågor och påståenden) utvecklades och testet med dess skalor konstruerades. Än värre är det när man påstår att intervjuer mäter FFM utan att ha någon som helst dokumentation på vilka grunder den utsagan kan bekräftas. Jag har även hört att vissa påstå att deras kompetensmodeller vilket säkert är ett framgångsrikt marknadsföringsknep som skänker legitimitet.

Att validera ett testresultat

Detta psykometri-babbel hörde jag första gången på 90-talet. Med detta menas att bedömaren (rekryteraren) ska bekräfta att de resultat som kandidaten fått på ett personlighetstest ska verifieras eller förkastas i en intervju med kandidaten. Jag har aldrig sett någon forskning om detta, men risken att den validitet som finns i en testpoäng försvinner då man ställer dessa frågor är betydande. Om man vill ”kontrollera” resultatet bör man istället utveckla intervjufrågor som mäter FFM, dessa intervjuer genomförs sedan helt oberoende av testresultatet. Det mest ”sanna” är sedan medeltalet av dessa två bedömningar. För att detta ska fungera så krävs dock en hel del utvecklingsarbete, något som få är villiga att göra eller har kompetensen till, tyvärr. Sannolikheten är därför stor att man fortsätter att ställa frågor till kandidater som sannolikt ger mer skada än nytta.

Adaptiva test

Adaptiva test bygger på en psykometrisk modell som benämns item respons theory (IRT). Om IRT används på ett korrekt sätt finns en fördel i att man inte behöver administrera exakt samma item till alla personer som ska jämföras. En annan fördel är att du inte behöver ställa lika många frågor i jämförelse med ett traditionellt test, det räcker med att administrera de för den enskilda individen mest relevanta itemen. Ett exempel är ett begåvningstest, där person 1 får 34 uppgifter att besvara medan person 2 endast får 24 uppgifter. Trots detta kan des båda personernas begåvningsnivå jämföras, och till och med utgöra en bättre jämförelse än om båda fått samma antal frågor. På detta sätt kan en leverantör utveckla en ”itembank” med många uppgifter (eller frågor) som sedan kan användas på olika sätt vid testning. Det låter ju fantastiskt, men vad är nackdelen? (I ett poddavsnitt hörde jag enleverantör ondgöra sig över alla andra okunniga psykometriker som inte fattade detta, förutom att hen naturligtvis som hade utvecklat ett adaptivt personlighetstest).

Jo nackdelen (för sådana finns det alltid flera av även om de sällan nämns) är att när man använder IRT så görs en mängd mycket starka antaganden. Dessa antaganden måste alltså uppfyllas för att modellen ska fungera i praktiken. Ett av de viktigaste (men långt ifrån det enda) antagandena är det sk ”lokala oberoendet”. Antagandet om lokalt oberoende innebär att det statistiska sambandet mellan item kan förklaras endast av det latenta begreppet som vi avser att mäta med en skala, tex en frågor i en skala som mäter Extraversion ska förklaras av begreppet Extraversion. Om så inte är fallet, faller IRT modellen modellen totalt. Den är helt enkelt inte längre giltig. Naturligtvis går detta att testa, men det struntar man ofta i när man pratar IRT.

Jag har själv varit med att utveckla test som tillämpar IRT och som testutvecklare anser jag att IRT INTE fungerar i praktiken såsom teorin förutspår. IRT kan fungera med begåvningstest, men jag har tills dags datum inte läst om något personlighetstest som mäter FFM och som uppfyller alla krav som ställs på IRT för att det praktiskt ska fungera. Så säger din testleverantör att de har ett adaptivt personlighetstest så ställ frågan om alla antaganden som finns verkligen uppfylls för den svenska version (eller annan språkversion) som ska användas och låt dem redogöra för det skriftligt. Jag har läst en manual som ser lovande men det är inte ett test som finns på svenska.

Textanalys

Detta begrepp är nära knutet till Maskinlärning, skillnaden är att innan själva analysen omvandlas textmassan till siffror. I ett pilotprojekt jag ledde analyserades öppna enkätsvar med sk ”latent semantisk analys”. Resultatet såg lovande ut men det var ett enormt jobb att göra data analyserbart. Och analysen i sig tog väldigt lång tid. Det finns också lovande resultat inom forskningen där man uppnått minst lika bra resultat av text analys som av att använda numeriska värden för att tex mäta livstillfredställelse (https://psycnet.apa.org/record/2018-31467-001). Tror mycket på detta i framtiden, men hitintills har jag inte sett någon studie som stödjer att textanalys skulle addera någon validitet till ett begåvningstest eller ett personlighetstest som använder traditionell poängsättning.

Användningen av normgrupper

Går det att använda ett test utan normgrupper? Normgruppens funktion är att relatera den individuella testpoängen till en absolut nivå. Låt mig ta ett exempel, om du har testat en person och fått en summapoäng på skalan Sympatiskhet i ett personlighetstest, då vill du veta om denna summa är förhållandevis låg eller hög i jämförelse med andra personer. ”Babblet” här jag har hört är att det finns test på marknaden utan normgrupper?  Eller att vi ”inte har normgrupper, vi har stickprov”. Ett annat babbel jag hört är att i den moderna psykometrin inte behövs några normgrupper. Det är sant att man mycket väl kan strunta i normgrupper, om syftet med testningen är att endast rangordna dessa individer längs skalan Sympatiskhet (som exempel) utan att vara intresserad av att säga om en individs summavärde är låg, medel eller högt i förhållande till något. Men så fort du ska uttala dig om en individs absoluta nivå på Sympatiskhet måste ALLTID en normgrupp användas. Det spelar inte någon roll om du använder ”gammal” psykometri från början av 1900-talet eller ”modern psykometri” (som för övrigt inte bör kallas modern psykometri eftersom IRT kan spåras tillbaka till 1940-talet, eller kanske t om tillbaka till 1920-talet när Thurstone lanserade sin absoluta skalning som var inspirerad av psykofysiken).

Detta är bara några exempel på babbel som många gånger har svagt stöd i forskningen. Om du vill att jag ska skriva om mer psykometribabbel så maila mig på info@psychometrics.se

Personlighet i arbete –evidensbaserad personlighetsbedömning 

Vår bok Personlighet i arbete som publicerats av Natur och Kultur har fått ett fantastiskt mottagande av personer som är intresserade av att veta mer om sin egen och andras personlighet. När vi började detta projekt hade vi en vision att informera intresserade vad forskningen säger om personlighet. Nu vill vi ta ett steg till och ge kunskap om evidensbaserad bedömning av personlighet i arbete. Vi kommer ge deltagarna den absolut senaste forskningsresultaten avseende Fem Faktor Modellen och extrema personlighetsdrag och även visa hur ni på ett enkelt sätt kan öka tillförlitligheten i personbedömningar i arbetslivet. Välkomna

Utbildning

9 maj 2022 kl 13-16 på Tändstickspalatset i centrala Stockholm samt digitalt via zoom

Kursbok: Sjöberg, S., Sjöberg A., & Henrysson Eidvall S. (2021). Personlighet i arbete. Natur och Kultur.

Pris: 2500 kronor + moms och inklusive kursbok.
(Om du redan har boken är kostnaden 2150 kronor + moms – ange i anmälan).

Seminariet anordnas av Sara Henrysson Eidvall, Henrysson Åkerlund AB i samarbete med Sofia och Anders Sjöberg, Assessment Engine

Anmäl dig här

Länkar med mer information

Vill du höra mer om boken klicka här där jag samtalar med Fredrik Hillerborg i programmet Lära från Lärda.

Vill du höra mer om boken klicka här där jag samtalar med Lena Gatenborg Mohns på MPS om hur personligheten sätter ramar för våra styrkor och svagheter på arbetsplatsen?

Vill du beställa boken klicka här

Vill du läsa om evidensbaserade bedömningar i arbetslivet som följer ISO10667 klicka här

Vill du beställa den nya standarden ISO10667 om bedömningstjänster i arbetslivet, i detta projekt har jag verkat som expert i många år. Om du är uppdragsgivare av personbedömningar klicka här. Är du leverantör av personbedömningar klicka här

Personlighetsbedömning i arbetslivet. Vad funkar bäst?

Att bedöma personlighet är svårt. Eftersom personlighet alltid är i arbete går det att bedöma med en rad olika metoder. Bedömningen kan vara att se vad du publicerar på Facebook, låta en robot ställa frågor om din personlighet, administrera ett självrapporterande test och/eller låta andra bedöma din personlighet. I mitt förra inlägg redovisade jag var forskningen står idag avseende självrapporterande test. Nedan breddar jag dikussionen och tar även upp observatörsskattning.

Fem Faktor Modellen (FFM) bedöms i de allra flesta fallen med ett självrapporterande test. Men faktum är att FFM inte upptäcktes genom självrapporterande test utan genom observatörsskattningar. Det var redan 1961 som forskarna Ernest Tupes och Raymond Christal formulerade det som vi i dag kallar FFM. I huvudsak grundades detta arbete
på omfattande observatörsskattningar inom det amerikanska flygvapnet. Observatörsskattningarna faktoranalyserades och resulterade i en preliminär FFM.

Under senare delen av 1960-talet och under 1970-talet drabbades personlighetsforskningen och synen på individuella skillnader av en mer allmän, stark kritik från olika håll. Det var inte politiskt korrekt att tala om att människor skiljer sig åt, i synnerhet inte om sådana skillnader som till stora delar är ärftliga. Personlighetsforskningen föll mer eller mindre i glömska. Det var inte förrän på 1980-talet, när forskarna Paul T. Costa och Robert R. McCrae genomförde studier om personlighetsutveckling, som arbetet med FFM togs upp igen. Även då med observatörsskattningar. Paul T. Costa och Robert R. McCrae kunde då replikera Ernest Tupes och Raymond Christals fynd, drygt 20 år senare. Tanken bakom en observerad bedömningsmetod av personlighet är att andra uppfattar individens personlighet på ett annat, mer korrekt sätt i jämförelse med individen själv och/eller att betraktaren ser andra saker i jämförelse med individen själv. Så den självrapporterande personligheten bör således kompletteras med observatörskattningar av personlighet, för att ge en mer träffsäker bedömning

Vill du läsa mer om historiken kring FFM, kolla in vår nya bok här.

Jag har sammanfattat forskningen nedan vad vi idag vet om självrapporterande test och observatörsskattningar baserat på studierna som ni hittar i referenslistan. Jag har även adderat egen insamlad data. För att göra en komplett uppskattning behövs följande.

  1. Samband mellan de ingående faktorerna i FFM (Känslomässig Instabilitet, Extraversion, Öppenhet, Sympatiskhet och Målmedvetenhet.
  2. Samband mellan de ingående faktorerna i FFM och kriteriet arbetsprestation. Data för detta går att hitta i forskningstudier (se referenslistan), förutom sambanden mellan de ingående faktorerna i FFM för kontextualiserade test.

Det opublicerade resultatet som jag använde i mina beräkningar hämtade jag från Assessment Engine Manualen där vi beskriver standardiseringen av vårt nya kontextualiserade personlighetstest Personality30 (Assessment Engine Assessments & Algorithms Technical Info, 2020).

För att beräkna validiteten använde jag programmet R (package yhat). Genom att beräkna en linjär regressionsanalys baserat på ovan redovisad data kan den sammanlagda validiteten (multiple R) uppskattas för tre olika sätt att bedöma personlighet. Allmänna (okontextualiserade) personlighetstest, kontextualiserade personlighetstest och test som baseras på observatörsskattningar.

Not. Observera att estimatet för observerad personlighet antar att det är en person som observerat. Om det är flera personer som observerar så ökar sannolikt validiteten. Mer forskning behövs, särkilt för kontextualiserade test och observatörsskattningar för att de flesta studierna som meta analyserna bygger på har inte undersökt hur dessa metoder fungerar i skarpt läge.

Resultatet i figuren visar validiteten uttryckt i en multipel korrelation för allmänna personlighetstest, kontextualiserade personlighets test och observatörsskattningar. Lägst validitet har allmänna okontextualiserade personlighetstest och högst validitet har observatörsskattningar.

Det är naturligtvis praktiska utmaningar med olika bedömningsmetoder, särskilt med observatörsskattningar. Vi på Assessment Engine tror dock att detta går att lösa, vill ni veta mer om vår nyutvecklade bedömningstjänst ”observerad personlighet” eller testa vårt kontextualiserade personlighetstest, ett av få test som verkligen bygger på hela FFM och utvecklat för arbetslivet, får ni gärna kontakta oss på team@assessmentengine.se.

Vill ni läsa mer om Assessment Engine kan ni klicka här.

Referenser

Assessment Engine. Assessments & Algorithms Technical Info (2020). opublicerat manuscript. Psychometrics Sweden AB.

Connelly, B. S., & Ones, D. S. (2010). An other perspective on personality: Meta-analytic integration of observers’ accuracy and predictive validity. Psychological Bulletin, 136(6), 1092–1122. https://doi.org/10.1037/a0021212

Oh, I.-S., Wang, G., & Mount, M. K. (2011). Validity of observer ratings of the five-factor model of personality traits: A meta-analysis. Journal of Applied Psychology, 96(4), 762–773. https://doi.org/10.1037/a0021832

Park, HyeSoo (Hailey) , Wiernik, Brenton M. , Oh, In-Sue , Gonzalez-Mulé, Erik , Ones, Deniz S. , & Lee, Youngduk. Journal of Applied Psychology, Vol 105(12), 1490-1529

Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2021, December 30). Revisiting Meta-Analytic Estimates of Validity in Personnel Selection: Addressing Systematic Overcorrection for Restriction of Range. Journal of Applied Psychology. Advance online publication. http://dx.doi.org/10.1037/apl0000994.

Shaffer, J. A., & Postlethwaite, B. E. (2012). A matter of context: A metaanalytic investigation of the relative validity of contextualized and noncontextualized personality measures. Personnel Psychology, 65(3), 445–494. https://doi.org/10.1111/j.1744-6570.2012.01250.x

Sjöberg, S., Sjöberg A., & Henrysson Eidvall, S. (2021). Personlighet i arbete. Förstå drivkrafter bakom och beteenden bakom femfaktormodellen. Natur & Kultur. 

Personlighet i arbete. Beror personlighetstests validitet på situationen? Nya resultat från meta-analyser ger klarhet.

Personlighetstest som bedömningsmetod har fått mycket kritik i media under senaste åren. Enligt min mening är det ofta på grund av okunskap från de som kritiserar, sällan behandlas vilken teori personlighetstestet utgår ifrån, om det ska användas som en beskrivning av personen eller om det ska vara underlag för ett urvalsbeslut. Inte heller diskuteras när i en urvalsprocess ett personlighetstest ska administreras till sökande till en tjänst. Nedan kommer en alldeles färsk sammanställning vad forskningen säger om självrapporterande personlighetstest.

I den senaste sammanställningen av forskning kring metoder som kan användas för urvalsbeslut jämförs olika typer självrapporterande personlighetstest. Författarna skiljer på två olika personlighetstest. Allmänna och kontextualiserade test. I allmänna test får personen som bedöms instruktioner att svara på frågorna hur personen tänker känner och handlar i största allmänhet i olika situationer. Kontextualiserade test anger en specifik situation, i detta fall hur personen tänker känner och handlar på arbetet eller i en yrkesroll.

Resultatet presenterades redan 2012 men har nu sammanställts och beräknats om med delvis nya metoder och publicerats i samma artikel som jag bloggade om förra veckan. Nedan ser ni resultatet när en jämförelse genomförs mellan allmänna och kontextualiserade personlighetstest. Resultatet är uppdelat i de fem stora personlighetsdragen, känslomässig stabilitet, extraversion, öppenhet, sympatiskhet och målmedvetenhet.

Figur. Allmänna och Kontextualiserade personlighetstest

Som ni ser är det tydliga resultat, test som i instruktionerna anger att personen ska tänka på en arbetssituationen har betydligt högre validitet i jämförelse med de allmänna personlighetstesten som ej definierar en arbetssituation. Det är särskilt emotionell stabilitet och öppenhet där de största skillnaderna finns. Men även de andra faktorerna visar på en klar förhöjd validitet. Så slutsatsen är tydlig. Använd personlighetstest som är kontextualiserade. Forskarna har en förklaring till detta vilket benämns Frame Of Reference (FOR). Det betyder att frågar du tydligt vilken situation som avses så höjs validiten betydligt.

Vill ni börja använda ett personlighetstest som bygger på vår senaste bok om personlighet i arbete? Ett test som från början utvecklades och validerades i en arbetande population och där instruktioner och frågor handlar om hur personen som testas tänker, känner och handlar i arbetet. Vi kallar det Personality150. Kolla in denna adress www.assessmentengine.se

Kolla in denna bok om ni är intresserade att läsa mer om personlighet i arbete.

Sjöberg, S., Sjöberg A., & Henrysson Eidvall, S. (2021). Personlighet i arbete. Förstå drivkrafter och beteenden med femfaktormodellen. Natur & Kultur. 

Och det är inte slut här, i nästa blogg gör jag en jämförelse mellan observatörsskattningar och självrapporterade personlighetstest som vi skriver om i vår bok Personlighet i arbete.

Referenser

Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2021, December 30). Revisiting Meta-Analytic Estimates of Validity in Personnel Selection: Addressing Systematic Overcorrection for Restriction of Range. Journal of Applied Psychology. Advance online publication. http://dx.doi.org/10.1037/apl0000994. Table 4.

Shaffer, J. A., & Postlethwaite, B. E. (2012). A matter of context: A metaanalytic investigation of the relative validity of contextualized and noncontextualized personality measures. Personnel Psychology, 65(3), 445–494. https://doi.org/10.1111/j.1744-6570.2012.01250.x

Sjöberg, S., Sjöberg A., & Henrysson Eidvall, S. (2021). Personlighet i arbete. Förstå drivkrafter bakom och beteenden bakom femfaktormodellen. Natur & Kultur. https://www.nok.se/titlar/laromedel-b2/personlighet-i-arbete/

Ny sammanställning av metaanalyser och hur det påverkar det praktiska urvalsarbetet

Som jag skrivit om tidigare är min rekommendation att inte fullständigt stirra sig blind på Schmidt & Hunters meta analys från 1998. En hel del nya meta analyser har visat att forskningsresultat förändras och min poäng är att praktiken alltid måste följa de senaste forskningsresultaten.

Sista dagen på året 2021 publicerades en ny sammanställning av alla meta analyser som finns tillgängliga avseende urvalsmetoders prediktiva validitet som kommer delvis ändra på kartan avseende hur urvalsmetoder bör användas i urvalsprocesser (Sackett mfl, 2021).  Men innan jag redovisar en del av resultatet bör några saker sägas.

Få som citerar och hänvisar till den tidigare artikeln publicerad 1998 har läst hela artikeln. Det är oftast endast en kolumn i hela artikeln som används som argument för att bygga en urvalsprocess. Delvis mitt fel, för jag gjorde redan 1998 en förenklad figur av den kolumnen (tillsammans med Åsa Magander på dåvarande Psykologiförlaget) som sedan har återgetts om och om igen i tidningar och powerpoint presentationer. Nu innan den nya artikeln når ut så vill jag gärna försöka förklara närmare hur resultatet bör tolkas. Så innan jag presenterar det det jämförande resultatet mellan åren 1998 och 2021 skulle jag be att ni läser igenom följande punkter innan ni tittar på resultatet (i graf och kolumner).

  • En hel del av data i denna artikel bygger INTE på ny data utan snarare på att forskarna har räknat om gamla resultat med en delvis ny metod för att hitta mer exakta estimat. 
  • Kriteriet i denna artikel liksom den tidigare artikel från 1998 fokuserar på övergripande arbetsprestation, i de allra flesta fallen bedömd av den närmaste chefen. Idag vet vi att det är här viktigt att skilja på olika typer av prestation som ”task performance” som omfattar den prestation i faktiska och konkreta arbetsuppgifter som bidrar till produktionen i organisationen, och Organisationsmedborgarskap (eng. Organizational Citizenship Behaviour, OCB) som definieras som alla de frivilliga och positiva beteenden som inte omfattas av Task Performance men som på olika sätt främjar organisationens mål, och ”skadliga” eller kontraproduktiva beteenden ”Counterproductive Work Behavior, CWB” som är relaterade till arbetet eller organisationen. Denna distinktion görs EJ i denna artikel.
  • Denna artikel behandlar explicit varken kostnadsaspekten av vad som administreras i urvalsprocessen eller hur många sökande det är till en tjänst (sk nyttoberäkningar). Under vissa förhållanden kan det vara fördelaktigt att välja billigare alternativ med lägre validitet framför mer kostsamma metoder med högre validitet. Detta behandlades i artikeln från 1998.
  • Denna artikel behandlar INTE tillägs-validiteten (eng incremental validity), dvs vad som händer när man kombinerar två eller flera metoder, tex arbetsprov och begåvningstest. Detta genomfördes i Schmidt & Hunter (1998) men inte i denna artikel.
  • När resultatet tolkas nedan är det viktigt att skilja på metoder som baseras på en noggrann arbetsanalys (tex kunskapsprov) och de metoder som mäter generella psykologiska egenskaper (tex begåvning).
  • När det gäller strukturerad intervju avses EJ kompetensbaserad intervju (unikt fenomen på den svenska marknaden). En strukturerad intervju avser att samma frågor ställs till alla kandidater, utan olika följdfrågor och att alla svar (som har med urvalsbeslutet att göra) poängsätts på samma skala. Varje fråga ska kunna länkas till den kunskap eller färdighet som krävs i arbetet baserat på den tidigare utförda arbetsanalysen. Det som i Sverige benämns struktured intervju betraktar jag i de flesta fallen som ostrukturerad intervju, dvs liknande frågor med följdfrågor med poängsättning som endast delvis är kopplat till en gedigen arbetsanalys.
  • Systematisk insamlad biodata används, vad jag vet, knappast i Sverige. I USA benämns det som ”biodata inventories” och består av skriftliga frågor som standardiserat besvaras av kandidaten om tex ledarskap, personlighet, intresse, kunskap och färdighet. Det gemensamma med alla frågor är att det handlar om tidigare beteenden på arbetsplatsen. Även biodata är starkt knutet till arbetsanalysen.
  • När det gäller intresse så har man delvis bytt fokus, i denna artikel avses matchningen mellan individens intresse och det aktuella arbetet. Det skiljer sig från den tidigare sammanställningen där det handlade om hur mycket intresse individen hade av alla olika intressen. Således även här krävs en ordentlig arbetsanalys.
  • Vissa av metoderna har ej, enligt forskarna kunnat replikeras då det redan 1998 saknades tillräcklig information om studierna som ingick i de enskilda meta analyserna. Detta är bl.a.; år av utbildning, medarbetarbedömning (eng peer ratings) provanställning, referenstagning (eng reference checks), grafologi och ålder. Så dessa metoder för urvalsbeslut vet vi inte något om i dagsläget.
  • Nedan resultatredovisning är inte en komplett redovisning, det finns fler resultat bl.a. om emotionell intelligens och personlighet som jag kommer återkomma till i senare blogginlägg. 

Jämförande resultatet (1998 mot 2021)

Det tydligaste resultatet ser ni i grafen och den högra kolumnen i tabellen. Av 11 metoder är det 9 där validiteten sjunkit. Den största skillnaden är arbetsprov (-0,21) tätt följt av begåvning (-0,20) och ostrukturerad intervju (-0,19). Det är endast två metoder som visar på en högre validitet i jämförelse med för över 20 år sedan, det är intresse (+0,14) och biodata (+0,03). Både intresse Nye m.fl. (2017) och biodata Speer m.fl. (2021) baseras på nyligen publicerade meta analyser långt efter 1998.
Den största anledningen till skillnaden (förutom de nya meta analyserna) är, menar forskarna, att tidigare studie överkorrigerat för beskuren spridning. Beskuren spridning uppkommer när man räknar samband baserat på samma urval som redan använt metoden för urvalsbeslut. Eftersom många av studierna sannolikt inte haft en kraftig beskuren spridning så har man överskattat validiteten. Det syns tydligt i validiteten för begåvning som man 1998 fann ha samma validitet som strukturerad intervju (0,51). Däremot har det inte varit samma problem med den strukturerade intervjun, den sjunker inte så kraftigt som begåvning.

Vad betyder detta resultat för praktiken? 

Den tydligaste indikationen är att de metoder som har högst validitet mäter arbetsbeteende. Den strukturerad intervjun, kunskapsprov, biodata och arbetsprov (och även assessment center som kommer lite längre ned i rangordningen) har ofta en gemensam nämnare, dvs vad kandidaten kan, vad har kandidaten gjort innan och hur bra har kandidaten lyckats med det. 

Det är positivt eftersom då vet vi att det viktigaste kanske inte är att välja en specifik metod av dessa utan snarare analysera, hur kan vi till minsta möjliga tid/kostnad kan ta reda på detta? En annan fördel är att dessa kan kombineras, tex kan en anställningsintervju även innehålla kunskapstest, ett prov på att göra jobbet (arbetsprov) och frågor om hur väl man lyckats på ett tidigare jobb (biodata). 

En nackdel är att det i de allra flesta fallen krävs erfarenhet hos de som söker arbetet, vi kan ju inte testa kunskapen hos någon som ska lära sig något (tex urvalet till polishögskolan). Vi kan inte heller ställa frågor hur någon lyckats med något om det inte finns någon erfarenhet (en person som söker chefsposition som aldrig varit chef). 

Ytterligare en utmaning är att med dessa metoder är att det krävs det en ytterst gedigen arbetsanalys, då varje roll kan ha specifika utmaningar och de frågor som ställs i antingen skriven form eller muntlig form bör vara specifikt arbetsrelaterat till just det jobbet. Här finns inga genvägar, här krävs grundlighet av någon expert som kan jobbet, eller flera som utfört jobbet under en längre tid som vet vad som krävs. 

Jag ser inte att detta kan utföras av en rekryteringsexpert ensam, snarare ska rekryteraren samla in standardiserad information från experter och sammanställa denna information som grund för utformning av intervjun/kunskapsprovet/arbetsprovet/biodata. En annan utmaning är kostnaden. För att utveckla dessa metoder krävs både en arbetsanalys, en utprövning av metoden inklusive en lokal valideringstudie för att se om det funkar.

Begåvningstest och personlighet (i detta fall målmedvetenhet och intergritetstest) och intresse mäter psykologiska egenskaper hos kandidaten. Förutom intresse har dessa sjunkit i validitet. Det är naturligtvis en stor brist att vi trott innan att begåvning har haft en betydligt högre validitet för medelkomplexa arbeten. När det gäller komplexa arbeten höjs validiteten, det är viktigt att komma ihåg. Uppskattnigsvis för mer komplexa arbeten så ligger validiteten på ca .40 (men det får kommande meta analyser undersöka).

Finns det fog för att använda dessa psykometriska metoder? Fördelen med dessa mer psykologiska faktorer är att de ofta är billigare i förhållande till mer arbetsrelaterade metoder. Mycket tyder på tex att nivåer av begåvning och centraltendenser av personlighet går att generalisera till många jobb och yrken. Tex mer komplicerade yrken kräver högre begåvning och stressutsatta arbeten kräver känslomässig stabilitet, så arbetsanalysen blir inte så central här. Eftersom det tar mindre tid att administrera dessa metoder bör de lika tidigt i processen när de obligatoriska kraven på tjänsten uppfyllts. Däremot är det tveksamt att använda dessa psykologiska variabler sent i urvalsprocessen. En annan fördel är att dessa metoder ej kräver någon erfarenhet hos de sökande, således lämpar sig dessa metoder bra när man ska lära sig nya saker eller anpassa sitt beteende till ett nytt jobb, en del kallar det för potential att lyckas.

Detta var det första blogginlägget om denna artikel, men det finns flera intressanta resultat om tex personlighet som jag kommer ta upp i nästa inlägg.

Referenser

Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2021, December 30). Revisiting Meta-Analytic Estimates of Validity in Personnel Selection: Addressing Systematic Overcorrection for Restriction of Range. Journal of Applied Psychology. Advance online publication. http://dx.doi.org/10.1037/apl0000994

Nye, C. D., Su, R., Rounds, J., & Drasgow, F. (2017). Interest congruence and performance: Revisiting recent meta-analytic findings. Journal of Vocational Behavior, 98, 138–151. https://doi.org/10.1016/j.jvb.2016.11.002

Schmidt, F. L., & Hunter, J. E. (1998). The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 85 years of research findings. Psychological Bulletin, 124(2), 262–274.https://doi.org/10.1037/0033-2909.124.2.262

Speer, A. B., Tenbrink, A. P., Wegmeyer, L. J., Sendra, C. C., Shihadeh, M., & Kaur, S. (2021, October 21). Meta-Analysis of Biodata in Employment Settings: Providing Clarity to Criterion and Construct-Related Validity Estimates. Journal of Applied Psychology. Advance online publication. http://dx.doi.org/10.1037/apl0000964

Lära Från Lärda. Avsnitt 254 – Personlighet i arbete.

Podcasten “Lära Från Lärda” är numera Sveriges största podcast om fackböcker. Varje avsnitt handlar om en ny fackbok och dess författare intervjuas av Fredrik Hillerborg. Tanken med podden är att inspirera fler att hitta nyfikenhet och en glädje i att lära sig nya saker. Formatet, med längre och reflekterande intervjuer, står till viss del i kontrast till ett höjt tempo i hur vi konsumerar media idag. Och intervjutekniken, med närvaro och nyfikenhet i samtalet, står också i viss kontrast till “tyckartrenden” och att det är ovanligt med bra lyssnare. Det här är två viktiga budskap med poddens koncept.

Tack Fredrik för att jag fick besöka din studio och prata om vår bok Personlighet i arbete, jag hoppas att detta avsnitt kan sprida lite kunskap om personlighet, utöver det vanliga dravlet i den allmänna debatten om personlighetstests vara eller icke vara.

Fem Faktor Modellen och prestation i det akademiska och på jobbet

I dag är fem Faktor Modellen (FFM), med sina fem personlighetsdrag eller faktorer, den mest meningsfulla modellen för att bedöma och beskriva kandidaters personlighet. Många använder denna modell när kandidater ska bedömas vem som sannolikt kommer prestera bäst på arbetet. Det finns även forskning kring akademisk prestation, nedan presenteras en kort sammanfattning av forskningen.

Kärt barn har många namn. Det har även FFM, som ofta även kallas Big Five, och dess faktorer. Både de svenska och engelska benämningarna på dessa fem faktorer varierar, men de mest allmänt vedertagna är:

MÅLMEDVETENHET – conscientiousness  (C)– ordningsamhet, disciplin och prestationssträvan

SYMPATISKHET – agreeableness (A) – tillit, värme och samarbetsvilja

KÄNSLOMÄSSIG INSTABILITET – Neuroticism (N) – stresskänslighet, vaksamhet och beredskap

ÖPPENHET – openness (O) – intellektuell nyfikenhet, fantasi och öppenhet för nya idéer

EXTRAVERSION (E) – extraversion – utåtriktning, energi och spänningssökande.

Men hur bra är egentligen dessa fem faktorer att förutsäga prestation? Med prestation menas här prestation i det akademiska och i arbetet.

Det har genomförts ett antal sk meta analyser som undersökt mer exakt hur bra de olika faktorerna är att förutsäga prestation och nyligen publicerades en sammanfattning av läget för hur väl FFM förutsäger prestation.

Resultatet i grafen visar tydligt att det är Målmedvetenhet som har högst förutsägande kraft. Men viktigt att påpeka är att det är ej ett högt samband, om man tex jämför med intelligens (som ligger på ca .50). De andra faktorerna visar på lite olika resultat. Extraversion kan förutsäga arbetsprestation men inte akademisk prestation. Samma sak med Neuroticism, där finns det ett negativt samband med arbetsprestation men endast ett mycket svagt negativt samband med akademisk prestation. För öppenhet finns det ett något högre samband med akademisk prestation och när det gäller Sympatiskhet är sambandet lite högre för arbetsprestation. 

En anledning att Målmedvetenhet sticker ut i FFM i förhållande till prestation är, som vi skriver i vår bok Personlighet i arbete (Sjöberg, Sjöberg, Henrysson Eidvall, 2021), att individer med låg nivå av målmedvetenhet har ett avslappnat och lättsamt förhållningssätt till prestation, ansvar, åtaganden och förpliktelser, medan de individer som har hög målmedvetenhet istället karakteriseras av att förpliktelser och åtaganden tas på allvar, vilket gör att de ofta uppfattas som pålitliga, plikttrogna, samvetsgranna och lojala” (sid 34-35).

Efter dessa meta analyser (54 meta analyser med över 500 000 individer, undersökta i sammanlagt över 2000 studier) anser jag att det vi inte kommer längre med FFM för att förutsäga prestation. Även om det kan tyckas svaga samband så rätt använt kan personlighet fungera mycket väl i urvalssituationer, särkilt om man viktar de olika faktorerna enligt grafen ovan. Tyvärr verkar många använda resultatet som ett diskussionsunderlag och då är det tveksamt naturligtvis.

Nästa steg är att ta med hela modellen, inte bara de fem breda faktorerna. FFM har bara skrapat på ytan. Forskning de
senaste årtiondena har nämligen visat att personlighet kan beskrivas utifrån en hierarki där FFM och dess faktorer
enbart utgör en av flera nivåer. Vill du läsa mer om detta, kolla in vår nya bok Personlighet i arbete.