Ålder, intelligensmätning och val av test

AI2De senaste 10 åren har användningen av intelligenstest ökat betydligt i rekryteringssammanhang. För 20 år sedan i Sverige var det ovanligt att använda intelligenstest, och använde rekryteraren test av kognitiv förmåga så var det ofta ett antal deltest med olika typer av problemlösning, sk begåvningsbatterier. Fördelen med dessa mer omfattande batterier är att de täcker hela domänen generell intelligens (g), nackdelen är att de tar längre tid att administrera, utveckla och poängsätta (om det är ett papper och penna test) i jämförelse med enstaka test. Konsekvensen av tidsmässigt effektivare instrument har tyvärr gjort att vissa rekryterare nöjer sig med ett test (läs 1 problem), detta kan få allvarliga konsekvenser eftersom en problemlösningsuppgift knappast täcker begreppet g. En annan konsekvens att förlita sig på 1 problemlösningsuupgift är att det inte bara differentierar på intelligens, i värsta fall finns det även åldersskillnader som kan missgynna både äldre och yngre beroende på val av test.

Även om det finns en närmast oändlig variation av problemlösningsuppgifter som är kapabla att mäta intelligens, så är de uppgifter som utmanar förmågan till att se dolda samband som bäst mäter g-faktorn. Därför är de test som använder tex matriser eller serier av bokstäver och siffror utmärkta indikatorer på g. Men många som använder test  likställer ett test med en g poäng. Jag får ofta frågan om det finns ett riktigt bra g test, men det är mer komplicerat än vad man tror att svara på den frågan. Matriser är en bra indikator på g, men matriser korrelerar  mellan .40 – .70 med andra typer av test, det betyder att en person som misslyckas på ett matristest kan lyckas på ett verbalt eller spatialt test. Jensen (1998) menar att det behövs minst 9 deltest av olika karaktär (verbal, numerisk, spatial, språk, snabbhet etc etc) för att på ett adekvat sätt mäta g. Detta betyder att de gamla batterierna ska plockas fram igen. Dock bygger detta antagande tungt på den klassiska testteorin. Moderna former av psykometri visar att det kanske inte behövs så många uppgifter som man förut trodde, men likväl behövs en hel del olika typer av problemlösning för att ”fånga g”. Risken är således att ni sorterar bort begåvade människor om ni endast väljer 1 problemlösningsuppgift som indikator på g.

En annan nackdel är att vissa test skiljer sig mellan olika åldersgrupper (Klein, Dilchert Ones & Dages, 2015). Det är särskilt de test som ligger närmast g som med ökande ålder ger sämre testresultat. Däremot de test som innehåller ord eller räkneövningar (ibland benämnd kristalliserad intelligens), där är det tvärtom där presterar yngre människor sämre än äldre. Detta betyder att om man bara förlitar sig på en typ av uppgift finns risken att man diskriminerar på ålder, särkilt när urvalskvoten är låg (många sökande till få platser), då kommer ni välja de som ligger absolut högst i testpoäng. Återigen fungerar de gamla batterierna bättre än enstaka test, mao om det finns en bra blandning av g mått och kristalliserade mått tar dessa skillnader ut varandra, och åldersskillnaden försvinner.

Nedan ser ni resultatet av 2199 testningar utförda i ”skarpt” läge. I den första grafen ser ni en ökning av antal rätt beroende på ålder när synonymer testas, ett klassiskt kristalliserande test. I den andra grafen ser ni en sjunkande testpoäng när Talserier testas och samvarierar med ålder. Och i tredje grafen ser ni den sammanslagna poängen av Synonymer och Talserier (ett hyfsat bra mått på g), där har ålderseffekten nästan försvunnit.

Så mina rekommendationer är välj test med omsorg, testet ska först och främst mäta g (för det är g som kan förutsäga prestation) och det ska inte vara några ålderseffekter i testpoängen (för då kan konsekvensen bli att ni väljer delvis på ålder).graf2

 

Referenser

Jensen, A. R. (1998). The g Factor. The science of Mental Ability. Westport, CT: Praeger Publisher.

Klein, R. M., Dilchert, S., Ones, D. S., & Dages, K. D. (2015, March 30). Cognitive predictors and age-based adverse impact among business executives. Journal of Applied Psychology. Advance online publication. http://dx.doi.org/10.1037/a0038991

Publicerat av Anders Sjöberg

Anders Sjöberg är docent i psykologi och har lång erfarenhet av bedömningsmetoder in arbetslivet. Anders har utvecklat psykologiska bedömningssystem som används av både privata och offentliga organisationer. Anders har publicerat böcker och vetenskapliga artiklar inom organisationspsykologi och psykologisk metodutveckling.

Delta i diskussionen

2 kommentarer

  1. Klokt och viktigt. För vissa personer varierar verkligen resultaten mellan olika begåvningstest vilket ger en klar risk med bara ett test. Jag tycker att ATS batteriet eller BASIQ är två bra kombinstionsformer, alternativt kombinera BKT med ett figurlogiskt test för högre befattningar.

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Denna webbplats använder Akismet för att minska skräppost. Lär dig hur din kommentardata bearbetas.